论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement Learning。作者之一,就是罗福莉。 要用GPU去做模型推理,要用CPU去执行代码,要用API去处理搜索、数据库,可能还要用浏览器进行网页操作 ...
3月16日消息,小米AI实验室研究员罗福莉,也就是很多人口中的“天才少女”,又发论文了。论文名叫ARL-Tangram: Unleash the Resource Efficiency in Agentic Reinforcement ...
之前发了很多期商业方向的博客了,其实我也是一个技术博主来着,而且研究AI,不研究技术,属于水中捞月。所以,本期我来一份硬核技术分享。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果