财中社11月14日电人工智能初创公司OpenAI正准备发布一个代号为“Operator”的AI智能体(AI agent),它将能够控制计算机并自动执行编码和预订等任务,并于2025年1月通过API访问。这将标志着针对日常用户需求设计的AI代理开发迈出了重要一步。
在当地时间周三的员工会议上,OpenAI的领导层宣布计划在1月发布该工具,作为研究预览版和开发者工具,并通过该公司面向开发人员的应用程序编程界面。
OpenAI的AI智能体最终面向消费者发布的时间仍然保密,但它的开发预示着AI系统将向主动接触计算机界面,而不仅仅是处理文本和图像的方向转变。
AI公司面临着越来越大的压力,AI模型成本高昂,它们必须找到变现方式:人们希望智能体能成为下一个突破性产品,一个具有ChatGPT影响力的创新。
所有领先的人工智能公司都已承诺推出自主人工智能代理,OpenAI最近也在大力宣传这种可能性。OpenAI首席执行官萨姆·奥特曼(Sam Altman)上个月在社交媒体Reddit的论坛“问我任何事”环节中回应用户提问时,暗示了公司向智能体转型的方向。奥特曼表示:“我们会开发越来越先进的模型,但我认为,真正意义上的下一个巨大突破将是智能体的出现。”
OpenAI曾在公司内部提出了通用人工智能5级标准,以评判人工智能的进展:第一级是能够进行类似人类对话的人工智能,比如ChatGPT;第二级是“推理者(Reasoners)”;第三级名为“智能体(Agents)”,指的是能在数天内代表用户行事的AI系统;第四级描述的是能够创新的AI系统;第五级是“组织(Organizations)”, 指的是能够完成组织工作的AI系统。按照这个标准,OpenAI正在向第三个等级努力。
在上月初的一次OpenAI新闻发布会上,首席产品官凯文·威尔(Kevin Weil)说:“我们希望能够以与人类互动的所有方式与人工智能互动。 ”
“这些更具代理性的系统将会成为可能,这就是我认为2025年将成为代理系统最终进入主流的一年的原因。”他补充说。
AI初创公司Anthropic上月推出了 “计算机使用 ”功能,通过API接入,开发人员可以指导Claude使用计算机,就像人们看屏幕、移动光标、单击按钮和输入文本一样。Claude能够将指令(例如,“使用我的计算机和在线数据填写此表单”)转换为计算机命令(例如,检查电子表格;移动光标打开web浏览器;导航到相关网页;使用这些网页中的数据填写表单等等)。
谷歌据说也在准备自己的版本,将于12月发布。