财中社12月11日电山西证券发布计算机行业点评报告称,Agent已成为AI应用端的最大亮点,海外AI应用厂商及科技大厂正加速布局AIAgent。在决策智能领域,Palantir于2023年4月推出AIP平台,提升辅助决策的自动化水平,并通过AIPBootcamp训练营进行推广,目前已在库存管理、医院运营、自动化产品分类等场景中落地;在企业服务领域,Salesforce于10月24日正式推出AIAgent创建平台Agentforce,并提供预构建的Agent,包括面向客服场景的Service Agent、面向销售场景的SDRAgent和Sales Coach等,Agentforce在正式推出后一周内便达成200多笔交易;同样在企业服务领域,ServiceNow于11月发布AIAgent,采用Multi-Agent架构,主要面向ITSM、客户服务等场景。此外,微软为代表的海外科技巨头在应用端的布局重心也开始向AIAgent倾斜,10月21日微软连发10个AIAgent,面向销售、运营等场景,并将在今年提供公共预览版且集成到Dynamics 365中,11月19日微软又宣布Copilot Studio平台已支持用户构建自主Agent,同时发布5款预构建的Agent。随着海外厂商持续发力,AIAgent已经在各行业陆续落地。
应用形态从Chatbot、Copilot向Agent发展,体现大模型能力与应用端的结合正不断加深,AI应用的自动化及智能化程度持续提升。过去Chatbot(聊天机器人)形态的AI应用主要提供文字/语音问答功能,人类完成绝大部分工作,在此过程中向AI提问,AI提供回答以供人类参考。到了Copilot(助理)形态,AI协助人类完成工作,即AI通过人类的提示词等完成任务初稿,并由人类进行修改优化。而根据吴恩达教授,AIAgent(智能体)具备Reflection(反思,即通过自我修正优化生成结果)、Tool use(使用工具,即调用外部工具)、Planning(规划,即规划一系列行动来完成复杂任务)、Multi-agent collaboration(多代理协作,即多个Agent协作完成任务)的能力,在工作流程中,人类只需设定任务目标并负责监督管理,Agent可自主完成从分析、决策到执行的全流程任务。
OpenAI发布的o1模型推动大模型复杂推理能力大幅提升,为未来AIAgent应用拓展到更多更复杂的任务场景奠定基础。今年9月,OpenAI发布o1模型,采用强化学习(RL)和思维链(CoT)技术,在回答问题前会先进行“思考”以提升模型的输出质量。o1模型在编码和数学等领域的复杂推理能力大幅提升,其中的o1-preview版本在美国数学邀请赛(AIME)中准确率为56.7%,大幅超过GPT4o的13.4%,o1-preview在CodeForces编程竞赛中得分为62.0%,同样高于GPT4o的11.0%。12月6日,OpenAI推出o1模型正式版,推理能力进一步提升,在AIME和CodeForces竞赛中,o1正式版的得分分别为83.3%和89.0%,均超过此前发布的o1-preview,并且o1正式版加快了简单推理的速度。同时,OpenAI还推出了整体推理能力更强的o1 pro。由于AIAgent应用通常需要实现多步推理以完成整个任务,o1模型复杂推理性能的持续升级为未来AIAgent的加速落地及场景拓宽奠定坚实的基础。
国内以智谱为代表的厂商也开始重点发力AIAgent。10月25日,智谱发布AutoGLM智能体,可通过读取语音指令理解用户意图,并模拟人类行为,自动完成点外卖、订机票和酒店等操作。11月29日,智谱推出AutoGLM智能体升级版,长步骤自动执行能力和跨应用操作灵活性显著提升,最新的AutoGLM支持自主执行超过50步的长步骤任务,并且能够在执行任务时灵活切换不同的APP。同时,AutoGLM新增支持复杂任务的自定义短语模式及随意模式。当天,智谱宣布AutoGLM启动大规模内测以尽快上线,并宣布启动“10个亿级APP免费Auto升级”计划,开始布局智能体生态建设。除智谱以外,字节、百度、腾讯、字节、阿里等科技大厂也开始布局AIAgent,包括字节的Coze Agent平台、百度千帆AgentBuilder智能体开发工具、昆仑万维的天工skyAgents等。