• 最近访问:
发表于 2024-09-16 15:11:40 股吧网页版
OpenAI o1 拉开中美大模型差距?这个国产大模型或可一较高下
来源:读创

  日前,OpenAI 发布 o1-preview,问鼎最强大语言模型,引发业内轰动。也正因如此,国内也产生了质疑的声音:为何大模型领域国内追赶了一两年,差距好像没见缩小,甚至是扩大了。

  差距真的是在扩大吗?行业专家张俊林认为,o1-preview之所以能够更强,其方法本质上是思维链(Chain-of-Thought, CoT)

  的自动化。通过CoT把一个复杂问题拆解成若干简单步骤,有利于大模型解决复杂逻辑问题,但之前这个过程主要靠人工来达成。o1采用的这种方法,将使得Prompt工程逐渐消亡,也就是说所有复杂人工环节的自动化成为了大势所趋。

  这种思想和方法并非OpenAI的首创。早在7月底的ISC.AI2024大会上,360集团创始人周鸿祎就宣布,“用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力”,并且此后多次强调类似观点。这种方法的技术和产品应用上,国内也已经走在前面:还是在 ISC.AI 上 360发布的CoE(Collaboration-of-Experts,专家协同)技术架构及混合大模型,就是该方法的产物;并且,该技术架构已经落地到了多个产品中,比如360AI搜索、360AI浏览器。

  在大模型技术前沿,国内比 OpenAI 在开放协作的道路上走的更远。比如CoE架构并非只接入了一家企业的模型,而是由 360 牵头,百度、腾讯、阿里巴巴、智谱AI、Minimax、月之暗面等16家国内主流大模型厂商合作打造的,目前已经接入了这些企业的54款大模型产品,未来预计会全量接入100多款大模型产品。

  更进一步的是,CoE技术架构不仅接入了“大模型”,还接入了很多十亿甚至更小参数的专家模型,这使得整个系统更加智能。CoE 架构在实现“让最强的模型回答最难的问题”的同时,还能在回答简单问题时调用更精准的“小模型”,在获得高质量回答的同时,节约推理资源、提升响应速度。

  有了上述的多种底层技术创新,基于CoE 架构的混合大模型在翻译、写作等12项指标的测试中取得了80.49分的综合成绩,超越了GPT-4o的69.22分;特别是在“弱智吧”和“诗词赏析”这类比较具有中文特色的问题上,该架构的领先优势更加明显。即使是对于最新发布的o1-preview,CoE 架构在未经专门优化的情况下也展现出了优势。

  拥有了底层技术创新的情况下,国内在做应用和产品层面的优势更大。CoE 架构和混合大模型没有止步于技术创新,而是比OpenAI更快一步地进入了实际应用领域。

  一方面,360通过CoE技术架构,构建了国内首个大模型竞技平台——模型竞技场(bot.360.com),目前已经入驻360AI浏览器,成为国内大模型领域的基础设施。在多模型协作模式下,用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款大模型,进行多模型协作,以此达成比单个大模型回答问题好得多的效果。

  另一方面,CoE 还成为了支撑360AI搜索的底层技术架构。正是由于全球领先的技术架构的支撑,和国内多家主流大模型厂商的通力协作,让360AI搜索能够让360AI搜索能够在2024年1月诞生后八九个月的时间里,就超越 Perplexity AI,成为全球最大的AI原生搜索引擎。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500