11月27日,猎户星空发布Orion-MoE8×7B大模型,系开源混合架构MoE(专家)大模型,同时推出基于该模型的数据服务产品——AI数据宝AirDS(AI-Ready Data Service),主要提供包括数据清洗与数据标注在内的服务。
猎豹移动董事长兼CEO、猎户星空董事长傅盛在谈及现在推出MoE模型与数据闭环服务时表示,产业链里决定大模型基础能力的核心是标注后的数据,当下行业的重点在于如何将高质量数据找出来,与应用实现高度结合。
傅盛认为,今天行业最好的突破点就是高质量数据与AI Agent框架对应用的需求,如今的模型即使不再进步,水平也足够解决相当大一部分的问题,且是革命性体验的需求问题。
行业共同期待的是一次AI应用爆发,谷歌、OpenAI、阿里、华为等大型企业都在侧重利用MoE提升大模型性能和实用性,与此同时,也有一些国内企业在尝试以软硬件结合的方式寻找更多落地的可能性。
用好大模型不简单
2024年全球MoE大模型数量呈爆发增长态势。目前基于Transformer的MoE已成为大模型领域主流架构,优势在于可以将神经网络拆分成多个专家子网络,面对一次输入,既可以指定某一位“专家”来回答,也可以要求多位“专家”回答,甚至全部参与回答,最终依据权重综合给出结果。
开发者可以在一个巨型模型上继续增加参数量,进行横向扩展。因为 MoE可以选择只启用部分专家子模型,在保持性能的同时,能够降低推理成本。
相比于算法和算力,在大模型商业闭环中,猎户星空认为数据成为最直接影响大模型在垂直行业落地效果的关键。这也是如今猎户星空发布数据宝产品的原因。猎户星空首席科学家韩堃称,大模型与实际应用之间还有很大的差距,这个差距并非数据本身,而是围绕数据进行的一系列服务,包括数据标注、提示词撰写、提示词优化、模型评测等,厂商在推出大模型之后还需要教会客户如何用好模型。
此次推出的AI数据宝AirDS提供的大模型数据服务涵盖数据收集、清洗、标注、提示词工程以及评估等环节。在实际应用中,AirDS已服务包括移动通信终端、互联网娱乐、新能源汽车等多领域的中国出海品牌。
知道创宇安全中心总经理鄢晓玲对记者表示,就目前所接触到的市场情况而言,数据清洗与标注的客户需求有非常明显的增加,甚至可以说达到了翻倍的增长。从行业发展趋势来看,数字化转型全面提速,各行业深度依赖数据驱动。无论是新兴的电商直播精准推荐,还是传统医疗行业的病历数据分析辅助诊疗,都离不开高质量数据,而数据清洗与标注是保障数据质量的必不可少的一环。
落地场景之中,机器人也是猎户星空大模型选择的重要场景之一。傅盛强调,大模型是基于语言学习后对世界产生理解,并有自己逻辑和推理能力的一个模块。以前的机器人本质上没有大脑,更多是个自动化机器。
加入大模型后,傅盛表示,可以提高机器人自主决策的能力,例如讲解交互、任务处理。长远来看,机器人真正参与一些劳动,如把机械臂加到机器人身上,让它帮你端杯水,这些很快能够实现产品化。
因此,整体来看,在探索AI应用场景过程中,韩堃表示,一方面,客户对大模型的需求是既要效果好又要速度快;另一方面,相比稠密模型的“通才”,一群“专家”的MoE能更高效专业地完成企业复杂任务,且在不显著增加计算成本的前提下大幅增加模型容量。
开箱即用才好说服客户买单
猎豹移动高级副总裁孙明焱认为,数据服务要做好,企业需要有足够的应用实践,才可以为客户的任务针对性提供正确的数据集,这是大模型厂商的优势。
要怎样的应用才能说服客户买单?
将大模型与数据包打包发布,在猎户星空的商业逻辑里是为了打通商业闭环,也是今年大模型行业从训练端转向推理端的一大体现。伴随大模型应用的兴起,猎豹移动副总裁童宁对记者表示,公司对接的企业客户几乎都在All in AI。但不同之处在于,过去对接的是客户技术部门,但现在更多对接的是业务部门。
这在童宁看来,是很大的变化。过去猎户星空提供的业务服务主要面向基础架构层,面向IT部门。而现在AI或大模型要解决的问题存在于客户企业的核心业务里,包括供应链等。童宁认为,客户核心痛点的解决是大模型厂商都会去投入的方向,只是各自的切入点不同,目前行业呈现百花齐放的状态。但如何用好大模型,是行业普遍关心的。猎户星空做的就是将大量没有结构化的数据进行处理,这也是大模型厂商所擅长的。
因此,这就需要把大模型变成“开箱即用”的应用。
“当AI有这么大关注度的时候,我们一直在思考如何让客户把AI运用起来,从中获取价值。”中国惠普有限公司个人信息产品部高级计算与解决方案产品部总经理徐鸣说。这家以硬件制造为主的一个领先的科技企业也敏感地注意到了AI正在成为一个主流趋势,并尝试通过进行硬件与软件的结合,让更多的企业把大模型应用到生产业务之中。
最近惠普和星环科技与一家央企共同签署了战略合作协议,正式成为他们的IT合作伙伴。该央企计划构建一个专属的知识库,并通过深度学习技术对其数据进行分析,以便更有效地解读历史经营数据。惠普与星环科技共同探讨并制定了一套方案,旨在为他们提供一个合适的模型架构、选择恰当的硬件配置,并决定部署位置,同时预估了项目实施的时间表。在前端部署完成后,惠普和星环科技还将在中后端进行模型的持续维护,并针对在实际使用过程中可能产生的训练需求,以及对内部员工的培训持续合作。
通过一体机的方式,依托惠普提供算力支撑的工作站,加上星环提供的Knowledge Hub,把数据通过惠普的硬件设施,结合星环科技的产品技术,可以把数据转化为企业内部的知识沉淀。
星环科技联合创始人、副总裁朱珺辰认为,大模型的应用意味着从以前的数据基础设施(Data Infra)向AI基础设施(AI Infra)做转变。企业可以把这些信息做更好的、特征化的处理,能够更好地利用这些数据的价值。对于大多数企业来说,他们所期望采购的大模型并非只是一个空洞的框架,而是一个全面的解决方案。
“即使大模型技术发展了,也需要软件与硬件结合,才能真正落地,产生价值。”朱珺辰说。