1月16日,南方财经全媒体记者从“模数融合,数智融通:数据要素与人工智能引领新质生产力发展新格局”首席数据官培训暨珠海无界方舟 AutoArk 大语言模型数据资产估值发布仪式获悉,珠海无界方舟智能技术有限公司(以下简称“无界方舟”) “AutoArk 大语言模型”经中国资产评估协会评估,该数据资产价值达3.8142亿元,是目前已公布的全国最大单笔人工智能大语言模型数据资产价值评估项目。
在香洲区数据要素协会的赋能下,协会会员珠海无界方舟1月3日获得全省首张大语言模型(LLM)数据产权登记证书,这是全国首款多模态、高估值、自研大语言模型数据产品,市场估值超过3.81亿元,标志着香洲区在人工智能和数据融合创新上实现新的突破。
迭代多模态大语言模型
无界方舟创始人曾晓东向南方财经全媒体记者介绍,AutoArk 大语言模型涵盖了国内最大的跨多垂域、覆盖近亿量级的逻辑型合成思维链数据,采用专家标注加自动合成方式,涉及生命科学、金融、法律等多个细分领域,超2000万棵推理逻辑树和逻辑图,并在多场景完成行业业务验证。
此次上架的AutoArk大语言模型数据产品是基于开源训练语料及开源算法进行迭代开发,打造出的自有通用算法模型,可针对各类行业进行垂直行业训练,精准匹配业务需求。目前,无界方舟的大语言模型已迭代到多模态大模型,是国内首个实现 400ms 超低延迟“视觉理解”模型的服务商。
活动现场,无界方舟与工商银行珠海分行签订战略合作协议,将接洽推动基于数据资产的大额授信,完成数据价值的最终落地。曾晓东表示,未来将利用工行金融资源,双方会进一步深化在融资、结算等领域的业务合作。
值得一提的是,此次估值高达3.8亿元的数据产品在律所预审、合规审查等方面遇到不少难点。香洲区数据要素协会秘书长卢霄表示,大语言模型是一个新兴且极具前沿性的行业,使用成本法评估价值会被严重低估,目前市面上市场法评估并无成熟参考案例。其次,大语言模型的开发训练必然要用开源社区的语料进行训练,但法律法规上使用开源社区语料没有界定手段,对于数据源合法性确权造成了巨大困难。无界方舟的训练语料庞大,对于产品申报的合规性检查是一项海量工作。
在香洲区政数局的协调推进下,香洲区数据要素协会企业天唯科技、均正资产评估等专业机构通力协作,经过数月最终完成无界方舟数据资源盘点、数据资产入表、质量价值评估等工作,是一次在大语言模型数据产品上架交易的前沿探索。
打造“数据产业集聚区”
香洲区是推动人工智能大模型产业发展的“先行区”,目前已初步具备从边缘计算AI芯片、数据标注、算力中台、模型底座到垂直行业AI应用的人工智能全产业基础。
2024年,香洲区打造珠海首个人工智能大模型领域高地“模数空间”,已引入大模型垂类应用超100个,大模型企业已呈集聚之势。此外,香洲区成立珠海首家数据要素协会,截至目前已汇聚58家数据商,推动83款数据交易标的上架广州数据交易所、深圳数据交易所,初步构建辖区数据要素生态。
在近日举行的香洲区党代会上,香洲就瞄准深化数据要素市场化改革提出新解法,提出积极对接珠海市“云上智城”项目建设,主动融入珠海市打造国家级“数据口岸”工作大局,努力打造“数据产业集聚区”。同时,助力企业挖掘数据要素市场价值,走出一条从数据资源到数据资产再到数据资本的全新路径。此外还提出打造“数智香洲”数据治理中枢,推动公共数据安全有序开发应用,通过数据要素共享,赋能人工智能、大模型、低空经济、海洋经济等未来产业发展。
在探索数据要素市场化改革中,“模数融合”是香洲发展人工智能产业的思路之一,从业界的反应和市场的估值便可窥见其发展成色。去年,香洲已诞生深译科技全国首个高价值AI算料数据资产包,估值达2.04亿元。此次无界方舟获全省首张LLM大语言模型数据产权登记证书,估值超3.81亿元。
越来越多的大数据和人工智能企业也开始加速拥抱市场化。以无界方舟为例,除了从大模型单点发力外,无界方舟走的是“大模型+智能体”商业路径,已推出智能机器人“阿奇”系列等。
曾晓东分析:“智能体是大模型迈向场景应用的重要‘中间层’,因此我们坚持‘产模一体’的技术架构,以自研大模型推动智能体性能提升,再通过智能体反馈助力底层大模型优化,从而最大化激发‘大模型+智能体’的技术优势,目前C端和B端我们均在积极推进Agent的商业化落地。”