科大讯飞星火大模型再迎升级。
10月24日,《中国经营报》记者从科大讯飞全球1024开发者节上了解到,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火最新版本讯飞星火4.0 Turbo、国产超大规模智算平台“飞星二号”、基于大模型的星火超拟人数字人等10余款技术和应用产品。
据科大讯飞方面介绍,讯飞星火4.0 Turbo版本在数学、代码能力上超越GPT-4o,同时,训练推理效率大幅提升,进一步满足星火大模型规模化落地的需求。
“今天的AI应用正日益进入到场景化深水区。”刘庆峰介绍了科大讯飞在智能翻译、智能质检、儿童兴趣、声音修复等领域的场景化应用,并进一步指出:“在这样的一个阶段,我们需要做的就是把最好的技术跟应用场景和人文关怀更深入地连接在一起。”
讯飞星火大模型持续迭代
自去年5月6日首次发布以来,讯飞星火大模型经历了多次迭代,直至今年10月24日,讯飞星火已更新至4.0 Turbo版本。
刘庆峰介绍,讯飞星火4.0 Turbo七大能力超过GPT-4 Turbo,在数学、代码能力上超越GPT-4o。
刘庆峰介绍,在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年年底可实现类o1的高难度数学能力显著提升。而首发的星火多语言大模型,首批支持中文、英语之外的八个语种,多行业任务场景效果超过GPT-4o。
根据代码生成HumanEval测试集上的效果对比,讯飞星火4.0 Turbo在Python、Java、JavaScript等任务上和GPT-4o的差距微弱,在C++能力上超过GPT-4o。在真实应用场景,基于认知智能全国重点实验室构建的iFLYCode-Eval-2.0代码实用场景测试集,讯飞星火4.0 Turbo在代码生成、代码检错、单元测试等任务上都超过了GPT-4o。
去年10月24日,科大讯飞携手华为宣布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”启用。刘庆峰表示,过去一年内,“飞星一号”持续对标英伟达A100/A800,一年内已解决超过500次基础软硬件问题,模型训练适配优化平台耗时从90天下降到15天。
会上,科大讯飞、华为、合肥市大数据资产运营有限公司联合打造的国产超大规模智算平台“飞星二号”上线。据介绍,“飞星二号”具备强大的计算能力,能够支持大规模的数据处理和复杂的人工智能模型训练。刘庆峰表示:“只有在真正自主可控的平台上,才有真正的中国人工智能大未来。”
商业回报周期有望迎来拐点
底座技术的迭代与垂直应用能力的提升需要大量投入,过去一年,由于不断加大对大模型的投入,也在一定程度上影响到了科大讯飞近期的净利润表现。财报显示,今年上半年,科大讯飞实现营业收入93.25亿元,同比增长18.91%,因高强度研发投入,归属于上市公司股东的净利润亏损4.01亿元,上年同期净利润为7357.2万元,同比由盈转亏。
不过,随着全国产算力训练打造的大模型底座铺开以及大模型的商业化落地加速,科大讯飞在2024年第三季度净利润也实现了转正,单季度业绩亮眼,或成为公司AI商业化落地的拐点。
科大讯飞刚刚发布的第三季度财报显示,2024年第三季度实现营业收入55.25亿元,同比增长15.77%;归属于上市公司股东的净利润5696.14万元,同比增长120.87%。科大讯飞在公告中表示,公司保持健康的经营发展态势,营收、毛利、净利润、现金流等各项经营指标均保持正向增长,在加大星火大模型的研发投入和布局的同时,实现了利润当季度转正。不过,前三季度合计来看,科大讯飞仍在亏损,归母净利润亏损3.44亿元,上年同期盈利9936.21万元。
今年,大模型头部玩家纷纷拿下一众订单,大模型商业化落地正迎来加速期,其中就不乏“讯飞星火”这样的大模型已经成为央国企的一个优选。据融中财经通过中国政府采购网、中国招投标公共服务平台等数据梳理,科大讯飞成为上半年大模型中标数最多的市场化玩家,且8月份单月中标金额突破1.5亿元,行业排名第一。
刘庆峰此前曾表示,科大讯飞在坚定不移地退出一些小业务,以减少亏损,同时在大模型的算力上面不需要再做很大投入,而是专注于在有限投入下实现大模型的深度落地。
科大讯飞董事、副总裁、董事会秘书江涛在第三季度业绩说明会上对记者表示,目前,星火大模型三条商业化路径已经得到验证,包括:其一,星火大模型在消费者、教育、医疗、汽车等已有场景中加快规模化落地,商业价值闭环已得到初步验证;其二,以大模型为切入点,在运营商、金融、能源、交通等重点行业做深做透,与央国企战略合作深度运营有望打开增量空间;其三,通过先发优势,打造iFlyCode、招采、会议、文档、翻译等标准化产品,企业市场的规模化推广实现商业价值。
刘庆峰曾对记者预计,大模型真正大规模商业化落地,在未来两三年。至少未来一两年内,主要还是以千亿到百亿,甚至几十亿、几亿参数的模型在各个领域深入,科大讯飞在这方面拥有很大优势。同时,“语音交互+后台大模型”的路径,也让科大讯飞在智能座舱和机器人领域具备优势。“在有限的投入下,我认为我们可以把大模型落地这个仗打好。”刘庆峰表示。