编者按
2023年“百模大战”爆发,2024年大模型应用浪潮来袭。从ChatGPT、文心一言等产品的横空出世,到多模态AIGC、垂直行业模型的百花齐放,过去一年,AI大模型正加速从象牙塔走向落地应用。
从去年的“卷大模型”进化到今年的“卷应用”阶段,产业端已经在探索如何“玩转”AI大模型,在智能终端、工业制造、医疗健康、智慧教育、交通出行、金融服务等领域,越来越多的企业尝试用AI大模型技术来优化业务流程、提升生产效率、创造新价值……
在此背景下,南方都市报联合百度推出《探寻产业智变“模”范生》系列报道,通过解码AI技术赋能产业的标杆案例,探究大模型时代下的生产力变革。
“教育行业有个‘不可能三角’理论,高质量的、大规模的、个性化的教育是很难做到的。但AI老师,真的能够在大规模和高质量基础之上,把个性化加进来。”在九章大模型面市后,好未来CTO田密这样描述着AI教育未来的愿景。
据了解,基于百舸训练平台及训练加速方案,好未来实现了包括 GLM、LLaMA 系列在内的多个大模型的训练实践,并将训练成果作为九章大模型的基座模型,为上层素养、学科类教育场景赋能。
同为教育企业,考试宝也在做AI在教育场景下的应用。“因为大模型的出现,提高了我们的工作流程的效率。过去两个人一天最多改300份卷子,一个人评分,一个人复核。目前一份卷子大概10到15秒可以解决掉,300份卷子几分钟之内就可以完成。”考试宝CTO杨宇建表示。
AI大模型技术正在为教育领域带来新的变革。根据Research And Markets报告,2024年,教育市场的人工智能市场价值为102.48亿美元。预计其年复合增长率将达到33.51%,到2029年市场价值将达到434.67亿美元。
业内首个数学大模型在百舸炼成
早在去年5月,好未来就宣布,旗下学而思宣布正在进行自研数学大模型的研发,命名为九章大模型(MathGPT)。对于开发九章大模型的初衷,九章产品负责人国朝游透露,他早在2018年就开始做AI在教育场景的应用,但是去年大模型的爆火让大家看到了AI带来的更大的想象空间,“我们是一家在数学场景扎根非常深的机构,所以也是以数学的讲题、解题为基础开始做大模型的。”
国朝游坦言,业内的通识是大模型在理科推理能力上有先天的缺陷,所以好未来希望能在理科特别是数学场景上实现突破,“如果我们都不做(数学大模型),那业内其他人更不会做了。”
但对于好未来这样的企业来说,自己去购买显卡搭建算力集群的投入是难以承受的,并且此前IT 业务目前并没有做统一整合,彼此之间关联程度不高。
好未来CTO田密透露,在去年年初,好未来就确定和百度进行合作,由百舸平台提供自研大模型的训练场景,千帆平台提供AI应用需求落地,此后随着算力逐渐加大,九章大模型的训练框架优化、推理速度优化都是由百度完成,双方的合作越来越深。
基于百度百舸平台,好未来可以快速、方便的创建出千卡级别的训推任务集群。算力方面,集群最大可支撑 16000 GPU卡的规模;存储方面,适用于大规模深度学习训练场景,可提供亚毫秒级(300us)的时延,支持百万级 IOPS,服务可用性不低于99.95%;在加速上,好未来自研过程中使用了多种框架及多种训练模型,通过百度云 AIAK 加速工具包实现了 AI 加速,主要体现在性能吞吐指标表现优良。
基于百舸训练平台及训练加速方案,好未来实现了包括 GLM、LLaMA 系列在内的多个大模型的训练实践,并将训练成果作为九章大模型的基座模型,为上层素养、学科类教育场景赋能。
目前,九章大模型已经成功在学小伴 App、智能硬件学习机 Xpad 实现了业务上线。基于九章大模型的“数学随时问”,可以实现对小学初中的任何一道数学题,80%实现即问即答,暂时不能回答的最快可在一小时内上传真人讲解、20分钟内生成AI视频解析。除此之外,还升级了基于大模型的指尖翻译、百科问答、口算练习等AI工具。
而在千帆平台, 好未来通过少量数据微调,获得高精度和高性能的大模型,并最大程度贴合业务场景,比如作文批改、阅读理解、企业智能搜索等。其中百度云千帆能力已经赋能了作文批改场景的相关任务,包括结构点评、思维导图等,并已经成功登录xpad学习机与题拍拍业务应用。
值得一提的是,百度百舸平台已经布局多项与教育和大模型相关的专利技术。这些技术在智能教育等场景中展现出广泛的应用前景,为好未来等教育机构提供了更加精准、高效的教育解决方案。例如,通过为待处理题目选择相同类别的参考题目和答案,并引入判题提示语句,利用微调的大语言模型进行判题,提高了判题的准确性和效率。通过预设的知识点数据库和视频资源的匹配,实现了对视频资源中知识点的准确确定,帮助用户快速了解视频内容,提高学习效率。
基于大模型技术落地需求和项目合作,百度百舸平台凭借其强大的算力、高效的存储、优秀的加速能力以及先进的专利技术,为好未来等教育机构提供了全面、高效的技术支持,也加速推动了人工智能技术在教育领域的应用和发展。
考试宝接入大模型后付费率从1.5%提升到3%
考试宝同样在做AI在教育场景下的应用。考试宝是一款面向有学习、考试晋升需求的用户提供在线学习、考试、组卷相关的服务软件,目前有超过6000万用户,日活跃用户超过100万,平台上试题总数已经超过了30亿道。考试宝CTO杨宇建透露,“我们早期发展的过程是非常痛苦的,随着大模型的能力的出来,结合我们的业务,让我们一家初创型的企业也能获得了更多的用户的认可和喜欢。”
过去考试宝主要通过人工进行题目解析,成本巨大,且操作难度高。按历史实践统计,平均每道题的人工解析成本在1元左右。而且App每日用户上传新试题超过300万道,人工解析几乎无法做到小时级响应。
“比如一个安全员考试的内容,我们得找到建筑工程这个行业的、考过相关职业技能的专家才能去做解析。这样一个流程下来,差不多一道试题的解析至少要五分钟,一道试题的解析成本我们差不多算下来1到2块钱。”杨宇建表示。
大模型出现后,杨宇建发现大模型的能力非常匹配考试宝的需求,在文心大模型内测阶段就申请了使用。后来考试宝和百度达成合作,考试宝通过百度智能云千帆大模型平台,打造了职业教育的AI大脑,推出AI智能解析、AI学习助手、AI在线考评等功能。
“因为大模型的出现,提高了我们的工作流程的效率。过去两个人一天最多改300份卷子,一个人评分,一个人复核。目前一份卷子大概10到15秒可以解决掉,300份卷子几分钟之内就可以完成。”杨宇建表示。
考试宝的用户增长率也有了显著提升。杨宇建透露,近两年考试宝新增用户和日活跃用户的增长率都是100%,“因为随着最开始文心大模型能力的提供,让我们的整个试题解析的数量和质量都得到了提高,用户会觉得越来越有价值。”
考试宝的用户付费意愿也得到了提高。在结合大模型之前,考试宝的用户付费率只有不到1.5%。据杨宇建披露的数据,随着文心大模型解决了解析、错题、精选题,以及试题的题眼、阅卷评分等问题后,考试宝的付费率已经提升到了3%。
大模型可以实现教育行业的千人千面
九章产品负责人国朝游坦言,在大模型时代之前是很难实现教育个性化的,“如果想给学生个性化就得给他配个一对一的老师,这就不可能低成本、规模化。但如果上大班课或者让优秀的老师录视频,那学生只能单方面接受输入,很难有个性化。”
在国朝游看来,大模型最大的优势就是可以理解人的语言,转化用户的意图,这一点用在教育上就可以用来拆解学生答题的思路,“不同的学生对同一个问题反馈的内容是不一样的,这就可以通过大模型给每个学生都讲明白,我觉得未来个性化学习可以上一个台阶。”
国朝游提到,通过大模型,可以实现苏格拉底式的讲解,“我们的模型会向学生提问,启发学生回忆这道题用到的关键的知识点、方法、技巧等,通过这些提问让学生思路跟上,同时我们希望中间这些关键的过程和结果学生能够自己说出来,这就意味着他真正能够学会解这道题。”
考试宝CTO杨宇建同样提到了教育的个性化,“大模型可以实现千人千面的教育。它不再像传统的教育行业,老师面向一个班所有人讲课,而是有了一个专门的AI老师答疑。”
好未来CTO田密这样评价AI的影响,“AI相比于真人教师的优势是对知识点的掌握非常全,永不遗忘,记住每个孩子的学情,还可以随时调取。”田密分享了教育行业存在的“不可能三角”理论,即个性化、高质量和大规模很难同时做到,“要打破不可能三角,只能靠AI技术的发展。大模型AI技术的出现,让我们看见了曙光”。