• 最近访问:
发表于 2024-07-04 21:21:30 股吧网页版
AI参加数学高考为何不及格?周伯文提出“通专融合”科研战略路径
来源:上观新闻

  如何实现通用人工智能(AGI),让人工智能像人一样可以做很多事,不再局限于某些特定领域?今天下午举行的2024世界人工智能大会·科学前沿全体会议上,上海人工智能实验室主任、清华大学惠妍讲席教授周伯文发表演讲,提出“通专融合是通往AGI的战略路径”。在他看来,建立在AI大模型强大泛化能力上的专业能力,是“人工智能皇冠上的明珠”,与目前的大模型相比,这种系统可以更高效、更好地适应并解决现实世界中的复杂问题。

  大模型在专业能力上进步缓慢

  回顾历史,2017年以前,人工智能在专业能力上发展迅猛。从“深蓝”到“阿尔法围棋”,AI棋手先后击败了国际象棋和围棋世界冠军。那时,人工智能面临的巨大挑战是不具备泛化能力,只在一些特定任务上表现突出。然而随着Transformer架构2017年问世, ChatGPT等大模型在泛化能力上突飞猛进,表现出触类旁通的“涌现”能力,让很多人相信:通用人工智能时代即将到来。

  对于这种乐观预测,周伯文指出了大模型的一大弱点:它们在专业能力上进步缓慢,虽然在迭代过程中消耗了巨大的能源、数据等资源。OpenAI首席执行官萨姆·奥特曼坦言:GPT-4的专业能力大概相当于10%—15%的专业人士,即使迭代到GPT-5,其专业能力预计也只会提高4—5个百分点。这意味着,OpenAI将用指数级的能源消耗增长换来缓慢的专业能力提升。

  从GPT-4o等大模型参加今年中国数学高考的成绩,也可看出大模型在专业能力上的短板。“书生·浦语”2.0文曲星考了75分,GPT-4o得到73分,阿里Qwen2-72B拿到70分,都没有及格(满分150分)。令人欣慰的是,上海人工智能实验室研发的“书生·浦语”2.0文曲星在数学成绩上排名第一,超过了GPT-4o。

中外7个大模型的数学各题型得分情况

  “这得益于我们的开源数学模型,它沉淀了密集过程监督、模型辅助的思维链校验、多轮强化自训练、文本推理和代码解释器联合迭代等一系列技术,具备良好的自然语言推理、代码解题和形式化数学语言性能,所以能以200亿参数在高考数学上超过GPT-4o。我们的大模型不但效果最好,而且参数体量最小,能源消耗最低。”周伯文说。

  AI有望提出有价值的科学假设

  “书生·浦语”的胜出,显示出“通专融合”研发路径的潜在价值。作为一种新的人工智能发展范式,“通专融合”将大模型的泛化能力与专业能力紧密结合,旨在打造一个完整的技术体系。周伯文认为,这个体系包含三层重点工作:基础模型层、融合协同层、自主进化与交互层。

  在基础模型层,科研团队专注于高效地构建大模型的通用泛化能力,尤其是高阶能力,如数学、因果推理等。通过高质量数据的清洗和合成,研发高性能训练框架、高效的模型架构。

  在融合协同层,科研人员要将泛化性和专业性有效地结合起来。上海人工智能实验室正在采用多路线协同的算法和技术,构建比肩人类优秀水平的专业能力。实验室的原创工作包括:高密度监督信号的生成、复杂任务规划,以及用新的架构来实现人类大脑“系统1”(快速、直觉反应的系统)和“系统2”(慢速、逻辑分析的系统)之间的交互。通过这些技术,AI能够在复杂环境中做出决策,将复杂任务分解为更易管理的子任务,制定行动计划,并有效地协调多个智能体,以实现群体智能的“涌现”。

  在自主进化与交互层,人工智能的自主探索和反馈闭环十分重要。人工智能系统要在真实或仿真世界中自主地收集数据、学习并适应环境,通过与环境的交互获得反馈。这些反馈对于AI自我进化至关重要,自主进化与交互层使AI能进行“具身”自主学习,最终对“世界模型”有更深刻的理解并与之交互,具备完成开放世界任务的能力。

  “在科学发现领域,通专融合也有巨大的潜在价值。”周伯文表示,通过通专融合,AI能掌握科学知识、分析实验结果、预测科学现象,进而在反思的基础上,拥有越来越强的提出科学假设的能力。

  为此,他给出一个科研团队发现新科学假设过程的案例:他们将已有的背景知识输入2023年1月发布的大模型,并让大模型生成可能的假设。大模型提出的假设中,第一条假设是背景已知信息,并不是新的知识,但第二条假设是以前科学文献中所没有的。两个月后,第二条假设在2023年3月发表的论文中得到了验证。

  “这个案例显示出大模型有望成为科学家的得力助手,促进科学知识发现,并能够提出有价值的科学假设。”周伯文的演讲,指出了AI4S(科学智能)的巨大潜力。

  科技部副部长龙腾、上海市副市长刘多出席会议。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500