• 最近访问:
发表于 2025-01-17 00:13:00 股吧网页版
沪研大模型捷报频传 阶跃星辰自研推理模型Step R-mini今上线
来源:上观新闻

  这几天,沪研沪产大模型捷报频传。继15日上海人工智能实验室对“书生”大模型进行重要版本升级,MiniMax发布并开源新一代01系列模型后,阶跃星辰自研推理模型Step Reasoner mini(简称“Step R-mini”)今天上线。

  Step Reasoner mini是Step系列模型家族的首个推理模型,擅长主动进行规划、尝试和反思,能通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。它既擅长通过超长推理能力,解决逻辑推理、代码和数学等复杂问题,也能兼顾文学创作等通用领域。

  记者了解到,目前大部分推理模型难以兼顾文理科双方向能力——随着训练参数规模增加,模型的文科能力会得到提升,但也会因此损失确定性,造成理工科能力的下滑。Step Reasoner mini通过大规模的强化学习训练,并使用同策略强化学习算法,实现了“文理兼修”。Step Reasoner mini除了能准确解答数学、代码、逻辑推理问题,还能富有创意地完成文学内容创作和日常聊天的任务。

  例如,在解答“连续整数之和为1000的共有几组”这道题时,Step Reasoner mini展现了全面和严谨的思维链路:先分析用户题目需求,然后选择出最佳的解题公式,在得到初步答案后,它通过多次自我追问确定是否有没被考虑到的因素。

  而在处理逻辑推理任务时,Step Reasoner mini会自主进行多种解题思路的尝试,在得到初步答案后,会自我反问尝试有没有其他可能性,确保枚举出所有效果良好的解决方案,并在交卷前检查有无遗漏。

  当接到创作类题目的任务,Step Reasoner mini能够深入理解用户的表达需求,是个“追求完美”的创作者。它会先分析用户对创作主题、文学题材的要求,然后思考处理创作角度、描绘的景物、修辞手法、内容结构,赋予事物人类情感层面的象征意义,并增加个性化的、创新的表达风格。

  记者获悉,阶跃星辰自研的Step系列基座模型矩阵,目前已经覆盖了从语言、多模态到推理的全面能力。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500