• 最近访问:
发表于 2024-04-29 15:43:50 股吧网页版
通义千问首个千亿参数模型来了
来源:中国证券报·中证金牛座

K图 BABA_0]

K图 09988_0]

  据“阿里通义千问”微信公众号4月28日消息,通义千问首次推出千亿级参数模型Qwen1.5-110B。据介绍,Qwen1.5-110B基础能力可与Meta-Llama-3-70B媲美,是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超1000亿参数的模型。

  据研究团队评估,结果显示:在MMLU、GSM8K、MATH、HumanEval等基准测试中,Qwen1.5-110B模型是三者中表现最优的。在TheoremQA、ARC-C、MBPP等评测中,Qwen1.5-110B模型表现优于Llama-3-70B。

1868ea77-93e3-4584-b07b-84ad13cfab73.png

图片来源:“阿里通义千问”微信公众号

  此外,据研究团队对Chat模型进行的评估,对比Qwen1.5-110B-Chat模型在MT-Bench和AlpacaEval 2.0上的表现。结果显示:与之前发布的Qwem1.5-72B-Chat模型相比,Qwen1.5-110B-Chat模型的表现显然更好。

ed576618-2db0-4826-a250-5ec0c1711e0d.png

图片来源:“阿里通义千问”微信公众号

  今年以来,通义千问团队推出最新开源模型系列Qwen1.5,随后在不到3个月的时间连续推出8款大语言模型,此前的模型参数规模涵盖5亿、18亿、40亿、70亿、140亿、320亿、720亿,而本次Qwen1.5-110B的参数规模达到1100亿。据悉,目前通义千问开源模型下载量超过700万。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500