• 最近访问:
发表于 2024-08-14 21:53:19 股吧网页版
马斯克发布Grok 2测试版 逻辑能力更强 新增文生图功能
来源:科创板日报

  北京时间8月14日下午,马斯克旗下xAI公司的第二代AI大模型Grok 2测试版本正式发布,包括Grok 2和Grok 2 mini两个版本,实测支持中文提问和中文回答,目前仅X Premium及Premium+用户可体验,非X订阅用户可以在LMSYS大模型竞技场(Auto Arena of LLMs,专为大模型设计的评估平台)中,免费体验Grok 2的早期版本模型sus-column-r。

  马斯克在去年4月注册了xAI公司,今年5月,xAI官宣获得60亿美元的B轮融资,这轮融资使该公司的估值达到约240亿美元。xAI在今年先后推出了Grok 1和升级版Grok 1.5。

  马斯克盛赞:“Grok是火箭速度”。

image

  评测显示,Grok 2测试版的逻辑推理能力有较大提升,该模型还具备文生图能力,信息显示其使用Black Forest Labs 的FLUX.1模型生成图像。

  Grok 2测试版不仅准确解答了“9.8和9.11哪个大”,还能数清草莓(strawberry)里有多少个“r”,这些可谓人类测试大模型的经典难题。

image
image

  X平台的用户已经上传了许多由Grok 2测试版模型生成的照片。

image

  在GPQA、MMLU、MMLU-Pro、MATH、MathVista等多项测评中,Grok 2的得分都超过了GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5等主流模型。另据知名度较高的研究机构Large Model Systems Organization(简称LMSYS)最新发布的评测数据,Grok 2早期版本(代号sus-column-r)已经杀入LMSYS推出的大模型竞技场Chatbot Arena排行榜前三,与GPT-4o并列。

image
image

Grok 2早期版本sus-column-r的Elo得分情况

  Grok 2测试版本的发布,标志着该模型距离正式商用又迈出一步。

  xAI计划在本月稍晚时候,推出Grok 2正式版本的企业API。xAI表示将强化安全功能,包括强制性的多因素身份验证(如Yubikey、Apple TouchID或TOTP),并提供了详尽的流量统计数据和高级计费分析服务,支持数据导出。

  另外,马斯克此前透露后者将在今年年底左右发布更新版本的大模型Grok 3。

  今年4月,马斯克在接受挪威主权基金负责人Nicolai Tangen采访时表示,Grok 2需要大约2万张H100来进行训练。Grok 3所需的算力资源只多不少,马斯克在上个月称,xAI公司一直在训练Grok 3,该模型将使用10万块英伟达H100芯片进行训练,其水平将与尚未发布的OpenAI GPT-5相匹敌,甚至超越GPT-5。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500