西部证券:DeepSeek-V3显著降低AI模型训练成本助力商业应用
来源:财中社
财中社1月6日电西部证券发布AI行业跟踪45期。文中写到DeepSeek-V3训练和使用成本大幅降低,或有望助力商业端落地算力优化。
引入FP8训练和细粒度量化策略,大幅降低计算时间。相比于Meta的Llama3需要16384块上半年00 GPU训练,DeepSeek-V3仅需2048块H800 GPU即可完成相同规模的任务,训练成本低至约557万美元。
用户使用门槛降低:1)软硬件一体化支持,提升推理效率。DeepSeek首发支持国内昇腾平台(Ascend)和MindIE推理引擎,这种软硬件一体化的支持使得用户能够在不同的硬件环境中灵活高效地部署模型。2)支持多种主流框架、全面开源策略。模型支持SGLang、LMDeploy和TensorRT-LLM等多个主流框架,开发者可以根据自身需求选择合适的开发工具和框架。3)灵活的API定价模型,降低每百万token的处理成本。
西部证券认为,DeepSeek-V3的表现给前沿LLM训练降本带来新的解决路径和可能性,模型端使用成本的下降有助于推动商业端落地的闭环。
郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
评论该主题
帖子不见了!怎么办?作者:您目前是匿名发表 登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》