“不打价格战”，字节跳动推出视频生成大模型_博纳影业(001330)股吧

股吧首页 > 博纳影业吧 > 正文

最近访问：

博纳影业吧

返回博纳影业吧>>

- 重要股东股权质押数据全览

博纳影业资讯

发表于 2024-09-24 19:45:30 股吧网页版

“不打价格战”，字节跳动推出视频生成大模型

来源：第一财经

　　OpenAI发布的视频大模型Sora后，国内厂商迅速跟进，相继发布视频模型产品，包括生数科技、智谱AI、阿里等。9月24日，字节跳动旗下火山引擎发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型，以及豆包音乐大模型、同声传译模型等产品。

　　大模型行业经过2022年年底的震撼、2023年的追赶，2024年的逐渐冷静，厂商开始调整业务方向，由通用型转向应用端，由训练侧转向推理侧。对此，火山引擎总裁谭待对第一财经记者表示，中国大模型应用之所以没有做大，成本是一个很重要的原因，如今行业将成本价格"打"了下来，转向应用成为必然。

　　谭待表示，豆包大模型并不打价格战，而是让价格回归合理。以豆包大模型为例，截至目前，豆包大模型日均tokens使用量超过1.3万亿，较5月数据增长了10倍。日均生成图片5000万张，日均处理语音85万小时。谭待认为，当大模型价格不再是阻碍创新的门槛，随着企业大规模应用，大模型支持更大的并发流量正成为行业发展的关键因素。

　　至于降价带来的营收压力，谭待表示，对To B厂商而言，技术与产品最重要的是可持续，降价之后的火山引擎并未负毛利，至于具体毛利数据，谭待并未进一步披露。

　　关于推出视频大模型的时间，谭待表示，过去豆包视频大模型主要用于集团内部，内部技术对外开放成为商用业务需要时间，而企业客户普遍存在对安全性与稳定性的担心。

　　此前豆包视频大模型在字节跳动内部已配合即梦AI与剪映进行产品试用，今年7月，全国首部AIGC生成式连续性叙事科幻短剧集《三星堆：未来启示录》在抖音上线，由博纳影业（001330.SZ）出品制作，抖音旗下即梦AI提供首席技术支持。此次公开，技术层面解决了视频生成模型大多只能完成简单指令的问题，可实现自然连贯的多拍动作与多主体复杂交互。

　　据了解，豆包视频生成模型基于DiT 架构，通过DiT融合计算单元让视频在大动态与运镜中自由切换，另外通过扩散模型训练方法攻克了多镜头切换的一致性难题，在镜头切换时可同时保持主体、风格、氛围的一致性。目前豆包视频大模型落地于电商营销、动画教育、城市文旅、微剧本等企业场景，也能为专业创作者和艺术家们提供创作辅助。

　　此次豆包大模型发布产品覆盖语言、语音、图像、视频等全模态，但对于未来多模态AGI的发展，谭待对记者表示，现在行业技术还需更努力才能勉强摸到AGI的门槛。

　　作为字节跳动集团内的产品，此次由火山引擎面向B端客户推出豆包视频大模型，也可看出集团对AI2.0时代下云计算业务的重视。

（文章来源：第一财经） [点击查看原文]

郑重声明：用户在财富号/股吧/博客等社区发表的所有信息（包括但不限于文字、视频、音频、数据及图表）仅代表个人观点，与本网站立场无关，不对您构成任何投资建议，据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容，远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息，谨防上当受骗！

评论该主题

帖子不见了！怎么办？

作者：您目前是匿名发表登录 | 5秒注册作者：，欢迎留言退出发表新主题

郑重声明：用户在社区发表的所有资料、言论等仅代表个人观点，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决定证券投资并承担相应风险。《东方财富社区管理规定》