• 最近访问:
发表于 2024-07-07 01:28:19 股吧网页版
WAIC 2024|可灵推网页端、可图开源 视频生成领域迎 “王炸”
来源:广州日报新花城 作者:文静

  此前一直犹抱琵琶半遮面的快手大模型终于亮相了。7月6日,在2024世界人工智能大会(WAIC)期间,短视频平台快手旗下的大模型首次集体登场,同时,视频生成大模型可灵以及图像生成大模型可图等产品升级。

  据悉,继图生视频、视频续写功能发布之后,可灵在一个月内迎来了第三次重大升级,网页端在当日公布上线。创作者单次生成的文生视频时长增加至10秒。同时,图像生成大模型可图则宣布开源。

  “追赶”Sora 网页端更便于创作者使用

  快手高级副总裁、主站业务与社区科学线负责人盖坤表示,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个层面,并深度服务快手的商业生态场景。其中,快手的推荐大模型SIM,其下一代架构ACT预计每日将为App增加4亿分钟的用户观看时长,提升用户黏性和活跃度。

  今年初OpenAI公布Sora,视频生成大模型就成为全球AI行业的“爆点”,然而,哪家能够推出首个用户可用的视频生成大模型则成为业界焦点。作为国内短视频平台,快手不断加速在该领域的研发速度,今年6月初,可灵发布文生视频功能,并开放内测,在本届大会上,可灵网页端上线,不仅国内,还是海外的视频领域都引来广泛讨论。同时,本次可灵AI基础模型再度升级,推出更为清晰的高画质版以及首尾帧控制、镜头控制等全新编辑能力。目前,能单次生成的文生视频时长增加至10s,是行业中对用户开放使用可实现的最长时长。业内人士称,网页端能为创作者提供更专业、更精细的画质以及更多的功能。平台数据显示,截至目前,已有超过50万用户申请可灵的内测资格,视频生成数量达700万。

  至于图像生成大模型领域,盖坤表示,可图大模型集成了平台在大语言模型领域的深厚积累。通过数十亿中文语料的训练,其综合性能超过了SDXL/SD3等开源模型以及Midjourney等闭源模型。可图宣布开源,旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。

  文/广州日报新花城记者:文静

  图/广州日报新花城记者:文静

  广州日报新花城编辑:龙嘉丽

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500