• 最近访问:
发表于 2024-07-04 14:15:53 股吧网页版
分钟级人物视频AIGC一键生成 商汤Vimi成为WAIC镇馆之宝| 2024世界人工智能大会
来源:周到 作者:苗夏丽

  仅通过一张任意风格的照片,就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。

  7月4日,世界人工智能大会(WAIC 2024)举行,由商汤科技打造的首个面向C端用户的可控人物视频生成大模型——Vimi入选WAIC展览展示最高荣誉“镇馆之宝”,成为本届大会最具创新展品。

  首次实现分钟级可控、唯美人物视频生成

  随着大模型和生成式AI技术的快速发展,让照片中的人物动起来已经不是新鲜事。但目前市面上的相关产品在实际应用中存在诸多痛点,有的人物动作、表情动作无法精准控制,只能频繁尝试各种Prompt抽卡;有的效果稳定性不高,人物长相、背景效果变幻莫测;有的时长有限,只能生成3~4秒视频等诸多限制创作的问题,无法满足广大视频创作者的使用需求。

  为了解决这些应用中的实际问题,商汤可控人物视频生成大模型Vimi应运而生。

  与图片表情控制类技术只能控制头部表情动作不同,Vimi不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。同时光影变化也能做到合理生成,让人物动作和视觉效果流畅自然,画面和谐唯美。

  更重要的是,Vimi具备极强的稳定性,可稳定生成长达1分钟的单镜头人物类视频,画面效果不会随着时间的变化而劣化或失真,真正满足娱乐互动等需要长时间稳定视频生成需求。

  轻松化身网红,满足用户娱乐创作需求

  Vimi将完全面向C端用户开放使用,尤其能够满足广大女性用户的娱乐创作需求。用户只需上传不同角度的高清人物图片,即可自动生成数字分身和不同风格的写真视频。由Vimi生成的视频人物不再只是呆板的五官运动,而是搭配手势、肢体、头发等,形成更完整、统一的人物动作,让创作者可基于生成的视频素材进行剪辑和再创作。

  针对喜爱自拍的用户,Vimi可支持聊天、唱歌、舞动等多种娱乐互动场景;而对于热衷表情包的用户来说,Vimi通过单张图片即可驱动生成各种趣味的人物表情包,玩法多样,实现创作自由。此外,Vimi还提供唯美写真风、奇幻风等多种生成风格,让用户仿佛穿越不同次元,享受大片质感的沉浸式视觉效果。

  目前,行业里80%的视频都是以人物为主要内容,同时伴随短视频、直播平台的爆发,以人物为主体的视频需求量成指数级增长。然而,市面上缺少可控人物视频生成的AIGC产品,导致内容创作者的效率有待提升。Vimi的出现恰恰填补了这一需求空缺,为广大C端的视频创作者提供了简单、好用的创作工具,可以广泛应用于人物类短视频的创作。

  Vimi以商汤日日新大模型体系为基础,结合商汤在计算机视觉领域的多年技术积淀和经验积累,能够精准识别和理解复杂的人物图片,并通过强大的AIGC能力,实现和谐、稳定的视频内容生成。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500