• 最近访问:
发表于 2024-06-21 19:13:40 股吧网页版
AIGC行业周报 | 2024,有分析称英伟达要花68亿美元买芯片;ShareGPT4Video系列发布;马斯克:我没投资任何永生技术,活太久会对社会产生负面影响
来源:每日经济新闻

  一、企业动态

  (一)前OpenAI联合创始人Ilya Sutskever成立新公司

  OpenAI联合创始人Ilya Sutskever宣布成立Safe Superintelligence Inc.(SSI),专注于开发安全超级智能。

  SSI致力于实现“核能级别”的安全超级智能,不受短期商业压力影响,专注于安全性和AI能力的提升。

  拥有强大的资金、算力和人才支持,包括与Eric Schmidt的合作和Daniel Gross的天使投资经验,以及在硅谷和以色列特拉维夫的人才网络。

  (二)2024,有分析称英伟达要花68亿美元买芯片

  预计2024年全球HBM芯片总产能约为5600万颗,英伟达的需求量预计为2700万颗,基于单颗250美元的成本测算,意味着英伟达全年采购HBM芯片的费用可以预测到68亿美元,远超此前媒体披露的13亿美元预算。

  CoWoS封装技术是GPU-HBM芯片的关键,台积电和Amkor为主要供应商。

  二、产品技术动态

  (一)ShareGPT4Video系列发布

  由中国科学技术大学、北京大学等研究人员推出的ShareGPT4Video系列,包含4万条高质量视频-字幕数据,旨在提升视频理解和生成能力。

  通过差分滑窗视频描述策略,创建了能够为任意视频生成详细描述的模型,有助于提高视频语言模型的性能。

  数据集在多个长视频理解基准上带来性能增益,同时在视频生成任务中,使用该数据集训练的模型展现出更好的镜头和语义控制能力。

  (二)AI视频巨头Runway深夜发布Gen-3

  AI视频制作公司Runway推出了新一代视频生成模型Gen-3 Alpha,其在细节、一致性和动作表现上进行了显著改进,达到电影级画质。

  Gen-3 Alpha支持文本到视频、图像到视频等多种功能,被认为将挑战现有的AI视频生成技术,包括Sora。

  Runway计划提供定制版本,并宣布了新的安全功能,Gen-3 Alpha即将向付费订阅者开放。

  (三)开源版Sora:单镜头16秒720p高清视频一键生成

  潞晨团队Open-Sora项目在720p高清视频质量和生成时长上取得显著进展,支持一键生成16秒的任意风格高质量视频,并且宣布全部开源。

  引入视频压缩网络和优化的扩散模型算法,发布了1.1B的扩散生成模型,实现了成本与生成质量的平衡,提供了训练和推理的高效解决方案。

  Open-Sora的开源为视频内容创作者提供了丰富的创作工具,使用户从消费者转变为创造者。

  (四)Google DeepMind 最新研究:为AI视频生成创建逼真的背景声音

  DeepMind开发了V2A技术,将视频像素与自然语言文本相结合,生成与视频动作同步的逼真音效。

  V2A技术能够为无声视频添加相应的背景声音或对话,提升视频的真实感和用户体验,同时支持对生成音效的创意控制。

  V2A基于扩散模型,通过编码视频输入、迭代改进音频并解码生成波形实现同步生成,但仍在改进中,如提高音频质量和唇语同步的准确性。

  (五)ChatGPT最新定价体系

  OpenAI的ChatGPT提供多种订阅计划,满足从个人到企业的各类需求,包括免费版、ChatGPT Plus、团队版、企业版、教育版本和非营利组织版本。

  免费版用户可访问GPT-4o模型和GPT Store,但有日容量限制;ChatGPT Plus提供更高容量和高级数据分析功能;团队版和企业版提供协作工具、定制应用程序和增强的管理控制。

  ChatGPT Edu专为教育机构设计,提供额外的SCIM支持;非营利组织可获得ChatGPT团队和企业版的折扣价格。

  (六)DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

  通过3D Diffusion Transformer技术,实现高质量3D内容生成。

  解决了传统2D-to-3D升维技术中的多个问题,如多头多面、空腔、遮挡等,满足商业应用需求。

  推出面向C端用户产品,可将图片/文字转换为二次元3D人物形象,以及面向创作者的3D内容创作平台,大幅简化3D模型获取流程。

  (七)英伟达开源Nemotron-4 340B模型

  英伟达发布了一个包含3400亿参数的开源模型家族,包括基础模型、指令模型和奖励模型,采用NVIDIA Open Model License Agreement,允许分布、修改和使用模型及其输出。

  模型训练使用了超过98%的合成数据,展示了在生成合成数据方面的能力,有助于训练更小的语言模型,同时开源了合成数据生成流程。

  Nemotron-4 340B性能在多个基准测试中与GPT-4o等专有模型竞争,支持多种语言和编程语言,对商用友好的许可协议,可能对医疗、金融、制造业和零售业等行业产生重大影响。

  三、前沿观点

  (一)马斯克最新专访:我没投资任何永生技术,活太久会对社会产生负面影响

  人工智能很快会改变一切,最早明年就能带来显著改变,五年内将带来激进变化。

  马斯克认为,人工智能将在搜索领域超越谷歌,提供更为精准、个性化的搜索结果。

  马斯克透露,SpaceX的最终使命是将生命拓展至多个行星,以扩展人类的意识边界。

  马斯克的脑机接口公司Neuralink正研究大脑芯片,致力于创造人类与人工智能的共生关系。

  马斯克预测,将来每个人至少会拥有一个机器人。全球将有200亿台类似擎天柱的人形机器人。

  (二)奥特曼谈AI的机遇、挑战与人类自我反思:中国将拥有独特的大语言模型

  认为AI在提升生产力方面已显现积极作用,但网络安全等问题也随之而来。

  GPT-4o能覆盖97%人群的母语,奥特曼承诺将持续改进,解决语言公平性问题。

  面对AI治理的挑战,OpenAI成立安全委员会,奥特曼强调安全与效率并重。

  奥特曼预测在众多大语言模型,少数将会胜出;中国将会拥有自己独特的大语言模型。

  奥特曼认为AI可能使人类更谦卑,促使我们重新认识自身在宇宙中的位置。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500