北京时间12月13日,OpenAI进入“连续12天直播发布”的第6天。 在13日的发布会上,OpenAI“起大早赶晚集”,终于官宣将要推出7个月前已经离职的原首席技术官米拉(Mira Murati)曾发布的实时通话、理解屏幕功能。
实时视频通话理解屏幕内容拥有记忆和理解能力
在本次发布会中,ChatGPT通过摄像头同4名直播人员进行了互动,它首先“记住”了每个直播人员的名字,随后正确回答了主持人的随机提问,包括“谁戴着鹿角配饰”、“谁戴了圣诞帽”等,值得注意的是,它的回答可以随时被主持人打断,并再熟练地“接话”,表现同人类别无二致。
直播人员还展示了ChatGPT的“辅助”能力,如通过摄像头的观察,语音指导直播人员冲咖啡,实时讲解每一个步骤所起到的效果,并对直播人员的动作进行评价。 以及给ChatGPT转发短信内容及图片,让大模型建议如何回复对方的短信。
值得注意的是,7个月前,ChatGPT最先进的大模型还是GPT-4o,而目前模型已经进化到了o1。 此外,时隔半年,国内大模型如讯飞星火、智谱等都已经推出了类似功能,同再次发布Sora一样,OpenAI此次发布的功能依然属于“起大早赶晚集”,已经不再像首次发布一样令人惊艳,且要面对国内同类产品的竞争。
OpenAI直播官网截图
新功能曾被推迟数次 Plus和Pro套餐用户可“在几天内使用”
根据直播展示的内容,要启动视频对话,ChatGPT用户需要点击聊天栏旁边的语音图标,然后点击左下角的视频图标。 如果想共享屏幕,手机用户要点击打开菜单,选择其中的“共享屏幕”。
事实上,该功能自今年5月第一次发布以来,已经被推迟了几次。 今年4月,OpenAI承诺该功能将在几周内向用户推出。 几个月后,该公司表示需要更多时间。 6月末,OpenAI计划向一小批Plus用户推出该语音模式,但之后又宣布再次推迟,“以便确保该功能安全有效地处理来自数百万用户的请求。 ”
而本次直播发布,OpenAI终于宣布“大多数ChatGPT Plus和Pro套餐的订阅用户以及所有团队用户都将可以在今后几天内通过ChatGPT访问该新功能。 ”
贝壳财经记者注意到,OpenAI在这次发布中还把“圣诞老人模式”作为亮点放进了发布会的标题中,但实际上其就是一款可以限时访问的圣诞老人语音,“即使用户的高级语音额度已用完,首次与圣诞老人对话时,系统也会重置额度,确保人人都能体验。 ”
新京报贝壳财经记者罗亦丹