当AI战略成为“必然选择”,不断升级也是大势所趋。记者从今日举行的2024 vivo开发者大会上了解到,vivo正式发布全新AI战略——“蓝心智能”,同时带来全面升级的自研蓝心大模型矩阵、原系统5(OriginOS 5)、蓝河操作系统2(BlueOS 2)以及vivo在安全、人文、生态合作等方面的最新成果。
去年,vivo推出了自己的技术品牌——“蓝科技”,这是vivo基于用户需求,所构建的技术研发体系。其包含了“蓝图影像”“蓝海续航系统”“蓝晶芯片技术栈”以及全新升级的“蓝心大模型”和“蓝河操作系统”。短短一年,其AI战略再度升级,从中可见AI技术的新进展。
(vivo全新AI战略“蓝心智能”发布。)
在去年开发者大会上,vivo 发布了自研十亿、百亿、千亿三个参数量级,由5款语言大模型组成的蓝心大模型矩阵、1B、7B、13B的端侧大模型以及基于蓝心大模型推出了蓝心小V和蓝心千询APP。数据显示,截至目前,vivo的AI能力已覆盖全球60多个国家和地区,服务超过5亿手机用户,大模型token输出量超过了3万亿个。
而在此次大会上,vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围正式发布了vivo的全新AI战略——蓝心智能。据介绍,蓝心智能是将大模型技术与手机操作系统深度融合的个人智能。周围解释,以蓝心大模型为技术底座,蓝心智能可以理解用户的个人情景和偏好,为用户提供个人化的专属服务。
不仅如此,vivo还正式发布了全新30亿参数量级的蓝心端侧大模型3B。在对话写作、摘要总结、信息抽取等能力上,蓝心3B可以越级比肩行业7B-9B模型,相比蓝心7B,蓝心 3B极致性能提升300%,平衡模式下功耗优化达46%。
另外,新一代操作系统——原系统5(OriginOS 5)也正式发布。在原系统5中,蓝心小V与Jovi语音正式合并,新增了长按屏幕底部,呼出“小V搜索”等一些全新的交互方式。基于蓝心多模态大模型技术,vivo全新推出小V圈搜功能,在既有的文本搜索基础上,通过图像识别与圈选交互的结合,精准搜索对象,为用户带来更加便捷的“一圈即搜”。
用AI重构的系统体验体现在哪里?
听得懂方言,AI还能读懂人的情绪了!
在今年的vivo开发者大会上,“AI重构”成为关键词。记者了解到,为了达成这一点,vivo从三个方面用AI重构了系统体验。首先是重构人与设备的交互体验,让交互更自然更符合直觉。具体来说,在蓝心大模型的加持下,手机将具备更强大的分析能力,无论是按压屏幕的力度、圈搜文字或图片、还是拖拽一段地址信息,多模态大模型都可以深度解读用户的意图,进而给用户需要的反馈和服务。而依托文本大模型,结合自监督学习语音编解码、多语音任务学习和模态对齐等技术,让蓝心小V在文本能力外,进一步具备强大的语音表征理解与生成能力,进而让手机能够与人自然对话、翻译语言、模拟人声甚至理解对话中的情绪。
同时,AI还重构了人与数字世界的服务体验,让智能更加个人化。据了解,vivo为三方开发者构建了连接服务的框架和平台,让人在找服务的同时,服务也能主动匹配人的需求。而通过构建个人智能系统框架,经由本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。
此外,重构的重点还在于“人与物理世界的连接体验”。记者看到,利用多模态大模型,手机已然成为视障人士的眼睛,可以方便地帮助视障人士“读出”所在的环境等。“vivo看见”功能得到了语音大模型加持,新增了实时问答功能,而今年为了协助国家通用手语的普及与推广,在“手语翻译官”中升级了“手语学习”功能,希望可以帮助更多的人学习手语。基于蓝心语音大模型,“vivo听说”新增了方言自由说功能,目前支持6种方言,以解决各地区间的沟通障碍问题,也让用户可以以自己最熟悉的乡音与手机进行交互。
文、图/广州日报新花城记者:陈薇薇