近期,云计算巨头AWS(亚马逊云科技)几乎在以日更的速度上新AI服务。
12月的re:Invent全球大会上,AWS发布了新款基础大模型Amazon Nova系列,目前包括6款大模型,涵盖语言、图像生成和视频生成模型。
此前,AWS已经有Titan模型,现在更多的模型正在路上,不论自家模型还是第三方模型,都将在AI应用开发平台Bedrock上提供。同时,AWS还推出了新一代AI芯片Trainium3,将采用3纳米工艺制造。
可见,AWS正在AI基建上全面投入,除了模型和芯片之外,亚马逊整体也在生成式AI上进一步发力,不久前再次豪掷40亿美元投资Anthropic,并持续在数据中心建设上大举开资。
AWS开始发起攻势,而场上的博弈早已火热。同样在AI上“氪金”的不只有AWS,微软、谷歌、字节纷纷“一掷千金”;OpenAI刚刚连开了12天发布会,预告了新一代AI推理模型o3和o3-mini。
从训练到推理,从大模型到AI Agent(AI代理),生成式AI来到了新的阶段,面临新的赛点。
近日,亚马逊云科技生成式AI全球副总裁兼总经理Vasi Philomin接受21世纪经济报道记者专访时谈道:“现在客户更关心的是如何将AI工具实现规模化应用,大家已经逐渐理解这项技术的真正价值,并且开始有选择地应用它,而不是盲目跟风。这也说明了‘炒作’阶段正在逐渐过去。”
在他看来,之前生成式AI引发了大量炒作,尤其是当AI代理成为热门话题时,进一步加剧了这种现象。但现在客户变得更加理性,开始思考实际应用,这是一种积极的变化。
如果从业界有名的技术发展曲线(Gartner Hype Cycle,也被称为“炒作周期”)来对照,Vasi Philomin认为,生成式AI的发展刚刚越过了第二阶段峰值期(Peak of Inflated Expectations),开始有了规模化的应用。
但是他也指出,未来也会有一个阶段,大家发现生成式AI无法解决所有问题而感到失望,但这都是技术发展的必然过程。随着越来越多应用落地,生成式AI正逐渐从“炒作”转向实际价值。
眼下,大模型的缠斗还在持续。Vasi Philomin告诉记者:“我认为最终只有少数公司,大概五到十家,能够负担得起从头构建大模型。这些公司将拥有最强大的模型,但这些模型也会逐渐趋同,差距会逐渐缩小。”
当然,随着大模型进化得更加强大,通向AGI的道路也更进一步。对于场上的玩家而言,现在似乎是一场“无限战争”,所有人都在押注AI,在FOMO(Fear of missing out,错失恐惧)的氛围中,谁都不想错失下一个时代。格局未定之际,巨头们正在一次又一次加注。
AWS进击生成式AI:“一个模型无法解决所有问题”
《21世纪》:AWS在生成式AI市场中的定位是什么?与其他云厂商相比,AWS有哪些竞争优势?
Vasi Philomin:AWS真正擅长的是将生成式AI等技术大规模应用于现实世界的业务中,我们之所以能够做到这一点,是因为我们从端到端(end to end)进行思考。
举例来说,20世纪90年代,亚马逊还是一家书店,当时就有推荐功能,这其实是大规模机器学习应用;快进到现在,看看Alexa,它已经进入了超过一亿个家庭;在物流中心,里面有机器人和人类并肩工作;Bedrock上有很多模型,能帮助人们构建应用程序的工作流,此外,我们还有定制硬件,降低运行模型的成本。
我认为公司的DNA就在于此,会帮助我们继续成功。因此,我们不太在意竞争对手在做什么,而是专注于客户的需求,同时聚焦现实世界的业务问题,并将解决方案大规模地推广。
《21世纪》:目前生成式AI在哪些领域应用最为广泛,有哪些典型案例?
Vasi Philomin:如果你在18个月前问我,我可能不会猜到,以下两个领域会是最早大规模采用生成式AI的领域。第一是金融科技服务,第二是医疗健康生命科学。传统上,这些行业更加保守,通常发展较慢,然而它们却以惊人的速度采用了生成式AI。
原因在于,这些公司早已习惯了监管的要求,因此必须确保数据保持在非常良好的状态。大多数情况下,它们已经将所有数据迁移到云端,并且在数据治理方面有着非常严格的实践。
生成式AI的核心在于推动创新,而生成式AI与高质量数据的结合,才真正让创新成为可能。因此,这些公司因为已经拥有完备的数据基础,所以能够非常迅速地采用这些技术。
比如,在金融科技领域,纳斯达克的数字业务运行在AWS上,有一个业务部门的重点是识别金融犯罪,比如内幕交易等,分析员需要整合大量数据,而生成式AI帮助分析员的工作效率提高了33%;在医疗领域,辉瑞目前有大约17个生成式AI的用例,如果这些用例能够成功落地,他们预计每年将节省7.5亿到10亿美元。
《21世纪》:AWS最初是什么时候关注到生成式AI,如何建立AI团队?
Vasi Philomin:十年来,亚马逊一直在各个业务领域广泛使用AI,无论是在零售业务,还是在AWS中。2016年底,我们开始将AI能力开放给客户,当时AWS成立了一个专门的AI业务团队,核心使命是“让AI民主化”,让客户轻松地获取和使用AI功能,可以将AI整合到他们的工作流程中。
那时我正好加入了AWS,之后我们推出了很多AI服务,比如语言服务(Amazon Translate用于文档翻译、Amazon Polly用于语音合成),Alexa的语音其实就是Polly的声音,Alexa之所以能“说话”,是因为它依赖于Polly的技术。此外,我们还推出了视觉服务、工业服务、医疗保健相关服务等。
然后,我们注意到“Transformer架构”逐渐流行起来了,这种架构是所有新一代生成式AI模型的核心。三年前,我们推出了一项服务,名叫CodeWhisperer,可以被视为生成式AI的一种早期形态。随着技术的进步,模型变得越来越大,功能也越来越复杂,我们自然地进入了生成式AI领域。
我认为ChatGPT的推出是一个重要的转折点,他们抓住了全世界消费者的想象力,向大家展示了AI的强大力量。但AWS的关注点不同,我们始终专注于真实世界的业务用例,以及如何将技术应用于规模化的场景中。
《21世纪》:在推进生成式AI的过程中,早期的工作重点是什么?
Vasi Philomin:我们的客户包括初创企业、中小型企业以及大型企业,他们依赖AWS来保证安全性、隐私保护和操作稳定性,我们不能出任何差错。
生成式AI需要大量数据,而保持数据的私密性和安全性至关重要。所以我们没有仓促推出产品,而是与客户深入沟通,了解他们的挑战和需求。
我们得出的第一个结论是,客户需要的不仅仅是一个AI模型,而是多个模型,因为一个模型无法解决所有问题。第二个挑战是,客户需要一种简单的方法来构建应用程序,并实现差异化,确保他们的竞争优势。第三个挑战是成本,客户希望能够以较低的成本大规模应用这些技术。
基于这些洞察,我们在去年4月推出了Bedrock服务,全力加速开发,最终在9月完成了正式发布。自那以后,Bedrock的发展非常迅速,目前已有超过一万家企业组织在使用这项服务。Bedrock是AWS历史上增长最快的服务之一,我们几乎每天都在推出新功能。
Bedrock的核心在于,AWS不仅提供自己的模型,也汇集了其他领先AI公司的模型。这种开放的策略让客户有更多选择,根据自己的需求找到最合适的解决方案。
《21世纪》:但是一些分析人士认为,AWS在推出自己的生成式AI工具方面可能慢了一些?
Vasi Philomin:我们的行动更加谨慎和深思熟虑。我们并不急于推出产品,而是确保我们提供的服务真正满足客户的需求。举个例子,我们是第一家推出“Guardrails”(护栏机制)的公司。想象一下,在没有这个机制的情况下,企业客户急于推出一个AI聊天机器人,结果用户可能会问这个机器人关于政治或其他敏感话题,这些问题可能会让企业陷入被动,而没有任何控制。
此外,我们也是第一家推出企业级代理框架(agents framework)的公司。去年6月的纽约峰会上,我们发布了这个框架,帮助客户构建更强大的AI代理。
所以,那些认为AWS行动较慢的分析人士可能没有全面了解数据。事实上,我们在很多领域都是行业的第一,我们率先提出“一个模型无法解决所有问题”,并将多个模型整合到一个平台上,让客户可以自由选择、快速切换。
推出生成式AI工具并不只是发布一个聊天机器人或一个模型那么简单,我们需要确保这些工具能够被企业客户在真实世界中大规模应用。这需要深思熟虑和大量的准备工作,而我们一直在这么做。
《21世纪》:AWS已经推出了自己的模型Titan,也投资了其他大型模型公司,接下来计划如何进行整合?
Vasi Philomin:首先,我们始终专注于客户需求。很明显,客户需要多个模型,而不是单一模型。在特定的模型类别内,比如文本模型或大语言模型,客户需要在成本、延迟和准确性之间做出权衡和选择。有些模型特别大、功能强,但成本较高,而有些模型更适合速度更快但不一定那么强大的任务。
例如,Anthropic的Claude模型就有三种不同版本:Haiku、Sonnet和Opus。Haiku非常快速,但在推理能力上不如Sonnet,Opus则更加强大,但成本相对较高。这些不同的选择满足了不同客户的需求,这就是为什么我们强调“开放策略”,我们不仅仅提供自己的模型,也汇聚合作伙伴的模型。
Titan模型方面,我们已经推出了Titan图像生成模型,日本的Denso公司,就在他们的业务中使用了该模型。
谈生成式AI“泡沫”:已过“炒作”阶段大模型差距在缩小
《21世纪》:如何看待未来AI大模型公司之间的竞争格局?未来只有少数公司会留下吗?
Vasi Philomin:首先,我们要看到,18个月前,市场上可能只有一两个大模型,而现在,模型的数量已经迅速增长,数百种模型已经问世,而且这些新模型的性能也在迅速追赶甚至超越早期的大模型,这说明创新的步伐非常快。
但是,它们之间的差距正在逐渐缩小。当然,目前还有少数几个模型确实更出色一些。我本不该这么说,但事实确实如此,但这种差距会慢慢弥合。
关键的问题在于构建这些大模型的成本,从零开始训练一个大模型,需要的不仅仅是大量的资金,还需要顶尖的人才,这是大部分公司无法承受的门槛。但使用现有的模型进行微调要容易得多,成本也低很多。你只需要一到两周的时间,投入少量的资源,就可以对一个现成的模型进行调整,让它为你完成任何任务。
因此,我相信最终只有少数公司,大概五到十家,能够负担得起从头构建这些大型模型。这些公司将拥有最强大的模型,但这些模型也会逐渐趋同,并可以互换使用,这将是一个明显的趋势。
这些公司要么是专注于将AI模型作为商业核心的企业,拥有清晰的商业计划,要么是那些具备基础设施投资能力的大公司,他们才能够持续开发这些模型。
AWS的目标是让这些技术变得触手可及,这与我们当初推广云计算的目标是一样的。当时,我们使计算和存储资源变得高度可访问,而这彻底改变了整个行业。所以,即使未来只有十个最顶级的模型,这些模型也会通过AWS等平台对所有人开放,人人都可以使用它们。
《21世纪》:现在大家非常关注生成式AI的投资回报,应该如何平衡AI投资与盈利?
Vasi Philomin:我始终告诉客户,首先要从高价值的业务问题开始,而不是从技术出发。比如,有些公司看到其他人都在客服领域使用AI,他们也想尝试。但更好的方式是,深入分析你的业务,找出那些能够带来最大增值的机会。
你可以思考两个方向:一是如何创造新的产品和服务,推动业务达到一个全新的高度;二是如何提升生产力,降低运营成本。
简单来说,你要么提高收入(top line),要么降低成本(bottom line)。大多数业务都会围绕这两个目标展开。因此,找到一个高价值的业务问题,然后判断生成式AI是否是解决该问题的合适工具。
现在,AI 推理的成本仍然较高,但如果你从高价值问题入手,就能负担得起实验和实施的成本。如果只是解决一个低价值的问题,那么当前的成本可能让你觉得不值得使用生成式AI。
我们也在努力降低AI的使用成本。随着技术的进步,训练和推理的成本将不断下降,而这正是AWS 的目标之一。最终,我们希望让生成式AI成为所有人都能负担得起、并广泛应用的技术。
《21世纪》:有观点认为现在AI有泡沫,你怎么看待?
Vasi Philomin:从“技术发展曲线”(Gartner Hype Cycle)的角度,我认为可能已经看到了峰值期(Peak of Inflated Expectations),这个判断是基于我与许多客户的接触。
过去,当客户听到生成式AI时,他们甚至不知道这是什么,他们迫切地想理解这种技术。而现在的问题变成了:我如何将它应用到我的业务中?我们能否真正跨过试点阶段,并将其成功部署到实际应用中?
客户已经开始理解,现阶段应该将生成式AI应用于哪些合适的场景。所以,我觉得“炒作”阶段可能过了,并已经略微回落了。之前确实存在大量炒作热潮,特别是随着AI代理的兴起,更是加剧了这种现象。但我现在认为,客户对这项技术的理解比以前更深入了。
我认为现在刚刚越过了峰值,可能处于曲线上略低于峰值的地方。人们开始认识到生成式AI确实有实际的应用场景,开始出现一些真正规模化的应用,并且它们逐渐开始发挥作用。
接下来,人们可能会感到失望的一个阶段是,他们原本期望这项技术非常伟大,但最终意识到AI并不能应用于所有场景。但在那之后,技术会进入一个稳定的阶段,最终真正成为一项成功且实用的技术,进入“实际应用”阶段。
《21世纪》:AI Agent今年成为热门话题,如何看待发展趋势?
Vasi Philomin:在我看来,AI代理是一种可以自主地接受目标并利用所提供的工具和资源完成任务的技术。简单来说,它就像一个自动化的数字工作者,能够帮助我们完成工作。
基于这个定义,今天的AI代理能做什么?目前,我们可以创建非常简单的代理,它们可以处理有限数量的工具和资源。但如果你给它成千上万种工具,它们会“迷失方向”,不知道如何选择最合适的工具。因此,我们需要不断为代理添加新的功能,提升它们的能力,让它们变得更加强大。
举个例子,最近我们在Bedrock的代理框架中新增了两个重要功能。一是长期记忆,这意味着它可以记住与用户的多次互动,理解用户的需求和偏好,从而提供更个性化的服务。二是代码生成与运行,AI代理现在可以生成代码、运行代码,并将结果反馈给用户,这让代理能够解决更复杂的问题。
未来,AI代理将变得更加智能。研究人员认为,未来的AI代理将能有效地利用大量工具,并找到解决问题的最佳路径。此外,我们还会看到“代理之间的协作框架”逐渐兴起,这意味着不同的AI代理将能够相互通信、协作完成更复杂的任务。
想象一下,每个AI代理都具备不同的技能,就像人类一样。某个代理擅长预订航班,另一个代理擅长预订酒店,这些代理可以协作,为用户提供一站式服务,比如完成度假套餐的预订。
这也与我们现实世界中的公司运作模式类似,拥有不同技能的人协同工作,共同解决问题。未来,AI代理将成为一种真正重要的技术,它的潜力巨大。
《21世纪》:在生成式AI领域,你认为未来几年最值得关注的技术趋势是什么?
Vasi Philomin:之前提到的AI代理是一个很好的答案,它会成为一个重要的发展方向。同时我还想强调几个趋势,其一是成本的下降,AI推理和训练的成本将持续下降,使更多企业能够负担得起并大规模应用生成式AI。
其二是多模态模型的兴起,未来,AI将能够同时处理文本、图像、音频等不同类型的数据,并将它们结合起来,提供更强大的功能。
其三是超个性化应用,生成式AI将推动超个性化应用的发展。举个例子,假设您是一家游戏公司,您可以为每个玩家提供完全不同的游戏体验。AI可以根据玩家的偏好和行为,动态调整游戏内容,使同一款游戏在不同玩家眼中变得截然不同。
这些趋势将推动生成式AI进入一个全新的发展阶段,为各行各业带来更多创新和机遇。