股吧首页 > 百度吧 > 正文
  • 最近访问:
发表于 2024-11-13 21:30:20 股吧网页版
对话百度“自由画布”创作团队:多模态AI创作工具“立等可取”
来源:中国经营网


K图 BIDU_0


K图 09888_0

  “应用来了”是百度世界大会2024年的主题。数据显示,截至今年11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,增长约30倍。百度创始人李彦宏表示:“这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。”

  为了迎接AI应用爆发的到来,百度一方面发布了两大赋能应用的AI技术——检索增强的文生图技术(iRAG)和无代码工具“秒哒”;另一方面带来了一款全模态AI创作工具,由百度文库和百度网盘联合开发的工具类智能体——“自由画布”。

  “自由画布可以帮你完成从找资料到编辑,再到生成和分享的全部任务。每个人都可以成为漫画家、短视频导演。”李彦宏强调道,“这不是期货,是立即可用的现货。”

  自由画布是百度文库、百度网盘联合首创的内容操作系统,打通了公域与个人授权的私域内容,通过“一拖一圈”的极简操作,实现对全格式、全模态文件的混合理解、生成、创作,并支持对富媒体文档的一键分享和存储,实现输入、编辑、创作、分享自由。

  近日,《中国经营报》记者采访到了自由画布的创作团队,探秘自由画布产生背后的故事。

  百度文库AI MAU超7000万

  自大模型发布之后,百度一直在用AI重构各业务。据介绍,目前,百度文库的AI用户MAU突破7000万,已经成为国内最大的AI原生产品。与此同时,百度文库也推出了智能PPT、智能研报和智能画本等AI能力。为了让用户更加方便地使用百度文库AI能力,近期百度文库还针对文库首页进行重新改版,除了提供专业权威的内容搜索以外,也将AI能力进行整合,提供了智能对话、智能PPT多种AI工具箱,方便用户使用文库AI功能。

  目前百度文库团队正在研发的重点,是全新的全模态的AI创作工具自由画布。

  “在AI能力发布后,世界上存在两种边际性的工具产品,第一类是WPS和Office的编辑器,这类的特点是创作成本非常高,它可以通过用户意图生成用户想要的内容。第二类是AI编辑器,这类编辑器特点是门槛相对比较低,可以生成大量文本,但是很难创意出来用户想要的精准内容,生成的大部分内容用户没有办法直接使用。”百度文库AI产品负责人钟昊解释道,百度自由画布是未来的AI创作平台,期望通过自由画布产品,同时解决操作成本很高和无法精准生成内容两个难题,真正实现自由输入和自由创作。

  自由输入的第一个层面是指用户电脑本地、百度网盘以及网页里面所有的素材,全部都可以自由拖入到自由画布里面进行编辑;另外一个层面是指素材的模式和文件的格式,不只支持文本、音视频、PDF,甚至支持URL更多内容类型直接拖入到自由画布里面。

  “真正实现一拖一放,就可以把相关的编辑素材拖到自由画布里面进行编辑。”钟昊说道,自由创作也分两个层面,第一个层面是指自由画布里面的多个素材或单个素材,全部或者部分内容可以进行内容创作;第二个层面是自由画布可以生成多模态的内容,不只是文本、文档,还有音像视频的内容形式。

  百度副总裁、百度文库&百度网盘负责人王颖告诉记者,自由画布的设计理念是解决从输入到处理到输出,多个不同内容,跨模态多平台操作,最后都可以在一个产品上实现。“过去Word、视频、图片都有不同的编辑系统,没有办法在一个平台实现融合;其次,用户私有内容(本地内容)和网络上的公域内容很难融合,自由画布则能充分理解本地知识和公网上知识,协同生成一个非常完整的知识。”

  自由画布产生的过程

  自由画布的设计理念其实经历了两个阶段。第一个阶段,从去年3月份百度开始用AI重构内部业务的时候,文库的重新定位是内容创作和查找内容的起点。“但我们发现了一个比较大的问题,就是各种素材编辑器特别多,且分布在不同的平台。发现这个问题之后,我们就坚定要做融合跨模态编辑器。”王颖说道。

  确定了融合的编辑器,百度文库开始找一个品类做尝试,看看路径能否走通,于是就推出了PPT功能,后来发现用户需求非常大,产品尝试范围逐渐扩大,到今年2、3月份,自由画布的产品形态逐渐变得比较清晰。

  “自由画布不是第一天长成这个样子的。”钟昊说道,在极小范围测试时产品经过几轮迭代,最早时候的产品形式甚至不是画布。在融合编辑下进行灰度测试时,发现用户使用融合编辑器的自由和开放程度比产品经理想的还要多。例如,有的用户会把自己收藏的文章段落、自己拍摄过的图片视频,或者在网上找到的截图,统统放到一个文档里面编辑使用,然后用AI生成他想要的文档、图片、图文结合的海报或者视频。最后才有了今天自由画布的产品形态。

  王颖表示,自由画布主要从输入、处理和输出三个维度进行考虑。因为是内容操作系统,涉及输入和输出,所以一定要做多模态。在4月份的时候,把漫画和绘本功能都做出来了,这中间其实是打通整个底层编辑器的过程,从文档类的编辑器,向多模态的编辑器一点一点积累,逐渐形成了产品形式和产品雏形。

  “在此过程中,我们面临的一个较大问题就是公域和私域融合的问题,因为百度文库是公域的,百度网盘是私域,所以从9月开始,百度文库开始处理和百度网盘协同、打通的事情。”王颖透露,自由画布的整个产品思路已经清晰了,百度文库和百度网盘底层能力的打通已经准备好,用户交互层面正在内部迭代中,目标是在11月底对外体验。

  “无论是行业内的人士,还是投资人,都觉得网盘和文库应该在一起。”王颖说道,“首先,内容生产就是创作、编辑和存储与管理,创、编属于文库,存、管属于网盘;其次,归到网盘,希望从内容生产的起点,到消费的终点,可以用‘网盘+文库’成为跟用户沟通的新媒介。未来好的AI能真正成为个人的助手,一定要懂你的私域的东西,而现在很多大模型都是抓取的公域知识,公私域的结合在未来场景一定很大。”

  如果没有大模型,百度网盘和百度网盘可能只能停留在功能项的融合层面。而大模型的出现,让产品的边界发生了变化。王颖举例说道,文库从原来的检索平台变成可以创作的平台,网盘从原来的存储平台变成既可以消费也可以创作的平台。

  “大模型让产品边界发生了变化,让这两件事(文库和网盘)变成是一件事,因为创作和存储本来就是循环的。另外,产生的数据还可以形成数据飞轮,让产品变得越来越好。在做预训练的时候,数据决定了模型的基础;后面模型的提升,则完全靠数据的质量和精度。”王颖说道。

  商业化的变化

  据了解,自由画布主要定位于两类人群,一类是年轻用户,一类是专业用户。专业用户的使用深度比较高,使用产品时的痛点更强,他们希望有更好的产品、更高科技的产品,帮他解决问题。年轻用户是原生的手机用户,还没有接受过传统编辑工具的人,对简单易用、高精尖的接受程度比较高。

  “大模型对产品重构在商业上带来的变化就是,产品年收入同比增长了20%。”王颖指出,网盘和文库的商业模式天然就和大模型非常匹配,包括AI能力扩展边界带来更多的权益,可以开发出更多的产品组合,以及会让付费率、转化率提升。

  目前百度文库和百度网盘都有各自的会员体系,打通文库和网盘而诞生的自由画布在会员体系上是否会做打通?

  “一年内可能不会变成一个会员,但是两个产品会有联合会员。联合给到用户的时候,无论从用户体验上,还是商业模式上,都能感觉到网盘和文库在一起提供服务。”王颖解释道,因为两个产品各有侧重,比如网盘强调存储和消费,文库强调内容生产和创作。但是未来如果能实现生产和消费的端到端,一产品一票制也是有可能的。

  对于未来的产品创新方向,钟昊透露,首先在产品交互层面,会用LUI(语言用户界面)+GUI(图形用户界面)的方式,变得非常自然,实现“指哪打哪”。现在不少用户反映一些大模型应用不好用,是因为用户希望大模型作出局部调整的时候,在重新生成时大多数很难准确实现。其次,在数据模态上,用户不只是有需求消费单一模态内容的需求,而是衍生出相关的多模态内容其实都需要。第三点是产品形态上,朝工具+内容的结合,过去提供工具的产品只提供工具,提供内容的产品只提供内容,未来大模型是内容和工具结合在一起的。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500