• 最近访问:
发表于 2024-12-30 14:59:00 股吧网页版
智元机器人开源全球首个基于全域真实场景百万数据集
来源:科创板日报

  今日,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,正式开源百万真机数据集AgiBot World,数据质量从实验室级上升到工业级标准,后续还将发布具身基座大模型.

  据智元机器人方面介绍,AgiBot World是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。此前,具身智能训练领域大规模的开源数据集是Google的Open X-Embodiment。相较于前者,AgiBot World长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量也从实验室级上升到工业级标准。

  AgiBot World数据集复刻了家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)五大核心场景,涵盖了80余种日常生活中的动作和技能。

image

  在这个具身数据的世界里,机器人不再只是进行简单的桌面任务,而是进入到人类日常生活的方方面面,既有抓取、放置、推、拉等基础操作,也有搅拌、折叠、熨烫等复杂动作。

image

  高质量的数据集对于当下人形机器人技术的发展尤为重要。人形机器人需要在训练中不断成长,才能像人一样的活动并完成任务。如同小学生做习题提高自己的学习能力一样,人形机器人也需要数据集这样的“习题册”来提升自己。

  但是数据,尤其是高质量的的数据仍是发展人形机器人当下一个卡点。现有开源数据集,或多或少都存在采集流程缺乏标准化、机器人构型过时、数据质量格式参差不齐等问题,在机器人策略学习的过程中甚至会带来副作用。

  在数据采集方面,傅利叶智能通用机器人事业部副总裁周斌表示,现在的机器人数据采集方式主流的还是以人的遥操的方式采集,未来则需要更拟人化,以提高数据对具身智能的泛化和迁移能力;二是提升数据维度,如增加触觉等数据输入,满足工业和实际场景需求;三是采用虚实结合的技术路径,提升数据集量级,目前物理世界数据集仍不足。

  通过低成本方式,高质量地获取数据对机器人进行训练,是量产前要解决的关键问题。一直以来,业界也正在积极补齐短板,如特斯拉等公司开展大规模真机数据采集。

  12月27日,北京国地共建具身智能机器人创新数据采集基地亮相;12月28日,上海提出“搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训”。

  国家地方共建人形机器人创新中心(“国地中心”),是目前我国发展人形机器人产业一个重要载体。该中心当前一个重要任务也是组建机器人训练场收集数据。

  国地中心总经理许彬在接受《科创板日报》记者采访时表示,这个训练场将落地在浦东张江模力社区,可容纳100个人形机器人同时训练,预计到2027年这一数字将达1000个。

  AgiBot World是智元机器人本年度开源的第三个项目,相关数据将在HuggingFace、Github以及agibot-world.com项目主页上分批上传。

  智元机器人方面称,将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。

郑重声明:用户在财富号/股吧/博客等社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
作者:您目前是匿名发表   登录 | 5秒注册 作者:,欢迎留言 退出发表新主题
郑重声明:用户在社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》

扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-34289898 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:021-54509966/952500