新华财经北京 8 月 11 日电 「不同于去年大会的机器人技能展示,今年最明显的感受是 『落地』。」 一名参展商对中国证券报记者感慨道。2025 世界机器人大会上,机器人化身商超零售员、物流分拣员、上下料工人、居家保姆,在不同场景中,演示着各自的应用潜力。
当然,机器人目前仅具有在有限场景执行简单任务的能力,还不足以应对复杂现实场景的挑战。记者采访多位参会企业高管与专家后发现:距离机器人真正走进更多场景 「打工」,行业仍需攻克机器人 「大脑」 能力这一核心关卡。对此,部分企业已展开积极探索,力求在具身智能大模型性能上实现突破。与此同时,开放场景中 「边做边学」、用合成数据破解 「数据荒」 等,都是行业探索者正在进行的实践。
让一部分场景先商业化
在 8 月 8 日至 12 日举办的 2025 世界机器人大会上,机器人公司纷纷展示落地应用场景。在银河通用的银河补给站,机器人往返于货架为观众取商品;越疆机器人戴上橡胶手套,「望着」 面前的物料分拣箱,时刻准备 「上岗」;乐聚机器人 「夸父」 步行到货架,精准地取下物料;星尘智能 Astribot S1 面对围观人群泡起了咖啡。
据介绍,本届大会共有 200 多家国内外机器人公司参会,全场共展出了 1500 多台机器人产品,创国内机器人展会之最。
各家企业高管透露,在会场之外的现实场景中,机器人也正在一部分场景操练起来。
松延动力的人形机器人订单已经突破 2000 台。松延动力创始人、董事长姜哲源表示,在手订单中教育行业占比最大,涵盖教育培训、科研等场景,「让机器人做领跑员、领操员,或是在文旅行业做导游,都是我们在探索的场景。」
傅利叶带来其近期正式发布的首款主打交互陪伴、具备 「可触摸」 特性的全尺寸人形机器人 Care-bot GR-3,可应用于陪伴、医疗、康养等场景。2025 年,傅利叶计划交付数千台旗下机器人产品。银河通用机器人创始人兼 CTO 王鹤说,公司的机器人已经在北京 10 家无人药店上岗,用户下单后可以由机器人取货,到年底将扩展至 100 家。
另外,智平方的 AlphaBot(爱宝) 系列机器人今年已收到近 500 个订单,目前已在东风柳汽、晶能微电子等工厂投入使用。星动纪元带来大会展示的星动 Q5 机器人目前已经获得几十台订单,预计今年会交付 100 台。「人形机器人商业化进程明显加快了。」 公司相关负责人称。
在大会现场,机器人形态也不局限于 「双足」,下肢可折叠、可升降的机器人展品明显增多。擎朗智能、帕西尼、灵宝 CASBOT 都带来了轮式底盘、下肢可折叠、可升降的机器人产品,拓宽了机器人活动边界,可以适配更多场景使用需求。
但目前机器人可应用的场景仍是有限的。国际先进技术应用推进中心 (深圳) 主任姚颂将具身智能和自动驾驶类比,参考自动驾驶行业 L1 到 L5 的分级,划分了具身智能进阶路线。「具身智能 L1 阶段,机器人可以完成给定的明确单一任务;具身智能 L2 阶段,在明确任务边界、人为拆分任务步骤后,机器人可在每个给定任务中有一定自主调整执行能力。」 姚颂表示,目前机器人智能水平在 L1、L2 之间。
「行业里最乐观的人都认为,机器人规模化落地应用会在 5 到 10 年间实现。这并不妨碍机器人在未来 2 到 3 年有一些真正的应用场景能够落地。」 他山科技联合创始人兼 CEO 马扬说,「就像智能辅助驾驶,现在没有谁可以做到 L5,但是 L1 至 L3 阶段就有实际应用。」
姚颂认为,第一批机器人落地场景是人们希望被替代的工作,如矿井、电力等高危场景,粉尘、辐射等有害健康的环境,洗手间清洁等令人不适的工作,以及装配、组装等重复繁重劳动。
「脑力」 还须升级
记者采访多位企业高管、行业专家时发现,「大脑」 能力不足、应用场景匮乏、制造精度受限,已成为阻碍人形机器人发展的几大痛点。
「现在多数机器人 『小脑』 的发展已经达到了不错的水平,能够比较自然地跑跳、在移动中保持平衡。但大脑的发展目前还需要进一步提升。所以现在机器人更多是为大家提供娱乐和情绪价值,从 『有用』 的角度,现有产品的投入产出比仍然较低。」 自变量机器人创始人王潜在接受记者采访时表示,「这并不是机器人硬件的问题,而是机器人大模型的智能化水平没有达到。」
宇树科技 CEO 王兴兴也提到,现在人形机器人在软件层面的具身智能大模型并不完善,当前具身智能大模型处于类似 ChatGPT 推出前 1 至 3 年的阶段,业界已经发现了合适的探索方向以及技术路线,但尚没人能将其实现。
和人类一样,机器人 「大脑」 负责 「想明白」 要做什么以及怎么做,往往通过大模型或高级决策实现;「小脑」 负责运动控制与平衡,会 「协调好」 身体各部分精准、稳定地执行动作。
但与语言类大模型相比,人形机器人需要具身智能大模型处理的不是文字代码等符号信息,而是物理世界的复杂信息,技术难度更高。
北京人形机器人创新中心具身智能负责人车正平表示,当下行业看好的 VLA 模型也面临动作预测难、本体差异大、数据难兼容、任务泛化弱的问题。模型直接从图像像素空间映射到机器人操作空间,存在优化困难和预测不准确问题;不同机器人本体外观、形态、动作表现差异大,直接应用难以兼容;模型对新任务指令和新场景环境的扩展性不足,依赖大量特定数据重新学习或者长时间适应。
大脑的能力不足直接影响的就是机器人的泛化能力,也就是机器人 「举一反三」「灵活调整」 的能力。
「虽然机器人能完成一些搬运、抓取的任务,但并不具备更泛化的能力,电池的续航能力也有限,因此企业现在更青睐技术成熟、不需要人工智能的普通机器人或自动化设备,」 百川智能共享工厂总经理赵辉向记者表示,「这些设备只需要根据程序完成固定动作,同样能提升生产效率,目前在各行业生产中都得到了广泛使用。」
边落地边探索
推动机器人商业化进程、加速落地更多场景,还需要行业形成 「数据-模型-场景验证」 的闭环。
王潜表示,过去一两年间行业开始形成共识,人形机器人要想向更高水平发展,就需要一个统一的端到端大模型或通用模型,预计未来 2 到 3 年间,此类模型将实现较大突破。
优必选首席品牌官谭旻提到,目前优必选机器人在工厂的应用场景主要集中在分拣、搬运和质检三类。他预计,通过 5 到 10 年的真实场景积累和千亿元级别的资金投入,人工智能将支持人形机器人走入更核心的岗位。
在大模型方面,北京人形机器人创新中心发布了四项具身智能核心成果——「具身世界模型体系」「跨本体 VLA 模型」「人形机器人全身控制自主导航系统」 和 「千台机器人真实场景数据采集计划」,加速具身智能从技术突破迈向产业实用。
另外,空间感知能力是机器人在物理世界准确行动的基础。群核科技董事长黄晓煌介绍,公司目前用 100 万个图纸信息使机器人空间感知准确度达 80%,但进一步提升需大幅增加数据量,而物理世界真实训练数据稀缺——人类小孩在少数环境中就能学会的事,机器人需成千上万数据才能勉强泛化,强泛化能力则需几十万到上百万的数据量。
银河通用则采用 「物理仿真+合成数据」 的技术路线,通过整合机器人动力学模型、环境资产搭建物理仿真环境,以消费级显卡大规模生产合成数据,用 99% 合成数据加 1% 真实数据训练模型,再通过 「仿真到真实」 的迁移,确保模型在真实世界有效工作,降低模型训练门槛。
编辑:尹杨
声明:新华财经 (中国金融信息网) 为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115