智元机器人彭志辉具身智能进入部署态元年

智元机器人彭志辉:具身智能进入"部署态"元年

近日,人形机器人与具身智能标准化(HEIS)年会在北京举行。工业和信息化部人形机器人与具身智能标准化技术委员会副主任委员、智元机器人联合创始人、总裁兼CTO彭志辉(稚晖君)出席并发表演讲,分享了智元从"实验室炫技"到"部署态落地"的工程化实践与思考。

"整个具身智能行业目前还在共同探索,没有任何一家企业能独自给出正确答案。"彭志辉在演讲开场时指出,"我们需要协力攻破瓶颈,在正确的时间做正确的事。"

行业进入工程化竞争下半场

谈及产业现状,彭志辉援引工信部数据表示,国内人形机器人整机企业已超140家,发布产品达330款,行业已从实验室炫技、Demo展示,进入工程化、场景化竞争的下半场。2024年到2025年初,行业焦点还在比拼机器人走路是否自然,如今已能完成"飞檐走壁"般的高难度动作。

"本体灵活性已达到实用化阶段,接下来要比的,是谁的干活能力更强。不仅在国内比,更要与海外头部企业比,看谁能在'部署态'真正落地。"彭志辉直言。

一体三智的工程范式

彭志辉表示,面对物理世界的复杂约束,智元总结出一套可落地的工程范式——"一体三智"。关于"一体",即机器人本体。"在数字世界,代码跑错了可以重启;但在物理世界,有物理成本、失效成本。因此本体设计绝非简单的硬件堆叠,而是可靠性工程、供应链工程和安全工程的综合体。"

针对核心零部件,彭志辉介绍称,关节和灵巧手决定了机器人的运动和操作能力上限,也占据了整机成本的绝大部分。目前智元机器人将所有产品线,包括五大系列、近10款产品全部规整到8款系列化关节设计上。"这8款关节用在我们所有产品上,能够满足所有部位的关节需求。这就是系列化、标准化带来的收益。"

灵巧手也是一个复杂度非常高的核心零件,它的难点一方面是需要把10至20个自由度的运动部件结构,塞进比人手手掌还小的空间;另一方面是对灵巧手的高维感知能力要求非常高,最典型的就是触觉。

智元机器人彭志辉 具身智能进入部署态元年 新闻

推动行业从"开发态"走向"创作态"

"如果说硬件本体是机器人的躯体,AI就是它的灵魂。"在智能层面,彭志辉将其划分为运动、交互和作业三个维度。为降低应用门槛,智元推出了"灵创平台"。"我们把动作训练流程简化到像发抖音一样,用户只需上传一段视频,平台就能自动完成关键点检测、训练和部署。"

此外,智元正致力于构建开放共享的生态。他透露,智元不仅开源了被称为"具身智能安卓"的操作系统灵渠OS,还发布了业界最大的真机数据集。"生态的力量远远大于单点突破,我们希望形成'能力复用、数据回流、模型进化'的正向循环。"

沿途下蛋的落地策略

在场景落地策略上,彭志辉提出了"沿途下蛋"的策略。他将任务维度划分为"场景复杂度"和"任务复杂度",认为当前人形机器人的最佳切入点是"在简单场景做复杂任务"。"比如在结构化的工厂环境里,执行高自由度、高维感知的复杂操作。"

他分析道,虽然自动驾驶是在复杂环境下做简单任务,但人形机器人与自动驾驶的终局是一致的,即在复杂环境下完成复杂任务,"目前我们已在文娱商演、工业制造、物流分拣、安防巡检等八大典型场景展开应用,只有真实场景才是验证可靠性、迭代系统的最有效途径"。

对于为何坚持"人形"路线的底层逻辑,彭志辉给出了一个形象的比喻:"ComputerUse(电脑使用)是数字世界的人形接口,而人形机器人就是物理世界的通用接口。"他解释说,正如现有的软件系统是为鼠标键盘设计的一样,整个物理世界——从门把手高度到工具形态——都是为人类身体设计的。"既然环境是围绕人类构建的,那么AI要实现最大化的通用性和兼容性,其终端形态大概率也要长得像人。它未必是效率最高的,但一定是兼容性最强的。"

他预判,未来人形机器人走进家庭时,产业规模将是"手机数量乘以汽车价格"的级别。