对话希迪智驾CEO胡斯博:“重载具身智能”的本质是系统工程能力

对话希迪智驾CEO胡斯博:“重载具身智能”的本质是系统工程能力
文 | 智能相对论作者 | 叶远风凌晨三点新疆准东某露天煤矿。零下28度的寒风卷着煤渣刮在脸上像刀子一样。放在十年前这个时间点正是三班倒的矿工们最疲惫、也最容易出事故的时候。但今天整个矿区看不到太多人影。几十台无人矿卡正在作业它们沿着预设的路线平稳行驶精准停靠在无人挖掘机的下方巨大的铲斗落下矿石精准倒入车厢。调度室里年轻的操作员盯着屏幕偶尔动一下鼠标。他面前的大屏上整个矿山的所有设备、车辆、人员都以数字的形式实时跳动着。这不是什么科幻电影里的场景而是希迪智驾交付的真实场景也是中国乃至全球矿山智能化变革的一个缩影。当整个具身智能行业还在为“机器人什么时候能端茶倒水”争论不休时希迪智驾已经在矿区跑通了“重载具身智能”的商业闭环。具身智能正在用系统工程思维走出“Demo陷阱”跳舞、翻跟头、拿起杯子喝水喧嚣过后的具身智能少有产品能真正走进工厂、走进家庭创造可量化的商业价值。问题出在哪里“很多公司陷入了一个误区他们追求单一机器人的全能化希望做出一个能解决所有问题的万能机器人。”希迪智驾CEO胡斯博指出“但在现阶段这既不技术可行也不经济合理。一个几十万甚至上百万的人形机器人去做几块钱一小时的简单重复劳动ROI永远算不过来。”希迪智驾CEO 胡斯博博士于是整个行业陷入了一个死循环为了融资必须做酷炫的Demo为了做Demo不得不投入大量资源优化单点技术但单点技术再强也无法解决真实场景中的复杂问题无法落地就拿不到真实场景的数据没有数据模型就无法持续迭代。破局之道在哪里一种“先落地、再迭代、用系统换时间”的系统工程思路逐步得到行业认同。在能力还不充分时“先到场景里算得过ROI跑起来再说”。而如果企业本来就在场景里系统工程的执行更容易做到极致。希迪智驾是典型代表。很多人对希迪智驾的印象还停留在“全球无人矿卡第一股”但其实今天的希迪早已进化为“重载具身智能”公司。这个“重载具身智能”是具身智能在工业重型装备场景中的纵深落地“重载”指明了它大吨位、高荷载、适配极端工况的装备形态高危环境意味着它是工、矿、交、建体系中人机替代需求最迫切、价值释放空间最大的领域。“智能驾驶解决的是运输问题让车从A点安全到达B点。”胡斯博解释道“但重载具身智能要解决的是作业问题让机器在真实工况中自主完成完整的生产任务。”以矿山为例采矿不是单一的运输行为而是钻孔、爆破、挖掘、运输等一系列工序的协同闭环。希迪智驾的目标不只是让矿卡自动开而是让整个采矿流程实现无人化协同。”这不是一句空话。目前希迪智驾无人挖机、自动充电机器人已落地运行凿岩机器人、爆破机器人正在制造推进中它们与矿山各种有人设备实现协同最终所有工作各归其位——在需要精确判断的环节保留人的干预能力在高重复、高风险的作业环节实现机器的完全自主。实际上对场景需求方而言它要的不是一台性能强大的机器人而是一套能解决实际问题的完整解决方案谁的模型精度更高、谁的机械臂更灵活这些固然重要但没有决定性价值。“客户买的不是无人矿卡而是每吨矿石的运输成本降低多少。”胡斯博说“为了实现这个目标你不仅要做好矿卡的自动驾驶做好智能调度和挖掘机、破碎机等其他设备协同还要融入客户的生产管理系统。任何一个环节掉链子整个方案就没有价值。”也只有这样当下的ROI才“算得过去”。“技术只有创造商业价值才有存在的意义。不能赚钱的技术都是耍流氓。”胡斯博说。率先做成的为什么会是希迪智驾希迪智驾之所以能够用系统工程思维把具身智能推向深度的场景落地有四个不可复制的能力支柱。首先真实场景下积累的数据资产。“很多人说可以用合成数据解决问题在重载场景合成数据永远无法替代真实数据。”胡斯博说“矿山的地形、地质、气候千差万别每一个矿区都有自己独特的工况。这些数据你不进去跑永远拿不到。”希迪智驾在过去九年里积累了海量重载车辆真实运营数据。以无人矿卡为例希迪的系统不仅记录了车辆的速度、加速度、转向角等行驶动力学数据还记录了道路坡度、路面平整度、粉尘浓度等环境感知数据以及装载量、卸载周期、排队等待时长等作业过程数据。“真实场景所形成的数据能力是我们的护城河之一。”胡斯博强调“专用场景的数据具有极强的壁垒。而且这些数据会形成正向飞轮数据越多模型越好模型越好客户越愿意用客户用得越多产生的数据就越多。”然后是多智能体集群协同能力。系统工程最直观的能力需求是协同这包括机器与机器协同也包括人与机器的协同。如果说单点机器人的难度是1那么多智能体集群协同的难度就是100。在矿山场景中几十台上百台不同类型的设备要在同一时空域内协同作业既要保证安全又要保证效率这是一个极其复杂的系统工程问题。“矿山里的车和车之间不能撞不能堵挖机和矿卡之间要精准配合这些多智能体协同问题我们从做无人矿卡的第一天起就在解决。”胡斯博说。希迪智驾打造了一个三层架构的具身智能技术底座底层是数据引擎基于各场景的生产、运营与车辆数据构建标准化数据底座中层是重载世界模型采用端云协同架构终端行动模型毫秒级实时决策云端训练模型持续迭代进化顶层是集群决策与调度系统。以全局最优为目标指挥多品类机器人在同一时空域内协同作业。这套系统已经在实践中得到验证。在新疆的一个大型露天矿希迪实现了56台无人驾驶矿卡与约500台有人驾驶车辆的协同运行打造了全球最大规模的混合编组作业案例。截至当前希迪智驾部署的无人矿卡已达1700台。第三面向作业的重载世界模型。希迪智驾的世界模型和乘用车公司、人形机器人公司的世界模型有着不同的设计逻辑。“主流的世界模型本质上是对物理世界的被动响应。”胡斯博解释道“但在工程作业场景中智能体的行为会持续改变物理世界本身。挖掘作业重塑地形地貌物料堆叠改变通行路径反复碾压影响路面力学特性。我们的世界模型必须将环境演化内化为系统状态的一部分。”希迪的重载世界模型是一个深度融合了生产作业场景专属数据的物理认知与预测框架。它不仅能感知当前有什么更能预判多方主体如何相互影响还能推断自身及协同智能体行为对环境的累积效应并基于演化后的环境状态重新规划未来行为。举个简单的例子当挖掘机挖走一斗矿石后作业面的地形会发生变化。希迪的世界模型会实时更新地形数据并据此调整挖掘机下一斗的挖掘轨迹同时通知矿卡调整停靠位置。这种环境演化推理的闭环能力是重载场景独有的技术门槛。第四渐进式的人机协同落地路径。“我们从来不追求一步到位的无人化。”胡斯博说“技术的成熟需要一个过程客户的接受也需要一个过程。我们的做法是机器能做的让机器做机器做不了的让人来做。随着技术的进步逐步减少人的介入。”这种渐进式的落地路径在希迪的无人挖机上得到了充分体现。首先实现的是远程操控工人在调度室里操控挖掘机作业不用再到现场。然后系统会记录工人的每一个操作通过模仿学习训练模型。当模型的成功率达到一定阈值后就切换为半自主模式机器负责大部分操作人只负责异常处理。最后当模型足够成熟后再实现全自主作业。“这是一个双赢的模式。”胡斯博说“对客户来说不需要等待技术完全成熟就能享受到智能化带来的价值对我们来说可以在真实场景中积累数据快速迭代模型。”硅碳共生不仅仅是理想主义希迪智驾的重载具身智能不仅创造了巨大的商业价值也回应了一个沉重的社会命题。矿业是高危行业。在中国尽管安全标准逐年提升矿难仍时有发生。而希迪的技术正在从根本上改变这一现状。“我们的愿景是未来所有高危作业面都看不到人。”胡斯博说“机器负责执行人类负责定义。这就是我们所说的硅碳共生的产业生态。”这种“硅碳共生”的模式也回应了矿山行业面临的招工难问题。现在的年轻人没有人愿意去矿山做又苦又累又危险的工作。很多矿山已经出现了用工荒司机平均年龄超过50岁。希迪的技术不是把工人赶下岗而是把他们从体力劳动者转变为技术管理者保护生命安全、给予劳动者体面与尊重。正是因为这种商业价值和社会价值的双重驱动希迪智驾的出海之路也在加速推进。目前希迪的产品已进入澳洲、南美、非洲、中东等全球主要矿业市场。和国内市场相比海外市场的需求更加迫切。“海外的人力成本远高于国内而且招工更难。”胡斯博以澳洲举例“当地矿工是飞进飞出工作制干两周休两周公司还要包机票住宿。在这种成本结构下无人矿卡的投资回报周期非常清晰。对海外客户来说这不是要不要上的问题而是什么时候上的问题。今年希迪智驾与英国MMD集团达成战略合作联合研发面向全球市场的矿山智能化解决方案。这标志着公司的技术能力已经得到国际矿业巨头的认可。结语物理世界的隐形冠军在AI概念满天飞的今天讲通用人工智能故事的公司似乎更吸引目光。而希迪智驾选择了一条不那么性感的路径。这条路注定更慢也更扎实。1700台无人矿卡的部署、连续翻倍的营收增长、从矿卡到爆破机器人的技术延伸这些不会出现在Demo视频里却构成了一个真实的商业闭环。具身智能最终要回答的问题不在于谁的Demo更酷而是谁能让机器真正替人干活。在这个维度上希迪智驾至少已经证明了一件事——物理世界的AI是可以做成生意的。至于这门生意能做多大时间会给出答案。*本文图片均来源于网络此内容为【智能相对论】原创仅代表个人观点未经授权任何人不得以任何方式使用包括转载、摘编、复制或建立镜像。部分图片来自网络且未核实版权归属不作为商业用途如有侵犯请作者与我们联系。•AI产业新媒体;•澎湃新闻科技榜单月度top5;•文章长期“霸占”钛媒体热门文章排行榜TOP10;•著有《人工智能 十万个为什么》•【重点关注领域】智能家电含白电、黑电、智能手机、无人机等AIoT设备、智能驾驶、AI、、、AI、AI、AR/VR、、开发者以及背后的芯片、算法等。