当自动驾驶机器人行驶在城市的人行道场景,算法会有效还是失灵呢?
这是一种比行驶在道路上更复杂、更具有不可预测情况的现实场景:一方面,机器人面对使用电动轮椅的老人、遛狗的人、婴儿推车、突然冲出马路的孩子等复杂的情况;另一方面,人行道还可能出现坑洼、斜坡等路况。
最近,DeepTech 关注到美国加州大学洛杉矶分校(UCLA,University of California,Los Angeles)副教授周博磊加入美国机器人初创公司 Coco Robotics,并在该公司新成立的 Physical AI Lab 担任首席 AI 科学家。我们通过与周博磊的交流,试图从产学研方面揭开人行道自动驾驶的“神秘面纱”。
(周博磊)
从模拟到现实:让自动驾驶走在人行道
周博磊先后在上海交通大学和香港中文大学获得学士和硕士学位,然后在美国麻省理工学院获得博士学位。此前,他曾在香港中文大学担任助理教授,并凭借“使人工智能模型更易于人类理解和信赖”,成为 2020 年《麻省理工科技评论》“35 岁以下科技创新者”亚太区入选者之一。目前,周博磊实验室的研究方向是计算机视觉和机器学习,致力于城市机器人交互,并于近期将研究方向聚焦于人行道自动驾驶方向。
他早期研究的类别激活映射(CAM,Class Activation Mapping)技术 [1] 和网络剖析(Network Dissection)[2] 等一系列工作,可应用于自动驾驶、医学影像诊断和医疗保健等领域,为目前的研究理念打下了坚实的基础。无论是设计模型、部署模型,还是训练模型,模型的可解释性都是一个非常重要的因素。在机器人应用中,当机器人在现实生活中做出错误决策后,如何分析它的行为是值得深入研究的课题之一。
在如今的大模型研究中,可解释性已自成体系,即训练好大模型后,能否理解其学到的知识,以及为什么会输出这样的结果。周博磊对 DeepTech 表示:“我们希望在获得 AI 模型后,能够提升它的可解释性。因为可解释性不仅在于理解模型,还在于提升它与人类交互的能力。只有理解模型的运作,才能实现人与 AI 共同操作,从而达到更透明的相互理解与协作。”
在该实验室最近的工作中,研究人员利用 Coco Robotics 赠予实验室的送货机器人小车做了相关研究工作。例如,发表在 CVPR 2025 的论文《Vid2Sim:基于视频的逼真交互式城市导航模拟》(Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation)[3]。通过拍摄一段视频,可将其重建成一个交互式环境,然后在该环境中训练 Coco 小车,进而能够直接在现实生活中部署。结果显示,Vid2Sim 显著提高了数字孪生和现实世界中的城市导航性能,成功率分别提高了 31.2% 和 68.3%。
(https://arxiv.org/abs/2501.06693)
在另一项发表于 CVPR 2025 的论文《通过可扩展的城市模拟实现自主微移动》(Towards Autonomous Micromobility through Scalable Urban Simulation)中 [4],也研究了人行道机器人。研究人员利用 AI 代理协助人类操控小型出行设备(micromobility),为提升安全性和效率提供了一种可行的解决方案。他们构建了一种高性能机器人学习平台 URBAN-SIM,用于在交互式城市场景中大规模训练具身代理。此外,他们还针对四种机器人设计了涵盖 8 个场景的三项任务,包括轮式机器人(Coco Robotics 的送货机器人)、四足机器人(Unitree Go2)、轮腿机器人(Unitree B2-W)和人形机器人(Unitree G1)。
(https://arxiv.org/abs/2505.00690)
介于家庭机器人和车道自动驾驶之间的应用场景
Coco Robotics 以实现配送机器人“最后一公里”为目标,其成立于 2020 年,联合创始人兼 CEO 扎克·拉什(Zach Rash)和联合创始人兼 CTO 布拉德·斯奎恰里尼(Brad Squicciarini)都是 UCLA 的校友。该公司在种子轮融资时获得了 OpenAI 的 CEO 山姆·奥特曼的支持,并与 OpenAI 一直保持数据方面的合作。在如今的大模型和 AI 浪潮中,Coco Robotics 的优势之一在于,其基于自身机器人小车送餐业务能够像特斯拉那样每天积累大量新的视频数据,而不是像其他大模型公司那样下载通用的互联网数据。
从美国市场来看,目前聚焦人行道自动驾驶机器人的主要公司“各有千秋”,除了 Coco Robotics 还包括 Starship Technologies 和 Serve Robotics。Starship Technologies 成立于 2014 年,专注于校园内餐厅的机器人配送业务,并在美国、英国、芬兰等国家的相关城市开展业务。Serve Robotics 公司自 2021 年从 Uber 分拆而来,已于 2024 年在纳斯达克上市。
周博磊与 Coco Robotics 的合作一方面源于双方技术发展方向的契合,另一方面也基于他们此前的合作。
尽管周博磊实验室之前做过自动驾驶的相关研究,但缺少自动驾驶真车,也没有场地做真车实验,更没有数据和计算资源和大型自动驾驶公司竞争。因此,他们切换了研究场景,转而研究人行道上的机器人——既能研究机器人学习课题,又可以在真实世界中做实验。与此同时,Coco Robotics 正处于 AI 转型阶段,随着其基于远程遥控配送车的业务发展成熟,公司计划向用 AI 模型补充和降低人工操作的方向转型。
需要了解的是,机器人研究中常见的划分方向是机械臂或家庭环境下的机器人方向,以及自动驾驶方向。现阶段,特定场景下的道路自动驾驶技术已基本接近实现,人们可使用 Waymo 和萝卜快跑等自动驾驶服务平台在国内外的相关城市打车出行。而人行道自动驾驶是介于家庭机器人和车道自动驾驶之间的过渡场景。该场景下的机器人需要完成的不仅是简单的视觉识别任务,还需要充分整合感知、理解、判断、决策和行动,这也是决定着 AI 是否能走进现实世界的关键因素。更重要的是,其还需要机器人和人类进行更有效的安全交互。周博磊进一步说道:“如果能解决好人行道上的机器人技术问题,它也可以应用到送货之外的其他方向,比如为人形机器人提供城市导航模块,为电动轮椅提供自动驾驶能力等。”
为更好地解决上述问题,新成立的 Physical AI Lab 将围绕三个方向开展研究:一是从数据层面,基于 Coco Robotics 累积的真实数据训练出适用于城市人行道的、配送机器人的基础模型或者移动性基础模型。“这相当于特斯拉基础款的 Autopilot 功能,它可以在高速等相对简单的情况下实现自动驾驶,然后把这个模型整合到现有的操作流程中。”周博磊说。二是通过仿真重建出与真实情况高度契合的虚拟环境对模型进行训练,以进一步提升机器人的决策和因果推断能力。三是让模型能从人类的操作中持续学习,将 AI 模型与人类操控者更好地协作整合
需要了解的是,这并不意味着在短时间内完全实现自动化,而是通过人机协作共同完成人行道导航任务:在较简单的人行道情况下,由 AI 操作系统;而在过马路等较复杂的情况下,则由人接手操作。他表示:“现阶段的遥控操作是一个操作者对应操作一辆送货车。我们希望在两三年内可以发展到一个操作者结合 AI 模型能同时操作 3 到 4 辆送货车,这将大大节省人力成本。”
产学研结合的双赢路径
从周博磊这次与 Coco Robotics 的携手,我们可以看到产学研紧密结合的一种双赢合作路径:公司可提供资金、通过业务积累的海量数据和实验平台,但面临招聘全职 AI 研究员工成本高和 AI 技术迭代慢的问题;而实验室由于没有真实数据,很难开展相关研究。通过合作,实验室的学生们可利用公司提供的真实世界数据和硬件平台开展研究、发表论文。尤为重要的是,相关研究成果开源发布后,能够进一步促进和回馈整个社区的技术发展。
周博磊指出,城市人行道自动驾驶领域目前尚处于技术早期阶段。在接下来的几年中,随着技术的发展、数据的积累和研究的深入,非常有可能有一条稳定的技术路线“突出重围”。
参考资料:
1.https://arxiv.org/abs/1512.04150
2.https://arxiv.org/abs/1704.05796
3.https://arxiv.org/abs/2501.06693
4.https://arxiv.org/abs/2505.00690
5.https://techcrunch.com/2025/06/11/sam-altman-backed-coco-robotics-raises-80m/
6.https://www.cocodelivery.com/
相关文章
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读
2025-10-200阅读