阿里达摩院王刚:数据驱动是解决无人驾驶难题的关键技术路径
2021-11-17
来源:麻省理工科技评论
10 月 28 日至 29 日,由杭州未来科技城(海创园)管委会指导,DeepTech 主办的世界科技青年论坛暨 “35 岁以下科技创新 35 人”(TR35)全球-亚太区线下发布仪式,在杭州未来科技城成功举办。
在 TR35 全球-亚太区线下发布仪式现场,一众顶尖科学家、青年科技人才、科技创业人士对世界科技前沿技术和热点问题进行了探讨、交流。
阿里巴巴集团副总裁、达摩院自动驾驶实验室负责人王刚以《无人驾驶从技术到产品再从产品到技术》为主题,分享了他对无人驾驶的看法。一般来说,人们对技术到产品的流程非常熟悉,但是从产品到技术却不是很了解,此次分享,王刚便为大家详细阐述了其中的逻辑区别。
图 | 阿里巴巴集团副总裁、达摩院自动驾驶实验室负责人王刚
瞄准末端无人驾驶,服务 “最后三公里” 需求
在大家的普遍认知里,无人驾驶或许离我们还很遥远,但事实上,末端无人驾驶市场却大有可为。
王刚指出,阿里达摩院致力于解决 “最后三公里” 的包裹配送需求,瞄准的市场正是末端无人驾驶,并在规模化和产品化方面取得极大进展。目前,达摩院已经在全国 22 个省和 71 个城市开展了常态化物流服务,累计服务接近 200 多个大学校园和社区,配送单量超过一百万单。
当然,相比于快递市场或者对物流市场来讲,这样的数字并不值一提,但就无人驾驶领域而言,这个数字已经实现了一个极大的突破,客观上也佐证了达摩院的产品化能力。目前,该产品已辐射了全国大部分地取,东北到哈尔滨、南到广州、西到成都,产品稳定性值得肯定。
话题回归到无人驾驶,王刚指出,目前我们针对的只是末端 “最后三公里” 的场景,而作为无人驾驶领域的从业者,其实每个人最想解决的是 “所有场景里都能够自动驾驶” 的难题。
王刚表示,“我觉得前面做的一切事情,包括产品化和规模化,都是帮助我们从技术路径上实现目标,所以我们做末端三公里并不只是一个业务决策,更多的是技术决策。”
从数据里找规律,重新定义无人驾驶技术路径
纵观过去几十年人工智能的发展,几乎所有成功的经验都是基于统计学习。而统计学习的本质就是从数据里面找到规律,如果没有数据,再聪明的科学家也很难找到办法让机器变得更聪明。
在王刚看来,数据驱动无疑是解决无人驾驶目前问题的最佳技术路径之一。
基于这样的认识和了解,王刚提出,在当前条件下无人驾驶需要解决两个问题:一是如何获取海量数据;二是如何利用数据。
那么我们该如何获取海量数据呢?
据王刚介绍,其在三年前确定业务和技术方向的时候,就考虑过是否学习谷歌依靠测试车解决 robot taxi 问题。但由于交通场景的复杂性,测试数据和场景都显得过于片面,最终放弃了这个想法。
接下来,王刚想到先通过垂直场景解决业务问题,再利用其产生的价值去推动汽车规模化,从而推动更多车辆的部署,当有更多车辆部署的时候,数据的采集就变成了一件自然而然的事,进而推进技术发展。
“时至今日,经过不断的技术研发和产品化、规模化的实验,我们初步看到了曙光,在未来几年的技术发展里,我们会从传统的路测驱动走向产品驱动,即从产品再到技术。” 王刚表示。
阿里达摩院计划在两到三年内部署一万辆车的规模,覆盖中国所有的大学还有大型的园区、社区,并将今天的累计一百万订单发展成每天配送一百万订单。王刚表示,这一百万订单的背后会积累非常多有意思,对技术带来非常大改变的数据。比如末端场景中经常出现的行人、非机动车等,相比更容易检测、预测的卡车和轿车,这类交通参与者才是无人驾驶里面最头痛的问题。
而在达摩院构建的场景下,一辆车日均可检测 4000 万个障碍物,每天与行人和非机动车进行超过 5000 次的交互。随着更多的车辆被部署后,其产生的数据将是难以想象的。
获取数据之后,最重要的节点就是掌握利用数据的方法。
王刚表示,“数据是一个石油,但是怎么样提炼出来是另外一个同样重要的问题。” 而实现这样的人工智能无外乎三个方向。
第一个方向是学习人脑。不过王刚也表示,人脑是非常复杂的结构,很难做到彻底了解,因此不宜在这个方向投入太多的资源。第二个方向是自动化学习,即通过仿真虚拟化场景提高人工智能能力,而不过度依赖人工的经验和能力。第三个方向是小样本学习能力,同样受人的启发。
达摩院自动驾驶实验室在自动化学习上做了很多努力,且拥有了独属于自身的差异化竞争优势,分别表现在硬件和工程上。王刚说道,“比如我们做了无人驾驶全链路的自动化学习,包括最困难的决策规划、控制以及定位,而不仅仅是常见的感知和图象识别,这就是我们工程上的差异化。”
将智能仿真和强化学习相结合
那么如何将智能仿真和强化学习结合在一起呢?
王刚表示,谷歌作为世界上最好的 AI 公司之一,其实已经做了类似的探索,那就是阿尔法围棋(AlphaGo)。作为第一个战胜围棋世界冠军的人工智能机器人,AlphaGo 由谷歌旗下 DeepMind 公司戴密斯·哈萨比斯(Demis Hassabis)领衔的团队开发,其主要工作原理正是 “深度学习”。
但之所以这样的方法没有大规模应用在机器人和无人驾驶领域,在于其中仍有迫切需要解决的问题。
首先是如何仿真场景,因为在围棋领域,仿真是非常容易的,把棋盘画出来就可以了,而无人驾驶却需要构造交通场景,这就需要工程上的投入。
其次,从算法上来讲 AlphaGo 是离散空间,而无人驾驶场景却是连续空间,所以达摩院也研发出了基于连续空间的蒙特卡洛树搜索算法,从而让该方法在连续空间里同样得以实现。
在王刚看来,积累数据和用好数据都是为了去更好地解决自动驾驶问题。他表示,“目前我们已经基本解决了末端的低速问题,不仅能满足业务需求,还极大地降低了成本。在未来,我和团队将围绕更泛化的场景做进一步的研发,并基于当前的经验以及数据去攻克更大的挑战。”