AI3.0:无人驾驶走入现实的关隘与密钥
2021-04-21
来源:智车科技
吴甘沙
驭势科技联合创始人、董事长兼CEO
4月17日下午,湛庐特别邀请圣塔菲研究所客座教授、《AI 3.0》一书作者梅拉妮·米歇尔,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃,驭势科技联合创始人、董事长兼CEO吴甘沙,清华大学计算机系副教授、智源青年科学家刘知远等国内外知名科学家和创业者,以及特别嘉宾达闼云端机器人小姜,一起探讨AI 3.0时代的新商机和新生态。
这次全智能场景发布会第一次采用了演播室和户外智能场景双现场形式,在无人驾驶汽车和云端智能机器人的烘托下,全面展示了中国人工智能领域的创新实力和前沿进展。几位科学家、企业家跨界深度交流,共同探讨了人工智能发展现状,以及透视当下AI发展的关键问题,并对产业布局和政策提出了可供参考的建议,助力未来的想象与开创。
以下为驭势科技联合创始人、董事长兼CEO吴甘沙的演讲精华内容
1、无人驾驶是人工智能顶上的皇冠
在科学技术飞速发展的今天,人工智能被广泛应用在多个尖端领域,比如无人驾驶、生命科学探索及医药制造等。除了商业应用,人工智能还创造了打败排名世界第一的人类棋手柯洁的辉煌战绩。在所有这些任务中,自动驾驶被誉为人工智能顶上的皇冠,这是为什么呢?在吴甘沙老师看来,无人驾驶获得这一赞誉的关键在于mission critical AI。
那么什么是mission critical AI呢?通俗来讲,就是关键任务人工智能。它与我们通常所说的人工智能的差别主要在于准确率。在传统的人脸识别技术中,我们说其准确率为92%或95%,事实上,两者之间并没有多大区别。而在自动驾驶这样的关键任务中,我们需要确保其准确率达到100%,或者说无限接近100%。这就好比我们给出了100万张不同的试卷,由人工智能来答,它只能有一张试卷上出错,其他都必须得满分。
就目前投入应用的无人驾驶技术而言,它所搭载的人工智能实现的是一个非常简单的闭环,这个闭环主要包括五个部分。第一个部分是感知,而这个感知是通过传感器来实现的。这些传感器能帮助车辆“眼观六路、耳听八方”。第二个部分是认知,用于帮助车辆判断周围物体的运动,识别道路标志等。第三个部分是车辆导航和定位,导航是知道车辆往哪里去,定位是明确车辆在哪里。而目前无人驾驶采用的定位技术误差只有几厘米。第四个部分是决策和规划,主要是车辆的中央处理器根据车辆周围的情况确定下一步的动作。第五个部分是控制,就是将中央处理器的指令转变为控制车辆底盘的动作。
2、今天的无人驾驶建立在笨鸟式的人工智能之上
无人驾驶的前景非常吸引人,但就当前的发展情况而言,实现的难度非常大。目前的人工智能,吴甘沙老师称其为笨鸟式人工智能,因为它是通过大量的数据,通过蛮力式的计算,通过历史的记忆,比如高精地图,整合形成的。车辆需要将沿路的道路记忆输入进去,其中还会遇到数据不全或算力不足等问题,这种情况下,人们就必须做出取舍,通过设计大量冗余去弥补单个部件的不可靠性。
就现在汽车安装的传感器来说,有基于激光的,有基于摄像头的,有基于毫米波雷达的,有基于超声波的。这些传感器每一种都有其优缺点,在应用过程中,我们需要对其进行组合。而这种组合跟我们追求的终极的人工智能是有很大差别的。
所谓的笨鸟式人工智能,意味着要在现有基础上实现非常可靠的无人驾驶,需要积累几十亿公里的数据。目前,谷歌的无人驾驶汽车积累的数据也不过几千万公里。而几十亿公里,相当于一个人类司机几百万年的驾龄。
很多人通常认为无人驾驶人工智能已经得到了大规模应用,而实际情况是我们的科学家和制造者还在研究开发的过程中,目前的人工智能和我们理想中的职能还有很大的差距。我们都倾向于称目前阶段的、仍有许多局限的人工智能为专用人工智能或领域人工智能,即AI2.0,与其相对的则是通用人工智能,即AI3.0。AI3.0是人工智能未来发展的必然趋势,而这也是梅拉妮·米歇尔在《AI3.0》这本书中重点介绍的。
今天的无人驾驶在识别一辆车时,是靠着大量的劳动力对后台数据一一进行标注实现的,可以说,没有人工就没有智能。《AI3.0》中描述了一个场景,是一个推着婴儿车的孕妇牵着一条狗出现在路边。当人类看到这个场景时,我们可能产生无数种解读,比如通过孕妇的表情去判断,她脸上的表情是惊诧还是平静;比如观察孕妇周围有没有人,这个人有没有可能对她们采取下一步动作。人类,即使是小孩都可以轻松对这一场景进行准确、迅速的判断,但对人工智能来说就很难。
解读这一场景实际上需要大量的认知技能,比如解读人与人之间的眼神交流或是博弈关系。在目前的人工智能中,我们是需要对机器捕捉到的图片进行标注,来告诉人工智能图片中包含哪些信息的。想要让机器看到这样的场景就自动产生正确的解读,实际是需要下一代更通用的人工智能去解决的问题。
在无人驾驶人工智能发展的当下,我国的发展速度与国外尤其是美国相比是不算太晚的。而在算法能力方面,两者间也不存在代际的差别,相反,我们还具备一些国外没有的优势。目前应用的人工智能2.0,是由应用驱动、需求驱动和场景驱动的。在这些方面,我国具有得天独厚的优势。
梅拉妮在《AI3.0》中讲到,无人驾驶人工智能的发展过程可以分为0~5级,共计6个阶段。就技术发展而言,国内的无人驾驶处在4级,严格来讲,4级的标准是完全脱离司机的操控,但因为相关法律法规的限定,我们现在都需要在车上配备安全员。特斯拉的auto pilot(自动驾驶)功能则属于2级,其本质上是一种辅助驾驶,主要功能是帮助司机减负,实际的责任人还是司机本身。而3级则意味着责任人由司机转变为驾驶系统,这个系统可以在它完整的能力覆盖范围内自动驾驶,在必要时寻求司机的干预。再继续往上看,就到了5级,当前的科学家普遍认为5级是一个可望而不可及的目标,需要借助AI3.0,即通用的人工智能才能实现,它可以实现的场景是“随叫随到”。
3、实现真正的无人驾驶,我们要从AI2.0跨入AI3.0
在无人驾驶领域,除了数据积累以外,人们遇到的难题还有很多,其中一些是可解的,比如它的发展受限于木桶效应;另一些则是很难解的,比如“9010原则”。梅拉妮在《AI3.0》中解释说,“9010原则”是指无人驾驶实际上已经走完了90%的道路,但是剩下10%的道路还需要我们花费90%的时间和努力。
想要破解无人驾驶人工智能未来发展的种种难题,关键在于我们对人的认知及在相关科学理论方面能否取得突破。那为什么是对人的认知的突破呢?因为从本质上讲,我们对人脑的工作机制还不甚了解。或许,我们在脑科学、认知科学方面取得的进展,才是促进通用人工智能发展的密钥。
在《AI3.0》中,梅拉妮将现在人们关心的人工智能领域的各个热门领域进行了清晰的梳理,比如无人驾驶、机器学习、视觉识别等,它明确地指出了人工智能目前的发展阶段,还畅想了未来人工智能领域即将发生的巨变。对于想要了解人工智能行业的大众读者和相关领域的创业者和管理者而言,《AI3.0》超越了一般图书,能为他们提供极具权威性、专业性、前沿性和启发性的知识与见解。
第三波人工智能的爆发即将来临,未来世界的潮水会涌向哪里?《AI3.0》,立足前沿,深度思考,超脱技术,是每一个渴望摸准时代的脉搏、站立潮头的现代人都不能错过的新锐之作。