机器人正学习使用自己的语言交流
2017-03-24
在硅谷,聊天机器人是当下热点之一。像许多人工智能研究者一样,Igor Mordatch正致力于构造一种能够彼此交流的机器。但是Mordatch并不是语言学家。他不直接处理人工智能中关于语言的问题。在他成为人工智能研究者之前,他是一名动画师。他曾在皮克斯工作,参与制作了《玩具总动员3》。工作之余,他在斯坦福和华盛顿大学负责教会机器人像人类一样运动。“我以前就对教会机器人运动感兴趣,”他说。如今,所有的知识技能正以不寻常的方式到来。
Igor Mordatch出生于乌克兰长在多伦多,现年31岁的他如今是OpenAI的访问学者。OpenAI是由特斯拉公司的Elon Musk和YC的Sam Altman一同创建的人工智能实验室。在这里,Mordatch正在探索着一条全新的道路,他想要让机器不仅能和人对话,还能彼此交流。他建立了一个虚拟世界,在这里机器人必须学会创建自己的语言。
OpenAI发布的一份研究报告显示,Mordatch和他的同事创建了一个虚拟世界。在这里机器人负责完成某些特定的任务,比如移动到某个特定的位置。这个世界很简单,就是个巨大的白色正方形。在这二维世界里机器人也只是简单的红绿蓝的圆。但事实比看起来要复杂,机器人需要借助自己创造的语言相互指挥,配合着完成任务。
这一切都是建立在强化学习的技术上。这种技术也被谷歌用来构造AlphaGo——谷歌DeepMind人工智能实验室借此在围棋领域独孤求败。简单来说,机器人通过不断试错来为彼此指引方向,不断跟踪着指令的最终效果。如果某个指令成功帮助它们达成目标,那它们就会知道指令有效并继续沿用。通过这样的方式,机器人学会建立自己的语言,告诉彼此如何更快地抵达目标。
正如Mordatch所说,“我们判断机器人的会话是否有效就看它们有没有到达某个特定的目标。”
为了让机器人能够建立自己的语言,它们被分配了随机而抽象的字符串,以便它们在虚拟世界中给彼此指引方向时能够简化要学习的概念。它们给彼此分配虚拟世界中的目标,然后执行诸如“到达某个目标”和“观察某个目标”的指令。Mordatch和他的同事希望,随着机器人语言的复杂化,相应技术能紧跟其后将其翻译成英语等人类能理解的语言。这个过程会很漫长——至少要有一个能实际应用的翻译软件——但另一名OpenAI的研究员已经开始着手研究这类翻译型机器人。
最后,Mordatch表示,他的方法能教会机器人更深入地理解语言,告诉它们语言存在的意义——这也为后期进行真正的会话搭建了跳板,有朝一日实现科学家梦寐以求的人机对话。
Mordatch的方法不同于其他人工智能语言研究方法。如今,顶尖研究者们大多在模仿人类语言而不是创造新的语言。例如他们的工作集中于深度神经网络。近些年来,深度神经网络——一种通过在海量数据中寻找统计模式来学习任务的复杂数学系统——已经被证实在照片识别、手机语音控制等方面的高效性。如今,谷歌、Facebook和微软的研究员正在将类似的方法应用于语言理解上,试图识别英语会话的模式,但目前收效甚微。
Mordatch和他的同事,包括OpenAI的研究员和加州大学伯克利分校的Pieter Abbeel教授,他们对寻常方法心有疑虑,所以开辟了一条不一样的道路。他们的论文中这样写道:“要让机器和人类智能地交互,依靠统计模式是非常低效的。机器在它所处的环境下学会应用语言(以及其他不依赖声音的物理语言)解决问题时,才能很好的理解人类语言”。
对早期人类来说,语言的产生是一种必然。人们学会交流是因为语言帮助他们处理问题,使他们超脱于动物。这些OpenAI的研究员们想要让机器人遵循此道。在机器人的虚拟世界中,机器不止学习自己的语言,他们也学习简单的手势和行动来交流——例如,指明特定的方向,或者指引他们从一个地方到达另一个地方——就像小婴儿所做的那样。这也是语言的一种形式。
也有很多研究者认为,借助深度神经网络通过统计模式识别来研究语言也是有效的。Saleforce公司的人工智能研究员Richard Socher,也是OpenAI团队的一员,他说:“Mordatch的方法本质上也是在使用统计模式,但他是在一个更简单的人工环境下。在这样有趣的新领域有所进展是非常好的,但并没有论文里说的那么夸张。”
虽然如此,Mordatch的项目表明分析海量数据并不是唯一出路。机器系统也可以从自己的行为中学习并强化。OpenAI的其他研究员们搞了一个更大的虚拟世界,他们称之为“宇宙”。在这里机器人学习使用常用软件,比如网页浏览器,这也是通过一种强化学习的方式。对于OpenAI的创办者Ilya Sutskever来说,这样安排团队最终是用来帮助研究语言理解。一个人工智能只有在理解人类自然语言时才能上网。与此同时,微软也在通过强化学习的其他形式来研究语言,斯坦福大学的研究者也不例外,他们也正探索自己的方法研究机器人之间的协作。
最后,成功很可能来自于所有技术的综合,而不是某一种技术。Mordatch提出的新思路——机器人不止学习如何交流,还学会用自己的语言交流,正像我们人类所展示的那样,这是个很有力的创想。