人工智能是如何在 Google 崛起的
2016-07-05
前不久,Google的CEO桑达尔·皮查伊在接受Forbes专访时,非常明确地指出了:Google将在一切服务和设备中,或早或晚地采用人工智能技术。
Back Channel的一篇来自Steven Levy的文章描述了Google从培训、雇佣、管理、技术等各个方面的措施和转变,并且介绍了机器学习在Google崛起的历史、克服的阻力、以及势不可挡的未来。
Google正在打造机器学习的“忍者团队”
Carson Colgate,一名Google机器学习队伍的新成员。她正在训练自己成为一名“忍者”。
她今年26岁,之前已经在跆拳道里拿过一个二级的黑带。这次,她要做的是在算法上成为一名“忍者”。她在Google的Android部门担任工程师,现在则被收录到Google内部的一个机器学习“忍者项目”。这个项目只招收了18个人,这18个人却都是Google各个产品部门的精英。他们将要把学习到的人工智能技巧,用于打造他们各自负责的产品。
在Google负责内部机器学习、管理此“忍者项目”的产品经理Christine Robson说:“这个项目邀请Google全公司对机器学习感兴趣的工程师,与机器学习团队一起学习6个月,跟导师取取经,做一些项目,然后开展和实施项目,从中学习经验和教训。”
Carson Colgate
很多年来,机器学习被认为是一个只有技术精英才懂的技术专项。但是现在,机器学习成为了将人类智慧与电脑智慧结合在一起的不二途径。Google致力于在公司内部制作多一点机器学习的“精英”,甚至想要让机器学习成为工程师的常规技巧。
Google是一个庞大的公司,六万个雇员里面,有将近一半都是工程师。对比之下,这个目前只有18个人的机器学习忍者项目,实在很小。但是这个项目表明了Google一个认知上的转变——机器学习已经成为最受重视的新方向之一。
虽然Google一直都有采用机器学习的技术,也一直致力于雇佣这个领域的人才,但是直到2016年,Google才开始执迷于机器学习这项科技。去年年末,Google的总裁Sundar Pichai就说出了Google的新态度:
“机器学习是一个核心的、转变式的改变,它将改变我们做每一件事的方式和想法。我们有目的地在我们的各项产品中运用机器学习,无论是搜索,广告,You Tube,还是Play。我们目前所处的阶段还早,但是你会看到我们一个系统性、规模性的进展——我们将在众多的领域使用机器学习。”
因而这个逻辑很清晰:如果Google真的想要在全线的产品中运用机器学习,它的工程师也必须掌握机器学习的技巧,这个技巧将和传统的编程很不同。正如知名的机器学习宣言《高超算法》一书的作者Pedro Domingos所言:
“机器学习确实是太阳底下的新鲜事:它将自己建造(和实现)自己。”
机器学习是如何在Google崛起的?
Jeff Dean,Google的神级人物,正在带领Google转向机器学习的时代。
做好机器学习,意味着辨识正确的数据,选择正确的算法,并且确保所有的其他条件都正确,才能成功。
Jeff Dean,Google软件部的神级人物,如今带领着机器学习团队,建造各种工具,帮助Google工程师加深机器学习的技能。根据他的预测:今天Google25000个工程师中,只有几千个工程师精通于机器学习。而Jeff Dean的愿景是:所有的Google工程师都要懂得机器学习的一些知识。“我们将要尝试实现这个目标。”
John Giannandrea一直以来都在Google内部提倡机器学习的重要性,而时代造英雄,在Google的机器学习时代,Giannandrea成为了搜索业务的负责人。但是当他2010年刚到公司的时候,他并没与多少机器学习的经验。2011年的时候,他在一个会议上得知“神经信息处理系统”(Neural Information Processing Systems,NIPS),从此欲罢不能。
从此,每一年,NIPS都使用机器学习创造着科技界的神话,解决着如翻译、声音辨识、或者视觉辨识等诸多领域的难题。Giannandrea回忆道当时参加这个NIPS会议的时候,这个会议非常不知名,“但是这个领域在学术和科技界都在过去三年高速成长。去年参会者达到了6000人。”
不只是Giannandrea认为机器学习将会成为科技的核心。Google内部的机器学习拥护者越来越多。比如,Google Brain的联合创始人Dean,他曾在Google X负责一个神经网络的研究计划。这些在Google进行的机器学习运动,说明了Google对计算机的决心和信心。
Jeff Dean
如今在机器学习领域最领先的为“深度学习”算法,这个算法的模型由人脑启发,建立在复杂的神经网络之上。Google Brain以及Google在2014年1月以5亿美元收购的Deep Mind,都在深度学习这一块集中力量开发。Deep Mind开发了Apha Go,并在围棋比赛中将人类的冠军打败了,这件事激发了人类对人工智能深深的恐惧。Giannandrea觉得人工智能绝对不会把人类赶尽杀绝或者取代人类,但是,它将要深刻地变革我们生活的每一个方面。
机器学习的概念在Google绝不是新鲜事。Google的创始人一直以来相信人工智能的力量。十年前,Google已经开始在公司内部给工程师教授机器学习的课程。2005年的时候,研究科学家Peter Norvig开始在每周三在43号楼给感兴趣的Google工程师讲授机器学习。课程如此受欢迎,以至于在Bangladesh的工程师熬夜到凌晨,只为了远程打个电话过来一起听课。而2013年,整个Google都意识到了机器学习的重要性。
随着机器学习的重要性在Google内部崛起,Jeff Dean也开始认真思考:
“在过往,我们可能会使用机器学习,去改善系统的某几个方面。但现在我们真的是要用机器学习去取代整个旧的系统。”
机器学习正在让产品有着以往不可想象的新功能。比如去年11月发布的Gmail上的智能回复功能,就是缘起于Google Brain与Gmail团队的一次对话。Google一直鼓励着这种合作,让这两个团队保持密切的联系。
传统的对人工智能语言的理解是:人们需要将语言的规则嵌入到系统,但是在Gmail的智能回复中,这个系统拥有足够多的数据,它自己就可以学习和完善自己。
不过当这个团队在开始测试智能回复的时候,这个软件有一个很诡异的问题:它总是在建议一些不太符合场合的浪漫性的回复。当它感到困惑的时候,它就会开始说:我爱你。这不是什么软件上的故障。这个错误可能就是它从人类行为中学习而来的:如果你处于不知所措或者困窘的状态,说“我爱你”是个很好的防范策略。
克服重重阻力,机器学习渗透到了搜索算法中
自从去年11月发布智能回复之后,GmailInbox应用的用户就可以选择三个自动生成的回复,而且这些自动生成的回复准确性一般很高。现在,从手机移动端的Gmail用户发出的回复中,十分之一都是由机器学习系统创造的。Gmail的成功只是Google成功运用机器学习的一个极小的例子。
但是当机器学习被运用到搜索功能,这就是极大的转折点了。一直以来,搜索都有运用到机器学习,但是很多年以来,这个公司最重要的搜索算法,都被认为太过于神圣,而不能被机器学习算法所玷污。机器学习对于搜索的作用,一直都受到怀疑。
这种怀疑,部分源自于一种文化上的抵抗:一直以来,高超的黑客们都想要对程序有完全的掌控,而机器学习难免有点太禅意般的“放任自流”。Amit Singhal是一个经验丰富的搜索工程师,是传奇式的电脑科学家Gerald Salton的学徒,Singhal当年修改了Google创始人布林和佩奇的编程作业,让他们的程序变为可以量化扩大的工具。Singhai对于把机器学习并入搜索算法,曾经抱着怀疑的态度。Google的工程师David Pablo Cohn证实当时他们用机器学习提高搜索的沮丧的尝试:
“Amit Singhai的算法当时是世界上最棒的,我们只能通过复制他的想法来做好。当时我们找不到任何比他的方法要好的东西。”
Greg Corrado为Google Brain的联合创始人
到2014年早期的时候,Google的机器学习专家们继续挑战这种局面。结果,机器学习团队的实验成为了搜索的一个核心部分:通过看用户是否点击了搜索词条,来判断搜索呈现的结果是否更好地匹配搜索的词条。
如今,机器学习所建立的搜索匹配的成果Rank Brain,已经是搜索算法的一部分。Rank Brain于2015年4月的时候上线。Google一直以来对于搜索功能如何运作都是闪乎其辞,但是Jeff Dean很明确地说:
“Rank Brain这个机器学习的产物在每一次检索中都发挥作用,并且在大部分的检索中影响着排名。”
并且,这个机器学习的算法证明是非常有效的。每一次的Google搜索都要用上几百个信息点(比如,用户所处的地理位置,以及页面的标题是否与搜索词条匹配),而Rank Brain提供的信息点,是所有信息点中的重要性排在了第三。
打败了传统编程后,机器学习该如何在Google普及
Christine Robson是Google内外机器学习活动的组织者和带动者。
机器学习在搜索中获得成功,对于Google而言非常重要,这让很多人开始真的注意起机器学习来。而华盛顿大学的教授Pedro Domingos用更直白的语言说:
“一直以来,在传统编程者与机器学习者之间都存在着一场战争。结果机器学习者在战斗中获胜了。”
Google目前的挑战是要将他们的工程师队伍过渡到机器学习的队伍,不要求每个人都熟悉掌握机器学习,但起码需要熟悉机器学习。不仅Google在这么做,很多其他的公司(比如Facebook)都在积极迈进机器学习的时代。Google正在各个名校的机器学习领域抢夺人才。Google也即将在苏黎世开设一个机器学习研究中心,抢夺机器学习人才的战争,延伸到了欧洲。
基于目前学术界并没有造出很多的机器学习人才,保持这方面的人才就显得至关重要。在Google,这并不是易事。因为大部分的顶级工程师一辈子都通过传统的编程取得成就。但是机器学习所要求的,是全新的思维。编程者一般通过对编程的控制来进行创造,但是机器学习要求掌控的是某些具体类型的数学和统计学,但是这些领域的知识,甚至对于一些顶级的、可以解决复杂问题的工程师而言,都是陌生的,他们之前也根本不愿意学。
Christine Robson正在致力于给Google的工作人员创造更好的机器学习的环境:
“机器学习与静止不变的编程不同:你要经常给它提供新数据,我们要一直更新模型,一直学习,要一直添加更多的数据,一直转变我们预测的方式。机器学习就像是一个活生生的、会呼吸的家伙,它和传统的计算机编程完全不同。”
但是,Google对训练工程师学会机器学习的前景是乐观的:如今在机器学习中使用的数学不算太复杂,大部分Google的工程师都可以学会。Google并且建造了类似Tensor Flow的工具,帮助工程师学习机器学习。Tensor Flow也为Google在雇用人才方面增加了吸引力。当Google开设Tensor Flow公开课时,有75000人报名参加。
目前Google最大的任务,就打造更多可以完善这些机器学习工具的人才。他们也在内部建立了大量的机器学习的课程,“下一次的课程,已经有好几千的工程师报名参加。”JeffDean说。
毫无疑问,机器学习,将会是Google一个重大的发展方向。我们的未来,将会是一个机器学习和人工智能的未来。