《电子技术应用》
您所在的位置:首页 > 通信与网络 > 业界动态 > 微软人工智能计划 华人顶起半边天

微软人工智能计划 华人顶起半边天

2016-06-27

  在亚洲研究院内,90%以上的科研人员是华人,像聂再清团队一样的研究小组有20多个,其中很多都从事与人工智能相关的核心技术和应用研究。

  “为微软孵化颠覆性科技并创造新的业务。现在我们部门建立了几个团队,专注于新业务”

  人工智能

  今年的微软Build大会上,微软CEO萨提亚.纳德拉展示了一款能够订购达美乐Pizza的机器人。方法很简单,只需要对着你的移动设备说“想吃Pizza”,约定时间内,Pizza就被送到你的手里——不用点开某个叫餐软件,甚至不必打字。就像是有个人坐在后台,随时待命。

  没有人坐在后台待命,是读取和深度学习达美乐点餐全流程的虚拟机器人完成了所有操作。微软给这个黑科技项目取了一个并不花哨的名字——“机器人智能”(Bot Intelligence)。整个项目展示只有短短5分钟,但对微软而言,意义重大。

  掌管微软整体技术研究的执行副总裁沈向洋表示,“机器人智能”是机器人架构(Bot Framework)的核心部分,嵌入了深度学习、语义理解等人工智能技术,第三方开发者能够通过机器人架构这个平台来创建不同功能的机器人。

  它直接关系到微软的未来——不仅仅是订购Pizza,微软希望,不同企业可以像达美乐那样利用微软的平台更简单地制作并运行自己的智能机器人。彭博社撰文指出,这是一个崭新的市场,以至于Gartner和Forrester等调研公司还没有摸清楚它的规模,这很可能会非常庞大。

  这项终极目标是要让机器替代人类的技术背后,集结了微软众多科学家的智慧,尤其是几年来在人工智能领域的研发成果。每年微软都有接近100亿美元投入在研发上,其中很大一部分集中在人工智能。据沈向洋介绍,在全球微软有1000多名研究人员,至少有三分之一都在研究人工智能。在这庞大的科学家队伍中,华人面孔的科学家,成为微软人工智能战略背后的核心研发力量。

  “(微软CEO纳德拉展示的)这个Pizza机器人的大脑,就是我们做的。”38岁的聂再清说。他是微软亚洲研究院资深研究员,带领着一个有8个研究员的小组,过去十余年都在主攻大数据挖掘和机器学习。“简单说,(我们的工作)就是让机器能够理解用户的自然语言并构建知识图谱。”他说道。

  这个研究小组的成果,促成了Pizza机器人和其背后“机器人智能”技术的诞生,也让不同企业利用微软的平台制作并运行自己的机器人,成为了可能。

  今年3月,聂再清代表亚洲研究院,在美国华盛顿州雷德蒙微软总部一年一度的Techfest(微软技术大会)上,展示了这项成果。他仅用了几行代码,制作出一个能够用于企业内部预订会议的机器人。当时,纳德拉坐在不到5米远的看台上,在他旁边的是微软执行副总裁、研发集团CEO沈向洋。

2016062509.jpg

  “这是我见到过的最简单的代码。”微软CEO纳德拉对一旁的沈向洋说道,他希望在一个月后的Build大会上加入这个研究的展示,不过展示形式可能要换换,比如,不是用于预订会议的机器,而是用简单的代码写出一个可以订购Pizza的智能点餐机器人。

  “通常为机器人添加新功能或场景需要一整套的工序,现在只需要几步,有了‘机器人智能’的机器人架构平台就能帮助开发者构建一个机器人的大脑,哪怕你对软件工程的知识一窍不通。”他介绍道。

  讲述“Pizza机器人”这段诞生过程时,聂再清坐在北京中关村一栋30层高的写字楼办公室里。这里是微软亚洲研究院,微软全球范围内1000多名科学家和专家中的五分之一,聚集于此。

  在亚洲研究院内,90%以上的科研人员是华人,像聂再清团队一样的研究小组有20多个,其中很多都从事与人工智能相关的核心技术和应用研究,涵盖了从大数据挖掘、机器学习、自然语言处理到在线搜索等人工智能核心技术的方方面面。3月在美国高调上线并引发轩然大波的微软人工智能助手Tay的原型,即在中国有4000万用户的语音助手“微软小冰”,正是这些研究团队的另一项成果。

  研发团队

  身为微软全球执行副总裁、掌管这个全球最大高科技公司研究事务的沈向洋博士,也起步于位于北京的这个研究院。沈向洋曾担任微软亚洲研究院院长,是聂再清的上司。

  1999年,沈在北京加入微软亚洲研究院,成为这个研究院第一名研究员,主攻视觉识别。那一年,李开复任亚洲研究院院长,在他的带领下,微软实验室开始拼音输入程序的研发。李开复和沈向洋不仅都毕业于卡内基梅隆大学,且都师从1994年的图灵奖获得者拉吉.瑞迪。从1999年开始,直到今日,人工智能都是整个微软亚洲研究院的主攻方向之一。

  现在沈向洋的办公室位于美国华盛顿州的雷德蒙总部,从窗外望出去,能隐约看到雷德蒙大学的操场。19年前,Windows95在这里正式发布。那曾是微软最辉煌的时期,Windows几乎占据了90%的市场份额,直到2007年,雅虎和谷歌带来的全新商业模式——这种通过广告赚钱,而对用户而言一切免费的模式与微软截然不同,也让微软第一次正视自己已经错失了搜索的机会。

2016062510(1).jpg

  美国华盛顿州雷德蒙德的微软总部

  那是一次输在策略的赛跑。事实上,2007年沈向洋在亚洲研究院任院长时,这里的自然语言研究及机器学习已小有成果——这两者正是搜索技术往前发展的核心。正因如此,当年年底,当时任微软CEO的史蒂夫.鲍尔默决定要在微软内部打造一支搜索团队时,选中了沈向洋。

  鲍尔默当时给团队打气说:“我调了一个最懂技术的人,叫沈向洋,又调了一个最懂产品的人,叫纳德拉。”接下来的几年,沈陆续从亚洲研究院带了54个研究员到必应(Bing)。这些研究员最后都成为了搜索团队里面的技术骨干。

  又过了六年后,纳德拉成为了微软的掌舵人,把公司带向云计算,而沈向洋这位出生于南京的中国人,则成为了微软创新理念的重要布道者。他所带领的研发团队时刻都在为微软寻找下一个“伟大的点子”。

  这两年,如何让研发团队这个微软重要且宝贵的资产支持企业未来的发展蓝图,一直是纳德拉和沈向洋反复讨论的话题。为此,沈向洋更改了研发部门的一些规划与制度。微软在全球拥有11个研究院和实验室,在研究院里,研究工作以研究领域为单位独立运行,同时研究组之间、研究组与产品部门之间又保持密切合作。

  过去,研究小组不是一个真正的产品研发团队,而是以基础研究为主,较少考虑市场因素,现在沈向洋希望研究团队也参与产品的研发。“为微软孵化颠覆性科技并创造新的业务。现在我们部门建立了几个团队,专注于新业务。”他说道。

  每年,微软研发集团会挑选一些项目向公司业务部门展示,但只有七个项目进入到最后的颠覆性科技评估环节。这些入选的项目大都在相关性领域有颠覆性的研究发现。每年10月,在雷德蒙会议室里,各个项目负责人都会与微软高层们进行4个小时的头脑风暴,沈向洋会在一旁收集反馈,并决定下一步动作,比如,是否立刻将其落实为产品。

  一些项目已经处于前期研究的阶段,其中包括位于美国加州的圣塔芭芭拉市(SantaBarbara)的量子计算实验室;英国剑桥研究院在做生物计算(Biological Computing)的长期研究;最近,微软还试图在DNA上存储海量信息,并为此新建了一个Wet Lab……

  说起这些项目,沈向洋如数家珍。过去两年,他平均每周深度考察两个来自全球研究院的项目。沈向洋分享了以上那些鲜为人知的微软黑科技。他试图向外界展示的不外乎一点:现在的微软跟盖茨时代没有两样,仍然是一家注重技术研发的公司,哪怕这些研发都相当基础,短期内不可能实现。

  从基础研发到最终产品,其中过程并不容易。微软不止一次在一些项目上栽跟头,包括Tay。今年3月Tay在美国正式上线,但几个小时后,就有别有用心的人教会它发表种族歧视的言论。不久Tay便被要求紧急下线。这几乎可以看作小冰“西游”的一次失败。

  不过,在与中国文化相近的日本,小冰的姐妹版Rinna却受到追捧。在沈向洋看来,这回到了最根本的问题:计算机的算法让它已经能识别数千种汽车,而人类可能只能认出三种。但在认知、同理心和情感层面,机器还无法接近人类。

  需求与未来

  人工智能之于今天的微软,就像当年的搜索服务。人工智能是让计算机学习如何像人一样听、说、读、想,该领域与移动互联网时代紧密相连。大多数科技公司都已经看到其广阔前景,巨头之间,人工智能的竞赛也已展开。

  Facebook在硅谷、纽约和巴黎建立了三个人工智能实验室。Google常年在全球搜罗人工智能方面的科学家。百度挖走了谷歌的科学家吴恩达,还在硅谷建立了研究院……“但是各家不一样,主要还是看各自的业务模式,也就是你到底用这样的技术去做什么。”沈向洋说道,他与百度董事长李彦宏相熟,去年他们还讨论过尼克.波斯特洛姆的《超级智能》里的场景。

  百度与谷歌类似,在人脸识别、自然语言处理上下功夫,以支撑搜索技术发展的需要。Facebook则希望通过人工智能挖掘社交技术的可能。而微软花了大量精力在机器学习、计算机视觉识别等人工智能的基础研究上,“所有的人工智能研究都围绕微软未来的智能云平台展开。”沈向洋说道。这是继搜索后的又一次赛跑,好在这次,微软至少没有输在起跑线上,北京的研发团队过去十几年的技术积累,正在派上用场。

  机器学习是让机器具有智能的核心。过去十多年,聂再清位于北京中关村的团队都在主攻大数据挖掘和机器学习。他的第一个项目叫学术搜索。那时,他刚从美国大学博士毕业,正愁没有研究课题。却发现自己平时苦于做论文需要寻找文献,于是搭建了一个可以搜索文献、会议、作者、机构及其关系的对象级别搜索引擎。

  后来该团队把搜索对象扩展到了互联网上有公开信息的任何一个人,就有了叫“人立方”的产品——这是一种关系搜索,它从超过十亿的中文网页中自动抽取出人名、地名、机构名以及中文短语,并且通过算法自动计算出它们之间存在关系的可能性。

  “机器人智能”项目,实际上基于人立方的技术。这种技术最先被用到了企业内部,一款名为企业深度智能(Enterprise Deep Intelligence,简称EDI)的应用已经预计会很快进行产品化。它已在微软亚洲研究院内部广泛试用,人们都在用这个应用查询信息、组织会议、自动预订会议室。

  另外,EDI还可以像一个私人秘书一样,通过Skypefor Business与用户聊天,只要告诉“他”你的需求,“他”就帮你处理日常事务。“可以把预订会议的邮件抄送给‘他’,或者输入:‘EDI,请帮我跟这些人约一个会议’,‘他’根据你的要求和喜好,会自动去找会议室和大家都有空的时间段。”聂再清说,“把API应用到达美乐场景,就得到了订购Pizza的机器人。”

  在沈向洋看来,这是微软的下一步:“我们认为未来智能助理(Intelligent Agent),可能会是一个新入口,无论是Android还是WindowsPhone都行得通,微软就可以和所有的公司合作。”看上去此类需求无处不在。“很多想法从平时的阅读和学术文章中来,但有些时候,是自己真的发现了需求。”微软亚洲研究院主管研究员闫峻说。近几年,他一直在负责一支5个研究员组成的知识挖掘团队。

  去年,闫峻在北京一家医院接受了一个外科手术。他了解到,一个普通外科医生一天可能进行10例手术,医生资源不够用,无法解答每个康复期病人的困惑。这激发他进行一项基于知识挖掘的医疗项目,以解决医院生产力的问题。他选择在北京和沈阳的医院进行试点,并同时与产品部门保持密切联系,让后者及时得到用户需求的趋势。

  理想的模型是,医院里有一个机器人,或者是存在于病患手机中的一个App中,病患的所有问题都能通过这个机器人得到回复。去年年底开始,闫峻通过让机器模拟人类学习的四个阶段来获取这些专业知识。闫峻介绍称,即使在最简单的第一阶段,也需要运用到知识挖掘的技术——在这个阶段,机器可以从一些网页上抓取疾病可能存在的症状,然后捕捉那些在论坛上活跃医生的问答。

  据闫峻团队统计,一个外科医生一年之内,能在不同论坛里回答几十到几千个问题。而网络针对同一疾病可能有几万个不同问题,最后通过机器的知识挖掘,可以总结出用户实际上在问的最本质的问题,针对一个疾病这样的问题可能只有80多个。

2016062511.jpg

  闫峻

  除了机器学习和知识挖掘之外,沈向洋鼓励亚洲研究院的中国研究员们在深度神经网络研究领域投入力量。这个领域的研究属于人工智能深度学习。“这个领域的意义在于,几年内,计算机在感知上的能力就会超越人类。再过5到10年,图像识别上计算机就可以比人类更厉害。到时候,当识别这是个什么瓶子、是哪个牌子的瓶子时,人工智能就能比人更清楚。”沈向洋说。

  人工智能要达到这样的能力,还有很远的路要走。沈向洋明白,如果“人工智能”之父阿兰.图灵活到今天,可能会对人工智能过去60年的发展感到失望——即便是最近获得极大关注的Alpha Go,它可以在围棋上取胜,却玩不了高级扑克,因为它还看不懂人类的虚张声势。不过,对沈向洋的团队而言,这倒也是机会,毕竟,至少现在他们的人工智能技术可以用来叫Pizza外卖了。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。