科大讯飞的AI战略部署,做到机器智能的极端
2017-09-17
对于“超脑”一词,胡郁将其解释为一个比大脑更优秀的人工智能系统。至于“讯飞超脑”,这是科大讯飞在2014年公布的一个人工智能计划,几年来一直由胡郁所领导研发,也在多次演讲中曾被提及。对于该计划,它的目的是什么?具体是怎样操作的?又将带来什么样的变革?相信很多小伙伴的心中都有一个疑惑。
机器智能有三个阶段,“讯飞超脑”的目标是“认知智能”
在胡郁的演讲中,我们看到他将机器能够实现的人工智能分为了三个维度,分别是运算智能、感知智能/运动智能和认知智能。
所谓的“运算智能”早已实现,讲究的就是一个“能存会算”,最典型的案例就是IBM深蓝打败国际象棋大师卡斯帕罗夫,以及2016年初引起全世界轰动的AlphaGo战胜围棋大师李世石这两场“人机之战”。其中,计算机所做的就是利用超强的计算和存储能力来预测接下来的一步甚至十几步,从而作出相应的部署。
而“感知智能/运动智能”就是语音识别、计算机视觉等当下已经发展的相当成熟的人工智能技术,以及一些运动机能,也就是说,机器具备了眼、耳、鼻、舌等如同人类一样的感官,并且能走会跑、能抓会扔。
至于“认知智能”,从某种意义上来讲,这更像是基于以上两种智能的一种升华。“人类区别于动物的一个本质,就是人类有自己的语言,能够解释自己的知识,并且能够进行逻辑推理。而机器人在这个方面跟人类也有很大的差距,我们甚至可以说,这是机器人最后能够跟上人类的最需要的一个功能,叫做认知智能。”胡郁在峰会上表示。而从这段话中,我们或许可以这样作出总结,“认知智能”就是机器具备知识理解、逻辑推理等能力,并且能够用自然语言的方式表达出来。这就是“讯飞超脑”的研发目的。
两大路径,“讯飞超脑”打造认知智能引擎
为什么现在人工智能能够在生活中得到应用和普及?其中的主要原因有三,首先是深度学习网络,其次是互联网和移动互联网的普及所带来的大量的数据,最后则是一种“涟漪效应”。
在这三个基础上,为了实现“认知智能”,成功打造一个认知智能引擎,“讯飞超脑”是如何运作的?
在峰会现场,胡郁表明,“讯飞超脑”的运作采用两条路径,一方面是深度神经网络+大数据+涟漪效应,另一方面则是与人脑相结合,一短一近,一长一远,以此来实现这方面的突破。
当前,“讯飞超脑”模拟人脑打造了拥有100多亿个神经元的深度神经网络,继而利用大数据来进行训练以提升相关算法。当然,这其中的“训练”指代的并不是那种填鸭式的数据输入和训练,而是让系统能够依据数据实现自主学习和提升。至于其中的具体过程,就涉及到大数据与涟漪效应的一个结合。
首先推出一个人工智能算法,慢慢的让用户群体由小到大,就跟水滴滴入水中后的涟漪一样越来越大。在这期间,用户使用算法所产生的数据就会上传到云端,继而算法就相当于在真实环境中自行学习并更新。这样一来的结果就是,在用户群体不断扩大的同时,算法也因此愈加成熟。
部署多年,“讯飞超脑”成果如何?
历经18年,在语音识别、语音合成等方面,科大讯飞的地位已经是不可撼动的了。一直以来,科大讯飞都是围绕“语音”这一块来进行各项技术研发的,作为其旗下的一个重点项目,“讯飞超脑”在应用上也可以说是“万变不离其宗”。
胡郁称,“讯飞超脑”计划是科大讯飞面向人工智能领域深度进发的一个非常重要的风向标,一定是符合公司自身需求并且和现在业务发展能够紧密配合的,比如智能客服、个人定制手机全能助理、机器智能健康医疗咨询等应用方向。
这样一来,从某种意义上来说,以理解人类语言,掌握人类的概念,进行人类的推理,拥有自学习能力等为目标的“讯飞超脑”更像是一种专用人工智能。当然,这也是由科大讯飞十几年来的研发成果和积累所决定的。
目前,“讯飞超脑”已经能够做到看、听、读、写,同时还具备了推理、知识学习与表达的功能。与此同时,国际最高水平的语音合成比赛Blizzard Challenge(暴风雪竞赛)的第一名、第四届CHiME Challenge国际多通道语音分离和识别大赛的第一名、国际著名的常识推理比赛Winograd Schema Challenge 2016的第一名……通过几场国际比赛和测试的评判,“讯飞超脑”的实力也已经得到了验证。