《电子技术应用》
您所在的位置:首页 > 通信与网络 > 业界动态 > 上交大AI研究院首席科学家徐雷:中国人工智能研究真的世界领先了吗?

上交大AI研究院首席科学家徐雷:中国人工智能研究真的世界领先了吗?

2019-10-12
关键词: 上交大 人工智能 AI

  尽管人工智能不是新鲜的概念,从1956年被提出至今已逾一个甲子,但对于大多数人来说,从2016年AlphaGo战胜围棋世界冠军李世石开始,才对人工智能略有耳详。在此之前,人工智能在大众舆论场中几乎是长期沉默的。

  但从学术界的视角来看,对人工智能的研究,犹如在盘山公路上爬坡,从未停止过。欧洲科学院院士、上海交大人工智能研究院首席科学家徐雷就是一位从上世纪八十年代初就加入这个领域的老一辈研究者,谈及随机霍夫变换RHT、分类器组合、对手竞争学习RPCL、非线性PCA学习、Mixture of Experts, EM 算法,LMSER学习、BYY 学习等神经网络和模式识别领域中的多项先驱成果时,都绕不开他的名字。在这些领域中,徐雷自九十年代初起就一直是国际上最有影响的几位华人之一。

  在37年余的人工智能研究生涯中,徐雷做出了多个广为引用的成果。2001年当选IEEE Fellow,是从计算智能学会当选之首位中国学者;2002年当选国际模式识别学会 Fellow,是最早获选的几个华人之一; 2003年当选欧洲科学院院士。徐雷曾与Judea Pearl (2011图灵奖得主), Geoffrey Hinton(引发当下人工智能浪潮的深度学习之父)和Michael I. Jordan均有合作文章发表。1993年加入香港中文大学之前,曾在MIT的Michael I. Jordan团队工作过一年多。早在九十年代的前五年里,就在学界最顶级的NIPS(后改名为NeurlPS)会议中发表了四篇论文,并三次担任NIPS大中华区的联络人。

  徐雷曾荣获多个国内外主要奖项,如获93年国家自然科学奖、95年国际神经网络学会领袖奖、06年亚太神经网络学会最高奖杰出成就奖(首位获奖华人)。

640.webp (2).jpg

  为了解人工智能研究的历史、现在与未来,AI报道(AI Report)拜访了徐雷教授。这位在国际舞台上为中国赢得声誉的科学家对中国人工智能的发展有何看法?答案或许并不如国内AI圈中很多人想得那么乐观。

  中国人工智能发展水平距离世界顶尖还有多远?

  近年,我国人工智能发展迅猛,在企业数、发表论文数等数项指标上都已达到了世界第二。那么,中国整体人工智能发展水平距离世界顶尖水平还差多远?

  徐雷认为,要讲清这个问题,最好先看一下这一波人工智能热潮是怎样发展起来的。

  这一波人工智能热潮起点源于2006年Geoffrey Hinton 及其学生在《神经计算》和《科学》上发表的两篇深度学习论文,经过在学界的几年孕育以后,引起IBM,微软、谷歌等企业跟进推动,尤其是中国互联网产业的蜂拥而入,才有了现在人工智能大发展的盛况。这波热潮有下面三个主要支撑:

  (1) 理论方法  Hinton在2006年的工作源头其实是八十年代中期曾引起人工神经网络研究热潮的反向传播学习算法,始于发表在1986年《自然》的一篇论文,Hinton是三位作者中间的那位。这个算法的早期影子先是回溯到1974年,后又前推到1968年。八十年代末之后的十余年,在神经网络研究在理论、方法、和算法上都有很大发展。现今的基本家当,例如,卷积网络、生成网络,自编码学习、变分学习、以及包括LSTM在内的各种递归网络,大都来自于那个时期。近年来的发展主流,基本上是这些方法的应用、拓展、和各种集成,当然也有一些如GAN学习等基础研究突破。

  (2) 芯片算力  马斯克的OpenAI 认为,2012-2017六年间AI计算力6年提升30万倍。保守估计九十年代初到2006年的算力增长就算只有它的十分之一,那也意味着做2006年需要20分钟算的问题,九十年代初中期要算一年。当时的基础研究提出了各种方法,但不可能通过计算得到验证,所以才会有一、二十年的滞后期。Hinton在1986年后的二十年再续前缘,既反映他的执着,也是历史的圆满。

  (3) 大数据和互联网  九十年代初采集用于语音识别的数据都已经十分困难,采集人脸图像数据则难度更大。就算那时有算力,也不可能有足够大量的数据来训练,以确定深度神经网络中的大量参数。2009年原微软人工智能首席科学家邓力邀请Hinton来到微软,利用他们在语音领域积累了多年的大数据,尝试了深度学习的应用,发现用深度学习进行语音识别比原来的识别方法成果有了很大提高。李飞飞在 CVPR 2009 上发表了关于ImageNet的论文,关注如何有效地获取图像数据集,并从2010 年开始开启了每年一度的ImageNet 挑战赛(通过互联网和众筹),解决了计算机视觉的大数据获取问题。

  在上述三大支撑中,第三个是我国的明显强项。最多的人口、通讯和互联网的飞速发展和普及、以及体制的优势和社会的需求,语音、图像、以及其他大数据的获取都远超欧美。而通过雄厚的资金投入,也购买获得了巨大的算力,这些催生了国内许多独角兽公司出现和飞速发展。2012年,Hinton团队在ImageNet首次使用深度学习完胜其它团队,神经网络层数只有个位数。商汤的团队在2016年ImageNet图片分类中做出最佳性能时,用得神经网络层数是1200多层。

  语音识别和计算机视觉这两个“耳聪目明”领域快速进入商用,这大大推动了这波人工智能浪潮在世界范围内的高涨。与此同时,主要集中在这两个领域,中国学者发表论文数与日俱增,国内也出现了许多独角兽公司。从总量来看,在企业数、发表论文数等数项指标上都已达到了世界第二。甚至可以说,在刷脸场景下,已做到世界第一。

  能在“耳聪目明”领域迅速发力,还和我国的文化渊源有关。徐雷说, 粗略地,人工智能可以从机器模拟“耳聪目明”、形象思维、和抽象思维三个方面来考虑。早在1975年,钱学森先生就提出,常用而重要的智能活动其实在形象思维。而那时候,人工智能界主要在研究抽象思维。

  很有意思,这两种不同方式,中国人和西方人正好各擅长其一。中国文字基本是象形的,思维发展偏重形象思维,而西方文字抽象成符号,注重关系、形式、与语法。

  符号文字抽象于形象文字,故有西方有学者把抽象思维叫高级智能。自然地, AI发展的前半段就是基于符号思维,注重解析出基本单元,再按一定的规则,由底朝上逐步组合搭出一个体系。这种思维有利于抓住主要脉络,解释所看到的现实世界。 但是,针对“耳聪目明”这类识别认知活动,反而遇到很大困难。尽管有时被称为初级智能, “耳聪目明”却是思维的基础,AI发展的前半段其实走了建“空中楼阁”的弯路。

  而这次人工智能浪潮就是从“耳聪目明”这个形象思维的基础突破的。做法很简单,数学上完成一个X到Y的一个整体性的映射,用一个深度神经网络结构来实现。可能由于我们的文化偏好形象思维,华人不仅参与这次推波助澜并引起主要发展,而且也是过去一路走来致力于推动“耳聪目明”的主角之一。

  早在1957年就有在美国的华人介入字符识别,70年代中期到80年代中期,是主攻“耳聪目明“的模式识别之第一个发展期,头号领袖是美国普渡大学教授付京孙先生(1930-1985)。而徐雷的博士导师清华大学常迵院士(1917-1991)和博士后导师北京大学程民德院士(1917-1998),在上述时期则领导了中国模式识别的发展,建立了我国智能科学的第一批三个国家重点实验室,其中两个主攻模式识别与机器认知,并在我国学科设置上正式开出了模式识别的相关专业,近年来我国在 “耳聪目明”方面能够人才济济,应当回溯到当年他们打下的根基。

  中国在“耳聪目明”领域能迅速发力的现实基础,是有大量数据、大量需求,和大量投入。影像医疗就是另一个我国依靠样本优势有望快速赶超的领域,仅北京肿瘤医院一个月胃癌的门诊病历数就超过全美胃癌患者一年的门诊量。中国还有不少有明显的样本优势的其它应用领域,都有望能快速看到应用效益,并问鼎世界。即使如此,现在也不到声称中国AI在应用方面已经领先的时候。例如,在语音识别和语言翻译方面,Google的水平优于国内企业,特别是在英文和其他文字领域更是如此。在机器人行业中,尤其是类人或特种机器人,离美国的波士顿动力机器人的水平,国内水平远远落后,可能差一、二十年都不止。

  更令我们保持清醒的是,在三大支撑中的前两个,我们的差距更大。

  在芯片方面,设计各种专门的人工智能芯片,是可以有望很快赶上甚至超越的。但是在芯片的制造上,却有一段很长的路要赶。而制造能力才是基础,造不出来的设计只能是纸上谈兵。在算力方面,尽管中国的神威和天河超级计算机都曾经问鼎全球,现在也仍位四甲,但在量子计算机方面,谷歌和IBM都在商用化方面推进很快。还有,在下一代计算材料和芯片方面,我国的短板可能更大。

  在徐雷看来,东方文化注重集成、注重整体应用,这是一种优势;西方注重基础,注重造芯片,这是另一种优势。取人之长补己之短,把别人的芯片集成过来直接使用不失为上策,东西方文化融合、互补,才能给发展人工智能带来更好局面;只有在行不通时,才需要我们一切重新造起,这其中的关键是,中国必须要做到让对方愿意卖给我们使用。

  80年代初期的历史或值得我们借鉴:当时中国要买美国的一些计算机设备,都面临西方所谓巴黎统筹委员会对我们的掣肘。因此,中国不断跟踪研制,一达到一个新的水平,他们就会批准把更一高档的设备卖给中国。可见,在产业发展时,不一定要样样自主做,以小得多的代价跟踪,最优配置资源,也许更佳,但要清楚让人知道,需要的时候,我们是有能力自己做的。

  要在人工智能理论方法的基础研究达到世界领先水平,中国也仍然是任重道远。目前来自中国的论文,大多是在偏应用性质的会议上发表,能冲进NIPS论文不多,还达不到能在NIPS这个基础研究的顶会上占有不可或缺的地位。大量的工作,都在追求能在中国计算机学会或其他单位自定的顶级会议上可以发表,并不追求是否能被别人大量的引用、跟随和应用,而追求从0到1突破的努力更是凤毛麟角。尤其令人担忧的是,大多数大学和研究机构发出的论文,还都是通过直接用别人的开源程序计算的。

  徐雷接着说,前面提到,中国人的思维是从顶向下的,忽略基础创新,重视整体把握、应用集成,追求“短、平、快”,最后一点是尤其堪忧的。大家都离起跑线不远时,差距还不远,越往前差距越大。对此,他特别地提到八十年代导师常迵之问。第一次常先生问付京孙教授:“中国模式识别的研究水平离美国差多远?”付先生答“三、四年”。而三、四年后付先生再来华访问,常先生再问“还差几年”, 付先生答“七、八年”。类似的故事,在基础研究起关键作用的阶段,其他领域也出现过。徐雷希望,这个故事不会在今后的中国人工智能发展中重演。

  他还表示:“希望中国的学者中能有一部分,在这一波热潮渐渐平稳下来、整顿盘整的期间,能慢慢沉下来,回归到一些基础研究。‘耳聪目明’ 的基础研究不是中国人贡献的,中国人的贡献主要是快速推广到实际应用。希望中国学者未来在形象思维、抽象思维等基础研究领域有更多贡献。”

  在科学“奥运会”上为国摘金

640.webp (1).jpg

  上海市经信委副主任张英(左一)给中科院上海分院副院长张旭院士(左二)、同济大学副校长蒋昌俊教授(左三)、和徐雷教授(左四)发WAIC SAIL奖的评审专家的聘书。徐雷教授在去年和今年都担任了SAIL奖的终评会审专家。

  尽管徐雷已过花甲之年,但他仍保持着高强度的工作,带领着团队奋战在科研第一线。“我把一生的时间都用来拼搏了,我自认为是一个很拼的人。”徐雷这样评价自己。这位发已斑白的老人始终保持着简朴的生活,除了工作外,徐雷很少有别的爱好,每天从宿舍走到办公室,晚上再走回去,就充作锻炼身体了。

  很难想象,这位闻名遐迩的科学家曾是一名煤矿工人。在恢复高考前,徐雷曾在云贵交界的一处煤矿工作。1977年,在恢复高考后的第一次招生中,徐雷走进了考场,进入哈尔滨工业大学获得了本科学位,随后又考入清华大学,成为常迵先生和闫平凡教授共同任导师的第一个硕士生和第一个博士生。1987年,徐雷来到北大,师从程民德院士和石青云院士做博士后,次年成为北大全校当年破格提升的十位副教授之一。

  在此期间,徐雷在包括《中国科学》《科学通报》《计算机学报》《电子学报》《自动化学报》在内的国内核心刊物上发表论文18篇,在模式识别、人工智能、信号处理的主要国际会议上发表论文九篇。其中,1987年发表在UAI会议上的一篇论文最早将二值变量贝叶斯树之学习拓广到高斯变量,开实变量贝叶斯网学习之先。这篇论文被J.Pearl(2011年图灵奖获得者)收入1988年出版的经典专著中,成为了专门的一节。

  还有一篇发表在国际模式识别大会ICPR上的论文,是口头报告,因为当时外汇有限,不能出去开会。会后当时的国际模式识别学会主席 Pierre Devijver(?-1996)却给徐雷来了一封信,说他没有时间事先获得许可(当时国内还没有电邮),就主动帮徐雷代做了口头报告。Devijver当时并不认识徐雷,也不知道是常迵的学生,那论文徐雷是单独作者,他只是认为那篇论文应该被介绍。当今国际模式识别学会的大奖,最重要的奖项是以付京孙(K.S.Fu)命名的,而另一个主要奖项是P.Devijver奖。

  1988年,在时任国家主席在北京人民大会堂主持颁奖的第一批40名霍英东奖获得者中,徐雷是唯一的人工智能相关学科的学者。那年冬天,北大视觉与听觉信息处理国家重点实验室的主任石青云教授找他谈,告知领导有意让他接任做主任,该实验室是当时国家首批智能科学相关的三个国家重点实验室之一。此时,摆在徐雷面前的本是一个顺理成章进入仕途的机会,但他毅然决然地放弃了。徐雷认为,在世界范围内,中国的人工智能学科相关的研究离世界前沿还差的很远,因此他选择出国看看,与世界上最顶尖的科学家直接打交道。

  谈及为何做出这一选择时,徐雷回忆道,他曾深深受到陈景润故事的影响:1972年,苏联数学家代表团来访问中国,周总理一时很为难,不知道该找哪些数学家去接待。此时代表团提出,中国有个杰出年轻数学家叫陈景润,哥德巴赫猜想研究做出了杰出成果,希望和他谈谈。于是政府到处去找这个年轻人,最后在中科院一间不足6平米的锅炉房里找到了他。陈景润的故事激励着那个年代的知识分子,从此徐雷立下志向,一旦国家需要,也要能为国争光。

  实际上,后来徐雷的确以中国自己培养的博士身份,在模式识别、神经网络等人工智能领域,留下了多个中国人的印记,实现了当年的愿望。

  1989年至1993年,徐雷辗转于欧美当时相关学术领域的四个领军团队。1989年初徐雷加入芬兰拉普兰塔理工大学的E.Oja团队做高级研究员(Oja是九十年代欧洲神经网络领域的几个主要学术领头人之一),1990年春加入加拿大康考迪亚大学C.Y.Suen团队做副研究员,也是当时加拿大模式识别领域的领军团队。徐雷在1991年9月以访问学者的身份加入了哈佛的 A.Yuille 团队(Yuille是霍金的弟子,也是计算机视觉研究领域的大师),又在一年后加入麻省理工的M. I. Jordan团队做博士后。直到1993年秋返回中国香港,加入香港中文大学任教。

  在此期间,徐雷研究著名的霍夫变换有突破性进展,发明了随机霍夫变换RHT。他还以第一作者身份发表了另一论文,提出了分类器组合的三级框架并讨论了多个组合方法, 为现在广为研究的集成学习和信息融合提供了基础,被广为引用。这两个成果使他在2002年当选国际模式识别学会 IAPR Fellow会士,成为最早获选的几位华人之一。

  在此期间,徐雷将当时相关领域很有影响的Oja自适应PCA学习,发展到自适应非线性PCA学习;并率先揭示了Hebb学习辅以S非线性实现独立化学习,能消除旋转不确定性;还为Oja自适应子空间学习的全局收敛性提供了数学证明。这些成果不仅让徐雷在该方向的影响紧随Oja之后,而且将Oja团队的主要兴趣引回,也吸引了欧美还有中国的不少学者之后的持续推进。

  在此期间,作为单独作者,徐雷在1991年会议论文首先提出并在1993年的期刊论文中进一步阐述,提出了多层神经网络自组织学习LMSER,以双向对偶方式实现对网络中参数的学习,其特点是强制了参数对称性和神经元强度的对称性。2006年Hinton团队的那两篇经典论文中的深度学习结构Stacked RBM,也强制了这种参数对称性,而近年才出现的所谓U-net的结构,也与多层LMSER类似。由于算力的限制,当时计算实验只做了单个隐层。但在论文中,讨论和预言了多层LMSER的若干认知功能,如联想、概念形成、心像、注意等。后面会提到,这些预言都在近年得到了计算验证。

  在此期间,徐雷还1991年提出在竞争学习中引入反垄断机制,同时适度地引入对手惩罚机制,发明了对手惩罚竞争学习(RPCL),开创了无监督学习过程中,可以实现模型自动选择的先河。在学习中可以自动去除多余参数,可实现选择模型自动选择的另一个办法L1学习, 是1995年才出现而快速走红的。RPCL已被直接应用于解决许多实际问题上。例如,在大数据分析和无监督统计学习中经常遇到的聚类分析中,可自动确定样本集来自几个不同的类。

  在此期间,徐雷通过对Gaussian Mixture和Mixture of Experts 上的EM算法之收敛性做数学分析,有力支持了M. I. Jordan在九十年代倡导的EM算法的新一轮研究热,澄清了当时统计文献上关于EM算法的一些误解,厘清了EM的优缺点。徐雷还与M. I. Jordan和G. Hinton合作,提出一个改进的多专家混合模型,更适合利用EM算法。

  也从这期间开始,徐雷成为了当时NIPS(后改名为NeurlPS)会议上活跃的少数几位华人学者之一。从NIPS1992起,每年一篇,连续在NIPS年会上发表了四篇论文。若看作者单位,第一篇徐雷是第一作者,单位是北京大学。其他3篇的作者单位都是香港中文大学。这意味着中国学者在NIPS发表论文的最早时间至少可提前到1992年,而不是目前国内一些资料所记载的本世纪的头几年。

  80年代底开始,引发当下人工智能浪潮的深度学习之父G. Hinton和一批学术精英,接管了这个在1986年由IEEE信息论分会发起的学术会议。 从此NIPS成为神经网络领域、乃至人工智能所有相关领域的旗舰会议。其后近三十年,先是G. Hinton和M. I.Jordan交替为旗手,后由他们的学生们接力,是人工智能领域,最活跃、最有创意,也是文章最难进入的会议。基础研究成果大多先出现在NIPS,然后向其他会议,以一定的滞后期传播和推广应用。顺便一提,从1995年起,徐雷曾连续三年担任NIPS组委会中大中华区的联络人(Liaison)。

  徐雷在香港中文大学二十多年期间,先是进一步发展提出了贝叶斯阴阳学习理论,发表在NIPS1995会议上,这点后面还会做介绍。然后,他一方面将贝叶斯阴阳学习理论及以上所述成果,进一步发展、完善、系统化,并在智能金融、智能医疗、雷达信号识别等领域做了许多应用工作;另一方面,在径向基网学习、独立子空间学习、独立分量分析、时序独立状态空间、运筹优化等方向还做了不少基础研究工作。根据资料检索,徐雷的多个研究成果已被国内和欧美日等许多研究单位,广泛应用于雷达、遥感、材料、机器人、无人驾驶、软件工程、网络发掘、精密制造、医学图像、生物信息等领域。

  徐雷曾获得数个国内外主要奖项和荣誉。1993年,徐雷获国家自然科学奖。1995年,徐雷获国际神经网络学会领袖奖。2006年,徐雷获亚太神经网络学会最高奖——杰出成就奖,此奖每年仅奖一人,徐雷是荣获此奖第三人,首两位分别是日本智能领域的头两位大咖。此外,徐雷于2001年当选IEEE会士,成为中国最早的几位会士之一,也是从计算智能学会当选的首位中国学者。2002年,徐雷当选国际模式识别学会 IAPR Fellow会士,成为最早获选的几位华人之一。2003年,徐雷当选欧洲科学院院士。

  徐雷曾任9个国际学术期刊之编委,例如,1994起年担任国际神经网络权威学术期刊Neural Networks的编委达22年,是首位担任这个角色的华人。2001年至2003年,徐雷当选国际神经网络学会理事会理事,是中国学者最早当选的二人之一(另一位是当时的北京大学常务副校长),并任Award committee委员。2007-08年徐雷任IEEE计算智能学会Fellow committee委员,是首位华人担任该学会此角色。他还是首位获任 IEEE 计算智能学会会士评审委员会的华人。

  徐雷于2016夏全职到岗上海交大,任致远讲席教授、人工智能研究院首席科学家、脑科学与技术中心首席科学家、张江实验室脑与智能科技研究院神经网络计算研究中心主任。在香港期间也一直致力于贡献内地,为促进中国神经网络领域的发展出力。2005年中国神经网络学会在总结其十五年历程时,向为该领域在中国之发展做出贡献者,颁发了三个奖,一是给国内学者的贡献奖, 罗沛林院士、吴佑寿院士获奖;二是一个给外国学者的友谊奖,日本神经网络领域头号大咖Amari教授获得;三是给境外华人的长期报效奖,由徐雷获得。

  面对如此丰硕的成果,徐雷却自谦道,“我只是在科技‘奥运会’的某个项目为中国拿过奖牌,只不过就像很多优秀的运动员一样,只能在很短一段历史时间里做冠军。”实际上,徐雷的领军时间并不短暂,从90年代初之后的一、二十年里,徐雷一直是神经网络和模式识别等人工智能领域中,中国人的一个重要代表人物。

  人工智能将带来哪些行业机会?

  近年间,人工智能为多个传统行业赋能,如医疗、金融、安防等行业都受到了深刻的影响。哪些行业更能吃到人工智能的红利?下一个人工智能带来的增长点又将会出现在哪里?

  对此,徐雷概括,凡是涉及到视觉和语音的行业都可能被人工智能所改变。人类最主要的信息获取渠道是视觉和听觉,自2006年Hinton团队的工作以来,这一波人工智能的核心突破点正是让机器“耳聪目明”。

  以语音应用为例,由于人说话快、写字慢,很多原本需要人们耗费时间精力记录的工作可通过语音技术转成记录,如医生手术记录、打官司写诉状、填表等,都是人工智能可以发挥作用的场景。视觉方面,我国对场景监控的需求越来越大,相关行业未来仍有较大增长空间。不仅如此,人类智能中最主流的信息获取渠道就是视觉,70%左右的信息获取来自视觉,如果一个人从小就失明,长大后智能发展必然受损。人工智能也是同理,现在人工智能发展程度相当于达到了几岁的儿童就能达到的视觉和听觉能力,在此基础上开发其他应用的空间是很大的。

  徐雷指出,要挖掘人工智能在视觉和语音相关领域的新应用,关键在于找到还未被一窝蜂涌入又有经济增长点的场景,这就是二次创新。

  尽管人工智能应用前景广阔,但在精密制造等领域,智能化进程并不如人们预期的那么快。徐雷认为,这是由于进入专业领域的人工智能人才过少,无论是来自高校的人才还是AI初创企业都很少选择精密制造业的缘故。这类领域需要从业者能够同时在人工智能领域和特定专业领域具备研究水平,从业者要进入相应领域的学习成本较高,这就导致大学老师和企业双方都没有强烈发展AI+制造的意愿。但一旦人工智能进入制造领域,必能发挥更大的作用。

  如今人工智能在医疗行业最重要的应用是医疗影像分析,也是中国有样本优势有望问鼎世界的领域。一来医院已积累了大量影像片子,便于机器学习训练;二来影像分析中人工智能的应用相对简单,只要识别、检索、分割和标记影像即可,需要用到的医学专业知识较少,因此人工智能可以顺利投入应用。而在医药开发这类需要更多专业知识的领域,人工智能与医疗的结合依然很难。懂医的不懂AI,懂AI的人不懂医,甚至双方想互懂的欲望都不大,应用自然落地维艰。徐雷认为,这与评价机制有关,学者研究新领域的时间成本高,发文章慢,又难以获得适当的评价,造成动力不足,这是AI与应用场景结合的关键难点。

  行业机会与地方政策息息相关。谈及上海人工智能产业的发展机会,徐雷对AI报道表示,从中国现状来看,人才最集中的地区是北京,但是上海政府是布局人工智能最积极的地方政府。

  一方面,从2018年起上海政府每年举办的世界人工智能大会WAIC,打造世界顶尖的智能合作交流平台和行业盛会。并在大会上颁发最高荣誉SAIL奖(Super AI Leader,即“卓越人工智能引领者奖”),打造AI行业的“诺贝尔奖”,激励全球范围内在技术上做出方向性突破、应用创新,正在或将要改变未来生活的人工智能项目。

  另一方面,在上海政府的优惠政策下,很多来自北京、深圳的人工智能企业来到上海发展,为上海带来了大量的人才。特别是上海经信委积极建设人工智能应用基地,并在一年内连续发布了二十多个人工智能试点应用场景作为各个领域的示范,动作是相对超前的。如果上海政府能够坚持推动下去,未来前景很可观。另外,上海研究人工智能的力量更具备可联合性,协同性较强。

640.webp.jpg

  2018年在上海举办的世界人工智能大会期间,多年未见的老朋友相见于黄浦江畔。从右边起依次是Alan L. Yuille、 张旭、徐雷、邓力。另外,左起是Michael I. Jordan和徐雷。

  双向智能应用初探

  谈及近两年的研究成果,徐雷介绍,近期他正在继续发展双向智能,即将形象思维抽象思维和认知结合到一起,并继续发展整体理论框架。前面提到,早在1991年提出的LMSER学习,就具备实现换脸功能的潜力,只是当时因算力所限没有实现。但在那篇论文中,已讨论和预言了多层LMSER的若干认知功能,如联想、概念形成、心像、注意等。最近徐雷的学生,对多层Lmser进行计算,不仅验证了早年的预言,而且发现比目前相近的自编码和U网,性能更优越,尤其是样本少、攻击强的情况下。

  推理是徐雷研究的又一方向。现在的知识图谱方法反映的是信息的相关性,不能揭示因果性。在借助人工智能进行问题推断时,找出因果关系是更有必要的。1987年时,徐雷就曾涉猎因果推理,最近在这方面又取得了较大进展。近年,中国全面启动了新一代人工智能重大科技项目。徐雷作为负责人,带领上海交大、清华、北大、浙大、电子科大、上科大和阿里巴巴七个单位组成的团队,成功申请下来最近公布的首批项目之一,就是要主攻这个方向,希望能够获得大的突破。

  此外,双向智能还能应用于许多类似AlphaGo的场景。在人工智能领域中,AlphaGo做到的事实际上被叫做启发式搜索和问题求解。现在很多人以为AlphaGo的成功关键在于蒙特卡洛树的前瞻性搜索,但徐雷表示,这并不是AlphaGo成功的关键要素,在1986-1988年间,中国学者在研究启发式搜索时就已提出过类似思路。真正的关键在于用深度学习网络来看到棋盘,犹如开了“天眼”,认清了状态并由此联想,做到三管齐下。

  徐雷总结称,下棋和做领导是类似的,都要做三件事。第一件,是要先试几步看一看,类似于邓小平做深圳特区先行探路。第二件,需要有仙人指路,指出这一盘棋能不能赢,赢面是多少,这类似于大智慧者老子出面提示,起到的是坚定信心的作用。第三件,需要孙子相助,告诉从业者具体有几种走法、走哪里是最好的策略,让从业者选择赢面最大的走法。下棋也好,解决任何一个问题也好,都需要三种人同时协同。AlphaGo之所以能赢,就是因为用深度学习网络开了天眼、认了棋盘,同时做了“老子”和“孙子”。

  而双向智能的关键就在于形象思维认知和抽象思维相结合,双向协同互补。过去只用抽象思维进行问题求解所遇到的困难,有望通过双向智能获得改进。

  一般认为,AlphaGo按最低使用率计算,能耗也高达3万瓦,是一个人脑的耗能一千倍。后来的AlphaGoZero 降到了其百分之十。我们希望运用双向智能的耗能明显小于AlphaGo,希望仅通过一个很小的机器就可以做到。徐雷强调:“关键是要追求单位能耗下的智能。”

  AlphaGo和AlphaGoZero由背靠Google的DeepMind公司研发而成,此外,世界上其他的巨无霸公司也先后投入了这场研究,如腾讯已推出围棋AI“绝艺”,日本、法国也各有自己的围棋AI。但徐雷认为,围棋AI不应只有拥有巨大资源的巨无霸公司能做,希望仅用普通的机器也可以与它们对弈。

  双向智能的另一优势是鲁棒性高。以刷脸应用为例,很多刷脸程序在应用时,框稍微动一下,用户的脸就识别不出了,双向智能方法有望改进这一困扰。

  徐雷解释道,通常的人工智能研究,要么单向地由外向内考虑识别认知,如现在大多数深度学习应用,要么单向地由内向外考虑思维与问题求解。而双向智能是两个方向同时考虑,认知抽象的部分被叫做阳,另一部分叫作阴,阴阳和谐进行。有趣的是,1981年诺贝尔奖获得者罗杰·斯佩里的发现,左右脑皮质区分为左右两边,一部分负责逻辑、分析,一部分负责认知,双向智能理论与这个人脑分工理论是相容的。

  沿着在1991年提出Lmser的路子发展,引入概率理论,结合上面的思路, 徐雷在1995年进一步发展提出了贝叶斯阴阳学习理论。尽管阴阳的概念源自中国,在西方面临接受度的问题,人工智能顶会NIPS在1995年会议还是接受了这个论文。它不但为许多现有统计学习主要模型提供了一个统一的框架,而且建立了一个易于计算的有限样本下学习的新理论,可在参数学习的过程中自动完成模型选择。上世纪末,麻省理工整理20世纪脑科学和神经网络重要贡献,出版经典汇集《脑理论和神经网络方法》时,贝叶斯阴阳学习理论也被收纳其中。

  AI新挑战无可回避

  人工智能蓬勃发展的同时,也带来了一系列新的挑战。

  伦理方面,面临最大争议的研究领域是“增强智能”,特斯拉CEO埃隆·马斯克正在研究的脑后插管就是一个代表性例子。“增强智能”旨在将人脑与机器直接连接,让人能够通过脑电波直接控制机器进行交流。这部分研究对残疾人是有意义的,但也提出了重大的伦理挑战:这一类人与机器的结合体是否依然能被称作人类?

  人工智能还可能带来更为直观的危险。比如,国外有人做出蝴蝶或蜻蜓大小的飞行器,携带着烈性炸药,通过人脸识别技术寻找特定对象并炸穿面部实施谋杀。目前,有3000多名人工智能从业者联合签名阻止上述研究,但以现有技术做出这类“杀手机器人”已不成问题。

  更重要的是,人工智能减少人的劳动,将导致失业问题。随着人工智能逐渐替代人的劳动岗位,用工成本渐低,未来财富很可能越来越集中到几个寡头手里,其他人却越来越贫穷。而人的本性决定,大资本家挣钱后不会拿出来与普通百姓共享。

  不过,失业问题并非完全无解。徐雷认为,人工智能不断改变人类的生活形态,将造就行业洗牌的机会,旧的行业倒下后,也可能洗出新的领域。核心问题在于如何创造出新的生活方式,在某个领域的从业者批量失业的同时,怎样让新的行业吸收倒下的行业。徐雷将该过程比作小孩搭积木,“现在有一些积木块,我们用它搭出一个世界;后来有一天,小孩玩这个积木玩烦了,希望搭出新的一堆积木,拆拆搭搭总有事干。”只是,人类的需求并非无限增长,因此新行业的创造存在极限。对此,徐雷寄希望于政府进行统一管理,强有力地从顶层解决最关键的分配问题,才有可能达到人工智能为劳动者减负而不导致失业潮的状态。

  最后,徐雷谈到了人工智能发展可能带来人类抽象思维能力下降的问题。现代计算机在西方智能高度抽象的基础上建立而成,在计算机替代人类完成很多抽象思维工作后,人类的相应能力就得不到锻炼。这意味着人类不只是工作在被替代,连思维能力也在被代劳的过程中逐步减退。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。