人工智能领域,机器学习的难度在哪?
2018-07-27
人工智能是一门交叉学科,从被提出到现在也有六十多年的历史,目前仍处在AI初级阶段。之所以发展缓慢的一个重要原因是人工智能的技术难度很高,它涉及计算机、心理学、哲学等,对从业者要求很高,目前国内从事AI行业的工程师很多是硕士或以上学位。
人工智能技术可应用于安防、医疗、家居、交通、智慧城市等各行各业,其前景是毋庸置疑的,未来绝对是一个万亿级市场。根据应用领域的不同,人工智能研究的技术也不尽相同,目前以机器学习、计算机视觉等成为热门的AI技术方向,本文以机器学习为例,通过分析其关键技术与当前面临的难点,一起探索人工智能的发展与未来。
机器学习是人工智能的核心
机器学习也被称为人工智能的核心,它主要是研究计算机怎样模拟或实现人类的学习行为以获取新的知识或技能,帮助计算机重新组织已有知识结构使之不断改善自身的性能。
被称作人工智能的核心,机器学习为什么这么难于研究?
机器学习是人工智能研究的一个分支,人们对机器学习的研究也有很多年了。它的发展过程大体上可分为几个时期,第一是在20世纪50年代中叶到60年代中叶,属于热烈时期;第二是在20世纪60年代中叶至70年代中叶,被称为机器学习的冷静时期;第三是从20世纪70年代中叶至80年代中叶,称为复兴时期;第四阶段的机器学习开始于1986年,目前我们仍处在这个时期。
现在很多应用领域都可以看到机器学习的身影,如数据挖掘、自然语言处理、生物特征识别、搜索引擎、医学诊断、证券、游戏、机器人等。
学习是一项非常复杂的过程,学习与推理分不开,按照学习中使用推理的多少,机器学习所采用的策略可分为四种:机械学习、传授学习、类比学习和通过事例学习。学习中所用的推理越多,说明系统的能力越强。
机器学习的难度在哪?
对于机器学习的开发者而言,除了需要对数学知识掌握得非常熟练之外,选择什么工具也很重要。一方面,机器学习的研究需要创新、实验和坚持,很多人半途而废;另一方面,如何将机器学习模型应用到实际工作中也有难度。
除了工程师因素,机器学习的系统设计也有难度。影响学习系统设计的最重要的因素是环境向系统提供的信息,信息质量直接影响系统性能,知识库里存放的是指导执行部分动作的一般原则,但环境向学习系统提供的信息却是各种各样的。
如果信息质量高,与一般原则的差别比较小,则机器学习比较容易处理。如果向学习系统提供的是无规律的指令信息,则学习系统需要在获得足够数据之后,删除不必要的细节,总结后才能形成指导动作,并放入知识库;这样机器学习的任务就比较繁重,设计起来也较为困难。
被称作人工智能的核心,机器学习为什么这么难于研究?
对于机器学习而言,还有一个技术难度就是机器学习的调试很复杂,如在进行常规软件设计时,编写的问题不能按预期工作,可能是算法和实现出现问题;但在机器学习里面,实际的模型和数据是两个关键因素,这两个的随机性非常强,调试难度倍增。除了复杂性,机器学习的调试周期一般都很长,因为机器得到指令进行实施修正和改变通常需要十几个小时甚至几天。
谷歌是机器学习的推动者
提到机器学习,就不得不提到谷歌,2017年,它展示了聚焦人工智能的名为张量处理单元(TPU)的芯片,这是一款谷歌打造的处理器,是专为机器学习量身定做的。
TPU的特点是执行每个操作所需的晶体管数量更少,自然效率更高,据谷歌介绍,TPU与同期的CPU和GPU相比,可以提供15-30倍的性能提升及30-80倍的效率提升。谷歌表示,它们专门为这款TPU设计了MXU作为矩阵处理器,可以在单个时钟周期内处理数十万次运算。谷歌提到,TPU的核心是脉动阵列,MXU有着与传统CPU、GPU截然不同的架构,称为脉动阵列;“脉动”名字的来源是因为在这种结构中,数据一波一波地流过芯片,与心脏跳动供血的方式类似。
机器学习技术助力人工智能
被称作人工智能的核心,机器学习为什么这么难于研究?
机器学习被提出来也有一段时间了,但是发展并不是非常快速,其中有自身的技术难度等原因。目前尽管机器学习面临着很多技术问题去解决,但人工智能的发展和突破是绕不开它的,以谷歌为代表的企业为行业树立了一个榜样,笔者相信未来会有更多的企业加入到机器学习的研究之中,去推动机器学习,助力人工智能。