《电子技术应用》
您所在的位置:首页 > 模拟设计 > 业界动态 >   百度“小灵”首秀,AI为何能赚足眼球?

  百度“小灵”首秀,AI为何能赚足眼球?

2019-05-26
关键词: AI 3D AR

  今年是“五四运动”一百周年,中央广播电视总台举办了主题为“我们都是追梦人”的 2019《五月的鲜花》五四晚会,在这场晚会中,百度大脑arget="_blank">AI虚拟主持人“小灵”在众多高颜值主持人、演员中脱颖而出,赚足了观众们的眼球。

  眼前一亮美少女

  在很多的印象当中,机器人只是十分机械的机器与数据的结合,但是从鲜花通道中一出场的虚拟主持人“小灵”,就让人眼前一亮,得益于百度强大的3D建模技术和AR能力,化身成为立体3D的美少女,与尼格买提、王俊凯同台竞技。

  活泼灵动开口脆

  “小灵”并非是第一位人工智能主持人,可相比于不讨好的机器音,“小灵”的音色显得自然很多,让人听着有一种舒适感,原因在于百度在AI语音库的制作上花了很大的功夫。AI语音库制作的步骤大概是三步:第一先确定音色、风格、产品的特征,将文本变成音频;第二配音员根据需求试音,收集录音;第三步投入生产线,进行录音效果优化,丰富音色。百度大脑为此准备了几十个音库,找播音主持专业的学生专业录制了各式各样的声音,具备非常丰富的音色矩阵。

  表情唇动显自然

  除了声音信息外,唇动视觉同样非常重要。人的表情由面部肌肉和唇动共同组成,而人在不同的场合、心情的表情千差万别,可能有些时候我们都不能把一些表情进行正确的分类,但是“小灵”可以做到。百度基于“大量的面部特征数据”提供了唇动技术,百度称之为“国内首家三维”唇动“系数预测”,可以做到“自动将输入式音频直接生成唇形动画”。百度大脑在检测到人脸后,对人脸进行分析,对眼、耳、鼻嘴等150个关键点进行定位,识别出人的年龄、性别、表情等,然后基于这些面部特征,用深度学习的算法去学习归纳,学习人类的表情,使得表情更加丰富自然,便形成了我们看到的人工智能虚拟主持人“小灵”在晚会上能够“真实唇动”。

  过去AI虚拟人物在说话的时候嘴巴一张一合,说话与嘴巴不匹配也让人感到十分尴尬。百度大脑基于大量的面部特征数据,对说话人的唇动的行为特性进行了大量的研究,通过人工智能的深度学习,完成了国内首家“唇动”系数预测。截止到目前,市面上只有百度可以自动将输入式音频直接生成唇形动画。

  知识积累超丰富

  在晚会上,“小灵”会和观众打趣“如果掌声再热烈一点,我会有更出色的表现”。还有这样一个场景:谈及自己的“第一部动画片” ,主持人小尼想要分享《喜洋洋灰太狼》,“小灵”却打断他:“小尼哥,这是00后的童年回忆,属于你的应该是《黑猫警长》、《葫芦兄弟》。”

  “小灵”妙语连珠的口才、极佳的场控能力,不失为全场最精彩的地方。这个背后,需要实时互动与理解,更需要“知识”,而这与百度的人工智能算法和超过千亿级的知识图谱不无关系。

  百度知识图谱依托海量的日志数据、网页数据和行业数据,综合运用语义理解、知识挖掘、知识整合与补全等技术,提炼出高精度知识,并组织成图谱,进而基于知识图谱进行理解、推理和计算等,在此基础上,支持百度众多产品,并且拓展出广泛的应用场景。据悉,知识图谱已经助力DuerOS(对话式人工智能系统)实现10大类目超过100种能力,为智能音箱、智能电视等各类终端产品带来全面精准的人机交互问答能力。

  知识图谱还能根据已有知识进行推理。例如,根据“爆炸或者燃烧物质和装置不可以带上飞机”、“酒精是爆炸或者燃烧物质”这两个知识,推断酒精不可以带上飞机,当用户输入查询之后,将直接反馈推断结果。知识图谱的加持,实现用户与应用之间更智能的交互。

  人机交互AR

  在百度APP小灵AR界面上,诸如“北大红楼名字的由来”等五四主题内容,“小灵”都可以对答如流。在现场以及百度APP“五四青年节”搜索结果页都能参与的“通过人脸识别来测是什么花”活动,观众还可以通过百度APP扫描二维码,让小灵直接出现在观众的手机屏幕上,实现实时互动,这都是依托于百度AR Lab(百度增强现实实验室)。百度AR在今年的开发者大会上推出了DuMix AR 3.0,在MVP部分定义场景,然后对内容进行感知,根据不同要求进行呈现,对目标进行跟踪,最后通过人脸表情、肢体手势、语音等进行人机交互,然后运用平台工具对素材进行制作管理,完成上线,最后进入商业化运营。百度AR Lab的业务已广泛覆盖营销、娱乐、教育、文化等各个领域。

  不得不说,“小灵”在晚会上机智又专业的首秀可谓圈粉无数。而这一切,都离不开百度大脑的多项AI技术的强大支撑。截至目前,百度大脑AI开放平台开放了171项技术能力,涉及智能城市、智慧教育、无人驾驶等众多领域。

  说到AI开放平台,自然少不了腾讯。近日,2019“AI Everything Summit”峰会在迪拜国际贸易中心召开,腾讯集团高级执行副总裁刘胜义代表腾讯出席峰会并发表主题演讲,提出“AI向善”的发展观,他指出,在人工智能的时代,“人”更为重要,“AI向善”将帮助人类提升生活品质,为社会发展创造新的可能。腾讯持续探索将人工智能技术应用于寻回走失人员,打造“会寻人的AI”;在医疗健康领域,腾讯致力于打造“会救命的AI”;并且投身于“AI+农业”的应用探索,在食物、能源和水资源等问题上提供创新解决思路。

  不管应用的领域如何,各家企业都是以“人”为出发点,从自身的基因出发寻找合适的切入点,利用AI帮助人类提升生活品质,提出行业解决方案。相信百度和腾讯也会大胆尝试,探索更多可能。


本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。