扎克伯格实现今年“小目标”:成功打造AI语音助手J.A.R.V.I.S.
2016-12-22
Facebook CEO扎克伯格(Mark Zuckerberg)在今年年初立下个人目标,计划打造人工智能(AI)语音助手“贾维斯”(J.A.R.V.I.S.),原本预计会在 9 月公开成果,却迟迟没有消息,如今扎克伯格总算赶在 2017 年到来前,告诉大家他已成功打造出贾维斯系统,并发布长文分享贾维斯的建造过程与心得。
为了让 AI 助手具备学习与识别能力,扎克伯格为贾维斯采用多项人工智能技术,包括自然语言处理(Natural Language Processing)、语音与脸部辨识、增强式学习(reinforcement learning),其系统程序则以 Python、PHP 及 Objective-C 等语言编写。平常只要透过手机或电脑便能跟贾维斯“说话”,进一步操控家电设备、保全系统,调节室内灯光与空调,播放音乐等。
串联家中所有设备
不过在打造 AI 助手之前,必须先解决家中设备连网的问题。扎克伯格在文章里提到,家中设备的语言和协定各有不同,加上仍有许多设备未有连网功能,因此若要透过 AI 助手操控家中所有设备,就必须让所有设备都连上网。他也建议厂商应开发通用的应用程序界面(API)及标准,好让各设备间能够互相链接通讯。
理解自然语言
扎克伯格又以循序渐进的方式,让贾维斯理解人类的文字和语音指令。一开始先让贾维斯了解简单词汇如“房间”、“灯”、“打开”等做为指令关键字,再教贾维斯学习更多同义词、新词汇及概念,使贾维斯准确执行不同人所发出的指令。扎克伯格表示,就算他和妻子 Priscilla 下了差不多的指令,也不见得两人需求相同,好比说同样的指令但没有指明房间位置,扎克伯格所指的可能是办公室,Priscilla 可能指的是某个房间,因此要AI助手得学习分辨个中差异。
而音乐在自然语言认知上,则是更有趣却也更复杂,毕竟单靠关键字无法一下掌握众多歌手、歌曲及专辑,但经过不断“沟通”调整后,贾维斯能够分辨差异,并根据每个人听音乐的喜好与模式推荐歌曲。扎克伯格认为,当 AI 助手懂得愈多语意脉络,愈能处理各种开放式、非特定而惯用的指令,而贾维斯也在这样的“训练”下,表现愈来愈进步。
具备视觉与脸部辨识功能
为了让贾维斯拥有视觉与脸部辨识能力,扎克伯格在家门口设备数台摄影机,让贾维斯能以多个角度取得访客样貌长相,并透过脸部辨识技术加以识别访客身份。一旦确认对方身份是预期到访的客人,贾维斯就会让对方进门,同时知会扎克伯格。
除此之外,视觉与脸部辨识功能还能应用在许多方面,例如掌握女儿 Max 的动态,或是侦测每个人的所在位置,借以判断应在哪个房间、哪个位置执行指令。
沟通靠文字和语音信息、声控功能
扎克伯格运用自家 Messenger 架构打造聊天机器人平台,以便随时随地透过手机传送文字或语音信息跟贾维斯沟通;贾维斯也会利用平台提醒扎克伯格待办事项,或传送访客影像给扎克伯格,告诉他哪位客人来访等等。
扎克伯格跟贾维斯沟通的方式以文字信息居多,连他自己也感到相当惊讶。他认为主要原因是文字信息的干扰性较低,也能等自己想看时再看,不受语音信息限制。这其实也符合 Messenger 和 Whatsapp 等通讯软件的使用者偏好,也就是惯用文字信息多于语音信息。扎克伯格表示,未来的 AI 产品不能只着重在语音声控,还必须具备文字信息界面。
当然,扎克伯格并不表示声控和语音辨识功能不重要。他为此还开发出声控专用 app,载入手机之后便能直接以语音操控贾维斯。
持续改良贾维斯,配音人选将揭晓
这一年来,扎克伯格利用闲暇时间打造贾维斯,总共耗时约 100 小时。他认为透过这次挑战所学习到的事物远远超出预期,对自家工程师所使用的内部技术也更有概念。扎克伯格对于 Facebook 程序码数据库及各种内部工具感到相当满意,也因为这些资源,为开发贾维斯节省了不少时间。
虽然目前已成功打造出贾维斯,扎克伯格坦言还是有许多地方有待改善,接下来会想办法教贾维斯自行学习新技能,而不是教他执行特定任务。
扎克伯格未透露贾维斯配音人选,仅表示即将揭晓
扎克伯格即将在明年初分享新年新挑战,至于先前网友们热烈讨论的贾维斯配音人选问题,他则是卖关子表示,贾维斯的“真声”即将会在接下来发布的影片中揭晓。
钢铁侠扮演者罗伯特·唐尼(Robert Downey)曾经表示愿意在特定情况下为贾维斯配音。但扎克伯格还是将决定权交给公众。他的Facebook帖子共收到5万多条评论,根据大众的投票,贾维斯很有可能使用美国影星摩根·弗里曼(Morgan Freeman)的声音。
扎克伯格表示,他给弗里曼打电话说:“嘿,我发了这样一个帖子,有好几千人想让你来配音。你愿意吗?”弗里德曼回答道:“当然愿意。”
摩根·弗里曼曾在电影《冒牌天神》中饰演上帝