face++ 人工智能引爆人脸识别新革命
2016-08-23
驱雷策电驭水火,碎裂大地分全球。在技术的发展历程中,技术与人的关系不断发生演变。在技术处于机器的时代中,人虽然生产了机器,但也仅仅能俯瞰机器。随着技术与市场的推进,人机之间的关系逐渐得到改善。未来伴随着生物工程、人工智能和会聚技术的发展,人类与技术的距离将越来越近。
尤其在中国这个特殊的国度,拥有着网民最多、移动互联网应用最为发达、语言最为复杂的环境,人工智能迎来了独立发展的最佳时机。在这样的背景下,近年来市场中不断涌现出以人工智能为发展定位的新兴企业,而这些企业的领军人往往以80后、90后居多。
旷视科技有限公司商务总监宋晨
曾经有人这么说过,所有的模型都能计算,但是唯一不能被计算的就是年轻的互联网创业者的潜力,这些年轻企业的生命力、创造力让大众眼前一亮,而旷视科技有限公司(以下简称“旷视科技”)便是这群年轻生力军中的佼佼者,以机器视觉与人工智能为核心,在短短的四年内,成为全球领先的人脸识别及深度学习技术服务的领跑者。
“先让机器看懂世界,再让机器真正思考”是旷视科技成立的初衷,随着近四年的探索,以技术为驱动,目前旷视科技已经真正地将人脸识别技术进行商业化,从支付宝到平安信贷,再到近期的杭州G20峰会,让全社会兴起一股“刷脸”的热潮。
旷视科技公司一角
人工智能“看得见”的未来
人工智能涵盖范围较广,机器视觉作为其核心技术,已经在虚拟现实、无人驾驶汽车、机器人、智慧城市以及物联网中看到它的成功应用。机器视觉,简单地理解便是利用机器代替人眼进行测量与判断。
自2010年伊始,中国机器视觉市场进入快速发展的轨道,经过4-5年的孕育及积累,电子制造、市政交通、汽车、食品等众多行业的需求带动着该市场的增长,其也被视为未来的蓝海。在安防领域,围绕着机器视觉,已经有不少厂商正在发力金融、地产、安防、机器人、智能汽车等领域。在此趋势下,旷视科技将人脸识别的技术优势进行商业化,向着人工智能大步迈进,目前已经在金融、商业楼宇、安防等领域初露锋芒。
旷视科技前台
近几年来,人脸识别技术早已经不是让人望而止步的高深技术,在各类手机应用、公司考勤、银行业务中随处可见,彻底改变了传统的生活习惯、业务办理方式,让生活更加的便捷及科技化。但相比这些,人脸识别发展的历程却鲜为人知,旷视科技有限公司商务总监宋晨认为,从技术的诞生到目前的商业化应用,其实已经走过至少四个阶段。
“第一阶段是在2011年前后,人脸识别公司更多强调的是自身算法的排名,标榜的是自身算法的层级,但却忽视了算法结果是在实验室场景下产生的,距离真正的应用和产品化仍然有段距离;第二阶段的特征是围绕软件,通过打包软件或者SDK让用户能实现人脸识别功能,但缺陷在于仅仅提供了软件和算法,却没有告知用户具体的适应场景(识别距离、光线问题等),软件与用户业务逻辑上的结合度较低;第三个阶段是既提高算法和软件也提供单一的产品,例如刷脸门禁产品,也实现了在非配合的情况下的精准识别,但由于一个简单的识别功能,未能给用户的业务逻辑带来更多的帮助,所以其使用很受限制;第四个阶段便是端到端整体的人工智能解决方案,例如在企业、楼宇、园区的行业解决方案中,从访客刷脸注册开始,系统便将信息推送给拜访对象,访客在无需任何他人帮助下便能刷脸通过闸机通道,梯控也会自动设定到指定楼层,通过楼层的电子指引,到达拜访地点,迎宾的前台便会工作,一整套的端到端的人脸识别的逻辑,大大减少人力投入,让访客拜访更加便捷。厂商在这个阶段不仅需要提供标准软件层级的支持(标准API接口调用),而且还掌握接口的调取实现的具体效果,减少后期的开发工作。”宋晨分析。
虽然这四个阶段的趋势已经非常明显,但如果从一些企业的宣传文案上来看,目前一些公司仍停留在算法阶段,更多的聚焦在一到三阶段。“如果仅仅停留在早期的阶段,则无法形成行业或者生态的平台效应,旷视科技在2011年成立公司之后,一直聚焦人脸识别技术,目前已经拥有了较深的技术积累,并把目光聚焦在三与四的阶段,为用户在端到端的方案中提供标准性的接口。”
从技术角度上看,人脸识别准确率已经超过了人眼的水平,据悉,目前在金融、安防等领域已经在拟定相关的行业标准,未来更多的规模化应用及生态建设将不断成熟。
旷视科技公司一角
三箭齐发技术转化商业价值
人脸识别在商业领域的运用,其实并不是近几年的事。早在许多年前,国外众多优秀的厂商早以自身的技术优势跻身行业,形成自身的生态链。初生之犊不惧虎,旷视科技对此并没有畏惧,他们相信技术的壁垒会随着科技的发展不断消失,而用户将逐步成熟,重视服务的性价比,而这便是他们与国外厂商最大的竞争优势。“在华为进军通讯行业之前,国外厂商的供应链、生产、客户,海外大厂已经形成了一套完整的方法论和客户壁垒,市场犹如‘死海’,为什么华为能够成功地打入呢?一方面是华为不断缩短与国外厂商的技术差距,另一方面,华为重视服务的性价比,提供吻合客户需求的服务,用户无需过多为超出需求范围的内容埋单。”宋晨解释。他表示,旷视也将秉持自身的观念,坚持性价比,重视客户实际需求,不让超额的服务成为用户的累赘。
旷视科技公司一角
“人工智能技术要转化为生产力和商业价值,必须依附于不同的行业与产品之中,形成数据、技术、产品不断循环的滚雪式闭环。”宋晨说。目前整个人脸识别行业中,虽然每家企业宣称的不太一致,但如果从本质上而言,大致可以分为以下三个重要的领域。
其一,泛金融领域,强调的是人证的核身。随着互联网技术的发展,互联网金融不断兴起,诸如支付宝等金融机构并没有传统金融机构的线下营业厅,为了保证远程开户人员信息的准确性,过往传统的机构采取的是网络视频的方式,虽然通过人工远程视频通话可以解决问题,但其投入的人工成本也较高,随着互联网金融用户的增加,仅仅依靠人力并不是良性发展的现象。例如旷视的合作伙伴南京银行,便将人脸识别技术用于手机银行、信用卡、柜面网点、以及发卡机等业务流程中。据南京银行相关负责人表示,当客户无法亲临柜面或者没有带身份证件时完全可以通过移动终端或智能机具进行身份验证,先进的人脸识别技术可以在几秒之内完成客户的身份验证,相比人工肉眼识别更精准高效。
其二,泛商业领域,根据商业应用场景的不同,人脸识别为用户提供不同的服务:智能企业核心是访客的权限管理,例如通过人脸识别结合传统的门禁、考勤、访客注册等,形成高效便捷的生态环境;智能小区强调的则是通过非接触式(非侵犯式的)人脸识别,围绕业主营造门禁、迎宾、物业通知(水电费通知、车库信息等)等更加友好自然的生活体验;在消费场景中,大型连锁店用户为了更好地识别VIP客户,获取更精准的数据分析(消费者行为、年龄性别、VIP客户识别等),人脸识别技术让线下实体商家能像电商一样掌握每个节点的数据,提升自身销售转化率。
为了让笔者更详细的了解实际情况,宋晨分别举出案例来分享,在不久前,某全国性股份制商业银行引用了旷视科技(Face++)的配合式人脸识别智能管理系统,实现了无卡考勤、迎宾系统、门禁等应用,员工可通过人脸识别,进出公司。银行采用的方案是针对白名单的比对和识别,这种方式主要应用于包括银行、机房、财务室,甚至工地等具有较高安保要求的场所。除此之外,此解决方案还可以为客户提供陌生人提醒功能。也就是说,当白名单之外的人来申请授权的时候,管理员会收到相应提醒,针对以往‘蹭卡进门’的不安全事件将会得以有效控制,以此提升安全等级。而在商超行业中,用户画像一直是商家的痛点,旷视科技已与某国际连锁快餐品牌展开深度合作,为该店提供客流分析和VIP识别服务。为线下客群进行实时标注,包括性别、年龄、身高等特征信息。而这种对于用户信息画像的数据服务,已经从零售行业最先迸发出来。
其三,泛安防领域,人脸识别技术运用较多的是在与行政机关以及公安部对接的智慧城市项目中。其主要结合公安部的嫌犯的黑名单,在公共交通的出入口处,部署摄像头,通过摄像头抓拍人像,从而进行比对,快速锁定犯罪嫌疑人。
“围绕着三个领域的生态链建设,覆盖人的工作环境、生活环境、消费场景的生活状态,打通这三者的数据链条之后,便会有征信、精准营销的业务,为更多用户提供咨询及服务,这便是公司的最终的战略目标——成为一间真正的数据运营公司。”宋晨说。
除了依靠自身在行业战略中部署外,旷视科技也在寻找合适的合作伙伴,形成更好的物理层级、产品层级、应用逻辑层级的开放生态环境和平台。“如果需要把每个行业都做得同样深与透,这对企业而言无形中是巨大的挑战,所以我们希望能找到行业内有标杆和旗帜影响力的企业,能共同满足用户更深层次的需求。”宋晨透露。
产业生态链的健康发展本是如此,旷视科技通过开放的平台,将更多的感应器件接入进来,通过结构化的数据支撑上层应用和业务逻辑,充分发挥出自己的所长,也让更多的合作伙伴受惠。“我们的合作伙伴主要有以下三类:一为具有客户资源但没有开发能力(交付能力)的,合作主要集中在销售渠道的建设,通过旷视科技的产品以及技术平台,其利用原有客户资源形成销售网络;二为没有客户资源,但拥有系统集成能力的,可以将我们的核心技术集成到他们的系统方案之中,例如在学校行业方案中的考勤以及访客登记中加入人脸识别技术等,形成差异化优势;三为既有客户资源又有系统集成能力(交付能力),可以将旷视的核心技术和产品在自身的销售网络中去强化竞争力,形成联合品牌的生态产品,例如人脸识别闸机、机器人等,这些生态产品以双方的logo呈现,结合他们的行业优势和旷视的人工智能优势,快速建立起新的生态。”宋晨补充。[page]
软硬结合打造最佳的人脸识别体验
人脸识别技术已经发展多年,过去在静态识别技术日趋成熟,但在动态识别中发展较为平缓,市场并没有取得实质性的突破,主要应用也仅停留在静态的识别之中,但在2011年之后,国内动态识别技术如雨后春笋般发展开来,尤其在平安城市、智慧城市中,面对越来越复杂的环境,人脸识别的实战能力得到用户的一致认可。
众所周知,相比静态识别,动态识别中非配合与精准识别为其最大挑战,这不仅关系到用户的体验度,也是技术发展的难点。虽然目前识别率并不能达到100%正确,但随着数据的积累,识别率将不断朝着这一方向发展。“除了技术本身,前端硬件的挑战也是无需置疑的。人工智能下的人脸识别并不是在某个场景下抓拍部分人脸的特征,结合在另一个场景下抓拍的特征,拼在一起进行比对。而是通过在每秒25-30帧的动态识别中,关注人的变化,如果人在这过程中达到质量判断(机器判断是否有效的照片)的阈值,那系统便可以进行人脸判断和识别,如果没有达到,工作将继续与算法服务器进行比对。但如果因为摄像头的问题,这点在技术上是无法改变的。”宋晨补充,“针对这种情况,我们除了基于软件及算法的优化,加强质量判断的方式之外,也会基于硬件的优化(宽动态、逆光曝光调节等),让更多摄像头保持位置不变的前提下,改善动态识别的效果。”
虽然开放的平台和技术,在理论上赋予任何系统都不会存在问题,但如果本身硬件的性能限制,动态人脸识别的效果必然会大打折扣。宋晨提到,为了更好地搭配后端的算法处理器,旷视科技创造性地推出了模块化智能摄像机(MegviiC1),可以根据不同的场景更换不同的摄像头与算法处理器,形成最佳以及最具性价比的方案。“因为很多情况下,其他厂商的硬件与我们的软件的适配程度会出现一些问题,所以我们推出与算法处理器适配最好的摄像机。但我们对于其他品牌的态度是非常开放的,如果某个行业的合作伙伴,其硬件能够匹配到我们软件,我们也会积极地提供软件支持,形成不同的方案,覆盖到其他的行业中去。”
人工智能的未来:赋能+激活+创新
在过去的几十年里,人工智能还只是“存活”在好莱坞的科幻大片中,但自2014年谷歌以4亿美元收购人工智能创业公司DeepMind,到其旗下的机器人Alphago大战李世石并获取最终胜利开始,预示着人工智能的爆发已经成为了现实,它正不断走进我们的生活中来。
牛津大学相关专家称,在不久的将来,人工智能可能将占据美国近一半的就业机会,意味该领域未来潜在着巨大的商业价值。然而,更重要的是人工智能绝不仅仅是模仿人类从而取代人类,而是利用庞大的数据推算出比人类更好的判断,但目前市场关于人工智能定义不一,甚至一些产品及功能在严格意义上与智能丝毫不沾边,但也被冠以“人工智能”之名。
宋晨认为,目前依赖数据,是人工智能的一个重要因素,但人工智能绝不是简单的编程程序,而是更像一个不断学习的小孩,通过各种数据来提升训练引擎的精准度,形成自动判别的能力,当数据量足够大的时候,它什么都学得会,最终不再需要数据训练,能不断进行数据循环,为新的商业模式造血和营造应用场景。
简单地理解便是,人工智能通过数据来提升自身的算法和技术,先有数据产生,再有产品诞生,然后有客户使用,客户在使用之后又会产生新的数据,这些新数据又会优化产品,最终提升客户的体验,形成一个闭合循环的环状生态。
尽管海外人工智能的起步要比国内快,但因为这样的环状生态,中国市场产生的群体数据量是最大的,所以国内的厂商的加速度会比国外走得更快,而且数据的获得更加的容易和丰富,甚至在某些领域,国内的技术已经超越了国外。
宋晨强调,这正是人工智能的魅力——数据不仅能提升系统的精准度,而且还能产生新的商业价值。“例如企业拿到年龄及性别数据,不仅可以提升系统的判断,也能通过设计商业模式将数据进行营销,让数据赋上行业的属性。数据除了正向循环之外,环也会越来越多,根据功能(训练系统、商业体外循环等)能为企业带来更多的收益。”
“我们专注在人工智能的视觉模块,通过人脸识别技术赋予在传统的摄像头或者门禁产品上,形成完整的业务生态,而不是简单的单品或者概念。”宋晨说。万物互联,传统的物品被赋能、激活、创新,让传统场景、传统产品获得新的使命,这便是旷视科技眼中的人工智能。而现在前路已经浮现曙光,旷视科技也将向着初心一直走下去。