基于微机电(MEMS)技术的3D手势辨识技术正大幅扩展其在智慧手机和电视遥控器领域的应用,而不再仅限于最初的儿童游戏了。
今年可说是3D手势辨识技术突破传统在一般游戏应用框架的一年。从最初作为任天堂(Nintendo) Wii的无线游戏介面首次出现在消费市场后,历经数年的发展,基于MEMS 感测器的手势辨识技术已将触角延伸到了智慧手机,并准备抢占最具有象征性的消费者介面:电视遥控器。
自从Wii于2006年问世后,任天堂公司的竞争对手们都纷纷开发出各自的3D手势辨识和处理技术。Sony公司专为追逐高精确度控制的游戏玩家们开发出Move Playstation所用的动态控制器;微软(Microsoft)则以Xbox Kinect实现游戏介面的免持功能。
苹果(Apple)率先利用MEMS感测器的潜能,成功地打造出更直观的智慧手机介面,并于2007年在iPhone中增加了MEMS加速度计,2010年又增加了MEMS 陀螺仪。苹果公司的竞争对手们紧随其后,很快地,各种3D指令(如以摇动表示取消、提起表示接听,以及反转手机表示断线)将成为标准的智慧手机功能。
而今,消费OEM们正为其产品线中增加3D手势辨识功能。有些公司使用GestureTek公司的相机技术授权,其它公司则取得Hillcrest Laboratories公司或Movea公司的MEMS技术授权。Movea公司拥有250多项相关专利,涵盖像使用陀螺仪控制游标之类的技术;Hillcrest公司拥有100多项专利,包括使用加速度计和陀螺仪以追踪动作的专利。这两家公司都为3D手势设计者提供了加值的软体开发工具──分别是Movea公司的Gesture Builder和Hillcrest公司的Freespace MotionStudio。
谷歌(Google)方面则是在代号为'姜饼'(Gingerbread)的Android作业系统中增加了基于MEMS的手势辨识应用程式介面,以便能够辨识诸如倾斜、旋转、插入和切削等动作。
“动作处理终将受到主流消费者的广泛接受,”InvenSense公司创始人Steve Nasiri表示,“我们预测用于动作处理和手势辨识的硬体将像会变得像照相机模组一样,广泛地应用在智慧手机中。”InvenSense公司是首家在单一晶片上整合加速度计和陀螺仪的MEMS晶片制造商。
InvenSense在其陀螺仪以及加速度计/陀螺仪整合晶片中嵌入一个动作处理器,以执行辨识用户手势时必要的复杂感测器融合演算法,同时减轻应用处理器的任务负载。InvenSense公司计划明年将在单一晶片上整合加速度计、陀螺仪和磁力计(电子罗盘)。
在国际消费电子展(CES)上,InvenSense公司的动作处理资料库首次出现于电视遥控器和智慧手机中──使电视遥控器可控制3D手势辨识,并以智慧手机实现基本电话功能(如只需将手机拿起来靠近耳朵就能接听电话)。这两种产品都是LG Electronics公司的产品──Magic Motion遥控器用于LG Infinia系列3D电视机;而LG公司新款仅9.2mm宽的Optimus Black智慧手机据称是全球最薄的智慧手机,可辨识多种独特的手势指令。
其它MEMS晶片制造商同样将手势辨识演算法整合于其加速度计与陀螺仪产品中。例如,Kionix公司提供数十种内建手势辨识演算法的产品系列,该公司的Gesture Designer软体开发套件也能协助OEM设计出客制化的手势控制效果。
“电视遥控器公司们正在努力将手势辨识技术整合于其产品中,这需要利用非常先进复杂的动作控制技术。”Kionix公司CEO Greg Galvin指出,“其精华是将视听输入功能融合于电视机中,让用户可透过一个遥控器切换频道、下载音乐、欣赏照片集或图库、进行文字处理或浏览网际网路。”
在IPTV上执行应用程式和浏览网路内容时,遥控器必须具备像滑鼠一样的精确度,才能实现点选和基于手势的控制功能。“这些应用确实需要利用MEMS技术。”Galvin表示。
智慧电视元年
Hillcrest公司创始人兼CEO Dan Simpkins认为,2011年是'智慧电视元年',并补充道,“50多年来,电视市场终于首次迎来了一种全新的输入技术。”Hillcrest公司开发出一种空中滑鼠──Loop指向器,专门针对那些想要将电脑与电视机连接起来的消费者而设计;同时,该公司并为IPTV开发出一款Kylo浏览器。
LG公司在CES上展示的Magic Motion遥控器使用的是Hillcrest公司的Freespace手势辨识技术,可让助用户透过复杂的点选萤幕介面浏览网路和传统电视内容。
其它竞争技术还包括飞利浦(Philips)公司的uWand。飞利浦的掌上型控制器选用整合式红外线摄影机检测电视机发出的红外光,无需采用陀螺仪就能实现精确的动作追踪。但大多数其它IPTV遥控器使用的是MEMS陀螺仪。
例如,Movea公司在CES上宣布,台湾笔记型电脑键盘供应商精元电脑(Sunrex)公司今年稍晚即将推出的控制器产品中,将会使用Movea公司基于MEMS的MotionIC平台以及SmartMotion技术,以实现3D手势辨识。
“下一代动作遥控器将能辨识所有种类的新手势。”Movea公司全球行销经理Dave Rothenberg表示,“例如,父母透过在空中挥动签名手势,即可解锁电视中的成人内容,而当小孩走进房内时再以相同的动作来启动监护控制功能。”
同时,微软公司的Kinect控制器也为传统智慧带来了挑战。这款内建MEMS加速度计的Kinect控制器可置于设备头端,使用户的手得以完全摆脱手势感测硬体。微软根据由GestureTek公司所授权而来光学辨识技术,为Kinect开发了专有的3D辨识演算法。
Kinect控制器为特定游戏(如虚拟排球)界定严格的动作范围,并进行分类。该技术以雷射将一组规则的红外线点阵投射到玩家身上,而对所投射的影像进行分段,然后测量每个点的反射强度。强度较低的反射点被设定为来自于背景反射,而较强的反射点则被设定为从前景中的用户身上反射而来。然后,Kinect再为用户的动作进行最佳推测分析,以驱动游戏中的化身进行反应与动作。Kionix公司的MEMS加速度计则有助于使摄影镜头能更精确地对准用户。
根据业界分析师们表示,这种技术牺牲了一定的精确度,以利于用户的行动性。“我认为微软公司基于摄影机的辨识系统所具备的精确度仍不足以满足众多游戏玩家的要求,这可能导致他们仍然宁可继续使用手持控制器,从而让Sony的Move成为游戏玩家的更佳选择。 ”iSuppli公司资深分析师Jeremie Bouchaud指出。
“微软解决方案适合其所针对的用户:例如想要快速进入和离开游戏、以及希望拥有方便且即时体验的家庭。”IHS Screen Digest公司游戏负责人Piers Harding-Rolls表示。“另一方面,Sony的Move是一种混合解决方案,不但以感测器追踪动作,也使用摄影机追踪位置。在目前这个阶段中,Sony的论点是为游戏玩家提供更精确的感测器技术。 ”
像Kinect控制器这类以摄影机为基础的技术,“并不是手势辨识的终结者。它有一定的存在空间,但加速度计/陀螺仪组合也有自己的市场空间。”Gartner公司分析师Jim Tully认为。
“例如,Kinect摄影机镜头无法在多用户场合中检测一连串复杂的动作,特别是当某一位用户被另一位用户挡住,以及当用户背对着摄影机镜头时的效果都不好……这些时候就需要多部摄影机,然而,这在大多数情况下又不见得可行。”
透过观察不断变化中的摄影影像,GestureTeck公司的技术已经追踪了数百万部手机的3D动作。该公司并因此宣称,这一光学手势辨识技术最终将战胜基于MEMS的设备。
“至今,光学手势辨识技术的解析度和精确度仍无法达到像使用MEMS惯性感测器时的效果,但对于大多数游戏来说已经足够了。”GestureTek公司共同创办人兼总裁Vincent John Vincent指出,“同时,随着摄影机镜头解析度的不断提升,我们深信光学手势辨识将具有更精确的解析度,让设备得以追踪身体每部分的动作,最终还将超越MEMS技术。”
手势辨识领域中的'凯迪拉克'
就像游戏玩家十分看重精确度一样,游戏本身的重要性也不如游戏的开发或特效电影动画一般。对于动画达人来说,手势辨识领域中的'凯迪拉克'就是Xsens Technologies公司以MEMS元件镶嵌打造的紧身衣裤。这种套装上的加速度计和陀螺仪可实现即时的动画序列预览。
Xsens公司利用美商亚德诺(ADI)公司的高精度三轴加速度计、陀螺仪和磁力计,开发出精细的动态追踪。例如,有些专业设计者利用Xsens技术为电影'钢铁人2'(Iron Man 2)和PS3游戏'杀戮地带2'(KillZone 2)开发动画效果。这种技术提供的动作撷取解决方案可应用于任何场合,而无需复杂的基础设施。Xsens公司预测,这种技术最终将能使消费应用降低成本,实现类似Kinect的体验,但提供较其更高的精确度,玩家人数多少也不受限制。
“微软Kinect是一种优质的解决方案,因为它不需要在人体上安装任何感测器,不过,这也使其速度较慢,有时在追踪人类动作姿势方面显得比较迟缓。”Xsens公司CEO Casper Peeters表示,“我们的技术应用场合方面则灵活得多,它在追踪穿戴者的细致动作中可以达到更高的精确度。但基于动作的游戏控制器和电话介面才刚开始出现。Xsens公司期望朝另一方面发展,针对细致的人物动画实现高阶动态撷取,并为未来催生更多有趣的应用。”
微软也将目光瞄准了未来,计划充分利用该公司分别于2009年和2010年收购3-DV和Canesta公司时所取得的3D追踪技术。这些公司在时差测距(TOF)手势辨识专利方面实际上已垄断了市场,特别是对行动设备而言。
时差测距感测器所测量的是红外线从物体反射回来到达某个特定CMOS感测器的时间,从而实现可在任何光照条件下任意距离的高精确度3D深度映射。时差测距深度映射技术还能与微软获GestureTek授权开发的3D摄影机手势辨识演算法完美地结合起来。
德国TriDiCam和其他几家公司声称也拥有时差测距感测器技术。但至今只有Canesta公司证实了这个概念,可以使用一个CMOS影像感测器作出在行动设备上方仅数英吋处挥手的精确3D影像映射,即使在室外明亮的阳光下使用也没问题。
同时,像Silicon Labs等公司则利用低成本的红外线和环境光感测器,以辨识特殊应用手势,例如以手指在空中划一条线来启动显示器或调整音量。
Surface的变化
微软在CES上展示了下一代Surface多点触控平台。这种平台不再使用第一代产品中的5架摄影机建置,实现了一种可垂直安装的更轻薄设备。
这种Surface平台让用户能直接操作显示在萤幕上的物体,并内建演算法来解读各种手势,如选择、拖拉、放下、单指缩放(pinch-to-zoom)和其它类似触控萤幕的指令(OEM还可开发自建演算法)。该新版本“厚度仅4英吋,能以水平、垂直或任何角度进行安装。”微软公司Surface开发团队总经理Brad Carpenter指出。
Surface平台的关键在于微软与三星LCD部门共同开发的PixelSense技术。该技术针对交错式棋盘图案的可见光或红外光,为其中的每个LCD画素都加入一个光感测器。在背光中的可见光和红外光发射器让每个对应画素能侦测到从使用者双手或其它物体反射的光线,再以60f/s的速度采样感测器,即可同时追踪多位用户的动作,使用者数量仅受限于萤幕可用的表面积空间大小。内建的FPGA支援定位追踪,并能读取在萤幕表面上放置物体上的特殊应用标签,再透过红外线传输方式将资料传送到配备摄影机的Windows 7智慧手机上。
在应用程式方面,Surface平台包括支援Windows 7的超微(AMD) Athlon X2 245e 2.9GHz双核心处理器,以及一个与其搭配的AMD Radeon HD 6750绘图处理器。
三星公司还将采用此技术推出型号为SUR40的显示器,“这种40英吋的萤幕将由三星的LCD部门以7,600美元的价格销售至全球市场。”微软公司的Carpenter透露。
图说:苹果用户们非常熟悉2D手势控制,包括像单指缩放等指令都已经被电脑和智慧手机领域的竞争对手们复制。
图说:穿戴着Xsens公司MVN Motion Capture弹性纤维紧身衣的演员(中)──这件莱卡材质的紧身衣镶嵌着ADI公司的MEMS惯性感测器。他模拟美国惊奇漫画(Marvel Comics)公司'钢铁人'漫画插图中的人物姿态(左),以作为派拉蒙电影(Paramount Picture)公司创作“钢铁人2”(右)电影动画的基础。
资料来源:Marvel、Xsens、Paramount
图说:飞利浦公司的uWand技术针对与配备MEMS控制器相同的应用,但不使用MEMS元件。相反地,它整合了一个红外线摄影机以侦测来自电视的红外光,因此不用陀螺仪就能实现动作追踪。
资料来源:飞利浦
(红外线光束,红外线感测器,游标+按键透过RF到接收器)
图说:在OEM演算法的支援下,微软Surface平台可读取'挥手'动作。重新设计过的萤幕面板还可挂在墙上。
图说:微软的Xbox Kinect以PrimeSense参考设计为基础,使用两个CMOS成像器(一个用于红外光,一个用于可见光)侦测3D深度,使系统能够轻松区别房间内的游戏玩家和背景物体。