影像辨识正在改变你的生活!
2019-06-01
科技发展日新月异,科技结合图像处理的应用案例雨后春笋般地冒出,甚至融入我们的日常生活,使生活质量和效率大幅提升。本文就分享一些生活中的影像辨识应用,剖析计算机视觉与开放原始码的运用以及其带来的效益。
开源系统让影像辨识成真
人脑在进行影像辨识时,从眼睛接收图像,到大脑计算,这个过程共需经过七层关卡,其中包含影像亮度/色彩/边界的撷取、可识别的对象的组合、大脑 30%~40% 的部位执行视觉运算与分析,最后才由大脑告诉你,这个影像是什么。
而关于计算机影像辨识,Intel 所发起的开源影像辨识系统 OpenCV 便是不可或缺的主角。这套开源系统让开发人员在进行相关辨识系统的开发时更加容易,同时促进相关技术的进展。若计算机辨识系统要仿效人脑得到相近的视觉感受,则必须经过复杂的运算,以当红的虚拟现实(VR)、扩增实境(AR)或是结合两者的混合实境(MR)来说,都必须计算出影像中各个对象的运动状况、环境的影像复原和重建等。
计算机视觉系统基本架构
OpenCV 可以在许多平台上执行,以Webduino 为例,其运行Google Tensorflow.js后,让硬件的开发者可以更简单的使用网页开发AI服务。这个云端平台,整合了从硬件到软件、软件到云端、云端到行动装置,充分展现 OpenCV 跨平台的能力!
将 OpenCV 结合摄影机,撷取物体颜色,经过设定特定色彩范围后,OpenCV 也可以被来侦测热区、对物体颜色进行萃取,甚至能将这项影像辨识技术结合机械手臂,应用在更多领域中。此外,这项技术也能够在摄影镜头侦测到的指定对象上画上笑脸,再利用 Google 大脑团队开发的 Tensorflow.js 进行深度学习,提升其侦测物体技术及准确度。目前 Webduino也正将这些程序信息整合成一个平台,在浏览器上就能直接进行对象的分类及侦测。
Webduino 示意图
另外一个应用是农业。在一望无际的西红柿园里,果实的颜色与大小总是参差不齐,通过设计蜂巢农研影像,利用 OpenCV 和 YOLO 进行物体检测,将侦测到的西红柿果实进行框架并标示,以作为自动采收系统中的视觉模块核心。经过开发者不断地尝试与检测、调整程序,这套物体侦测系统能增快筛选速度并减轻人力负担,有效提升工作效率!
UGV 西红柿采收项目中的物体侦测
车牌辨识知多少?
影像辨识技术日趋成熟,应用领域也更为广泛。在车牌辨识系统领域中,由于摄影机质量大幅跃升,现在已经进入车牌辨识乃至影像辨识的战国时代!传统 2D 平面辨识系统,辨识度低且分析速度慢,而最新研发的 3D 立体辨识系统筛选速度快,即使画面中倾斜的车牌号码也能清楚掌握。
为了追求更高的效率,设计者不断尝试让系统能一次侦测「多车」的辨识程序。目前 3D 立体辨识系统已能在相同时间内,辨识出多个车牌,并普遍应用在压线拍照的停车场、学校小区的栅栏感应辨识、测速的高画素多车侦测、辨识侧边路旁车牌的车载等领域。未来,若车牌辨识技术结合超高清(Ultra HD)摄影机,将赋予讲究效率和质量的「动态、多车、多车道」辨识系统,达到能够运用到更广泛的生活层面。
影像辨识结合医疗
为了解决偏乡长者对于药物服用、辨别较不熟悉的问题,已经有团队研发出 AI 自动给药系统— UTOPIL,设计团队以长者最常服用的 15 种药物进行辨识实验,辨识结果正确率高达99.1%!
起初设计团队利用机械手臂来旋转药物,进行多角度拍摄,撷取药物影像。如此作法虽然提升实验速度,机械手臂却经常捏碎药丸,甚至有污染的风险,因此改以「真空吸取药丸」的方式进行辨识,如此一来,药物的形状大小也不会受限制,团队也将药物辨识后的结果建立成数据库,并依照长者需求,定时发放药物供长者服用,以达到按时吃药、吃对药物的目的。
这样一个有系统性的药物辨识技术,除了能协助居家长者服药,未来也盼能协助药局快速分药,或在乡里间公共场所定期提供给药服务,让影像辨识技术发挥最大效益,造福更多人群。
小结
从身边的 iPhone X 所搭载的脸部辨识系统,到随处可见的车牌辨识,影像辨识技术已融入我们的日常生活。为了应用在不同的场景,影像辨识所着重的技术重点也各不相同,藉由结合特殊的算法,或其他硬件辅助,便能快速应用在不同领域,以协助改善人类生活,让生活质量大幅提升。相信未来的影像辨识应用将会更加宽广,让辨识算法更加精进、使影像辨识技术更上一层楼。