文章專區

2020-05-14當3D視覺感知遇上微機電系統──精細之眼，讓AI看懂世界 461 期

Author 作者編輯部

2017年，隨著iPhone X首次搭載前置3D鏡頭作人臉辨識，「3D視覺」成為新科技寵兒，進入一般消費者的生活中。2020年4月，iPad Pro後置鏡頭採用光達（LiDAR）模組，再次以領先的3D感知技術驚艷世界。根據法國市場研究機構Yole Développement指出，全球3D成像與感測市場在2019~2025年的複合年均增長率（compound annual growth rate, CAGR）為20％，且將在2025年超過市值150億美元。消費與手機行業、車用兩大領域將成長4倍。

究竟，何謂「3D視覺感知」？微機電系統如何引領3D視覺感知技術微型化，創造人臉辨識、AR／VR 娛樂、智慧製造、無人駕駛的科技革命呢？

定位需求帶來的立體革命

以物理角度來看，一個平面、一張照片即是2D，每個像素點擁有X與Y軸座標；而三維空間的立體點雲（point cloud）多了Z軸深度資訊，機器得以蒐集與建構被測物到空間距離的3D數據，進行分析與定位。有了深度資訊，AI不需事先進行路徑規劃，即能透過自身感測器採集環境的空間數據、傳輸到演算法進行識別，並下指令自動避開障礙物。

然而，3D視覺感知並非新技術。過去軟硬體成本高昂，僅用於工業檢測、地形測繪等專業市場。消費級市場應用可追溯至2010年微軟Xbox偵測手勢動作的Kinect體感遊戲。由於十年前晶片運算速度及成本考量，使得3D感知在消費市場的應用僅限於娛樂。

近年，人工智慧（artificial intelligence, AI）、物聯網應用話題熱度增加，產業鏈上下游廠商價格也因增量、技術升級受惠，包含硬體控制晶片、處理器、紅外光雷射發射與接收模組、光學鏡頭、CMOS（互補性氧化金屬半導體）影像感測器，以及軟體大數據分析、演算法、機器學習等。

透過3D座標數據建立的立體模型，由OPUS 3DSLiM^TM Apollo S深度相機拍攝。（圖片皆由OPUS Microsystems提供）

讓3D感知再起的關鍵要角—微機電系統中的微振鏡

微機電系統（micro electronical mechanical systems, MEMS）中的微振鏡（micro mirror），具備微型化、集成化與低成本的元器件優勢。微振鏡以半導體製程，將矽基反射鏡面與驅動所需的機械結構於晶片層級微型化，通過電子訊號控制，以靜電、電磁或壓電方式驅動，讓反射鏡面進行高速擺動，在晶片層級提供傳統機械掃描無法達成的功能，包括高品質雷射反射掃描與高畫質掃描投影成像。這些功能可在3D感知領域中用於短距離的動態結構光（structured light）投影成像，或中長距離下透過脈衝雷射以飛時測距（time of flight, ToF）原理實現高解析度3D光達。

MEMS振鏡研發17年的臺灣研發團隊先進微機電系統公司（Opus Microsystems, OPUS）創辦人、史丹佛電機博士洪昌黎指出，MEMS設計上需考慮的層面比起以電訊號為主的IC晶片複雜許多，且在晶圓製程上並沒有標準流程能滿足不同MEMS的設計需求，是一個需要與晶圓廠深度合作、累積足夠設計與製造經驗才能掌握的領域。過去MEMS微振鏡主要應用於雷射列印與微投影，現在則是將3D深度感知推向新興應用的風口。

OPUS 1D MEMS微振鏡，具半導體工藝微型化電子與機電結構。

OPUS 80線MEMS光達，可清楚辨識前方人體、障礙物。

AR ∕ VR應用於智慧型裝置，將助商業應用爆發

國際大廠Apple、Google與Facebook多年前開始佈局AR／VR軟硬體，3D感知技術正是應用落地的關鍵，而MEMS可透過不同設計方案，支援不同遠、近距離拍攝場景。例如，在50公分內提供高解析度與高精度的3D商品建模、1.5公尺內提供人臉與手勢感知，並在5公尺內以光達技術實現全環境掃描感知，解決圖像漂浮的痛點。

高解析度、高精度3D人臉識別，賦能高安全性個人身份認證

過去2D辨識存在可能被駭客以圖片、仿真面具欺騙的風險，但當算法能採集更多臉部深度特徵點，將大幅提升安全等級，實現一秒認證、解鎖、支付場景。iPhone以繞射光學元件進行空間編碼的「散斑結構光技術」掃描一次可獲取三萬個點雲數據；基於MEMS技術的「動態結構光」，透過時間與空間同時編碼，取得散斑結構光的33倍以上、高達百萬點雲，因此成為金融支付、安防、工業領域投入發展的焦點。

機器深度視覺將成為智慧製造、自動化普及的關鍵

導入機器學習與演算法的工業製造，加上深度感知的「眼睛」，機器可自動找到物品、規劃最適抓取路徑，取代高重複性、高危險性的工作人力，提升生產效率。過去因只有價格數十萬元的微米級深度相機可供選擇，工廠因預算考量，多數工站僅能採事先編程，在固定路徑完成動作的替代方案。現在MEMS技術開發的3D毫米級深度相機具備低成本優勢，恰巧可切入抓取、分揀、倉庫歸位的物流需求，加速工業製造智慧化。

MEMS光達為無人駕駛的核心3D感知元件

Google、特斯拉先後布局無人駕駛技術，成為科技公司競相角逐的賽道。無人駕駛是運用測量脈衝雷射光從發射到接收回來的時間差，換算成前方物體的相對距離與速度，賦予汽車感知所處道路環境、自主判斷停行的能力。MEMS微鏡的光達是目前普遍認為性能、成本與商業化時間上較可行的方案，除了沒有機械式多線光達架構複雜、機械易產生磨耗等問題，透過單一MEMS晶片將雷射以柵式掃描方式覆蓋三維空間達到水平0.1度、垂直0.15度的高解析度，大幅簡化機械式多線3D光達的製造困難，也提升光達環境感知解析能力。

新科技將重新定義未來生活

3D感知提供機器高精度影像的深度學習，而MEMS技術大幅縮小機械體積與採用成本，並提升商用普及率。相信不久的將來，科幻電影中人機互動、萬物聯網的智慧城市，將會成為我們的日常生活。

文章專區

2020-05-14當3D視覺感知遇上微機電系統──精細之眼，讓AI看懂世界 461 期

定位需求帶來的立體革命

讓3D感知再起的關鍵要角—微機電系統中的微振鏡

AR ∕ VR應用於智慧型裝置，將助商業應用爆發

高解析度、高精度3D人臉識別，賦能高安全性個人身份認證

機器深度視覺將成為智慧製造、自動化普及的關鍵

MEMS光達為無人駕駛的核心3D感知元件

新科技將重新定義未來生活

相關推薦

認識科月

讀者服務