文章專區

2020-05-14當3D視覺感知遇上微機電系統──精細之眼,讓AI看懂世界 461 期

Author 作者 編輯部
2017年,隨著iPhone X首次搭載前置3D鏡頭作人臉辨識,「3D視覺」成為新科技寵兒,進入一般消費者的生活中。2020年4月,iPad Pro後置鏡頭採用光達(LiDAR)模組,再次以領先的3D感知技術驚艷世界。根據法國市場研究機構Yole Développement指出,全球3D成像與感測市場在2019~2025年的複合年均增長率(compound annual growth rate, CAGR)為20%,且將在2025年超過市值150億美元。消費與手機行業、車用兩大領域將成長4倍。

究竟,何謂「3D視覺感知」?微機電系統如何引領3D視覺感知技術微型化,創造人臉辨識、AR/VR 娛樂、智慧製造、無人駕駛的科技革命呢?

定位需求帶來的立體革命

以物理角度來看,一個平面、一張照片即是2D,每個像素點擁有X與Y軸座標;而三維空間的立體點雲(point cloud)多了Z軸深度資訊,機器得以蒐集與建構被測物到空間距離的3D數據,進行分析與定位。有了深度資訊,AI不需事先進行路徑規劃,即能透過自身感測器採集環境的空間數據、傳輸到演算法進行識別,並下指令自動避開障礙物。

然而,3D視覺感知並非新技術。 過去軟硬體成本高昂,僅用於工業檢測、地形測繪等專業市場。消費級市場應用可追溯至2010年微軟Xbox偵測手勢動作的Kinect體感遊戲。由於十年前晶片運算速度及成本考量,使得3D感知在消費市場的應用僅限於娛樂。

近年,人工智慧(artificial intelligence, AI)、物聯網應用話題熱度增加,產業鏈上下游廠商價格也因增量、技術升級受惠,包含硬體控制晶片、處理器、紅外光雷射發射與接收模組、光學鏡頭、CMOS(互補性氧化金屬半導體)影像感測器,以及軟體大數據分析、演算法、機器學習等。

 

透過3D座標數據建立的立體模型,由OPUS 3DSLiMTM Apollo S深度相機拍攝。(圖片皆由OPUS Microsystems提供)

讓3D感知再起的關鍵要角—微機電系統中的微振鏡

微機電系統(micro electronical mechanical systems, MEMS)中的微振鏡(micro mirror),具備微型化、集成化與低成本的元器件優勢。微振鏡以半導體製程,將矽基反射鏡面與驅動所需的機械結構於晶片層級微型化,通過電子訊號控制,以靜電、電磁或壓電方式驅動,讓反射鏡面進行高速擺動,在晶片層級提供傳統機械掃描無法達成的功能,包括高品質雷射反射掃描與高畫質掃描投影成像。這些功能可在3D感知領域中用於短距離的動態結構光(structured light)投影成像,或中長距離下透過脈衝雷射以飛時測距(time of flight, ToF)原理實現高解析度3D光達。

MEMS振鏡研發17年的臺灣研發團隊先進微機電系統公司(Opus Microsystems, OPUS)創辦人、史丹佛電機博士洪昌黎指出,MEMS設計上需考慮的層面比起以電訊號為主的IC晶片複雜許多,且在晶圓製程上並沒有標準流程能滿足不同MEMS的設計需求,是一個需要與晶圓廠深度合作、累積足夠設計與製造經驗才能掌握的領域。過去MEMS微振鏡主要應用於雷射列印與微投影,現在則是將3D深度感知推向新興應用的風口。

OPUS 1D MEMS微振鏡,具半導體工藝微型化電子與機電結構。


OPUS 80線MEMS光達,可清楚辨識前方人體、障礙物。

AR ∕ VR應用於智慧型裝置,將助商業應用爆發

國際大廠Apple、Google與Facebook多年前開始佈局AR/VR軟硬體,3D感知技術正是應用落地的關鍵,而MEMS可透過不同設計方案,支援不同遠、近距離拍攝場景。例如,在50公分內提供高解析度與高精度的3D商品建模、1.5公尺內提供人臉與手勢感知,並在5公尺內以光達技術實現全環境掃描感知,解決圖像漂浮的痛點。

高解析度、高精度3D人臉識別,賦能高安全性個人身份認證

過去2D辨識存在可能被駭客以圖片、仿真面具欺騙的風險,但當算法能採集更多臉部深度特徵點,將大幅提升安全等級,實現一秒認證、解鎖、支付場景。iPhone以繞射光學元件進行空間編碼的「散斑結構光技術」掃描一次可獲取三萬個點雲數據;基於MEMS技術的「動態結構光」,透過時間與空間同時編碼,取得散斑結構光的33倍以上、高達百萬點雲,因此成為金融支付、安防、工業領域投入發展的焦點。

機器深度視覺將成為智慧製造、自動化普及的關鍵

導入機器學習與演算法的工業製造,加上深度感知的「眼睛」,機器可自動找到物品、規劃最適抓取路徑,取代高重複性、高危險性的工作人力,提升生產效率。過去因只有價格數十萬元的微米級深度相機可供選擇,工廠因預算考量,多數工站僅能採事先編程,在固定路徑完成動作的替代方案。現在MEMS技術開發的3D毫米級深度相機具備低成本優勢,恰巧可切入抓取、分揀、倉庫歸位的物流需求,加速工業製造智慧化。

MEMS光達為無人駕駛的核心3D感知元件

Google、特斯拉先後布局無人駕駛技術,成為科技公司競相角逐的賽道。無人駕駛是運用測量脈衝雷射光從發射到接收回來的時間差,換算成前方物體的相對距離與速度,賦予汽車感知所處道路環境、自主判斷停行的能力。MEMS微鏡的光達是目前普遍認為性能、成本與商業化時間上較可行的方案,除了沒有機械式多線光達架構複雜、機械易產生磨耗等問題,透過單一MEMS晶片將雷射以柵式掃描方式覆蓋三維空間達到水平0.1度、垂直0.15度的高解析度,大幅簡化機械式多線3D光達的製造困難,也提升光達環境感知解析能力。

新科技將重新定義未來生活

3D感知提供機器高精度影像的深度學習,而MEMS技術大幅縮小機械體積與採用成本,並提升商用普及率。相信不久的將來,科幻電影中人機互動、萬物聯網的智慧城市,將會成為我們的日常生活。