如果說學音樂的小孩不會變壞,那麼玩影像處理的人就不會寂寞!影像處理的範疇包羅萬象,其應用的產品與我們的生活息息相關。例如手機APP(條碼辨識),數位相機的人臉偵測,監控系統的人臉/車牌/指紋,…等辨識,工業領域上的產品外觀瑕疵檢測,或是國防科技等應用。筆者粗淺的就接觸過的產業來分析影像處理的演變與未來趨勢。
早期影像處理或許可以狹隘的解釋為使電腦有了視覺的能力,例如監控系統可以不斷地紀錄著現實生活中的狀況,但隨著人工智慧的發展,人們開始讓電腦有了思考的能力,而這能力也為人類帶來更便利的生活。以Google為例,該公司的搜尋引擎,讓我們在網路上打入關鍵字,就可以找到全世界相關的資料。3D街景影像中自動遮蔽人臉及車牌等技術也是影像處理的應用之一。此外Google現在更將機器學習(Machine Learning)的技術,應用在無人駕駛汽車上。機器學習簡單來說,就是讓電腦透過經驗的累積,來自我提高性能,而這經驗的累計就是輸入大量的學習資料,經過軟體的演算找出最佳的決策結果。在未來機器學習不但是個趨勢,也是大數據(Big Data)能否成功的重要關鍵之一。
在911事件發生前,監控領域大多將技術發展放在影像壓縮上,業者希望電腦可以儲存更久的影像資料,但又不會犧牲掉影像的品質。但911事件發生後,大家開始意會到監控系統需要有更多的附加功能,例如遺留物偵測,在車站大廳是否有旅客置放行李而未取?人臉辨識,海關出入境是否有恐怖份子試圖闖關?軌跡偵測,旅客移動軌跡是否有徘迴或逗留情況?行為分析,分析行人是否有跌倒或異常的舉動等。這些影像處理的應用,在以前主要還是擷取影像的特徵來分析,但逐漸的人們開始運用機器學的方式來解決這些議題。舉例來說,筆者在學生時代的人臉偵測技術,主要是利用膚色的分布,以及五官的幾何特徵來判斷是否識人臉,在2000年左右由Yoav Freund和Robert Schapire等學者提出一種自適應增強(Adaptive Boosting)的機器學習方法,成功的應用在人臉偵測的議題上,而目前數位相機或手機上的人臉偵測功能,大多也是根據該方法來實現的。此外,另一個機器學習的成功案例則是車牌辨識,機器學習的最大優點在於結果不太會受到環境變化的影響,而傳統的幾何特徵分析,往往遇到光線或氣候的變化其效能就會打折扣。相同的在工業檢測的領域上,一般的檢測方法還是利用像素的統計分析,來找出極端的異常區塊,而該區塊就是瑕疵缺點發生的地方。當然該方法的計算速度很快,但缺點則是容易受到環境光源的影響,因此在工業檢測上,打光技巧就相對重要,筆者認為利用機器學習的方法,配合幾何特徵的訓練,或許可補足光線影響的因素。在互動科技方面,微軟X-box360遊戲機,更是影像處理的成功案例,該遊戲機內建兩組攝影機,利用兩組的影像資訊來計算使用者與遊戲機之間的空間關係,以及使用者的肢體辨識等。韓國更是全面的推廣互動式廣告的國家之一,現在的互動式廣告刊版有內建一組攝影機,該攝影機判斷有人佇立在看板前時,就會切換看板的內容(例如開始撥放動畫)使其達到互動的效果。
以前消費者的觀念大多是要求產品體積一定要大,軟體操作介面要很複雜,這樣才能凸顯出這項產品的相對價值,但隨著智慧型手機的普及,也逐漸地改變著使用者對於產品的要求,例如電腦體積越來越小,軟體按鈕越來越少,但這也意味著現在的工程師的挑戰越來越大,筆者認為在這科技日新月異的年代,工程師必須拋開以往的舊思維,跳脫思考的框架,才能接受未來更嚴峻的挑戰。