群立法律事務所 -- 影像處理的應用與趨勢

付款機制

影像處理的應用與趨勢 - 許詠泰編輯

首頁 > 群立新知 | JOURNALS > 第12期 | Article 12

群立103年度第七次講座

影像處理的應用與趨勢

103年10月18日

*許詠泰

如果說學音樂的小孩不會變壞，那麼玩影像處理的人就不會寂寞!影像處理的範疇包羅萬象，其應用的產品與我們的生活息息相關。例如手機APP(條碼辨識)，數位相機的人臉偵測，監控系統的人臉/車牌/指紋，…等辨識，工業領域上的產品外觀瑕疵檢測，或是國防科技等應用。筆者粗淺的就接觸過的產業來分析影像處理的演變與未來趨勢。

早期影像處理或許可以狹隘的解釋為使電腦有了視覺的能力，例如監控系統可以不斷地紀錄著現實生活中的狀況，但隨著人工智慧的發展，人們開始讓電腦有了思考的能力，而這能力也為人類帶來更便利的生活。以Google為例，該公司的搜尋引擎，讓我們在網路上打入關鍵字，就可以找到全世界相關的資料。3D街景影像中自動遮蔽人臉及車牌等技術也是影像處理的應用之一。此外Google現在更將機器學習(Machine Learning)的技術，應用在無人駕駛汽車上。機器學習簡單來說，就是讓電腦透過經驗的累積，來自我提高性能，而這經驗的累計就是輸入大量的學習資料，經過軟體的演算找出最佳的決策結果。在未來機器學習不但是個趨勢，也是大數據(Big Data)能否成功的重要關鍵之一。

在911事件發生前，監控領域大多將技術發展放在影像壓縮上，業者希望電腦可以儲存更久的影像資料，但又不會犧牲掉影像的品質。但911事件發生後，大家開始意會到監控系統需要有更多的附加功能，例如遺留物偵測，在車站大廳是否有旅客置放行李而未取?人臉辨識，海關出入境是否有恐怖份子試圖闖關?軌跡偵測，旅客移動軌跡是否有徘迴或逗留情況?行為分析，分析行人是否有跌倒或異常的舉動等。這些影像處理的應用，在以前主要還是擷取影像的特徵來分析，但逐漸的人們開始運用機器學的方式來解決這些議題。舉例來說，筆者在學生時代的人臉偵測技術，主要是利用膚色的分布，以及五官的幾何特徵來判斷是否識人臉，在2000年左右由Yoav Freund和Robert Schapire等學者提出一種自適應增強(Adaptive Boosting)的機器學習方法，成功的應用在人臉偵測的議題上，而目前數位相機或手機上的人臉偵測功能，大多也是根據該方法來實現的。此外，另一個機器學習的成功案例則是車牌辨識，機器學習的最大優點在於結果不太會受到環境變化的影響，而傳統的幾何特徵分析，往往遇到光線或氣候的變化其效能就會打折扣。相同的在工業檢測的領域上，一般的檢測方法還是利用像素的統計分析，來找出極端的異常區塊，而該區塊就是瑕疵缺點發生的地方。當然該方法的計算速度很快，但缺點則是容易受到環境光源的影響，因此在工業檢測上，打光技巧就相對重要，筆者認為利用機器學習的方法，配合幾何特徵的訓練，或許可補足光線影響的因素。在互動科技方面，微軟X-box360遊戲機，更是影像處理的成功案例，該遊戲機內建兩組攝影機，利用兩組的影像資訊來計算使用者與遊戲機之間的空間關係，以及使用者的肢體辨識等。韓國更是全面的推廣互動式廣告的國家之一，現在的互動式廣告刊版有內建一組攝影機，該攝影機判斷有人佇立在看板前時，就會切換看板的內容(例如開始撥放動畫)使其達到互動的效果。

以前消費者的觀念大多是要求產品體積一定要大，軟體操作介面要很複雜，這樣才能凸顯出這項產品的相對價值，但隨著智慧型手機的普及，也逐漸地改變著使用者對於產品的要求，例如電腦體積越來越小，軟體按鈕越來越少，但這也意味著現在的工程師的挑戰越來越大，筆者認為在這科技日新月異的年代，工程師必須拋開以往的舊思維，跳脫思考的框架，才能接受未來更嚴峻的挑戰。

*作者為元智大學機械工程研究所(碩士畢業)

　　　元智大學機械工程學系(學士畢業)

　　　財團法人金屬工業研究發展中心副研究員

　　　詳維科技公司軟體研發高級工程師

　　　安鵬科技公司軟體工程師

　　　滿景資訊公司研發工程師

討論區

地址:高雄市新興區民生一路56號6樓之1 TEL:(+886-7)222-2833(高雄所代表號) FAX:請加LINE:0936-265870 行動:(+886)936-265-870(事務所)

E-MAIL: legaltrust.lawfirm@gmail.com (高雄) Copyright © 2015 群立法律事務所 All rights reserved.
本所營業時間:周一至周五09:00~17:00 (中午12:30~13:30休息) / 周六、周日僅接受事先預約