E-PAPER

訂閱 / 取消電子報,請輸入下列資料:

*您的大名

*公司名稱

*電子郵件

*使用類別

送出 重填

top
GO TOP

CONTACT

歡迎蒞臨巨鷗科技網站,若有任何智慧科技服務、行銷服務或 其他問題,請寫下寶貴意見,我們將盡速與您聯繫,謝謝您!

*您的大名

*性 別

*電子郵件

*連絡電話

手機號碼

服務單位

職 稱

*詢問事項

*您的意見


備註:有「*」之記號者,敬請務必正確填寫。
送出 重填

Column跨界專欄

跨界專欄

AI人工智慧-深度學習新知


2011年Apple推出了智慧助理Siri,然而Siri背後技術之一為人工智慧(Artificial Intelligence,AI)中的深度學習(Deep Learning),它具由強大的學習能力,可以有效的學習並且判斷。自從2012年起深度學習技術運用在市場上開始萌芽, Google、Facebook、推特與百度都相繼投入研發,因應物聯網(IOT)與大數據(Big Data)的發展,全球從2013年至今已經有數千家深度學習技術新創公司設立,並且發展各項運用,如有影像搜尋、影像推薦廣告、使用者分析行為、車用安全、寵物辨識、語意分析等,未來隨著物聯網與大數據的趨勢發展,將會衍生出更多深度學習的相關運用。

Deep Learning為人工智慧技術在2011年因Siri大發異彩,帶動全球在2012~2018年間新創公司逐年成長,2015年10月Apple更在四天內收購了兩家Deep Learning新創公司,為加強圖像識別技術,全球性公司Apple、Google、Facebook、Uber、 Alibaba、Airbnb、IBM、Intel、Microsoft等等,都有將深度學習的技術導入自家的服務之中,雖然這些公司的領域差異相當大,可是唯一的共通點在於擁有龐大的資料,得以進行深度學習的分析並提供對應的服務。因為深度學習的發展, 也讓自動駕駛車的技術可以更上一層樓, 全球第一大先進駕駛防護系統(ADAS)廠商mobileye在2015年宣示將深入學習系統導入自家產品中,完成自動駕駛的最後一理路。深度學習產業結構分為三塊,軟體、硬體與服務,軟體是指提供深度學習相關的函式庫(Library)或是運用程式(App),由於深度學習需要龐大的運算量,所以高速運算的硬體將會是個關鍵,尤其是低供耗且高速的行動晶片,目前有數家硬體廠商投入研發,如Intel,Nvidia,Qualcomm,CEVA,Movidous等等都有提供硬體加速的整合方案,服務是指將深度學習結合某些運用,提供給使用者服務,最有名的有Apple 的Siri、YouTube的自動搜尋最佳影片縮圖、 Google的以圖找圖等等之類的服務功能。而在我國方面已有數家公司投入Deep Learning技術,所涵蓋的領域有圖像識別、語音辨識、語意辨識、安全監控、廣告推薦系統與高階寵物產品。


深度學習(Deep Learning)

在深度學習一名詞未被定義前,常用機器學習或類神經網路(Artificial neural network, ANN),而深度學習就是所謂的深度神經網路(Deep neural network, DNN),關於類神經網路的發展歷史,1958年第一個類神經網路之神經元提出,名稱感知機(Perceptron),可以解決線性可分割的分類問題,隨後1974年倒傳遞(Backpropagation)被提出,將神經網路的層數延伸且採用梯度傳遞的方式求得神經網路的最佳解,在這時期類神經網路沒有辦法保證最佳解的求得備受傳統數學家們的挑戰,直到1995年支援向量機(Support vector machine, SVM)有了最佳解的證明,1998年處理圖像辨識的卷積神經網路(Convolution neural network, CNN)提出並解決手寫辨識,2012年AlexNet基於CNN的架構提出更深層的網路結構並贏得IMAGENET比賽的冠軍。截至2018年為止,基於深度學習的論文都還在一一被提出,且一年比一年進步,更在2016年時,深度學習的影像辨識率在IMAGENET比賽中已超越人類的認知,實在進步迅速。

卷積神經網路(Convolution Neural Network, CNN)

卷積神經網路(Convolution neural network, CNN)是個針對圖像特徵擷取與辨識非常有效的神經網路,它將影像經過Convolution Layer, Pooling Layer, Fully Connected Layer各兩層以上的處理,既可稱為卷積神經網路,其中Convolution Layer主要負責圖像中的特徵擷取,每層Convolution都具備多個Kernel,每個Kernel會將圖像中的特徵突顯出來,再透過Pooling Layer來進行細節到整體的圖像特徵縮放,最後將這些特徵組合資訊,經由Fully Connected Layer最後將這些特徵組合資訊經過非線性的轉換輸出,其中詳細的結構如圖1所示。

圖1 卷積神經網路(Convolution neural network, CNN)架構圖

現今卷積神經網路(Convolution neural network, CNN)發展迅速,而最常見的是運用於進行影像的辨識與分類,影像辨識之運用中,可以分為三大類,Image Classification、Object Detection與Image Segmentation(如圖2所示),其中Image Classification為影像分類,將圖中的影像內容進行分類,比如是場景辨識之應用; Object Detection是在影像中進行分類外並且把物體的區域偵測出來,可以達到多個物件之偵測辨識效果,此應用目前最為廣泛與常用,如行人辨識、行車安全影像辨識與人臉辨識等之應用; 最後Image Segmentation如Object Detection相同效果外,最大的差別是Object Detection需要將每個pixels 一一標記出來類別,特別運用在需要每個pixels精準運算之運用上,如影像去背、影像電子圍籬等應用。

圖2 卷積神經網路(Convolution neural network, CNN)之三大影像運用