技術(shù)支持
來(lái)源:光虎
人工智能,特別是通過(guò)深度學(xué)習(xí)的方式進(jìn)行的機(jī)器學(xué)習(xí),正在對(duì)整個(gè)世界產(chǎn)生巨大的有益影響。深度學(xué)習(xí)技術(shù)被用于無(wú)數(shù)應(yīng)用,從賦予虛擬助理處理自然語(yǔ)言的能力,到通過(guò)推薦引擎增強(qiáng)電子商務(wù)體驗(yàn),到幫助醫(yī)療從業(yè)人員進(jìn)行計(jì)算機(jī)輔助診斷,到在航空航天工業(yè)中執(zhí)行預(yù)測(cè)維護(hù)。深度學(xué)習(xí)技術(shù)也是工業(yè)4.0的關(guān)鍵推動(dòng)者——這是在制造業(yè)中發(fā)生的第四次工業(yè)革命,特別是使用由數(shù)據(jù)和機(jī)器學(xué)習(xí)驅(qū)動(dòng)的智能和自主系統(tǒng)——機(jī)器視覺技術(shù)是一個(gè)重要的貢獻(xiàn)者。需要注意的是,深度學(xué)習(xí)本身并不能處理各種形式的機(jī)器視覺任務(wù),需要仔細(xì)的準(zhǔn)備和維護(hù)才能真正有效。接下來(lái)將詳細(xì)介紹機(jī)器視覺——獲取和分析數(shù)字圖像的自動(dòng)化計(jì)算機(jī)化過(guò)程,主要是為了確保質(zhì)量、跟蹤和指導(dǎo)生產(chǎn),即如何從深度學(xué)習(xí)中獲益。
機(jī)器視覺和深度學(xué)習(xí)面臨的挑戰(zhàn)
機(jī)器視覺處理在消費(fèi)品和工業(yè)產(chǎn)品的制造和加工過(guò)程中經(jīng)常遇到的識(shí)別、檢查、指導(dǎo)和測(cè)量任務(wù)。傳統(tǒng)的機(jī)器視覺軟件用特定的算法來(lái)解決這些任務(wù);這些方法通常需要專門的知識(shí)、技能和經(jīng)驗(yàn)才能正確地實(shí)現(xiàn)。此外,這些方法或工具有時(shí)在處理和適應(yīng)復(fù)雜變化條件下的能力方面存在不足。
深度學(xué)習(xí)針對(duì)此類應(yīng)用有很大的幫助,但需要基于預(yù)先收集的樣本數(shù)據(jù)進(jìn)行艱苦的訓(xùn)練,以產(chǎn)生行業(yè)通常要求的結(jié)果水平(即3σ或至少99.7%的過(guò)程準(zhǔn)確性)。此外,有時(shí)還需要進(jìn)行更多的訓(xùn)練,以考慮到可能對(duì)生產(chǎn)產(chǎn)出產(chǎn)生不利影響的不可預(yù)見的情況。重要的是要認(rèn)識(shí)到,深度學(xué)習(xí)主要用于數(shù)據(jù)分類,并不是所有的機(jī)器視覺任務(wù)都適合這種方法。
深度學(xué)習(xí)的優(yōu)勢(shì)和劣勢(shì)
如前所述,深度學(xué)習(xí)是指諸如圖像或其組成像素等數(shù)據(jù)被分類為兩個(gè)或更多類別的過(guò)程。深度學(xué)習(xí)特別適合于識(shí)別對(duì)象或?qū)ο筇卣?,例如,識(shí)別小部件A與小部件B的不同等等。
該技術(shù)還特別擅長(zhǎng)應(yīng)用在檢測(cè)缺陷,無(wú)論是存在缺陷或異物,還是在正在組裝的小部件中或小部件上沒有關(guān)鍵組件。還可以方便地識(shí)別文本字符和符號(hào),如生產(chǎn)日期和批次代碼。
雖然深度學(xué)習(xí)擅長(zhǎng)在復(fù)雜和可變的情況下使用,例如發(fā)現(xiàn)不規(guī)則不均勻、紋理圖像背景或一個(gè)小部件的圖像顯示為正常和可接受的方式變化(見圖1)。
使用深度學(xué)習(xí)進(jìn)行分析是一個(gè)基于概率的過(guò)程,因此不適用,甚至不適合需要精確測(cè)量的工作。高精度測(cè)量仍然是傳統(tǒng)機(jī)器視覺軟件的所擅長(zhǎng)的。條形碼和二維符號(hào)的解碼,本質(zhì)上是基于特定的算法,也不是一個(gè)適合深度學(xué)習(xí)技術(shù)的領(lǐng)域(見圖2)。
圖一
圖二
深度神經(jīng)網(wǎng)絡(luò)的介紹
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的最新表現(xiàn),它本身被細(xì)分為三種不同的類型,即監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)是現(xiàn)在應(yīng)用中最常用的方法。
深度學(xué)習(xí)技術(shù)利用深度神經(jīng)網(wǎng)絡(luò)來(lái)執(zhí)行其分類功能。這些神經(jīng)網(wǎng)絡(luò)的靈感來(lái)自于人類大腦處理感官輸入的方式,以解釋數(shù)據(jù)。具體來(lái)說(shuō),深度學(xué)習(xí)技術(shù)利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)分析圖像。CNN也可以被稱為模型。
一個(gè)深度神經(jīng)網(wǎng)絡(luò)由多個(gè)層組成(見圖3)。輸入層定義了神經(jīng)網(wǎng)絡(luò)必須處理的圖像屬性??梢杂?jì)算兩個(gè)或兩個(gè)以上的隱藏層提取特征(即邊、角等)。具有越來(lái)越高的復(fù)雜度,并建立了一個(gè)特征空間。最后,輸出層根據(jù)保留的特征建立分類,并提供所謂的推理或預(yù)測(cè)結(jié)果。
圖三
【來(lái)源:光虎光學(xué)內(nèi)部培訓(xùn)資料】