公務(wù)員期刊網(wǎng) 精選范文 卷積神經(jīng)網(wǎng)絡(luò)的深度范文

卷積神經(jīng)網(wǎng)絡(luò)的深度精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡(luò)的深度主題范文,僅供參考,歡迎閱讀并收藏。

卷積神經(jīng)網(wǎng)絡(luò)的深度

第1篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

(江蘇科技大學(xué)電子信息學(xué)院,江蘇鎮(zhèn)江212003)

摘要:在實際交通環(huán)境中,由于運動模糊、背景干擾、天氣條件以及拍攝視角等因素,所采集的交通標(biāo)志的圖像質(zhì)量往往不高,這就對交通標(biāo)志自動識別的準(zhǔn)確性、魯棒性和實時性提出了很高的要求。針對這一情況,提出一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識別方法。該方法采用深層卷積神經(jīng)網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)模型,直接將采集的交通標(biāo)志圖像經(jīng)二值化后作為輸入,通過卷積和池采樣的多層處理,來模擬人腦感知視覺信號的層次結(jié)構(gòu),自動地提取交通標(biāo)志圖像的特征,最后再利用一個全連接的網(wǎng)絡(luò)實現(xiàn)交通標(biāo)志的識別。實驗結(jié)果表明,該方法利用卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)能力,自動地提取交通標(biāo)志的特征,避免了傳統(tǒng)的人工特征提取,有效地提高了交通標(biāo)志識別的效率,具有良好的泛化能力和適應(yīng)范圍。

關(guān)鍵詞 :交通標(biāo)志;識別;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí)

中圖分類號:TN911.73?34;TP391.41 文獻標(biāo)識碼:A 文章編號:1004?373X(2015)13?0101?06

收稿日期:2015?01?09

基金項目:國家自然科學(xué)基金面上項目(61371114)

0 引言

隨著智能汽車的發(fā)展,道路交通標(biāo)志的自動識別[1?3]作為智能汽車的基本技術(shù)之一,受到人們的高度關(guān)注。道路交通標(biāo)志識別主要包括兩個基本環(huán)節(jié):首先是交通標(biāo)志的檢測,包括交通標(biāo)志的定位、提取及必要的預(yù)處理;其次是交通標(biāo)志的識別,包括交通標(biāo)志的特征提取和分類。

如今,交通標(biāo)志的識別方法大多數(shù)都采用人工智能技術(shù),主要有下述兩類形式[4]。一種是采用“人工特征+機器學(xué)習(xí)”的識別方法,如基于淺層神經(jīng)網(wǎng)絡(luò)、支持向量機的特征識別等。在這種方法中,主要依靠先驗知識,人工設(shè)計特征,機器學(xué)習(xí)模型僅負責(zé)特征的分類或識別,因此特征設(shè)計的好壞直接影響到整個系統(tǒng)性能的性能,而要發(fā)現(xiàn)一個好的特征,則依賴于研究人員對待解決的問題的深入理解。另一種形式是近幾年發(fā)展起來的深度學(xué)習(xí)模型[5],如基于限制波爾茲曼機和基于自編碼器的深度學(xué)習(xí)模型以及卷積神經(jīng)網(wǎng)絡(luò)等。在這種方法中,無需構(gòu)造任何的人工特征,而是直接將圖像的像素作為輸入,通過構(gòu)建含有多個隱層的機器學(xué)習(xí)模型,模擬人腦認知的多層結(jié)構(gòu),逐層地進行信息特征抽取,最終形成更具推廣性和表達力的特征,從而提升識別的準(zhǔn)確性。

卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)模型之一,是一種多層的監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它利用一系列的卷積層、池化層以及一個全連接輸出層構(gòu)建一個多層的網(wǎng)絡(luò),來模仿人腦感知視覺信號的逐層處理機制,以實現(xiàn)視覺特征信號的自動提取與識別。本文將深層卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于道路交通標(biāo)志的識別,通過構(gòu)建一個由二維卷積和池化處理交替組成的6層網(wǎng)絡(luò)來逐層地提取交通標(biāo)志圖像的特征,所形成的特征矢量由一個全連接輸出層來實現(xiàn)特征的分類和識別。實驗中將加入高斯噪聲、經(jīng)過位移、縮放和旋轉(zhuǎn)處理的交通標(biāo)志圖像以及實際道路采集交通標(biāo)志圖像分別構(gòu)成訓(xùn)練集和測試集,實驗結(jié)果表明,本文所采用的方法具有良好的識別率和魯棒性。

1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及原理

1.1 深度學(xué)習(xí)

神經(jīng)科學(xué)研究表明,哺乳動物大腦皮層對信號的處理沒有一個顯示的過程[5],而是通過信號在大腦皮層復(fù)雜的層次結(jié)構(gòu)中的遞進傳播,逐層地對信號進行提取和表述,最終達到感知世界的目的。這些研究成果促進了深度學(xué)習(xí)這一新興研究領(lǐng)域的迅速發(fā)展。

深度學(xué)習(xí)[4,6?7]的目的就是試圖模仿人腦感知視覺信號的機制,通過構(gòu)建含有多個隱層的多層網(wǎng)絡(luò)來逐層地對信號特征進行新的提取和空間變換,以自動學(xué)習(xí)到更加有效的特征表述,最終實現(xiàn)視覺功能。目前深度學(xué)習(xí)已成功地應(yīng)用到語音識別、圖像識別和語言處理等領(lǐng)域。在不同學(xué)習(xí)框架下構(gòu)建的深度學(xué)習(xí)結(jié)構(gòu)是不同的,如卷積神經(jīng)網(wǎng)絡(luò)就是一種深度的監(jiān)督學(xué)習(xí)下的機器學(xué)習(xí)模型。

1.2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及原理

卷積神經(jīng)網(wǎng)絡(luò)受視覺系統(tǒng)的結(jié)構(gòu)啟發(fā)而產(chǎn)生,第一個卷積神經(jīng)網(wǎng)絡(luò)計算模型是在Fukushima 的神經(jīng)認知機中提出的[8],基于神經(jīng)元之間的局部連接和分層組織圖像轉(zhuǎn)換,將有相同參數(shù)的神經(jīng)元應(yīng)用于前一層神經(jīng)網(wǎng)絡(luò)的不同位置,得到一種平移不變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)形式。后來,LeCun 等人在該思想的基礎(chǔ)上,用誤差梯度設(shè)計并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)[9?10],在一些模式識別任務(wù)上得到優(yōu)越的性能。

卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種有監(jiān)督的深度學(xué)習(xí)算法,無需事先知道輸入與輸出之間精確的數(shù)學(xué)表達式,只要用已知的模式對卷積神經(jīng)網(wǎng)絡(luò)加以訓(xùn)練,就可以學(xué)習(xí)到輸入與輸出之間的一種多層的非線性關(guān)系,這是非深度學(xué)習(xí)算法不能做到的。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)是由一系列的卷積和池化層以及一個全連接的輸出層組成,可以采用梯度下降法極小化誤差函數(shù)對網(wǎng)絡(luò)中的權(quán)值和閾值參數(shù)逐層反向調(diào)節(jié),以得到網(wǎng)絡(luò)權(quán)值和閾值的最優(yōu)解,并可以通過增加迭代次數(shù)來提高網(wǎng)絡(luò)訓(xùn)練的精度。

1.2.1 前向傳播

在卷積神經(jīng)網(wǎng)絡(luò)的前向傳播中,輸入的原始圖像經(jīng)過逐層的卷積和池化處理后,提取出若干特征子圖并轉(zhuǎn)換成一維特征矢量,最后由全連接的輸出層進行分類識別。

在卷積層中,每個卷積層都可以表示為對前一層輸入圖像的二維卷積和非線性激勵函數(shù),其表達式可用式(1)表示:

式中:Yj 表示輸出層中第j 個輸出;Y l + 1i 是前一層(l + 1層)

的輸出特征(全連接的特征向量);n 是輸出特征向量的長度;Wij 表示輸出層的權(quán)值,連接輸入i 和輸出j ;bj表示輸出層第j 個輸出的閾值;f (?) 是輸出層的非線性

1.2.2 反向傳播

在反向傳播過程中,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法采用類似于BP神經(jīng)網(wǎng)絡(luò)的梯度最速下降法,即按極小化誤差的方法反向傳播調(diào)整權(quán)值和閾值。網(wǎng)絡(luò)反向傳播回來的誤差是每個神經(jīng)元的基的靈敏度[12],也就是誤差對基的變化率,即導(dǎo)數(shù)。下面將分別求出輸出層、池采樣層和卷積層的神經(jīng)元的靈敏度。

(1)輸出層的靈敏度

對于誤差函數(shù)式(6)來說,輸出層神經(jīng)元的靈敏度可表示為:

在前向傳播過程中,得到網(wǎng)絡(luò)的實際輸出,進而求出實際輸出與目標(biāo)輸出之間的誤差;在反向傳播過程中,利用誤差反向傳播,采用式(17)~式(20)來調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,極小化誤差;這樣,前向傳播和反向傳播兩個過程反復(fù)交替,直到達到收斂的要求為止。

2 深層卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識別方法

2.1 應(yīng)用原理

交通標(biāo)志是一種人為設(shè)計的具有特殊顏色(如紅、黃、白、藍、黑等)和特殊形狀或圖形的公共標(biāo)志。我國的交通標(biāo)志主要有警告、禁令、指示和指路等類型,一般采用顏色來區(qū)分不同的類型,用形狀或圖形來標(biāo)示具體的信息。從交通標(biāo)志設(shè)計的角度來看,屬于不同類型(不同顏色)的交通標(biāo)志在形狀或圖形上有較大的差異;屬于相同類型(相同顏色)的標(biāo)志中同類的指示信息標(biāo)志在形狀或圖形上比較接近,如警告標(biāo)志中的平面交叉路口標(biāo)志等。因此,從機器視覺的角度來分析,同類型中同類指示信息的標(biāo)志之間會比不同類型的標(biāo)志之間更易引起識別錯誤。換句話說,相比于顏色,形狀或圖形是正確識別交通標(biāo)志的關(guān)鍵因素。

因此,在應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志時,從提高算法效率和降低錯誤率綜合考慮,將交通標(biāo)志轉(zhuǎn)換為灰度圖像并作二值化處理后作為卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像信息。圖2給出了應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志的原理圖。該網(wǎng)絡(luò)采用了6層交替的卷積層和池采樣層來逐層提取交通標(biāo)志的特征,形成的特征矢量由一個全連接的輸出層進行識別。圖中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分別表示卷積層L1,L3,…,Ln - 1 的卷積核;Input表示輸入的交通標(biāo)志圖像;

Pool表示每個池采樣層的采樣池;map表示逐層提取的特征子圖;Y 是最終的全連接輸出。

交通標(biāo)志識別的判別準(zhǔn)則為:對于輸入交通標(biāo)志圖像Input,網(wǎng)絡(luò)的輸出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},則Input ∈ j,即判定輸入的交通標(biāo)志圖像Input為第j 類交通標(biāo)志。

2.2 交通標(biāo)志識別的基本步驟

深層神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志主要包括交通標(biāo)志的訓(xùn)練與識別,所以將交通標(biāo)志識別歸納為以下4個步驟:(1) 圖像預(yù)處理:利用公式Gray= 0.299R +0.587G + 0.114B 將彩色交通標(biāo)志圖像轉(zhuǎn)換為灰度圖像,再利用鄰近插值法將交通標(biāo)志圖像規(guī)格化,最后利用最大類間方差將交通標(biāo)志圖像二值化。

(2)網(wǎng)絡(luò)權(quán)值和閾值的初始化:利用隨機分布函數(shù)將權(quán)值W 初始化為-1~1之間的隨機數(shù);而將閾值b 初始化為0。

(3)網(wǎng)絡(luò)的訓(xùn)練:利用經(jīng)過預(yù)處理的交通標(biāo)志圖像構(gòu)成訓(xùn)練集,對卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,通過網(wǎng)絡(luò)前向傳播和反向傳播的反復(fù)交替處理,直到滿足識別收斂條件或達到要求的訓(xùn)練次數(shù)為止。

(4)交通標(biāo)志的識別:將實際采集的交通標(biāo)志圖像經(jīng)過預(yù)處理后,送入訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)中進行交通標(biāo)志特征的提取,然后通過一個全連接的網(wǎng)絡(luò)進行特征分類與識別,得到識別結(jié)果。

3 實驗結(jié)果與分析

實驗主要選取了我國道路交通標(biāo)志的警告標(biāo)志、指示標(biāo)志和禁令標(biāo)志三類中較常見的50幅圖像??紤]到在實際道路中采集到的交通標(biāo)志圖像會含有噪聲和出現(xiàn)幾何失真以及背景干擾等現(xiàn)象,因此在構(gòu)造網(wǎng)絡(luò)訓(xùn)練集時,除了理想的交通標(biāo)志以外,還增加了加入高斯噪聲、經(jīng)過位移、旋轉(zhuǎn)和縮放處理和實際采集到的交通標(biāo)志圖像,因此最終的訓(xùn)練樣本為72個。其中,加入的高斯噪聲為均值為0,方差分別為0.1,0.2,0.3,圖像的位移、旋轉(zhuǎn)、縮放的參數(shù)分別隨機的分布在±10,±5°,0.9~1.1的范圍內(nèi)。圖3給出了訓(xùn)練集中的交通標(biāo)志圖像的示例。圖4是在實際道路中采集的交通標(biāo)志圖像構(gòu)成的測試集的示例。

在實驗中構(gòu)造了一個輸入為48×48個神經(jīng)元、輸出為50 個神經(jīng)元的9 層網(wǎng)絡(luò)。網(wǎng)絡(luò)的輸入是像素為48 × 48 的規(guī)格化的交通標(biāo)志圖像,輸出對應(yīng)于上述的50種交通標(biāo)志的判別結(jié)果。網(wǎng)絡(luò)的激活函數(shù)采用S型函數(shù),如式(2)所示,其輸出范圍限制在0~1之間。

圖6是交通標(biāo)志的訓(xùn)練總誤差EN 曲線。在訓(xùn)練開始的1 500次,誤差能迅速地下降,在迭代2 000次以后是一個平穩(wěn)的收斂過程,當(dāng)?shù)?0萬次時,總誤差EN可以達到0.188 2。

在交通標(biāo)志的測試實驗中,為了全面檢驗卷積神經(jīng)網(wǎng)絡(luò)的識別性能,分別針對理想的交通標(biāo)志,加入高斯噪聲、經(jīng)過位移、旋轉(zhuǎn)和比例縮放以及采集的交通標(biāo)志圖像進行實驗,將以上測試樣本分別送入到網(wǎng)絡(luò)中識別,表2給出了測試實驗結(jié)果。

綜合分析上述實驗結(jié)果,可以得到以下結(jié)論:(1)在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過程中,整個網(wǎng)絡(luò)的誤差曲線快速平穩(wěn)的下降,體現(xiàn)出卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)具有良好的收斂性。

(2)經(jīng)逐層卷積和池采樣所提取的特征具有比例縮放和旋轉(zhuǎn)不變性,因此對于旋轉(zhuǎn)和比例縮放后的交通標(biāo)志能達到100%的識別率。

(3)與傳統(tǒng)的BP網(wǎng)絡(luò)識別方法[11]相比較,卷積神經(jīng)網(wǎng)絡(luò)能夠達到更深的學(xué)習(xí)深度,即在交通標(biāo)志識別時能夠得到更高的所屬類別概率(更接近于1),識別效果更好。

(4)卷積神經(jīng)網(wǎng)絡(luò)對實際采集的交通標(biāo)志圖像的識別率尚不能達到令人滿意的結(jié)果,主要原因是實際道路中采集的交通標(biāo)志圖像中存在著較嚴重的背景干擾,解決的辦法是增加實際采集的交通標(biāo)志訓(xùn)練樣本數(shù),通過網(wǎng)絡(luò)的深度學(xué)習(xí),提高網(wǎng)絡(luò)的識別率和魯棒性。

4 結(jié)論

本文將深層卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于道路交通標(biāo)志的識別,利用卷積神經(jīng)網(wǎng)絡(luò)的深層結(jié)構(gòu)來模仿人腦感知視覺信號的機制,自動地提取交通標(biāo)志圖像的視覺特征并進行分類識別。實驗表明,應(yīng)用深層卷積神經(jīng)網(wǎng)絡(luò)識別交通標(biāo)志取得了良好的識別效果。

在具體實現(xiàn)中,從我國交通標(biāo)志的設(shè)計特點考慮,本文將經(jīng)過預(yù)處理二值化的圖像作為網(wǎng)絡(luò)的輸入,主要是利用了交通標(biāo)志的形狀信息,而基本略去了顏色信息,其優(yōu)點是在保證識別率的基礎(chǔ)上,可以簡化網(wǎng)絡(luò)的結(jié)構(gòu),降低網(wǎng)絡(luò)的計算量。在實際道路交通標(biāo)志識別中,將形狀信息和顏色信息相結(jié)合,以進一步提高識別率和對道路環(huán)境的魯棒性,是值得進一步研究的內(nèi)容。

此外,本文的研究沒有涉及到道路交通標(biāo)志的動態(tài)檢測,這也是今后可以進一步研究的內(nèi)容。

參考文獻

[1] 劉平華,李建民,胡曉林,等.動態(tài)場景下的交通標(biāo)識檢測與識別研究進展[J].中國圖象圖形學(xué)報,2013,18(5):493?503.

[2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.

[3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.

[4] 中國計算機學(xué)會.深度學(xué)習(xí):推進人工智能夢想[EB/OL].[2013?06?10].http://ccg.org.cn.

[5] 鄭胤,陳權(quán)崎,章毓晉.深度學(xué)習(xí)及其在目標(biāo)和行為識別中的新進展[J].中國圖象圖形學(xué)報,2014,19(2):175?184.

[6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.

[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.

[8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.

[9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.

[10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.

[11] 楊斐,王坤明,馬欣,等.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)分類器識別交通標(biāo)志[J].計算機工程,2003,29(10):120?121.

[12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.

[13] 周開利,康耀紅.神經(jīng)網(wǎng)絡(luò)模型及其Matlab 仿真設(shè)計[M].北京:清華大學(xué)出版社,2005.

[14] 孫志軍,薛磊,許陽明,等.深度學(xué)習(xí)研究綜述[J].計算機應(yīng)用研究,2012,29(8):2806?2810.

[15] 劉建偉,劉媛,羅雄麟.深度學(xué)習(xí)研究進展[J].計算機應(yīng)用研究,2014(7):1921?1930.

第2篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

關(guān)鍵詞:樹葉識別;支持向量機;卷積神經(jīng)網(wǎng)絡(luò)

中圖分類號 TP18 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)10-0194-03

Abstract: In this paper, the convolution neural network recognition in the leaves, and the process by convolution of image visualization. Experiments show that the neural network application identification convolution leaves a 92% recognition rate. In addition , this neural network and support vector machine comparative study can be drawn from the study , convolutional neural network in either speed or accuracy better than support vector machines, visible, convolution neural network in the leaves aspect has good application prospects.

Key words recognition leaves; SVM; convolutional neural network

1 概述

樹葉識別與分類在對于區(qū)分樹葉的種類,探索樹葉的起源,對于人類自身發(fā)展、科普具有特別重要的意義。目前的樹葉識別與分類主要由人完成,但,樹葉種類成千上萬種,面對如此龐大的樹葉世界,任何一個植物學(xué)家都不可能知道所有,樹葉的種類,這給進一步研究樹葉帶來了困難。為了解決這一問題,一些模式識別方法諸如支持向量機(Support Vector Machine,SVM)[1],K最近鄰(k-NearestNeighbor, KNN)[2]等被引入,然而,隨著大數(shù)據(jù)時代的到來,這些傳統(tǒng)分類算法暴露出越來越多的不足,如訓(xùn)練時間過長、特征不易提取等不足。

上世紀(jì)60年代開始,學(xué)者們相繼提出了各種人工神經(jīng)網(wǎng)絡(luò)[3]模型,其中卷積神經(jīng)網(wǎng)絡(luò)由于其對幾何、形變、光照具有一定程度的不變形,因此被廣泛應(yīng)用于圖像領(lǐng)域。其主要特點有:1)輸入圖像不需要預(yù)處理;2)特征提取和識別可以同時進行;3)權(quán)值共享,大大減少了需要訓(xùn)練的參數(shù)數(shù)目,是訓(xùn)練變得更快,適應(yīng)性更強。

卷積神經(jīng)網(wǎng)絡(luò)在國內(nèi)研究才剛剛起步。LeNet-5[4]就是一種卷積神經(jīng)網(wǎng)絡(luò),最初用于手寫數(shù)字識別,本文研究將卷積神經(jīng)網(wǎng)絡(luò)LeNet-5模型改進并應(yīng)用于樹葉識別中。本文首先介紹一下卷積神經(jīng)網(wǎng)絡(luò)和LeNet-5的結(jié)構(gòu),進而將其應(yīng)用于樹葉識別,設(shè)計了實驗方案,用卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的模式識別算法支持向量機(SVM)進行比較,得出了相關(guān)結(jié)論,并對進一步研究工作進行了展望。

2人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)方面的研究很早就已開展,現(xiàn)在的人工神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展成了多領(lǐng)域、多學(xué)科交叉的獨立的研究領(lǐng)域。神經(jīng)網(wǎng)絡(luò)中最基本的單元是神經(jīng)元模型。類比生物神經(jīng)元,當(dāng)它“興奮”時,就會向相連的神經(jīng)元發(fā)送化學(xué)物質(zhì),從而改變這些神經(jīng)元的狀態(tài)。人工神經(jīng)元模型如圖1所示:

上述就是一個簡單的神經(jīng)元模型。在這個模型中,神經(jīng)元接收來自n個其他神經(jīng)元傳遞過來的輸入信號,這些信號通過帶權(quán)重的w進行傳遞,神經(jīng)元接收到的總輸入值將與神經(jīng)元的閾值進行比較,然后通過“激活函數(shù)”來產(chǎn)生輸出。

一般采用的激活函數(shù)是Sigmoid函數(shù),如式1所示:

[σz=11+e-z] (1)

該函數(shù)圖像圖2所示:

2.1多層神經(jīng)網(wǎng)絡(luò)

將上述的神經(jīng)元按一定的層次結(jié)構(gòu)連接起來,就得到了如圖3所示的多層神經(jīng)網(wǎng)絡(luò):

多層神經(jīng)網(wǎng)絡(luò)具有輸入層,隱藏層和輸出層。由于每一層之間都是全連接,因此每一層的權(quán)重對整個網(wǎng)絡(luò)的影響都是特別重要的。在這個網(wǎng)絡(luò)中,采用的訓(xùn)練算法是隨機梯度下降算法[5],由于每一層之間都是全連接,當(dāng)訓(xùn)練樣本特別大的時候,訓(xùn)練需要的時間就會大大增加,由此提出了另一種神經(jīng)網(wǎng)絡(luò)―卷積神經(jīng)網(wǎng)絡(luò)。

2.2卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(CNN)由于在圖像分類任務(wù)上取得了非常好的表現(xiàn)而備受人們關(guān)注。發(fā)展到今天,CNN在深度學(xué)習(xí)領(lǐng)域已經(jīng)成為了一種非常重要的人工神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)的核心在于通過建立很多的特征提取層一層一層地從圖片像素中找出關(guān)系并抽象出來,從而達到分類的目的,CNN方面比較成熟的是LeNet-5模型,如圖4所示:

在該LeNet-5模型中,一共有6層。如上圖所示,網(wǎng)絡(luò)輸入是一個28x28的圖像,輸出的是其識別的結(jié)果。卷積神經(jīng)網(wǎng)絡(luò)通過多個“卷積層”和“采樣層”對輸入信號進行處理,然后在連接層中實現(xiàn)與輸出目標(biāo)之間的映射,通過每一層卷積濾波器提取輸入的特征。例如,LeNet-5中第一個卷積層由4個特征映射構(gòu)成,每個特征映射是一個24x24的神經(jīng)元陣列。采樣層是基于對卷積后的“平面”進行采樣,如圖所示,在第一個采樣層中又4的12x12的特征映射,其中每個神經(jīng)元與上一層中對應(yīng)的特征映射的2x2鄰域相連接,并計算輸出。可見,這種局部相關(guān)性的特征提取,由于都是連接著相同的連接權(quán),從而大幅度減少了需要訓(xùn)練的參數(shù)數(shù)目[6]。

3實驗研究

為了將LeNet-5卷積網(wǎng)絡(luò)用于樹葉識別并檢驗其性能,本文收集了8類樹葉的圖片,每一類有40張照片,如圖5所示的一張樹葉樣本:

本文在此基礎(chǔ)上改進了模型,使用了如圖6卷積神經(jīng)網(wǎng)絡(luò)模型:

在此模型中,第一個卷積層是由6個特征映射構(gòu)成,每個特征映射是一個28*28的神經(jīng)元陣列,其中每個神經(jīng)元負責(zé)從5*5的區(qū)域通過卷積濾波器提取局部特征,在這里我們進行了可視化分析,如圖7所示:

從圖中可以明顯地看出,卷積網(wǎng)絡(luò)可以很好地提取樹葉的特征。為了驗證卷積神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)分類算法之間的性能,本文基于Python語言,CUDA并行計算平臺,訓(xùn)練同樣大小8類,一共320張的一批訓(xùn)練樣本,采用交叉驗證的方法,得到了如表1所示的結(jié)論。

可見,無論是識別率上,還是訓(xùn)練時間上,卷積網(wǎng)絡(luò)較傳統(tǒng)的支持向量機算法體現(xiàn)出更好地分類性能。

4 總結(jié)

本文從人工神經(jīng)網(wǎng)絡(luò)出發(fā),重點介紹了卷積神經(jīng)網(wǎng)絡(luò)模型LeNet-5在樹葉識別上的各種研究并提取了特征且進行了可視化,并與傳統(tǒng)分類算法SVM進行比較。研究表明,該模型應(yīng)用在樹葉識別上較傳統(tǒng)分類算法取得了較好的結(jié)果,對收集的樹葉達到了92%的準(zhǔn)確率,并大大減少了訓(xùn)練所需要的時間。由于卷積神經(jīng)網(wǎng)絡(luò)有如此的優(yōu)點,因此在人臉識別、語音識別、醫(yī)療識別、犯罪識別方面具有很廣泛的應(yīng)用前景。

本文的研究可以歸納為探討了卷積神經(jīng)網(wǎng)絡(luò)在樹葉識別上的效果,并對比了傳統(tǒng)經(jīng)典圖像分類算法,取得了較好的分類精度。

然而,本文進行實驗的樣本過少,當(dāng)數(shù)據(jù)集過多的時候,這個卷積神經(jīng)網(wǎng)絡(luò)算法的可行性有待我們進一步的研究;另外,最近這幾年,又有很多不同的卷積神經(jīng)網(wǎng)絡(luò)模型出現(xiàn),我們會繼續(xù)試驗其他的神經(jīng)網(wǎng)絡(luò)模型,力求找到更好的分類算法來解決樹葉識別的問題。

參考文獻:

[1]Bell A, Sejnowski T. An Information-Maximization Approach to Blind Separation and Blind Deconvolution[J]. Neural Computation, 1995, 7(6):1129-59.

[2]Altman N S. An Introduction to Kernel and Nearest-Neighbor Nonparametric Regression[J]. American Statistician, 1992, 46(3):175-185.

[3]Ripley B D, Hjort N L. Pattern Recognition and Neural Networks[M]. Pattern recognition and neural networks. Cambridge University Press,, 1996:233-234.

[4]Lécun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.

第3篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

關(guān)鍵詞:無人機;STM32;道路檢測;神經(jīng)網(wǎng)絡(luò);模型訓(xùn)練

傳統(tǒng)的道路巡檢和保養(yǎng)主要由人工來完成,需要投入大量的人力物力來保證道路的相對安全,這種方式存在著低效率、高成本且難以保證道路的決定安全[1]。固定式交通檢測設(shè)備大量設(shè)置在道路的主干路上,也存在著一些缺陷:(1)監(jiān)控攝像頭不能做到全覆蓋且具有一定的探測盲區(qū)。(2)監(jiān)控系統(tǒng)采用多屏幕方式,工作人員進行道路故障判斷時受限。(3)不能靈活的通知有關(guān)部門對事故的快速應(yīng)急處理。為了克服上述的缺點,本文設(shè)計了一種基于卷積神經(jīng)網(wǎng)絡(luò)的無人機道路巡檢系統(tǒng),對發(fā)生故障和需要保養(yǎng)的道路能快速響應(yīng),及時的通知有關(guān)部門,避免事故的發(fā)生。

1系統(tǒng)的總體設(shè)計

在無人機道路巡檢系統(tǒng)中,我們主要考慮了以下幾個要求[3]:(1)無人機系統(tǒng)能滿足正常的工作;(2)無人機系統(tǒng)能適應(yīng)各種天氣和氣候變化等;(3)無人機系統(tǒng)應(yīng)充分考慮控制的安全性;(4)視頻流的傳輸應(yīng)避免較長的延時。無人機道路巡檢系統(tǒng)主要由無人機系統(tǒng)設(shè)計、遠程控制系統(tǒng)、PC端系統(tǒng)三大部分組成,系統(tǒng)的總體結(jié)構(gòu)框圖如圖1所示。系統(tǒng)的具體工作原理為:無人機將道路環(huán)境檢測的結(jié)果,將處理后的視頻流通過遠程傳輸?shù)姆绞?,發(fā)送到PC端進行實時監(jiān)控道路狀況。遠程控制系統(tǒng)以STM32作為主控芯片,主要包括在無人機端和遙控端兩個部分,遙控端將控制指令通過2.4G通信發(fā)送到無人機端,此時無人機的做出相應(yīng)的位姿變化,完成遙控端對無人機位姿的控制。無人機系統(tǒng)的圖像采集模塊芯片為樹莓派,完成圖像的采集并采用TCP通信實現(xiàn)遠程視頻的傳輸,將獲取的視頻流傳輸?shù)絇C端。PC端上使用OpenCV對圖像進行處理[4],利用深度學(xué)習(xí)模塊對設(shè)計的神經(jīng)網(wǎng)絡(luò)進行數(shù)據(jù)訓(xùn)練,從而得到檢測模型,最后在PC上接收處理過的數(shù)據(jù)并實時監(jiān)測道路狀況。上述工作原理可實現(xiàn)無人機道路巡檢系統(tǒng),下文將對其包括的三大模塊進行說明介紹。

2無人機系統(tǒng)設(shè)計

本次使用的是RaspberryPi3(modelB+)作為無人機的主控制板[7],無人機的飛行控制算法和圖像采集模塊集成在樹莓派中。遠程控制系統(tǒng)通過2.4G無線通信模塊連接,通過控制器實現(xiàn)對無人機飛行和圖像采集的控制。無人機系統(tǒng)總體結(jié)構(gòu)如圖2所示。

3PC端系統(tǒng)設(shè)計

在PC端系統(tǒng)設(shè)計主要分為圖像預(yù)處理、模型訓(xùn)練和視頻監(jiān)控三大部分,通過TCP通信協(xié)議進行通信,TCP通信是一種面向連接的通信,可完成客戶端(樹莓派)和服務(wù)端(PC)的信息傳遞[9]。下面主要對前兩部分詳細介紹。

3.1圖像預(yù)處理

本系統(tǒng)對地面裂縫檢測的圖像預(yù)處理流程如圖3所示具體工作原理為:(1)采用加權(quán)平均灰度化對獲取的無人機影像進行灰度化處理;(2)對灰度化處理后的影像進行直方圖均衡化,使得影像具有高對比度和多元的灰度色調(diào)變化,為后續(xù)的濾波降噪奠定基礎(chǔ);(3)對處理后的影像進行濾波降噪,消除孤立的噪聲點,采用方法的是中值濾波降噪;(4)使用迭代二值化處理將影像的灰度值設(shè)置合適的閾值,使得圖像更簡單,目標(biāo)更突出,然后對圖像進行分割,計算迭代的閾值,判斷迭代的閾值是否收斂到某一值或者達到限定的迭代次數(shù),如果是的話,將完成二值化處理和濾波,否則將初始二值化閾值;(5)最終完成道路故障的識別與標(biāo)記。

3.2模型檢測

3.2.1卷積神經(jīng)網(wǎng)絡(luò)原理使用卷積神經(jīng)網(wǎng)絡(luò)進行模型訓(xùn)練,首先使用卷積層實現(xiàn)特征的提取,原理如圖4所示。如圖5所示,卷積操作是模仿神經(jīng)元的機制。不同的輸入在權(quán)重的影響下會有不同的輸出,根據(jù)損失函數(shù)的計算來不斷的更新權(quán)重,直到獲得合理的權(quán)重參數(shù)。初始傳遞的信號為x,中間通過權(quán)重w,再經(jīng)過偏置b后連接在末端,最后輸出信號變成wx+b。fun(?)表示激活函數(shù),最終f(z為輸出的結(jié)果,如式(1)所示。3.2.2卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程通過相機采集到的缺陷和問題圖像作為訓(xùn)練樣本,這部分是檢測道路安全的關(guān)鍵一步,(1)訓(xùn)練標(biāo)記數(shù)據(jù):首先使用圖像預(yù)處理中標(biāo)記好的道路故障提取出來,通過卷積神經(jīng)網(wǎng)絡(luò)對標(biāo)記框內(nèi)的目標(biāo)數(shù)據(jù)進行訓(xùn)練;(2)提取特征數(shù)據(jù):將道路故障的類型統(tǒng)計并歸納;(3)誤差反饋學(xué)習(xí):對測試樣本進行誤差反饋學(xué)習(xí),并進行測試;(4)優(yōu)化訓(xùn)練數(shù)據(jù):根據(jù)實際應(yīng)用場景增加圖像的種類和數(shù)量,不斷訓(xùn)練模型。3.2.3故障的基本分類道路故障主要路面缺陷(例如裂縫、殘缺等)和路面增加(例如長時間靜止的車輛和路人),各自訓(xùn)練集數(shù)量為1000張。如表1所示。3.2.4實驗測試為實現(xiàn)故障的檢測,測試數(shù)據(jù)集為100張,不同類型故障數(shù)據(jù)50張,均采集自新道路且與訓(xùn)練樣本一致,實驗結(jié)果如表2所示。由表2可知,檢測路面增加(例如長時間靜止的車輛和路人)的準(zhǔn)確率高達96%,但是地面缺陷的準(zhǔn)確率相比較而言略低,可能造成的原因是:①硬件原因?qū)е虏杉膱D像清晰度比較低;②地面缺陷太小,無人機難以識別;③訓(xùn)練的數(shù)據(jù)集較少,特征學(xué)習(xí)誤差大;但是滿足了設(shè)計需求,還需進一步改進。

4總結(jié)與展望

第4篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

【關(guān)鍵詞】人工智能 圖像識別 深度學(xué)習(xí)

1 概述

圖像識別技術(shù)是人工智能研究的一個重要分支,其是以圖像為基礎(chǔ),利用計算機對圖像進行處理、分析和理解,以識別不同模式的對象的技術(shù)。目前圖像識別技術(shù)的應(yīng)用十分廣泛,在安全領(lǐng)域,有人臉識別,指紋識別等;在軍事領(lǐng)域,有地形勘察,飛行物識別等;在交通領(lǐng)域,有交通標(biāo)志識別、車牌號識別等。圖像識別技術(shù)的研究是更高級的圖像理解、機器人、無人駕駛等技術(shù)的重要基礎(chǔ)。

傳統(tǒng)圖像識別技術(shù)主要由圖像處理、特征提取、分類器設(shè)計等步驟構(gòu)成。通過專家設(shè)計、提取出圖像特征,對圖像M行識別、分類。近年來深度學(xué)習(xí)的發(fā)展,大大提高了圖像識別的準(zhǔn)確率。深度學(xué)習(xí)從大量數(shù)據(jù)中學(xué)習(xí)知識(特征),自動完成特征提取與分類任務(wù)。但是目前的深度學(xué)習(xí)技術(shù)過于依賴大數(shù)據(jù),只有在擁有大量標(biāo)記訓(xùn)練樣本的情況下才能夠取得較好的識別效果。本文認為研究如何在標(biāo)記數(shù)據(jù)有限的情況下繼續(xù)利用深度學(xué)習(xí)完成物體識別任務(wù)具有重要意義。這也是未來人工智能研究的重要方向之一。

2 傳統(tǒng)圖像識別技術(shù)

傳統(tǒng)的圖像識別技術(shù)包括:圖像獲取、預(yù)處理、特征提取、分類。在圖像輸入后,需要先對圖像進行預(yù)處理。一幅標(biāo)準(zhǔn)灰度圖像,如果每個像素的像素值用一個字節(jié)表示,灰度值級數(shù)就等于256級,每個像素可以是0~255之間的任何一個整數(shù)值。一幅沒有經(jīng)過壓縮處理的640×480分辨率的灰度圖像就需要占據(jù)300KB的存儲空間。通常我們需要將圖片的亮度及對比度調(diào)整合適,才能使圖片更加清晰、便于觀察。

許多采集到的圖片帶有或多或少的噪聲,需要對圖片的噪聲進行消除。對圖片噪聲的消除可以使用不同的去噪方法,如中值濾波、算數(shù)平均濾波、平滑線性濾波和高斯濾波等。不同濾波器分別適用于不同情況的噪聲。如椒鹽噪聲便適合使用中值濾波器,高斯噪聲便適合使用平滑線性濾波和高斯濾波。有時候,我們需要對圖像細化處理(如指紋細化,字符細化等),以便獲取主要信息,減少無關(guān)信息。細化操作,可以得到由單像素點組成的圖像輪廓,便于后續(xù)特征提取操作。

基本的圖像特征提取包括邊緣、角點等提取。一般使用不同的特征提取算子結(jié)合相應(yīng)的閾值得到這些關(guān)鍵點。另一類在頻域中進行特征提取的方法主要是通過傅里葉變換,將圖像基于頻率分為不同的部分,從而可以在頻譜中反映出原始圖像的灰度級變化,便可得到圖像的輪廓、邊緣。

在完成圖像的預(yù)處理和特征提取之后,我們便能夠?qū)D像進行識別、分類。常用的分類器有K-近鄰(KNN),支持向量機(SVM),人工神經(jīng)網(wǎng)絡(luò)(ANN)等等。K-近鄰算法原理是,當(dāng)一個樣本的k個最相鄰的樣本中大部分屬于某一類別時,該樣本也應(yīng)當(dāng)屬于同一類別。支持向量機是通過尋找支持向量,在特征空間確定最優(yōu)分類超平面,將兩類樣本分開。人工神經(jīng)網(wǎng)絡(luò)模仿生物大腦中的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過誤差反向傳播不斷優(yōu)化參數(shù),從而得到較好的分類效果。

3 基于深度學(xué)習(xí)的圖像識別技術(shù)

一般認為深度學(xué)習(xí)技術(shù)是由Hinton及其學(xué)生于2006年提出的,其屬于人工神經(jīng)網(wǎng)絡(luò)分支。深度神經(jīng)網(wǎng)絡(luò)模仿人腦的神經(jīng)機制來分析樣本,并盡可能地對樣本的特征進行更深度的學(xué)習(xí)。以圖片為例,利用深度學(xué)習(xí)技術(shù)對樣本的特征進行學(xué)習(xí)時,由低層特征到高層特征越來越抽象,越來越能表達語義概念。當(dāng)樣本輸入后,首先對圖像進行卷積與下采樣操作,卷積和下采樣操作是為了進行特征提取和選擇。以原始像素作為輸入,深度學(xué)習(xí)技術(shù)可以自動學(xué)習(xí)得到較好的特征提取器(卷積參數(shù))。深度學(xué)習(xí)的訓(xùn)練過程,首先將當(dāng)前層的輸出作為下一層的輸入,進行逐層分析,使得每一層的輸入與輸出差別盡可能小。其后,再聯(lián)合優(yōu)化,即同時優(yōu)化所有層,目標(biāo)是分類誤差最小化。

傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)往往網(wǎng)絡(luò)中的節(jié)點數(shù)太過龐大,難以訓(xùn)練。人們構(gòu)造出卷積神經(jīng)網(wǎng)絡(luò),以權(quán)值共享的方式減少了節(jié)點數(shù)量,從而能夠加深學(xué)習(xí)的深度,使系統(tǒng)能學(xué)習(xí)到更抽象、更深層的特征,從而提高識別正確率。目前較成功的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)有AlexNet、GoogLeNet、ResNet等。

與傳統(tǒng)識別技術(shù)相比,深度學(xué)習(xí)技術(shù)具有以下優(yōu)勢:

(1)無需人工設(shè)計特征,系統(tǒng)可以自行學(xué)習(xí)歸納出特征。

(2)識別準(zhǔn)確度高,深度學(xué)習(xí)在圖像識別方面的錯誤率已經(jīng)低于人類平均水平,在可預(yù)見的將來,計算機將大量代替人力進行與圖像識別技術(shù)有關(guān)的活動。

(3)使用簡單,易于工業(yè)化,深度學(xué)習(xí)由于不需要領(lǐng)域的專家知識,能夠快速實現(xiàn)并商業(yè)化,國內(nèi)較知名的深度學(xué)習(xí)創(chuàng)業(yè)公司有專注人臉識別的Face++、研究無人車的馭勢科技等。

4 存在問題與未來展望

雖然深度學(xué)習(xí)具備諸多優(yōu)點,但目前來看深度學(xué)習(xí)仍有許多不足之處。首先,由于深度學(xué)習(xí)模型為非凸函數(shù),對其的理論研究十分困難,缺乏理論保證。在對數(shù)據(jù)進行調(diào)整時,仍是簡單的“試錯”,缺少理論支撐。

同時,由于深度學(xué)習(xí)過于依賴數(shù)據(jù)量和計算資源。對一個新概念的學(xué)習(xí),往往需要數(shù)百個甚至更多有標(biāo)記的樣本。當(dāng)遇到有標(biāo)記的樣本難以獲取或者代價太大時,深度學(xué)習(xí)就無法取得好的學(xué)習(xí)效果。并且深度學(xué)習(xí)需要十分昂貴的高性能GPU,這使得深度學(xué)習(xí)難以平民化。目前深度學(xué)習(xí)訓(xùn)練速度較慢,往往需要幾天甚至一個月。其模型擴展性差,缺少“舉一反三”的能力,樣本稍加變化,系統(tǒng)性能便會迅速下降。目前的深度學(xué)習(xí)屬于靜態(tài)過程,與環(huán)境缺乏交互。

對其的解決方案目前主要有兩點:

(1)針對于模型擴展性差的問題,通過引入遷移學(xué)習(xí),研究不同任務(wù)或數(shù)據(jù)之間的知識遷移,提高模型的擴展能力、學(xué)習(xí)速度,同時降低學(xué)習(xí)成本,便于冷啟動。

(2)與強化學(xué)習(xí)結(jié)合,研究在動態(tài)環(huán)境下進行深度學(xué)習(xí),提高深度學(xué)習(xí)與環(huán)境交互的能力。

參考文獻

[1]蔣樹強,閔巍慶,王樹徽.面向智能交互的圖像識別技術(shù)綜述與展望[J].計算機研究與發(fā)展,2016:113-122.

[2]張翠平,蘇光大.人臉識別技術(shù)綜述[J].中國圖象圖形學(xué)報,2000:885-894.

[3]梅園,趙波,朱之丹.基于直線曲線混合Gabor濾波器的指紋增強算法[J].計算機科學(xué),2016.

[4]孫志軍,薛磊,許陽明,王正.深度學(xué)習(xí)研究綜述[J].計算機應(yīng)用研究,2012:2806-2810.

[5]莊福振,羅平,何清,史忠植.遷移學(xué)習(xí)研究進展[J].軟件學(xué)報,2015:26-39.

[6]高陽,陳世福,陸鑫.強化學(xué)習(xí)研究綜述[J].自動化學(xué)報,2004:86-100.

第5篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

【關(guān)鍵詞】人工智能 醫(yī)學(xué)領(lǐng)域

1 引言

人工智能(AI)是上世紀(jì)50年展起來的新興學(xué)科,主要內(nèi)容包括:知識表示、自然語言理解、機器學(xué)習(xí)和知識獲取、知識處理系統(tǒng)、計算機視覺、自動推理和搜索方法、智能機器人、自動程序設(shè)計等方面。在過去的幾十年里人工智能涌現(xiàn)出了大量的方法,大致可分為兩大類:第一類是基于Newell和Simon的物理符號系統(tǒng)假說的符號處理方法。這種方法大多采用從知識階段向下到符號和實施階段的自上而下的設(shè)計方法,第二類是采用自下而上設(shè)計的“字符號”方法。

2 人工智能的發(fā)展

全球?qū)θ斯ぶ悄艿难邪l(fā)經(jīng)歷了已經(jīng)有70年的發(fā)展,從上個世紀(jì)的50年代開始一直到今天,歷經(jīng)了兩次大起大落,但伴隨著深度學(xué)習(xí)的重燃、龐大的大數(shù)據(jù)支撐以及計算能力的不斷提升和成本的不斷下降這些因素的出現(xiàn),尤其是在摩爾定律、大數(shù)據(jù)、互聯(lián)網(wǎng)和云計算、新方法這些人工智能進步的催化劑作用下,將迎來人工智能新的春天。

3 人工智能在醫(yī)學(xué)領(lǐng)域上的應(yīng)用

3.1 在神經(jīng)網(wǎng)絡(luò)中人工智能的應(yīng)用

在醫(yī)學(xué)診斷中人工智能的應(yīng)用會出現(xiàn)一些難題,例如知識獲取比較難、推理速度慢、自主學(xué)習(xí)以及自適應(yīng)變化能力弱。研究人腦連接發(fā)現(xiàn)了以人工神經(jīng)為特點可以解決在獲取知識中所出現(xiàn)的瓶頸和知識種類繁瑣問題,能夠提高對知識的推理能力,包括自主學(xué)習(xí),自組織等方面的能力,促進了神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)專家系統(tǒng)中的快速發(fā)展。

人工智能領(lǐng)域ANN,有不同于其他人工智能的方法,在傳統(tǒng)的結(jié)構(gòu)上,它只是AI分支中的一個,只能通過邏輯符號來模擬人腦的思維方式,進一步來實現(xiàn)人工智能,與之相比,不同的ANN是學(xué)習(xí)和訓(xùn)練為一體來達到智能的。ANN具有學(xué)習(xí)的能力及特殊方法,用戶不用編寫復(fù)雜的程序來解決所遇到的問題,只用提供有效的數(shù)據(jù)就可以完成。迄今為止,醫(yī)學(xué)領(lǐng)域中對大部分的病理原因無法解釋,無法確定病理原因,加上各種疾病的表現(xiàn)種類復(fù)雜多變。在醫(yī)學(xué)的日常實踐中,疾病相應(yīng)的治療只能以經(jīng)驗為基礎(chǔ)來判斷。所以,ANN有著記憶,學(xué)習(xí)和歸納總結(jié)為一體的人工智能服務(wù),在醫(yī)學(xué)領(lǐng)域有很好的應(yīng)用發(fā)展趨勢。

3.2 在中醫(yī)學(xué)中人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用

在中醫(yī)學(xué)中,所提出的“辨證論治”中的“證”具有模棚性、不確定性的特點,主觀性比較強,因此中醫(yī)的診斷方法和治療手段與醫(yī)師的經(jīng)驗水平有很大聯(lián)系。數(shù)年來在實驗研究,臨床觀察,文章整理,經(jīng)驗總結(jié)上,都有著對“證”的研究思想的深入調(diào)查。一部分“辨證”的過程可以用人工神經(jīng)網(wǎng)絡(luò)來替換使用。恰當(dāng)?shù)闹嗅t(yī)癥狀可以作為基本輸入和適當(dāng)人工神經(jīng)網(wǎng)絡(luò)模型,人工神經(jīng)網(wǎng)絡(luò)能夠根據(jù)以往的學(xué)習(xí)“經(jīng)驗”來進行綜合分析,從而提出中醫(yī)診斷方法。

由神經(jīng)元結(jié)構(gòu)模型、網(wǎng)絡(luò)連接模型、網(wǎng)絡(luò)學(xué)習(xí)算法等幾個要素組成了人工神經(jīng)網(wǎng)絡(luò)。具有某些智能系統(tǒng)的功能。 按照網(wǎng)絡(luò)結(jié)構(gòu)來劃分,人工神經(jīng)網(wǎng)絡(luò)有很多不同的種類,例如感知器、BP網(wǎng)絡(luò)、Hopfield網(wǎng)絡(luò)等,目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)就是其中的BP網(wǎng)絡(luò)。這種前沿網(wǎng)絡(luò)非 BP網(wǎng)絡(luò)所屬,網(wǎng)絡(luò)的結(jié)構(gòu)與權(quán)值能夠表達復(fù)雜的非線性 I/0映射關(guān)系。憑借 BP網(wǎng)絡(luò)優(yōu)良的自主學(xué)習(xí)功能,既可以通過誤差的反向傳播方法,對照已知樣本反復(fù)進行訓(xùn)練,也可以調(diào)整網(wǎng)絡(luò)的權(quán)值,直到網(wǎng)絡(luò)的 I/0關(guān)系在某一塊訓(xùn)練指標(biāo)下最接近樣本為止。

3.3 人工智能在臨床醫(yī)療診斷中的應(yīng)用

計算機編寫的程序主要根據(jù)專家系統(tǒng)的設(shè)計原理和方法來模擬醫(yī)生的醫(yī)學(xué)診斷,以及通常治療手段的思維過程來進行。醫(yī)療專家系統(tǒng)是臨床醫(yī)療診斷中人工智能的很好體現(xiàn),不僅能夠處理較為復(fù)雜的醫(yī)學(xué)治療問題,還能當(dāng)做醫(yī)生診斷疾病的重要工具,更重要的是傳承了專家們的寶貴醫(yī)學(xué)治療經(jīng)驗。

3.4 人工智能技術(shù)在醫(yī)學(xué)影像診斷中的應(yīng)用

目前,在醫(yī)學(xué)影像中存在著的問題,比如:誤診率高、缺口大。這些問題需要通過人工智能的方法來解決。在醫(yī)學(xué)影像技術(shù)領(lǐng)域人工智能的應(yīng)用包括主要的兩個方面,分別是:第一個方面為圖像識別,第二個方面為深度學(xué)習(xí),其中人工智能應(yīng)用最核心的部分實深度學(xué)習(xí)。這兩個部分都是基于醫(yī)學(xué)影像大數(shù)據(jù)所進行的數(shù)據(jù)上的挖掘和應(yīng)用。這兩個方面所進行的數(shù)據(jù)挖掘及其應(yīng)用都是依據(jù)醫(yī)學(xué)影像大數(shù)據(jù)來完成的。

Geoffrey Hinton教授是神經(jīng)網(wǎng)絡(luò)領(lǐng)域的大師,2006年,他與其博士生在《Science》和相關(guān)的期刊上發(fā)表了論文,第一次提出了“深度信念網(wǎng)絡(luò)”的概念。2012年,由斯坦福大學(xué)Fei-Fei Li教授舉辦的ImageNet ILSVRC大規(guī)模圖像識別評測任務(wù)是由Hinton教授的研究團隊參加的。這個任務(wù)包括了120萬張高分辨率圖片,1000個類比。Hinton教授團隊使用了全新的黑科技多層卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),將圖像識別錯誤率突破性地從26.2%降低到了15.3%。 這個革命性的技術(shù),讓神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)以迅速的速度進入了醫(yī)療和工業(yè)的領(lǐng)域范圍,隨后這一技術(shù)被陸續(xù)出現(xiàn)的醫(yī)療影像公司使用。例如:國際知名的醫(yī)學(xué)影像公司Enlitic和國內(nèi)剛剛獲得有峰瑞資本600萬天使輪融資的DeepCare。都是不斷積累大量影像數(shù)據(jù)和診斷數(shù)據(jù),繼續(xù)對神經(jīng)元網(wǎng)絡(luò)進行深度的學(xué)習(xí)訓(xùn)練,從而有效的提高了醫(yī)生診斷的準(zhǔn)確率。

人工智能不僅能使患者的健康檢查快速進行,包括X光、B超、核磁共振等。另外還能大量減少醫(yī)生的讀片時間,提升了醫(yī)生的工作效率,降低誤診率。

4 總結(jié)

人工智能軟件工作效率遠遠超過了人類大腦,不僅能夠更快速的找到數(shù)據(jù)的模式和相似性,還能有效幫助醫(yī)生和科學(xué)家提取重要的信息。隨著人工智能的發(fā)展及其在醫(yī)學(xué)領(lǐng)域的逐漸普及和應(yīng)用,兩者的互相融合在未來必定成為醫(yī)學(xué)發(fā)展的重要方向。

參考文獻

[1]馮伍,張俊蘭.人工智能在醫(yī)學(xué)上的應(yīng)用[J].電子設(shè)計工程,2010(01).

[2]楊琴,陳家榮.人工智能在醫(yī)學(xué)領(lǐng)域中的應(yīng)用[J].科技風(fēng),2012(12),100-101.

[3]王宇飛,孫欣.人工智能的研究與應(yīng)用[J].信息與電腦,2016(05).

[4]鉛筆道.人工智能與影像診斷相結(jié)合的醫(yī)生界阿爾法狗,2016(03).

第6篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

關(guān)鍵詞:安全帶檢測;深度學(xué)習(xí);支持向量機;智能交通;特征提取

中圖分類號:TP391 文獻標(biāo)識碼:A 文章編號:1009-3044(2016)11-0240-03

Abstract:Seat belt detection in intelligent transportation systems is an important research area. A seat belt detection algorithm for complex road backgrounds based on deep learning is proposed. It first extracts features from labeled vehicle, windshield, and seat belt regions, and those features are used to train the detection models by deep learning. Then, it detects the locations of the vehicle, windshield, and seat belt regions, and uses the relative positions among these vehicle components and their detection scores to train a support vector machine classification model. Finally, it performs a fine mapping and identification process using this classification model on the seat belt region. This method performs well when applied to a database of images collected by road surveillance cameras.

Key words: Seat belt detection; deep learning; support vector machine; intelligent transportation; feature extraction

針對駕駛員未系安全帶的這種危險駕駛行為,以及為了響應(yīng)公安部門的需求,目前出現(xiàn)了很多種安全帶檢測方法?,F(xiàn)有的安全帶檢測方法大多是基于邊緣檢測[1-2]和Hough變換[3]的方法進行安全帶檢測。Guo等人[4]提出了安全帶檢測系統(tǒng),包括安全帶檢測和駕駛員區(qū)域定位兩個模塊。該算法利用線性濾波器在HSV顏色空間[5]通過水平方向和垂直方向投影來確定車牌的位置,然后利用邊緣檢測算子(Sobel[6],Canny[7]等)通過邊緣檢測得到車窗的上下邊緣,再通過幾何關(guān)系確定駕駛員區(qū)域的位置。該方法容易受到車身顏色影響,穩(wěn)定性較差。

為了解決安全帶檢測過程中的光照、車型、駕駛員著裝等因素對檢測結(jié)果的影響,本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN[8])的安全帶檢測系統(tǒng)。當(dāng)采集到圖片后,首先粗定位車輛區(qū)域,并根據(jù)檢測算法得到車窗區(qū)域粗定位模塊,找到圖像上若干個車窗候選區(qū)域,最后通過安全帶檢測模型及支持向量機(SVM)分類器[9]處理得到安全帶檢測結(jié)果。

1 基于深度學(xué)習(xí)的安全帶檢測

1.1 CNN特征提取算法

深度學(xué)習(xí)[11-12]是通過大量的簡單神經(jīng)元組成,根據(jù)非線性關(guān)系將底層特征抽象表示為高層特征。卷積神經(jīng)網(wǎng)絡(luò)[13]是一個多層的神經(jīng)網(wǎng)絡(luò),每層由多個二維平面組成,而每個平面包括多個獨立神經(jīng)元。網(wǎng)絡(luò)中由一些簡單元和復(fù)雜元組成,分別記為S-元和C-元。

1.2 檢測模型的構(gòu)建

如圖1所示,我們構(gòu)建了由三個CNNs組成的多尺度的特征提取模型。每個CNN模型共有八層,其中有五個卷積層和三個全連接層。對于每一張圖片,都會自動的提取三個嵌套的越來越小的矩形窗口的特征,分別為車輛區(qū)域、車窗區(qū)域以及安全帶區(qū)域。這三個由CNNs提取的特征送到兩個全連接層,第二個全連接層的輸出被送到輸出層,最后用線性支持向量機分類器對所有子塊進行分類。

2 實驗結(jié)果

2.1 車輛及車窗檢測

本實驗訓(xùn)練集包括戴安全帶和未戴安全帶各2000張的車輛圖像,測試集包括戴安全帶和未戴安全帶各100張的圖像。本文共完成車輛檢測、車窗檢測和安全帶檢測三個實驗。其中,對于車輛和車窗檢測部分,使用檢測率(CIR)和漏檢率(MIR)來作為系統(tǒng)的評價指標(biāo),計算方式如下式所示:

對于車輛檢測實驗,選取6000車輛圖片用于訓(xùn)練模型。然后選取2000張車輛圖片作為測試圖片,并隨機分成10份。檢測結(jié)果示例如圖2(a)。平均檢測率為93.3%,平均漏檢率為6.7%。同時,對比了基于Adaboost算法[10]的車輛檢測模型,檢測結(jié)果示例如圖2(b),平均檢測率為90.6%,平均漏檢率為9.4%。

由此可以看出,本文算法在相同的數(shù)據(jù)庫上比Adaboost算法表現(xiàn)更好,具有更低的漏檢率和誤檢率。并且車輛檢測結(jié)果更適合用于后面的車窗檢測實驗。

車窗檢測實驗的示例如圖3所示。選取6000張車窗正面車窗圖片用于訓(xùn)練模型,選取2000張圖片作為測試集,并隨機分成10份。平均檢測率為93.6%,平均漏檢率為9.4%。

2.2 安全帶檢測

對于安全帶檢測部分,使用檢測率(CIR)、虛警率(WIR)和漏檢率(MIR)作為安全帶檢測系統(tǒng)的評價指標(biāo),計算方式如下式所示:

選取戴安全帶和未戴安全帶圖片各2000張圖片用于訓(xùn)練模型。選取2000安全帶區(qū)域圖片作為測試圖片,并隨機分成10份,每份包含戴安全帶圖片和未戴安全帶圖片各100張。通過基于深度學(xué)習(xí)的安全帶檢測算法,檢測結(jié)果示例如圖4所示,平均檢測率為92.1%,平均虛警率為6.4%,平均漏檢率為2.5%。

3 結(jié)論

安全帶檢測是智能交通系統(tǒng)中的一個重要研究課題。本文提出了一個高效的進行安全帶檢測的系統(tǒng),對于檢測部分,我們采用深度神經(jīng)網(wǎng)絡(luò)的特征提取方法,該特征更加適用于訓(xùn)練檢測模型。同時,我們結(jié)合SVM的后處理,提高了安全帶檢測系統(tǒng)的魯棒性,并且很大程度上減低了虛警率和漏檢率。

參考文獻:

[1] Ha D M, Lee J M, Kim, Y D. Neural-edge-based vehicle detection and traffic parameter extraction [J]. Image and vision computing, 2004, 22(11): 899-907.

[2] Song G Y, Lee K Y, Lee J W. Vehicle detection by edge-based candidate generation and appearance-based classification [C]//Intelligent Vehicles Symposium, IEEE, 2008: 428-433.

[3] Ballard D H. Generalizing the Hough transform to detect arbitrary shapes [J]. Pattern recognition, 1981, 13(2): 111-122.

[4] Guo H, Lin H, Zhang S. Image-based seat belt detection [C]//2011 IEEE International Conference on Vehicular Electronics and Safety (ICVES). IEEE, 2011: 161-164.

[5] 王運瓊, 游志勝. 基于色差均值的快速車窗定位算法[J]. 計算機應(yīng)用與軟件, 2004, 21(1): 78-79.

[6] 張建軍, 羅靜. 基于改進Sobel算子的表面裂紋邊緣檢測算法[J]. 合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版), 2011年06期.

[7] Ali M, Clausi D. Using the Canny edge detector for feature extraction and enhancement of remote sensing images [C]//IEEE 2001 International Geoscience and Remote Sensing Symposium. 2001:2298-2300.

[8] Li Guanbin, Yu Yizhou. Visual Saliency Based on Multiscale Deep Features [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2015: 5455-5463.

[9] 駱玉榮. 安全帶識別系統(tǒng)的研究與實現(xiàn)[D]. 北京:北京工業(yè)大學(xué), 2008.

[10] 吳法. 圖像處理與機器學(xué)習(xí)在未系安全帶駕車檢測中的應(yīng)用[D]. 杭州:浙江大學(xué), 2013.

[11] A. Krizhevsky, I. Sutskever, G. E. Hinton. Imagenet classification with deep convolutional neural networks [C]//Advances in neural information processing systems, 2012:1097-1105.

第7篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

隨著時代的發(fā)展,構(gòu)建在互聯(lián)網(wǎng)生態(tài)模式之上的云計算、大數(shù)據(jù)、人工智能等新技術(shù),正滲透到每一個行業(yè),引發(fā)產(chǎn)業(yè)生產(chǎn)、服務(wù)模式的變革,并且已經(jīng)取得一系列重要成果。在此背景下,大學(xué)教學(xué)如何跟上時代步伐,是值得每一個高校教師深入思考的問題。程序設(shè)計作為計算機專業(yè)大學(xué)生的必修課程和必須掌握的基本技能,其教學(xué)改革在新時代下尤顯必要。

傳統(tǒng)的大學(xué)教學(xué)中,一直都以C/C++或Java作為教學(xué)語言。誠然,C/C++和Java是當(dāng)今使用人數(shù)最多的語言,但在“互聯(lián)網(wǎng)+”時代,面對大數(shù)據(jù)分析時,特別是面對數(shù)據(jù)采集、仿真建模、結(jié)果驗證與數(shù)據(jù)可視化時,他們就不再是最佳選擇。

Python作為一種解釋型超高級語言,具備交互式、可移植、面向?qū)ο蟮奶攸c。它功能強大,適用于多種操作系統(tǒng),有完善豐富的工具包,正在得到越來越多的應(yīng)用,而且越來越被重視。2017年4月,北京理工大學(xué)計算機學(xué)院和高等教育出版社聯(lián)合承辦了“第一屆高等學(xué)校Python語言及計算生態(tài)教學(xué)研討會”,提出了計算生態(tài)的概念[1],大力推動了Python教學(xué)。在此背景下,根據(jù)我們在Python教學(xué)和科研中的應(yīng)用經(jīng)驗,對如何進行基于Python計算生態(tài)的教學(xué)改革進行探討。

1 Python語言的興起與優(yōu)勢

從20世紀(jì)中期到今天,短短的70年間,電子計算機經(jīng)歷了飛速的發(fā)展,出現(xiàn)了許多不同的程序設(shè)計語言,例如Pascal、Fortran、C、C++、Java、PHP、C#等,這些不同的語言,都體現(xiàn)了不同的設(shè)計哲學(xué),也反映了不同的時代特點。

然而,每種程序設(shè)計語言都有其局限性。Python的設(shè)計者Guido von Rossum希望有一種語言,既具有C方便地調(diào)用計算機功能接口的能力,又可以像一些腳本語言一樣輕松地編程。Python正是在這種背景下被創(chuàng)造出來。

同C/C++和Java等語言相比,Python有以下優(yōu)勢:

(1)簡單易學(xué)。Python是一種代表簡單主義思想的語言,語法簡單,學(xué)習(xí)起來容易上手。這使學(xué)生能夠?qū)W⒂诮鉀Q問題而不是學(xué)習(xí)語言本身。

(2)解釋性。Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序。這使得Python更加簡單,更易于移植。

(3)面向?qū)ο?。Python既支持面向過程的編程,也支持面向?qū)ο蟮木幊獭?/p>

(4)可擴展性。為了提升運行效率,可以采用C/C++來編寫關(guān)鍵代碼,然后在Python程序中使用它們。

(5)混合編程。Python被稱為膠水語言,是由于可以很容易地將Python與其他語言進行混合編程。這樣方便地利用已有的各種工具包,提高開發(fā)效率。

(6)豐富的庫。Python有強大的標(biāo)準(zhǔn)庫,并且Python的生態(tài)系統(tǒng)開始拓展到第三方包,例如用于Web框架的web.py ,用于科學(xué)計算的numpy,以及用于數(shù)據(jù)可視化的matplotlib等。

Python作為一種跨平臺編程語言,已經(jīng)被移植在以Linux、Windows、Mac、Android為代表的許多平臺上。由于Python的開放性,有豐富的來自開源社區(qū)的成熟庫支持,從而可以基于Python完成各種工作,例如數(shù)據(jù)采集(如網(wǎng)絡(luò)爬蟲)、圖像處理、機器學(xué)習(xí)、科學(xué)計算等。

2 針對Python的應(yīng)用支持與國內(nèi)外課程建設(shè)情況

正由于Python具有上述優(yōu)點,它獲得了業(yè)界的廣泛支持。例如在Google公司,Python是繼C++和Java之后,使用率排名第三的編程語言,使用Python的開發(fā)團隊也是Google的第三大研發(fā)部門。

(1)Tensorflow:TensorFlow是由Google Brain小組開發(fā)的用于機器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)的工具。據(jù)統(tǒng)計,Tensorflow是目前使用人數(shù)最多的開源深度學(xué)習(xí)框架[2]。TensorFlow本身是使用C++實現(xiàn)的,然后用Python封裝。Tensorflow可以根據(jù)用戶給出的所有指令創(chuàng)建一個計算圖,該圖被內(nèi)部優(yōu)化和編譯成可執(zhí)行的C++代碼。這樣Tensorflow就可以利用Python 帶來的開發(fā)速度和C++帶來的執(zhí)行速度。

(2)Google App Engine:Google App Engine(GAE),是谷歌推出的云平臺,它完全把CPU、內(nèi)存等硬件基礎(chǔ)設(shè)施抽象化,這樣只需要關(guān)注代碼的編寫,不需要關(guān)注硬件、操作系統(tǒng)或者物理位置。Python是GAE最早支持編程的語言之一,任何使用Python編寫的程序,都可以配合Google Python API,很方便地在GAE上創(chuàng)建、部署、運行Python程序。

(3)Caffe(Convolutional Architecture for Fast Feature Embedding):Caffe是由Berkeley AI Research(BAIR)和Berkeley Vision and Learning Center (BVLC)社?^貢獻者開發(fā)的另一個深度學(xué)習(xí)框架。同Tensorflow一樣,Caffe也是采用C++進行編寫,然后提供Python封裝,從而既可以利用C++的高執(zhí)行效率,也可享受Python的高開發(fā)效率。

(4)在好萊塢,工業(yè)光魔公司(Industrial Light) 采用Python制作商業(yè)動畫,在“阿貝斯(Abyss)”“星球之旅(Star Trek)”“Indiana Jones”等超級大片中驚艷登場。

(5)ERP和CRM軟件的開發(fā)也開始基于Python完成;Red Hat曾用Python和Tk一起成功開發(fā)配置和管理操作系統(tǒng)的可視界面,整個系統(tǒng)可以全面控制Linux操作系統(tǒng),并根據(jù)用戶選擇對配置文件作自動更新。

正由于Python是受到業(yè)界的歡迎,國外很多高校(如麻省理工學(xué)院、斯坦福大學(xué)、加州大學(xué)洛杉磯分校等)已經(jīng)用Python作為程序設(shè)計語言的教學(xué)對象。在Coursera等在線教育平臺上,可以發(fā)現(xiàn)有來自密歇根大學(xué)、萊斯大學(xué)、約翰霍普金斯大學(xué)等眾多高校的Python課程;國內(nèi)南京大學(xué)張莉老師的課程也在其中。然而國內(nèi)這方面的工作做得還遠遠不夠。截至2015年,我國開設(shè)Python語言教學(xué)的高校不超過10所[3]。目前在國內(nèi)大力推動Python教學(xué)改革的主要有北京理工大學(xué)嵩天老師等人,已編著并出版相應(yīng)的大學(xué)教材[4],受到廣泛歡迎。哈爾濱工業(yè)大學(xué)車萬翔老師等人分析了C語言作為入門語言的不足和Python作為入門語言的優(yōu)勢,闡述了計算機專業(yè)高級語言程序設(shè)計課程的改革方案和實施效果[5]。南京大學(xué)張莉老師發(fā)表了《基于MOOC的“用Python玩轉(zhuǎn)數(shù)據(jù)”翻轉(zhuǎn)課堂實踐與研究》,研究證明:采用Python教學(xué)可以較好地提高學(xué)生的主動學(xué)習(xí)能力、學(xué)習(xí)興趣和熱情以及問題求解能力[6]。

3 基于Python的教學(xué)科研應(yīng)用改革案例

3.1 輸入輸出

輸入輸出(I/O)是每個程序都必須具備的重要功能。常見的I/O可以分為3類:標(biāo)準(zhǔn)I/O(終端打印等)、文件I/O和網(wǎng)絡(luò)I/O。以?K端I/O為例:

/* Basic I/O in C */

#include

int main()

{

char name[20]; /* char數(shù)組,保存第一行輸入,作為名字輸出 */

scanf("%s", name); /*讀取第一行輸入 */

printf("Hello %s\n", name);

return 0;

}

以上用C語言編寫的有效代碼共計8行,輸入輸出都采用標(biāo)準(zhǔn)庫函數(shù)。由于C語言本身設(shè)計方面的缺陷(如果第一行輸入超出char數(shù)組大?。赡軐?dǎo)致嚴重的緩沖區(qū)溢出問題。針對這一問題,C++對數(shù)組越界進行了保護,從而提高系統(tǒng)安全性。

如果采用Java實現(xiàn),則有效代碼共10行。由于Java的面向?qū)ο缶幊趟枷?,下面這個示例程序中多了很多對象構(gòu)造的流程,引用的庫看起來也相對較多,如下所示。我們只需要對這段代碼進行稍微修改,就可以實現(xiàn)網(wǎng)絡(luò)I/O和文件I/O。例如,替換“System.in”,就能夠?qū)崿F(xiàn)對文件或者網(wǎng)絡(luò)流讀取。將“Reader”和“InputStream”替換,就能夠?qū)崿F(xiàn)寫入。

/ * Basic I/O in Java */

import java.io.BufferedReader;

import java.io.IOException;

import java.io.InputStreamReader;

public class HelloWorld {

public static void main(String[] args) throws Exception { /*所有Java程序的入口函數(shù) */

/* 新建輸入對象,用來讀取標(biāo)準(zhǔn)輸入。其中對象構(gòu)造有嵌套*/

BufferedReader reader = new BufferedReader(new InputStreamReader(System.in));

String name = reader.readLine(); /* 讀取第一行輸入 */

System.out.printf("Hello %s\n", name);

}

}

相比之下,基于Python的代碼則非常短小簡潔:

/* Basic I/O in Python */

import sys

name = sys.stdin.readline() /* 讀取第一行輸入 */

print("Hello " + name)

有效代碼僅僅只有3行!同樣,替換其中的“sys.stdin”可以實現(xiàn)對文件讀取。對于動態(tài)類型的Python來說,所有的變量都不需要繁復(fù)的聲明,直接用就可以,再加上解釋執(zhí)行的特點,無需定義入口函數(shù)即可運行。

以上是對C/C++、Java、Python在基本終端I/O操作上的比較,當(dāng)推廣到文件I/O和網(wǎng)絡(luò)I/O后,Python的優(yōu)勢會更突出,詳見表1。

3.2 數(shù)據(jù)操作

數(shù)據(jù)處理是大數(shù)據(jù)時代我們面臨的首要問題。然而,由于信息化系統(tǒng)建設(shè)過程中,數(shù)據(jù)可能以不同的結(jié)構(gòu)存在,可能是純文本文件、CSV格式,也可能是Excel格式,或者是各種不同廠商的數(shù)據(jù)庫格式。

當(dāng)然,可以采用C++或Java來讀取各種異構(gòu)數(shù)據(jù)源,但過程相當(dāng)繁瑣,需要利用各種底層驅(qū)動,甚至是一些商業(yè)化組件。以Excel文件讀取為例,為了處理Excel數(shù)據(jù),C/C++代碼需要用到libxl商業(yè)庫,而Java也需要用到Apache POI開源庫。而利用Python對Excel文件進行讀取則需要利用Pandas開源數(shù)據(jù)處理分析庫,示例代碼如下:

/* Read Excel in Python */

import pandas

df = pandas.read_excel('sample.xls')

print df.columns /* 輸出列名 */

values = df['列名'].values /* 獲取某一列的所有數(shù)據(jù) */

FORMAT = ['列名1', '列名2', '列名3'] /* 獲取指定列組成的數(shù)據(jù)幀 */

df_selected = df[FORMAT]

總的來說,在數(shù)據(jù)庫操作方面,C++、Java和Python的支持都非常好。C++和Java都為SQL提供了標(biāo)準(zhǔn)的連接、驅(qū)動管理類,不同的數(shù)據(jù)庫只需要加載不同的驅(qū)動就可以。Java對數(shù)據(jù)庫有比較好的語言級別支持,相應(yīng)的驅(qū)動也比較豐富。Python也提供語言級別的支持,同時第三方庫十分豐富,甚至一種數(shù)據(jù)庫有多個不同的連接庫。另外值得一提的是, 盡管當(dāng)前很多流行的分布式大數(shù)據(jù)平臺及分布式數(shù)據(jù)庫使用Java編寫,但利用Python同樣能夠方便地基于第三方庫實現(xiàn)操作Hbase、Hive以及其他非關(guān)系數(shù)據(jù)庫,如Mongodb、Redis等,這種特點是C/C++不能比擬的。表2為Python與C++、Java在數(shù)據(jù)庫操作上的比較。

由于Python對各種文件和數(shù)據(jù)庫的支持都非常好,它十分適合編寫數(shù)據(jù)庫之間,數(shù)據(jù)庫與文件之間相互導(dǎo)入導(dǎo)出數(shù)據(jù)的腳本,是大數(shù)據(jù)處理的首選語言。

3.3 數(shù)據(jù)可視化

豐富的可視化數(shù)據(jù)圖形能夠更好地對數(shù)據(jù)進行展示。利用數(shù)據(jù)可視化,可方便分析人員從宏觀上了解數(shù)據(jù)的形態(tài)和分布,或者進行最后的結(jié)果展示。

Python提供了豐富的數(shù)據(jù)可視化工具,如pandas、Seaborn、Bokeh、matplotlib等。下面以matplotlib為例說明如何利用Python完成數(shù)據(jù)繪圖與可視化。

假定我們要展現(xiàn)的數(shù)據(jù)用CSV格式保存,內(nèi)容見表3。目標(biāo)是基于matplotlib進行直觀的數(shù)據(jù)總體分布展示,例如利用直方圖統(tǒng)計年齡分布、利用箱體圖展示薪資水平、利用散點圖繪制年齡與收入的相關(guān)關(guān)系。完整代碼如下:

import matplotlib.pyplot as plt

import pandas as pd

df = pd.read_csv("example.csv") /* ?x取數(shù)據(jù) */

fig = plt.figure()

ax1 = fig.add_subplot(1,4,1) /* 定義展示布局 */

ax1.hist(df["Age"], bins = 5) /* 定義直方圖 */

plt.axis([20,45,0,5])

plt.title("Age distribution")

plt.xlabel("Age")

plt.ylabel("Employee")

plt.show()

ax2 = fig.add_subplot(1,4,2) /* 確定圖在畫布中的位置 */

ax2.boxplot(df["Age"]) /* 定義箱線圖 */

ax3 = fig.add_subplot(1,4,3)

ax3.bar(df["Age"],df["Income"]) /* 定義條形圖 */

ax3.set_title("Income distribution")

ax3.set_xlabel("Age")

ax3.set_ylabel("Income")

ax4 = fig.add_subplot(1,4,4)

ax4.scatter(df["Age"],df["Income"]) /* 定義散點圖 */

ax4.set_title("Income distribution")

ax4.set_xlabel("Age")

ax4.set_ylabel("Income")

plt.show()

得到的可視化效果如圖1所示。

Python的開放性還表現(xiàn)為利用支持庫,實現(xiàn)如圖1所示的各類統(tǒng)計效果和復(fù)雜的展示(如地圖、熱力圖以及復(fù)雜網(wǎng)絡(luò)等)。此外,除了構(gòu)建在Python之上的原生庫,還有大量其他的數(shù)據(jù)可視化工具包(如基于Javascript的Plot.ly、百度的Echart等),這些工具包同時也提供Python的調(diào)用封裝,豐富了基于Python的可視化效果,體現(xiàn)了強大的Python計算生態(tài)。

3.4 圖像處理與深度神經(jīng)網(wǎng)絡(luò)

深度學(xué)習(xí)的出現(xiàn)點燃了研究者對神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)的研究熱情,特別是基于Google Tensorflow的AlphaGo接連擊敗世界圍棋冠軍,更加吸引了人們對深度學(xué)習(xí)的關(guān)注。在深度學(xué)習(xí)領(lǐng)域,很多優(yōu)秀的開源平臺與框架(如Tensorflow、Caffe、Theano、MXNet等)都提供Python接口。這也從側(cè)面反映出Python計算生態(tài)已經(jīng)建立。下面以Tensorflow提供的Python接口為例,介紹Python在圖像處理與深度神經(jīng)網(wǎng)絡(luò)方面的應(yīng)用。

卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的一個重要模型。Tensorflow已經(jīng)屏蔽了關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu),如神經(jīng)元函數(shù)、拓撲連接狀態(tài)等。程序員只需要通過參數(shù)指定,就能完成網(wǎng)絡(luò)模型的設(shè)計,例如

conv1 = tf.layers.conv2d(inputs=input_layer,filters=32,kernel_size=[5, 5], padding="same",activation=tf.nn.relu)

pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2, 2], strides=2)

通過設(shè)置輸入層ID、激活函數(shù)、padding方法、核大小等參數(shù),就可以唯一確定輸入層、卷積層、池化層,再通過調(diào)整參數(shù)并選擇一定的學(xué)習(xí)算法,結(jié)合pillow、scikit-image等基于Python的圖像處理工具包,從而可以利用深度網(wǎng)絡(luò)自動完成特征學(xué)習(xí),完成模式識別或圖像分類工作。

第8篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

關(guān)鍵詞:人工智能;云計算;大數(shù)據(jù)

最近火熱的美劇《西部世界》里傳遞出很多關(guān)于人工智能的信息,在圍繞如何突破機器極限,形成自主意識方面,提出了富有科幻現(xiàn)實色彩的方法-冥想程序, 將意識形成描繪成了“走迷宮”的過程,同時在道德層面又一次將“人工智能是否能成為有別于人類的另一個物種”的問題呈現(xiàn)在廣大觀眾面前。

“人工智能”(AI)這一概念最早由馬文?明斯基和約翰?麥卡錫于1956年的“達特茅斯會議”上共同提出。1960年,麥卡錫在美國斯坦福大學(xué)建立了世界上第一個人工智能實驗室。經(jīng)過近幾年互聯(lián)網(wǎng)的飛速發(fā)展,AI對企業(yè)甚至是行業(yè)產(chǎn)生了巨大而又深遠的影響。機器學(xué)習(xí),尤其是深度學(xué)習(xí)技術(shù)成為人工智能發(fā)展的核心。越來越多的硬件供應(yīng)商專為深度學(xué)習(xí)和人工智能定制設(shè)計芯片。如IBM的人腦模擬芯片SyNAPSE(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,自適應(yīng)塑料可伸縮電子神經(jīng)形態(tài)系統(tǒng))芯片,含有100萬個可編程神經(jīng)元,2.56億個可編程突觸,每消耗一焦耳的能量,可進行460億突觸運算。

云計算和大數(shù)據(jù)作為人工智能的基礎(chǔ), 在工業(yè)制造等眾多場景中得到了廣泛應(yīng)用,比如很多工廠都在傳送帶上加裝了傳感器,將壓力、溫度、噪音和其他一些參數(shù)實時傳到云端,將工廠真正連上網(wǎng)絡(luò),然后利用人工智能的算法對這些數(shù)據(jù)進行比對,由此提前為工廠提供預(yù)警和遠程檢測服務(wù)。這種將生產(chǎn)流程及產(chǎn)品通過物聯(lián)網(wǎng)連接到云端,然后利用算法進行大數(shù)據(jù)分析的模式,將在更多的行業(yè)被廣泛應(yīng)用。

目前人工智能主要有10個應(yīng)用子領(lǐng)域,分別是機器學(xué)習(xí)、計算機視覺、智能機器人、虛擬個人助理、自然語音處理、實時語言翻譯、情感感知計算、手勢控制、推薦引擎及協(xié)同過濾、視頻內(nèi)容自動識別。各方向處于不同的發(fā)展階段,發(fā)展程度有高有低。但驅(qū)動發(fā)展的先決條件主要體現(xiàn)在感知能力、理解能力、學(xué)習(xí)能力、交互能力四個方面。

1 感知能力

目前人工智能的感知主要通過物聯(lián)網(wǎng)來實現(xiàn),它提供了計算機感知和控制物理世界的接口與手段,能夠采集數(shù)據(jù)、記憶,分析、傳送數(shù)據(jù),進行交互、控制等。比如攝像頭和相機記錄了關(guān)于世界的大量圖像和視頻,麥克風(fēng)記錄了語音和聲音,各種傳感器將它們感受到的世界數(shù)字化。這些傳感器就如同人類的五官,是智能系統(tǒng)的數(shù)據(jù)輸入,是感知世界的方式。

2 理解能力

智能系統(tǒng)不同于人腦,沒有數(shù)以千億的神經(jīng)元,對事物問題的理解在現(xiàn)階段還很大程度上依賴于處理器的計算分析能力。近年來,基于GPU(圖形處理器)的大規(guī)模并行計算異軍突起,擁有遠超CPU的并行計算能力。從處理器的計算方式來看,CPU計算使用基于x86指令集的串行架構(gòu),適合盡可能快的完成一個計算任務(wù)。而GPU誕生之初是為了處理3D圖像中的上百萬個像素圖像,擁有更多的內(nèi)核去處理更多的計算任務(wù)。因此GPU具備了執(zhí)行大規(guī)模并行計算的能力。云計算的出現(xiàn)、GPU的大規(guī)模應(yīng)用使得集中化數(shù)據(jù)計算處理能力變得空前強大。

3 學(xué)習(xí)能力

學(xué)習(xí)能力的培養(yǎng)類似人類需要教材和訓(xùn)練。據(jù)統(tǒng)計,2015年全球產(chǎn)生的數(shù)據(jù)總量達到了十年前的20多倍,大數(shù)據(jù)的發(fā)展為人工智能的學(xué)習(xí)和發(fā)展提供了非常好的基礎(chǔ)。機器學(xué)習(xí)是人工智能的基礎(chǔ),而大數(shù)據(jù)和以往的經(jīng)驗就是人工智能學(xué)習(xí)的書本,以此優(yōu)化計算機的處理性能。不可忽視的是近年來科技巨頭為了提前布局AI生態(tài),紛紛開源平臺工具,極大地豐富了機器訓(xùn)練的素材和手段。如谷歌了新的機器學(xué)習(xí)平臺TensorFlow,所有用戶都能夠利用這一強大的機器學(xué)習(xí)平臺進行研究,被稱為人工智能界的Android。IBM宣布通過Apache軟件基金會免費為外部程序員提供System ML人工智能工具的源代碼。微軟則開源了分布式機器學(xué)習(xí)工具包DMTK,能夠在較小的集群上以較高的效率完成大規(guī)模數(shù)據(jù)模型的訓(xùn)練,并于2016年7月推出了開源Project Malmo項目,用于人工智能訓(xùn)練。

4 交互能力

第9篇:卷積神經(jīng)網(wǎng)絡(luò)的深度范文

在國內(nèi),百度DuerOS 2.0,希望成為新標(biāo)桿,阿里ET大腦又開啟新征程。

國外

谷歌:正式TensorFlow Lite可在移動設(shè)備上運行深度學(xué)習(xí)

今年5月,在GoogleI/O開發(fā)者大會上,Google宣布了一個專門針對移動設(shè)備優(yōu)化系統(tǒng)的TensorFlow新版本。11月,正式了TensorFlow Lite。

據(jù)了解,這款被稱為TensorFlow Lite的軟件庫,是可在移動設(shè)備上運行的深度學(xué)習(xí)工具,它允許開發(fā)人員在用戶的移動設(shè)備上實時運行人工智能應(yīng)用。此外,自TensorFlow Lite正式公布以來,已經(jīng)出現(xiàn)了多個安裝在移動設(shè)備上具有類似功能的學(xué)習(xí)軟件庫,包括蘋果的CoreML、Clarifai人工智能云端訓(xùn)練服務(wù),以及華為Mate10使用的麒麟970人工智能處理器。

亞馬遜:AWS re:Invent 2017大會AWS云推出新品EKS

11月,在亞馬遜舉辦的AWS re:Invent 2017大會上,公司了22款新品,分別涉及計算能力、數(shù)據(jù)庫、機器學(xué)習(xí)、智能硬件和IOT等領(lǐng)域,尤其是在計算能力、數(shù)據(jù)庫方面對AWS云服務(wù)進行了升級。

其中,AWS云推出了新品EKS,是AWS云上托管的Kubernete容器服務(wù),不僅兼容多云環(huán)境,還具備高可用性、自動部署,自主升級等優(yōu)勢,并可與AWS上其他服務(wù)集成,兩個平臺可無縫集成,在ECS中的應(yīng)用同樣可以使用AWS其它服務(wù)。

FB:Pytorch 0.3實現(xiàn)多方優(yōu)化增加對ONNX支持

今年初,F(xiàn)acebook在機器學(xué)習(xí)和科學(xué)計算工具Torch的基礎(chǔ)上,針對Python語言了一個全新的機器學(xué)習(xí)工具包PyTorch。日前,這款工具包又迎來了它的0.3.0版本,此版本增加了多個函數(shù)功能,多方面性能均有所提升。

其中,0.3版本中刪掉了Variable.reinforce()等隨機函數(shù),用torch.distributions包來代替。新功能包括構(gòu)建了一個in-built Profiler,能對模型進行瓶頸分析,同時支持CPU和CUDA模型;增加Higher order gradients模塊;以及優(yōu)化器中增加了add_param_group函數(shù),能在構(gòu)建好的優(yōu)化器中增加新的參數(shù)組。除此之外,還增加了新的張量函數(shù)和功能,在新版本中,能通過ONNX將模型遷移到其他框架上。

IBM:強化AI實力Deep Learning Impact軟件工具

11月,IBM公布了一款最新軟件Deep Learning Impact,其幫助用戶開發(fā)的AI模型可使用流行的開源、深度學(xué)習(xí)框架,例如TensorFlow和Caffee。12月,這款工具被添加到IBM的Spectrum Conductor軟件中。

除了軟件,IBM還推出了為AI量身定制的基于Power9處理器的新系統(tǒng)。據(jù)了解,該系統(tǒng)可以在Power9 CPU和硬件加速器(例如GPU和FPGA)之間加速傳輸數(shù)據(jù)。此外,Power9將成為首個片上支持最新高速連接器(包括Nvidia下一代NVLink、OpenCAPI 3.0和PCIe 4.0)的商用平臺。

國內(nèi)

百度:DuerOS 2.0搭載AI硬件渡鴉raven H樹立新標(biāo)桿

在今年的百度世界大會上,主打下一代人機交互的DuerOS迎來一次重大升級,推出了2.0版本。據(jù)官方資料,DuerOS 2.0主要帶來了兩個變化:其一,是小度智能設(shè)備開放平臺的升級;其二,則是小度技能開放平臺的全新。至此,基于語音交互,DuerOS形成了兩個開放式平臺,可以對接設(shè)備開發(fā)商、生態(tài)合作伙伴、線上線下服務(wù)提供商。

此外,百度世界大會上同時了人工智能硬件產(chǎn)品渡鴉raven H,這款產(chǎn)品通過搭載DuerOS 2.0,在功能和用戶體驗上樹立了新的標(biāo)桿。

騰訊:騰訊云正式Supermind用人工智能方式實現(xiàn)網(wǎng)絡(luò)規(guī)劃

11月,騰訊云正式SUPERMIND智能網(wǎng)絡(luò)產(chǎn)品。據(jù)介紹,相比此前網(wǎng)絡(luò)產(chǎn)品,SUPERMIND智能網(wǎng)絡(luò)將擁有高性能、全球互聯(lián)、智能化等三大特點。

據(jù)了解,用人工智能方式實現(xiàn)網(wǎng)絡(luò)規(guī)劃、建設(shè)以及運維的全流程,是騰訊云SUPERMIND網(wǎng)絡(luò)產(chǎn)品最大的亮點。騰訊云SUPERMIND智能網(wǎng)絡(luò)能夠結(jié)合幾萬條線路特征智能規(guī)劃,通過歷史用量分析、網(wǎng)絡(luò)路徑分析、用戶反饋分析、節(jié)點規(guī)劃建議、專線擴容建議等方面,合理規(guī)劃出網(wǎng)絡(luò)建設(shè)路線,大幅縮短規(guī)劃時間,節(jié)約時間成本。

阿里巴巴:ET大腦獲世界互聯(lián)網(wǎng)領(lǐng)先科技成果18強

自去年8月阿里巴巴推出ET大腦,一年多來已經(jīng)被用來解決和探索社會經(jīng)濟發(fā)展當(dāng)中依靠人腦所無法解決的棘手問題。據(jù)阿里巴巴集團CEO張勇介紹:“整個ET大腦有非常多的人工智能技術(shù),不僅僅是機器視覺、語音識別、自然語言處理等單個的AI技術(shù),更重要的是這些技術(shù)有機整體的實現(xiàn)和全局的突破?!?/p>

在11月舉辦的第三屆世界互聯(lián)網(wǎng)大會上,15項世界互聯(lián)網(wǎng)領(lǐng)先科技成果同時,其中便包括ET大腦。獲獎原因包括AI、云計算、大數(shù)據(jù)能力與垂直領(lǐng)域知識深度結(jié)合,以及在應(yīng)方面,已廣泛應(yīng)用于城市治理、工業(yè)制造、社會安全等數(shù)十個垂直領(lǐng)域。

中國移動:移動網(wǎng)絡(luò)業(yè)界首個AI平臺“九天”

12月,中國移動面向業(yè)界首個AI平臺“九天”。

據(jù)了解,該平臺可以拆分出三個方面:第一方面,產(chǎn)品的應(yīng)用服務(wù),包括運營、連接、服務(wù)三大領(lǐng)域,旗下分別包括智能營銷、智能決策、智能網(wǎng)絡(luò)、智能物聯(lián)以及智能客服等領(lǐng)域;第二方面,AI核心能力層可以將其處理的數(shù)據(jù)自主分為語音語言類型、圖像識別類型等;第三方面,“九天”的深度學(xué)習(xí)平臺是中國移動首款基于GPU的深度學(xué)習(xí)訓(xùn)練平臺。

中科視拓:推出深度學(xué)習(xí)服務(wù)平臺SeeTaaS將深度學(xué)習(xí)開發(fā)過程簡化

10月,中科視拓推出一站式企業(yè)級深度學(xué)習(xí)平臺SeeTaaS,主要用于研發(fā)人臉識別、手勢識別、無人機視覺、視頻結(jié)構(gòu)化分析等在內(nèi)的企業(yè)級解決方案。據(jù)了解,該平臺可以提供深度學(xué)習(xí)相關(guān)的數(shù)據(jù)、算法、算力等服務(wù),同時將深度學(xué)習(xí)的開發(fā)過程簡化為:上傳數(shù)據(jù)、選擇算法、自動調(diào)參、輸出訓(xùn)練模型、模型批量測試、模型跨平臺部署等。

應(yīng)用方面,中科視拓已與中國平安、中國航天科技、中國電信、華為、百度、三星、高通等企業(yè)達成合作。

EasyStack:推出全球首個同時支持GPU和FPGA開源云平臺

在2017中國開源產(chǎn)業(yè)峰會暨第21屆中國國際軟件博覽會分論壇上,EasyStack正式推出全球首個同時支持GPU和FPGA異構(gòu)計算的人工智能開源云平臺ESCould AI。