前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)過(guò)擬合的表現(xiàn)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);RBF神經(jīng)網(wǎng)絡(luò);損傷識(shí)別;損傷預(yù)測(cè)
Abstract:In this paper, the BP neural network and the RBF neural network are compared combined with practical engineering examples. The analysis result shows that the RBF neural network was closer to the actural working conditions of structure.Then, the Least squares method was used to fit and predict the deflection damage parameters.Finally, the predicted data was recognised by using RBF neural network, to achieve the objectve of prevention.
Keywords: BP neural network; RBF neural network; damage recognition; damage prediction
中圖分類號(hào):TU74文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):
目前,神經(jīng)網(wǎng)絡(luò)由于自身的特性,在損傷模式識(shí)別領(lǐng)域中有著越來(lái)越廣泛的應(yīng)用。當(dāng)橋梁結(jié)構(gòu)出現(xiàn)損傷時(shí),結(jié)構(gòu)中的各個(gè)參量或部分參量將表現(xiàn)出與正常狀態(tài)下的不同特征。橋梁損傷識(shí)別的主要任務(wù)就是如何找到損傷的特征描述,并利用其進(jìn)行損傷診斷和結(jié)構(gòu)安全度的評(píng)估。前向BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)的學(xué)習(xí)算法屬于有教師型的。這種算法模型具有很好的推廣能力,用于損傷模式識(shí)別的效果比較好。訓(xùn)練好的BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)計(jì)算速度快、內(nèi)存消耗低,可用于實(shí)時(shí)監(jiān)測(cè)和診斷。以下,著重介紹BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)。
1基于BP算法的多層前饋網(wǎng)絡(luò)模型
采用BP算法的多層前饋網(wǎng)絡(luò)是至今為止應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò),BP網(wǎng)絡(luò)是一種具有三層或三層以上的神經(jīng)網(wǎng)絡(luò),包括輸入層、中間層(隱層)和輸出層。上下層之間實(shí)現(xiàn)全連接,而每層神經(jīng)元之間無(wú)連接。在多層前饋網(wǎng)絡(luò)的應(yīng)用中,以單隱層網(wǎng)絡(luò)的應(yīng)用最為普遍。一般習(xí)慣將單隱層前饋網(wǎng)絡(luò)稱為三層前饋網(wǎng)或三層感知器。
2徑向基函數(shù)(RBF)網(wǎng)絡(luò)
徑向基函數(shù)(Radial-Basis Function,RBF)網(wǎng)絡(luò)包括三層,輸入層由信號(hào)源節(jié)點(diǎn)(感知單元)組成,它們將網(wǎng)絡(luò)與外界環(huán)境連結(jié)起來(lái);徑向基隱層含S1個(gè)神經(jīng)元,線性輸出層含S2個(gè)神經(jīng)元。分別是兩層網(wǎng)絡(luò)的權(quán)值和閾值;S1、S2是兩層的神經(jīng)元的個(gè)數(shù);是兩層的輸出;P是輸入;下標(biāo)表示量的行列數(shù)。隱層中的神經(jīng)元采用徑向基傳遞函數(shù)()。輸出層中的神經(jīng)元采用線性傳遞函數(shù)()。
3小溝橋橋跨結(jié)構(gòu)損傷識(shí)別模型
小溝橋的各個(gè)子系統(tǒng)運(yùn)行以來(lái),工作狀態(tài)良好,性能可靠。經(jīng)過(guò)比對(duì)實(shí)驗(yàn),該系統(tǒng)能夠真實(shí)的反映橋梁的各個(gè)待測(cè)參數(shù),并且具有自動(dòng)歸納分類的功能。小溝橋右幅橋在某兩年24個(gè)月的數(shù)據(jù)訓(xùn)練樣本格式為,輸入向量依次為撓度、振動(dòng)、應(yīng)力、溫度、載重、通行量,目標(biāo)向量是撓度和應(yīng)變兩項(xiàng)的期望輸出值(“0”表示完好狀態(tài),“1”表示危險(xiǎn)狀態(tài))。同時(shí),對(duì)模型進(jìn)行損傷仿真的模擬訓(xùn)練。接下來(lái),借助于MATLAB7里所對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)工具箱,分別用BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)對(duì)以上表1所規(guī)定的數(shù)據(jù)樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練。
3.1基于BP網(wǎng)絡(luò)的損傷識(shí)別
由于網(wǎng)絡(luò)輸入變量已經(jīng)確定,需要進(jìn)行歸一化處理,這里將其變換在[0,1]的范圍內(nèi),經(jīng)過(guò)歸一化處理的數(shù)據(jù)對(duì)于神經(jīng)網(wǎng)絡(luò)更容易訓(xùn)練和學(xué)習(xí)。利用以下代碼來(lái)創(chuàng)建以上剛剛設(shè)計(jì)的網(wǎng)絡(luò)。
Threshold=[01;01; 01;01;01;01]
net=newff(threshold,[13,2],{‘tansig’,‘logsig’},‘trainlm’);
其中,變量threshold定義了輸入向量的最大值和最小值。接下來(lái),對(duì)所建網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)調(diào)整,使網(wǎng)絡(luò)的輸出誤差達(dá)到最小,滿足實(shí)際應(yīng)用的要求。訓(xùn)練函數(shù)trainlm是利用Levenberg-Marquardt算法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的。
網(wǎng)絡(luò)訓(xùn)練結(jié)果為:
TRAINLM, Epoch 0/1 000, MSE 0.471 248/0.001, Gradient 2.116 8/1e−010
TRAINLM, Epoch 19/1 000, MSE 0.000 158 792/0.001, Gradient 0.037 399 1/1e−010
TRAINLM, Performance goal met.
經(jīng)過(guò)19次訓(xùn)練后,網(wǎng)絡(luò)的性能就達(dá)到了要求,并利用原始樣本輸入數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,得到逼近誤差曲線。
3.2基于RBF網(wǎng)絡(luò)的損傷識(shí)別
利用函數(shù)newrb創(chuàng)建一個(gè)徑向基神經(jīng)網(wǎng)絡(luò),調(diào)用格式為:
[net,tr]=newrb(P,T,GOAL,SPREAD,MN,DF);
在網(wǎng)絡(luò)設(shè)計(jì)過(guò)程中,需要用不同的SPREAD值進(jìn)行嘗試,以確定一個(gè)最優(yōu)值。最終,確定網(wǎng)絡(luò)創(chuàng)建函數(shù)為:net=newrb (P, T, 0,0.2,25,5);
通過(guò)上述代碼,創(chuàng)建了一個(gè)目標(biāo)誤差為0、徑向基函數(shù)分布密度為0.2、中間層神經(jīng)元個(gè)數(shù)最大值為25、顯示間隔為5的RBF網(wǎng)絡(luò)。當(dāng)中間層神經(jīng)元個(gè)數(shù)增至25時(shí),網(wǎng)絡(luò)輸出的誤差SSE已經(jīng)非常小了,數(shù)量級(jí)為10−31。
以訓(xùn)練樣本對(duì)上面建立的RBF網(wǎng)絡(luò)進(jìn)行測(cè)試,得到逼近誤差曲線數(shù)量級(jí)為10−16。因此,可以判定經(jīng)過(guò)訓(xùn)練后,網(wǎng)絡(luò)是可以滿足要求的。
3.3BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)比對(duì)
綜合對(duì)比兩種網(wǎng)絡(luò)的訓(xùn)練誤差、逼近誤差等,發(fā)現(xiàn)BP網(wǎng)絡(luò)由于收斂速度慢、較長(zhǎng)的訓(xùn)練時(shí)間、網(wǎng)絡(luò)往往存在很大的冗余性,在一定程度上增加了網(wǎng)絡(luò)學(xué)習(xí)的負(fù)擔(dān),并且網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性。因此,BP網(wǎng)絡(luò)明顯不如RBF網(wǎng)絡(luò),認(rèn)為用RBF網(wǎng)絡(luò)更能準(zhǔn)確地評(píng)估橋跨結(jié)構(gòu)的損傷,接近于實(shí)際工作狀態(tài)。
3.4最小二乘擬合的Matlab設(shè)計(jì)與實(shí)現(xiàn)
Matlab軟件是集數(shù)值計(jì)算、符號(hào)運(yùn)算及出色的圖形處理、程序語(yǔ)言設(shè)計(jì)等強(qiáng)大功能于一體的科學(xué)計(jì)算語(yǔ)言。由于撓度是橋梁工作性能的一個(gè)重要參數(shù),它更加直接地反應(yīng)了橋梁結(jié)構(gòu)的工作狀況,所以接下來(lái)以撓度數(shù)據(jù)為例運(yùn)用最小二乘法進(jìn)行曲線擬合,并預(yù)測(cè)。
確定參量的測(cè)量值:
=[1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9];
=[11.83 12.48 11.84 11.97 11.76 11.48 11.68 11.89 12.57 11.49 11.52 11.59 11.45 11.61 11.53 11.83 12.52 12.41 12.13 11.95 12.26];
用Matlab語(yǔ)言中的plot函數(shù)的曲線散點(diǎn)趨勢(shì)圖,以此圖對(duì)比典型曲線圖,選擇合適的經(jīng)驗(yàn)公式,確定多項(xiàng)式的擬合次數(shù),多次實(shí)驗(yàn)后,確定為4;
Matlab系統(tǒng)設(shè)計(jì)polyfit函數(shù)采用最小二乘法原理對(duì)給定的數(shù)據(jù)組進(jìn)行多項(xiàng)式擬合,最后給出擬合的多項(xiàng)式系數(shù),溫度擬合曲線的多項(xiàng)式為:
并擬合接下來(lái)的兩個(gè)月的撓度值;
同理,對(duì)振動(dòng)、應(yīng)力、溫度、載重、通行量項(xiàng)目的數(shù)據(jù)進(jìn)行擬合。
3.5對(duì)預(yù)測(cè)數(shù)據(jù)進(jìn)行損傷評(píng)估
以表3中最后兩列的預(yù)測(cè)數(shù)據(jù)作為輸入量,即
p_test=[12.11 3.31 0.91 7.66 162.9534 30.5539;
11.93 3.32 0.92 −3.12 162.6354 30.5567];
經(jīng)過(guò)歸一化處理后為P_test,利用先前所建立的RBF網(wǎng)絡(luò)來(lái)進(jìn)行損傷評(píng)估,y=sim(net,P_test);
得到兩個(gè)指標(biāo)的損傷指數(shù)分別為:[0.2187e−0080.0001e−008;−0.0144e−0080.0629e−008],數(shù)量級(jí)為10−8,接近于“0”,表明結(jié)構(gòu)在接下來(lái)的兩個(gè)月應(yīng)該處于完好狀態(tài)。
4結(jié)束語(yǔ)
針對(duì)小溝橋的歷史數(shù)據(jù),分別用BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)對(duì)樣本數(shù)據(jù)進(jìn)行損傷訓(xùn)練、測(cè)試。綜合對(duì)比后,采用RBF網(wǎng)絡(luò)對(duì)橋跨結(jié)構(gòu)進(jìn)行損傷評(píng)估,并作為后續(xù)對(duì)橋梁結(jié)構(gòu)進(jìn)行整體評(píng)估的兩個(gè)底層指標(biāo)。
采用最小二乘法對(duì)24個(gè)月以來(lái)的歷史數(shù)據(jù)進(jìn)行曲線擬合,預(yù)測(cè)出后續(xù)的兩組數(shù)據(jù);然后對(duì)預(yù)測(cè)出來(lái)的兩組數(shù)據(jù)進(jìn)行損傷識(shí)別,得出兩個(gè)指標(biāo)的損傷指數(shù),從而真正達(dá)到預(yù)測(cè),進(jìn)而達(dá)到預(yù)防的目的。
參考文獻(xiàn):
[1] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.3:89~108
[2] 胡伍生.神經(jīng)網(wǎng)絡(luò)理論及其工程應(yīng)用[M].北京:測(cè)繪出版社,2006:63~83
[3] 王可,毛志.基于Matlab實(shí)現(xiàn)最小二乘曲線擬合[J].北京廣播學(xué)院學(xué)報(bào)(自然科學(xué)版),2002,12(2):52~56
[4] 李麗,王振領(lǐng).MATLAB工程計(jì)算機(jī)應(yīng)用[M].北京:人民郵電出版社,2001
關(guān)鍵詞: 鐵路交通; 信息預(yù)測(cè); 數(shù)據(jù)融合; 神經(jīng)網(wǎng)絡(luò)
在城市地鐵交通中,各車站交通流量信息(如候乘數(shù)量、下車數(shù)量等) 的準(zhǔn)確預(yù)測(cè)有利于地鐵運(yùn)行高效、及時(shí)地調(diào)度,從而既達(dá)到增加效益的經(jīng)濟(jì)目的,又可以更好地滿足人們的乘車需求。傳統(tǒng)的預(yù)測(cè)方法有回歸分析算法以及Kalman 濾波等。這些方法假定過(guò)程是平穩(wěn)的,系統(tǒng)是線性的,系統(tǒng)的干擾是白噪聲,因此在線性系統(tǒng)平穩(wěn)的隨機(jī)時(shí)間序列預(yù)測(cè)中能夠獲得滿意的結(jié)果。然而,交通問(wèn)題是有人參與的主動(dòng)系統(tǒng),具有非線性和擾動(dòng)性強(qiáng)的特征,前述方法難以奏效,表現(xiàn)為以下缺點(diǎn): ① 每次采樣的數(shù)據(jù)變化較小時(shí)適用,數(shù)據(jù)變化大誤差就大; ② 預(yù)測(cè)值的變化總是滯后于實(shí)測(cè)值的變化; ③ 無(wú)法消除奇異信息的影響?;谛〔ǚ治龅膭?dòng)態(tài)數(shù)據(jù)預(yù)測(cè)方法以小波變換后的數(shù)據(jù)進(jìn)行預(yù)測(cè),克服了傳統(tǒng)預(yù)測(cè)方法不能消除奇異信息的缺點(diǎn), 有效地預(yù)測(cè)動(dòng)態(tài)的流量信息[ 1 ] 。但該方法只能對(duì)單個(gè)的數(shù)據(jù)序列進(jìn)行處理,而事實(shí)上能夠用于預(yù)測(cè)的數(shù)據(jù)可以是多方面的。
數(shù)據(jù)融合(Data2Fusion) 技術(shù)起源并發(fā)展于軍事領(lǐng)域,主要用于目標(biāo)的航跡跟蹤、定位與身份識(shí)別以及態(tài)勢(shì)評(píng)估等[ 2 ] 。傳統(tǒng)的數(shù)據(jù)融合技術(shù)大多采用概率理論(如Bayes 決策理論) 對(duì)多種信息的獲取與處理進(jìn)行研究,從而去掉信息的無(wú)用成分,保留有用成分[ 3 ] 。在信息處理中,分別運(yùn)用各種體現(xiàn)數(shù)據(jù)不同屬性特征的方法處理(如預(yù)測(cè)) 后進(jìn)行融合是一個(gè)有待深入研究的問(wèn)題。為了充分利用各方面已有的數(shù)據(jù),獲得可靠的交通流量動(dòng)態(tài)預(yù)測(cè),本文借鑒數(shù)據(jù)融合的基本思想,提出了在數(shù)據(jù)處理方法上的融合預(yù)測(cè)方法。
1 流量融合預(yù)測(cè)模型
1. 1 預(yù)測(cè)模型的結(jié)構(gòu)
由于預(yù)測(cè)對(duì)象的復(fù)雜性,為了表現(xiàn)與預(yù)測(cè)對(duì)象相關(guān)聯(lián)的其他對(duì)象或?qū)傩?,每個(gè)關(guān)聯(lián)對(duì)象(屬性) 用一個(gè)時(shí)間序列來(lái)表示,作為預(yù)測(cè)對(duì)象的相關(guān)序列。所有用于預(yù)測(cè)的相關(guān)序列構(gòu)成預(yù)測(cè)對(duì)象的相關(guān)序列集。由于在預(yù)測(cè)中具有不同的作用,各相關(guān)序列將使用不同的處理和預(yù)測(cè)方法。在相關(guān)序列集上的地鐵客流量融合預(yù)測(cè)模型結(jié)構(gòu),如圖1 所示。
下面針對(duì)城市地鐵車站客流量的預(yù)測(cè)進(jìn)行論述。
1. 2 構(gòu)造相關(guān)序列集
為了預(yù)測(cè)車站(序號(hào)為0)在第i 天t 時(shí)刻的流量^F0 i(t) ( 實(shí)測(cè)值為F0 i(t)) ,設(shè)t 時(shí)刻^F0 i(t)的相關(guān)時(shí)間序列集為f(t) = {fj(t) ,1 ≤ j ≤ n} ( 1 ) 式中,fj(t)為t時(shí)刻^F0 i(t)的相關(guān)時(shí)間序列; n 為相關(guān)時(shí)間序列數(shù)。
為了獲得精確的預(yù)測(cè),可以根據(jù)關(guān)聯(lián)特性構(gòu)造任意多個(gè)相關(guān)時(shí)間序列。本文意在闡明本算法的基本思想,將流量數(shù)據(jù)僅僅構(gòu)造為3 類相關(guān)序列:當(dāng)前序列、歷史序列和鄰站序列。
當(dāng)前序列 預(yù)測(cè)時(shí)刻t之前本站最近k次流量按時(shí)間先后記錄下來(lái)的數(shù)據(jù)構(gòu)成的時(shí)間序列為當(dāng)前序列,即
f1 (t) = { F0 i(t -l),1 ≤ l ≤ k} ( 2 )
該序列數(shù)據(jù)的主要影響因素是時(shí)刻,同時(shí)還受人為、氣溫、天氣等其他擾動(dòng)因素的影響,數(shù)據(jù)分布的非線性特性較大,頻帶較寬。第l 班列車的流量如圖2 所示。
歷史序列 同為工作日或同為節(jié)假日的相鄰數(shù)天,其流量曲線形狀相對(duì)類似,流量曲線相似的日期在預(yù)測(cè)中具有較大的參考意義。本站最近m 天在時(shí)刻t 的流量按日期先后記錄下來(lái)的數(shù)據(jù)構(gòu)成的時(shí)間序列為歷史序列,即f2 (t) = { F0 i-p(t) ,1 ≤ p ≤ m} ( 3 )
工作日和節(jié)假日流量差別較大,可將它們分類處理。該序列整體分布較平穩(wěn),有震蕩,但頻帶較窄。第p個(gè)工作日在時(shí)刻t的流量如圖3 所示。
鄰站序列 圖4 為本站與鄰近2 個(gè)車站24 h 的流量曲線經(jīng)DB2 小波3 層變換后的近似分量,可見(jiàn)各分量關(guān)聯(lián)性較大。如果根據(jù)以前的數(shù)據(jù)將各鄰近車站相互關(guān)系解算出來(lái),就可以利用這種函數(shù)關(guān)系預(yù)測(cè)時(shí)刻t在本站的流量。最近m天在時(shí)刻t 的流量按日期先后記錄下來(lái)的各鄰站歷史序列為本站的鄰站序列,即
qf2 +q(t) = { Fi-p(t) ,1 ≤ p ≤ m,1 ≤ q ≤ s} ( 4 )
q式中, Fi-p(t)表示第q個(gè)鄰近站的第(i -p)天的流量;s 表示鄰近站數(shù)。
1.3 相關(guān)序列的預(yù)測(cè)
由于各相關(guān)序列在預(yù)測(cè)中具有不同的影響,且分布規(guī)律和特點(diǎn)差異較大,因而各序列使用不同的預(yù)測(cè)方法。本文對(duì)當(dāng)前序列進(jìn)行小波分解后用Kalman 預(yù)測(cè),對(duì)歷史序列直接進(jìn)行Kalman 預(yù)測(cè),對(duì)鄰站序列用冪級(jí)數(shù)多項(xiàng)式進(jìn)行擬合。
1.3.1 小波分析
根據(jù)設(shè)置的分解指數(shù)η對(duì)序列進(jìn)行小波N 尺度分解,得到一組低頻信號(hào)和N 組高頻信號(hào),對(duì)這N + 1 組信號(hào)分別用Mallat 塔式算法重構(gòu)到原尺度上,得到N + 1 組在原始尺度上的經(jīng)過(guò)分解重構(gòu)處理的信號(hào)。分別對(duì)信號(hào)用Kalman 濾波進(jìn)行預(yù)測(cè),得到N + 1 個(gè)預(yù)測(cè)值,再將這N + 1 個(gè)預(yù)測(cè)值用權(quán)系數(shù)合成最終的預(yù)測(cè)值。具體算法請(qǐng)參見(jiàn)文獻(xiàn)[1 ]。
1.3.2 Kalman 濾波離散線性Kalman 濾波方程為
F(t) = Φ(t -1) F(t -1) + W(t -1)( 5 ) 式中,Φ (t) 為系統(tǒng)狀態(tài)轉(zhuǎn)移量; W(t) 為系統(tǒng)誤差。Kalman 濾波通過(guò)t -1 時(shí)刻的狀態(tài)F(t -1)估計(jì)t 時(shí)刻的狀態(tài)F(t) 。具體算法請(qǐng)參見(jiàn)文獻(xiàn)[1 ]。
1.3.3 多項(xiàng)式擬合
分別對(duì)各鄰站序列用冪級(jí)數(shù)多項(xiàng)式擬合本站數(shù)據(jù),擬合模型如下
n
i
p
^Fp(t) = αp,i(t) F(t) ( 6 )
i=0
i
6 式中, Fp (t)為對(duì)第p個(gè)鄰站在時(shí)刻t 的流量的i 次i 冪;αp,i(t)為Fp (t)的系數(shù)。當(dāng)n= 2 時(shí),上述擬合算法簡(jiǎn)化為線性回歸模型。
1.4 流量的融合預(yù)測(cè)設(shè)預(yù)測(cè)對(duì)象共有n個(gè)相關(guān)的時(shí)間序列fi(t) ,經(jīng)過(guò)預(yù)處理分別為fi(t) ,融合預(yù)測(cè)模型可表示^F(t)在f(t)上的映射,即^F(t) =ζ(f(t)) =ζ(f1 (t) ,f2 (t) ,fn(t)) ( 7 ) 式中,ζ(·)表示映射關(guān)系。特別地,式(7)可簡(jiǎn)化為如下的線性映射組合^F(t) = αi(t)ξ(fi(t)) ( 8 ) i=16
式中,αi(t)為t 時(shí)刻的序列fi (t)的權(quán)系數(shù);ξ(fi (t)) 為以fi (t)為依據(jù)的局部預(yù)測(cè)值。為了確定上述算法中映射關(guān)系ζ(·),本文采用神經(jīng)網(wǎng)絡(luò)進(jìn)行解算。
2 模型的神經(jīng)網(wǎng)絡(luò)解算
神經(jīng)網(wǎng)絡(luò)是由大量簡(jiǎn)單的神經(jīng)元以某種拓?fù)浣Y(jié)構(gòu)廣泛地相互連接而成的非線性動(dòng)力學(xué)系統(tǒng)[4 ]。神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)融合技術(shù)中具有無(wú)法替代的作用,通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)各相關(guān)序列的局部預(yù)測(cè)進(jìn)行最終融合,具體過(guò)程如下。
2.1 數(shù)據(jù)的局部處理
廣州市地鐵某站一個(gè)方向的流量數(shù)據(jù)是以每班列車到站上車的人數(shù)記錄的(流量單位:人/班) 。根據(jù)2002 年5 月1 日 2003 年3 月2 日的流量數(shù)據(jù),運(yùn)用本文算法進(jìn)行預(yù)測(cè)。按照1.2 節(jié)的方法構(gòu)造了4 個(gè)相關(guān)序列:當(dāng)前序列f1 (t) 、歷史序列f2 (t)以及相鄰2 個(gè)車站的鄰站序列f3 (t)和f4 (t) 。 2.2 神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)
因?yàn)? 層神經(jīng)網(wǎng)絡(luò)可以一致逼近任何非線性函數(shù)[5 ]。采用具有單隱層的3 層神經(jīng)網(wǎng)絡(luò)作為模型,即輸入層、隱層和輸出層。
以各相關(guān)序列的局部預(yù)測(cè)值作為輸入向量,實(shí)測(cè)值F(t)為期望輸出,有4 個(gè)輸入節(jié)點(diǎn),1 個(gè)輸出節(jié)點(diǎn)。隱層神經(jīng)元數(shù)量關(guān)系到網(wǎng)絡(luò)的訓(xùn)練速度和精度問(wèn)題。對(duì)于一定數(shù)量的樣本,需要一定數(shù)量的隱層神經(jīng)元數(shù), 神經(jīng)元少了,不能反映樣本的規(guī)律;多了,則神經(jīng)網(wǎng)絡(luò)以過(guò)于復(fù)雜的非線性關(guān)系來(lái)擬合輸入輸出之間的關(guān)系,使得模型的學(xué)習(xí)時(shí)間大大增加。本例中,8 個(gè)隱層神經(jīng)元數(shù)是最好的。以誤差平方和SSE(Sum2Squared Error ) 作為訓(xùn)練評(píng)價(jià)標(biāo)準(zhǔn), SSE = p j (Ypj-Opj)2 ,其中Ypj和Opj分別為輸出層第j個(gè)神經(jīng)元的第p個(gè)樣本的期望輸出和實(shí)際輸出(本例中j= 1 ,p= 60) 。
用MATLAB 的ANN 工具箱構(gòu)造神經(jīng)網(wǎng)絡(luò)。隱層神經(jīng)元的激勵(lì)函數(shù)為tansig 函數(shù)( 正切S 型傳遞函數(shù)),輸出層神經(jīng)元的激勵(lì)函數(shù)為purelin 函數(shù)(線性傳遞函數(shù)),這樣整個(gè)網(wǎng)絡(luò)的輸出可以取任意值。采取批處理學(xué)習(xí)方式和快速BP 算法訓(xùn)練。
2. 3 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
將網(wǎng)絡(luò)的訓(xùn)練標(biāo)準(zhǔn)SSE 設(shè)為64(60 組訓(xùn)練樣本), 利用上述樣本對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練6 000 次時(shí)網(wǎng)絡(luò)的權(quán)值和閾值將達(dá)到最佳值,即達(dá)到了訓(xùn)練目標(biāo)。神經(jīng)網(wǎng)絡(luò)訓(xùn)練目標(biāo)接近過(guò)程,如圖5 所示。
從圖5 中可以看出,訓(xùn)練開(kāi)始時(shí),網(wǎng)絡(luò)收斂速度較快,接近目標(biāo)時(shí)收斂速度會(huì)減慢??梢?jiàn),訓(xùn)練次數(shù)越多,得到的結(jié)果越好。當(dāng)然,這是以訓(xùn)練時(shí)間的增長(zhǎng)作為代價(jià)的。
3 實(shí)驗(yàn)對(duì)比分析
采用本文算法和傳統(tǒng)的Kalman 算法分別對(duì)2003 年3 月2 日的各整點(diǎn)時(shí)刻的流量進(jìn)行預(yù)測(cè)。算法各時(shí)刻均通過(guò)訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè),預(yù)測(cè)與實(shí)測(cè)結(jié)果的比較,如圖6 所示。
傳統(tǒng)的Kalman 濾波是直接在當(dāng)前序列的基礎(chǔ)上進(jìn)行預(yù)測(cè)的, 預(yù)測(cè)與實(shí)測(cè)結(jié)果的比較如圖7 所示。2 種預(yù)測(cè)方法的誤差指標(biāo)對(duì)比見(jiàn)表1 。
表1 實(shí)驗(yàn)結(jié)果對(duì)比
比較可得,由于傳統(tǒng)的Kalman 預(yù)測(cè)方法只能以某一類序列的數(shù)據(jù)作為預(yù)測(cè)基礎(chǔ),無(wú)法利用其他序列信息,且對(duì)變化大的數(shù)據(jù)采樣要求較高,因而具有較大的誤差,而本文所述方法有效地克服了這些缺點(diǎn)。
4 結(jié)論
通過(guò)分析城市地鐵站客流量的相互關(guān)系和特點(diǎn), 在對(duì)流量信息進(jìn)行以預(yù)測(cè)為目的相關(guān)序列集構(gòu)造的基礎(chǔ)上,提出了一種基于數(shù)據(jù)融合的預(yù)測(cè)模型。該預(yù)測(cè)模型不僅是一個(gè)多信息接收和處理的融合模型,而且還是一個(gè)動(dòng)力學(xué)系統(tǒng),網(wǎng)絡(luò)的訓(xùn)練樣本也是動(dòng)態(tài)的,如果訓(xùn)練的次數(shù)適當(dāng),預(yù)測(cè)的精度也可以隨之變化調(diào)整。實(shí)驗(yàn)結(jié)果表明,基于數(shù)據(jù)融合的預(yù)測(cè)與傳統(tǒng)的預(yù)測(cè)方法相比,由于充分利用了所有預(yù)測(cè)信息,在預(yù)測(cè)的準(zhǔn)確程度上有較大提高。
參考文獻(xiàn):
[1 ] 李存軍, 等. 基于小波分析的交通流量預(yù)測(cè)方法[J ] . 計(jì)算機(jī)應(yīng)用, 2003 , 23(12) : 7 —8.
[2 ] 權(quán)太范. 信息融合: 神經(jīng)網(wǎng)絡(luò) 模糊推理理論與應(yīng)用[M] . 北京: 國(guó)防工業(yè)出版社, 2002.
[3 ] . 信息融合技術(shù)[ M ] . 北京: 國(guó)防工業(yè)出版社, 1996.
[關(guān)鍵詞] 藥品;神經(jīng)網(wǎng)絡(luò);組合預(yù)測(cè);需求預(yù)測(cè)
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051
[中圖分類號(hào)] TP183 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2014)08- 0084- 05
0 引 言
隨著人工智能技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)得到了廣泛研究和應(yīng)用。由于神經(jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)能力和較強(qiáng)的非線性處理能力、不依賴于特定數(shù)學(xué)模型等優(yōu)勢(shì),其作為一種預(yù)測(cè)方法已被廣泛應(yīng)用于許多領(lǐng)域。
在醫(yī)藥企業(yè)、醫(yī)藥衛(wèi)生管理領(lǐng)域,藥品需求預(yù)測(cè)一直是管理部門關(guān)心的熱點(diǎn)問(wèn)題。藥品需求除了受由藥品自身屬性影響外,還受國(guó)家政策或醫(yī)藥行業(yè)規(guī)定等因素的影響,如藥品在某地區(qū)是否中標(biāo)、是否為處方藥等;同時(shí),制藥企業(yè)自身制定的定價(jià)、渠道以及促銷等營(yíng)銷策略和銷售團(tuán)隊(duì)的組建制度也對(duì)藥品需求產(chǎn)生不同程度的影響。藥品需求特征的多樣性,決定了藥品需求預(yù)測(cè)本質(zhì)上是一個(gè)復(fù)雜的非線性系統(tǒng)建模問(wèn)題。
國(guó)內(nèi)外眾多學(xué)者對(duì)藥品需求預(yù)測(cè)進(jìn)行了深入的研究,產(chǎn)生了一批有價(jià)值的研究成果。目前,藥品需求預(yù)測(cè)的主要方法包括:回歸分析法、時(shí)間序列分析法、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。這些方法從不同角度出發(fā)建模,均取得一定效果,尤其是BP神經(jīng)網(wǎng)絡(luò),已經(jīng)在藥品預(yù)測(cè)研究中取得了眾多應(yīng)用。盡管相關(guān)討論和研究不斷增多,但是目前常用的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法普遍存在以下問(wèn)題:由于藥品需求特征頗為復(fù)雜的特殊性,運(yùn)用單項(xiàng)預(yù)測(cè)方法對(duì)其進(jìn)行預(yù)測(cè)無(wú)法涵蓋其較多的特征信息,通常表現(xiàn)為對(duì)某類特定的藥品預(yù)測(cè)效果良好,而對(duì)其他藥品則預(yù)測(cè)性能較差,從一定程度上限制了預(yù)測(cè)模型的適用范圍。
本文采用基于神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型來(lái)解決上述問(wèn)題。組合預(yù)測(cè)方法(combined forecasting)是指通過(guò)一定數(shù)學(xué)方法將不同的單項(xiàng)預(yù)測(cè)模型組合起來(lái),綜合利用各種單項(xiàng)預(yù)測(cè)方法所提供的信息,從而達(dá)到提高預(yù)測(cè)精度的目的。組合預(yù)測(cè)方法最早由Bates和Granger[1]于1969年提出,他們認(rèn)為對(duì)于一個(gè)包含系統(tǒng)獨(dú)立信息的單項(xiàng)預(yù)測(cè)方法,與預(yù)測(cè)精度較小的預(yù)測(cè)方法進(jìn)行組合預(yù)測(cè)完全可以增強(qiáng)系統(tǒng)的預(yù)測(cè)性能。
考慮到各種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法的特點(diǎn)及其適用范圍,本文選擇BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法、RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法和基于廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)3種常用的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法作為組合預(yù)測(cè)模型中的單項(xiàng)預(yù)測(cè)方法。在此基礎(chǔ)上,用平均絕對(duì)相對(duì)誤差(MAPE)和方差為衡量標(biāo)準(zhǔn),并根據(jù)設(shè)置的閾值對(duì)單項(xiàng)預(yù)測(cè)方法進(jìn)行篩選,最后選取了MAPE作為最優(yōu)準(zhǔn)則計(jì)算得到權(quán)重,從而建立組合預(yù)測(cè)模型,在提高組合預(yù)測(cè)模型精度的同時(shí),使得組合預(yù)測(cè)模型具有現(xiàn)實(shí)意義。實(shí)驗(yàn)結(jié)果表明,本文提出的模型的預(yù)測(cè)精度高于傳統(tǒng)的線性組合模型的預(yù)測(cè)精度。
1 相關(guān)工作
基于神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法具有很多其他預(yù)測(cè)方法所不具備的優(yōu)點(diǎn),近年來(lái)越來(lái)越被人們所關(guān)注。吳正佳 等(2010)[2]針對(duì)某備貨型企業(yè)的產(chǎn)品需求量,建立了基于良好學(xué)習(xí)能力的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并通過(guò)實(shí)證分析與簡(jiǎn)單移動(dòng)平滑法和加權(quán)移動(dòng)平滑法的預(yù)測(cè)結(jié)果相比較,結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果比其他兩種更為有效果。童明榮 等(2007)[3]提出一種季節(jié)性RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)具有季節(jié)性的產(chǎn)品月度市場(chǎng)需求進(jìn)行預(yù)測(cè),最后利用構(gòu)建好的RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行仿真實(shí)驗(yàn),并與ARIMA模型、分組回歸模型等常用季節(jié)預(yù)測(cè)模型做對(duì)比分析,結(jié)果表明前者的預(yù)測(cè)誤差均方差最小,預(yù)測(cè)精度較高。Maria Cleofé(2005)[4]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)對(duì)圣保羅地區(qū)的降雨量進(jìn)行預(yù)測(cè),并通過(guò)實(shí)證分析與其他線性回歸模型作對(duì)比評(píng)價(jià),實(shí)驗(yàn)結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)有著更好地預(yù)測(cè)效果。此外還有其他很多學(xué)者在交通、航運(yùn)、氣候等多個(gè)領(lǐng)域運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行了預(yù)測(cè)[5-7],不在此贅述。
針對(duì)藥品銷量預(yù)測(cè)這一特定問(wèn)題,國(guó)內(nèi)外部分學(xué)者也做了一定的研究工作,試圖尋找合適的預(yù)測(cè)方法對(duì)藥品需求做出較為準(zhǔn)確的預(yù)測(cè)。馬新強(qiáng) 等(2008)[8]提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測(cè)模型,該文先利用數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)挖掘技術(shù)分析提取了相關(guān)有效的藥品銷售信息作為研究對(duì)象,在此基礎(chǔ)上利用BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行預(yù)測(cè),最后在較為精確銷售量的基礎(chǔ)上提出了一種優(yōu)化的生產(chǎn)決策系統(tǒng)方法。王憲慶 等(2009)[9]利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)藥品超市的藥品銷售情況進(jìn)行預(yù)測(cè)并做了相關(guān)實(shí)證分析,該文通過(guò)觀察藥品預(yù)測(cè)的顯著性差異評(píng)價(jià)模型的性能,最終取得了良好的效果,支持了其BP神經(jīng)網(wǎng)絡(luò)非常適用于資金有限、倉(cāng)儲(chǔ)量不大的藥品超市的結(jié)論。劉德玲(2012)[10]提出了一種針對(duì)大范圍內(nèi)的藥品銷售的預(yù)測(cè)方法。該文利用遺產(chǎn)算法優(yōu)化支持向量機(jī)藥品銷售預(yù)測(cè)方式進(jìn)行預(yù)測(cè),提高了藥品銷售預(yù)測(cè)的精確度,得到了較為滿意的結(jié)果。
盡管有關(guān)研究不斷增多,但由于藥品需求特征頗為復(fù)雜的特殊性,運(yùn)用單項(xiàng)預(yù)測(cè)方法對(duì)其進(jìn)行預(yù)測(cè)無(wú)法涵蓋其較多的特征信息,從一定程度上限制了預(yù)測(cè)模型的適用范圍。本文根據(jù)藥品需求高度非線性的特點(diǎn)選取了3種不同特性神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測(cè)方法,每種神經(jīng)網(wǎng)絡(luò)都有其所針對(duì)的藥品需求特征,并在此基礎(chǔ)上建立組合預(yù)測(cè)模型,擴(kuò)大了藥品預(yù)測(cè)模型的適應(yīng)范圍,對(duì)于提高藥品預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性具有重要意義。
2 基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測(cè)模型的建立
基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測(cè)模型的具體步驟如下:
(1)數(shù)據(jù)異常點(diǎn)預(yù)處理。為提高組合預(yù)測(cè)模型的適用范圍和預(yù)測(cè)精度,本文運(yùn)用基于距離的異常點(diǎn)檢測(cè)方法對(duì)存在異常點(diǎn)的藥品需求數(shù)據(jù)進(jìn)行異常點(diǎn)修復(fù),得到正常的需求數(shù)據(jù)。
(2)單項(xiàng)預(yù)測(cè)方法的選取。針對(duì)藥品需求的不同特征,選取3種不同特性的神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測(cè)方法,以此作為組合預(yù)測(cè)模型單項(xiàng)預(yù)測(cè)方法的篩選基礎(chǔ)。
(3)單項(xiàng)預(yù)測(cè)方法的篩選與變權(quán)重的計(jì)算。因?yàn)椴煌幤肪邆洳煌枨筇卣?,在進(jìn)行組合預(yù)測(cè)時(shí)仍需要在已選取單項(xiàng)預(yù)測(cè)方法的基礎(chǔ)上再次篩選合適的單項(xiàng)預(yù)測(cè)方法進(jìn)行組合,以相對(duì)誤差為最優(yōu)準(zhǔn)則,通過(guò)求解二次規(guī)劃問(wèn)題得到權(quán)重并按照一定的變權(quán)規(guī)則進(jìn)行變權(quán)。
(4)根據(jù)權(quán)重建立組合模型進(jìn)行預(yù)測(cè)。
2.1 藥品數(shù)據(jù)異常點(diǎn)預(yù)處理
在藥品銷售數(shù)據(jù)中,由于特殊事件(如鋪貨)等原因,個(gè)別數(shù)據(jù)會(huì)表現(xiàn)出明顯突變,導(dǎo)致藥品歷史數(shù)據(jù)存在異常點(diǎn),掩蓋了數(shù)據(jù)本身的規(guī)律。本文通過(guò)基于距離的異常點(diǎn)檢測(cè)方法和多項(xiàng)式擬合方法對(duì)藥品數(shù)據(jù)做預(yù)處理,具體處理步驟如下:
首先,選擇一個(gè)較大的數(shù)(如1010)將缺失數(shù)據(jù)補(bǔ)足,然后運(yùn)用基于距離的異常點(diǎn)檢測(cè)方法進(jìn)行檢測(cè)。第一步,對(duì)藥品需求數(shù)據(jù)進(jìn)行歸一化處理并計(jì)算出各個(gè)數(shù)據(jù)之間的距離,得到距離矩陣P。計(jì)算公式如下:
Pij=|xi-xj|,i,j=1,…,n(1)
式中,xi表示時(shí)間序列中第i期的數(shù)據(jù),Pij表示時(shí)間序列中i期數(shù)據(jù)與j期數(shù)據(jù)之差的絕對(duì)值。距離矩陣P的第i列表示時(shí)間序列第i期數(shù)據(jù)與長(zhǎng)度為n的時(shí)間序列中所有數(shù)據(jù)(包括第i期數(shù)據(jù)本身)的距離。
P=p11,p12,…,p1np21,p22,…,p2n… … … …pn1,pn2,…,pnn(2)
通過(guò)設(shè)置距離閾值d,計(jì)算出所有滿足Pij>d的距離個(gè)數(shù),記di,得到判別矩陣D。
D=[d1,d2,d3,…,dn](3)
將di與閾值f進(jìn)行比較,若大于f,則識(shí)別該點(diǎn)為異常點(diǎn),否則為正常值。最后利用多項(xiàng)式擬合方法,將檢測(cè)出來(lái)的異常點(diǎn)作擬合處理,得到建模需要的正常數(shù)據(jù)。
2.2 單項(xiàng)預(yù)測(cè)方法的選取
藥品需求預(yù)測(cè)是一個(gè)復(fù)雜的非線性系統(tǒng)建模問(wèn)題,相對(duì)于傳統(tǒng)分析方法(如指數(shù)平滑方法、ARMA模型、MTV模型),神經(jīng)網(wǎng)絡(luò)依據(jù)數(shù)據(jù)本身的內(nèi)在聯(lián)系建模,具有良好的自組織、自適應(yīng)性,以及抗干擾能力以及非線性映射能力,能夠較好地解決非線性數(shù)據(jù)擬合問(wèn)題。
本文選取3種具有不同特征的神經(jīng)網(wǎng)絡(luò)模型,即BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和GRNN廣義回歸神經(jīng)網(wǎng)絡(luò),綜合其各自優(yōu)勢(shì)建立組合預(yù)測(cè)模型,提升整個(gè)預(yù)測(cè)模型的泛化能力,提高預(yù)測(cè)精度與預(yù)測(cè)穩(wěn)定性。
2.2.1 基于BP神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測(cè)方法
BP神經(jīng)網(wǎng)絡(luò)由Rumelhard和McClelland于1986年提出,它是一種典型的多層前向型神經(jīng)網(wǎng)絡(luò)。藥品銷售記錄作為BP神經(jīng)網(wǎng)絡(luò)輸入值,藥品需求預(yù)測(cè)即為BP神經(jīng)網(wǎng)絡(luò)輸出值。當(dāng)輸入節(jié)點(diǎn)數(shù)為m,輸出節(jié)點(diǎn)數(shù)為n時(shí),BP神經(jīng)網(wǎng)絡(luò)就表達(dá)了從m個(gè)自變量到n個(gè)因變量的非線性函數(shù)映射關(guān)系。
BP神經(jīng)網(wǎng)絡(luò)側(cè)重對(duì)全樣本的學(xué)習(xí),因此適合對(duì)樣本整體特征相近的時(shí)間序列進(jìn)行預(yù)測(cè),即適應(yīng)受某一特定因素影響顯著,且該影響因素相對(duì)穩(wěn)定的藥品預(yù)測(cè)。
2.2.2 基于RBF神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測(cè)方法
徑向基函數(shù)(RBF,Radical Basis Function)由Powell于1985年首次提出,它是一種三層前饋網(wǎng)絡(luò),即輸入層、隱含層和輸出層。從輸入層到隱含層是一個(gè)非線性到線性的變換過(guò)程,從隱含層到輸出層是一個(gè)線性處理過(guò)程。RBF神經(jīng)網(wǎng)絡(luò)在處理非線性問(wèn)題時(shí),引入RBF核函數(shù)將非線性空間映射到線性空間,極大地提高了非線性處理能力,且RBF神經(jīng)網(wǎng)絡(luò)采用自組織有監(jiān)督的學(xué)習(xí)算法進(jìn)行訓(xùn)練,其訓(xùn)練收斂速度具有顯著的優(yōu)勢(shì)。
RBF神經(jīng)網(wǎng)絡(luò)具有很好的非線性處理能力,其學(xué)習(xí)算法屬于局部激活性較高的高斯函數(shù),對(duì)于相似的樣本有著較高的逼近能力,因此適用于受會(huì)隨時(shí)間變化而較為顯著變化的因素影響的藥品需求預(yù)測(cè)。
2.2.3 基于GRNN的藥品需求預(yù)測(cè)方法
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN,Generalized Regression Neural Network)由美國(guó)學(xué)者Donald F. Specht在1991年提出,它是徑向基神經(jīng)網(wǎng)絡(luò)的一種。GRNN具有很強(qiáng)的非線性映射能力和柔性網(wǎng)絡(luò)結(jié)構(gòu)以及高度的容錯(cuò)性和魯棒性,適用于解決非線性問(wèn)題。
GRNN在逼近能力和學(xué)習(xí)速度上較RBF網(wǎng)絡(luò)有更強(qiáng)的優(yōu)勢(shì),網(wǎng)絡(luò)最后收斂于樣本量積聚較多的優(yōu)化回歸面,并且在樣本數(shù)據(jù)較少時(shí),預(yù)測(cè)效果也較好。此外,網(wǎng)絡(luò)還可以處理不穩(wěn)定數(shù)據(jù)。因此GRNN適用于數(shù)據(jù)不全、異常點(diǎn)較多的藥品。
綜上所述,3種神經(jīng)網(wǎng)絡(luò)都具有良好的非線性處理及預(yù)測(cè)能力,因?yàn)閷W(xué)習(xí)算法的不同有著各自側(cè)重的學(xué)習(xí)方向,皆為應(yīng)用廣泛的預(yù)測(cè)方法,且對(duì)各自適應(yīng)范圍內(nèi)有著較好的預(yù)測(cè)效果。因此本文選擇BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)以及廣義回歸神經(jīng)網(wǎng)絡(luò)作為單項(xiàng)預(yù)測(cè)方法,并在此基礎(chǔ)上建立組合預(yù)測(cè)模型。
2.3 單項(xiàng)預(yù)測(cè)方法的篩選與變權(quán)系數(shù)的計(jì)算
本文在已選取3種單項(xiàng)預(yù)測(cè)方法的基礎(chǔ)上,再根據(jù)合適的MAPE和誤差方差篩選出組合模型中的單項(xiàng)預(yù)測(cè)方法,計(jì)算出變權(quán)系數(shù)。假設(shè)藥品需求的實(shí)際時(shí)間序列為y(t),t=1,2,…,N,N+1,…,N+T,其中t表示預(yù)測(cè)區(qū)間,T表示預(yù)測(cè)步長(zhǎng)。
(1)單項(xiàng)方法篩選
單項(xiàng)方法進(jìn)一步篩選的具體步驟為:
①預(yù)先設(shè)置選擇單項(xiàng)方法MAPE閾值m 和誤差方差閥值ε
②進(jìn)行逐期單步預(yù)測(cè),預(yù)測(cè)序列為:
{i(t),i=1,2,…,n;t=N+1,…,N+T}
③計(jì)算n種單項(xiàng)方法的相對(duì)誤差ei(t)、誤差方差εi(t)和MAPE。其中,單項(xiàng)預(yù)測(cè)方法的相對(duì)誤差序列為:
ei(t)=i=1,2,…,n;t=N+1,…,N+T(4)
單項(xiàng)預(yù)測(cè)方法的誤差方差為:
εi(t)=(5)
單項(xiàng)預(yù)測(cè)方法的MAPE為:
MAPEi(t)=ei(j),(i=1,2,…,n;t=N+1,…,N+T)(6)
④若MAPEi(t)
(2)變權(quán)系數(shù)的計(jì)算
本文考慮預(yù)測(cè)效果,選用基于相對(duì)誤差為最優(yōu)準(zhǔn)則的最優(yōu)加權(quán)法進(jìn)行計(jì)算。
假設(shè)從n中方法中篩選出p(p≤n)種單項(xiàng)預(yù)測(cè)方法,則組合模型第t+1期的權(quán)系數(shù)w(t+1)由相對(duì)誤差ei(1),…,ei(t)決定,其中i=1,…,p。變權(quán)規(guī)則如表1所示。
權(quán)系數(shù)具體計(jì)算過(guò)程如下:
①設(shè)組合權(quán)重wi為方法mi在組合預(yù)測(cè)方法中權(quán)重,則組合預(yù)測(cè)方法第t期相對(duì)誤差為:
e(t)=wi*ei(t),i=1,2,…,p(7)
②組合模型前t期的相對(duì)誤差平方和為:
e2=e(1)2+e(2)2+…+e(t)2(8)
令w=[w1,w2,…,wP]T,
E=e1(1),e2(1),…,ep(1)e1(2),e2(2),…,ep(2) … … … …e1(t),e2(t),…,ep(t)
建立如下目標(biāo)規(guī)劃:
min P=e2=wT*ET*E*w
s.t. wi=1(9)
③求解該目標(biāo)規(guī)劃得到變權(quán)系數(shù)w。
2.4 建立組合模型進(jìn)行預(yù)測(cè)
組合預(yù)測(cè)模型可表示為:
式中, wi(t)表示第t期單項(xiàng)方法mi的變權(quán)系數(shù),(t)表示第t期組合預(yù)測(cè)方法的預(yù)測(cè)值。根據(jù)該模型對(duì)藥品進(jìn)行預(yù)測(cè)。
3 實(shí)驗(yàn)與分析
本文以上海市某制藥企業(yè)月度銷售額為藥品需求預(yù)測(cè)的實(shí)證數(shù)據(jù),根據(jù)銷售地區(qū)的不同抽取有代表性的藥品銷售數(shù)據(jù),其中選取上海地區(qū)10種藥品,北京地區(qū)4種藥品及全區(qū)域銷售數(shù)據(jù)12種藥品,數(shù)據(jù)長(zhǎng)度皆為30(2009-1至2011-6)。
數(shù)據(jù)選擇依據(jù)如下:①藥品銷售有一定的連續(xù)性,為公司主推或在某地區(qū)主推藥品,具有代表性及預(yù)測(cè)意義;②在考慮異常點(diǎn)和數(shù)據(jù)缺失時(shí),選取異常點(diǎn)和缺失數(shù)據(jù)較少的藥品。
3.1 單項(xiàng)方法篩選和變權(quán)系數(shù)計(jì)算
根據(jù)不同銷售區(qū)域藥品需求的具體情況,設(shè)定單一省市藥品的MAPE閾值和方差閾值分別為20%和0.1;設(shè)定公司的MAPE閾值和方差閾值分別為30%和0.1。shy03和all03的單項(xiàng)預(yù)測(cè)方法選取結(jié)果如表2 所示。
利用單項(xiàng)預(yù)測(cè)方法的6期預(yù)測(cè)結(jié)果計(jì)算組合預(yù)測(cè)模型的3期權(quán)重,選相對(duì)誤差最優(yōu)準(zhǔn)則進(jìn)行權(quán)重計(jì)算,運(yùn)用MATLAB的二次規(guī)劃函數(shù)quadprog求解。變權(quán)規(guī)則及權(quán)重計(jì)算結(jié)果如表3所示。
3.2 預(yù)測(cè)模型的精度比較
本文選取平均絕對(duì)相對(duì)誤差(MAPE)和預(yù)測(cè)有效度兩個(gè)指標(biāo)來(lái)綜合評(píng)價(jià)模型的預(yù)測(cè)精度。當(dāng)MAPE越小時(shí),說(shuō)明預(yù)測(cè)精度越高。然而當(dāng)實(shí)際值非常小時(shí),即使是預(yù)測(cè)值與真實(shí)值之差較小,其平均絕對(duì)相對(duì)誤差也會(huì)很大,而預(yù)測(cè)有效度能很好地避免此類問(wèn)題,故我們引入預(yù)測(cè)有效度來(lái)綜合評(píng)價(jià)預(yù)測(cè)精度,預(yù)測(cè)有效度越大,預(yù)測(cè)精度越高。
用單項(xiàng)預(yù)測(cè)方法BP、RBF、GRNN與組合預(yù)測(cè)方法單一省市和全區(qū)域藥品銷售預(yù)測(cè)值的MAPE和有效度,對(duì)MAPE和有效度的情況進(jìn)行統(tǒng)計(jì)并且計(jì)算MAPE和有效度的平均值,比較結(jié)果如表4所示。
可以看出,運(yùn)用組合預(yù)測(cè)方法對(duì)單一省市的14種藥品進(jìn)行需求預(yù)測(cè)時(shí),MAPE小于標(biāo)準(zhǔn)值20%的有8個(gè),占藥品總數(shù)的57.14%,優(yōu)于BP(7)、RBF(4)、GRNN(6)方法;14種藥品的MAPE平均值為19.81%,優(yōu)于BP(26.71%)、RBF(28.45%)、GRNN(40.59%)方法。預(yù)測(cè)有效度大于標(biāo)準(zhǔn)值0.5的有11個(gè),占藥品總數(shù)的78.57%,優(yōu)于BP(8)、RBF(10)、GRNN(8)方法;14種藥品的預(yù)測(cè)有效度平均值為0.62,優(yōu)于BP(0.57)、RBF(0.61)、GRNN(0.57)方法。
此外,運(yùn)用組合預(yù)測(cè)方法對(duì)全區(qū)域銷售的12種藥品進(jìn)行需求預(yù)測(cè)時(shí),MAPE小于標(biāo)準(zhǔn)值30%的有7個(gè),占藥品總數(shù)的58.33%,優(yōu)于BP(4)、RBF(6)、GRNN(3)方法;12種藥品的MAPE平均值為25.22%,優(yōu)于BP(35.90%)、RBF(32.07%)、GRNN(70.59%)方法。預(yù)測(cè)有效度大于標(biāo)準(zhǔn)值0.45的有10個(gè),占藥品總數(shù)的83.33%,優(yōu)于BP(7)、RBF(9)、GRNN(5)方法;12種藥品的預(yù)測(cè)有效度平均值為0.58,優(yōu)于BP(0.46)、RBF(0.56)、GRNN(0.49)方法。
通過(guò)上述實(shí)證結(jié)果,從整體上看,組合預(yù)測(cè)方法的預(yù)測(cè)精度優(yōu)于單項(xiàng)預(yù)測(cè)方法,而且模型的適用范圍較廣。
3.3 預(yù)測(cè)模型的穩(wěn)定性比較
本文選擇預(yù)測(cè)誤差的方差作為評(píng)價(jià)模型穩(wěn)定性的指標(biāo)。將單項(xiàng)預(yù)測(cè)方法BP、RBF、GRNN與組合預(yù)測(cè)方法的誤差方差進(jìn)行比較,單一省市和全區(qū)域的比較結(jié)果如表5所示。
可以看出,運(yùn)用組合預(yù)測(cè)方法對(duì)單一省市的14種藥品進(jìn)行需求預(yù)測(cè)時(shí),誤差方差小于標(biāo)準(zhǔn)值0.1的有12種,占藥品總數(shù)的85.71%,優(yōu)于BP(10)、RBF(11)、GRNN(10)方法;此外,14種藥品誤差方差平均值為0.0263,優(yōu)于BP(0.0613)、RBF(0.0361)、GRNN(0.0522)方法。運(yùn)用組合預(yù)測(cè)方法對(duì)全區(qū)域銷售的12種藥品進(jìn)行需求預(yù)測(cè)時(shí),誤差方差小于標(biāo)準(zhǔn)值0.1的有11個(gè),占總數(shù)的91.67%,優(yōu)于BP(9)、RBF(10)、GRNN(8)方法,此外,14種藥品的誤差方差平均值為0.031 0,優(yōu)于BP(0.092 7)、RBF(0.033 5)、GRNN(0.065 0)方法。因此從整體上看,組合預(yù)測(cè)方法的預(yù)測(cè)穩(wěn)定性優(yōu)于單項(xiàng)預(yù)測(cè)方法。
4 總結(jié)及展望
本文選擇3種具有不同適應(yīng)特征的神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測(cè)方法,建立了基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測(cè)模型,以上海市某藥企的實(shí)際銷售數(shù)據(jù)作為實(shí)證對(duì)象,驗(yàn)證了該模型在預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性上均優(yōu)于單項(xiàng)預(yù)測(cè)方法。當(dāng)然,雖然建立的神經(jīng)網(wǎng)絡(luò)組合模型在一定程度上彌補(bǔ)了現(xiàn)有方法的不足,擴(kuò)大了預(yù)測(cè)方法的適用范圍,但在研究過(guò)程中依然存在亟待解決的問(wèn)題:
(1)單項(xiàng)預(yù)測(cè)方法的參數(shù)優(yōu)化有待進(jìn)一步研究。本文在參數(shù)優(yōu)化時(shí),大部分采用遍歷法和經(jīng)驗(yàn)法進(jìn)行設(shè)置,缺乏相應(yīng)理論依據(jù)和方法指導(dǎo)。如何采用合適參數(shù)尋優(yōu)方法進(jìn)行參數(shù)確定是下一步亟待解決的問(wèn)題。
(2)進(jìn)行組合預(yù)測(cè)時(shí),選擇合適的最優(yōu)準(zhǔn)則有待于進(jìn)一步研究。本文選取相對(duì)誤差作為最優(yōu)準(zhǔn)則進(jìn)行需求預(yù)測(cè),該準(zhǔn)則的選取忽視了量綱統(tǒng)一性,未來(lái)的研究應(yīng)該綜合考慮量綱統(tǒng)一、預(yù)測(cè)誤差和預(yù)測(cè)穩(wěn)定性,使組合預(yù)測(cè)方法更科學(xué)、更合理。
主要參考文獻(xiàn)
[1]J M Bates,C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly,1969,20(4):451-468.
[2]吳正佳,王文,周進(jìn).BP神經(jīng)網(wǎng)絡(luò)在備貨型企業(yè)銷售預(yù)測(cè)中的應(yīng)用[J].工業(yè)工程,2010(1):105-108.
[3]童明榮,薛恒新,劉路冰.基于季節(jié)性RBF神經(jīng)網(wǎng)絡(luò)的月度市場(chǎng)需求預(yù)測(cè)研究[J].運(yùn)籌與管理,2007(3),146-150.
[4]Maria Cleofé,R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J].Journal of Hydrology,2005,1(20):146-162.
[5]A A Khan,K E Marion,C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research, Melbourne, Victoria, 2007.
[6]D C Park,El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems, 1991, 6(2):442-449.
[7]Maria Cleofé, Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J]. Journal of Hydrology , 2005, 301(20):146-162.
[8]馬新強(qiáng),黃羿.基于BP神經(jīng)網(wǎng)絡(luò)的藥品銷售預(yù)測(cè)模型設(shè)計(jì)[J].重慶文理學(xué)院學(xué)報(bào),2008(2):64-66.
[關(guān)鍵詞]人力資源管理;人力資源需求預(yù)測(cè);BP神經(jīng)網(wǎng)絡(luò)
[中圖分類號(hào)]F270.7[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]2095-3283(2013)01-00-02
一、 應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的必要性
隨著經(jīng)濟(jì)全球化和信息技術(shù)的加快發(fā)展,我國(guó)企業(yè)面臨著更為嚴(yán)峻的競(jìng)爭(zhēng)壓力。為了適應(yīng)現(xiàn)代市場(chǎng)需求,企業(yè)必須優(yōu)化配置人力資源,并科學(xué)制定人力資源規(guī)劃。其中,科學(xué)的人力資源需求預(yù)測(cè)是人力資源開(kāi)發(fā)和規(guī)劃的基礎(chǔ),對(duì)人力資源管理活動(dòng)將產(chǎn)生持續(xù)和重要的影響。
企業(yè)人力資源需求預(yù)測(cè)分析方法多種多樣。在進(jìn)行人力資源需求預(yù)測(cè)時(shí),企業(yè)要考慮的因素復(fù)雜多變,如企業(yè)的目標(biāo)和經(jīng)營(yíng)戰(zhàn)略、生產(chǎn)狀況的變化、工作設(shè)計(jì)或組織結(jié)構(gòu)的變化等,而且各種影響因素與預(yù)測(cè)結(jié)果之間的相關(guān)性難以用定量的方法表示出來(lái),是非線性相互制約的映射關(guān)系。將BP神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于人力資源需求預(yù)測(cè)領(lǐng)域,彌補(bǔ)和改進(jìn)了人力資源需求預(yù)測(cè)分析方法,能較好地實(shí)現(xiàn)各指標(biāo)與需求結(jié)果之間非線性關(guān)系的映射,對(duì)企業(yè)人力資源決策具有一定的參考和指導(dǎo)作用。
二、BP神經(jīng)網(wǎng)絡(luò)的基本原理
人工神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱神經(jīng)網(wǎng)絡(luò),是一種包括許多簡(jiǎn)單的非線性計(jì)算單元或聯(lián)結(jié)點(diǎn)的非線性動(dòng)力系統(tǒng),是用大量簡(jiǎn)單的處理單元廣泛連接組成的復(fù)雜網(wǎng)絡(luò)。Back-Propagation Network,簡(jiǎn)稱為BP網(wǎng)絡(luò),即基于誤差反向傳播算法的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最成功和廣泛的人工神經(jīng)網(wǎng)絡(luò)。它由輸入層、隱含層和輸出層組成。隱含層可以是一層或多層。BP神經(jīng)網(wǎng)絡(luò)自身具有的非線性映射、自學(xué)習(xí)、自適應(yīng)能力、容易實(shí)現(xiàn)并行計(jì)算等優(yōu)點(diǎn),彌補(bǔ)和改進(jìn)了供應(yīng)商選擇和評(píng)價(jià)方法,能較好地實(shí)現(xiàn)各指標(biāo)與評(píng)價(jià)結(jié)果之間非線性關(guān)系的映射。
基于BP神經(jīng)網(wǎng)絡(luò),構(gòu)建供應(yīng)商的選擇評(píng)價(jià)模型,其基本思想為:假設(shè)輸入變量為X=(X1,X2,···,Xi)',隱含層輸出變量為Y=(Y1,Y2,···,Yj)',輸出層變量為Z=(Z1,Z2,···,Zl)',期望輸出的目標(biāo)變量為T=(T1,T2,···,Tl)',Wij、Wjl分別為輸入層到隱含層、隱含層到輸出層的連接權(quán)值(如圖1所示)。對(duì)于i個(gè)輸入學(xué)習(xí)樣本X1,X2,···,Xi,已知與其對(duì)應(yīng)的輸出樣本為Z1,Z2,···,Zl。通過(guò)BP算法的學(xué)習(xí),沿著負(fù)梯度方向不斷調(diào)整和修正網(wǎng)絡(luò)連接權(quán)值Wij和Wjl,使網(wǎng)絡(luò)的實(shí)際輸出Z逐漸逼近目標(biāo)矢量T,也就是使網(wǎng)絡(luò)輸出層的誤差平方和達(dá)到最小。
圖1三層BP網(wǎng)絡(luò)結(jié)構(gòu)圖三、BP神經(jīng)網(wǎng)絡(luò)在企業(yè)人力資源需求預(yù)測(cè)中的應(yīng)用
根據(jù)上述BP神經(jīng)網(wǎng)絡(luò)主要思想,以A公司為例,分析如何運(yùn)用MATLAB工具箱實(shí)現(xiàn)基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)人力資源需求預(yù)測(cè)。
1.樣本數(shù)據(jù)處理
選取年份、產(chǎn)值、資產(chǎn)總計(jì)、利潤(rùn)4個(gè)指標(biāo)作為輸入向量,從業(yè)人員作為目標(biāo)向量(見(jiàn)表1)。在對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練前,應(yīng)該對(duì)數(shù)據(jù)進(jìn)行歸一化處理,使那些比較大的輸入仍落在傳遞函數(shù)梯度大的地方。本例采用MATLAB工具箱中的premnmx()函數(shù)把數(shù)據(jù)歸一到[-1,1]之間,如表2所示。
對(duì)于BP網(wǎng)絡(luò),有一個(gè)非常重要的定理。即對(duì)于任何在閉區(qū)間內(nèi)的一個(gè)連續(xù)函數(shù)都可以用單隱層的BP網(wǎng)絡(luò)逼近,因而一個(gè)三層BP網(wǎng)絡(luò)就可以完成任意的n維到m維的映射。本例采用單隱層的BP網(wǎng)絡(luò)進(jìn)行從業(yè)人員預(yù)測(cè)。由于輸入樣本為4維的輸入向量,因此,輸入層一共有4個(gè)神經(jīng)元,網(wǎng)絡(luò)只有1個(gè)輸出數(shù)據(jù),則輸出層只有1個(gè)神經(jīng)元。隱含層神經(jīng)元個(gè)數(shù)根據(jù)最佳隱含層神經(jīng)元數(shù)經(jīng)驗(yàn)公式取15個(gè)。因此,網(wǎng)絡(luò)應(yīng)該為4×15×1的結(jié)構(gòu)。隱含層神經(jīng)元的傳遞函數(shù)為S型正切函數(shù)tansig(),輸出層神經(jīng)元的傳遞函數(shù)為線性激活函數(shù)purelin()。
3.BP網(wǎng)絡(luò)訓(xùn)練及仿真
建立網(wǎng)絡(luò)后,對(duì)表2中的數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練參數(shù)的設(shè)定如表3所示,其他參數(shù)取默認(rèn)值。
訓(xùn)練次數(shù)12100012目標(biāo)誤差120.00112學(xué)習(xí)速率120.01訓(xùn)練結(jié)果如圖1所示,可見(jiàn)經(jīng)過(guò)52次訓(xùn)練后,網(wǎng)絡(luò)的目標(biāo)誤差達(dá)到要求。
圖1訓(xùn)練結(jié)果網(wǎng)絡(luò)訓(xùn)練結(jié)束后,運(yùn)用MATLAB工具箱中的sim()函數(shù),將經(jīng)過(guò)歸一化后的數(shù)據(jù)表2進(jìn)行仿真模擬,獲得網(wǎng)絡(luò)的輸出,然后將運(yùn)算結(jié)果通過(guò)postmnmx()函數(shù)進(jìn)行反歸一化處理,得到BP網(wǎng)絡(luò)預(yù)測(cè)值,最后檢查BP網(wǎng)絡(luò)預(yù)測(cè)值和實(shí)際從業(yè)人員數(shù)之間的誤差是否符合要求,如表4所示。
4.預(yù)測(cè)結(jié)果評(píng)價(jià)
圖2反映了該BP網(wǎng)絡(luò)較好地逼近了輸入矢量,即年份、產(chǎn)值(萬(wàn)元)、資產(chǎn)總計(jì)(萬(wàn)元)和利潤(rùn)(萬(wàn)元)與目標(biāo)矢量,即從業(yè)人員(人)之間的線性關(guān)系。用BP神經(jīng)網(wǎng)絡(luò)對(duì)現(xiàn)有人力資源狀況進(jìn)行分析擬合,是人力資源需求預(yù)測(cè)的較理想方法。與傳統(tǒng)的人力資源需求預(yù)測(cè)方法相比,將BP神經(jīng)網(wǎng)絡(luò)用于人力資源需求預(yù)測(cè),克服了輸入矢量和目標(biāo)矢量非線性、不符合統(tǒng)計(jì)規(guī)律的問(wèn)題。BP神經(jīng)網(wǎng)絡(luò)模型良好的容錯(cuò)和自學(xué)習(xí)能力,調(diào)用MATLAB工具箱函數(shù),使預(yù)測(cè)過(guò)程更易實(shí)現(xiàn),可以更好地對(duì)人力資源進(jìn)行規(guī)劃,提高人力資源預(yù)測(cè)精度。
圖2BP神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近結(jié)果將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于企業(yè)人力資源需求預(yù)測(cè),能較好地建立起各影響因素與預(yù)測(cè)結(jié)果之間的非線性關(guān)系,是企業(yè)預(yù)測(cè)人力資源需求的一種較理想的方法。但BP神經(jīng)網(wǎng)絡(luò)也存在著一些不足和問(wèn)題。主要表現(xiàn)在學(xué)習(xí)速率太小可能會(huì)造成訓(xùn)練時(shí)間過(guò)長(zhǎng);BP算法可以使權(quán)值收斂到某個(gè)值,但并不能保證其為誤差平面的全局最小值;網(wǎng)絡(luò)隱含層的層數(shù)和單元數(shù)的選擇一般是根據(jù)經(jīng)驗(yàn)或者通過(guò)反復(fù)實(shí)驗(yàn)確定,網(wǎng)絡(luò)往往存在很大的冗余性,在一定程度上也增加了網(wǎng)絡(luò)學(xué)習(xí)的負(fù)擔(dān)。因此,BP神經(jīng)網(wǎng)絡(luò)在企業(yè)人力資源需求預(yù)測(cè)領(lǐng)域的應(yīng)用仍需根據(jù)企業(yè)自身實(shí)際情況做進(jìn)一步的改進(jìn)和完善。
[參考文獻(xiàn)]
[1]飛思科技產(chǎn)品研發(fā)中心神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M]北京:電子工業(yè)出版社,2005.
[2](美)海金(Simon Haykin)神經(jīng)網(wǎng)絡(luò)原理(原書(shū)第2版)[M]葉世偉,史忠植譯北京:機(jī)械工業(yè)出版社,2004.
[3]叢爽面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M]中國(guó)科學(xué)技術(shù)大學(xué)出版社,1998.
[4]劉躍基于BP神經(jīng)網(wǎng)絡(luò)的人力資源估價(jià)研究[J]統(tǒng)計(jì)與信息論壇,2007(1):96-99.
[5]艷明四種人力資源的定量預(yù)測(cè)方法及評(píng)述[J]統(tǒng)計(jì)與決策,2008(7):30-32.
[6]國(guó)家統(tǒng)計(jì)局固定資產(chǎn)投資統(tǒng)計(jì)司,中國(guó)行業(yè)企業(yè)信息中心中國(guó)大型房地產(chǎn)與建筑業(yè)企業(yè)年鑒[M]北京:中國(guó)大地出版社,2003-2008.
[7]王文富企業(yè)人力資源預(yù)測(cè)與規(guī)劃研究[D]天津大學(xué),2004.
關(guān)鍵詞:壁紙識(shí)別;BP神經(jīng)網(wǎng)絡(luò);不變矩
中圖分類號(hào):TP391.41
貼標(biāo)的識(shí)別以往是通過(guò)人工識(shí)別,人為因素影響大,識(shí)別速度慢,精度低,不能滿足大批量生產(chǎn)的需要。因此,在經(jīng)濟(jì)社會(huì)高速發(fā)展的今天,此方法越來(lái)越不能滿足壁紙行業(yè)發(fā)展的需要。隨著計(jì)算機(jī)的發(fā)展,通過(guò)計(jì)算機(jī)智能識(shí)別壁紙的紋理就成為可能,主要思路是將壁紙拍攝獲知的圖像進(jìn)行紋理特征的提取,只要建立足夠的特征庫(kù),就可以把需要判別的壁紙圖片輸入計(jì)算機(jī),通過(guò)檢索來(lái)判別該壁紙是哪種材種。因此,本文引入圖像處理技術(shù)和BP神經(jīng)網(wǎng)絡(luò)技術(shù),提出一種壁紙貼標(biāo)自動(dòng)識(shí)別算法,以解決貼標(biāo)大批量生產(chǎn)的需要。
1 壁紙紋理特征的提取
不變矩是指物體圖像經(jīng)過(guò)平移,旋轉(zhuǎn)以及比例變換仍保持不變的矩特征量,設(shè)物體的二維離散圖像函數(shù)用f(x,y)表示,其(p+q)階矩定義為:
(1)
相應(yīng)的(p+q)階中心矩定義為:
(2)
其中,x0=m10/m00,y0=m01/m00,x0表示二維圖像的灰度在水平方向上的重心,y0表示二維圖像的灰度在垂直方向上的重心。
HuM.K.等人利用二階、三階中心矩得到了7個(gè)不變矩特征參數(shù),具體如下:
Φk=|log|Φk,k=1,2,3,4,5,6,7 (3)
在本設(shè)計(jì)的實(shí)驗(yàn)中要求樣本的尺寸是256×256,從每一類原始樣本中采集100個(gè)能表現(xiàn)該樣本紋理的圖片,形成識(shí)別樣本庫(kù),之后提取了所有樣本的不變矩紋理特征。
圖1 壁紙樣本圖片
2 BP-神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計(jì)
2.1 BP神經(jīng)網(wǎng)絡(luò)概述
BP神經(jīng)網(wǎng)絡(luò)(Back Propagation)是1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種基于誤差逆?zhèn)鞑ニ惴ǖ亩鄬忧梆伾窠?jīng)網(wǎng)絡(luò),目前廣泛應(yīng)用于分類、識(shí)別、函數(shù)逼近等領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,包括輸入層、輸出層和隱含層。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
BP學(xué)習(xí)算法的工作過(guò)程由正向傳播和反向傳播組成。正向傳播過(guò)程是指輸入信號(hào)從輸入層經(jīng)隱含層,在輸出層產(chǎn)生輸出信號(hào)。如果輸出層不能得到期望的輸出信號(hào),輸出信號(hào)將反向傳播,將誤差信號(hào)沿原有路徑返回,并按照一定規(guī)則修改網(wǎng)絡(luò)參數(shù),逐漸地向輸入層傳播去進(jìn)行計(jì)算,正向傳播和反向傳播兩個(gè)過(guò)程的反復(fù)運(yùn)用,直到誤差信號(hào)滿足要求。
2.2 BP神經(jīng)網(wǎng)絡(luò)分類器設(shè)計(jì)
2.2.1 網(wǎng)絡(luò)輸入節(jié)點(diǎn)數(shù)的設(shè)計(jì)
輸入層節(jié)點(diǎn)數(shù)主要根據(jù)數(shù)據(jù)特征向量的維數(shù)來(lái)確定,本文輸入節(jié)點(diǎn)數(shù)為不變矩特征向量的維數(shù),即輸入節(jié)點(diǎn)數(shù)為7。
2.2.2 網(wǎng)絡(luò)隱含層數(shù)的設(shè)計(jì)
通常情況下,增加網(wǎng)絡(luò)的隱含層數(shù)可以使網(wǎng)絡(luò)誤差降低,提高網(wǎng)絡(luò)的精度,但同時(shí)也使網(wǎng)絡(luò)變得復(fù)雜化,使得網(wǎng)絡(luò)的訓(xùn)練時(shí)間增加,而且容易出現(xiàn)網(wǎng)絡(luò)過(guò)擬合的情況。有研究表明,具有Sigmoid非線性函數(shù)的3層BP神經(jīng)網(wǎng)絡(luò)能夠逼近任何連續(xù)函數(shù)。因此,本研究中神經(jīng)網(wǎng)絡(luò)分類器的隱含層數(shù)選為3層。
2.2.3 網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的設(shè)計(jì)
在確定BP神經(jīng)網(wǎng)絡(luò)隱含層數(shù)后,下一步就需要確定隱含層節(jié)點(diǎn)數(shù)。隱含層神經(jīng)元個(gè)數(shù)一般由 是公式確定,其中n是隱含層神經(jīng)元個(gè)數(shù),n0是輸入層神經(jīng)元個(gè)數(shù),n1是輸出神經(jīng)元個(gè)數(shù),a∈(1~10)。
2.2.4 網(wǎng)絡(luò)輸出層的設(shè)計(jì)
輸出層的節(jié)點(diǎn)數(shù)是根據(jù)BP神經(jīng)網(wǎng)絡(luò)分類器的輸出類別數(shù)量決定,也就是說(shuō),輸出層的節(jié)點(diǎn)數(shù)應(yīng)為類別總數(shù)。例如,本研究需要將待識(shí)別的壁紙樣本分成8大類,那么輸出層節(jié)點(diǎn)數(shù)應(yīng)設(shè)置為8,并將每類對(duì)應(yīng)的目標(biāo)向量依次設(shè)置為[1 0 0 0 0 0 0 0]T、[0 1 0 0 0 0 0 0]T、[0 0 1 0 0 0 0 0]T、[0 0 0 1 0 0 0 0]T、[0 0 0 0 1 0 0 0]T、[0 0 0 0 0 1 0 0]T、[0 0 0 0 0 0 1 0]T、[0 0 0 0 0 0 0 1]T,對(duì)應(yīng)目標(biāo)向量的數(shù)目為對(duì)應(yīng)輸入壁紙樣本的數(shù)目,即目標(biāo)向量與輸入壁紙樣本是相互對(duì)應(yīng)的。
本文BP神經(jīng)網(wǎng)絡(luò)分類器采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行設(shè)計(jì),訓(xùn)練函數(shù)選擇Trainlm,訓(xùn)練次數(shù)為200,誤差為0.001,將壁紙樣本其分成訓(xùn)練樣本與測(cè)試樣本2部分,并利用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行自動(dòng)識(shí)別,識(shí)別率達(dá)到90.0%。
3 結(jié)束語(yǔ)
實(shí)驗(yàn)結(jié)果表明不變矩紋理特征參數(shù)可以用于表征壁紙樣本,使用本文設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)分類器可以有效識(shí)別不同種類的壁紙樣本。
參考文獻(xiàn):
[1]高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京:機(jī)械工業(yè)出版社,2003:55-63.
[2]楊斐,王坤明,馬欣.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)分類器識(shí)別交通標(biāo)志[J].計(jì)算機(jī)工程,2000(10):120-121.
[3]Yaping JIANG,Zuxin XU,Hailong YIN.Study on improved BP artificial neural networks in eutrophication assessment of China eastern lakes [J].Journal of Hydrodynamics,2006(03):528-532.
[4]嚴(yán)曉梅,耿國(guó)華,周明全.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的指紋自動(dòng)分類器[J].微計(jì)算機(jī)信息,2007(01):281-282+288.
[5]李梅,孟凡玲,李群.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的地下水環(huán)境脆弱性評(píng)價(jià)[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(03):245-249.
[6]閔惜琳,劉國(guó)華.用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱開(kāi)發(fā)BP網(wǎng)絡(luò)應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2001(08):163-164.
關(guān)鍵詞 基本藥物 采購(gòu)行為 BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):F713.54 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-1533(2013)05-0047-05
2009年國(guó)家基本藥物制度實(shí)施后,國(guó)家將執(zhí)行基本藥物集中采購(gòu)作為實(shí)施基本藥物制度的評(píng)價(jià)標(biāo)準(zhǔn)之一,于是各省將原有的藥品集中采購(gòu)分為基本藥物和非基本藥物兩類。2010年11月,國(guó)務(wù)院《建立和規(guī)范政府辦基層醫(yī)療衛(wèi)生機(jī)構(gòu)基本藥物采購(gòu)機(jī)制的指導(dǎo)意見(jiàn)》,旨在對(duì)現(xiàn)階段較為無(wú)序的藥品采購(gòu)行為進(jìn)行規(guī)范,推行科學(xué)合理的采購(gòu)模式,對(duì)基本藥物采購(gòu)方面的研究開(kāi)始得到關(guān)注。
現(xiàn)行采購(gòu)模式是省集中采購(gòu)平臺(tái)通過(guò)統(tǒng)計(jì)各基層醫(yī)院上報(bào)的用藥需求之后,再統(tǒng)籌面向中標(biāo)企業(yè)進(jìn)行集中采購(gòu)。但是,作為基本藥物集中招標(biāo)采購(gòu)體系中繼招標(biāo)過(guò)程之后的重要環(huán)節(jié),采購(gòu)過(guò)程并未得到足夠的重視,基于基本藥物采購(gòu)行為的微觀研究的理論和文獻(xiàn)更是少之又少。在缺乏科學(xué)理論和方法支持下的采購(gòu)決策,容易受主觀如采購(gòu)主體尋租以及客觀如廠商合謀等因素干擾而不穩(wěn)定,這種不穩(wěn)定帶來(lái)的滯后效應(yīng)會(huì)掣肘社區(qū)衛(wèi)生服務(wù)中心對(duì)基本藥物的需求預(yù)測(cè),繼而帶來(lái)后續(xù)基本藥物的供需矛盾。除此之外,采購(gòu)量錯(cuò)誤統(tǒng)計(jì)或填寫(xiě)不夠準(zhǔn)確的偶然誤差將會(huì)進(jìn)一步加劇這個(gè)矛盾?;舅幬锛姓袠?biāo)采購(gòu)體系下的基本藥物采購(gòu)在執(zhí)行過(guò)程中有必要加強(qiáng)監(jiān)督管理和調(diào)控。因此,尋找合理與靈活的理論和方法來(lái)保證基本藥物的采購(gòu)決策行為的穩(wěn)定性就成為關(guān)注點(diǎn)。
由于BP (Back Propagation)神經(jīng)網(wǎng)絡(luò)模型尚未在基本藥物招標(biāo)采購(gòu)體系中進(jìn)行相關(guān)的理論研究和應(yīng)用探索,未能發(fā)揮其在其他領(lǐng)域中發(fā)揮出的功效。本文針對(duì)這一環(huán)節(jié)進(jìn)行探索,擬在建立BP 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,統(tǒng)計(jì)分析社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)的藥品使用等特征后,將BP神經(jīng)網(wǎng)絡(luò)模型運(yùn)用到社區(qū)醫(yī)療機(jī)構(gòu)的需求預(yù)測(cè)中來(lái),使采購(gòu)主體在決策時(shí)能有更多的支持信息,實(shí)現(xiàn)采購(gòu)數(shù)量科學(xué)化,從而保證社區(qū)醫(yī)療機(jī)構(gòu)對(duì)基本藥物的供應(yīng)充足,以期從這一環(huán)節(jié)上減輕民眾對(duì)基本藥物的獲取負(fù)擔(dān),使整個(gè)基本藥物的供應(yīng)實(shí)現(xiàn)資源優(yōu)化配置,也可為基本藥物集中采購(gòu)的理論和方法提供借鑒和參考。
1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)功能的研究
由于人工神經(jīng)網(wǎng)絡(luò)是非線性、非局域性和非定常性的復(fù)雜網(wǎng)絡(luò)系統(tǒng),具有并行分布的信息處理結(jié)構(gòu)和自適應(yīng)的腦模式的信息處理的本質(zhì)與能力,它可以通過(guò)“自學(xué)習(xí)”或“訓(xùn)練”掌握大量的知識(shí),完成特定的工作。人工神經(jīng)網(wǎng)絡(luò)對(duì)建立預(yù)測(cè)模型十分有效,它能從數(shù)據(jù)樣本中自動(dòng)學(xué)習(xí)以前的經(jīng)驗(yàn)而無(wú)需復(fù)雜的查詢和表述過(guò)程,并自動(dòng)地逼近那些最佳的數(shù)據(jù)蘊(yùn)含的規(guī)律,它在時(shí)間序列預(yù)測(cè)方面,尤其是高復(fù)雜度的非線性時(shí)間序列方面明顯優(yōu)于傳統(tǒng)的預(yù)測(cè)方法。在預(yù)測(cè)方面,目前應(yīng)用最廣泛且較為成功的是前向神經(jīng)網(wǎng)絡(luò)。
1.1 BP神經(jīng)網(wǎng)絡(luò)基本理論
BP神經(jīng)網(wǎng)絡(luò)也稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),為有監(jiān)督的學(xué)習(xí),是梯度下降法在多層前饋網(wǎng)絡(luò)中的應(yīng)用。它有一個(gè)輸入層、一個(gè)輸出層、一個(gè)或多個(gè)隱含層。每一層上包含若干個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表一個(gè)神經(jīng)元。同一層上的各節(jié)點(diǎn)之間無(wú)連接關(guān)系,相鄰層采取全互連。信息從輸入層開(kāi)始在各層之間單向傳播,依次經(jīng)過(guò)各隱含層,最后到達(dá)輸出層。
BP算法的學(xué)習(xí)過(guò)程是一個(gè)反復(fù)迭代的過(guò)程,由正向傳播和反向傳播組成。其算法的基本思想是根據(jù)網(wǎng)絡(luò)輸出層的誤差,從輸出層開(kāi)始反過(guò)來(lái)調(diào)整網(wǎng)絡(luò)的權(quán)值和閥值,最后使得輸出的均方誤差最小。經(jīng)過(guò)對(duì)一定數(shù)量樣本進(jìn)行反饋學(xué)習(xí)后,網(wǎng)絡(luò)所持的權(quán)值便是網(wǎng)絡(luò)通過(guò)自適應(yīng)學(xué)習(xí)得到的正確的內(nèi)部表示。這時(shí)將待識(shí)別樣本的特征數(shù)據(jù)輸入訓(xùn)練好的網(wǎng)絡(luò),則網(wǎng)絡(luò)就可以對(duì)樣本的屬性進(jìn)行自動(dòng)推理和識(shí)別。在非線性建模方法中,神經(jīng)網(wǎng)絡(luò)理論證明了在選擇適當(dāng)?shù)碾[層數(shù)及相應(yīng)的神經(jīng)元數(shù)目下,前饋神經(jīng)網(wǎng)絡(luò)能以任意精度逼近任意非線性函數(shù)[1]。
1.2 BP神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)領(lǐng)域的實(shí)現(xiàn)
由于BP學(xué)習(xí)算法本質(zhì)上是一個(gè)非線性優(yōu)化問(wèn)題,網(wǎng)絡(luò)模型的確立分為兩個(gè)階段:學(xué)習(xí)階段和檢驗(yàn)階段。學(xué)習(xí)階段是通過(guò)對(duì)歷史資料的學(xué)習(xí),使己有的模式以權(quán)系數(shù)的方式存儲(chǔ)于網(wǎng)絡(luò)之中,這實(shí)質(zhì)上是一個(gè)擬合的過(guò)程;檢驗(yàn)階段是將已有歷史數(shù)據(jù)輸入網(wǎng)絡(luò)之中,檢驗(yàn)網(wǎng)絡(luò)輸出與實(shí)測(cè)值的誤差是否達(dá)到一定的精度要求,如果滿足要求,則BP網(wǎng)絡(luò)可以被用于預(yù)測(cè)。采用BP網(wǎng)絡(luò)學(xué)習(xí)方法進(jìn)行模擬分析,構(gòu)造BP網(wǎng)絡(luò)的基本步驟是:
1) 確定BP網(wǎng)絡(luò)的輸入向量、輸出向量的維數(shù)和隱含層數(shù)及節(jié)點(diǎn)數(shù);
2) 確定隱含層傳遞函數(shù)和輸出層傳遞函數(shù)關(guān)系;
3) 將網(wǎng)絡(luò)學(xué)習(xí)樣本劃分為學(xué)習(xí)段和檢驗(yàn)段;
4) 訓(xùn)練網(wǎng)絡(luò),擬合學(xué)習(xí)段時(shí)間序列,使其誤差平方和達(dá)到最?。?/p>
5) 用檢驗(yàn)段數(shù)據(jù)檢驗(yàn)訓(xùn)練好的網(wǎng)絡(luò)模型,利用該模型對(duì)未來(lái)進(jìn)行預(yù)測(cè)。
1.3 BP神經(jīng)網(wǎng)絡(luò)在醫(yī)藥行業(yè)的應(yīng)用
BP神經(jīng)網(wǎng)絡(luò)在醫(yī)藥行業(yè)的應(yīng)用包括藥品采購(gòu)資金管理、醫(yī)療器材需求和藥品銷售預(yù)測(cè)3個(gè)方面。據(jù)文獻(xiàn)報(bào)道[2-3],出于降低庫(kù)存,提高管理有效性和運(yùn)作靈活性的目的,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)研究對(duì)象的歷史數(shù)據(jù)進(jìn)行分析,得出預(yù)測(cè)值,并與經(jīng)驗(yàn)性的實(shí)際值進(jìn)行對(duì)比,發(fā)現(xiàn)基于BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),可以有效節(jié)約采購(gòu)和生產(chǎn)安排的不穩(wěn)定性,降低庫(kù)存,從而節(jié)約成本,提高效益。
2 BP神經(jīng)網(wǎng)絡(luò)在湖北省基本藥物采購(gòu)量預(yù)測(cè)中的應(yīng)用
2011年3月13日,湖北省政府辦公廳印發(fā)《湖北省基層醫(yī)療衛(wèi)生機(jī)構(gòu)基本藥物集中采購(gòu)管理辦法(試行)》,標(biāo)志著該省建立和規(guī)范基本藥物統(tǒng)一招標(biāo)采購(gòu)新機(jī)制的出臺(tái)[4]。在該辦法中,實(shí)行以省為單位集中采購(gòu)、統(tǒng)一配送,與藥品生產(chǎn)企業(yè)簽訂購(gòu)銷合同,一次完成采購(gòu)全過(guò)程,最大限度地降低采購(gòu)成本,促進(jìn)基本藥物生產(chǎn)和供應(yīng)。
2.1 湖北省基本藥物采購(gòu)量預(yù)測(cè)模型的建立
2.1.1 研究對(duì)象及數(shù)據(jù)準(zhǔn)備
湖北省每月采購(gòu)的基本藥物品種有1 000種之多,從理論上來(lái)說(shuō),為了更好地估計(jì)湖北省的基本藥物采購(gòu)量的預(yù)測(cè)值,需要將每種藥物根據(jù)其歷史采購(gòu)量來(lái)建立預(yù)測(cè)模型,如此一來(lái)會(huì)帶來(lái)巨大的工作量。因此,應(yīng)選擇使用頻率比較高、采購(gòu)比較頻繁、使用特點(diǎn)具有相似性的一大類藥物品種來(lái)進(jìn)行研究。綜合對(duì)湖北省每月采購(gòu)?fù)▓?bào)的分析,選定藥物大類為抗生素類。樣本納入標(biāo)準(zhǔn)為統(tǒng)計(jì)期內(nèi)的采購(gòu)時(shí)間是連續(xù)的,并且屬于同一大類的不同規(guī)格。
本文建模對(duì)象及數(shù)據(jù)見(jiàn)表1。
2.1.2 基本藥物采購(gòu)量神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的實(shí)現(xiàn)
在進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)之前,為避免原始數(shù)據(jù)過(guò)大造成網(wǎng)絡(luò)麻痹,要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,對(duì)于預(yù)測(cè)值,由于變化幅度較大,也不宜直接作為神經(jīng)網(wǎng)絡(luò)的輸出。對(duì)于單極型Sigmoid函數(shù)來(lái)說(shuō),應(yīng)用如下歸一化處理公式對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理:
2.2 實(shí)證檢驗(yàn)
湖北省基本藥物采購(gòu)量神經(jīng)網(wǎng)絡(luò)模型就是利用神經(jīng)網(wǎng)絡(luò)的非線性特性去逼近一個(gè)時(shí)間序列或一個(gè)時(shí)間序列的變形,通過(guò)神經(jīng)網(wǎng)絡(luò)清晰的邏輯關(guān)系,利用過(guò)去時(shí)刻的值去表達(dá)未來(lái)時(shí)刻的值。本文以湖北省部分基本藥物品種采購(gòu)量為數(shù)據(jù),以月度基本藥物采購(gòu)量為預(yù)測(cè)目標(biāo),用上述的建模方法建立月度基本藥物采購(gòu)量預(yù)測(cè)模型。
第一步,建立預(yù)測(cè)模型,對(duì)歸一化的數(shù)據(jù)用MATLAB中提供的函數(shù)進(jìn)行學(xué)習(xí)(圖1),學(xué)習(xí)程序如下:
net=newff(minmax(P), [8 1], {'tansig', 'purelin'}, 'traingdx', 'learngdm');
net.trainparam.epochs=10 000;
net.trainparam.goal=0.005;
net.trainparam.show=500;
[net, tr]=train(net, P, T);
首先,我們?cè)O(shè)定的隱層節(jié)點(diǎn)數(shù)為8,目標(biāo)誤差為0.005,學(xué)習(xí)率設(shè)置為0.01,網(wǎng)絡(luò)經(jīng)過(guò)222次迭代之后達(dá)到了指定精度,誤差為0.004 966 8。再分別設(shè)定隱層節(jié)點(diǎn)數(shù)為:6,8,12,15,20;目標(biāo)誤差不變,仍為0.005,學(xué)習(xí)結(jié)果如表2所示。
結(jié)合學(xué)習(xí)次數(shù)和誤差的比較,可以得出在隱層節(jié)點(diǎn)數(shù)設(shè)為15時(shí),學(xué)習(xí)效果較好。
由17個(gè)月樣本藥品的采購(gòu)量數(shù)據(jù)P為訓(xùn)練值,以第17個(gè)月的采購(gòu)量為目標(biāo)值,進(jìn)行訓(xùn)練。由于2012年12月的采購(gòu)量未知,如果要預(yù)測(cè)第18個(gè)月采購(gòu)量則無(wú)法用實(shí)際的數(shù)據(jù)進(jìn)行檢驗(yàn)。因此在預(yù)測(cè)值調(diào)整為第17個(gè)月的采購(gòu)量數(shù)據(jù)。測(cè)試程序如下:B=sim(net, T)。
誤差為[0.024 9, -0.118 5, -0.170 7, -0.242 2, -0.040 5, 0.143 9, -0.047 5, 0.078 3, -0.066 6, -0.057 3, -0.036 6, 0.003 2, -0.043 6, -0.009 9, 0.020 5, -0.031 0, -0.016 8, 0.057 3, -0.025 1, 0.018 0, 0.036 4, -0.218 0, -0.159 0, -0.112 9, -0.014 81, -0.120 8, 0.134 9, -0.043 6]。誤差均在可接受的范圍內(nèi),認(rèn)可數(shù)據(jù)已得到很好的訓(xùn)練,具備較好的仿真能力。
學(xué)習(xí)的誤差基本上在我們可以接受的范圍內(nèi),其學(xué)習(xí)效果如圖2所示。通過(guò)前面己經(jīng)驗(yàn)證,該網(wǎng)絡(luò)的學(xué)習(xí)能力以及預(yù)測(cè)能力有很大的優(yōu)越性。
2.3 預(yù)測(cè)結(jié)果分析
通過(guò)反歸一化公式:得到第17個(gè)月即2012年11月各藥品的采購(gòu)值。將2012年11月的實(shí)際采購(gòu)量與實(shí)證檢驗(yàn)建立模型后所得到的預(yù)測(cè)中結(jié)果進(jìn)行比較,結(jié)果見(jiàn)表3。
從表3中我們可以看出,除了個(gè)別品種誤差較大以外,如注射用苯唑西林鈉為530.21%、硫酸奈替米星注射液為52.60%,阿莫西林膠囊為42.89%,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)基本藥物的采購(gòu)量的預(yù)測(cè)誤差率大多數(shù)在10%以下,經(jīng)Excel數(shù)據(jù)分析工具中成對(duì)雙樣本均值t檢驗(yàn)分析,結(jié)果見(jiàn)表4。
因?yàn)镻 > 0.05,故預(yù)測(cè)值與實(shí)際值均值差異無(wú)統(tǒng)計(jì)學(xué)意義。
模型預(yù)測(cè)結(jié)果是比較令人滿意的。由于在本次研究中藥品采購(gòu)量的變化是在時(shí)間序列上面進(jìn)行的,所采取的預(yù)測(cè)方法是單步預(yù)測(cè),每月的藥物采購(gòu)量還要受很多因素影響,不可能做到預(yù)測(cè)結(jié)果與實(shí)際的數(shù)據(jù)完全一致。除此之外,基本藥物制度實(shí)施的時(shí)間并不長(zhǎng),在湖北省基本藥物集中采購(gòu)平臺(tái)上所獲取采購(gòu)量的數(shù)據(jù)時(shí)間范圍也不長(zhǎng),所以個(gè)別藥品誤差的較大偏倚也在預(yù)料之中。
根據(jù)計(jì)算得出的結(jié)果,可以很好地預(yù)測(cè)一個(gè)月或幾個(gè)月內(nèi)內(nèi)湖北省的基本藥物采購(gòu)量,相關(guān)基本藥物生產(chǎn)企業(yè)可以根據(jù)預(yù)測(cè)結(jié)果做好生產(chǎn)計(jì)劃安排和原料采購(gòu)等工作,提高企業(yè)生產(chǎn)運(yùn)作效率和經(jīng)濟(jì)效益;基本醫(yī)療機(jī)構(gòu)可以根據(jù)情況調(diào)整藥物儲(chǔ)備和使用量,以使基本藥物的利用率和可及性都能得到很好的保障。
3 總結(jié)與展望
本文對(duì)湖北省2011年5月-2012年11月抗生素大類的部分基本藥物品種的采購(gòu)量預(yù)測(cè)進(jìn)行了定量分析,主要采用了BP神經(jīng)網(wǎng)絡(luò)法進(jìn)行預(yù)測(cè)的實(shí)證研究,不僅簡(jiǎn)化了網(wǎng)絡(luò)結(jié)構(gòu),而且提高了預(yù)測(cè)精度。結(jié)果比較理想,說(shuō)明本文所建立的基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有較好的預(yù)測(cè)能力和推廣潛力。
1) 采購(gòu)決策行為是由主觀因素及客觀因素相互影響共同構(gòu)成,具有動(dòng)態(tài)性和復(fù)雜性等特點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)作為高度非線性體系,能夠?qū)τ绊懖少?gòu)行為的各變量之間的非線性關(guān)系進(jìn)行高精度的逼近,從而實(shí)現(xiàn)預(yù)測(cè)功能。
2) 實(shí)證表明,人工神經(jīng)網(wǎng)絡(luò)雖然存在不足,但其優(yōu)勢(shì)還是顯而易見(jiàn)的。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)高度自動(dòng)化的系統(tǒng),只要有基本藥物的歷史采購(gòu)量,通過(guò)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和仿真,達(dá)到滿意精度后即可輸出特定時(shí)間點(diǎn)的采購(gòu)量,為基本藥物采購(gòu)決策提供科學(xué)的信息支持。但由于影響基本藥物采購(gòu)的各因素并不明了,難以對(duì)基藥采購(gòu)量的波動(dòng)情況進(jìn)行解釋,無(wú)法提供有意義的干預(yù)措施。
3) 由于社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)長(zhǎng)期以來(lái)缺乏對(duì)藥品使用數(shù)據(jù)的收集,在對(duì)其藥品需求分析時(shí)沒(méi)有足夠多的信息予以支持,所以在對(duì)BP神經(jīng)網(wǎng)絡(luò)的推廣應(yīng)用中,需要保證社區(qū)醫(yī)療機(jī)構(gòu)對(duì)藥品使用數(shù)據(jù)的收集、整理與統(tǒng)計(jì),從而增加預(yù)測(cè)的準(zhǔn)確性。
4) 加強(qiáng)有關(guān)基本藥物采購(gòu)分析的理論研究?;舅幬锊煌谝话闵唐?,其供需關(guān)系雖然較為穩(wěn)定,但是在現(xiàn)存醫(yī)患信息極不對(duì)稱的情況下,由于誘導(dǎo)需求、道德風(fēng)險(xiǎn)等問(wèn)題造成劣品驅(qū)逐良品的現(xiàn)象,而對(duì)基本藥物的可及性和供需帶來(lái)不必要的風(fēng)險(xiǎn)?,F(xiàn)行的有關(guān)基本藥物采購(gòu)理論還需進(jìn)一步完善。
5) 對(duì)基本藥物采購(gòu)量分析方法的探索。本文運(yùn)用BP神經(jīng)網(wǎng)絡(luò)在基本藥物采購(gòu)量短期預(yù)測(cè)上面進(jìn)行一次有益的探索,結(jié)論雖然具備理論指導(dǎo)意義和實(shí)際應(yīng)用價(jià)值。但是由于BP神經(jīng)網(wǎng)絡(luò)無(wú)法探知對(duì)變量造成波動(dòng)的影響因素,若從現(xiàn)實(shí)意義進(jìn)行指導(dǎo),還需要結(jié)合其他的分析方法如多元回歸分析、主成分分析等方法來(lái)相互補(bǔ)充,揚(yáng)長(zhǎng)避短。
參考文獻(xiàn)
[1] 王維, 賀京同, 張建勛, 等. 人工神經(jīng)網(wǎng)絡(luò)在非線性經(jīng)濟(jì)預(yù)測(cè)中的應(yīng)用[J]. 系統(tǒng)工程學(xué)報(bào), 2000, 15(2): 202-207.
[2] 劉衛(wèi)紅, 崔振霞. 基于BP神經(jīng)網(wǎng)絡(luò)的藥品采購(gòu)資金管理研究[J]. 中國(guó)鄉(xiāng)鎮(zhèn)企業(yè)會(huì)計(jì), 2012, 20(1): 70-71.
[3] 張俊才, 黃萬(wàn)杰. BP神經(jīng)網(wǎng)絡(luò)在醫(yī)療器材需求預(yù)測(cè)中的應(yīng)用[J]. 醫(yī)療衛(wèi)生裝備, 2004, 25(4): 8-9.
(黑龍江民族職業(yè)學(xué)院,黑龍江 哈爾濱 150066)
摘 要:盈余預(yù)測(cè)具有引導(dǎo)投資者投資行為的作用,因此受到投資者的廣泛重視。然而,國(guó)內(nèi)對(duì)公司未來(lái)盈利進(jìn)行預(yù)測(cè)的研究還相當(dāng)少。提出了以決策樹(shù)作為基分類器,采用集成學(xué)習(xí)方法,利用上市某公司2001至2005年的財(cái)務(wù)數(shù)據(jù)對(duì)該上市公司在2006年的盈利狀況進(jìn)行預(yù)測(cè)研究。首先,采用有放回的隨機(jī)抽樣技術(shù)分別從訓(xùn)練樣本和測(cè)試樣本中產(chǎn)生50個(gè)訓(xùn)練子集和1個(gè)測(cè)試集;然后利用決策樹(shù),采用CHAID算法對(duì)50個(gè)訓(xùn)練子集分別進(jìn)行訓(xùn)練,得到50個(gè)基決策樹(shù)分類器;通過(guò)采用Bagging方法,構(gòu)建決策樹(shù)集成模型。所得到的集成模型在測(cè)試集上的分類準(zhǔn)確率達(dá)到96%以上,通過(guò)比較由不同數(shù)目的基分類器構(gòu)成的集成模 型和單個(gè)分類器的預(yù)測(cè)準(zhǔn)確率,證明了該集成模型的預(yù)測(cè)準(zhǔn)確率高且穩(wěn)定。
關(guān)鍵詞 :神經(jīng)網(wǎng)絡(luò);集成學(xué)習(xí);盈利預(yù)測(cè)
中圖分類號(hào):F275文獻(xiàn)標(biāo)志碼:A文章編號(hào):1000-8772(2014)31-0253-02
收稿日期:2014-10-28
作者簡(jiǎn)介:潘道華(1981-),女,漢族,黑龍江哈爾濱人,研究生,主要研究方向:人工智能、數(shù)據(jù)挖掘與決策支持。
1 引言
公司的財(cái)務(wù)狀況及其未來(lái)盈利情況不但對(duì)公司的管理層十分重要,而且對(duì)其他投資者也非常重要。如果能夠利用公司以往的財(cái)務(wù)報(bào)表數(shù)據(jù)和其它一些宏觀經(jīng)濟(jì)數(shù)據(jù)(如GDP、CPI、利率等)及早準(zhǔn)確預(yù)測(cè)公司未來(lái)的盈利狀況的話,那么就可以更有效地對(duì)公司進(jìn)行管理和指導(dǎo)投資者的投資行為。但是,一個(gè)公司的財(cái)務(wù)報(bào)表往往只反映了公司在過(guò)去的財(cái)政年度內(nèi)的經(jīng)營(yíng)狀況,并不反映出公司在下一年中的管理情況。因而,一個(gè)公司的財(cái)務(wù)狀況與其未來(lái)盈利之間的關(guān)系并沒(méi)有那么明顯,它受到很多因素的影響,要構(gòu)建一個(gè)精確的模型反映它們之間的關(guān)系是很困難的。針對(duì)此情況,本文提出采用決策樹(shù)集成方法,構(gòu)建模型來(lái)刻畫(huà)公司財(cái)務(wù)狀況與其未來(lái)盈利之間的關(guān)系,利用上市公司已有的財(cái)務(wù)數(shù)據(jù),并結(jié)合主要的宏觀經(jīng)濟(jì)變量來(lái)預(yù)測(cè)公司未來(lái)的盈利狀況,這必將是公司財(cái)務(wù)處理的一個(gè)新發(fā)展。
數(shù)據(jù)挖掘技術(shù)越來(lái)越多地被用于預(yù)測(cè)研究。集成學(xué)習(xí)方法作為數(shù)據(jù)挖掘技術(shù)中一種較新的方法,由于其在提高預(yù)測(cè)的準(zhǔn)確性上的優(yōu)點(diǎn),正被越來(lái)越多的研究者使用。
盡管許多領(lǐng)域都應(yīng)用集成學(xué)習(xí)方法來(lái)進(jìn)行研究,但在對(duì)公司未來(lái)盈利的預(yù)測(cè)研究上還很少,在國(guó)內(nèi)尚未見(jiàn)到任何報(bào)導(dǎo)。雖然Takashi Washio等人對(duì)日本上市公司的未來(lái)盈利狀況進(jìn)行了研究,但是他們只是將盈利狀況分為兩種情況來(lái)進(jìn)行研究。本文通過(guò)利用集成學(xué)習(xí)方法,考慮宏觀經(jīng)濟(jì)對(duì)公司盈利可能造成的影響,提出將宏觀經(jīng)濟(jì)變量納入變量體系,同時(shí),為了使結(jié)果更有指導(dǎo)意義,將上市公司的每股收益(EPS)指標(biāo)將公司盈利的情況劃分為三類,即EPS為負(fù),EPS大于均值及EPS介于二者之間,對(duì)其進(jìn)行預(yù)測(cè)研究。
2 研究方法
2.1神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是由大量并行分布式處理單元組成的簡(jiǎn)單處理單元[1]。由于神經(jīng)網(wǎng)絡(luò)具有非線性,自學(xué)習(xí)能力、自適應(yīng)性強(qiáng)和容錯(cuò)性高等優(yōu)點(diǎn),因而被廣泛用于各種非線性預(yù)測(cè)問(wèn)題。
所有神經(jīng)網(wǎng)絡(luò)都有一個(gè)輸入層和輸出層,一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)可以包含一個(gè)或多個(gè)隱含層。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)是通過(guò)調(diào)整連接權(quán)重和偏差實(shí)現(xiàn)的。Cybenko等人證明了如果神經(jīng)網(wǎng)絡(luò)利用一個(gè)有界的,連續(xù)的,非遞減的激活函數(shù)時(shí),只要不對(duì)隱含層的神經(jīng)元數(shù)進(jìn)行限制,一個(gè)三層網(wǎng)絡(luò)(包含一個(gè)隱含層)就能夠?qū)W習(xí)任意一個(gè)在輸入和輸出空間的連續(xù)映射[2]。在實(shí)際應(yīng)用中用的最多的是BP神經(jīng)網(wǎng)絡(luò)。
BP神經(jīng)網(wǎng)絡(luò)是一種基于誤差后向傳播算法(BP算法)的多層感知器網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)的激活函數(shù)一般采用Log-Sigmoid或Tangent Sigmoid等可微函數(shù)。BP算法分為兩個(gè)階段。第一階段是前向過(guò)程,逐層計(jì)算各神經(jīng)元的輸出值,第二階段是誤差后向傳播過(guò)程,從后向前逐層傳播輸出層的誤差并據(jù)此修正各層權(quán)重,直到輸出結(jié)果滿足預(yù)先設(shè)定的精度要求或達(dá)到算法設(shè)定的最大循環(huán)次數(shù)。
2.2神經(jīng)網(wǎng)絡(luò)集成
如何根據(jù)觀測(cè)數(shù)據(jù)學(xué)習(xí)得到精確估計(jì)是機(jī)器學(xué)習(xí)領(lǐng)域中人們非常關(guān)注的一個(gè)問(wèn)題,機(jī)器學(xué)習(xí)的一個(gè)重要目標(biāo)就是對(duì)新的測(cè)試樣本盡可能給出最精確的估計(jì)。構(gòu)造一個(gè)高精度估計(jì)是一件相當(dāng)困難的事情,然而產(chǎn)生多個(gè)只比隨機(jī)猜測(cè)好的粗糙估計(jì)卻很容易。傳統(tǒng)的機(jī)器學(xué)習(xí)方法是在一個(gè)由各種可能的函數(shù)構(gòu)成的空間中尋找最接近實(shí)際分類函數(shù)的分類器。常用的單個(gè)分類器模型主要有決策樹(shù)、人工神經(jīng)網(wǎng)絡(luò)等。
集成學(xué)習(xí)(ensemble learning)的基本思想是在對(duì)新的實(shí)例進(jìn)行分類的時(shí)候,把若干個(gè)單個(gè)分類器集成起來(lái),通過(guò)對(duì)多個(gè)分類器的分類結(jié)果按某種方式來(lái)進(jìn)行組合,決定最終的分類,以取得比單個(gè)分類器更好的結(jié)果。如果把單個(gè)分類器比作一個(gè)決策者的話,集成學(xué)習(xí)方法就相當(dāng)于多個(gè)決策者共同進(jìn)行一項(xiàng)決策。
盡管單個(gè)神經(jīng)網(wǎng)絡(luò)在處理非線性問(wèn)題上表現(xiàn)良好,但是用單個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行預(yù)測(cè),一個(gè)不足的地方就是結(jié)果的穩(wěn)定性差。因?yàn)樯窠?jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果受網(wǎng)絡(luò)各層之間的初始權(quán)重影響很大。為了克服這一不足,本文利用集成學(xué)習(xí)的思想,采用以BP神經(jīng)網(wǎng)絡(luò)作為基分類器的神經(jīng)網(wǎng)絡(luò)集成方法來(lái)對(duì)公司未來(lái)盈利狀況進(jìn)行預(yù)測(cè)。
以神經(jīng)網(wǎng)絡(luò)作為基分類器構(gòu)建集成模型的方法主要有Bagging和Boosting。本文選擇采用Bagging方法,因?yàn)锽agging方法較易于實(shí)現(xiàn),而且不容易產(chǎn)生過(guò)擬合現(xiàn)象。對(duì)一個(gè)已知的有n個(gè)數(shù)據(jù)元素的數(shù)據(jù)集,Bagging法的原理是[1]:對(duì)每次循環(huán)(=1,2,…,),采用有放回的隨機(jī)抽樣方法從數(shù)據(jù)集中抽取m個(gè)數(shù)據(jù)形成訓(xùn)練集(mn),分類器模型從中學(xué)習(xí)。為了對(duì)一個(gè)未知的元素X分類,每個(gè)都返回一個(gè)分類值,將該分類值看成是一票,而最后的集成分類器,通過(guò)統(tǒng)計(jì)這些投票,將X歸為得票最多的那一類。
3 研究步驟與具體實(shí)例分析
3.1樣本選取
本文采用的上市公司數(shù)據(jù)樣本來(lái)自天軟數(shù)據(jù)庫(kù)。在剔除了財(cái)務(wù)變量有大量缺失值后,樣本共包含從2001年至2006年的深市和滬市A股的1174家上市公司。其中,滬市上市公司734家,深市440家。本文選取了反映上市公司償債能力,成長(zhǎng)能力,經(jīng)營(yíng)能力,資本結(jié)構(gòu),盈利能力,現(xiàn)金流,每股指標(biāo)等方面的29個(gè)財(cái)務(wù)變量作為初始變量。此外,為了研究宏觀經(jīng)濟(jì)環(huán)境對(duì)公司未來(lái)盈利的影響,相應(yīng)的選擇了2001年至2006年的三個(gè)宏觀經(jīng)濟(jì)變量:國(guó)內(nèi)生產(chǎn)總值增長(zhǎng)率(GDP),居民消費(fèi)價(jià)格指數(shù)增長(zhǎng)率(CPI)及一年期金融機(jī)構(gòu)貸款基準(zhǔn)利率。這幾個(gè)變量都與公司的盈利狀況有著密切的關(guān)系。國(guó)內(nèi)生產(chǎn)總值反映了整個(gè)國(guó)家的經(jīng)濟(jì)狀況,而居民消費(fèi)價(jià)格指數(shù)是反映居民購(gòu)買并用于消費(fèi)的商品和服務(wù)項(xiàng)目?jī)r(jià)格水平的變動(dòng)趨勢(shì)和變動(dòng)幅度的相對(duì)數(shù),它可以全面反映多種市場(chǎng)價(jià)格變動(dòng)因素及其對(duì)居民實(shí)際生活的影響程度。一年期金融機(jī)構(gòu)貸款基準(zhǔn)利率會(huì)影響公司的營(yíng)運(yùn)成本,會(huì)對(duì)公司的利潤(rùn)產(chǎn)生直接的影響。所有變量見(jiàn)附表。
為了預(yù)測(cè)未來(lái)公司的盈利狀況,本文將數(shù)據(jù)樣本分為訓(xùn)練樣本和測(cè)試樣本。其中,訓(xùn)練樣本由2001年至2005年的公司樣本數(shù)據(jù)用有放回的隨機(jī)抽樣方法得到,每個(gè)訓(xùn)練樣本包含1000個(gè)觀測(cè),測(cè)試樣本是用相同方法得到的上市公司在2006年的數(shù)據(jù)樣本,包含400個(gè)觀測(cè)。
3.2指標(biāo)選擇
對(duì)于初始變量表,變量之間存在著相關(guān)性。雖然神經(jīng)網(wǎng)絡(luò)對(duì)變量間的相關(guān)性具有較強(qiáng)的容忍度,但是,變量太多會(huì)增加網(wǎng)絡(luò)的復(fù)雜度,還有可能使網(wǎng)絡(luò)過(guò)適應(yīng),從而使得網(wǎng)絡(luò)在測(cè)試樣本上的表現(xiàn)很差,而且并不是變量越多,神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度就越大,所以適當(dāng)選擇具有代表性的指標(biāo)變量既可以達(dá)到與用所有變量相同的預(yù)測(cè)精度,又能降低網(wǎng)絡(luò)的復(fù)雜度,避免使網(wǎng)絡(luò)陷入過(guò)適應(yīng),提高網(wǎng)絡(luò)的訓(xùn)練速度。
然而,運(yùn)用神經(jīng)網(wǎng)絡(luò)方法,對(duì)輸入變量的選取目前并沒(méi)有一個(gè)公認(rèn)的方法。為了從眾多的初始變量中選擇具有代表性的變量,本文利用spss Clementine11.1數(shù)據(jù)挖掘軟件包選項(xiàng)面板中的建模欄中的特征選擇節(jié)點(diǎn)來(lái)對(duì)變量進(jìn)行篩選。通過(guò)構(gòu)建一個(gè)帶有特征選擇節(jié)點(diǎn)的流,可以為每一訓(xùn)練集篩選出重要的變量。利用篩選出來(lái)的變量和全部變量分別對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,得到兩種神經(jīng)網(wǎng)絡(luò)模型,分別對(duì)測(cè)試樣本進(jìn)行分類,并分別構(gòu)建集成模型。
3.3 建立模型
本文是對(duì)2001年至2005年上市公司的數(shù)據(jù)樣本進(jìn)行訓(xùn)練得到單個(gè)神經(jīng)網(wǎng)絡(luò)模型,用該模型對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)。如何產(chǎn)生不同的分類模型是影響集成模型準(zhǔn)確性的一個(gè)重要因素[4]。以下四種方法——不同的初始條件,不同的網(wǎng)絡(luò)結(jié)構(gòu),不同的訓(xùn)練數(shù)據(jù),不同的訓(xùn)練算法常用來(lái)產(chǎn)生分類模型。本文采用不同的訓(xùn)練數(shù)據(jù)和不同的網(wǎng)絡(luò)結(jié)構(gòu)這兩種方式結(jié)合得到基神經(jīng)網(wǎng)絡(luò)。
按照Bagging方法的要求,本文采用有放回隨機(jī)抽樣方法,從訓(xùn)練樣本中隨機(jī)抽取了15個(gè)子訓(xùn)練集,并用相同的方法從測(cè)試集中抽取了400個(gè)樣本數(shù)據(jù)組成測(cè)試集。每個(gè)子訓(xùn)練集含有1000個(gè)樣本,它們均由2001至2005年的200個(gè)公司樣本組成。利用特征選擇節(jié)點(diǎn)在每個(gè)訓(xùn)練集上選出的變量分別在這15個(gè)子樣本上進(jìn)行訓(xùn)練得到子分類器,然后用這些子分類器對(duì)測(cè)試樣本進(jìn)行分類。采用多數(shù)投票法對(duì)子分類器進(jìn)行集成,得到集成方法在測(cè)試集上的預(yù)測(cè)結(jié)果。
3.4 結(jié)果分析
為了比較集成模型與單個(gè)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)準(zhǔn)確率的差異,按照單個(gè)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)準(zhǔn)確率按升序進(jìn)行排序,分別計(jì)算了由7個(gè)、9個(gè)、11個(gè)、13個(gè)、15個(gè)基神經(jīng)網(wǎng)絡(luò)模型構(gòu)成的集成模型的預(yù)測(cè)準(zhǔn)確率,集成模型,不論是由用全部變量進(jìn)行訓(xùn)練得到的基神經(jīng)網(wǎng)絡(luò)構(gòu)建還是由用篩選出的變量進(jìn)行訓(xùn)練得到的構(gòu)建,都顯示出了很高的準(zhǔn)確率,而且得到的預(yù)測(cè)準(zhǔn)確率相當(dāng)穩(wěn)定。
4 結(jié)論
本文利用神經(jīng)網(wǎng)絡(luò)集成的方法,以上市公司過(guò)去的財(cái)務(wù)數(shù)據(jù)和宏觀經(jīng)濟(jì)數(shù)據(jù)為樣本,對(duì)上市公司的未來(lái)盈利狀況進(jìn)行預(yù)測(cè)。研究結(jié)果表明,相比于單個(gè)神經(jīng)網(wǎng)絡(luò)模型,盡管選用7個(gè)預(yù)測(cè)精度最差的單個(gè)神經(jīng)網(wǎng)絡(luò)作為基神經(jīng)網(wǎng)絡(luò),其集成網(wǎng)絡(luò)的預(yù)測(cè)準(zhǔn)確率仍然很高,因而集成方法得到的結(jié)果更穩(wěn)定,更具有說(shuō)服力。
由于上市公司管理水平的差異,影響公司盈利狀況的因素又多,所以要想較好的刻畫(huà)它們對(duì)盈利狀況的影響,是一個(gè)很有挑戰(zhàn)性的問(wèn)題。本文的研究結(jié)果還表明,采用神經(jīng)網(wǎng)絡(luò)集成方法來(lái)研究未來(lái)盈利狀況是可行的。進(jìn)一步的研究可以從以下幾個(gè)方面考慮:
(1)變量的選取。為了使預(yù)測(cè)更為準(zhǔn)確,在建模時(shí),需要考慮更多的影響因素。由于公司盈利狀況跟公司的管理水平直接相關(guān),因此,如何合理選取量化一些有關(guān)公司治理的指標(biāo)變量,將它們加入到模型中去,是一個(gè)值得深入研究的問(wèn)題。
(2)產(chǎn)生集成神經(jīng)網(wǎng)絡(luò)的方法。除了Bagging方法,還有其他產(chǎn)生集成神經(jīng)網(wǎng)絡(luò)的方法,比如Boosting方法。不同的方法會(huì)得到不同的結(jié)果,從而通過(guò)比較不同的結(jié)果,可以得到一個(gè)用來(lái)研究此類問(wèn)題的最好的方法。
參考文獻(xiàn):
[1] Lars Kar Hansen, Peter Salamon. Neural network ensembles,IEEE transactions on pattern analysis and machine intelligence,vol.12, pp993-1001, 1990.
[2] Li-Chiu Chia,Tseng-Chung Tang. Artificial neural networks in reorganization outcome and investment of distressed firms: The Taiwanese case, Expert Systems with Applications, vol.29,pp641-652, 2005.
[3] Jiawei Han Micheline Kamber, data mining; concepts and tech-niques(second edition)[M].北京:機(jī)械工業(yè)出版社,2006.
關(guān)鍵詞:GPS;高程擬合;大地高;正常高;擬合精度
Abstract: This paper discussed in detail the problems of GPS leveling survey, summarizes the commonly used methods of GPS height fitting, quasi geoid instances to two surface, polyhedral function, BP neural network method to fit the calculation by using MATLAB language program, analysis and draw some conclusions.
Key words: GPS; height; geodetic height; normal height; fitting accuracy
中圖分類號(hào):P228.4 文獻(xiàn)標(biāo)識(shí)碼: A文章編號(hào):2095-2104(2012)01-0020-02
一、引言
由于精度的限制,長(zhǎng)期以來(lái),工程應(yīng)用領(lǐng)域在利用GPS測(cè)量中平面位置信息的同時(shí),浪費(fèi)掉了大量高程信息。因此,GPS測(cè)高在一定程度上取代幾何水準(zhǔn)的限制性和可行性一直受到各方面關(guān)注。利用GPS水準(zhǔn)進(jìn)行測(cè)高,主要是通過(guò)GPS水準(zhǔn)擬合所測(cè)區(qū)域的高程異常分布,將GPS所測(cè)點(diǎn)的大地高轉(zhuǎn)化為正常高。由GPS得到正常高,其精度取決于多方面因素,本文采用多種擬合模型,對(duì)大范圍GPS水準(zhǔn)實(shí)測(cè)數(shù)據(jù)做了實(shí)驗(yàn)研究,對(duì)其結(jié)果進(jìn)行了比較,討論了相關(guān)問(wèn)題,得出了具有實(shí)際應(yīng)用的參考意見(jiàn)。
二、似大地水準(zhǔn)面的模擬與GPS高程擬合
GPS高程測(cè)量的基本原理
由高程系統(tǒng)的理論可知,測(cè)站點(diǎn)的大地高H與正常高h(yuǎn)之間有如下關(guān)系:
h=H-ζ (1)
式中ζ稱為高程異常。
由(1)式可看出, 若能求出GPS點(diǎn)的高程異常,就可確定GPS點(diǎn)的正常高h(yuǎn)。因此,高程異常的確定成為GPS高程轉(zhuǎn)換的關(guān)鍵。
縱觀高程異常的確定方法,可以分為幾何解析法和重力法兩類。
幾何解析法是用一個(gè)1次或高次的解析多項(xiàng)式擬合出測(cè)區(qū)的似大地水準(zhǔn)面,進(jìn)而內(nèi)插出GPS點(diǎn)上的高程異常值。
GPS重力高程是用重力資料求定點(diǎn)的高程異常,結(jié)合GPS求出的大地高,再求出點(diǎn)的正常高(或正高)的一種方法,應(yīng)用中需結(jié)合地形數(shù)字模型和地球重力場(chǎng)模型數(shù)據(jù)。對(duì)于一般工程單位而言,無(wú)法獲得必要的重力數(shù)據(jù),故重力法難于普及。
本文主要研究從幾何觀點(diǎn)出發(fā)推求大地水準(zhǔn)面的方法,此類方法的基本思想如下:
假設(shè)在測(cè)區(qū)內(nèi)有若干個(gè)既進(jìn)行了GPS測(cè)量又聯(lián)測(cè)了水準(zhǔn)高程的GPS點(diǎn),那么可利用大地高和高程異常之間的關(guān)系,推算出各水準(zhǔn)重合點(diǎn)的上的高程異常,利用這些離散數(shù)據(jù)點(diǎn)上的異常值,可以擬合出測(cè)區(qū)所在局部區(qū)域的似大地水準(zhǔn)面,進(jìn)而可以內(nèi)插出未知點(diǎn)上的高程異常,實(shí)現(xiàn)橢球高向正常高的轉(zhuǎn)換。
幾種常用的擬合方法
繪等值線圖法
這是最早的GPS水準(zhǔn)方法。其原理是:設(shè)在某一測(cè)區(qū),有m個(gè)GPS點(diǎn),用幾何水準(zhǔn)聯(lián)測(cè)其中n個(gè)點(diǎn)的正常高,根據(jù)GPS觀測(cè)獲得的點(diǎn)的大地高,按(1)式求出n個(gè)已知點(diǎn)的高程異常。然后,選定適合的比例尺,按n個(gè)已知點(diǎn)的平面坐標(biāo)(平面坐標(biāo)經(jīng)GPS網(wǎng)平差后獲得),展繪在圖紙上,并標(biāo)注上相應(yīng)的高程異常,再用1~5cm的等高距,繪出測(cè)區(qū)的高程異常圖。在圖上內(nèi)插出未聯(lián)測(cè)幾何水準(zhǔn)的(m-n)個(gè)點(diǎn)的高程異常,從而求出這些待求點(diǎn)的正常高。
三次樣條曲線擬合
當(dāng)測(cè)線長(zhǎng),已知點(diǎn)多,ζ變化大時(shí),如果進(jìn)行整體擬合,精度較低,若分段擬合計(jì)算,則分段點(diǎn)上將不連續(xù),且影響擬合精度,這時(shí)宜用三次樣條曲線擬合。
多面函數(shù)擬合
多面函數(shù)是從幾何觀點(diǎn)出發(fā),解決根據(jù)數(shù)據(jù)點(diǎn)形成一個(gè)平差的數(shù)學(xué)曲面問(wèn)題。其理論根據(jù)是認(rèn)為“任何一個(gè)圓滑的數(shù)學(xué)表面總可以用一系列有規(guī)則的數(shù)學(xué)表面總和,以任意的精度逼近”。它在每個(gè)數(shù)據(jù)點(diǎn)上同各個(gè)已知點(diǎn)分別建立函數(shù)關(guān)系(這種函數(shù)稱為核函數(shù),其表現(xiàn)形式為一規(guī)則的數(shù)學(xué)曲面),將這些規(guī)則的數(shù)學(xué)曲面按一定的比例疊加起來(lái),就可以擬合出任何不規(guī)則的曲面,且能達(dá)到較好的擬合效果。多面函數(shù)的核函數(shù)可以按幾何關(guān)系確定,它是距離的函數(shù),且顧及了待定點(diǎn)和已知點(diǎn)間的相關(guān)關(guān)系,起權(quán)系數(shù)矩陣作用。
加權(quán)平均值法擬合
采用加權(quán)平均值法推算未知點(diǎn)的高程異常進(jìn)行GPS高程轉(zhuǎn)換時(shí),必須使水準(zhǔn)重合點(diǎn)沿控制網(wǎng)比較均勻地分布,使推算點(diǎn)位于已知點(diǎn)所圍成的多邊形內(nèi),否則不能保證內(nèi)插點(diǎn)上計(jì)算結(jié)果的可靠性。另外,還應(yīng)使多邊形范圍內(nèi)有一定數(shù)量的水準(zhǔn)重合點(diǎn),并盡可能地均勻分布。一些實(shí)驗(yàn)與分析資料顯示,控制網(wǎng)中水準(zhǔn)重合點(diǎn)的數(shù)量越多,密度越大,分布情況越好,利用加權(quán)平均值法求得的高程異常值的準(zhǔn)確程度越高 (即GPS大地高轉(zhuǎn)換為正常高的實(shí)際精度越高)。一般要求一個(gè)網(wǎng)中水準(zhǔn)重合點(diǎn)的數(shù)量要保持在10個(gè)左右,至少為 6個(gè)。
曲面擬合法
當(dāng)GPS點(diǎn)布設(shè)成一定區(qū)域面時(shí),可以應(yīng)用數(shù)學(xué)曲面擬合法求定待定點(diǎn)的正常高。其原理是:根據(jù)測(cè)區(qū)中已知點(diǎn)的平面坐標(biāo)(X,Y),或大地坐標(biāo)(B,L)和ζ值,用數(shù)值擬合法,擬合出測(cè)區(qū)似大地水準(zhǔn)面,再內(nèi)插出待求點(diǎn)的ζ,從而求出待求點(diǎn)的正常高。
神經(jīng)網(wǎng)絡(luò)法
人工神經(jīng)網(wǎng)絡(luò)是一門新興交叉科學(xué),它是生物神經(jīng)系統(tǒng)的一種高度簡(jiǎn)化后的近似,是處理非線形映射問(wèn)題的有效工具?;谏窠?jīng)網(wǎng)絡(luò)來(lái)轉(zhuǎn)換GPS高程是一種自適應(yīng)的映射方法,設(shè)作假設(shè),理論上比較合理,能避開(kāi)未知因素的影響,減少人為構(gòu)造的數(shù)學(xué)模型的誤差。
擬合法進(jìn)行GPS高程轉(zhuǎn)換的幾個(gè)問(wèn)題
(1)擬合函數(shù)的選取。大范圍GPS水準(zhǔn)高程異常分布的嚴(yán)格確定是十分困難的,高程異常的確定不僅取決與地球內(nèi)部密度變化而且還取決地形起伏等各種因素。因此,用一種數(shù)學(xué)函數(shù)去擬合測(cè)區(qū)中給定的高程異常點(diǎn),其模型誤差是不可避免的,選取模型誤差較小的擬合方程來(lái)描述其高程異常分布是一種相對(duì)合理的方法。
(2)如果選擇的擬合模型較好,能否較準(zhǔn)確的擬合出該測(cè)區(qū)的局部似大地水準(zhǔn)面的關(guān)鍵在于已知高程異常值的準(zhǔn)確性。采用擬合法確定地面點(diǎn)的正常高是建立在兩個(gè)前提基礎(chǔ)上的:平差后的GPS高程觀測(cè)值具有很高的精度,可以看作是精確值;已知高程控制點(diǎn)上的正常高亦可看成精確值。
(3)GPS網(wǎng)中水準(zhǔn)點(diǎn)的選擇和分布。水準(zhǔn)點(diǎn)的分布對(duì)于擬合效果有著至關(guān)重要的影響。原則上要求水準(zhǔn)重合點(diǎn)的分布盡可能的均勻,而且在網(wǎng)的邊界上布設(shè)水準(zhǔn)重合點(diǎn),這樣可以大大降低內(nèi)插出的非重合點(diǎn)上的高程異常的不可靠性。
三、實(shí)驗(yàn)研究
為研究擬合模型,水準(zhǔn)點(diǎn)的精度及布設(shè)形式對(duì)擬合精度的影響,本文利用上述模型中的曲面擬合法、多面擬合法及神經(jīng)網(wǎng)絡(luò)法,用MATLAB語(yǔ)言編程實(shí)現(xiàn)了對(duì)某GPS網(wǎng)的高程擬合。
(1)實(shí)驗(yàn)區(qū)概況
該GPS控制網(wǎng)共有15個(gè)點(diǎn)與水準(zhǔn)點(diǎn)重合,控制面積為150k m2, 測(cè)區(qū)水準(zhǔn)點(diǎn)分布圖如圖1,高程成果表見(jiàn)表1。
圖1點(diǎn)位分布圖
測(cè)區(qū)高程成果表表1
從表 1 中的高程異常值可知,該測(cè)區(qū)的局部似大地水準(zhǔn)面較為平緩,且沒(méi)有顯現(xiàn)孤值性,均可參加擬合計(jì)算。
(2)為了選擇較好的擬合方案,對(duì)如下的幾種情況做了計(jì)算,并分析比較擬合結(jié)果。
(1)隨機(jī)選擇10個(gè)已知點(diǎn),用二次曲面、多面函數(shù)、BP網(wǎng)絡(luò)進(jìn)行擬合,結(jié)果見(jiàn)表2。
(2)選擇10個(gè)分布比較均勻的已知點(diǎn),用二次曲面、多面函數(shù)、BP網(wǎng)絡(luò)進(jìn)行擬合,結(jié)果見(jiàn)表3。
不同模型隨機(jī)選點(diǎn)擬合結(jié)果 表2
不同模型均勻選點(diǎn)擬合結(jié)果表3
四、結(jié)論
從上面擬合結(jié)果比較得出如下結(jié)論:
(1)某一區(qū)域的GPS高程擬合與模型的選擇有很大關(guān)系,選擇某一模型的時(shí)候,既要橫向比較,即同一模型不同條件比較,也要縱向比較,即不同模型之間比較。
(2)GPS水準(zhǔn)高程擬合精度與已知點(diǎn)的精度有關(guān)。當(dāng)已知點(diǎn)精度降低時(shí),待定點(diǎn)精度明顯降低,要得到較高精度的GPS水準(zhǔn)高程,就需要保證已知點(diǎn)精度。
(3)已知點(diǎn)的位置對(duì)GPS水準(zhǔn)高程擬合的精度影響很大。待定點(diǎn)精度在很大程度上取決與已知點(diǎn)的分布狀況。在進(jìn)行GPS水準(zhǔn)高程擬合時(shí),一定要使已知點(diǎn)均勻分布整個(gè)測(cè)區(qū),并具有一定的代表性。
(4)在較大范圍內(nèi),用神經(jīng)網(wǎng)絡(luò)方法轉(zhuǎn)換GPS高程優(yōu)于二次曲面和多面函數(shù)法,所獲得的正常高可滿足各種大比例尺測(cè)圖的精度要求。
參考文獻(xiàn):
[1]陶本藻,蔡風(fēng)萍 大范圍GPS水準(zhǔn)擬合模型的選取及其實(shí)驗(yàn)研究[J].工程勘察,2005,(1)。
[2]李崇貴,牟玉香,趙書(shū)河用嶺估計(jì)研究不完全三維趨勢(shì)面在GPS工程水準(zhǔn)測(cè)量中的應(yīng)用[J].測(cè)繪通報(bào),1998,(8)。
關(guān)鍵詞: 高維BP神經(jīng)網(wǎng)絡(luò); 粒子群算法; 神經(jīng)網(wǎng)絡(luò); 結(jié)構(gòu)優(yōu)化
中圖分類號(hào): TN711?34; TP311 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)03?0157?03
Research on a neural network structure optimization method based on
high?dimensional particle swarm optimization
HUANG Yu1, 2
(1. College of Computer Science, Chongqing University, Chongqing 400044, China; 2. Yibin Vocational and Technical College, Yibin 644003, China)
Abstract: In order to eliminate the shortcomings of the traditional BP neural network in the operation process, a neural network optimization method based on the high?dimensional particle swarm optimization algorithm is proposed. The acceleration constant with random variation is introduced into the high?dimensional PSO algorithm to acquire the optimal weight to optimize and train the BP neural network. The optimized high?dimensional BP neural network is applied to the automatic detection of the traffic incident. The trained data is performed with class test with the detection and training algorithm, and its result is compared with those tested with the traditional BP neural network algorithm and classical event detection algorithm. The results show that the detection rate and performance of the algorithm optimized with high?dimensional particle swarm optimization BP neural network algorithm are better than those optimized with BP neural network algorithm and classical algorithm, the values of 2 test samples are different with the expected values of 97 and 50 test samples, the rest samples can meet the test requirement, and the average optimal testing time is half of the detection time of the traditional BP neural network. The optimized BP neural network algorithm has excellent performance.
Keywords: high?dimensional BP neural network; particle swarm optimization; neural network; structure optimization
0 引 言
目前關(guān)于高維多目標(biāo)優(yōu)化問(wèn)題的理論和方法大都限于少數(shù)幾種算法,如NSGA?II算法,粒子群優(yōu)化(PSO)算法。粒子群優(yōu)化算法是Kennedy等受到飛鳥(niǎo)集群活動(dòng)的啟發(fā)而提出的一類新興的基于集群智能優(yōu)化算法[1?5]。相比進(jìn)化算法,PSO具有易于實(shí)現(xiàn)和收斂速度快等優(yōu)勢(shì)。近年來(lái)PSO在多目標(biāo)優(yōu)化領(lǐng)域的研究上取得了較大進(jìn)展[6?9],在神經(jīng)網(wǎng)絡(luò)訓(xùn)練、復(fù)雜函數(shù)優(yōu)化、圖像處理、工業(yè)系統(tǒng)優(yōu)化等領(lǐng)域應(yīng)用廣泛[10],PSO在特性的函數(shù)優(yōu)化問(wèn)題上更是發(fā)揮著重要作用,這些特性函數(shù)通常具備維數(shù)高、非線性、規(guī)模大、非凸和不可微等特點(diǎn),一般計(jì)算方法運(yùn)算困難。針對(duì)粒子群優(yōu)化算法的優(yōu)點(diǎn)以及傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)存在的諸如較慢的收斂速度、較低的學(xué)習(xí)效率,并且在計(jì)算過(guò)程中較難計(jì)算出局部極小值等問(wèn)題[11?14],提出一種基于高維粒子群算法的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法,結(jié)合二者優(yōu)點(diǎn)使其更好地應(yīng)用于實(shí)際中。
1 基于高維PSO算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化
1.1 高維PSO算法簡(jiǎn)介
粒子群算法是一種集群行為的計(jì)算方法,在不局限于二維空間,考慮高維時(shí),即是高維PSO算法。設(shè)搜索空間為[D]維,粒子集群是由[M]個(gè)粒子組成,其中,第[i]個(gè)粒子的空間位置表示為[Xi=xi1,xi2,…,xiD,i=][1,2,…,M,]其飛行速度應(yīng)表示為[Vi=][vi1,vi2,…,viD。]將空間位置和飛行速度數(shù)值代入優(yōu)化目標(biāo)函數(shù)中,從而計(jì)算出用于衡量[x]優(yōu)劣的適應(yīng)值。假設(shè)粒子[i]搜索到的最優(yōu)位置為[Pi=pi1,pi2,…,piD,]整個(gè)粒子群搜索到的最優(yōu)位置記為[PK=pK1,pK2,…,pKD。]此時(shí),對(duì)于每一代粒子,其第[d]維[1≤d≤D]的速度和位置根據(jù)式(1),式(2)迭代:
[vktt+1=ut?vitt+c1r1pid-xidt+c2r2pid-xidt] (1)
[xidt+1=xidt+vidt+1] (2)
[ut=umax-umax-umintitmax] (3)
式中:[ut]代表慣性權(quán)值數(shù)值,一般為線性慣性權(quán)值,慣性權(quán)值的作用是提高粒子群算法的全局、局部?jī)?yōu)化能力;[t]代表現(xiàn)在的迭代次數(shù);[itmax]代表迭代的最大次數(shù);[c1]和[c2]代表學(xué)習(xí)因子;[r1,r2]代表在[0,1] 范圍內(nèi)變化的兩個(gè)隨機(jī)數(shù)值。
粒子位置的更新如圖1所示。
1.2 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上一般由輸入層、隱含層、輸出層三層構(gòu)成,屬于多層前饋神經(jīng)網(wǎng)絡(luò),包括輸入信號(hào)前向傳遞和誤差反向傳播兩個(gè)過(guò)程。BP神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用在各種預(yù)測(cè)模型中。網(wǎng)絡(luò)結(jié)構(gòu)一般只需單個(gè)隱含層就能以任意精度逼近任意有理函數(shù)。訓(xùn)練樣本的輸入、輸出向量的維數(shù)分別決定了網(wǎng)絡(luò)的輸入、輸出層神經(jīng)節(jié)點(diǎn)個(gè)數(shù),典型的只有單個(gè)隱含層、單個(gè)輸出的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
在圖2中,[xi=x1,x2,…,xn]代表一組BP神經(jīng)網(wǎng)絡(luò)的輸入向量;[y]代表一組BP神經(jīng)網(wǎng)絡(luò)的目標(biāo)輸出值;[wij]代表輸入層和隱含層兩層級(jí)之間的連接權(quán)值;[wj1]代表隱含層和輸出層兩層級(jí)之間的連接權(quán)值。[aj,b]分別為隱含層和輸出層的節(jié)點(diǎn)閾值。若設(shè)隱含層節(jié)點(diǎn)個(gè)數(shù)為[m,]則[j=1,2,…,m=1,]在輸入信號(hào)前向傳遞過(guò)程中,[xi]從輸入層逐層傳輸?shù)诫[含層和輸出層,由傳輸過(guò)程中各層連接權(quán)值矢量、閾值矢量和相應(yīng)的激勵(lì)函數(shù)計(jì)算,得出輸出層的預(yù)測(cè)輸出值[Y,]若預(yù)測(cè)值[y]與目標(biāo)值[Y]之間有誤差,則誤差部分轉(zhuǎn)入反向逐層傳遞,沿誤差減小的方向調(diào)整網(wǎng)絡(luò)各層連接的權(quán)值、閾值。反復(fù)執(zhí)行以上過(guò)程,使得BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)值不斷逼近實(shí)際輸出值。
1.3 PSO算法的優(yōu)化
在實(shí)驗(yàn)過(guò)程中,種群的中間粒子更容易得到全局最優(yōu)位置而不是PSO算法中的所有粒子。因此,本文基于PSO算法并采用慣性因子[σ,]慣性因子更容易追蹤種群中最優(yōu)粒子的位置并確保速度連續(xù)變化,即粒子下一時(shí)段的運(yùn)行速度是在上一時(shí)段\行速度的基礎(chǔ)上迭代產(chǎn)生的,提高了PSO算法的性能,該優(yōu)化算法稱為帶慣性項(xiàng)的粒子群算法。采用慣性因子[σ]后,新的粒子速度公式為:
[Vidt+1=σVidt+c1r1Pid-Xidt+c2r2Pgd-Xidt] (4)
優(yōu)化后的PSO算法更容易找到最優(yōu)位置。在最優(yōu)位置找尋過(guò)程中,如果粒子探索的程度是在新的方向則被稱為探測(cè),而仍然在原始軌跡搜索則稱為開(kāi)發(fā)。探測(cè)和開(kāi)發(fā)是找尋最優(yōu)位置的必經(jīng)過(guò)程,調(diào)整粒子探測(cè)和開(kāi)發(fā)程度可以更好地找尋最優(yōu)位置并達(dá)到優(yōu)化效果。所以,常將隨機(jī)變化的加速常數(shù)[c1]和[c2]應(yīng)用到帶慣性項(xiàng)的粒子群算法,代表粒子向個(gè)體極值和全局極值推進(jìn)過(guò)程中的隨機(jī)加速權(quán)值,從而動(dòng)態(tài)改變探測(cè)和開(kāi)發(fā)所占的比例,使其盡快找到全局最優(yōu)位置,該優(yōu)化算法稱為引入慣性項(xiàng)和隨機(jī)加速常數(shù)的粒子群算法。其中,加速常數(shù)[c1]和[c2]定義為:
[c1=random(a)+tTmax] (5)
[c2=random(b)-tTmax] (6)
式中:[random(a)]和[random(b)]代表系統(tǒng)隨機(jī)生成的數(shù);[t,Tmax]代表當(dāng)前進(jìn)化代數(shù)和最大進(jìn)化代數(shù)。
1.4 BP網(wǎng)絡(luò)權(quán)值優(yōu)化方法
由BP網(wǎng)絡(luò)的三層結(jié)構(gòu)可知,用[ujht]代表輸入層和隱含層的網(wǎng)絡(luò)權(quán)值,[wkj(t)]代表隱含層和輸出層的網(wǎng)絡(luò)權(quán)值,[θk]代表輸出節(jié)點(diǎn)閾值,[θj]代表隱含層節(jié)點(diǎn)閾值。具體更新公式如下:
[wkjt+1=wkjt+αδkHj] (7)
[ujht+1=ujht+αkσjIh] (8)
[θKt+1=θKt+βδk] (9)
[θjt+1=θjt+βσj] (10)
式中:[Hj]代表隱含層節(jié)點(diǎn)[j]的輸出信號(hào);[Ih]代表輸入層節(jié)點(diǎn)[h]的輸入信號(hào);[δk]代表輸出層節(jié)點(diǎn)[k]的誤差;[σj]代表隱含層節(jié)點(diǎn)[j]的誤差;[α, β]代表學(xué)習(xí)參數(shù),參數(shù)取值范圍為0.1~0.9。
1.5 高維粒子群BP的算法實(shí)現(xiàn)
高維粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)需要確定網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),根據(jù)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)確定粒子搜索空間的維數(shù),即粒子長(zhǎng)度,以誤差均方值作為基準(zhǔn)調(diào)節(jié)BP網(wǎng)絡(luò)中的權(quán)值和閾值,以粒子群優(yōu)化的適應(yīng)度函數(shù)作為BP網(wǎng)絡(luò)誤差的反傳函數(shù),據(jù)此建立誤差均方值與粒子群優(yōu)化的適應(yīng)度函數(shù)的對(duì)等關(guān)系,目標(biāo)函數(shù)的表達(dá)式如下:
[fi=1Nk=1Nyk-ymk2] (11)
式中:[N]代表總訓(xùn)練樣本數(shù);[fi]代表目標(biāo)函數(shù)的誤差平方和;[y(k)]代表目標(biāo)函數(shù)的目標(biāo)輸出值;[ym(k)]代表目標(biāo)函數(shù)的實(shí)際輸出值。
改進(jìn)粒子群算法尋優(yōu)的具體步驟如下:
(1) 初始化粒子群參數(shù)。初始化粒子群規(guī)模、最大迭代次數(shù)[Tmax、]學(xué)習(xí)因子[c1]和[c2、]慣性權(quán)重[wmax]和[wmin]在特定位置與速度范圍內(nèi)隨機(jī)初始化位置向量和速度向量。
(2) 初始化BP神經(jīng)網(wǎng)絡(luò)。由實(shí)際情況確定BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),并建立下一步運(yùn)算的網(wǎng)絡(luò)模型,進(jìn)一步明確粒子維度。
(3) 輸入網(wǎng)絡(luò)訓(xùn)練樣本。通過(guò)步驟(1),步驟(2)初始化的位置向量輸入網(wǎng)絡(luò)訓(xùn)練樣本,確定網(wǎng)絡(luò)的權(quán)值和閾值,計(jì)算出期望輸出的誤差均方值和實(shí)際輸出的誤差均方值,由二者的誤差均方值可以得到粒子群的適應(yīng)度函數(shù)。在粒子群適應(yīng)度函數(shù)的基礎(chǔ)上結(jié)合位置和慣性因子可以計(jì)算粒子新的運(yùn)動(dòng)位置和運(yùn)動(dòng)速度。
(4) 迭代運(yùn)算。確定每個(gè)粒子的個(gè)體極值和全局極值:粒子[i]的適應(yīng)度值[fi]與個(gè)體最優(yōu)值[Pbest]比較,如果小于[Pbest]則取代它作為當(dāng)前的個(gè)體最優(yōu);適應(yīng)度值[fi]與全局極值[gbest]比較, 如果小于[gbest]則取代它作為當(dāng)前的全局最優(yōu)。當(dāng)停止迭代時(shí),會(huì)得到粒子在全局的最優(yōu)位置,此時(shí)需要把該數(shù)值作為BP網(wǎng)絡(luò)的最后權(quán)重值,映射為BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值。
(5) 將樣本數(shù)據(jù)源中訓(xùn)練樣本輸入到已確定的網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,用測(cè)試樣本做預(yù)測(cè)。
2 高維粒子群BP算法實(shí)例仿真
高維粒子群BP算法仿真實(shí)驗(yàn)的實(shí)驗(yàn)數(shù)據(jù)采集自沈陽(yáng)市和平區(qū)易發(fā)生交通擁堵的某一路段,采集方式是在測(cè)試車輛上安裝激光測(cè)距儀和 GPS設(shè)備,采樣時(shí)間設(shè)置為2 s,采樣時(shí)間段為早、中、晚高峰期三小時(shí)的時(shí)間區(qū)間,并多次測(cè)量采集數(shù)據(jù),選擇每組中發(fā)生事件的實(shí)驗(yàn)數(shù)據(jù)為6 rain,參照上述標(biāo)準(zhǔn)共采集150組樣本數(shù)據(jù),把樣本數(shù)據(jù)歸一化。將100組訓(xùn)練數(shù)據(jù)、50組測(cè)試數(shù)據(jù)輸入到Matlab進(jìn)行運(yùn)算,電腦內(nèi)存為8 GB,利用本文的高維粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化算法訓(xùn)練,最后將測(cè)試樣本分類判別,檢驗(yàn)最后的計(jì)算性能。部分原始樣本數(shù)據(jù)見(jiàn)表1。
設(shè)置高維粒子群算法的參數(shù),其中,種群數(shù)量設(shè)置為[m=30,]維數(shù)設(shè)置為[D=12×13+13×4+4=212,]加速因子設(shè)置為[c1=c2=1.50,]慣性因子設(shè)置為[ω=0.720,]速度最大值[Vmax=1,]速度最小值[Vmin=-1,]位置最大值為5,位置最小值為?5,最大迭代次數(shù)[N=100。]當(dāng)計(jì)算循環(huán)過(guò)程達(dá)到終止迭代次數(shù)時(shí)則終止計(jì)算。
通常采用交通事件的檢測(cè)率(DR)、平均檢測(cè)時(shí)間(MTTD)、誤判率(FAR)評(píng)價(jià)交通事件自動(dòng)檢測(cè)的算法效率。通過(guò)采用本文優(yōu)化的計(jì)算方法對(duì)采集到的數(shù)據(jù)進(jìn)行分類訓(xùn)練等一系列計(jì)算分析,并將最終分析結(jié)果和經(jīng)典事件檢測(cè)算法、BP神經(jīng)網(wǎng)絡(luò)算法比較。結(jié)果表明,經(jīng)過(guò)優(yōu)化后的高維粒子群BP神經(jīng)網(wǎng)絡(luò)的檢測(cè)率、算法性能均優(yōu)于經(jīng)典算法和BP神經(jīng)網(wǎng)絡(luò)算法,其中97,50個(gè)測(cè)試樣本中僅有2個(gè)測(cè)試樣本與應(yīng)該達(dá)到的數(shù)值不一致,其他樣本都滿足測(cè)試要求,并且平均優(yōu)化測(cè)試時(shí)間是傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)檢測(cè)時(shí)間的一半,結(jié)果對(duì)比見(jiàn)表2。
3 結(jié) 語(yǔ)
本文基于高S粒子群算法的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化方法,改進(jìn)了傳統(tǒng)運(yùn)算方法的檢測(cè)時(shí)間長(zhǎng)、收斂速度慢的缺點(diǎn),且容易實(shí)現(xiàn),是一種新興的群智能優(yōu)化算法,優(yōu)化全面,適用范圍廣泛,具有較高的精度和較好的擬合性能。
參考文獻(xiàn)
[1] 姚爾果,閆秋粉,南振岐,等.基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型研究[J].佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,31(1):107?109.
[2] 謝錚桂,鐘少丹,韋玉科.改進(jìn)的粒子群算法及收斂性分析[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(1):46?49.
[3] 閏紀(jì)如.粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)在交通流預(yù)測(cè)中的應(yīng)用[D].杭州:浙江工業(yè)大學(xué),2013.
[4] 劉洪波,王秀坤,孟軍.神經(jīng)網(wǎng)絡(luò)基于粒子群優(yōu)化的學(xué)習(xí)算法研究[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(4):638?640.
[5] 胡衛(wèi)東,曹文貴.基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)在邊坡穩(wěn)定性評(píng)價(jià)中的應(yīng)用[J].湖南理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2014,27(2):71?77.
[6] 劉坤,譚營(yíng),何新貴.基于粒子群優(yōu)化的過(guò)程神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,47(2):238?244.
[7] 徐以山,曾碧,尹秀文,等.基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(35):233?235.
[8] 張德慧,張德育,劉清云,等.基于粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化技術(shù)[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(5):1322?1328.
[9] 肖俊生,任諱龍,李文濤.基于粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)漏鋼預(yù)報(bào)的研究[J].計(jì)算機(jī)測(cè)量與控制,2015,23(4):1302?1305.
[10] 沈?qū)W利,張紅巖,張紀(jì)鎖.改進(jìn)粒子群算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010(2):57?61.
[11] 江麗,王愛(ài)平.基于粒子群與BP混合算法的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法[J].計(jì)算機(jī)應(yīng)用,2012,32(z2):13?15.
[12] 徐大明,周超,孫傳恒,等.基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的水產(chǎn)養(yǎng)殖水溫及pH預(yù)測(cè)模型[J].漁業(yè)現(xiàn)代化,2016,43(1):24?30.
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:北大期刊
榮譽(yù):百種重點(diǎn)期刊