公務員期刊網(wǎng) 精選范文 卷積神經(jīng)網(wǎng)絡的意義范文

卷積神經(jīng)網(wǎng)絡的意義精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡的意義主題范文,僅供參考,歡迎閱讀并收藏。

卷積神經(jīng)網(wǎng)絡的意義

第1篇:卷積神經(jīng)網(wǎng)絡的意義范文

關鍵詞:卷積神經(jīng)網(wǎng)絡;深度學習;年齡分類

0引言

人臉作為人類個體鮮明顯著的生物特征之一,包含著豐富的個人信息。隨著計算機視覺和機器學習技術的發(fā)展,相關的人臉識別等技術已成為這些項目任務的熱點課題,并在法醫(yī)、電子化客戶關系管理、安防、生物識別和娛樂影音等諸多領域中得到廣泛應用。人臉除了可進行身份認證和識別外,還可以提取出性別、種族和年齡等信息,特別是可以將年齡及分布特征用于人機交互和商業(yè)智能等應用中,因此年齡估計研究具有重要的科學意義和實用價值。

相對于人臉識別,人臉所能表征的年齡信息要受到很多因素的影響,例如不同個體的基因差異、生活習慣、環(huán)境、抗壓能力、健康情況和種族差別等有很大的關系。同時,相同個體因發(fā)型、化妝和表情的不同也會影響年齡的估計。因此,如果要基于傳統(tǒng)的分類算法(如支持向量機)并利用人臉圖像信息來進行年齡分類將很難得到理想的結果。針對這些問題,目前的研究還相對不足,如果能有效解決上述問題,對大部分潛在的應用領域也都將帶來深刻的影響。

1相關工作

年齡分類的主要流程是先根據(jù)人臉圖像獲取特征,再通過機器學習方法構建模型,通過把年齡分為多個年齡區(qū)段,即每個年齡段對應一個類別(比如未成年或成年人等)。因此可以把年齡分類看成是一個二分類或者多分類的分類問題來進行求解。1994年,Kwon和Lobo則從人臉圖像中獲取年齡分類,把人分為3種不同的類別,也就是兒童、青年人和老年人,強調重要特征點的選擇。2002年Lanitis等人提出了能自動對年齡實現(xiàn)估計的年齡量化方法。而且,王先梅等的綜述中也整體梳理了相關年齡估計技術的研究發(fā)展。王紹宇等人還基于SMV采用生物特征對人進行分類,分為小孩和成人。此外在2016年,董遠等人更將遷移學習和卷積神經(jīng)網(wǎng)絡用于人的年齡和性別分類。

第2篇:卷積神經(jīng)網(wǎng)絡的意義范文

關鍵詞:筆跡;性別識別;深度學習

0引言

近年來,由于在數(shù)據(jù)挖掘、取證分析、文檔授權和判斷真實歷史筆跡等方面的應用,筆跡分析變得愈加重要。人類學習寫字從模仿他人開始并逐漸形成自己的筆跡風格,在這個過程中,性別的影響是不容忽視的。Beech和Mackintosh研究了激素和筆跡風格的關系,由此發(fā)現(xiàn)產(chǎn)前激素對女性的筆跡風格有很大的影響。Mergl和Tigges的研究表明男性筆跡和女性筆跡存在明顯差異,女性的筆跡更加易讀,更加整潔和有組織性,而男性筆跡更加潦草,會出現(xiàn)更多的錯誤。

目前筆跡性別識別的方法有:基于梯度的識別算法GLBP,提取圖像的HOG特征并結合根據(jù)LBP算子提取的梯度特征來支持處理識別,使用SVM進行分類,獲得了75.45%的準確率:基于局部特征的識別算法,設計塊特征計算密度并提取多種LBP特征和HOG特征加入研發(fā)識別,使用SVM進行分類,獲得了70%的準確率;基于GMM的識別算法,將局部特征和全局特征融合進行分類,獲得了67.57%的準確率。雖然現(xiàn)有的方法可以在一定程度上識別作者性別,但是由于這些特征表達的筆跡信息不準確,識別率一直并不理想。而深度神網(wǎng)絡能夠自主學習特征,并且在人臉識別、物體的檢測識別系統(tǒng)方面取得了堪稱優(yōu)良的效果,因此本文研發(fā)設計了一個深度適中的網(wǎng)絡對筆跡進行性別分類。

第3篇:卷積神經(jīng)網(wǎng)絡的意義范文

【關鍵詞】人臉識別;人臉檢測;方法

Abstract:Face recognition system is one of the most popular current scientific research,In this paper,the process and prospects of face recognition system to do a simple review.The application of the system to do a simple analysis and the main method of face recognition for the corresponding category.For the future development of face recognition systems were mainly discussed.

Key words:Face Recognition;Face Detection;Methods

一、引言

隨著科學技術的突飛猛進,計算機及網(wǎng)絡的高速發(fā)展,信息的安全性、隱蔽性越來越重要,如何有效、方便的進行身份驗證和識別,已經(jīng)成為人們日益關心的問題。生物認證的方法,即利用人類自身的特征來進行身份認證,具有傳統(tǒng)方法沒有的有點,也解決了身份認證技術所面臨的一大難題。其具有方便、強化安全、不會丟失、遺忘或轉讓等優(yōu)點?,F(xiàn)在人體生物識別技術的研究主要針對人臉、指紋、虹膜、手型、聲音等物理或行為特征來進行。本文主要對人臉識別技術的介紹。

人臉識別是指給定一個靜止或動態(tài)圖像,利用已有的人臉數(shù)據(jù)庫來確認圖像中的一個或多個人。如同人的指紋一樣,人臉也具有唯一性,也可用來鑒別一個人的身份?,F(xiàn)在己有實用的計算機自動指紋識別系統(tǒng)面世,并在安檢等部門得到應用,但還沒有通用成熟的人臉自動識別系統(tǒng)出現(xiàn)。人臉圖像的自動識別系統(tǒng)較之指紋識別系統(tǒng)、DNA鑒定等更具方便性,因為它取樣方便,可以不接觸目標就進行識別,從而開發(fā)研究的實際意義更大。另一方面,人臉表情的多樣性;以及外在的成像過程中的光照,圖像尺寸,旋轉,姿勢變化等給識別帶來很大難度。因此在各種干擾條件下實現(xiàn)人臉圖像的識別,也就更具有挑戰(zhàn)性。

二、人臉識別系統(tǒng)流程

(1)人臉圖像的獲?。簣D像的獲取都是通過攝像頭攝取,但攝取的圖像可以是真人,也可以是人臉的圖片或者為了相對簡單,可以不考慮通過攝像頭來攝取頭像,而是直接給定要識別的圖像。

(2)人臉的檢測:人臉檢測的任務是判斷靜態(tài)圖像中是否存在人臉。若存在人臉,給出其在圖像中的坐標位置、人臉區(qū)域大小等信息。而人臉跟蹤則需要進一步輸出所檢測到的人臉位置、大小等狀態(tài)隨時間的連續(xù)變化情況。

圖1 人臉識別框架

(3)特征提?。和ㄟ^人臉特征點的檢測與標定可以確定人臉圖像中顯著特征點的位置(如眼睛、眉毛、鼻子、嘴巴等器官),同時還可以得到這些器官及其面部輪廓的形狀信息的描述。根據(jù)人臉特征點檢測與標定的結果,通過某些運算得到人臉特征的描述(這些特征包括:全局特征和局部特征,顯式特征和統(tǒng)計特征等)。

(4)基于人臉圖像比對的身份識別:即人臉識別問題。通過將輸入人臉圖像與人臉數(shù)據(jù)庫中的所有已知原型人臉圖像計算相似度并對其排序來給出輸入人臉的身份信息。

(5)基于人臉圖像比對的身份驗證:即人臉確認問題。系統(tǒng)在輸入人臉圖像的同時輸入一個用戶宣稱的該人臉的身份信息,系統(tǒng)要對該輸入人臉圖像的身份與宣稱的身份是否相符作出判斷。

三、人臉識別技術現(xiàn)狀及發(fā)展前景

自1995年以來,國外一些公司看準了人臉識別系統(tǒng)廣闊的應用前景,動用了大量人力和物力,自己獨立研發(fā)或與高校合作,開發(fā)了多個實用的人臉識別系統(tǒng),例如:加拿大Imagis公司的ID-2000面部識別軟件,美國Identix公司1的FaceIt人臉識別系統(tǒng),德國Human Scan公司的BioID身份識別系統(tǒng),德國Cognitec Systems公司的Face VACS人臉識別系統(tǒng)等;美國A4vision公司的3D人臉識別產(chǎn)品;等等。

國內相關領域較為出名的公司有上海銀晨智能識別科技有限公司(IS'vision),他們與中科院計算所聯(lián)合開發(fā)了會議代表身份認證/識別系統(tǒng)、嫌疑人面像比對系統(tǒng)、面像識別考勤/門禁系統(tǒng)、出人口黑名單監(jiān)控系統(tǒng)等多種自動人臉識別應用系統(tǒng)。2008年,北京奧運會開幕式正式使用了中國自主知識產(chǎn)權的人臉識別比對系統(tǒng);2010年4月1日起,國際民航組織(ICAO)已確定其118個成員國家和地區(qū)必須使用機讀護照,人臉識別技術是首推識別模式,該規(guī)定已經(jīng)成為國際標準;2011年,F(xiàn)ace book初次引入人臉識別技術,登陸人員可以免信息驗證而激活頁面;2012年3月6日,江蘇省公安廳與南京理工大學日前簽約共建“社會公共安全重點實驗室”,開展“人臉識別”技術相關領域項目攻關。

到目前為止,雖然有關自動人臉識別的研究已經(jīng)取得了一些可喜的成果,但在實際應用環(huán)境下仍面臨著許多難以解決的問題:人臉的非剛體,表情、姿態(tài)、發(fā)型和化妝的多樣性以及環(huán)境光照的復雜性都給正確的人臉識別帶來了很大的困難。即使在大量來自模式識別、計算機視覺、生理學、心理學、神經(jīng)認知科學等領域的研究人員對自動人臉識別艱苦工作40余年之后,其中不少問題至今仍然困繞著研究人員,始終找不到完善的解決辦法。

在人臉識別市場,特別是在中國的市場,正經(jīng)歷著迅速的發(fā)展,而且發(fā)展的腳步也將越來越快。主要有三大原因:

1.是科技界和社會各個領域都認識到人臉識別技術的重要性,國家政策對人臉識別技術研究給予了很大支持,使得我國人臉識別技術取得了很大進展。國際上,美國國家標準技術局(NIST)舉辦的Face Recognition Vendor Test 2006(FRVT2006)通過大規(guī)模的人臉數(shù)據(jù)測試表明,當今世界上人臉識別方法的識別精度比2002年的FRVT2002至少提高了一個數(shù)量級(10倍)。其中一些方法的識別精度已經(jīng)超過人類的平均水平。而對于高清晰、高質量人臉圖像識別,機器的識別精度幾乎達到100%。

2.各種應用需求不斷出現(xiàn)。人臉識別市場的快速發(fā)展一方面歸功于生物識別需求的多元化,另一方面則是由于人臉識別技術的進步。從需求上來說,除了傳統(tǒng)的公司考勤、門禁等應用外,視頻監(jiān)控環(huán)境下的身份識別正成為一種迫切的需求,即在一個較復雜的場景中,在較遠的距離上識別出特定人的身份,這顯然是指紋識別的方法不能滿足的,而人臉識別卻是一個極佳的選擇。

3.人口基數(shù)因素。人臉識別系統(tǒng)的市場大小,很大程度上是和人口的數(shù)量大小相關的。而我國有13億人口,這從本質上說明了我國是世界上規(guī)模最大的生物識別市場。

四、常用的人臉識別方法

人臉識別技術和方法可分為兩大類:基于幾何特征的方法和基于模板匹配的方法?;趲缀翁卣鞣椒ǖ乃枷胧鞘紫葯z測出嘴巴,鼻子,眼睛,眉毛等臉部主要部分的位置和大小,然后利用這些部件的總體幾何分布關系以及相互之間的參數(shù)比例來識別人臉?;谀0宓姆椒ㄊ抢媚0搴驼麄€人臉圖像的像素值之間的自相關性進行識別,這種方法也叫做基于表象的方法。

本文主要分析了常用的人臉識別方法為:幾何特征的方法、模型的方法、神經(jīng)網(wǎng)絡的方法和多分類器集成方法。

1.幾何特征的方法

最早的人臉識別方法就是Bledsoe提出的基于幾何特征的方法,這種方法以面部特征點之間的距離和比率作為特征通過最近鄰方法來識別人臉。該方法建立的人臉識別系統(tǒng)是一個半自動系統(tǒng),其面部特征點必須由人手工定位,也正是由于人工的參與,該系統(tǒng)對光照變化和姿態(tài)變化不敏感。

Kanade首先計算眼角、鼻孔、嘴巴、下巴等面部特征之間的距離和它們之間的角度以及其它幾何關系然后通過這些幾何關系進行人臉的識別工作在一個20人的數(shù)據(jù)庫上識別率為45%一75%。

Brunelli和Poggio通過計算鼻子的寬度和長度、嘴巴位置和下巴形狀等進行識別,在一個47人的人臉庫上的識別率為90%.然而,簡單模板匹配方法在同一人臉庫上的識別率為100%。

基于幾何特征的方法比較直觀,識別速度快,內存要求較少,提取的特征在一定程度上對光照變化不太敏感。但是,當人臉具有一定的表情或者姿態(tài)變化時,特征提取不精確,而且由于忽略了整個圖像的很多細節(jié)信息且識別率較低,所以近年來已經(jīng)很少有新的發(fā)展。

2.模型的方法

隱馬爾可夫模型,是一種常用的模型,原HMM的方法首先被用于聲音識別等身份識別上,之后被Nefian和Hayrs引人到人臉識別領域。它是用于描述信號統(tǒng)計特性的一組統(tǒng)計模型。

在人臉識別過程中,首先抽取人臉特征,得到后觀察向量,構建HMM人臉模型,然后用EM算法訓練利用該模型就可以算出每個待識別人臉觀察向量的概率,從而完成識別,HMM方法的魯棒性較好,對表情、姿態(tài)變化不太敏感,識別率高。

3.神經(jīng)網(wǎng)絡的方法

神經(jīng)網(wǎng)絡在人臉識別領域有很長的應用歷史,1994年就出現(xiàn)了神經(jīng)網(wǎng)絡用于人臉處理的綜述性文章。

動態(tài)鏈接結構(DLA)是用于人臉識別系統(tǒng)中最有影響的神經(jīng)網(wǎng)絡方法。DLA試圖解決傳統(tǒng)的神經(jīng)網(wǎng)絡中一些概念性問題,其中最突出的是網(wǎng)絡中語法關系的表達。DLA利用突觸的可塑性將神經(jīng)元集合劃分成若干個結構,同時保留了神經(jīng)網(wǎng)絡的優(yōu)點。

自組織映射神經(jīng)網(wǎng)絡(SOM)與卷積神經(jīng)網(wǎng)絡相結合的混合神經(jīng)網(wǎng)絡方法進行人臉識別。SOM實現(xiàn)對圖像的采樣向量降維,且對圖像樣本的小幅度變形不敏感。卷積網(wǎng)絡用來實現(xiàn)相鄰像素間的相關性知識,在一定程度對圖象的平移、旋轉、尺度和局部變形也都不敏感。

神經(jīng)網(wǎng)絡方法較其他人臉識別方法有著特有的優(yōu)勢,通過對神經(jīng)網(wǎng)絡的訓練可以獲得其他方法難以實現(xiàn)的關于人臉圖像的規(guī)則和特征的隱性表示,避免了復雜的特征抽取工作,并有利于硬件的實現(xiàn)。缺點主要在于其方法的可解釋性較弱,且要求多張人臉圖像作為訓練集,所以只適合于小型人臉庫。

4.多分類器集成方法

人臉的表象會因為光照方向、姿態(tài)、表情變化而產(chǎn)生較大的變化,每種特定的識別器只對其中一部分變化比較敏感,因此,將可以整合互補信息的多個分類器集成能夠提高整個系統(tǒng)的分類準確率。

Gutta等人提出將集成的RBF與決策樹結合起來進行人臉識別。結合了全局的模板匹配和離散特征的優(yōu)點,在一個350人的人臉庫上測試,取得了較好的實驗結果。

五、總結及展望

隨著圖像處理、模式識別、人工智能以及生物心理學的研究進展,人臉識別技術也將會獲得更大的發(fā)展。面對這種高新技術,人臉識別技術有著不可代替的優(yōu)點。近幾年對三維模型的人臉識別研究以成為一個熱點。從二維模型到三維模型是一個階躍性的發(fā)展,中間必須克服三維模型的開銷大,所占空間大等因素。因此如何增強這類系統(tǒng)的保密性將是人臉識別系統(tǒng)要考慮的問題,它將是這種識別系統(tǒng)投入使用后人們最關心的問題,同時也是人臉識別領域需要研究的新課題。我們期待在不久的將來,人們將告別鑰匙,迎來人臉開門的新時代。

參考文獻

[1]李武軍,王崇駿,張煒,等.人臉識別研究綜述[J].模擬識別與人工智能,2006,19(1):58-65.

[2]李子青.人臉識別技術應用及市場分析[J].中國安防,2007,8:42-46.

[3]柴秀娟,山世光,卿來云,等.基于3D人臉重建的光照、姿態(tài)不變人臉識別[J] .軟件學報,2006,17(3):525-534.

第4篇:卷積神經(jīng)網(wǎng)絡的意義范文

關鍵詞:圖像分割 閾值分割 遺傳算法 小波變換

中圖分類號:TP391 文獻標識碼:A 文章編號:1002-2422(2010)02-0001-03

圖像分割是按照一定的規(guī)則把圖像劃分成若干個互不相交、具有一定性質的區(qū)域,把人們關注的部分從圖像中提取出來,進一步加以研究分析和處理。圖像分割的結果是圖像特征提取和識別等圖像理解的基礎,對圖像分割的研究一直是數(shù)字圖像處理技術研究中的熱點和焦點。圖像分割使得其后的圖像分析,識別等高級處理階段所要處理的數(shù)據(jù)量大大減少,同時又保留有關圖像結構特征的信息。圖像分割在不同的領域也有其它名稱,如目標輪廓技術、目標檢測技術、閾值化技術、目標跟蹤技術等,這些技術本身或其核心實際上也就是圖像分割技術。

1 經(jīng)典圖像分割方法

1,1閾值分割方法

閾值分割是常見的直接對圖像進行分割的算法,根據(jù)圖像像素的灰度值的不同而定。對應單一目標圖像,只需選取一個閾值,即可將圖像分為目標和背景兩大類,這個稱為單閾值分割:如果目標圖像復雜,選取多個閾值,才能將圖像中的目標區(qū)域和背景被分割成多個,這個稱為多閾值分割,此時還需要區(qū)分檢測結果中的圖像目標,對各個圖像目標區(qū)域進行唯一的標識進行區(qū)分。閾值分割的顯著優(yōu)點,成本低廉,實現(xiàn)簡單。當目標和背景區(qū)域的像素灰度值或其它特征存在明顯差異的情況下,該算法能非常有效地實現(xiàn)對圖像的分割。閩值分割方法的關鍵是如何取得一個合適的閾值,近年來的方法有:用最大相關性原則選擇閾值的方法、基于圖像拓撲穩(wěn)定狀態(tài)的方法、灰度共生矩陣方法、最大熵法和谷值分析法等,更多的情況下,閾值的選擇會綜合運用兩種或兩種以上的方法,這也是圖像分割發(fā)展的一個趨勢。

1,2基于邊緣的圖像分割方法

邊緣總是以強度突變的形式出現(xiàn),可以定義為圖像局部特性的不連續(xù)性,如灰度的突變、紋理結構的突變等。邊緣常常意味著一個區(qū)域的終結和另一個區(qū)域的開始。對于邊緣的檢測常常借助空間微分算子進行,通過將其模板與圖像卷積完成。兩個具有不同灰度值的相鄰區(qū)域之間總存在灰度邊緣,而這正是灰度值不連續(xù)的結果,這種不連續(xù)可以利用求一階和二階導數(shù)檢測到。當今的邊緣檢測方法中,主要有一次微分、二次微分和模板操作等。這些邊緣檢測器對邊緣灰度值過渡比較尖銳且噪聲較小等不太復雜的圖像可以取得較好的效果。但對于邊緣復雜的圖像效果不太理想,如邊緣模糊、邊緣丟失、邊緣不連續(xù)等。噪聲的存在使基于導數(shù)的邊緣檢測方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測算子通常都是先對圖像進行適當?shù)钠交种圃肼?,然后求導?shù),或者對圖像進行局部擬合,再用擬合光滑函數(shù)的導數(shù)來代替直接的數(shù)值導數(shù),如Mart算子、canny算子等。在未來的研究中,用于提取初始邊緣點的自適應閾值選取、用于圖像層次分割的更大區(qū)域的選取以及如何確認重要邊緣以去除假邊緣將變的非常重要。

1,3基于函數(shù)優(yōu)化的分割方法

此方法是圖像分割中另一大類常用的方法。其基本思路是給出一個目標函數(shù),通過該目標函數(shù)的極大化或極小化來分割圖像。GA.Hewer等人提出了一個具有廣泛意義的目標函數(shù)。統(tǒng)計學分割方法、結合區(qū)域與邊緣信息的方法、基于貝葉斯公式的分割方法等是目前幾種活躍的函數(shù)優(yōu)化方法。

統(tǒng)計學分割方法是把圖像中各個像素點的灰度值看作是具有一定概率分布的隨機變量,且觀察到的實際物體是作了某種變換并加入噪聲的結果。統(tǒng)計學分割方法包括基于馬爾科夫隨機場方法、標號法、混合分布法等。

區(qū)域增長法和分裂合并法是基于區(qū)域信息的圖像分割的主要方法。區(qū)域增長有兩種方式,一種是先將圖像分割成很多的一致性較強的小區(qū)域,再按一定的規(guī)則將小區(qū)域融合成大區(qū)域,達到分割圖像的目的。另一種實現(xiàn)是給定圖像中要分割目標的一個種子區(qū)域,再在種子區(qū)域基礎上將周圍的像素點以一定的規(guī)則加入其中,最終達到目標與背景分離的目的;分裂合并法對圖像的分割是按區(qū)域生長法沿相反方向進行的,無需設置種子點。其基本思想是給定相似測度和同質測度。從整幅圖像開始,如果區(qū)域不滿足同質測度,則分裂成任意大小的不重疊子區(qū)域,如果兩個鄰域的子區(qū)域滿足相似測度則合并。

2 結合特定工具的圖像分割算法

雖然圖像分割目前尚無通用的理論,但是近年來大量學者致力于將新概念、新方法應用于圖像分割,結合特定理論的圖像分割方法在圖像分割方面取得了較好的應用效果。如小波分析和小波變換、神經(jīng)網(wǎng)絡、遺傳算法等數(shù)學工具的利用,有效地改善了分割效果。

2,1基于遺傳算法的圖像分割

遺傳算法是模擬自然界生物進化過程與機制求解問題的一類自組織與自適應的人工智能技術。對此,科學家們進行了大量的研究工作,并成功地運用于各種類型的優(yōu)化問題,在分割復雜的圖像時,人們往往采用多參量進行信息融合,在多參量參與的最優(yōu)值求取過程中,優(yōu)化計算是最重要的,把自然進化的特征應用到計算機算法中,將能解決很多問題。遺傳算法的出現(xiàn)為解決這類問題提供了新而有效的方法,不僅可以得到全局最優(yōu)解,而且大量縮短了計算時間。王月蘭等人提出的基于信息融合技術的彩色圖像分割方法,該方法應用剝殼技術將問題的復雜度降低,然后將信息融合技術應用到彩色圖像分割中,為彩色分割在不同領域中的應用提供了一種新的思路與解決辦法。

2,2基于人工神經(jīng)網(wǎng)絡技術的圖像分割

基于神經(jīng)網(wǎng)絡的分割方法的基本思想是先通過訓練多層感知器來得到線性決策函數(shù),然后用決策函數(shù)對像素進行分類來達到分割的目的。近年來,隨著神經(jīng)學的研究和進展,第三代脈沖耦合神經(jīng)網(wǎng)絡(PCNN)作為一種新型人工神經(jīng)網(wǎng)絡模型,其獨特處理方式為圖像分割提供了新的思路。脈沖耦合神經(jīng)網(wǎng)絡具有捕獲特性,會產(chǎn)生點火脈沖傳播,對輸入圖像具有時空整合作用,相鄰的具有相似輸入的神經(jīng)元傾向于同時點火。因此對于灰度圖象,PCNN具有天然的分割能力,與輸入圖像中不同目標區(qū)域對應的神經(jīng)元在不同的時刻點火,從而將不同區(qū)域分割開來。如果目標區(qū)域灰度分布有重疊,由于PCNN的時空整合作用,如果灰度分布符合某種規(guī)律,PCNN也能克服灰度分布重疊所帶來的不利影響,從而實現(xiàn)較完美的分割。這是其一個突出的優(yōu)點,而這恰恰是其他的分割方法所欠缺的,其在未來的圖像分割中將起主導作用。

2,3基于小波分析和變換的圖像分割

近年來,小波理論得到了迅速的發(fā)展,而且由于其具有良好的時頻局部化特性和多分辨率分析能力,在圖像處理等領域得到了廣泛的應用。小波變換是一種多尺度多通道分析工具,比較適合對圖像進行多尺度的邊緣檢測。從圖像處理角度看,小波變換具有“變焦”特性,在低頻段可用高頻率分辨率和低時間分辨率,在高頻段可用低頻率分辨率和高時間分辨率,小波變換在實現(xiàn)上有快速算法具有多分辨率,也叫多尺度的特點,可以由粗及精地逐步觀察信號等優(yōu)點。近年來多進制小波也開始用于邊緣檢測。另外,把小波變換和其它方法結合起來的圖像分割技術也是現(xiàn)在研究的熱點。

3 圖像分割的應用現(xiàn)狀

在圖像處理中,圖像分割是一種重要的技術,是圖像分析的基礎。隨著圖像分割技術研究的深入,其應用日趨廣泛,幾乎出現(xiàn)在有關圖像處理的所有領域,并涉及各種類型的圖像。凡屬需要對圖像目標進行提取、測量的工作都離不開圖像分割。通常,圖像分割是為了進一步對圖像進行分析、識別、壓縮、編碼等,圖像分割的準確性將直接影響后繼的工作,因此,分割的方法和精確程度是至關重要的。目前,圖像分割在圖像工程中占據(jù)非常重要的位置,圖像分割已在交通、醫(yī)學、遙感、通信、軍事和工業(yè)自動化等諸多領域得到廣泛應用。表1是應用領域表。

第5篇:卷積神經(jīng)網(wǎng)絡的意義范文

關鍵詞:人工智能;引擎;大數(shù)據(jù);CPU;FPGA

DOI:10.3969/j.jssn.1005-5517-2017-2.006

1 2016年人工智能迎來了春天

2016年人工智能(A1)進入了第三個。2016年3月9-15日,谷歌AlphaGo(阿爾法狗)以4:1的成績擊敗世界圍棋冠軍李世石職業(yè)九段,意義非常重大。因為過去機器主要做感知,現(xiàn)在出現(xiàn)了認知,這是人工智能的關鍵所在。

8個月后,2016年12月29日~2017年1月4日,AlphaGo的升級版――谷歌Master(大師)在30秒快棋網(wǎng)測中,以60勝0負1和的成績,橫掃柯潔、古力、聶衛(wèi)平、樸廷桓、井山裕太等數(shù)十位中日韓世界冠軍與頂級高手。從此以后,也許人類以后就沒有和Master進行圍棋比賽的機會了!除了圍棋,人工智能下一步將在國際象棋、中國象棋等棋類方面發(fā)展。

撲克牌方面,專家水平的人工智能首次戰(zhàn)勝一對一無限注德州撲克人類職業(yè)玩家,而且DeepStack讓機器擁有知覺。

人工智能還能玩游戲。其意義很重大,平時環(huán)境中很難得到一些數(shù)據(jù),因為游戲相當于虛擬社會,例如“星際爭霸2”是復雜的虛擬社會,如果人工智能在這個虛擬社會中能戰(zhàn)勝人,這將是非常了不起的,未來可涉及到高級決策,在軍事上很有用處。2016年11月5日,谷歌DeepMind宣布與暴雪合作開發(fā)人工智能,挑戰(zhàn)實時戰(zhàn)略視頻游戲“星際爭霸2”。這件事情的意義非常重大。下一步可以用于軍事上的高級戰(zhàn)略決策。

無人駕駛方面,2016年11月15日,“在第三屆世界互聯(lián)網(wǎng)大會”期間,18輛百度“云驍”亮相烏鎮(zhèn)子夜路,在3.16公里的開放城區(qū)道路上自主行駛。2016年特斯拉Autopilot 2.0問世,該軟件只需要八千美元,就可讓軟件駕駛汽車。所有特斯拉新車將安裝“具有完全自動駕駛功能”的該硬件系統(tǒng),并可通過OTA(空中下載技術)進行軟件升級;自動駕駛功能從L2(二級,半無人駕駛)直接跳躍到L4/L5();2017年底之前,特斯拉車將以完全自動駕駛模式從洛杉磯開往紐約。Uber提出在城區(qū)大范圍無人駕駛出租車試運行,Uber 2016年9月14日在美國匹茲堡市推出城區(qū)大范圍無人駕駛出租車免費載客服務并試運行,先期已測試近2年,說明無人駕駛真正落地了。

為何無人駕駛很重要?因為人工智能是無人駕駛的核心。除了百度、特斯拉、Uber,谷歌Waymo也在做自動駕駛測試。此外,沃爾沃、福特、寶馬、百度、英特爾等全球約20多家企業(yè)公開宣布,4年以后的2021年將會是無人駕駛/自動駕駛元年,部分5AE L4車將會實現(xiàn)量產(chǎn)。

計算機視覺

針對ImageNet ILSVRC測試比賽的1 000種物體識別,Deep CNN超過了人類的識別能力。人是5.1%(如圖1),2016年2月23日谷歌人工識別的評測是3.08%。ImageNetILSVRC中有1000種物體,例如猴子、馬、飛機、坦克等約1500萬張照片、包含2.2萬類種不同物體。深度學習一般能做到52層,極深度學習(very deep lea rning)現(xiàn)在已經(jīng)做到1000層。

在ILSVRC 2016國際評測中,包括視覺物體檢測、視覺物體定位、視頻物體檢測、場景分類、場景解析等性能均有提高。值得一提的是,在此次大會上,中國團隊大放異彩,幾乎包攬了各個項目的冠軍(圖2)。

人工智能語義分割

基于全卷積神經(jīng)網(wǎng)絡FCN的路面/場景像素級語義分割取得重要進展。為此,我們可以分割大部分道路。

人工智能唇語專家

看電視時把聲音關掉,靠嘴唇說話的變化來識別談話內容,這種能力機器識別率已經(jīng)超過人類。例如2016年12月,英國牛津大學與谷歌DeepMind等研發(fā)的自動唇讀系統(tǒng)LipNet,對GRID語料庫實現(xiàn)了95.2%的準確率;對BBC電視節(jié)目嘉賓進行唇語解讀,準確率為46.8%,遠遠超過專業(yè)的人類唇語專家(僅為12.4%)。

人工智能人臉識別

人臉識別可以達到產(chǎn)品級別,例如支付寶的刷臉成功率超過了人類。如圖3,人的水平為97.40,百度為99.77。因此可以進行產(chǎn)品體驗。2017年1月6日,百度人工智能機器人“小度”利用其超強人類識別能力,以3:2險勝人類最強大腦代表王峰。

語音識別

目前的社交新媒體和互動平臺中,Al虛擬助手和Al聊天機器人正在崛起。一天,美國GIT(佐治亞理工大學)的一個課堂上來了一位助教,教師講完課后說:“大家有問題就問助教吧”。這位助教原來是個會眨眼睛的機器人!這時學生們才知道每天網(wǎng)上給他們答疑解惑的是人工智能,此前學生們也感到很吃驚,這位助教非常敬業(yè),晚上還在發(fā)Email。

人工智能語音合成

指從文本聲音到真實聲音,可以自動翻譯成英文。2016年9月19日,谷歌DeepMind推出WaveNet,實現(xiàn)文本到美式英語或中國普通話的真實感語音合成。

人工智能速記員

包括語音識別和NLP(自然語言處理)。2016年10月17日,微軟的語音識別系統(tǒng)實現(xiàn)了5.9%的詞錯率(WER),媲美人類專業(yè)速記員,且錯誤率更低;中國科大訊飛也有語音輸入法。

人工智能翻譯

中國人往往從小學到讀博士都在學英語?,F(xiàn)在,谷歌、微軟和百度等公司在做人工智能翻譯。以谷歌為例,2016年9月27日,谷歌的神經(jīng)機器翻譯系統(tǒng)(GNMT)實現(xiàn)了多語種翻譯,較之傳統(tǒng)方法,英譯西班牙翻譯錯誤率下降了87%,英譯漢下降了58%,漢譯英下降了60%,已接近人工翻譯的水平。也許今后學外語沒那么重要了,人們可戴著耳機,耳機能直接翻譯成各語言。

人工智能對抗訓練

Goodfellow(2014)提出的生成式對抗網(wǎng)絡(GAN),為半監(jiān)督學習/舉一反三式的學習發(fā)展提供新思路,2016年發(fā)展迅速。目前是監(jiān)督式學習,需要依靠大數(shù)據(jù),因此大數(shù)據(jù)需要非常完備。而人是舉一反三式的學習。例如人沒有見過飛機,看過幾張照片就可以把世界上所有飛機都認出;目前的大數(shù)據(jù)驅動的深度學習方式,是把世界上所有飛機照片都看過才行?,F(xiàn)在進行舉一反三的半監(jiān)督或無監(jiān)督式學習,思路是采用對抗的方法,一個網(wǎng)絡造假,另一網(wǎng)絡鑒別照片是真是假,通過對抗式的學習來共同進步(如圖4)。

人工智能引擎

芯片三巨頭

英特爾、英偉達和高通全部轉到了人工智能上。為此英偉達的股票漲了幾倍。英特爾也在大搞人工智能。高通為了進入人工智能領域,收購了恩智浦,恩智浦此前收購了飛思卡爾。

現(xiàn)在出現(xiàn)了基于超級GPU/TPU集群的離線訓練,采用超級GPU/TPu集群服務器,例如英偉達的深度學習芯片Tesla P100及DGX-1深度學習計算機,谷歌數(shù)據(jù)中心的TPU。

終端應用采用GPU/FPGA-based DPU,例如英特爾Apollo Lake A3900的“智能互聯(lián)駕駛艙平臺”,高通驍龍的820A處理器。

通用人工智能與認知智能

1997年,lBM的超級電腦程序“深藍”擊敗國際象棋大師加里?卡斯帕羅夫;2011年2月,IBM的自動問答系統(tǒng)在美國最受歡迎的智力競答電視節(jié)目“危險邊緣”中戰(zhàn)勝了人類冠軍:IBM的沃森醫(yī)生在某些細分疾病領域已能提供頂級醫(yī)生的醫(yī)療診斷水平,例如胃癌診斷。

可見,1.AlphaGo和Master等已可橫掃人類圍棋職業(yè)頂尖高手,下一步,將能下中國象棋等所有棋類,此外還可以打牌、炒股等,即什么都可以干,是強人工智能。2.人工智能已成為無人駕駛汽車商業(yè)落地的關鍵。3.視覺物體識別、人臉識別、唇語識別等在許多國際公開評測中,達到或超過人類的水平;4.速記等語音識別已可媲美人類;5.包括神經(jīng)機器翻譯在內的自然語言處理,性能也大幅度提升;6.生成式對抗網(wǎng)絡得到極大關注。

目前,發(fā)展通用人工智能成為普遍共識。

2 社會極大關注

未來,可能很多工作就會消失了。

人工智能引起社會的極大關注和熱議,人工智能發(fā)展很快;而且人工智能的學習速度快,很勤奮,未來可以達到人類所有的智能,這時到達了從強人工智能到超越人工智能的奇點;人工智能有超越人類智能的可能;理論上,人工智能還可以永生。

這也引起了很多人們的擔憂。奇點到來、強人工智能、超人工智能、意識永生、人類滅絕等聳人聽聞的觀點出現(xiàn),引起包括霍金、蓋茨和馬斯克等在內的世界名人對人工智能發(fā)展的擔憂。在每年的世界人工智能大會上,專門有一個論壇探討人工智能與法律、倫理及人類未來的會場。

現(xiàn)在,人工智能工業(yè)的OpenAI成立。

2016年全社會對人工智能的極大關注,可能是2016年AI的最大進展!

在半監(jiān)督/無監(jiān)督學習、通用人工智能方面,人工智能具有舉一反三,并有常識、經(jīng)驗、記憶、知識學習、推理、規(guī)劃、決策,甚至還有動機。這最后一點有點恐怖,人是有意識和動機的,機器做事也有動機,太可怕了。

智能學習進步很快,AIpha Go八個月后就可以戰(zhàn)勝所有圍棋手,因為它能每天24小時學習、不吃不喝地學習,比人強多了。

因此,在經(jīng)歷了60年“三起兩落”的發(fā)展后,以深度學習為主要標志的人工智能正迎來第3次偉大復興,這次引起社會尤其是產(chǎn)業(yè)界高強度的關注。因為上世紀60年代和80年代,人工智能沒有達到這樣的水平。

硅谷精神教父、預言家凱文?凱利說,未來人工智能會成為一種如同電力一樣的基礎服務。斯坦福大學推出了“人工智能百年研究”首份報告――《2030年的人工智能與生活》。

3人工智能上升為國家發(fā)展戰(zhàn)略

有人認為第四次工業(yè)革命即將由人工智能與機器人等引爆。英國政府認為,人工智能有望像19世紀的蒸汽機革命那樣徹底改變我們的生活,甚至人工智能給人類社會帶來的變革與影響,有可能遠遠超過蒸汽機、電力和互聯(lián)網(wǎng)帶來的前三次工業(yè)革命。

智能制造、無人駕駛汽車、消費類智能機器人、虛擬助手、聊天機器人、智能金融、智能醫(yī)療、智能新聞寫作、智能律師、智慧城市等可能被人工智能代替。人工智能將無處不在,可望替換人類的部分腦力勞動,一些職業(yè)會被取代或補充,一些新的行業(yè)又會誕生,例如18世紀出現(xiàn)了紡織工人,之后汽車代替了馬車等。因此,我們將經(jīng)歷從“互聯(lián)網(wǎng)+”到“人工智能+”。

中國“互聯(lián)網(wǎng)+”與“中國制造2025”國家發(fā)展戰(zhàn)略的實施,對人工智能的巨大需求在迅速增長。未來2-5年,人工智能應用與產(chǎn)業(yè)發(fā)展將迎來爆發(fā)期。

中國政府在《“互聯(lián)網(wǎng)+”人工智能3年行動實施方案》提出:計劃在2018年形成千億級人工智能產(chǎn)業(yè)應用規(guī)模。201 7年1月10日,科技部部長萬鋼稱,將編制完成人工智能專項規(guī)劃,加快推進人工智能等重大項目的立項論證。

美國政府在2016年10月13日出臺了《為人工智能的未來做好準備》的報告,提出了23條建議措施。同一天,美國政府又出臺了《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》,提出了7大重點戰(zhàn)略方向。美國參議院于2016年11月30日召開了關于人工智能的首次國會聽證會,主題是“人工智能的黎明”,認為中國是對美國人工智能全球領導地位的一個真正威脅。在2016年12月20日美國白宮了《人工智能、自動化與經(jīng)濟》報告,考察了人工智能驅動的自動化將會給經(jīng)濟帶來的影響,并提出了國家的三大應對策略方向??梢姡瑠W巴馬把人工智能看作其政治遺產(chǎn)之一(注:另一個是Cyber空間)。

英國政府2016年12月了《人工智能:未來決策的機遇與影響》的報告,關注人工智能對社會創(chuàng)新與生產(chǎn)力的促進作用,論述如何利用英國人工智能的獨特優(yōu)勢,增強英國國力。

日本政府2017年開始,要讓人工智能與機器人推動第四次工業(yè)革命。

4 我國對策

應以深度卷積神經(jīng)網(wǎng)絡為核心,全面開展計算機視覺、語音識別和自然語言等人工智能產(chǎn)品的開發(fā)與大規(guī)模產(chǎn)業(yè)化應用。這需要大數(shù)據(jù)、計算平臺/計算引擎、人工智能算法、應用場景等飛速發(fā)展,另外還需要資源、資金、人才。在方法上,選定垂直細分領域最重要。

面向若干細分垂直領域,建立大數(shù)據(jù)中心。實現(xiàn)大數(shù)據(jù)采集、清洗、標簽、存儲、管理與交易,建立大數(shù)據(jù)源公共基礎設施與垂直領域知識庫。專有大數(shù)據(jù)是人工智能產(chǎn)業(yè)制勝的關鍵和法寶。中國企業(yè)必須開始特別關注大數(shù)據(jù)的采集與利用。其重要性如同原油―樣,跨國企業(yè)視之為戰(zhàn)略資源!

強力開展人工智能芯片與硬件平臺的研發(fā)。包括基于FPGA的深度學習芯片;類腦芯片與憶阻器件;建立國家級人工智能超算中心。

第6篇:卷積神經(jīng)網(wǎng)絡的意義范文

關鍵詞:發(fā)展趨勢;研究應用;人工智能

DOI:10.16640/ki.37-1222/t.2017.07.119

0 簡介

人工智能((Artificial Intelligence)),它是一門新的技術科學,主要用于模擬、延伸以及擴展人類的智能的方法、理論、技術以及應用系統(tǒng)。人工智能主要就是對人類的思維、意識的信息過程的合理化的模擬。人工智能它并不是人的智能,但是,它卻能像人那樣的思考,而且也可能會超過人類的智能??偟恼f來,人工智能研究的一個主要目標是使機器能夠勝任一些復雜工作。

1 人工智能的運用現(xiàn)狀

目前,在很多方面人工智能有著運用,其中一個主要表現(xiàn)就是全球人工智能公司數(shù)量在急劇的增加,專家系統(tǒng)在目前來看是在人工智能各領域中最為活躍,且最為有成效的一個領域。它是一類基于知識的系統(tǒng),并可以解決那些一般僅有專家才能夠解決的復雜問題。我們這樣定義專家系統(tǒng):專家系統(tǒng)是一種具有特定領域內大量知識與經(jīng)驗的程序系統(tǒng),它是基于程序系統(tǒng)依靠人工智能技術,來模擬人類專家求解復雜問題的過程,大多情況下,專家系統(tǒng)的水平甚至可以超過人類專家。專家系統(tǒng)的基本結構圖如下圖所示:

2 人工智能的影響

人工智能對經(jīng)濟的影響:人工智能的的確確會影響到社會、生活、文化的方方面面,特別是對于實體經(jīng)濟將來會有巨大的影響。以后,每個行業(yè)幾乎都會產(chǎn)生顛覆性的變化。在人工智能的研究上,中國并不落后,將來的中國一定可以從中獲得非常大的收益。一成功的專家系統(tǒng)可以為它的用戶帶來很明顯的經(jīng)濟效益。用比較經(jīng)濟的辦法執(zhí)行任務而不需要具有經(jīng)驗的專家,從而極大地減少開支。專家系統(tǒng)深入各行各業(yè),帶來巨大的宏觀效益,促進了IT網(wǎng)絡工業(yè)的發(fā)展。

人工智能對文化的影響:在人工智能原理的基礎上,人們通常情況下會應用人工智能的概念來描述他們的日常狀態(tài)和求解問題的過程。人工智能可以擴大人們知識交流的概念集合,描述我們所見所聞的方法以及描述我們信念的新方法;人工智能技術為人類的文化生活提供了巨大的便利。如圖像處理技術必將會對圖形藝術和社會教育部門等產(chǎn)生深遠影響。比如現(xiàn)有的智力游戲機將會發(fā)展成具有更高智能的一種文化娛樂手段。隨著技術的進步,這種影響會越來越明顯地表現(xiàn)出來。當然,還有一些影響可能是我們目前難以預測的。但可以肯定,人工智能將對人類的物質文明以及精神文明產(chǎn)生更大的影響。

人工智能對社會的的影響:一方面,AI為人類文化生活提供了一種新的模式。現(xiàn)有的游戲將逐步發(fā)展為更高智能的交互式文化娛樂手段,今天,游戲中的人工智能應用已經(jīng)深入到各大游戲制造商的開發(fā)中。另一方面,人工智能能夠代替人類進行各種腦力勞動,所以,從某種意義上來講,這將會使一部分人失去發(fā)展的機遇,甚至可能失業(yè)。由于人工智能在科技以及工程中的應用,一部分人可能會失去介入信息處理活動的機會,甚至不得已而改變自己的工作方式;人工智能還可能會威脅到人類的精神。一般人們覺得人類與機器的區(qū)別就是人類具有感知精神,但如果有一天,這些相信只有人才具有感知精神的人也開始相信機器能夠思維和創(chuàng)作,那他們就會感到失望,甚至于感到威脅。他們會擔心:有朝一日,智能機器的人工智能可能會超過人類的自然智能,從而使人類淪為智能機器的奴隸。

3 人工智能的發(fā)展趨勢

有機構預測,2017年人工智能投資將同比增長300%以上,在技術上將會更迅猛發(fā)展,工控自動化商城的智能語音、智能圖像、自然語言以及深度學習等技術越來越成熟,就像空氣和水一樣將會逐步地滲透到我們的日常生活。行業(yè)專家關于2017年人工智能的發(fā)展方向主要有以下幾點:(1)機器學習目前正在被應用在更復雜的任務以及更多領域中,且被更多的人作為挖掘數(shù)據(jù)的方式。無監(jiān)督的學習會取得更多進展,但也存在很大的挑戰(zhàn),故在這一方面離人類的能力還是差得很遠的。計算機在理解和生成自然語言方面,預計最先會在聊天機器人和其他對話系統(tǒng)上落地。 (2)深度學習、其他的機器學習、人工智能技術的混用,是成熟技術的典型標志。將深度學習應用到醫(yī)療領域中(醫(yī)療圖像、臨床數(shù)據(jù)、基因組數(shù)據(jù)等),各種類型數(shù)據(jù)上的研究以及成果將會大大的增加。 (3)聊天機器人和自動駕駛汽車可能會取得較大的進展,預計更多人類基準將會被打破,特別是那些基于視覺以及適合卷積神經(jīng)網(wǎng)絡的挑戰(zhàn)。而非視覺特征創(chuàng)建和時間感知方法將會變得更加頻繁、更加富有成果。

4 結論

人工智能是人類長久以來的夢想,同時也是一門富有挑戰(zhàn)性的學科。盡管人工智能帶來很多問題,但當人類堅持把人工智能只用于造福人類,人工智能推動人類社會文明進步將毋庸置疑。就像所有的學科一樣,人工智能也會經(jīng)歷各種挫折,但只要我們有信心、 有毅力,人工智能終將成為現(xiàn)實,融入到我們生活的方方面面,為我們的生活帶來更大的改變。

參考文獻:

[1]朱祝武.人工智能發(fā)展綜述[J].中國西部科技,2011,10(17):8-10.

[2]肖斌.對人工智能發(fā)展新方向的思考[J].信息技術,2009,37(12):166-169.

第7篇:卷積神經(jīng)網(wǎng)絡的意義范文

【關鍵詞】圖像復原;正則化;GMRES;約束最小二乘

1 國內外研究現(xiàn)狀

用迭代方法處理各種反問題已有悠久的歷史。但是研究表明,使用迭代方法求解反問題,有時會出現(xiàn)所謂的“半收斂”現(xiàn)象,即在迭代的早期階段,近似解可穩(wěn)定地得到改進,展現(xiàn)出“自正則化”效應,但當?shù)螖?shù)超過某個閾值后便會趨向于發(fā)散。因而,使用迭代法求解的關鍵是要尋找一個恰當?shù)慕K止原則,在迭代次數(shù)和原始數(shù)據(jù)誤差水平之間找到平衡值。研究表明,迭代指數(shù),即迭代步數(shù)正好起到正則化參數(shù)的作用,而這個終止準則對應著正則化參數(shù)的某種選擇方法。并且使用迭代方法求解還有很多優(yōu)點,因此,在正則化問題求解中通常選用迭代的方法,常用的迭代方法有:Landweber迭代法、VanCittert迭代方法、最速下降方法和迭代Tikhonov正則化的求解方法,以及正則化方法的快速數(shù)值實現(xiàn)。

2 基于解空間分解的GMRES 算法及圖像復原應用

2.1 正則化模型與圖像復原

設F和U分別表示度量空間,度量為ργ和ρμ,算子A:F到U映F到U,則該問題變?yōu)榫€性反問題(當A為線性算子時),或非線性反問題(當A為非線性算子時)?!安贿m定性”(病態(tài)性)是所有反問題所具有的一個共同的特性。一般情況下,不適定性是反問題本身的固有特征:如果問題的先驗信息是未知的,那么就無法得到理想的結果。因此,我們應該盡可能多的收集先驗信息,最大限度的復原原問題。通常,人們將求解反問題(不適定問題)的理論和方法稱為正則化方法。對于圖像處理問題,由于涉及到大規(guī)模的方程組求解,法方程的維數(shù)太大,此時再應用代數(shù)方法求解就會遇到一些難以實現(xiàn)的技術問題,而選用正則化方法不但可以克服上述缺點,還具有某些優(yōu)點,當問題從無窮維度變到有限維度時,迭代求解不會影響系數(shù)結構,而且能夠起到節(jié)約運算空間的效果。這些優(yōu)勢在大規(guī)模計算中非常有利。

對于圖像恢復的病態(tài)性問題,利用正則化思想進行圖像復原時,需要利用先驗信息,構造某種約束條件,使用數(shù)理統(tǒng)計方法,將圖像復原這一不適定問題轉變成適定問題,進而使得近似解滿足適定性的三項約束,這也是正則化方法的優(yōu)勢所在。

2.2 解空間分解的廣義極小殘量算法

在對線性方程組Ax=b,A緊算子,進行求解時,為了盡可能減少存儲空間和計算開銷,Krylov子空間迭代法是求行之有效的方法。當系數(shù)矩陣A對稱正定,共扼梯度法(CG)或預共轆梯度法(PCG)可快速準確求解該方程組的近似解;當A對稱但不正定時,極小殘量法或預極小殘量法則能有效求解方程組。對于一般的非對稱矩陣,常采用廣義極小殘量法、共扼梯度法來求解。GMRES算法利用Arnold過程產(chǎn)生Krylov子空間Kj的正交基,Arnold過程中每次迭代運算,都要調用所有前面的迭代所產(chǎn)生的正交基來生成下一個正交基。

2.3 光學圖像復原結果

對于方程Ax=b,利用基于解空間分解的加速GMRES 算法迭代求解。計算步驟如下:

Step1.置初始值x0=0,并令δ=10-8;

Step2.用解空間分解的加速GMRES 算法迭代求解式Ax=b,在第j步的值為xj;

Step3.若■≤σ,終止迭代;否則置 j=j+1,繼續(xù)進行Step2。在迭代運算中,正則化參數(shù)αj=15,■隨著迭代的進行自動更新。

圖像復原實驗中處理的是256*256尺寸的0-255灰度級的liftingbody圖像。用改進信噪比來衡量算法的復原性能。從復原之后的對比效果看,共扼梯度法(CG)并不能有效的抑制模糊退化,復原結果仍然比較模糊,圖像邊緣有振鈴波紋出現(xiàn)。解空間分解的加速GMRES算法復原結果的邊界紋路比較清晰,很好的顯示出原圖像邊緣細節(jié)部分,與此同時,振鈴波紋因為加窗處理得到有效抑制,整體視覺效果很好。

3 線性代數(shù)方法與圖像復原應用

在涉及到復雜矩陣和向量的離散圖像復原模型中,可以從線性代數(shù)方法中得到一種效率較高的求解方法,常用的方法是約束最小二乘法。對約束最小二乘法進行改進,根據(jù)先驗信息,把正則化思想和約束最小二乘法等有機結合在一起,并將其運用到離散圖像復原中,得到的約束最小二乘的空域迭代法可以出色的抑制噪聲,而且在噪聲很強是也可以得到很好地復原結果。

將正則化思想與約束最小二乘法相結合,繼而復原退化圖像。通過對噪聲能量的限制來使用正則化理論,運用空域迭代時很好的抑制了噪聲放大現(xiàn)象,同時克服了病態(tài)性,而且計算速度得到了提升。實驗數(shù)據(jù)表明,本方法更適合復原污染程度較大的圖像,但不適合復原模糊程度較大的圖像。

4 總結與展望

圖像復原近年來受到了越來越廣泛的關注,正則化方法理論的發(fā)展也越來越得到完善,許多學者從模型上、理論上、應用上分別展開了對于正則化的圖像復原的深入研究,本文的研究雖然力求有較強的實用性,但是由于受到多方面的限制,在理論和工程應用等方面仍存在很多的待豐富和改進之處,需要在以后的工作中繼續(xù)深入研究。

首先,要加深對觀測圖像的先驗信息的挖掘,因為如果能夠有效利用先驗信息,就能極大的改善估計精度以及問題的病態(tài)性。要充分的利用各種先驗知識,構造更加精確地目標泛函,設計出更加優(yōu)良的算法,同時要充分分析現(xiàn)有正則化參數(shù)的選擇方法,結合各個方法的優(yōu)缺點,構造出更加高效的正則化算子;要注意噪聲擴大與圖像復原的平衡,充分利用成像時的分段平滑性質,去除圖像邊緣模糊和振鈴現(xiàn)象。其次,要注重正則化圖像復原方法與其他圖像復原方法的有機結合。現(xiàn)階段,神經(jīng)網(wǎng)絡、小波分析和遺傳算法等新式的算法在圖像復原方面取得了極大的進展,如果能夠將這些理論結合在一起,形成優(yōu)勢互補,一定能得到性能更好的圖像處理算法。

【參考文獻】

[1]肖庭延,于慎根,王延飛.反問題的數(shù)值解法[M].北京:科學出版社,2003.

[2]鄒謀炎.反卷積和信號復原[M].北京:國防工業(yè)出版社,2001.

第8篇:卷積神經(jīng)網(wǎng)絡的意義范文

關鍵詞:指紋識別;中值濾波;加權自適應;最小二乘支持向量機

0 引言

現(xiàn)代社會中,身份鑒定技術具有非常重要的應用價值。人類指紋的不變性和唯一性使得指紋識別技術成為目前應用最廣泛、最可靠的身份驗證技術。指紋識別[1]算法理論的研究,以及計算機硬件的高集成、低成本,使得利用指紋來完成身份鑒別和識別任務的系統(tǒng)得到大規(guī)模應用。典型的指紋識別系統(tǒng)主要由指紋圖像采集、指紋圖像預處理、指紋圖像特征提取、指紋圖像比對這4個部分組成。

圖像去噪增強是指紋圖像預處理中的一項重要環(huán)節(jié)。中值濾波[2]是一種去除噪聲的非線性處理方法。中值濾波方法不但具有低通特性可以去除噪聲,而且又可以保護圖像邊緣,保留細節(jié)部分。中值濾波方法在去噪復原中得到了較好的效果。

目前指紋分類方法大致有:語義分析法、幾何法、隨機法、神經(jīng)網(wǎng)絡方法和支持向量機(SVM)方法。支持向量機是在統(tǒng)計學習理論基礎上發(fā)展出來的一種非常有效地新機器學習方法,它很好的解決了小樣本、非線性、過學習、高維數(shù)、局部極小點等問題,并具有很強的泛化能力。學者不斷對支持向量機進行深入研究,涌現(xiàn)出許多有效地改進算法,如C-SVM算法、v-SVM算法、加權支持向量機(WSVM)、最小二乘SVM算法(LS-SVM)等[3]。

本文研究了指紋圖像的中值濾波方法,以及基于最小二乘支持向量機的圖像分類識別。首先對指紋圖像進行濾波預處理,然后提取特征,最后,采用最小二乘支持向量機進行訓練分類識別。

1 指紋識別系統(tǒng)原理

指紋識別系統(tǒng)可分為兩大模塊:一是系統(tǒng)學習模塊;二是指紋識別模塊。學習模塊包括采集指紋圖像,對指紋圖像進行預處理,把提取出的特征編碼存入樣本數(shù)據(jù)庫。識別模塊包括將待識別的指紋圖像進行預處理,在提取特征后與數(shù)據(jù)庫中的指紋模版進行匹配,判斷是否匹配,得出結論。

2 噪聲

2.1 指紋圖像中噪聲的來源

指紋圖像中的噪聲主要來源于指紋圖像的獲?。〝?shù)字化過程)和傳輸過程。圖像傳感的工作情況受各種因素的影響,如圖像獲取中的環(huán)境條件和傳感元器件自身的質量。例如,使用CCD指紋傳感器獲取圖像,光照程度和傳感器溫度是生成圖像中產(chǎn)生大量噪聲的主要因素。圖像在傳輸過程中主要由于所用的傳輸信道的干擾受到的噪聲。比如通過無線電網(wǎng)絡傳輸?shù)膱D像可能會因為光或其他大氣因素的干擾而被污染[4]。

常見噪聲主要有高斯噪聲,均值噪聲,椒鹽噪聲,指數(shù)噪聲,對數(shù)噪聲等。

2.2 指紋圖像去噪的意義

噪聲在指紋圖像預處理中是一個非常重要的問題,它對指紋圖像的輸入、采集、處理的各個環(huán)節(jié)以及最終的輸出結果都會產(chǎn)生一定的影響。特別是在圖像的輸入、采集過程中,噪聲是個十分關鍵的問題,若輸入伴有較大噪聲,必然影響之后的處理以及最終的處理效果。因此,去噪處理已成為指紋圖像預處理中極其重要的步驟。

3 平滑濾波器

3.1 高斯濾波器

高斯平滑濾波是讓原圖像同高斯函數(shù)進行卷積,從而達到抑制噪聲、平滑圖像的目的。假設原圖像為 ,經(jīng)過高斯平滑濾波后的圖像為 , 和 表示圖像行、列坐標,則

式中: 表示高斯函數(shù)的方差。

3.2 中值濾波

指紋圖像在經(jīng)過高斯平滑處理后,大多數(shù)噪聲被去除了,但仍可能存在少數(shù)孤立的噪聲點,為進一步去除這些噪聲,有必要圖像進行中值濾波處理。中值濾波是基于排序統(tǒng)計理論的一種能有效抑制噪聲的非線性濾波器,它對消除椒鹽噪聲[5]非常有效,所以常被用來保留需要的圖像結構的同時消除椒鹽噪聲。

3.2.1 標準中值濾波

標準中值濾波是一種基于快速排序的非線性濾波算法,不僅能去除或者減少隨機噪聲和脈沖干擾,還能較好地保留圖像邊緣的信息。

算法具體實現(xiàn)步驟[6-7]如下:

1)將模板在圖中遍歷,并將模板中心圖中某個像素位置重合;

2)將模板下各對應像素的灰度值讀取出來;

3)把這些灰度值從小到大排成一列;

4)找出值的中間值作為最終的輸出結果;

5)將中間值賦給對應模板中心位置的像素。

通過以上的實現(xiàn)步驟,我們可以用一下公式來表示中值濾波:

式中: 表示坐標點 處的灰度值, 表示以為

中心濾波窗口中的所有坐標點, 表示進行中值處理,

表示濾波輸出。

標準中值濾波需要進行大量的排序工作,計算量很大,同時去除脈沖噪聲的性能受濾波窗口尺寸的影響較大,窗口越大,去噪效果越好,但圖像變得越模糊,即在抑制圖像噪聲和保護細節(jié)方面存在一定的矛盾。

3.2.2 加權自適應中值濾波算法

為了改進現(xiàn)有中值濾波算法對于高密度噪聲圖像以及紋理細膩圖像的邊緣處理能力欠佳的缺陷,加權自適應中值濾波算法采用了通過擴大窗口來相對地減少沖激噪聲空間密度這一策略。

算法的基本思想是:設 表示中心像素點 在濾波時所對應的掩膜窗口,窗口大小為 ,令 為 中的最小灰度值, 為 中的最大灰度值, 為 中的灰度中值, 為坐標 處的灰度值, 為 允許的最大窗口尺寸, 為閾值。

若滿足 ,則轉向5);

計算窗口內標準中值濾波結果記為SM,若滿足

則轉向4);

增大窗口尺寸 ,若 ,則重復1),否則轉向4);

計算像素點與另外 個像素點灰度值差值的均值

若 ,則轉向5),否則轉向6);

若滿足 ,則輸出 ,否則轉向6);

輸出 。

其中 的計算方法結合了均值思想,把排序得到的中值與窗口中所有像素點的均值加權得到灰度中值,中值的權重為0.6,均值的權重為0.4。

含噪聲圖 標準中值濾波圖 加權自適應中值濾波圖

經(jīng)過比較,可見這兩種處理方法的效果差異,加權自適應中值濾波比標準中值濾波處理的效果好,噪聲去除干凈,且指紋圖像中的細節(jié)保留較好。

4 最小二乘支持向量機

Suykens等提出的最小二乘支持向量機(LS-SVM),基本思想是對估計函數(shù)進行分段估計,然后再組合到一起以減小算法復雜度;構建新的核函數(shù),使之能降低優(yōu)化問題的維數(shù)。最小二乘支持向量機創(chuàng)造性地把標準SVM的線性不等式約束轉化成等式約束,從而使得SVM的訓練等價于一組線性方程組的求解。

LS-SVM類似于傳統(tǒng)SVM,也是通過構造最優(yōu)分類超平面實現(xiàn)分類的。但LS-SVM不同于SVM的是:SVM將每一個樣本點 都添加了一個誤差量,我們假設給定 個樣本數(shù)據(jù)為

其中 為輸入向量, 為輸出變量,且

為待估計的未知函數(shù)。作輸入空間到

維特征空間的內映射: , 是非線性的,且 的取值無上界,則被估計函數(shù) ,其中 為空間

中的權向量, 為偏置。于是求解優(yōu)化問題就變成一下問題:

若選取核函數(shù)

5 實驗

指紋圖像預處理過程包括:

圖像歸一化處理。將圖像的平均灰度和對比度調整到一個固定的級別上,以消除傳感器本身噪聲或手指壓力不同以及其它原因造成的灰度差異,使圖像具有預定的均值與方差,為后續(xù)處理提供一個較為統(tǒng)一的圖像規(guī)格。

圖像分割。把圖像的前景區(qū)域和背景區(qū)域分割開來,去除背景區(qū)域。這樣一方面減少了后續(xù)處理步驟的數(shù)據(jù)量,另一方面也避免了因為部分圖像區(qū)域不可靠而導致偽特征的產(chǎn)生。

圖像濾波增強。在此分別采用標準中值濾波和加權自適應中值濾波算法,并對最后識別結果做出比較。

圖像二值化[8]。將原始灰度圖像轉化為只有黑白兩種灰度等級的二值圖像,突出了圖像特征,便于進行特征提取。

實驗采用自建的組合指紋庫,40個人,每人2張共80張指紋圖片。每人取1張共40張圖片作為實驗的訓練集,取另外1張共40張圖片作為實驗的測試集。分別把預處理階段采用標準中值濾波算法和加權自適應中值濾波算法處理的指紋圖像,做指紋識別實驗。特征提取時,為使目標圖像具有平移、旋轉和比例不變性,用矩算法提取不變矩特征。采用最小二乘支持向量機對特征向量進行分類,選取樣本點進行訓練。

6 結束語

本文采用平滑濾波與最小二乘支持向量機方法,研究了指紋的圖像識別。建立了一個完整的指紋識別系統(tǒng),分為指紋圖像預處理、特征提取、分類識別3個主要階段,對經(jīng)過預處理的指紋圖像提取圖像特征,通過實驗實現(xiàn)了指紋識別。

從識別結果來看,預處理過程對識別效果影響很大,采用不同的濾波方法,圖像的增強效果不同,最終在指紋識別率上體現(xiàn)出來。采用加權自適應中值濾波算法對圖像進行去噪增強,效果比標準中值濾波好,識別率也高。

參考文獻:

[1]陳陽、譚思云,基于DSP的指紋識別系統(tǒng)設計[J].計算機測量與控制,2005.13(12):1339-1341.

[2]岡薩雷斯,數(shù)字圖像處理MATLAB版[M].北京:電子工業(yè)出版2005.9.

[3]胡學坤,改進支持向量機算法及其在圖像分割中的應用[D].2009.12.

[4]索俊祺,一種新的基于中值濾波的優(yōu)化濾波算法[D].2010.01.

[5]任洪海、紀玉波、張飛俠等,一種去除椒鹽噪聲中值濾波的改進算法[J].電腦開發(fā)與應用,2005(5).

[6]趙高長、張磊、武風波,改進的中值濾波算法在圖像去噪中的應用[J].應用光學,2011.32(4).