前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺(jué)研究的目的主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:雙目視覺(jué);匹配算法;計(jì)算機(jī)視覺(jué);立體匹配;相位一致性
1.計(jì)算機(jī)視覺(jué)系統(tǒng)分析研究
1.1計(jì)算機(jī)視覺(jué)技術(shù)及雙目立體視覺(jué)
計(jì)算機(jī)視覺(jué)是通過(guò)計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對(duì)視覺(jué)信息處理的整個(gè)過(guò)程,是一門(mén)新的學(xué)科。視覺(jué)是人們認(rèn)知事物的重要途徑,視覺(jué)是人們對(duì)視覺(jué)信息獲取、處理和存儲(chǔ)的過(guò)程。隨著計(jì)算機(jī)技術(shù)的發(fā)展,信號(hào)處理技術(shù)的應(yīng)用,人們通過(guò)照相機(jī)來(lái)把實(shí)際的事物拍攝下來(lái)轉(zhuǎn)變?yōu)閿?shù)字信息,并通過(guò)計(jì)算機(jī)信號(hào)處理技術(shù)隊(duì)獲取的視覺(jué)信號(hào)進(jìn)行處理。計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像的處理分為獲取圖像、特征抽象選取、事物識(shí)別及分類(lèi)和對(duì)三維信息的理解。獲取圖像主要是通過(guò)攝像機(jī)和紅外線等技術(shù)對(duì)周?chē)曈X(jué)事物進(jìn)行獲取,并通過(guò)計(jì)算得到和真實(shí)事物相應(yīng)的二維圖像,二維圖像主要是數(shù)字圖像。計(jì)算機(jī)視覺(jué)系統(tǒng)的最基本的功能是數(shù)字圖像的獲取??梢钥闯鲇?jì)算機(jī)視覺(jué)研究最基本內(nèi)容是三維場(chǎng)景距離信息的獲取。在計(jì)算機(jī)被動(dòng)測(cè)量距離方法中,有一種重要的距離感知技術(shù)叫作雙目立體視覺(jué)。雙目立體視覺(jué)技術(shù)是其他計(jì)算機(jī)視覺(jué)技術(shù)無(wú)法取代的一種技術(shù),對(duì)雙目立體視覺(jué)技術(shù)的研究在計(jì)算機(jī)視覺(jué)技術(shù)和工程應(yīng)用方面都是非常重要的。
1.2計(jì)算機(jī)視覺(jué)理論框架
第一個(gè)視覺(jué)系統(tǒng)理論框架的提出是以信息處理為基礎(chǔ),綜合了圖像處理和神經(jīng)生理學(xué)等研究?jī)?nèi)容而建立的。這個(gè)視覺(jué)系統(tǒng)理論框架是計(jì)算機(jī)視覺(jué)系統(tǒng)的基本框架,與計(jì)算機(jī)視覺(jué)技術(shù)有著密切的關(guān)系。視覺(jué)系統(tǒng)的研究是以信息處理為基礎(chǔ)的,從理論層次、算法層次和硬件層次3個(gè)層次進(jìn)行研究。計(jì)算機(jī)理論層次主要是表達(dá)系統(tǒng)各個(gè)部分計(jì)算的目的和方法,對(duì)視覺(jué)系統(tǒng)的輸入和輸出進(jìn)行規(guī)定,輸入作為二維圖像,輸出是以二維圖像為基礎(chǔ)建立起來(lái)的三維物體,視覺(jué)系統(tǒng)的目的就是對(duì)三維物體進(jìn)行分析和識(shí)別,通過(guò)計(jì)算對(duì)二維物置和形狀進(jìn)行重新建立。算法層次對(duì)計(jì)算機(jī)規(guī)定的目標(biāo)進(jìn)行計(jì)算,算法和計(jì)算機(jī)表達(dá)有關(guān),不同的表達(dá)可以通過(guò)不同的算法進(jìn)行實(shí)現(xiàn),在計(jì)算機(jī)理論的層次上,算法和表達(dá)比計(jì)算機(jī)理論的層次要低。硬件層次是通過(guò)硬件來(lái)實(shí)現(xiàn)算法的一種表達(dá)方法。計(jì)算機(jī)理論層次在計(jì)算機(jī)信息處理中時(shí)最高的層次,取決于計(jì)算機(jī)的本質(zhì)是解決計(jì)算機(jī)的自身問(wèn)題,不是取決于計(jì)算問(wèn)題的計(jì)算機(jī)硬件。要更好地對(duì)計(jì)算機(jī)系統(tǒng)和框架進(jìn)行理解最好的方法就是要區(qū)分3個(gè)不同的層次,計(jì)算機(jī)理論的含義和主要解決的問(wèn)題是計(jì)算機(jī)的目的,表達(dá)算法含義和主要解決的問(wèn)題是實(shí)現(xiàn)計(jì)算理論的方法和輸入輸出的表達(dá),硬件的實(shí)現(xiàn)的含義和主要解決的問(wèn)題是如何在物理上對(duì)表達(dá)和算法進(jìn)行實(shí)現(xiàn)。計(jì)算機(jī)視覺(jué)處理的可以分為3個(gè)階段,對(duì)視覺(jué)信息的處理過(guò)程從最初的二維圖像的原始數(shù)據(jù),到三維環(huán)境的表達(dá)。第一階段基元圖的構(gòu)成,基元圖是用來(lái)表示二維圖像中的重要信息,主要是圖像中亮度變化位置及其幾何分布和組織結(jié)構(gòu),圖像中每點(diǎn)的亮度值包括零交叉、斑點(diǎn)、端點(diǎn)和不連續(xù)點(diǎn)、邊緣等。第二階段2.5維圖描述,在以觀測(cè)者為中心的坐標(biāo)中,表示可見(jiàn)表面的方向、深度值和不連續(xù)的輪廓,基元是局部表面朝向離觀測(cè)者的距離深度上的不連續(xù)點(diǎn)表面朝向的不連續(xù)點(diǎn)。第三階段三維模型表示,在以物體為中心的坐標(biāo)系中,有由體積單元和面積單元構(gòu)成的模塊化多層次表示,描述形狀及其空間組織形式,分層次組成若干三維模型,每個(gè)三維模型都是在幾個(gè)軸線空間的基礎(chǔ)上構(gòu)成的,所有體積單元或面積形狀基元都附著在軸線上。視覺(jué)理論框架圖如圖1所示。
2.基于計(jì)算機(jī)的視覺(jué)立體匹配算法研究
視覺(jué)立體匹配算法是基于人類(lèi)視覺(jué)系統(tǒng)的一種計(jì)算機(jī)算法。立體匹配算法作為計(jì)算機(jī)立體視覺(jué)問(wèn)題研究的重點(diǎn),快速地實(shí)現(xiàn)圖像對(duì)應(yīng)點(diǎn)的匹配來(lái)獲得視差圖是當(dāng)今研究的熱點(diǎn)問(wèn)題。立體視覺(jué)匹配算法根據(jù)基元匹配的不同可以分為相位匹配、區(qū)域匹配和特征匹配3種,其中區(qū)域匹配算法可以減少計(jì)算負(fù)擔(dān),區(qū)域匹配算法實(shí)時(shí)性高,應(yīng)用前景廣闊。計(jì)算機(jī)立體視覺(jué)通過(guò)對(duì)人的雙眼進(jìn)行模仿,在雙眼的立體感知中獲得信息,從攝像機(jī)拍攝的圖像中獲取物體的三維深度信息,這就是深度圖的獲取,把深度圖經(jīng)過(guò)處理得到三維空間信息數(shù)據(jù),二維圖像到三維空間實(shí)現(xiàn)轉(zhuǎn)換。深度的獲取在雙目立體成像視覺(jué)系統(tǒng)中分為兩步,首先在雙目立體圖像與圖像之間建立點(diǎn)對(duì)點(diǎn)的對(duì)象關(guān)系,雙目立體視覺(jué)算法研究的重點(diǎn)問(wèn)題是解決對(duì)應(yīng)點(diǎn)之間的匹配問(wèn)題。其次以對(duì)應(yīng)點(diǎn)之間的視差為依據(jù)對(duì)深度值進(jìn)行計(jì)算。雙目成像是獲取同一場(chǎng)景中兩幅不同的圖像,兩個(gè)單目成像模型構(gòu)成一個(gè)雙目成像模型。雙目成像示意圖如圖2所示。系統(tǒng)的基線B是兩個(gè)鏡頭中心的連接線,空間點(diǎn)w(z,y,z)作為世界坐標(biāo)的值由(x1,y1)與(x2,y2)進(jìn)行確定,如果攝像機(jī)的坐標(biāo)位置和空間點(diǎn)w世界坐標(biāo)的位置重合,圖像平面和世界坐標(biāo)軸xY的平面就是平行的。如果兩個(gè)攝像機(jī)在坐標(biāo)系統(tǒng)中的原點(diǎn)不同但是它們的光軸平行,那么雙目成像計(jì)算人們可以看圖3所示,圖3表示的是兩個(gè)攝像頭連線在平臺(tái)xY的示意。
立體視覺(jué)的成像過(guò)程是成像的逆過(guò)程,具有一定的不確定性。大量的數(shù)據(jù)信息在從三維影像向二維圖像進(jìn)行投影的過(guò)程會(huì)出現(xiàn)丟失的現(xiàn)象,所以視覺(jué)系統(tǒng)要通過(guò)自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計(jì)算量方面可以提供有利的幫助。針對(duì)基于區(qū)域匹配快速算法,還可以應(yīng)用基于視差梯度的匹配算法,這種匹配算法應(yīng)用較大的搜索范圍在邊緣的特征點(diǎn)上進(jìn)行搜索,采用視差梯度在非邊緣區(qū)減少搜索范圍。應(yīng)用計(jì)算機(jī)視覺(jué)立體匹配算法可以減少成像匹配時(shí)間,大大提高了工作效率。計(jì)算機(jī)立體匹配算法征點(diǎn)的提取是算法的關(guān)鍵問(wèn)題,今后的研究方向重點(diǎn)是對(duì)有效特征點(diǎn)提取方法的研究。
關(guān)鍵詞: 計(jì)算機(jī)視覺(jué);快速開(kāi)發(fā);框架;模塊化;模塊耦合;底層剝離
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)29-7084-04
在視覺(jué)分析實(shí)際應(yīng)用項(xiàng)目中,如何通過(guò)建立計(jì)算機(jī)視覺(jué)分析快速開(kāi)發(fā)框架,搭建一個(gè)分工明確,快捷有效的圖像學(xué)應(yīng)用處理平臺(tái),提高開(kāi)發(fā)效率,縮短開(kāi)發(fā)時(shí)間,已成為項(xiàng)目開(kāi)發(fā)人員關(guān)注的重點(diǎn)內(nèi)容之一。本框架從項(xiàng)目應(yīng)用和實(shí)際需求出發(fā),將計(jì)算機(jī)視覺(jué)技術(shù)的核心算法從底層研究工作中剝離,可極大的縮短開(kāi)發(fā)時(shí)間,提高開(kāi)發(fā)效率。
在本框架下,開(kāi)發(fā)人員可各司其職,分工、構(gòu)成和職能劃分明確,框架開(kāi)發(fā)人員只專(zhuān)注于框架接口的定義;算法開(kāi)發(fā)人員只專(zhuān)注于圖像處理與識(shí)別等算法的開(kāi)發(fā);上層應(yīng)用開(kāi)發(fā)人員只負(fù)責(zé)抽取出一般的處理流程,專(zhuān)注于項(xiàng)目的具體實(shí)現(xiàn)和功能模塊的組合應(yīng)用。
1 研究與應(yīng)用
1.1背景
計(jì)算機(jī)視覺(jué)是用攝像機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量的機(jī)器視覺(jué)。系統(tǒng)將獲取的視頻或圖像資料,通過(guò)計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像,其中包括圖像處理、模式識(shí)別或圖像識(shí)別、景物分析、圖像理解等相關(guān)內(nèi)容,它們之間既有差別,又有相互重疊。
在計(jì)算機(jī)視覺(jué)分析技術(shù)中,對(duì)于一些復(fù)雜的問(wèn)題,往往不是某單一學(xué)科能夠解決的,它需要一系列相關(guān)技術(shù)的支持。例如:對(duì)航道中船舶的識(shí)別,獲取的視頻流往往要經(jīng)過(guò)平滑、去噪等圖像處理操作后,便于下一步運(yùn)用基于直方圖分類(lèi)器的圖像識(shí)別算法來(lái)區(qū)分船舶和水面,通過(guò)圖像分割技術(shù)來(lái)提取檢測(cè)目標(biāo)。而這些方案的實(shí)現(xiàn)中,同一個(gè)問(wèn)題的解決又往往需要有一系列的算法來(lái)支持。還是以船舶識(shí)別為例,圖像平滑有領(lǐng)域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類(lèi)器也存在決策樹(shù)、貝葉斯、SVM等等算法。雖然上述的算法本身沒(méi)有優(yōu)劣之分,但在特定的環(huán)境下一定會(huì)有某個(gè)最佳算法。
因此,在實(shí)際應(yīng)用項(xiàng)目中如何找出其最優(yōu)路徑,除了需要開(kāi)發(fā)者擁有深厚的圖像學(xué)功底,更需要的是通過(guò)大量的對(duì)比實(shí)驗(yàn)來(lái)找出該最優(yōu)路徑的解決方案。即便如此,也只能解決特定環(huán)境下的計(jì)算機(jī)視覺(jué)需求,換個(gè)應(yīng)用場(chǎng)景,上述步驟又需要重新進(jìn)行,此類(lèi)過(guò)程的重復(fù),既增加了開(kāi)發(fā)成本,又延長(zhǎng)了開(kāi)發(fā)時(shí)間。
本框架從工程化的角度出發(fā),在不同項(xiàng)目中的計(jì)算機(jī)視覺(jué)軟件開(kāi)發(fā)中,研究如何提高開(kāi)發(fā)結(jié)果的復(fù)用性,盡量降低上述各條件間的相互依賴(lài)關(guān)系,將視覺(jué)技術(shù)的核心算法從底層研究中剝離,達(dá)到縮短開(kāi)發(fā)時(shí)間,提高開(kāi)發(fā)效率的目的。
1.2研究目標(biāo)
1) 框架系統(tǒng)的扁平化、模塊化;
2) 完成處理過(guò)程的任意組合,使圖像處理模塊單一化;
3) 理行為在處理模塊內(nèi)部完成,處理結(jié)果可通過(guò)接口方式進(jìn)行輸出;
4) 處理模塊間的數(shù)據(jù)流動(dòng)定義在框架之中,框架負(fù)責(zé)配置數(shù)據(jù)流;
5) 置好的數(shù)據(jù)流,通過(guò)指定圖像處理模塊實(shí)現(xiàn)對(duì)物體的識(shí)別、行為的識(shí)別。
1.3.5框架的效果演示
從右側(cè)功能區(qū)中選取兩個(gè)輸入模塊:MediaOpen00和MediaOpen01,分別打開(kāi)視頻文件“.\公司監(jiān)控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識(shí)別模塊,這里我們選取了行人檢測(cè)算法、基本全局閾值二值算法、人臉檢測(cè)算法、輪廓檢測(cè)算法,加入輸出展示模塊用于顯示處理結(jié)果。最后我們用曲線將模塊間的輸入輸出點(diǎn)連起來(lái),完成數(shù)據(jù)流向的配置過(guò)程。其中一個(gè)輸出點(diǎn)可以連接多個(gè)輸入點(diǎn),但一個(gè)輸入點(diǎn)只能接入一個(gè)輸出點(diǎn)。
2 結(jié)論
隨著計(jì)算機(jī)視覺(jué)技術(shù)發(fā)展的日新月異,算法的更新和積累將會(huì)越來(lái)越多。計(jì)算機(jī)視覺(jué)快速開(kāi)發(fā)框架從實(shí)際應(yīng)用工程的角度出發(fā),在不同項(xiàng)目計(jì)算機(jī)視覺(jué)軟件的開(kāi)發(fā)過(guò)程中,將視覺(jué)技術(shù)的核心算法從底層研究中剝離,使視覺(jué)分析應(yīng)用項(xiàng)目中的框架開(kāi)發(fā)人員專(zhuān)注于框架接口定義的開(kāi)發(fā),而項(xiàng)目中的算法、上層應(yīng)用等開(kāi)發(fā)人員各司其職,分工明確,不但提高了開(kāi)發(fā)結(jié)果的復(fù)用性,同時(shí),也降低了項(xiàng)目開(kāi)發(fā)中各條件間的相互依賴(lài)關(guān)系,縮短了開(kāi)發(fā)時(shí)間,提高了開(kāi)發(fā)效率。
參考文獻(xiàn):
[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.
[2] 張廣軍.機(jī)器視覺(jué)[M].北京:科學(xué)出版社,2005.
[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點(diǎn)提取及匹配的方法[J].北京航空航天大學(xué)學(xué)報(bào),2008,34(5).
[4] 劉立,彭復(fù)員,趙坤,萬(wàn)亞平.采用簡(jiǎn)化SIFT算法實(shí)現(xiàn)快速圖像匹配[J].紅外與激光工程,2008,37(1).
[5] 戴斌,方宇強(qiáng),孫振平,王亮.基于光流技術(shù)的運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤方法研究[D].國(guó)防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院.
[6] 陳勝勇,劉盛.基于OpenCV的計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)[M].科學(xué)出版社.
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);案例推理;圖像處理;圖像描述
中圖分類(lèi)號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)?;诎咐评砼c類(lèi)比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問(wèn)題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問(wèn)題。如果沒(méi)遇到相似案例的,經(jīng)過(guò)推理后解決新問(wèn)題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問(wèn)題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。
這與人遇到問(wèn)題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問(wèn)題的方式相似,這也是解決問(wèn)題較好的方法。基于案例推理應(yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡(jiǎn)化知識(shí)獲取的過(guò)。
CBR求解效率較高。是對(duì)過(guò)去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開(kāi)始推導(dǎo),可以提高對(duì)新問(wèn)題的求解效率。
CBR求解的質(zhì)量較高。CBR以過(guò)去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開(kāi)失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來(lái)問(wèn)題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺(jué)技術(shù)起到很大的作用。
計(jì)算機(jī)視覺(jué)是研究用計(jì)算機(jī)來(lái)模擬人和生物的視覺(jué)系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周?chē)曈X(jué)世界的能力。通過(guò)計(jì)算機(jī)視覺(jué),進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類(lèi)、三維信息理解、景物描述、圖像解釋?zhuān)層?jì)算機(jī)具有對(duì)周?chē)澜绲目臻g物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。
計(jì)算機(jī)視覺(jué)隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺(jué)理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺(jué)從上世紀(jì)60年代開(kāi)始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡(jiǎn)單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺(jué)的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺(jué)打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語(yǔ)言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來(lái)越多,結(jié)構(gòu)十分復(fù)雜的案例庫(kù),尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫(kù)中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴(lài)于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問(wèn)題之間的不同之處,案例中的哪些部分可以用于新問(wèn)題,哪些部分不適合應(yīng)用于新問(wèn)題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫(kù)中,擴(kuò)充案例庫(kù)的案例種類(lèi)與數(shù)量,這過(guò)程也是知識(shí)獲取。此過(guò)程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫(kù)中,包括如何存儲(chǔ),如何建立索引等等。
針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺(jué)主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺(jué)如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類(lèi)型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡(jiǎn)單傳感器可使用光電開(kāi)關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過(guò)時(shí),產(chǎn)品遮擋住光源,使光電開(kāi)關(guān)產(chǎn)生一個(gè)0值,而沒(méi)有產(chǎn)品經(jīng)過(guò)時(shí),光電開(kāi)關(guān)產(chǎn)生相反的1值,系統(tǒng)通過(guò)判斷光電開(kāi)關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡(jiǎn)單地說(shuō)是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過(guò)傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過(guò)圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤(pán)。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說(shuō)圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。
在計(jì)算機(jī)視覺(jué)技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺(jué)效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:
圖2 計(jì)算機(jī)視覺(jué)的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來(lái)分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開(kāi),并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了??刹捎枚喾N算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。
特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒(méi)有特征,就談不上進(jìn)行檢索。圖像特征可通過(guò)圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫(kù)查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對(duì)話(huà)系統(tǒng):完成人機(jī)交互、問(wèn)題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫(kù)系統(tǒng):由案例庫(kù)及案例庫(kù)管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫(kù)的數(shù)據(jù)通過(guò)轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫(kù)協(xié)同器:根據(jù)問(wèn)題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問(wèn)題求解過(guò)程中對(duì)模型庫(kù)系統(tǒng)、方法庫(kù)系統(tǒng)、知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識(shí)庫(kù)系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專(zhuān)家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫(kù)系統(tǒng):由模型庫(kù)、算法庫(kù)、模型庫(kù)管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話(huà)系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫(kù)系統(tǒng):存放待決策支持的所有問(wèn)題,并完成其維護(hù)與查詢(xún)等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過(guò)產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類(lèi)識(shí)別。根據(jù)案例推理的算法檢索案例庫(kù)中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計(jì)算機(jī)視覺(jué)技術(shù)中圖像檢索問(wèn)題。對(duì)提高圖像檢索的效率和準(zhǔn)確度提供了平臺(tái)。
計(jì)算機(jī)視覺(jué)技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺(jué)技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。
系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻(xiàn):
[1](美)桑肯(Sonka,M).圖像處理分析與機(jī)器視覺(jué)[M].人民郵電出版社.
[2]王宏等譯.計(jì)算機(jī)視覺(jué)[M].電子工業(yè)出版社.
[3]蔡建榮.自然場(chǎng)景下成熟水果的計(jì)算機(jī)視覺(jué)識(shí)別[J].農(nóng)業(yè)機(jī)械,36(2):61-64.
[4]王宇輝.基于計(jì)算機(jī)視覺(jué)的錐體零件尺寸在線檢測(cè)算法[J].重型機(jī)械,2005,2:4-6
[5]駱志堅(jiān).基于計(jì)算機(jī)視覺(jué)檢測(cè)技術(shù)自動(dòng)計(jì)數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫(kù)推理中的應(yīng)用[J],南大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測(cè)支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
近日,國(guó)內(nèi)創(chuàng)業(yè)公司商湯科技宣布獲得4.1億美元B輪融資,這是截至目前為止全球范圍內(nèi)人工智能領(lǐng)域單輪最高融資。至此,這家成立僅三年的公司累計(jì)融資額達(dá)4.5億美元,估值超過(guò)15億美元,成為全球融資額最高的人工智能獨(dú)角獸企業(yè)。當(dāng)前,人工智能發(fā)展勢(shì)頭良好,技術(shù)和產(chǎn)品研發(fā)能力大幅提升,市場(chǎng)空間逐步拓展,社會(huì)關(guān)注與投資力度持續(xù)加大,技術(shù)創(chuàng)新驅(qū)動(dòng)的人工智能企業(yè)正成為資本青睞的熱點(diǎn)。
一、商湯融資背景分析
人工智能迎來(lái)估值猛漲期。自2014年起,人工智能領(lǐng)域一直都是全球投資熱點(diǎn)。近年來(lái),技術(shù)與產(chǎn)品的迅速成長(zhǎng)帶動(dòng)國(guó)內(nèi)創(chuàng)業(yè)熱情高q,也引發(fā)了資本的高度關(guān)注。據(jù)統(tǒng)計(jì),截至2017年5月31日,我國(guó)人工智能類(lèi)創(chuàng)業(yè)公司已超過(guò)650家,產(chǎn)業(yè)規(guī)模較2016年同期增長(zhǎng)達(dá)到51.2%,投融資事件超過(guò)430起,融資總額達(dá)340億元??萍季揞^加大在人工智能領(lǐng)域的布局,投資案例不斷涌現(xiàn)。同時(shí),社會(huì)資本競(jìng)相追逐人工智能領(lǐng)域的優(yōu)質(zhì)項(xiàng)目,整體行業(yè)獲投率偏高,超過(guò)一半的人工智能公司成立時(shí)間在兩年之內(nèi),可見(jiàn)資本市場(chǎng)對(duì)人工智能產(chǎn)業(yè)發(fā)展的信心。
計(jì)算機(jī)視覺(jué)領(lǐng)域成為熱點(diǎn)聚焦。在大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)推動(dòng)下,以計(jì)算機(jī)視覺(jué)和語(yǔ)音識(shí)別為代表的感知智能正呈現(xiàn)出高速演進(jìn)態(tài)勢(shì)。目前我國(guó)計(jì)算機(jī)視覺(jué)技術(shù)水平已達(dá)到全球領(lǐng)先水平,并在安防、汽車(chē)、金融等領(lǐng)域取得了顯著的應(yīng)用成效。在安防領(lǐng)域,智能技術(shù)如人臉識(shí)別、圖形識(shí)別應(yīng)用場(chǎng)景眾多,如車(chē)牌識(shí)別、車(chē)輛視覺(jué)特征識(shí)別、被動(dòng)人像卡口、身份證比對(duì)等應(yīng)用。在汽車(chē)領(lǐng)域,圍繞智能駕駛汽車(chē)人工智能在環(huán)境感知、路徑規(guī)劃與決策等關(guān)鍵環(huán)節(jié)均有所應(yīng)用和體現(xiàn),在該領(lǐng)域百度、樂(lè)視等企業(yè)已開(kāi)展卓有成效的實(shí)踐。廣泛的商業(yè)化渠道和技術(shù)基礎(chǔ)推動(dòng)計(jì)算機(jī)視覺(jué)成為創(chuàng)投熱門(mén)領(lǐng)域,據(jù)數(shù)據(jù)顯示,中國(guó)人工智能創(chuàng)業(yè)公司所屬領(lǐng)域分布中,計(jì)算機(jī)視覺(jué)領(lǐng)域擁有最多創(chuàng)業(yè)公司。2016年,人臉識(shí)別服務(wù)開(kāi)發(fā)商曠視科技完成至少1億美元融資,估值超過(guò)20億美元,專(zhuān)注圖像識(shí)別的圖普科技獲得千萬(wàn)美元A輪融資。
商湯科技技術(shù)實(shí)力領(lǐng)先,發(fā)展?jié)摿薮?。商湯科技主攻人臉識(shí)別、視頻監(jiān)控識(shí)別算法、增強(qiáng)現(xiàn)實(shí)、文字識(shí)別、自動(dòng)駕駛識(shí)別算法和醫(yī)療影像識(shí)別算法等技術(shù),基礎(chǔ)研究實(shí)力強(qiáng)大,高質(zhì)量專(zhuān)利數(shù)量、專(zhuān)業(yè)學(xué)術(shù)數(shù)量均保持全國(guó)領(lǐng)先水平。在2015年ImageNet大規(guī)模視覺(jué)識(shí)別競(jìng)賽中,商湯科技獲得視頻識(shí)別冠軍,次年在該競(jìng)賽中,商湯科技憑借原創(chuàng)深度神經(jīng)網(wǎng)絡(luò)平臺(tái),獲得3個(gè)項(xiàng)目的冠軍。商湯科技主要業(yè)務(wù)范圍是將計(jì)算機(jī)視覺(jué)技術(shù)賦能給安防、金融、機(jī)器人、政府大數(shù)據(jù)分析以及虛擬增強(qiáng)現(xiàn)實(shí)等行業(yè)。
二、由商湯融資帶來(lái)的兩點(diǎn)思考
【關(guān)鍵詞】平面測(cè)量技術(shù);鉛球項(xiàng)目;成績(jī)測(cè)量
0 引言
隨著計(jì)算機(jī)處理能力的提高和傳感器技術(shù)的發(fā)展,近年來(lái)基于視頻圖像處理的計(jì)算機(jī)視覺(jué)技術(shù)已成為圖像處理領(lǐng)域的研究熱點(diǎn),該技術(shù)在眾多的領(lǐng)域中都有十分廣泛的應(yīng)用[1]。
視覺(jué)是人類(lèi)認(rèn)識(shí)世界、觀察世界的重要手段。人類(lèi)從外界獲取的信息量約有 75%來(lái)自視覺(jué)系統(tǒng),這表明視覺(jué)信息量十分巨大以及人類(lèi)對(duì)視覺(jué)信息有較高的利用率。人類(lèi)利用視覺(jué)的過(guò)程可看作是一個(gè)從感覺(jué)到知覺(jué)的復(fù)雜過(guò)程,即從感受到的對(duì)三維世界的投影圖像到依據(jù)投影圖像去認(rèn)知三維世界的內(nèi)容和含義[2]。
計(jì)算機(jī)視覺(jué)技術(shù)是指利用計(jì)算機(jī)實(shí)現(xiàn)人的視覺(jué)功能,既對(duì)客觀世界的三維場(chǎng)景的識(shí)別、感知和理解。該技術(shù)包括是仿生學(xué)方法及工程方法,仿生學(xué)方法是模仿人類(lèi)視覺(jué)功能的結(jié)構(gòu)及原理,建立相應(yīng)的處理系統(tǒng),完成類(lèi)似的工作和功能;工程方法是從分析人類(lèi)視覺(jué)系統(tǒng)著手,并采用任何現(xiàn)有的可行手段實(shí)現(xiàn)人類(lèi)視覺(jué)系統(tǒng)的功能[3],該方法的特點(diǎn)是只關(guān)心系統(tǒng)的輸入和輸出。計(jì)算機(jī)視覺(jué)的主要研究目標(biāo)是建成計(jì)算機(jī)視覺(jué)系統(tǒng),完成各種視覺(jué)功能。也就是說(shuō),即要能借助各種視覺(jué)傳感器(如 CMOS 攝像器件、CCD等)獲取現(xiàn)實(shí)世界的圖像,而感知和恢復(fù) 3D 環(huán)境中物體的幾何性質(zhì)、運(yùn)動(dòng)情況、姿態(tài)結(jié)構(gòu)、相互位置等,并且要對(duì)客觀場(chǎng)景進(jìn)行識(shí)別、解釋、描述、進(jìn)而做出決斷。目前,計(jì)算機(jī)視覺(jué)技術(shù)在體育運(yùn)動(dòng)中也得到了廣泛的應(yīng)用,利用該技術(shù)不僅可以從不同的視角觀察運(yùn)動(dòng)員的動(dòng)作,而且能將運(yùn)動(dòng)員速度、加速度、所在位置等數(shù)據(jù)進(jìn)行量化處理,使體育訓(xùn)練及比賽擺脫依靠傳統(tǒng)經(jīng)驗(yàn)分析及判別的狀態(tài),從而進(jìn)入科學(xué)化、數(shù)字化的狀態(tài),而且還可以完成競(jìng)技體育項(xiàng)目的成績(jī)測(cè)試[4-5]。
在測(cè)試項(xiàng)目中鉛球成績(jī)的測(cè)量仍采用皮尺丈量法。這種方法存在著三個(gè)方面的缺陷,一是皮尺本身具有彈性以及易折疊特性,二是受場(chǎng)地的凹凸不平,三是人為因素影響較大。由于這三方面的作用, 故在鉛球成績(jī)的測(cè)量精確度受到極大的限制。針對(duì)這一問(wèn)題本課題提出了一種基于同視場(chǎng)(鉛球場(chǎng)地)測(cè)量地平面坐標(biāo)的單攝像機(jī)模型[6-7]。該模型利用透視投影幾何關(guān)系,對(duì)攝像機(jī)內(nèi)部參數(shù)進(jìn)行標(biāo)定,然后,建立相應(yīng)的網(wǎng)格匹配數(shù)學(xué)模型,通過(guò)單目CCD攝像機(jī)像面坐標(biāo),測(cè)量鉛球落點(diǎn)的地平面坐標(biāo)[8]。成功的解決了鉛球著點(diǎn)測(cè)量在雙目視覺(jué)交匯組合測(cè)量存在的死角影響系統(tǒng)的測(cè)量范圍的問(wèn)題,另外,單目視覺(jué)測(cè)量系統(tǒng)也避免了雙目視覺(jué)系統(tǒng)存在對(duì)應(yīng)特征點(diǎn)匹配問(wèn)題。
1 平面測(cè)量原理
圖1 鉛球的2D場(chǎng)景坐標(biāo)系
鉛球場(chǎng)地是一個(gè)扇形區(qū)域(如圖1)。假設(shè)建立一個(gè)如圖1的2D場(chǎng)景坐標(biāo)系,首先要做的事是要確定場(chǎng)地上指定點(diǎn)的真實(shí)坐標(biāo)與采集到的圖片的指定點(diǎn)象素坐標(biāo)之間的對(duì)應(yīng)關(guān)系,即要找到這兩種坐標(biāo)系之間的轉(zhuǎn)換關(guān)系。而這種轉(zhuǎn)換關(guān)系可以用平面測(cè)量的相關(guān)技術(shù)獲得。在計(jì)算機(jī)視覺(jué)中,所謂的平面測(cè)量,就是從圖像中獲得2D場(chǎng)景信息。在實(shí)際的測(cè)量中,我們可以通過(guò)在圖像上標(biāo)定一定數(shù)量的坐標(biāo)點(diǎn)來(lái)確定圖像中場(chǎng)地指定點(diǎn)的象素坐標(biāo)和真實(shí)世界中的指定點(diǎn)的現(xiàn)實(shí)坐標(biāo)之間的單應(yīng)矩陣。
我們獲取一幅2D場(chǎng)景S的圖像I,通過(guò)S與I之間的N(N>=4)對(duì)對(duì)應(yīng)點(diǎn),就可以確定它們之間的單應(yīng)矩陣H。
令:
H=h■,h■,h■=h■,h■,h■h■,h■,h■h■,h■,h■(1)
在H的九個(gè)元素中,有八個(gè)獨(dú)立比率,即一個(gè)單應(yīng)有八個(gè)自由度變量,一個(gè)常數(shù)1。因此,在H中,往往設(shè)置h■=1。
令(x■,y■)∈I,x■■,y■■∈S為一對(duì)對(duì)應(yīng)點(diǎn),i=1,2,…N。由每一對(duì)對(duì)應(yīng)點(diǎn),根據(jù)圖像與場(chǎng)景之間的單應(yīng)關(guān)系,我們可以得到兩個(gè)線性方程:
其中,h是矩陣H的向量形式,
于是我們可以得到2N個(gè)方程,寫(xiě)成矩陣形式為:
AH=0(3)
其中
因此,要求得8個(gè)參數(shù)的單應(yīng)矩陣,至少需要4個(gè)對(duì)應(yīng)點(diǎn)。在實(shí)際的測(cè)量中,為了提高精度,每個(gè)模板平面上提供的對(duì)應(yīng)點(diǎn)數(shù)目都會(huì)超過(guò)4個(gè)。
當(dāng)N>4時(shí),我們可以用奇異值分解法(SVD)[14]求最小二乘解h。
求得單應(yīng)矩陣后,利用公式(2),就可以計(jì)算出圖像上指定點(diǎn)對(duì)應(yīng)的真實(shí)坐標(biāo)值,從而計(jì)算出鉛球投擲的距離。
2 實(shí)驗(yàn)結(jié)果與分析
表1
2.1 實(shí)驗(yàn)結(jié)論(下轉(zhuǎn)第38頁(yè))
(上接第21頁(yè))經(jīng)實(shí)際測(cè)量的6個(gè)標(biāo)定點(diǎn)(如圖1)的坐標(biāo)分別為A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639) 。為了測(cè)試本文提出的測(cè)量模型,在反復(fù)測(cè)量鉛球投擲實(shí)驗(yàn)中選取了典型的10個(gè)測(cè)試樣本,其中鉛球落點(diǎn)10個(gè)。
2.2 誤差分析
從表1中我們可以看到人工測(cè)量值和系統(tǒng)測(cè)量值有一定的誤差,分析誤差產(chǎn)生的原因有如下幾種:
1)數(shù)字 CCD 鏡頭的光學(xué)性能引起的誤差,如焦距、畸變和光學(xué)中心誤差等通過(guò)攝像機(jī)內(nèi)部參數(shù)校正來(lái)解決。
2)攝像機(jī)的支架及底座一定要有足夠的穩(wěn)定性和剛度,在視頻圖像獲取過(guò)程中應(yīng)保證攝像機(jī)的相對(duì)位置穩(wěn)定不動(dòng),由意外情況所造成的誤差在計(jì)算中應(yīng)予以剔除。
3)環(huán)境的變化將對(duì)測(cè)量結(jié)果產(chǎn)生影響,因此測(cè)量中要及時(shí)修正背景圖像。
4)人工測(cè)量本身就會(huì)與真實(shí)值產(chǎn)生一定的誤差。
3 總結(jié)
本論文首先介紹了課題背景,對(duì)單目視覺(jué)測(cè)量的研究現(xiàn)狀和測(cè)量建模在國(guó)內(nèi)外的研究現(xiàn)狀進(jìn)行了分析和歸納,同時(shí)分析了視頻圖像處理技術(shù)在體育項(xiàng)目應(yīng)用現(xiàn)狀,將基于單目視頻圖像處理技術(shù)的鉛球成績(jī)測(cè)量作為切入點(diǎn),對(duì)數(shù)字圖像處理技術(shù)在田徑運(yùn)動(dòng)中應(yīng)用的關(guān)鍵技術(shù)進(jìn)行了研究。結(jié)合鉛球場(chǎng)地的特點(diǎn),提出一種基于視頻圖像的鉛球測(cè)量方法,并通過(guò)實(shí)際應(yīng)用證明了該方法的可行性。
【參考文獻(xiàn)】
[1]Criminisi A,Reid I,Zisserman A. A plane measuring device[J].Image and VisionComputing,1999,17(8), 625-634.
[2]Lorenzo Bruzzone, Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).
[3]L Sajó, Z Ruttkay, A Fazekas. Turk-2, a multi-modal chess player[J]. International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.
[4]Lichtenberg, D.B., Wills, J.G., Maximizing the range of the shot-put[J]. American Journal of Physics,1978,46:546-549.
[5]Maheras, A.V.. The relationship between the angle of release and the velocity of release in the shot-put, and the application of a theoretical model to estimate the optimum angle of release (throwing)[D].University of Kansas., 1995.
[6]Antonio Plaza, Jon Atli Benediktsson, Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment,2009,9,113(1):S110-S112.
多采用是人工測(cè)量的方式,在誤差的控制上選擇的是多次測(cè)量,反復(fù)操作,再將多次測(cè)量的結(jié)果進(jìn)行加權(quán),最終得到相對(duì)準(zhǔn)確的測(cè)量數(shù)值。這種方法在一定程度上是操作十分復(fù)雜,精度還很難達(dá)到設(shè)計(jì)要求,所以我們?cè)诘V區(qū)土地信息測(cè)量工程中引進(jìn)了GIS技術(shù)這樣的一個(gè)概念,下面我們就如何通過(guò)GIS技術(shù)進(jìn)行有效的觀測(cè)測(cè)量來(lái)進(jìn)行討論。
[關(guān)鍵詞] GIS技術(shù); 精密測(cè)量; 構(gòu)造幾何模型; 信號(hào)源的接收
地理信息系統(tǒng)(Geographic information system,GIS)是利用計(jì)算機(jī)及其外部設(shè)備采集、存儲(chǔ)、分析、描述與空間和地理分布有關(guān)的數(shù)據(jù)的空間信息系統(tǒng)。GIS融合計(jì)算機(jī)圖形和數(shù)據(jù)庫(kù)于一體,在一定的地域內(nèi),將地理空間信息和一些與該地域地理信息相關(guān)的屬性信息結(jié)合起來(lái),達(dá)到對(duì)地理和屬性信息的綜合管理。從外部來(lái)看,GSI表現(xiàn)為計(jì)算機(jī)軟硬件系統(tǒng),而其內(nèi)涵是由計(jì)算機(jī)程序和地理數(shù)據(jù)組織而成的地理空間信息模型,是一個(gè)高度信息化的地理系統(tǒng)。
1)等高線生成及等高線分析:等高線圖是人們傳統(tǒng)上觀測(cè)地形的主要手段??梢栽诘雀呔€圖上精確地獲知地形的起伏程度、區(qū)域內(nèi)各部分的高程等等。等高線圖可以從格網(wǎng)數(shù)字地形模型中獲取相關(guān)的資料信息,也可在不規(guī)則三角形格網(wǎng)T(NI)中生成。
2)立體透視圖分析:當(dāng)用戶(hù)需要從直觀上觀察地形的概貌時(shí),用繪制透視圖的方法(還可以用色彩)可以更逼真地顯示地形。
3)坡度分析、地表面積計(jì)算及挖、填土方體積計(jì)算:建立DTM后就可以用之計(jì)算坡度、面積和挖、填土方體積,以其作為土地適宜性評(píng)價(jià)的因子。
一 GIS技術(shù)在信息管理模式中的具體形式
在以往的測(cè)量中,選擇的測(cè)量方式還是完全采用機(jī)械的形式,但是在使用了計(jì)算機(jī)GIS技術(shù)精密測(cè)量后,完成了許多以往技術(shù)所不能達(dá)到的任務(wù)。在我們的研究中,計(jì)算機(jī)GIS技術(shù)測(cè)量的原理是通過(guò)攝像機(jī)將被處理的對(duì)象采集進(jìn)行影像采集,在多個(gè)控制點(diǎn)的數(shù)據(jù)采集完成后,系統(tǒng)會(huì)自動(dòng)將這些圖像進(jìn)行整合,得出相關(guān)的幾何多變參數(shù),再在計(jì)算機(jī)上以具體的數(shù)據(jù)顯示出來(lái),以供礦區(qū)技術(shù)人員使用參照。
在上面所說(shuō)的攝像機(jī)并不是我們通常意義上生活中使用的攝像機(jī)。它是一種可視化較強(qiáng),表針比較敏感的測(cè)試儀??梢詫⒁曈X(jué)中的二維形態(tài)通過(guò)顯影,記錄在機(jī)械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過(guò)播放儀呈現(xiàn)出三維的影像。這時(shí)的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價(jià)較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點(diǎn)的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對(duì)于原始的圖像進(jìn)行預(yù)處理,不再經(jīng)過(guò)有曝光這個(gè)程序,將圖像中關(guān)鍵點(diǎn)的坐標(biāo)在整個(gè)內(nèi)部軸面上體現(xiàn)出來(lái),提取數(shù)據(jù)幀數(shù),再運(yùn)用機(jī)器的智能識(shí)別系統(tǒng),對(duì)控制點(diǎn)的坐標(biāo)進(jìn)行數(shù)據(jù)分析,自動(dòng)生成圖形,這也可以用于精密測(cè)量。它的優(yōu)點(diǎn)就是使用上極其的方面,基本只要架立儀器和打開(kāi)開(kāi)關(guān),其他的工作機(jī)械系統(tǒng)都會(huì)自動(dòng)的完成。使用的困難就是造價(jià)極其的高,不適合一般企業(yè)使用。在基于計(jì)算機(jī)視覺(jué)圖像測(cè)量中使用上的原理如下:
(1)計(jì)算出觀察控制點(diǎn)到計(jì)算機(jī)視覺(jué)圖像測(cè)量?jī)x器的有效距離;
(2)得出觀察點(diǎn)到目標(biāo)控制點(diǎn)之間的三維的運(yùn)動(dòng)幾何參數(shù);
(3)推斷出目標(biāo)控制點(diǎn)在整個(gè)平面上的表面特征(大多時(shí)候要求形成立體視覺(jué));
(4)還通過(guò)觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。
在整個(gè)計(jì)算機(jī)GIS技術(shù)精密測(cè)量的在礦區(qū)土地信息管理中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。
所謂的壓力感應(yīng)就是一種新型的傳感器,通過(guò)電阻的變化作為一種感應(yīng)值的判斷標(biāo)準(zhǔn)進(jìn)行計(jì)算和采集數(shù)據(jù)。具體的做法是在受力物體上粘貼高靈敏度的感應(yīng)片,通過(guò)力的傳遞將物體上受到即時(shí)的力傳遞到感應(yīng)片上,以備技術(shù)人員收集。在物體的中心或者是機(jī)械的隔斷處,使用丙酮溶液進(jìn)行擦拭,以保證物體的表面潔凈和貼合度較高。當(dāng)液體充分風(fēng)干的情況下將感應(yīng)片貼在已涂丙酮的物體上(注意感應(yīng)片的正反),再使用導(dǎo)線和感應(yīng)片相互連接,從而形成了一個(gè)完整的閉合電路體系,在通電的情況下,在計(jì)算機(jī)終端上可以顯示出來(lái)。以便技術(shù)人員可以在任何時(shí)候掌握每個(gè)檢測(cè)點(diǎn)的施工使用情況,一旦機(jī)械設(shè)備發(fā)生異?,F(xiàn)象,就會(huì)在計(jì)算機(jī)圖形中顯示出來(lái)。于此同時(shí),它還可以對(duì)施工人員所處的具置做到應(yīng)力感應(yīng),人自身的重量傳遞到地面上,結(jié)構(gòu)會(huì)出現(xiàn)結(jié)構(gòu)上的略微變化,這個(gè)儀器就能第一時(shí)間以信號(hào)的方式傳送到計(jì)算機(jī)終端,讓技術(shù)人員掌握相關(guān)施工的情況,并結(jié)合數(shù)據(jù)報(bào)告總結(jié)出相關(guān)的可行性分析付諸實(shí)踐。
當(dāng)無(wú)法觀察到控制點(diǎn)是,計(jì)算機(jī)GIS技術(shù)測(cè)量可以通過(guò)接收信號(hào)或是相關(guān)的頻率波段來(lái)收集數(shù)據(jù),不會(huì)因?yàn)橐酝鶞y(cè)量的環(huán)境不好,距離太遠(yuǎn),誤差太大的影響。同時(shí)在信息管理中通過(guò)了加密通道,系統(tǒng)可以將數(shù)據(jù)自動(dòng)的保存和轉(zhuǎn)換為視圖模式,對(duì)于數(shù)據(jù)的審計(jì)和運(yùn)行可以同時(shí)進(jìn)行,這樣就可以很好的保證大地測(cè)量中的圖像數(shù)據(jù)安全,利用防護(hù)墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進(jìn)一步改善計(jì)算機(jī)GIS技術(shù)。
二 計(jì)算機(jī)GIS與CAD技術(shù)的結(jié)合
在計(jì)算機(jī)GIS技術(shù)測(cè)量中解決了很多以往很難完成的任務(wù),但是在使用過(guò)程中還是發(fā)生了很多的問(wèn)題。尤其在土地信息的選擇中,無(wú)法使用高幀數(shù)的圖片顯示,無(wú)法將計(jì)算機(jī)測(cè)量的關(guān)鍵技術(shù)的優(yōu)點(diǎn)發(fā)揮出來(lái)。在煤礦生產(chǎn)過(guò)程中,對(duì)于生產(chǎn)效率的提高就要對(duì)開(kāi)采環(huán)境的要求更高。使用繪圖技術(shù)與GIS技術(shù)相互結(jié)合可以將復(fù)雜的地理環(huán)境的具體形狀在電腦當(dāng)中展現(xiàn)出來(lái),用較為直觀的圖形準(zhǔn)確的反應(yīng)出來(lái)。而且在使用中,可以在計(jì)算機(jī)中隨時(shí)將圖像進(jìn)行修改,完全可以適應(yīng)復(fù)雜情況下的設(shè)備調(diào)試。在以往傳統(tǒng)的圖像設(shè)計(jì)中,技術(shù)人員在圖紙中很難將地理信息進(jìn)行再次修改,在設(shè)計(jì)后期在計(jì)算機(jī)圖形繪制處理技術(shù)中,對(duì)于圖像的調(diào)試使用的范圍很廣,通過(guò)虛擬的模擬和現(xiàn)實(shí)的結(jié)合來(lái)實(shí)現(xiàn)煤礦信息的完整,有效的加強(qiáng)了煤礦的信息化管理。
CAD技術(shù)是基于工程圖上的三維建模方式。三維模型是從二維信息中提取的三維模型信息,通過(guò)再次分類(lèi)以后,得到的一系列的相關(guān)處理信息,之后在三維空間建立相應(yīng)的二維信息的三維形狀模型提,使模型本身恢復(fù)點(diǎn),線,面和拓?fù)潢P(guān)系,從而實(shí)現(xiàn)形狀重建工程。計(jì)算機(jī)圖形繪制處理,也可以應(yīng)用于測(cè)繪圖紙和關(guān)于地形的建模。土地信息中包含的地貌和自然資源圖,它是國(guó)民經(jīng)濟(jì)體系的重要組成部分。我們可以畫(huà)一個(gè)圖,三維地形圖的存儲(chǔ)信息的產(chǎn)生。為預(yù)測(cè)和決策水平的使用有重大的意義,也為綜合治理和煤炭資源的研究開(kāi)發(fā)利用提供科學(xué)依據(jù),這些依據(jù),在軍事上也起著非常重要的作用。在煤礦機(jī)械設(shè)備也使用CAD軟件繪制零件圖,利用繪圖軟件在操作更簡(jiǎn)單的菜單式設(shè)計(jì),繪制出圖形更準(zhǔn)確。
三 GIS技術(shù)測(cè)量的關(guān)鍵技術(shù)遇到的困難和使用前景
計(jì)算機(jī)GIS技術(shù)測(cè)量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時(shí)間上不過(guò)十幾年,其使用的程度已經(jīng)無(wú)法估算。正是因?yàn)樗暮?jiǎn)單、使用、精度高以及自動(dòng)化能力卓越的特點(diǎn)受到了礦區(qū)土地信息管理部門(mén)的廣泛青睞。在測(cè)量調(diào)控方面的這些可靠性和穩(wěn)定性也是有目共睹的。這項(xiàng)關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識(shí)也很全面,一旦出現(xiàn)了機(jī)器的故障,在維修上還是一個(gè)很大的問(wèn)題,如何很好的解決計(jì)算機(jī)視覺(jué)圖像技術(shù)的相關(guān)核心問(wèn)題就是當(dāng)下亟待解決的。通過(guò)在一些相關(guān)的技術(shù)之間的相互結(jié)合才能使GIS技術(shù)發(fā)揮的更加完美。
我們都知道,人的眼睛是可以受到自身的控制,想要完成礦區(qū)土地觀測(cè)是十分簡(jiǎn)單的,但是在計(jì)算機(jī)GIS技術(shù)中,畢竟是采取攝像機(jī)取景的模式,在取得的點(diǎn)位有的時(shí)候不是特別的有代表性,很難將這些問(wèn)題具體化、形象化。達(dá)不到我們?cè)O(shè)計(jì)時(shí)的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴(yán)格的規(guī)定和要求,切不可盲目的實(shí)施測(cè)量,每項(xiàng)技術(shù)操作都要按規(guī)程來(lái)實(shí)施。
四 結(jié)束語(yǔ)
在煤礦土地工程發(fā)展的今天,很多的測(cè)量技術(shù)已經(jīng)離不了計(jì)算機(jī)GIS技術(shù)的輔助,本文中詳細(xì)的談到了GIS技術(shù)方面的研究,對(duì)于之中可能出現(xiàn)的一些問(wèn)題也提出了相應(yīng)的解決方案,對(duì)于和CAD繪圖技術(shù)相互結(jié)合的使用方式也做出了詳細(xì)的介紹。測(cè)量工程中使用計(jì)算機(jī)GIS技術(shù)可以很好的解決和完善測(cè)量中遇到的一些問(wèn)題,但是也暴露出了很多的問(wèn)題亟需技術(shù)人員不斷去解決完善。
將GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)中使用,也是加強(qiáng)了礦區(qū)建設(shè)的信息化水平??梢灶A(yù)見(jiàn)的是,在未來(lái)使用計(jì)算機(jī)GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)建立的測(cè)量模型會(huì)得到更多、更好的應(yīng)用。但作為一個(gè)長(zhǎng)期復(fù)雜的技術(shù)工程,在這個(gè)建設(shè)過(guò)程中定會(huì)有一些困難的出現(xiàn)。希望通過(guò)不斷的發(fā)現(xiàn)問(wèn)題、總結(jié)經(jīng)驗(yàn),讓GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)在煤礦的開(kāi)挖中的作用發(fā)揮的更好。
[參考文獻(xiàn)]
[1] 湯劍,周芳芹,楊繼隆.計(jì)算機(jī)視覺(jué)圖像系統(tǒng)的技術(shù)改造[J].機(jī)電產(chǎn)品開(kāi)發(fā)與創(chuàng)新周刊,2005,14(18):33-36
[2] 段發(fā)階等. 拔絲??仔斡?jì)算機(jī)視覺(jué)檢測(cè)技術(shù)[J] . 光電工程時(shí)報(bào), 2006, 23( 13):189-190
關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);計(jì)算機(jī)視覺(jué);三維注冊(cè)
中圖分類(lèi)號(hào):TP242 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 19-0000-02
1 引言
隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,計(jì)算機(jī)視覺(jué)、虛擬現(xiàn)實(shí)技術(shù)、人工智能、計(jì)算機(jī)圖形學(xué)等技術(shù)被廣泛地研究和應(yīng)用,這些技術(shù)引導(dǎo)著人們進(jìn)入了一個(gè)信息數(shù)字化的虛擬時(shí)代。
增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,AR)作為虛擬現(xiàn)實(shí)技術(shù)和計(jì)算機(jī)圖形學(xué)相結(jié)合的產(chǎn)物,它是在通過(guò)計(jì)算機(jī)渲染生成虛擬的物體或文字信息模型的同時(shí),對(duì)真實(shí)的場(chǎng)景進(jìn)行標(biāo)定,從而使虛擬的物體能夠被準(zhǔn)確地放置到真實(shí)的場(chǎng)景中,最終通過(guò)顯示設(shè)備顯示出來(lái),使用戶(hù)處于虛擬和現(xiàn)實(shí)相融合的亦真亦幻的新環(huán)境中,無(wú)法清楚地分辨出真實(shí)和虛擬。增強(qiáng)現(xiàn)實(shí)技術(shù)增強(qiáng)了用戶(hù)的觀感及其與真實(shí)場(chǎng)景之間的交互。
增強(qiáng)現(xiàn)實(shí)技術(shù)作為虛擬現(xiàn)實(shí)的一個(gè)重要分支,是虛擬現(xiàn)實(shí)技術(shù)發(fā)展過(guò)程中的產(chǎn)物。如圖1.1所示,該圖為Milgram提出的增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)關(guān)系的一種分類(lèi)學(xué)表示方法。由圖我們可以看出,虛擬現(xiàn)實(shí)所創(chuàng)建出來(lái)的是一種完全虛擬的三維世界,它與真實(shí)的世界相隔離。而增強(qiáng)現(xiàn)實(shí)是以現(xiàn)實(shí)場(chǎng)景為基礎(chǔ),場(chǎng)景中的虛擬物體隨著真實(shí)物體的變化而變化,提供給用戶(hù)的是一種復(fù)合的視覺(jué)效果,就好像這些虛擬物體真實(shí)的存在于場(chǎng)景中。
2 增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用
增強(qiáng)現(xiàn)實(shí)技術(shù)在20世紀(jì)90年代真正興起,其發(fā)展與20世紀(jì)60年代計(jì)算機(jī)圖形學(xué)的迅速發(fā)展密不可分。增強(qiáng)現(xiàn)實(shí)技術(shù)不僅擁有虛擬現(xiàn)實(shí)的各種優(yōu)點(diǎn),同時(shí)又有其獨(dú)特的視覺(jué)增強(qiáng)功能,因此成為了國(guó)內(nèi)外研究機(jī)構(gòu)和知名大學(xué)的研究熱點(diǎn),并廣泛的被應(yīng)用于教育、醫(yī)療、工業(yè)、娛樂(lè)、軍事等多個(gè)領(lǐng)域。
2.1 教育
增強(qiáng)現(xiàn)實(shí)豐富了教育學(xué)習(xí)生活。傳統(tǒng)的書(shū)籍中只存在文字信息,通過(guò)增強(qiáng)現(xiàn)實(shí)技術(shù),我們可以透過(guò)書(shū)籍看見(jiàn)文字相關(guān)的動(dòng)態(tài)畫(huà)面或是影像,圖文并茂,極大的增強(qiáng)了學(xué)生的學(xué)習(xí)興趣。目前的魔法書(shū)系統(tǒng)就是這一技術(shù)的很好運(yùn)用,用戶(hù)通過(guò)頭盔顯示器可以看到書(shū)中描述的場(chǎng)景,使讀者可以完全沉浸在虛實(shí)結(jié)合的環(huán)境中,提高學(xué)習(xí)興趣和效率。
2.2 醫(yī)療
增強(qiáng)現(xiàn)實(shí)技術(shù)可以幫助醫(yī)生實(shí)現(xiàn)可視化手術(shù)或手術(shù)培訓(xùn)。準(zhǔn)確地定位真實(shí)場(chǎng)景是增強(qiáng)現(xiàn)實(shí)技術(shù)的一個(gè)重要方面,在醫(yī)療中,運(yùn)用增強(qiáng)現(xiàn)實(shí)技術(shù)可以進(jìn)行手術(shù)定位,實(shí)時(shí)地收集病人體內(nèi)的3D影像,并將其與真實(shí)的人體相結(jié)合,使得醫(yī)生可以“透視”病人體內(nèi),從而減少手術(shù)的風(fēng)險(xiǎn),該技術(shù)對(duì)微創(chuàng)手術(shù)也有著深遠(yuǎn)的意義。手術(shù)培訓(xùn)方面,通過(guò)加入虛擬的提示注解,可以提醒醫(yī)生手術(shù)中的一些必要步驟,降低手術(shù)風(fēng)險(xiǎn)。
2.3 工業(yè)
增強(qiáng)現(xiàn)實(shí)的另一個(gè)應(yīng)用是工業(yè)組裝和維修。通過(guò)增強(qiáng)現(xiàn)實(shí)技術(shù)可以顯示出各種設(shè)備零件的內(nèi)部結(jié)構(gòu)圖、使用說(shuō)明等,方便安裝和維修。顯示的內(nèi)容可以不僅僅是簡(jiǎn)單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來(lái),方便操作。
2.4 娛樂(lè)
電影、廣告、游戲、體育比賽轉(zhuǎn)播中,增強(qiáng)現(xiàn)實(shí)技術(shù)也得到了廣泛的運(yùn)用。體育比賽中,能夠在直播現(xiàn)場(chǎng)實(shí)時(shí)地插入三維的圖形、動(dòng)畫(huà)、視頻等虛擬的比賽相關(guān)信息或廣告。日常生活中,出現(xiàn)一種增強(qiáng)現(xiàn)實(shí)瀏覽器,它利用多種傳感器將日常需求通過(guò)實(shí)景與虛景結(jié)合后呈現(xiàn)在用戶(hù)面前,用戶(hù)可以通過(guò)增強(qiáng)現(xiàn)實(shí)瀏覽器看到實(shí)景的文字介紹、三維模型等,并可以搜索定位。
3 增強(qiáng)現(xiàn)實(shí)相關(guān)技術(shù)
增強(qiáng)現(xiàn)實(shí)系統(tǒng)具有虛實(shí)結(jié)合、三維注冊(cè)、實(shí)時(shí)交互三個(gè)特點(diǎn)。三個(gè)特點(diǎn)之間緊密聯(lián)系,要求在合成的場(chǎng)景中虛擬的物體能夠擁有真實(shí)的存在感和位置感。因此顯示技術(shù)、定位技術(shù)、虛實(shí)融合技術(shù)、用戶(hù)交互技術(shù)是實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)系統(tǒng)的基礎(chǔ)支撐技術(shù)。
3.1 顯示技術(shù)
理想的AR系統(tǒng)的顯示器具有體積小、移動(dòng)方便、圖像繪制清晰、交互自然等特點(diǎn),但是目前仍不能制造出完成符合這些特點(diǎn)的顯示器。常用的顯示設(shè)備可以分為四類(lèi):普通液晶現(xiàn)實(shí)器;頭戴式顯示器;手持式顯示器;投影式顯示器。
液晶顯示器是最為常見(jiàn),也最容易得到的顯示設(shè)備。但是液晶顯示器體積較大,移動(dòng)不方便,限制了用戶(hù)的活動(dòng)范圍。頭戴式顯示器,佩戴于用戶(hù)的頭部,這種顯示器本身提供了一路或兩路攝像機(jī),采用視頻合成技術(shù),為用戶(hù)提供場(chǎng)景的顯示。但是頭戴式顯示器在戶(hù)外長(zhǎng)時(shí)間佩戴很不舒服,因此也不能為用戶(hù)廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進(jìn),但是也限制了用戶(hù)手部的活動(dòng)。投影式顯示器能夠?qū)?chǎng)景投影到較大范圍的環(huán)境中,位置固定,適合于室內(nèi)的AR系統(tǒng)。
3.2 定位技術(shù)
增強(qiáng)現(xiàn)實(shí)系統(tǒng)需要將虛擬的物體準(zhǔn)確地放置到真實(shí)的場(chǎng)景中,因此定位技術(shù)顯得尤為重要。目前的定位技術(shù)主要分為兩種:一種是基于硬件的定位技術(shù);一種是基于計(jì)算機(jī)視覺(jué)技術(shù)的定位技術(shù)。
基于硬件的定位技術(shù)一般使用硬件設(shè)備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測(cè)距儀、導(dǎo)航儀、機(jī)械裝置等。
基于計(jì)算機(jī)視覺(jué)的定位技術(shù)一般是從真實(shí)場(chǎng)景中獲得一幅或多幅圖像,根據(jù)圖像中的信息,計(jì)算出攝像機(jī)和圖形中物體的相對(duì)信息,最終恢復(fù)出三維場(chǎng)景的結(jié)構(gòu),從而達(dá)到定位的目的。
基于計(jì)算機(jī)視覺(jué)的定位技術(shù)主要包括以下幾種:
(1)單視圖法:在一幅圖像中找到六個(gè)以上特征點(diǎn)進(jìn)行跟蹤,通過(guò)已知的特征點(diǎn)的三維坐標(biāo)和其成像坐標(biāo)進(jìn)行定位。
(2)多視圖法:從多個(gè)角度拍攝場(chǎng)景,根據(jù)常用的角點(diǎn)檢測(cè)法,檢測(cè)多幅圖像的角點(diǎn)并進(jìn)行匹配,從而計(jì)算出真實(shí)場(chǎng)景中物體的景深,最終實(shí)現(xiàn)定位。
(3)運(yùn)動(dòng)目標(biāo)的序列圖像:根據(jù)序列圖像估算運(yùn)動(dòng)目標(biāo)的各項(xiàng)參數(shù)。
(4)模板匹配法:從多個(gè)視角出發(fā)尋找真實(shí)圖像中的物體作為模板數(shù)字化圖像,繼而將虛擬物體疊加到真實(shí)場(chǎng)景。
3.3 虛實(shí)融合技術(shù)
增強(qiáng)現(xiàn)實(shí)技術(shù)中的虛擬融合主要指虛擬物體在真實(shí)場(chǎng)景中的配準(zhǔn),以及虛擬物體與真實(shí)場(chǎng)景的一致性。
在增強(qiáng)現(xiàn)實(shí)系統(tǒng)的實(shí)現(xiàn)過(guò)程中,一致性是一個(gè)關(guān)鍵性問(wèn)題。虛實(shí)融合的一致性包括動(dòng)態(tài)一致性和靜態(tài)一致性。其中,動(dòng)態(tài)一致性通常指場(chǎng)景的實(shí)時(shí)繪制,跟蹤過(guò)程中虛擬物體和真實(shí)場(chǎng)景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實(shí)場(chǎng)景外觀的一致性變化等。
另一方面,為了實(shí)現(xiàn)很好的虛實(shí)融合效果,必須對(duì)拍攝真實(shí)場(chǎng)景的相機(jī)進(jìn)行標(biāo)定,并與繪制虛擬物體的虛擬相機(jī)參數(shù)進(jìn)行匹配。攝像機(jī)標(biāo)定主要是對(duì)攝像機(jī)的內(nèi)外參數(shù)的確定。目前,攝像機(jī)標(biāo)定技術(shù)已經(jīng)較為成熟,主要可以分為三類(lèi):傳統(tǒng)的標(biāo)定法,如張正友標(biāo)定法;自標(biāo)定法,如基于Kruppa方程的自標(biāo)定法;基于主動(dòng)視覺(jué)的標(biāo)定法,如基于射影重建的標(biāo)定法。三類(lèi)標(biāo)定法各有利弊,并沒(méi)有一種可以普遍適用,因此攝像機(jī)標(biāo)定技術(shù)仍是一個(gè)研究重點(diǎn)。
3.4 用戶(hù)交互技術(shù)
人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強(qiáng)現(xiàn)實(shí)系統(tǒng)根據(jù)跟蹤定位獲得的有關(guān)真實(shí)場(chǎng)景的信息對(duì)虛擬物體發(fā)出指令。目前,交互技術(shù)主要使用以下三種方式:
(1)在場(chǎng)景中選擇一個(gè)或多個(gè)特征點(diǎn)作為標(biāo)記點(diǎn),這是增強(qiáng)現(xiàn)實(shí)系統(tǒng)中最基本的交互方式。
(2)使用計(jì)算機(jī)識(shí)別出人或物體的姿態(tài),進(jìn)而交互操作。
(3)制作特殊工具,能夠通過(guò)按鍵等簡(jiǎn)單方式觸發(fā)事件。
4 結(jié)束語(yǔ)
本文總結(jié)了現(xiàn)階段增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用領(lǐng)域,并對(duì)其涉及到的關(guān)鍵技術(shù)進(jìn)行了闡述。增強(qiáng)現(xiàn)實(shí)技術(shù)作為一個(gè)多學(xué)科交叉的研究領(lǐng)域,必將飛速發(fā)展,更多的融入到我們的生活中。
參考文獻(xiàn):
[1]紀(jì)慶革,潘志庚,李祥晨.虛擬現(xiàn)實(shí)在體育體育仿真中的應(yīng)用綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(11):1333-1338.
[2]陳靖,王涌天,閆達(dá)遠(yuǎn).增強(qiáng)現(xiàn)實(shí)系統(tǒng)及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2001,15:72-75.
[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.
【關(guān)鍵詞】機(jī)器視覺(jué);VisionPro;識(shí)別定位;
1.引言
自20世紀(jì)80年代以來(lái),機(jī)器視覺(jué)技術(shù)開(kāi)始高速發(fā)展,已經(jīng)從實(shí)驗(yàn)室走向了人們生產(chǎn)生活的各個(gè)方面。機(jī)器視覺(jué)系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。在一些不適合于人工作業(yè)的危險(xiǎn)工作環(huán)境或人工視覺(jué)難以滿(mǎn)足要求的場(chǎng)合,常用機(jī)器視覺(jué)來(lái)替代人工視覺(jué);同時(shí)在大批量工業(yè)生產(chǎn)過(guò)程中用機(jī)器視覺(jué)檢測(cè)方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。而且機(jī)器視覺(jué)易于實(shí)現(xiàn)信息集成,是實(shí)現(xiàn)計(jì)算機(jī)集成制造的基礎(chǔ)技術(shù)。現(xiàn)今,在機(jī)器視覺(jué)領(lǐng)域已經(jīng)有了一些成熟的視覺(jué)開(kāi)發(fā)軟件,其封裝了很多可靠、高效的算法和工具。本文選用美國(guó)康耐視公司的VisionPro軟件,這是一套基于PC架構(gòu)的視覺(jué)系統(tǒng)軟件開(kāi)發(fā)包,主要應(yīng)用于各種復(fù)雜的機(jī)器視覺(jué)領(lǐng)域。它集成了用于定位、檢測(cè)、識(shí)別和通訊等任務(wù)的工具庫(kù),可用C#、VB和VC等語(yǔ)言進(jìn)行二次開(kāi)發(fā)。本文基于VisionPro利用語(yǔ)言進(jìn)行視覺(jué)定位系統(tǒng)的軟件開(kāi)發(fā)[1]。
2.視覺(jué)定位系統(tǒng)
2.1 硬件組成
在圖像處理前首先要得到清晰、有效的圖像,這就需要有一套完整的硬件設(shè)備。一般主要包括照明用的光源、調(diào)節(jié)圖像清晰度的鏡頭、將圖像轉(zhuǎn)換為數(shù)字信號(hào)的攝像機(jī)和進(jìn)行圖像處理的計(jì)算機(jī)。其中攝像機(jī)與計(jì)算機(jī)之間的接口也比很重要的,主要分為IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆網(wǎng)三種[2]。
本視覺(jué)系統(tǒng)采用的是日本FUJINON工業(yè)攝像頭,德國(guó)BASLER工業(yè)像機(jī)ACA1600-20GM,GigE千兆網(wǎng)接口。
2.2 基于VisionPro的軟件開(kāi)發(fā)
本視覺(jué)定位系統(tǒng)利用編寫(xiě)適合實(shí)驗(yàn)需要的界面,界面中只包含需要的操作功能和數(shù)據(jù),使整個(gè)界面看起來(lái)更加清楚簡(jiǎn)單,操作起來(lái)更方便。
(1)圖像采集
本視覺(jué)系統(tǒng)通過(guò)GigE千兆網(wǎng)作為接口控制相機(jī)進(jìn)行圖像采集。打開(kāi)軟件并連接相機(jī),設(shè)置好參數(shù)后,就可以通過(guò)可視化工具Image Source直接獲取圖像。
(2)相機(jī)的標(biāo)定
機(jī)器視覺(jué)的基本任務(wù)之一是從攝像機(jī)獲取的圖像信息出發(fā)計(jì)算三維空間中物體的幾何信息,并由此重建和識(shí)別物體。空間物體表面某點(diǎn)的三維幾何位置與其在圖像中對(duì)應(yīng)點(diǎn)之間的相互關(guān)系是由攝像機(jī)成像的幾何模型決定的,這些幾何模型參數(shù)就是攝像機(jī)參數(shù)。在大多數(shù)條件下,這些參數(shù)必須通過(guò)實(shí)驗(yàn)與計(jì)算才能得到,這個(gè)過(guò)程被稱(chēng)為攝像機(jī)標(biāo)定[3]。
本文利用VisionPro的CalibChecker-boardTool工具進(jìn)行攝像機(jī)標(biāo)定。首先需要一個(gè)棋盤(pán)板,棋盤(pán)板必須滿(mǎn)足以下條件:必須由大小相同的黑白格子交替組成;格子最好是正方形,如果達(dá)不到的話(huà),格子長(zhǎng)寬比也要在0.9和1.0之間。本系統(tǒng)采用康耐視公司提供的標(biāo)準(zhǔn)棋盤(pán)板進(jìn)行標(biāo)定[4,5]。圖1是標(biāo)定的結(jié)果。
(3)目標(biāo)識(shí)別與定位
視覺(jué)定位的目的就是找出目標(biāo)物的坐標(biāo)位置。本文利用VisionPro的PMAlignTool工具對(duì)目標(biāo)物體進(jìn)行識(shí)別定位。PMAlignTool工具是基于PatMax算法,該算法采用模板定位技術(shù)(pattern-location technology),先訓(xùn)練模板,然后根據(jù)模板對(duì)采集圖像進(jìn)行模板匹配,實(shí)現(xiàn)定位。在訓(xùn)練模板和定位過(guò)程中,PatMax不是基于像素柵格(Pixel grid)分析圖像,而是采用基于幾何外形(Features based)的定位方法,通過(guò)圖像的幾何特征信息和特征之間的空間位置關(guān)系進(jìn)行模板訓(xùn)練和匹配,使其能夠保證很高的精度和抗干擾性,而且可以高速定位發(fā)生旋轉(zhuǎn)、縮放、甚至拉伸形變的物體[1]。PMAlignTool工具定位的流程如圖2。
通過(guò)PMAlignTool工具對(duì)目標(biāo)物體識(shí)別定位后,利用VB調(diào)用該工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。這兩個(gè)值就是序號(hào)為i的目標(biāo)物在圖像上的X、Y坐標(biāo)值,其中i為識(shí)別的各個(gè)目標(biāo)物的序號(hào)。
3.實(shí)驗(yàn)
3.1 PatMax識(shí)別定位
在對(duì)攝像機(jī)完成標(biāo)定校正后,運(yùn)用自己編寫(xiě)的人機(jī)交互界面完成對(duì)目標(biāo)物體進(jìn)行識(shí)別定位,并將所需要的目標(biāo)位置坐標(biāo)顯示在界面上。同時(shí)又將識(shí)別到的所有目標(biāo)物體的坐標(biāo)信息保存到了文本文檔中,方便調(diào)用。主要操作如下:
(1)模型訓(xùn)練。實(shí)驗(yàn)以一元硬幣為目標(biāo)物,圖3為訓(xùn)練完成的模型。
(2)目標(biāo)識(shí)別定位。圖4是利用編寫(xiě)的界面,在圖像上能夠清楚的顯示出所識(shí)別出的目標(biāo)輪廓和形心位置,界面右方結(jié)果顯示區(qū)內(nèi)可以看到所識(shí)別的目標(biāo)數(shù)量和所需要的目標(biāo)物的坐標(biāo)。
3.2 對(duì)比實(shí)驗(yàn)
視覺(jué)定位可以用的軟件和工具包很多,其中應(yīng)用最廣泛的就是Opencv,它是一個(gè)基于(開(kāi)源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù),可以運(yùn)行在Linux、Windows和Mac OS操作系統(tǒng)上。它輕量級(jí)而且高效——由一系列 C 函數(shù)和少量 C++ 類(lèi)構(gòu)成,同時(shí)提供了Python、Ruby、MATLAB等語(yǔ)言的接口,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺(jué)方面的很多通用算法。為了驗(yàn)證PatMax算法定位的準(zhǔn)確性,本文利用Opencv對(duì)相同的圖像進(jìn)行目標(biāo)識(shí)別定位,對(duì)得到的效果圖和坐標(biāo)進(jìn)行對(duì)比[6]。如圖5所示,其中藍(lán)色為輪廓曲線,綠色十字為目標(biāo)形心。
圖6為VisionPro識(shí)別硬幣的效果圖,輪廓和形心均用綠色線標(biāo)識(shí)。對(duì)比兩圖可以看出VisionPro對(duì)輪廓的識(shí)別效果要更好一些。由于形心坐標(biāo)是由輪廓曲線上的點(diǎn)計(jì)算得到的,所以VisionPro獲得的形心坐標(biāo)值也會(huì)比Opencv的更加準(zhǔn)確,而且精確度更高。下表是兩種方法得到的形心坐標(biāo)。
4.結(jié)束語(yǔ)
本文基于VisionPro采用對(duì)其進(jìn)行開(kāi)發(fā),首先利用VisionPro中的工具進(jìn)行圖像的采集,攝像機(jī)的標(biāo)定,運(yùn)用PatMax算法進(jìn)行目標(biāo)物的識(shí)別與定位,然后運(yùn)用編寫(xiě)人機(jī)交互界面,可以更加方便快捷的得到所需要的目標(biāo)物坐標(biāo)值。本文利用Opencv對(duì)相同的圖像進(jìn)行目標(biāo)的識(shí)別定位,與VisionPro得到的結(jié)果進(jìn)行實(shí)驗(yàn)對(duì)比。結(jié)果證明基于VisionPro的視覺(jué)定位系統(tǒng)對(duì)目標(biāo)的識(shí)別效果更好,定位的數(shù)據(jù)更加準(zhǔn)確?;谠撥浖箲?yīng)用程序的開(kāi)發(fā)更加快速方便,得到的數(shù)據(jù)結(jié)果誤差較小,具有應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷機(jī)視覺(jué)定位系統(tǒng)[C].第十二屆中國(guó)體視學(xué)與圖像分析學(xué)術(shù)年會(huì)論文集,2008.
[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.機(jī)器視覺(jué)算法與應(yīng)用[M].楊少榮,吳迪靖,段德山,譯.北京:清華大學(xué)出版社,2008.
[3]邱茂林,馬頌德,李毅.計(jì)算機(jī)視覺(jué)中攝像機(jī)定標(biāo)綜述[J].自動(dòng)化學(xué)報(bào),2000,26(1):47-59.
[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.
[5]Cognex,VisionPro,Net Help,2006.
[6]Bradski G.,Kaehler A.著.學(xué)習(xí)OpenCV[M].于仁琪,劉瑞禎,譯.北京:清華大學(xué)出版社,2009.
作者簡(jiǎn)介:
韓慶瑤(1953—),男,華北電力大學(xué)教授。
張志遠(yuǎn)(1986—),男,華北電力大學(xué)能源動(dòng)力與機(jī)械工程學(xué)院碩士研究生。
關(guān)鍵詞:數(shù)據(jù)融合傳感器無(wú)損檢測(cè)精確林業(yè)應(yīng)用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時(shí)間和空間的觀測(cè)范圍,較強(qiáng)的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機(jī)器人、海洋監(jiān)視和管理、目標(biāo)跟蹤和慣性導(dǎo)航等領(lǐng)域。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對(duì)該技術(shù)在林業(yè)工程中的應(yīng)用及前景進(jìn)行了綜述。
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國(guó)國(guó)防部資助開(kāi)發(fā)的聲納信號(hào)理解系統(tǒng)中得到了最早的體現(xiàn)。
70年代末,在公開(kāi)的技術(shù)文獻(xiàn)中開(kāi)始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國(guó)國(guó)防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對(duì)多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計(jì),并完全能對(duì)態(tài)勢(shì)及帶來(lái)的威脅進(jìn)行實(shí)時(shí)評(píng)估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個(gè)框架里人們闡明如何使用特定的手段和工具來(lái)整合來(lái)自不同渠道的數(shù)據(jù),以獲得實(shí)際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強(qiáng)調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過(guò)數(shù)據(jù)融合后獲得的信息對(duì)用戶(hù)而言較融合前具有更高的滿(mǎn)意度,如可改善分類(lèi)精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開(kāi)發(fā)項(xiàng)目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個(gè)基本功能,人類(lèi)本能地將各感官獲得的信息與先驗(yàn)知識(shí)進(jìn)行綜合,對(duì)周?chē)h(huán)境和發(fā)生的事件做出估計(jì)和判斷。當(dāng)運(yùn)用各種現(xiàn)代信息處理方法,通過(guò)計(jì)算機(jī)實(shí)現(xiàn)這一功能時(shí),就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過(guò)對(duì)這些多傳感器及觀測(cè)信息的合理支配和使用,把多傳感器在空間或時(shí)間上的冗余或互補(bǔ)信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測(cè)對(duì)象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來(lái)自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。
(2)多傳感器ID/軌跡估計(jì)。假設(shè)多傳感器的報(bào)告反映的是同源目標(biāo),對(duì)這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對(duì)該目標(biāo)的估計(jì),或?qū)φ麄€(gè)當(dāng)前或未來(lái)情況的估計(jì)。
(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識(shí)狀態(tài),通過(guò)分配多個(gè)信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測(cè)、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識(shí)別、情況評(píng)估和預(yù)測(cè)。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個(gè)層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。其優(yōu)點(diǎn)是保持了盡可能多的原始信號(hào)信息,但是該種融合處理的信息量大、速度慢、實(shí)時(shí)性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。這種融合既保留了足夠數(shù)量的原始信息,又實(shí)現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實(shí)時(shí)處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯(cuò)性與可靠性有待進(jìn)一步改善。
(3)決策層融合。首先每一傳感器分別獨(dú)立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實(shí)質(zhì)是根據(jù)一定的準(zhǔn)則和每個(gè)決策的可信度做出最優(yōu)的決策。其優(yōu)點(diǎn)是數(shù)據(jù)通訊量小、實(shí)時(shí)性好,可以處理非同步信息,能有效地融合不同類(lèi)型的信息。而且在一個(gè)或幾個(gè)傳感器失效時(shí),系統(tǒng)仍能繼續(xù)工作,具有良好的容錯(cuò)性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個(gè)熱點(diǎn)。但是這種技術(shù)也有不足,如原始信息的損失、被測(cè)對(duì)象的時(shí)變特征、先驗(yàn)知識(shí)的獲取困難,以及知識(shí)庫(kù)的巨量特性等。
1.3處理模型
美國(guó)數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時(shí)僅應(yīng)用于軍事方面,但該模型對(duì)人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個(gè)模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫(kù)和人的先驗(yàn)知識(shí)等)。
源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計(jì)算負(fù)擔(dān),有時(shí)需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評(píng)估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對(duì)這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識(shí)。
態(tài)勢(shì)評(píng)估。根據(jù)當(dāng)前的環(huán)境推斷出檢測(cè)目標(biāo)與事件之間的關(guān)系,以判斷檢測(cè)目標(biāo)的意圖。威脅評(píng)估。結(jié)合當(dāng)前的態(tài)勢(shì)判斷對(duì)方的威脅程度和敵我雙方的攻擊能力等,這一過(guò)程應(yīng)同時(shí)考慮當(dāng)前的政治環(huán)境和對(duì)敵策略等因素,所以較為困難。
處理過(guò)程評(píng)估。監(jiān)視系統(tǒng)的性能,辨識(shí)改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計(jì)算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評(píng)價(jià)、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測(cè)定森林火點(diǎn)時(shí)的20、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強(qiáng)處理方法探測(cè)燃燒區(qū)火點(diǎn)的結(jié)果不理想。余啟剛運(yùn)用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見(jiàn)光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對(duì)火點(diǎn)位置的判斷準(zhǔn)確度。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測(cè)器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計(jì)算機(jī)獲得GPS接收機(jī)輸出的有關(guān)信息通過(guò)與RS實(shí)現(xiàn)高效互補(bǔ)性融合,從而彌補(bǔ)衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點(diǎn)信息準(zhǔn)確度和敏感性。
2.2森林蓄積特征的估計(jì)
HampusHolmstrom等在瑞典南部的試驗(yàn)區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用KNN(knearestneighbor)方法對(duì)森林的蓄積特征(林分蓄積、樹(shù)種組成與年齡)進(jìn)行了估計(jì)。
KNN方法就是采用目標(biāo)樣地鄰近k個(gè)(k=10)最近樣地的加權(quán)來(lái)估計(jì)目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對(duì)試驗(yàn)區(qū)的不同林分的蓄積特征進(jìn)行估計(jì),并對(duì)三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗(yàn)表明,融合后的數(shù)據(jù)作出的估計(jì)比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國(guó)5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費(fèi)大量的人力、物力和資金。國(guó)內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計(jì)方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對(duì)應(yīng)的GIS數(shù)據(jù)信息實(shí)現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認(rèn)為對(duì)森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用GPS對(duì)測(cè)點(diǎn)進(jìn)行定位,對(duì)特殊地區(qū)的攝像進(jìn)行拍攝,同時(shí)與對(duì)應(yīng)的GIS數(shù)據(jù)進(jìn)行融合,做出資源變化的估計(jì)或影像的修正。
試驗(yàn)表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費(fèi)少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時(shí)可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測(cè)中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長(zhǎng)的有機(jī)體,生長(zhǎng)過(guò)程中不可避免地有尖削度、彎曲度、節(jié)子等生長(zhǎng)缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強(qiáng)度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過(guò)程中,主要依靠人的肉眼來(lái)識(shí)別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識(shí)別起來(lái)非常困難,勞動(dòng)強(qiáng)度大,效率低,同時(shí)由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識(shí)別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開(kāi)發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識(shí)別和自動(dòng)剔除技術(shù),以解決集成材加工中節(jié)子人工識(shí)別誤差大、難以實(shí)現(xiàn)雙面識(shí)別、剔除機(jī)械調(diào)整時(shí)間長(zhǎng)等問(wèn)題。
3.1.2單一傳感器在木材檢測(cè)中的應(yīng)用
對(duì)木材及人造板進(jìn)行無(wú)損檢測(cè)的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動(dòng)、沖擊應(yīng)力波、快速傅立葉變換分析等檢測(cè)方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類(lèi)、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過(guò)程分析等。
隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,人們也將視覺(jué)傳感器應(yīng)用于木材檢測(cè)中。新西蘭科學(xué)家用視頻傳感器研究和測(cè)量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時(shí)準(zhǔn)確地測(cè)量單個(gè)纖維和全部纖維的幾何尺寸及其變化趨勢(shì),能夠區(qū)分不同紙漿類(lèi)型,測(cè)定木材纖維材料加固結(jié)合力,并動(dòng)態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。
新西蘭的基于視覺(jué)傳感器的板材缺陷識(shí)別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動(dòng)識(shí)別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實(shí)再現(xiàn)的計(jì)算機(jī)視覺(jué)識(shí)別功能,利用激光掃描儀自動(dòng)采集原木的三維幾何數(shù)據(jù)。
美國(guó)林產(chǎn)品實(shí)驗(yàn)室利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)木材刨花的尺寸大小進(jìn)行分級(jí),確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺(jué)傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測(cè),從而可以通過(guò)調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來(lái)提高定向刨花板的強(qiáng)度。
在制材加工過(guò)程中,利用計(jì)算機(jī)視覺(jué)技術(shù)在線實(shí)時(shí)檢測(cè)原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時(shí)可對(duì)鋸材的質(zhì)量進(jìn)行分級(jí),實(shí)現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過(guò)程中,利用計(jì)算機(jī)視覺(jué)技術(shù)在線實(shí)時(shí)檢測(cè)單板上的各種缺陷,實(shí)現(xiàn)單板的智能和自動(dòng)剪切,并可測(cè)量在剪切過(guò)程中的單板破損率,對(duì)單板進(jìn)行分等分級(jí),實(shí)現(xiàn)自動(dòng)化生產(chǎn)過(guò)程。Wengert等在綜合了大量的板材分類(lèi)經(jīng)驗(yàn)的基礎(chǔ)上,建立了板材分級(jí)分類(lèi)的計(jì)算機(jī)視覺(jué)專(zhuān)家系統(tǒng)。在國(guó)內(nèi)這方面的研究較少,王金滿(mǎn)等用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)刨花板施膠效果進(jìn)行了定量分析。
X射線對(duì)木材及木質(zhì)復(fù)合材料的性能檢測(cè)已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對(duì)木材密度、含水率、纖維素相對(duì)結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測(cè),并對(duì)木材內(nèi)部的各種缺陷進(jìn)行檢測(cè)。
3.1.3數(shù)據(jù)融合在木材檢測(cè)中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項(xiàng)技術(shù)在應(yīng)用上存在一定的局限性。如視覺(jué)傳感器不能檢測(cè)到有些與木材具有相同顏色的節(jié)子,有時(shí)會(huì)把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時(shí)也會(huì)受到木材的種類(lèi)或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測(cè)部分表面缺陷,而無(wú)法檢測(cè)到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測(cè)量密度及內(nèi)部特征,但是它們不能測(cè)定木材的顏色和瑕疵,因?yàn)檫@些缺陷的密度往往同木板相同。因此,一個(gè)理想的檢測(cè)系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測(cè)到木材的缺陷。
基于多傳感器(機(jī)器視覺(jué)及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測(cè),可以集成多個(gè)傳統(tǒng)單項(xiàng)技術(shù),更可靠、準(zhǔn)確地實(shí)時(shí)檢測(cè)出木材表面的各種缺陷,為實(shí)現(xiàn)木材分級(jí)自動(dòng)化、智能化奠定基礎(chǔ),同時(shí)為集裁除鋸、自動(dòng)調(diào)整、自動(dòng)裁除節(jié)子等為一身的新型視頻識(shí)別集成材雙面節(jié)子數(shù)控自動(dòng)剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國(guó)華盛頓大學(xué)研究人員開(kāi)展了樹(shù)形自動(dòng)分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實(shí)驗(yàn)站與有關(guān)公司合作開(kāi)展用GPS和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。
目前單項(xiàng)的GPS、RS、GIS正從“自動(dòng)化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個(gè)多組分的復(fù)雜系統(tǒng),是由能量流動(dòng)、物質(zhì)循環(huán)、信息流動(dòng)所推動(dòng)的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計(jì)算機(jī)集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時(shí)間上的質(zhì)的差異及空間數(shù)據(jù)類(lèi)型的多樣性,如地理統(tǒng)計(jì)數(shù)據(jù)、柵格數(shù)據(jù)、點(diǎn)數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個(gè)高效、柔性和開(kāi)放的體系,從而實(shí)現(xiàn)林業(yè)生產(chǎn)的標(biāo)準(zhǔn)化、規(guī)范化、開(kāi)放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時(shí)空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實(shí)現(xiàn)基于自然界生物及其所賴(lài)以生存的環(huán)境資源的時(shí)空變異性的客觀現(xiàn)實(shí),以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標(biāo),建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻(xiàn)]
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)