公務(wù)員期刊網(wǎng) 精選范文 計算機視覺技術(shù)范文

計算機視覺技術(shù)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺技術(shù)主題范文,僅供參考,歡迎閱讀并收藏。

計算機視覺技術(shù)

第1篇:計算機視覺技術(shù)范文

關(guān)鍵詞:增強現(xiàn)實;計算機視覺;三維注冊

中圖分類號:TP242 文獻標識碼:A 文章編號:1007-9599?。?012) 19-0000-02

1 引言

隨著計算機技術(shù)的迅速發(fā)展,計算機視覺、虛擬現(xiàn)實技術(shù)、人工智能、計算機圖形學(xué)等技術(shù)被廣泛地研究和應(yīng)用,這些技術(shù)引導(dǎo)著人們進入了一個信息數(shù)字化的虛擬時代。

增強現(xiàn)實技術(shù)(Augmented Reality,AR)作為虛擬現(xiàn)實技術(shù)和計算機圖形學(xué)相結(jié)合的產(chǎn)物,它是在通過計算機渲染生成虛擬的物體或文字信息模型的同時,對真實的場景進行標定,從而使虛擬的物體能夠被準確地放置到真實的場景中,最終通過顯示設(shè)備顯示出來,使用戶處于虛擬和現(xiàn)實相融合的亦真亦幻的新環(huán)境中,無法清楚地分辨出真實和虛擬。增強現(xiàn)實技術(shù)增強了用戶的觀感及其與真實場景之間的交互。

增強現(xiàn)實技術(shù)作為虛擬現(xiàn)實的一個重要分支,是虛擬現(xiàn)實技術(shù)發(fā)展過程中的產(chǎn)物。如圖1.1所示,該圖為Milgram提出的增強現(xiàn)實和虛擬現(xiàn)實關(guān)系的一種分類學(xué)表示方法。由圖我們可以看出,虛擬現(xiàn)實所創(chuàng)建出來的是一種完全虛擬的三維世界,它與真實的世界相隔離。而增強現(xiàn)實是以現(xiàn)實場景為基礎(chǔ),場景中的虛擬物體隨著真實物體的變化而變化,提供給用戶的是一種復(fù)合的視覺效果,就好像這些虛擬物體真實的存在于場景中。

2 增強現(xiàn)實技術(shù)的應(yīng)用

增強現(xiàn)實技術(shù)在20世紀90年代真正興起,其發(fā)展與20世紀60年代計算機圖形學(xué)的迅速發(fā)展密不可分。增強現(xiàn)實技術(shù)不僅擁有虛擬現(xiàn)實的各種優(yōu)點,同時又有其獨特的視覺增強功能,因此成為了國內(nèi)外研究機構(gòu)和知名大學(xué)的研究熱點,并廣泛的被應(yīng)用于教育、醫(yī)療、工業(yè)、娛樂、軍事等多個領(lǐng)域。

2.1 教育

增強現(xiàn)實豐富了教育學(xué)習生活。傳統(tǒng)的書籍中只存在文字信息,通過增強現(xiàn)實技術(shù),我們可以透過書籍看見文字相關(guān)的動態(tài)畫面或是影像,圖文并茂,極大的增強了學(xué)生的學(xué)習興趣。目前的魔法書系統(tǒng)就是這一技術(shù)的很好運用,用戶通過頭盔顯示器可以看到書中描述的場景,使讀者可以完全沉浸在虛實結(jié)合的環(huán)境中,提高學(xué)習興趣和效率。

2.2 醫(yī)療

增強現(xiàn)實技術(shù)可以幫助醫(yī)生實現(xiàn)可視化手術(shù)或手術(shù)培訓(xùn)。準確地定位真實場景是增強現(xiàn)實技術(shù)的一個重要方面,在醫(yī)療中,運用增強現(xiàn)實技術(shù)可以進行手術(shù)定位,實時地收集病人體內(nèi)的3D影像,并將其與真實的人體相結(jié)合,使得醫(yī)生可以“透視”病人體內(nèi),從而減少手術(shù)的風險,該技術(shù)對微創(chuàng)手術(shù)也有著深遠的意義。手術(shù)培訓(xùn)方面,通過加入虛擬的提示注解,可以提醒醫(yī)生手術(shù)中的一些必要步驟,降低手術(shù)風險。

2.3 工業(yè)

增強現(xiàn)實的另一個應(yīng)用是工業(yè)組裝和維修。通過增強現(xiàn)實技術(shù)可以顯示出各種設(shè)備零件的內(nèi)部結(jié)構(gòu)圖、使用說明等,方便安裝和維修。顯示的內(nèi)容可以不僅僅是簡單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來,方便操作。

2.4 娛樂

電影、廣告、游戲、體育比賽轉(zhuǎn)播中,增強現(xiàn)實技術(shù)也得到了廣泛的運用。體育比賽中,能夠在直播現(xiàn)場實時地插入三維的圖形、動畫、視頻等虛擬的比賽相關(guān)信息或廣告。日常生活中,出現(xiàn)一種增強現(xiàn)實瀏覽器,它利用多種傳感器將日常需求通過實景與虛景結(jié)合后呈現(xiàn)在用戶面前,用戶可以通過增強現(xiàn)實瀏覽器看到實景的文字介紹、三維模型等,并可以搜索定位。

3 增強現(xiàn)實相關(guān)技術(shù)

增強現(xiàn)實系統(tǒng)具有虛實結(jié)合、三維注冊、實時交互三個特點。三個特點之間緊密聯(lián)系,要求在合成的場景中虛擬的物體能夠擁有真實的存在感和位置感。因此顯示技術(shù)、定位技術(shù)、虛實融合技術(shù)、用戶交互技術(shù)是實現(xiàn)增強現(xiàn)實系統(tǒng)的基礎(chǔ)支撐技術(shù)。

3.1 顯示技術(shù)

理想的AR系統(tǒng)的顯示器具有體積小、移動方便、圖像繪制清晰、交互自然等特點,但是目前仍不能制造出完成符合這些特點的顯示器。常用的顯示設(shè)備可以分為四類:普通液晶現(xiàn)實器;頭戴式顯示器;手持式顯示器;投影式顯示器。

液晶顯示器是最為常見,也最容易得到的顯示設(shè)備。但是液晶顯示器體積較大,移動不方便,限制了用戶的活動范圍。頭戴式顯示器,佩戴于用戶的頭部,這種顯示器本身提供了一路或兩路攝像機,采用視頻合成技術(shù),為用戶提供場景的顯示。但是頭戴式顯示器在戶外長時間佩戴很不舒服,因此也不能為用戶廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進,但是也限制了用戶手部的活動。投影式顯示器能夠?qū)鼍巴队暗捷^大范圍的環(huán)境中,位置固定,適合于室內(nèi)的AR系統(tǒng)。

3.2 定位技術(shù)

增強現(xiàn)實系統(tǒng)需要將虛擬的物體準確地放置到真實的場景中,因此定位技術(shù)顯得尤為重要。目前的定位技術(shù)主要分為兩種:一種是基于硬件的定位技術(shù);一種是基于計算機視覺技術(shù)的定位技術(shù)。

基于硬件的定位技術(shù)一般使用硬件設(shè)備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測距儀、導(dǎo)航儀、機械裝置等。

基于計算機視覺的定位技術(shù)一般是從真實場景中獲得一幅或多幅圖像,根據(jù)圖像中的信息,計算出攝像機和圖形中物體的相對信息,最終恢復(fù)出三維場景的結(jié)構(gòu),從而達到定位的目的。

基于計算機視覺的定位技術(shù)主要包括以下幾種:

(1)單視圖法:在一幅圖像中找到六個以上特征點進行跟蹤,通過已知的特征點的三維坐標和其成像坐標進行定位。

(2)多視圖法:從多個角度拍攝場景,根據(jù)常用的角點檢測法,檢測多幅圖像的角點并進行匹配,從而計算出真實場景中物體的景深,最終實現(xiàn)定位。

(3)運動目標的序列圖像:根據(jù)序列圖像估算運動目標的各項參數(shù)。

(4)模板匹配法:從多個視角出發(fā)尋找真實圖像中的物體作為模板數(shù)字化圖像,繼而將虛擬物體疊加到真實場景。

3.3 虛實融合技術(shù)

增強現(xiàn)實技術(shù)中的虛擬融合主要指虛擬物體在真實場景中的配準,以及虛擬物體與真實場景的一致性。

在增強現(xiàn)實系統(tǒng)的實現(xiàn)過程中,一致性是一個關(guān)鍵性問題。虛實融合的一致性包括動態(tài)一致性和靜態(tài)一致性。其中,動態(tài)一致性通常指場景的實時繪制,跟蹤過程中虛擬物體和真實場景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實場景外觀的一致性變化等。

另一方面,為了實現(xiàn)很好的虛實融合效果,必須對拍攝真實場景的相機進行標定,并與繪制虛擬物體的虛擬相機參數(shù)進行匹配。攝像機標定主要是對攝像機的內(nèi)外參數(shù)的確定。目前,攝像機標定技術(shù)已經(jīng)較為成熟,主要可以分為三類:傳統(tǒng)的標定法,如張正友標定法;自標定法,如基于Kruppa方程的自標定法;基于主動視覺的標定法,如基于射影重建的標定法。三類標定法各有利弊,并沒有一種可以普遍適用,因此攝像機標定技術(shù)仍是一個研究重點。

3.4 用戶交互技術(shù)

人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強現(xiàn)實系統(tǒng)根據(jù)跟蹤定位獲得的有關(guān)真實場景的信息對虛擬物體發(fā)出指令。目前,交互技術(shù)主要使用以下三種方式:

(1)在場景中選擇一個或多個特征點作為標記點,這是增強現(xiàn)實系統(tǒng)中最基本的交互方式。

(2)使用計算機識別出人或物體的姿態(tài),進而交互操作。

(3)制作特殊工具,能夠通過按鍵等簡單方式觸發(fā)事件。

4 結(jié)束語

本文總結(jié)了現(xiàn)階段增強現(xiàn)實技術(shù)的應(yīng)用領(lǐng)域,并對其涉及到的關(guān)鍵技術(shù)進行了闡述。增強現(xiàn)實技術(shù)作為一個多學(xué)科交叉的研究領(lǐng)域,必將飛速發(fā)展,更多的融入到我們的生活中。

參考文獻:

[1]紀慶革,潘志庚,李祥晨.虛擬現(xiàn)實在體育體育仿真中的應(yīng)用綜述[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2003,15(11):1333-1338.

[2]陳靖,王涌天,閆達遠.增強現(xiàn)實系統(tǒng)及其應(yīng)用[J].計算機工程與應(yīng)用,2001,15:72-75.

[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.

第2篇:計算機視覺技術(shù)范文

【關(guān)鍵詞】視頻跟蹤 手部識別

1 引言

計算機從誕生至今,其輸入設(shè)備從最初的機電開關(guān),逐漸發(fā)展為打孔紙帶、磁帶,再到今天的鍵盤、鼠標和游戲手柄,向計算機輸入數(shù)據(jù)的效率越來越高,但方法的本質(zhì)并未改變,都要將自然信息通過機械式方式輸入計算機。這些方式都是基于2D的圖形界面,將用戶的操作限制于特定的外部設(shè)備上,無法實現(xiàn)自然而隨意的人機交互。長時間使用,會使用戶感到疲憊,導(dǎo)致用戶體驗下降。

對于用戶來說,人的語音、手勢等可以說是最為自然、最為方便的交流手段,同時手勢在3D環(huán)境中意義明確、方向精確,是極好的人機交互手段。許多大型互聯(lián)網(wǎng)公司與游戲公司早就對此進行了探索。微軟,索尼,任天堂等公司有著自己研發(fā)的外部設(shè)備,如游戲手套和傳感器等,以此來捕捉并記錄手部的運動軌跡,實現(xiàn)特定的操作乃至體感游戲。但這類外部設(shè)備的缺陷也是很明顯的:這類設(shè)備一般為機械傳感器式或光纖傳感器式,帶有傳感器、機械部件甚至用來與主機連接的電纜等,沉重、累贅、不靈活;且通常價格昂貴、極易損壞,用戶體驗不佳;更重要的是限制于特定平臺,不具備通用性,普及度不高。

若能實現(xiàn)基于計算機視覺技術(shù)的手勢識別及操作系統(tǒng),不僅可以將我們的雙手從特定外部設(shè)備上解放出來,使操作更加輕松、隨意,還能獲得更好的人機交互體驗,推動“虛擬現(xiàn)實”的研究。目前已經(jīng)有了大量的跟蹤算法和相關(guān)設(shè)別,如微軟的Kinect攝像頭及最新的Hololens頭盔已經(jīng)能達到很好的效果,但都較為復(fù)雜。因此本文研究一種簡單通用的基于計算機視覺的手部跟蹤算法。

2 手部區(qū)域提取

2.1 樣本采集

為了保證研究的順利進行,首先需要采集手部樣本圖片。為保證實驗結(jié)果的準確性,樣本圖片數(shù)量最好在100張以上,并記錄不同姿態(tài),其中男性樣本和女性樣本的數(shù)量保持相等。

2.2 膚色信息分析

膚色信息近似為皮膚的顏色信息,物體表面的顏色即表面色是因光照而呈現(xiàn)的顏色[6]。我們采用RGB顏色模型對手部表面膚色進行分析,發(fā)現(xiàn)膚色處于某個范圍之內(nèi)。方法如下:手動提取樣本圖像中的手部,對其進行RGB顏色分量統(tǒng)計,得到各分量直方圖。由于各分量直方圖上手部體現(xiàn)為一個近似波峰,所以可取波峰的半峰全寬(Full Width at Half Maxium)作為手部的膚色閾值。

根據(jù)膚色閾值提取手部,設(shè)HandSkin表示膚色閾值范圍,RGB(m, n)表示點(m, n)處的顏色信息,而bw(m, n)代表該點是否是手部,則:

2.3 模式識別

通過膚色信息初步提取手部后,可能會有孤立的局部點集出現(xiàn)。為此,統(tǒng)計所有互相連接的點集,提取點集對應(yīng)的幾何特征,建立規(guī)則來選取符合手部的點集。

幾何特征一般包括面積、周長、重心等。而手部可以分為手掌和手指部分,手掌形狀近似于橢圓,手指為細長的柱體,因此整個手部的周長面積比會與其他物體有所區(qū)分,所以根據(jù)周長面積比將手部從背景中提取出來:

面積:指物體區(qū)域包含的像素數(shù),用符號s表示。

周長:物體輪廓線上像素間距離之和,用符號c表示。在進行周長計算時,需根據(jù)像素間的連接方式,分別計算距離。像素間距離可分為并列連接像素與傾斜連接像素。并列有上下左右四個方向,像素間距離為1;傾斜方向有左上、左下、右上、右下,其像素間距離等于單位正方體的對角線長度。本文中先獲取二值圖像的邊緣信息,再使用8向鏈碼求周長。

周長面積比:用r表示,r = c/s。

求得所有樣本的面積周長比后,通過統(tǒng)計建立規(guī)則,并排除異常數(shù)據(jù)。設(shè)h表示點集,hand表示手部,handrule表示手部點集所必需滿足的規(guī)則,noise表示噪聲,s.t.表示滿足,則最終的手部點集為:

3 手部跟蹤

基于計算機視覺的手部跟蹤算法具體步驟:

步驟1:第一幀圖像預(yù)處理。根據(jù)上文所述方法進行第一幀的初始化。通過膚色信息和面積周長比特征提取出第一幀圖像中的手。為了方便描述手的運動軌跡,用幾何圖形來近似表示手部區(qū)域,本文選用包圍手部區(qū)域的最小橢圓來表示手部,該橢圓的中心O1表示手部中心點。

步驟2:依次掃描視頻的每一幀。對于第n幀,由于相鄰幀的時間相隔較短,手部不會有太大位移。根據(jù)上一幀手部區(qū)域的位置,設(shè)置該幀的掃描范圍。通過第2章方法,得出當前幀手部的中心點On。不斷重復(fù)算法直至視頻結(jié)束。

步驟3:描繪運動軌跡。從視頻最后一幀的中心點On開始,逆序依次連接On與On-1,直至視頻第一幀的中心點O1,得到完整的手部運動軌跡。

4 結(jié)論

本文所提出的以手部膚色信息為基礎(chǔ)的手部跟蹤算法,工程實現(xiàn)上較為簡答,算法效率高,經(jīng)試驗測試,能夠較為準確地再現(xiàn)手部運動軌跡。同時,該種方法也具有缺點,在手部快速移動或做復(fù)雜運動時,算法所描繪的運動軌跡可能會出現(xiàn)斷裂,且該算法對光照敏感,在過強或過弱光照條件下,算法的準確性都會受到影響。今后的工作將繼續(xù)完善本算法,將嘗試以HSI顏色模型進行分析,考慮引入手部紋理與邊緣信息,減弱算法的光照敏感性,采用專家系統(tǒng)、智能優(yōu)化、神經(jīng)網(wǎng)絡(luò)、特征降維等高級技術(shù)。

參考文獻

[1]俞烈彬,孟凡文.武器裝備系統(tǒng)中的人機交互新技術(shù)[J].電子世界,2013(12): 164-165.

[2]孟艷麗,郭建.二語演講中手勢功能的實證分析[J].河南科技大學(xué)學(xué)報(社會科學(xué)版),2014,32(3):62-67.

[3]劉晉鋼,劉衛(wèi)斌,劉晉霞.Kinect與Unity3D數(shù)據(jù)整合技術(shù)在體感游戲中的應(yīng)用研究[J].電腦開發(fā)與應(yīng)用,2014, 27(11):7-14.

[4]張蓬,王曉沖,陳建義.多自由度機械臂的虛擬現(xiàn)實仿真實現(xiàn)[J].機械設(shè)計與制造,2015(01):128-134.

[5]閆慶森,李臨生,徐曉峰,等.視頻跟蹤算法研究綜述[J].計算機科學(xué),2013, 40(6A):204-209.

[6]奚吉,趙曉鈴,張煜東.改進的沃爾什濾波的圖像插值算法[J].計算機工程, 2010,36(22):211-213.

[7]張煜東,吳樂南,王水花.專家系統(tǒng)發(fā)展綜述[J].計算機工程與應(yīng)用,2010, 46(19):43-47.

[8]王水花,張煜東,吉根林.群智能算法的理論及應(yīng)用綜述[J].南京師范大學(xué)學(xué)報(工程技術(shù)版),2014,14(4):31-38.

[9]張煜東,吳樂南,韋耿.神經(jīng)網(wǎng)絡(luò)泛化增強技術(shù)研究[J].科學(xué)技術(shù)與工程,2009(17):4997-5002.

[10]張煜東,霍元鎧,吳樂南,等.降維技術(shù)與方法綜述[J].四川兵工學(xué)報,2010, 31(10):1-7.

作者簡介

羅偉,男,江西省景德鎮(zhèn)市人?,F(xiàn)供職于南京師范大學(xué)計算機科學(xué)與技術(shù)學(xué)院。研究方向為手勢跟蹤。

通訊作者

張煜東,男,江蘇省南京市人。博士學(xué)位。現(xiàn)為南京師范大學(xué)計算機科學(xué)與技術(shù)學(xué)院教授。研究方向為圖像處理。

作者單位

第3篇:計算機視覺技術(shù)范文

誕生于20世紀40年代的電子計算機是人類最偉大的發(fā)明之一。并且一直以飛快的速度發(fā)展著。進入21世紀的現(xiàn)代社會,計算機已經(jīng)進入各個行業(yè),并成為各行業(yè)必不可少的工具。如今的計算機發(fā)展的更加智能化,就如今來說,人們最什么事情都非常重視信息,人類和社會的發(fā)展,時刻都離不開信息。計算機如今重視的方面就是對信息的閱讀和控制,人臉檢測與識別技術(shù)也是應(yīng)運而生。

人臉識別的論述

人臉識別是人類視覺中的一大特色,因為能對身邊的人進行識別,才不會對身邊的信息進行混淆,簡單來說,根據(jù)人臉可以對人的年齡,性別進行初步判斷。隨著計算機技術(shù)的智能化,計算機業(yè)已經(jīng)通過視覺能進行人臉的識別。其中在對人臉識別的同時進行有關(guān)信息的收集、識別、提取、變換、存儲、傳遞、處理、檢索、檢測、分析和利用等技術(shù)。如今人臉識別已經(jīng)應(yīng)用于很多的領(lǐng)域,但是要人臉檢測與識別是需要基于本來已經(jīng)收集和整理的信息本庫才能進行。再加上現(xiàn)在計算機技術(shù)雖然已經(jīng)接近成熟,然而在人臉識別方面的表情傳達出什么信息還是無從下手進行編程和設(shè)計。所以,基于計算機視覺的人臉檢測與識別技術(shù)還是會有很廣的發(fā)展空間,再加上人臉識別還可以維護人們的財產(chǎn)安全和隱私保護,必然會引起社會各界人士的廣泛關(guān)注。

從19世紀末開始就已經(jīng)有人對人臉識別進行了研究,因為當時沒有先進的科學(xué)技術(shù)做后盾,所以經(jīng)過了數(shù)百年的研究仍然沒有什么顯著的進展和成果。直到20世紀90年代人臉識別才成立了自己的學(xué)科,在加上當時的科技發(fā)展水平已經(jīng)達到了不錯的水平,人臉識別這個學(xué)科得到了快速的發(fā)展。如今,我國的計算機技術(shù)也已經(jīng)居于世界的前列,我國也已經(jīng)擁有比較完善的一套東方面孔的人臉數(shù)據(jù)庫。

人臉識別在發(fā)展過程中大概經(jīng)歷了三個階段:第一階段就是對人臉特征進行整理,整理出所需要的數(shù)據(jù)庫,并且應(yīng)用當時的計算機技術(shù)做出一套質(zhì)量不錯的人臉灰度模型,這個階段的識別工作全部由操作人員來完成;第二階段比第一階段要先進,有了基礎(chǔ)人機互交,將人臉的特征經(jīng)過多維度的矢量在模型上表示出來,并也可以設(shè)計出一套人臉識別的系統(tǒng),這個階段的識別不再是僅僅依靠操作人員,而是操作者和計算機一起完成;第三個階段是計算機智能識別的最高峰,一切操作和識別都依靠機器全自動化進行,在人臉識別過程中也不再是每臺計算機都需要完成一整套的工作,也實現(xiàn)了計算機與計算機之間的互聯(lián),多臺計算機一起完成人臉識別的過程,都人力也是一種解放。

積極踐行人臉檢測識別技術(shù)

人臉檢測識別技術(shù)是計算機實現(xiàn)智能化特征后的又一重要發(fā)展方向之一,它已經(jīng)在世界范圍內(nèi)得到了廣泛的普及與應(yīng)用。人們可以通過人臉識別來進行定位,來起到保護人們財產(chǎn)安全的作用,通過人臉識別來抵制社會中的造假率,之前曾經(jīng)有一些不法分子利用假身份來做損害公共利益和侵犯人們隱私權(quán)的事情,有了人臉識別讓不法分子沒有可乘之機,也應(yīng)用人臉識別來對財務(wù)密碼進行聯(lián)系,起到對人們的財產(chǎn)有絕對的保護作用,對社會的安定何嘗不是一項有意義的發(fā)明。

人臉識別一直是計算機智能化發(fā)展過程中的一個重要領(lǐng)域,因為人臉的識別與檢測是一個很難做到完善的項目,由于人類的面部表情豐富,要對人類的面部表情做出判斷和分析會存在一定的困難。再加上人臉識別的過程中,每個獨立存在的個體都有一張專屬于自己的臉。它的輪廓沒有明顯的特征界限,同時對眼、鼻子、嘴等器官在臉上的分布情況也沒有明確的界限,這就使得對人臉識別來進行算法設(shè)計有一定的困難,所以只有通過輪廓特征來進行初步的判斷,分辯出各種器官,再根據(jù)器官來完成人臉的分布情況設(shè)計灰度模型的完成工作。

第4篇:計算機視覺技術(shù)范文

1 雙目立體視覺概述

雙目立體視覺又稱雙目視覺技術(shù),是目前計算機視覺應(yīng)用領(lǐng)域的重要研究內(nèi)容。雙目立體視覺控制系統(tǒng)的組成因其采用的原理和應(yīng)用功能的不同,組成也都各不相同。

雙目立體視覺的實現(xiàn)原理是基于人眼的視網(wǎng)膜看物體的特性,從兩個不同的方向來觀看同一個物體的不同角度,從而實現(xiàn)清楚的了解到物體的圖像的目的。雙目立體視覺從不同的角度獲得物體的投影信息,并根據(jù)匹配的結(jié)果,獲取同一個物體不同偏差位置的信息。最后在依據(jù)三角測量技術(shù),根據(jù)已經(jīng)獲得的這些偏差信息從而獲得這些不同點對應(yīng)的距離信息,并最終獲得這些實際物體的具體坐標位置信息。

視差測距技術(shù)告訴我們,要清楚的觀察到一個物體的全貌,需要兩個觀察物從不同的方向,或者固定一個觀察物,移動另外一個觀察物的方式,以達到拍攝同一個物體的目的。根據(jù)同一個物體在兩個觀察物當中的位置偏差,從而確定該物體的三維信息。一般來說,雙目立體視覺的組成包括:圖像獲取設(shè)備、圖像預(yù)處理設(shè)備、攝像機標定設(shè)備、立體匹配設(shè)備、根據(jù)二維信息實現(xiàn)三維重構(gòu)設(shè)備等五個重要設(shè)備。

2 雙目立體視覺技術(shù)的原理

立體畫又可以稱之為三維立體畫,是一種人們可以從三維立體圖中獲取二維平面圖信息的技術(shù)。三維立體圖表面看似毫無規(guī)則,但是假如通過一些特殊的技術(shù)或者通過合理的觀察手段和觀察設(shè)備,就可以看到一組秩序井然的美妙圖片。

三維立體圖是一組重復(fù)的二維圖片有序的堆積積累而成,因此可以呈現(xiàn)出立體效果。人體觀察物體的原理大致如下:當人類通過左右眼觀察所在的空間平面的時候,這些平面圖都只是一些毫無秩序的圖片。而當左右眼重新聚焦或者在觀察畫面的時候呈現(xiàn)一定的層次感,則人類的左右眼觀察到的一組重復(fù)案在經(jīng)過人體識別以后,這些畫面之間將存在一定的距離差異,從而在腦中生成立體感。

雙目立體視覺技術(shù)正是基于以上的原理,從兩個不同的方向去觀察物體,并獲得目標圖像的信息,并經(jīng)過一定的處理獲得三維重建的物體立體信息的技術(shù)。

雙目立體視覺在計算機技術(shù)中實現(xiàn)三維重建的大致流程

如下。

1)攝像機定位,并通過單片機計算得到要獲取圖像信息需要的外部的參數(shù)的大概值,并根據(jù)這些參數(shù)值設(shè)定攝像機。

2)用設(shè)定參數(shù)的攝像機拍攝目標場景的畫面,并采集這些畫面的二維圖的信息。

3)通過計算機技術(shù)實現(xiàn)雙目匹配,并判定采集畫面中的二維圖像中的不同點之間的對應(yīng)關(guān)系。

4)在第三步中若得到兩組二維圖像的關(guān)系是稠密的時候,則生成三維視差圖。如果不是則進一步采集圖片信息。

5)根據(jù)得到的視差圖最終實現(xiàn)場景的三維圖形的重建。

3 雙目立體匹配技術(shù)的研究難點和未來的發(fā)展方向

盡管目前有很多學(xué)者都投身到雙目立體匹配技術(shù)的研究和開發(fā)當中,直至目前為止也解決了很多關(guān)于視覺理論當中存在的很多缺陷問題。但是視覺問題是一個復(fù)雜且難以解決的問題,特別是在雙目立體匹配問題方面更是困難重重。立體匹配技術(shù)的難點已經(jīng)成為限制將雙目技術(shù)應(yīng)用到計算機技術(shù)當中的重要瓶頸。

立體匹配的主要手段就是找到計算機采集到兩幅和多副圖片的中像素的對應(yīng)關(guān)系,然后根據(jù)這些像素關(guān)系判定并生成三維重建圖。但是二維圖像的匹配存在層層困難,主要體現(xiàn)在以下幾個方面。

1)由于視角的問題或者觀察物體存在遮擋問題,導(dǎo)致采集回來的圖片信息存在盲點,這樣子更難找到圖片的匹配區(qū)域。

2)場景中的一些深度不連續(xù)的區(qū)域大都處在場景當中的邊界位置,這些位置容易出現(xiàn)像素不高,邊界不清晰等問題,這些問題也給圖像匹配帶了很多困擾。

3)場景當中的低紋理的圖片匹配特征和匹配關(guān)系較少,而且該位置的每個像素點極為相似。假如只是通過簡單的像素相似性檢測的話,會檢測到很多匹配結(jié)果,而這些匹配結(jié)果當中有一大部分是錯誤的。這樣子的結(jié)果勢必會導(dǎo)致最終的圖像匹配正確率極為低下。

從以上的分析,我們可以看出立體匹配技術(shù)存在很多技術(shù)上的難點,這些都在很大程度上限制雙目立體匹配技術(shù)在計算機當中的應(yīng)用發(fā)展。如何才能設(shè)計出有效、準確、快速、通用性強的立體匹配算法將會是以后雙目立體匹配計算發(fā)展的重要方向。也只有通過設(shè)計出一套行之有效的立體匹配算法才能使得雙目立體匹配技術(shù)在計算機視覺當中得到廣泛的應(yīng)用。

4 結(jié)束語

人們通過眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立體信息,分辨出觀察物的廣度和深度,以及物體的遠近。因此人類視覺感知系統(tǒng)就是一個雙目的立體感知系統(tǒng)。本文講述的計算機中的雙目立體匹配技術(shù)正是基于人眼視覺觀察物體的原理,通過雙目立體視覺原理,對計算機采集獲得兩幅二維圖像的信息進行分析,并結(jié)合計算機的分析,最終獲得同人類眼睛一樣觀察到物體三維表面信息的目的。雙目立體匹配技術(shù)與計算機技術(shù)的完美結(jié)合幫助人們可以更加輕易的獲得物體的信息。希望在不久的將來,可以將該項技術(shù)應(yīng)用于人類的視網(wǎng)膜當中,以幫助一些視網(wǎng)膜存在問題的人們,讓他們重新感受到光明,感受世間的溫暖。

參考文獻

[1]高文,陳熙霖.計算機視覺算法與系統(tǒng)原理[M].北京:清華大學(xué)出版社,2002.

[2]明祖衡.雙目立體視覺測距算法研究[M].北京:北京理工大學(xué),2008.

[3]劉昌,郭立,李敬文,劉俊,楊福榮,羅鋒.一種優(yōu)于SAD的匹配準則及其快速算法[J].電路與系統(tǒng)學(xué)報,2007,12(4):137-14.

[4]陳蛟.雙目立體匹配的算法研究及其多核并行化[M].南京:南京郵電大學(xué),2012.

第5篇:計算機視覺技術(shù)范文

【關(guān)鍵詞】計算機視覺技術(shù) 馬鈴薯外部品質(zhì) 檢測

隨著計算機技術(shù)的不斷發(fā)展,計算機視覺技術(shù)應(yīng)運而生并在工業(yè)自動化以及農(nóng)產(chǎn)品檢驗檢測等領(lǐng)域成功應(yīng)用。其中,將計算機視覺技術(shù)用于以自動化采集和品級分級為代表的果蔬商品化處理具有非常廣闊的發(fā)展空間。我國政府將“農(nóng)產(chǎn)品深加工技術(shù)與設(shè)備研究開發(fā)”列為我國“十五”重大科技攻關(guān)項目的第一項,這標志著計算機視覺技術(shù)在果蔬外部品質(zhì)檢測中會發(fā)揮越來越重要的作用。

馬鈴薯是世界上僅僅排在小麥、水稻和玉米之后的第四種主要農(nóng)作物,種植區(qū)域非常廣泛。馬鈴薯品質(zhì)檢測是馬鈴薯深加工的一個關(guān)鍵步驟,目前,該檢驗過程多數(shù)采用人工檢測,不僅成本高、效率低,而且與檢驗員的專業(yè)素質(zhì)有密切的關(guān)系,受到人為因素影響的程度較大,嚴重制約的馬鈴薯加工企業(yè)的發(fā)展。計算機視覺技術(shù)能對農(nóng)產(chǎn)品的某些特性變化和缺陷進行識別,具有客觀、無損害等特點。本文對基于計算機視覺的馬鈴薯外部品質(zhì)檢測的應(yīng)用進行了研究。

1 應(yīng)用計算機視覺技術(shù)對馬鈴薯進行外部品質(zhì)檢測的必要性

隨著“麥當勞”、“肯德基”的餐飲服務(wù)業(yè)的快速發(fā)展,炸薯條、炸薯片已經(jīng)成為一種休閑食品深受消費者的喜愛,推動了我國馬鈴薯產(chǎn)業(yè)的發(fā)展。然而,情況并不十分樂觀,與國外的馬鈴薯企業(yè)相比,我國馬鈴薯加工企業(yè)生產(chǎn)規(guī)模小、生產(chǎn)產(chǎn)品單一、技術(shù)設(shè)備落后、產(chǎn)品質(zhì)量不高的現(xiàn)象導(dǎo)致我國的馬鈴薯產(chǎn)品銷售困難,經(jīng)濟效益逐漸下滑。

基于以上現(xiàn)狀,對馬鈴薯的加工研究還有很長的一段路程。企業(yè)要擴大生產(chǎn)規(guī)模,針對中國的消費趨勢與消費水平開發(fā)出新的馬鈴薯產(chǎn)品,從而提高我國馬鈴薯產(chǎn)品的競爭力。這就要求馬鈴薯加工企業(yè)要對馬鈴薯的加工技術(shù)進行創(chuàng)新,保證產(chǎn)品質(zhì)量。其中,馬鈴薯外部品質(zhì)檢測對馬鈴薯產(chǎn)品的最終品質(zhì)起著決定性作用。當前的人工檢測方式已經(jīng)不再適應(yīng)社會發(fā)展的要求,利用計算機視覺檢驗代替人工檢驗成為社會發(fā)展的必然趨勢,這是因為計算機視覺技術(shù)具有以下優(yōu)點:

(1)精度高,能夠進行定量測量。

(2)自動化程度高,一次就可完成包括大小、形狀、顏色以及缺陷在內(nèi)的檢測和分析,并能進行綜合識別。

(3)無損檢測,計算機視覺檢測過程不需要接觸產(chǎn)品,是通過傳感器掃面獲取圖像的,不會造成產(chǎn)品的損傷。

(4)信息量大,可對大量信息進行采集,對光譜的敏感范圍也很廣。

2 基于計算機視覺的馬鈴薯外部品質(zhì)檢測的應(yīng)用研究

2.1 馬鈴薯大小的檢測方法

馬鈴薯的大小檢測不僅影響馬鈴薯深加工的商業(yè)價值,在在遺傳和育種方面也有很高的應(yīng)用價值。

利用計算機視覺技術(shù)對馬鈴薯大小的檢測步驟如下:先從攝像機中獲取馬鈴薯的圖像信息,在圖像信息的基礎(chǔ)上對馬鈴薯三維空間的幾何信息進行計算,并由此重建和識別馬鈴薯。而馬鈴薯物體表面某點的三維幾何位置與其在圖像中對應(yīng)點之間的相互關(guān)系是由攝像機成像的幾何模型決定的,這些幾何參數(shù)成為攝像機參數(shù)。要想準確的獲取這些攝像機參數(shù),就必須將實驗與計算相結(jié)合,此過程成為系統(tǒng)定標。

系統(tǒng)定標的基本步驟:根據(jù)設(shè)定好的攝像機模型和特定的實驗條件包括形狀、尺寸等已知的定標參照物,經(jīng)過對馬鈴薯圖像的處理,并利用一系列的數(shù)學(xué)轉(zhuǎn)換和計算方法將攝像機模型的內(nèi)部和外部參數(shù)計算出來,從而建立照片與實物的聯(lián)系推算出馬鈴薯的真實尺寸。

2.2 馬鈴薯形狀的檢測方法

根據(jù)《中國馬鈴薯栽培學(xué)》中的知識,我們可以把馬鈴薯的塊莖形狀分為三類,分別是圓形、長筒形和橢圓形,除了這三種形狀,其余都是這三種形狀的變形。此次研究將馬鈴薯分為圓形、橢圓形和長筒形,并且采用橢圓的短長軸比來模擬馬鈴薯的縱橫直徑之間的關(guān)系。

2.2.1 馬鈴薯形狀特征參數(shù)的提取

將馬鈴薯橢圓的短長軸比R作為形狀特征參數(shù),并按照R的大小將馬鈴薯進行分類。當R小于0.67時,稱之為長筒馬鈴薯;當R大于0.85時,稱之為圓形馬鈴薯;當R介于0.67到0.85之間時,稱之為橢圓形馬鈴薯。

2.2.2 結(jié)果與分析

隨機抽取114塊馬鈴薯,對抽取的馬鈴薯進行正反兩面拍照,挑選清晰度最高的228張圖片。人工分類后進行計算機視覺分類,操作步驟具體如下:

(1)用DIPS預(yù)處理:B通道灰度化,中值濾波和Otsu分割;

(2)通過計算機視覺技術(shù)提取馬鈴薯圖片的短長軸比R;

(3)將人工分類與計算機視覺分類進行對比,并得出正確率。

根據(jù)圖表,我們可以看出在228張僅有兩張圖片被分類錯誤,正確率高達99.1%,而這兩個分類錯誤的馬鈴薯的短長軸比處于0.67周圍,分別為0.667604 , 0.67193和0.671887, 0.661063,又因為對馬鈴薯形狀的分類不需要類似工業(yè)生產(chǎn)那樣精密,所以,當正反兩面短長軸比接近時都可看作是橢圓形。

2.3 馬鈴薯的缺陷檢測

計算機視覺技術(shù)具有實時、客觀、無損的檢測特點,能對馬鈴薯的表面缺陷和某些特征要素進行快速檢測。基于此,國內(nèi)外很多研究學(xué)者進行了大量的實驗研究,在1998年開發(fā)了利用PC機輔助的實時馬鈴薯檢測系統(tǒng),能夠?qū)︸R鈴薯的重量、顏色以及形狀進行快速檢測;2000年,相關(guān)研究者在此基礎(chǔ)上建立了計算機視覺檢測系統(tǒng),不僅能實現(xiàn)大小、形狀的檢測,還能對馬鈴薯表面的生長裂縫、機械裂縫、綠皮等表面缺陷進行檢測。當前對馬鈴薯表面缺陷進行檢測的主要計算機視覺技術(shù)包括缺陷分割法和缺陷識別法兩種方法。

3 結(jié)論

本文應(yīng)用計算機視覺技術(shù)對馬鈴薯的大小、形狀和表面缺陷等外部品質(zhì)進行了檢測,但是還未能實現(xiàn)利用計算機視覺技術(shù)對馬鈴薯的表面缺陷進行分類這一技術(shù)。因此,相關(guān)部門要加大研究力度,爭取早日完善計算機視覺技術(shù),從而推動我國馬鈴薯加工企業(yè)快速高效的發(fā)展。

參考文獻

[1]魯永萍.基于機器視覺的馬鈴薯外部品質(zhì)檢測與分級.機械設(shè)計及理論[D].內(nèi)蒙古農(nóng)業(yè)大學(xué).2013(學(xué)位年度).

[2]史崇升.基于高光譜成像技術(shù)的馬鈴薯外部品質(zhì)無損檢測建模及優(yōu)化研究.電子與通信工程[D].寧夏大學(xué).2014(學(xué)位年度).

作者單位

第6篇:計算機視覺技術(shù)范文

【 關(guān)鍵詞 】 云計算;關(guān)聯(lián)規(guī)則;Apriori Map/Reduce

1 引言

隨著我國開放大學(xué)建立及網(wǎng)絡(luò)學(xué)院的發(fā)展,高中起點升本科,??破瘘c升本科,高中起點升大專三個層次的多個不同專業(yè)吸引了更多的人選擇參加遠程教育完成學(xué)習,網(wǎng)絡(luò)學(xué)習云平臺上及網(wǎng)絡(luò)考試系統(tǒng)中也就保存了大量數(shù)據(jù),在這些數(shù)據(jù)中隱藏很多對遠程教學(xué)有價值的信息,有助于教學(xué)管理人員及時分析學(xué)生學(xué)習情況,更好地整合網(wǎng)絡(luò)學(xué)習平臺上的教育資源。如果僅使用傳統(tǒng)數(shù)據(jù)挖掘方法,就會由于數(shù)據(jù)量巨大而導(dǎo)致系統(tǒng)處理速度緩慢,頻繁的輸入輸出會影響系統(tǒng)響應(yīng)時間,節(jié)點效率不同也會出現(xiàn)挖掘效率不高的情況。為此在對網(wǎng)上考試系統(tǒng)所存儲的海量數(shù)據(jù)信息進行挖掘時,引入能夠在云計算環(huán)境下運行的數(shù)據(jù)挖掘算法,利用云計算環(huán)境中分布的計算節(jié)點,來支持數(shù)據(jù)挖掘算法的并行執(zhí)行,彌補傳統(tǒng)數(shù)據(jù)挖掘算法的不足,能從海量的考試數(shù)據(jù)資源中找出有價值的數(shù)據(jù)信息。

2 云計算與數(shù)據(jù)挖掘相關(guān)概念

2.1 云計算下MAP/REDUCE并行編程模型介紹

云計算的概念最先由Google埃里克·施密特在2006年首次提出,其基本原理是將大的海量數(shù)據(jù)的計算任務(wù)分割成小的微量的計算任務(wù),將計算任務(wù)細分后由分布在網(wǎng)絡(luò)上的計算節(jié)點通過并行計算實現(xiàn),最后將細化的計算結(jié)果數(shù)據(jù)匯總,得到最后的計算結(jié)果。在當前的網(wǎng)絡(luò)教學(xué)平臺中就已經(jīng)開始引入云的概念,將優(yōu)質(zhì)的教學(xué)資源作為云,學(xué)習者只訪問自己學(xué)習相關(guān)的資源而不用考慮該資源所在位置,學(xué)習結(jié)束后通過網(wǎng)上考試系統(tǒng)完成測試。

MapReduce 是 Google 發(fā)明的并行分布式編程模型,被廣泛應(yīng)用于云數(shù)據(jù)計算中,用MapReduce來處理的數(shù)據(jù)任務(wù)必須能分解成獨立的小數(shù)據(jù)集,而且各個小數(shù)據(jù)集能夠并行處理,通過 Map階段將待處理數(shù)據(jù)分割成小的獨立數(shù)據(jù)塊,分別讓不同的空閑計算節(jié)點來進行計算,達到分布式運算的效果,再通過 Reduce 程序?qū)⒂嬎憬Y(jié)果匯總輸出。

2.2 關(guān)聯(lián)規(guī)則及Apriori算法介紹

數(shù)據(jù)挖掘目前公認的定義是:數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。

關(guān)聯(lián)規(guī)則由Agrawal 等于1993年首先提出,就是要從當前數(shù)據(jù)庫中挖掘出各個項集間存在的某種規(guī)則,形成關(guān)聯(lián)規(guī)則的項目集必須是頻繁項目集,也應(yīng)滿足最小支持度和最小可信度。

對于云計算平臺上的海量考試數(shù)據(jù)進行挖掘,主要目的之一就是希望能通過挖掘大量的考試信息發(fā)現(xiàn)試題之間隱藏的內(nèi)在聯(lián)系,這在功能上屬于關(guān)聯(lián)分析。例如,關(guān)聯(lián)規(guī)則可以表示為“答對了題目3的考生中有80%的人也答對了題目9”。從這些規(guī)則可找出試題中題目之間的關(guān)聯(lián)性,幫助教師分析學(xué)生知識掌握情況以及分析題目之間的互相影響性,以便幫助提高教學(xué)質(zhì)量。

Apriori算法的基本思想是找出所有的頻繁項集,這些頻繁項集出現(xiàn)的頻繁性要大于等于預(yù)先定義的最小支持度,由找出的這些頻繁項集產(chǎn)生同時滿足最小支持度和最小可信度的強關(guān)聯(lián)規(guī)則。

3 云計算環(huán)境下Apriori算法的Map/Reduce模型化設(shè)計

要在云計算環(huán)境下應(yīng)用Apriori算法,要將算法按照Map/Reduce的編程模型并行化設(shè)計并執(zhí)行,然后由主控程序控制算法應(yīng)用云存儲環(huán)境中的數(shù)據(jù)運行。主程序按照使用者指定的數(shù)據(jù)塊大小將云存儲中數(shù)據(jù)分成獨立的N個數(shù)據(jù)塊,并將這些數(shù)據(jù)塊分發(fā)到云平臺中各個空閑的計算節(jié)點去運行,在進行數(shù)據(jù)預(yù)處理后,Map進程對處理好的目標數(shù)據(jù)進行計算,得到局部的頻繁候選項集,再由Reduce進程對Map過程產(chǎn)生的局部候選頻繁項目集做歸并處理,產(chǎn)生總體的全部候選項目集,然后按照給定的最小可信度和最小支持度找出全局的頻繁候選項目集,得到有關(guān)的關(guān)聯(lián)規(guī)則。

云計算環(huán)境下的 Apriori 算法Map/Reduce化包括3個過程,首先是數(shù)據(jù)準備過程;其次是Map函數(shù)過程找到各個獨立數(shù)據(jù)塊的局部頻繁項集;最后由Reduce過程通過歸并處理接收Map過程得到的局部頻繁項集,從中找出全局頻繁項集,得到所需要的強關(guān)聯(lián)規(guī)則。

Map/Reduce 化后 Apriori 算法的執(zhí)行步驟如下:

(1) 數(shù)據(jù)庫中待處理數(shù)據(jù)首先要按照要求分割成相對獨立的N個小數(shù)據(jù)塊,并按照所需要求進行數(shù)據(jù)清理處理和篩選處理,得到處理后的N個候選數(shù)據(jù)項集。

(2) 由Master將N個候選數(shù)據(jù)項集分派給不同的工作節(jié)點,每個節(jié)點執(zhí)行不同的Map進程,利用參數(shù)KEY,產(chǎn)生的VALUE,按照系統(tǒng)設(shè)定的最小支持度和最小可信度要求計算出局部的頻繁項集。

(3) 由Map過程得到的局部頻繁項集保存到本節(jié)點硬盤上,準備交給Reduce過程處理歸并。

(4) Map過程結(jié)束后,由Master主程序?qū)⒈敬斡脖P存儲的局部頻繁項集具置信息傳遞給Reduce歸并過程,由主程序決定讓云計算環(huán)境中的空閑計算節(jié)點來運行完成Reduce過程。

(5) Reduce過程主要是從存儲區(qū)讀取局部頻繁項集數(shù)據(jù),然后通過歸并處理得到全局的數(shù)據(jù)候選項集,再找出滿足大于系統(tǒng)給定的最小可信度和最小支持度的頻繁項目集。

(6) Reduce過程得到的數(shù)據(jù)傳遞給用戶,由用戶對數(shù)據(jù)進行整理找出符合要求的強關(guān)聯(lián)規(guī)則。

4 實驗過程及分析

4.1 MapReduce化的Apriori算法考試數(shù)據(jù)挖掘應(yīng)用

網(wǎng)上考試系統(tǒng)中保存海量的學(xué)生考試信息,其中學(xué)生考試成績是很重要的一項數(shù)據(jù)信息,利用MapReduce化的Apriori算法對海量考試數(shù)據(jù)信息進行挖掘,主要是對學(xué)生成績信息進行挖掘,找出所學(xué)課程之間的相關(guān)性,可以更科學(xué)地幫助教師制訂合理的教學(xué)計劃進程,以指導(dǎo)學(xué)生順利完成學(xué)業(yè)。

如在對網(wǎng)絡(luò)云平臺上考試系統(tǒng)中的數(shù)據(jù)信息挖掘時,要找出學(xué)生的學(xué)習課程之間的相互關(guān)聯(lián)性,可以從學(xué)生的課程考試成績?nèi)胧?。首先要處理?shù)據(jù),將學(xué)生課程成績92分以上的設(shè)置為1,表示該門課程成績?yōu)閮?yōu)秀,其它低于該分數(shù)的成績設(shè)置為0,表示該門課程成績不優(yōu)秀。該數(shù)據(jù)庫表中有三門課程,包括程序設(shè)計基礎(chǔ),計算機基礎(chǔ)和VB課程,選取部分學(xué)生成績數(shù)據(jù),要對上述優(yōu)秀課程進行云計算環(huán)境下的關(guān)聯(lián)規(guī)則挖掘,假定最小支持度為40%、最小可信度為60%時,設(shè)定key和value參數(shù)值,首先由Master分配數(shù)據(jù)塊給各個Map,找出局部的頻繁項目集,再由Reduce過程歸納局部頻繁項目集得到全局候選項集,根據(jù)設(shè)定的最小支持度和最小可信度,找出全局頻繁項目集??梢缘贸鋈缦乱?guī)則:

(1)程序基礎(chǔ)成績優(yōu)秀,VB成績優(yōu)秀=〉計算機基礎(chǔ)成績優(yōu)秀的可能性大于100%;

(2)VB成績優(yōu)秀,計算機基礎(chǔ)成績優(yōu)秀=〉程序基礎(chǔ)成績優(yōu)秀的可能性大于100%。

根據(jù)以上挖掘得到的規(guī)則可以得知,VB程序設(shè)計課程與程序設(shè)計基礎(chǔ)課程之間有某種聯(lián)系,能夠相互影響,程序設(shè)計基礎(chǔ)這門課程成績會影響到VB課程成績,計算機專業(yè)責任教師在設(shè)計教學(xué)計劃時,可以將程序設(shè)計基礎(chǔ)課程作為VB程序設(shè)計課程的先修課,這樣學(xué)生成績?yōu)閮?yōu)秀的可能性就更大。

同樣的可以利用MapReduce化的Apriori算法在網(wǎng)絡(luò)考試數(shù)據(jù)信息中挖掘出相關(guān)學(xué)科之間不同知識點的影響程度,以實現(xiàn)在教學(xué)中在講授某一知識點時的知識擴展和準備。我們設(shè)定最小支持度為96% 最小置信度為97%

通過挖掘后,得到如下的規(guī)則:

站點顏色與主題 =〉網(wǎng)站風格的設(shè)計 96.8% 98.3%

網(wǎng)站風格的設(shè)計=〉站點顏色和主題 96.8% 97.2%

網(wǎng)頁信息的強勢 =〉頁面設(shè)計 97.6% 96.5%

其中,每一行為一條關(guān)聯(lián)規(guī)則,數(shù)字分別表示他們的支持度和可信度。如第2條規(guī)則表示,網(wǎng)站風格設(shè)計的知識點與站點顏色和主題的知識點有很強的關(guān)聯(lián)性,由于有96.8%的學(xué)生對這兩個知識點的掌握都比較好,同時有97.2%的學(xué)生屬于對網(wǎng)站風格設(shè)計知識點掌握的好也對站點顏色和主題知識點掌握的好。這就說明網(wǎng)站風格設(shè)計的知識點可以作為站點顏色和主題知識點的知識準備,教師在講解網(wǎng)絡(luò)信息制作與時要重點強調(diào)該部分內(nèi)容,也可以在講解DREAMWEAVER課程中將網(wǎng)站風格設(shè)計的相關(guān)概念給出,這對學(xué)生學(xué)習會有很大的幫助。同時,該規(guī)則可以幫助教師在進行試卷設(shè)計時,將這兩個知識點的內(nèi)容同時考察,這樣學(xué)生的得分率會更高。

4.2 MapReduce化的Apriori算法和傳統(tǒng)的Apriori算法挖掘效率對比

為了驗證使用基于云計算環(huán)境的Apriori算法與傳統(tǒng)的Apriori算法在對海量的考試數(shù)據(jù)信息挖掘方面的優(yōu)越性能,進行數(shù)據(jù)實驗測試。本測試環(huán)境是在局域網(wǎng)范圍內(nèi)配置一定數(shù)量節(jié)點的集群環(huán)境,每個單一節(jié)點的軟硬件配置都統(tǒng)一,利用Hadoop 自帶的 MapReduce Tools for Eclipse ,配置好 MapReduce分布式編程環(huán)境。測試數(shù)據(jù)來源于網(wǎng)上考試系統(tǒng)保存的學(xué)生考試數(shù)據(jù)信息。設(shè)定最小支持度為0.2,最小可信度為0.1。通過使用MapReduce化的Apriori算法和傳統(tǒng)的Apriori算法對海量的考試數(shù)據(jù)信息進行挖掘,將得到的測試結(jié)果進行比較,得到的結(jié)果是在數(shù)據(jù)規(guī)模比較小的情況下,傳統(tǒng)的挖掘方法和云計算環(huán)境下的挖掘方法耗費的時間差別并不大,但是隨著數(shù)據(jù)規(guī)模的增大,使用傳統(tǒng)的Apriori算法進行的單節(jié)點數(shù)據(jù)挖掘所耗費的時間越來越多,而使用MapReduce化的Apriori算法則顯現(xiàn)出了更好的計算效能,在對網(wǎng)絡(luò)考試系統(tǒng)的大規(guī)模數(shù)據(jù)信息進行挖掘時系統(tǒng)性能表現(xiàn)很好,解決了傳統(tǒng)數(shù)據(jù)挖掘在面對海量數(shù)據(jù)信息進行挖掘時的系統(tǒng)響應(yīng)速度慢,各個節(jié)點的輸入輸出量巨大時負載不均衡,挖掘效率不高的問題。

5 結(jié)束語

通過對網(wǎng)絡(luò)考試系統(tǒng)的海量考試數(shù)據(jù)信息進行挖掘,驗證了云計算環(huán)境下應(yīng)用基于Map/Reduce編程模型的Apriori算法進行數(shù)據(jù)挖掘,能夠解決傳統(tǒng)數(shù)據(jù)挖掘算法在對大規(guī)模數(shù)據(jù)挖掘時出現(xiàn)的系統(tǒng)響應(yīng)速度慢,整體挖掘效率不高的問題,希望在數(shù)據(jù)量越來越多的云教育時代,基于云計算環(huán)境的數(shù)據(jù)挖掘能發(fā)揮出更大的作用。

參考文獻

[1] 陳嘉恒.分布式系統(tǒng)及云計算概論.清華大學(xué)出版社, 2011.5.

[2] 趙虎.云計算環(huán)境下的關(guān)聯(lián)數(shù)據(jù)挖掘算法實現(xiàn).電子科技大學(xué),2011.6.

[3] 蘇海英.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的分析與優(yōu)化研究.吉林大學(xué),2006.

[4] 孟小峰.數(shù)據(jù)挖掘:概念與技術(shù)(M).機械工業(yè)出版社, 2001.

[5] 安淑芝.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘.清華大學(xué)出版社,2005.6.

[6] 戎翔.基于MapReduce的頻繁項集挖掘方法.西安郵電學(xué)院學(xué)報,2011.7.

[7] 謝桂蘭.基于Hadoop模型的應(yīng)用研究.微型機與應(yīng)用, 2010.8.

[8] 季一木,康家邦,潘俏羽等.一種云計算安全模型與架構(gòu)設(shè)計研究[J].信息網(wǎng)絡(luò)安全,2012,(06):6-8.

[9] 胡春輝.云計算安全風險與保護技術(shù)框架分析[J].信息網(wǎng)絡(luò)安全,2012,(07):87-89.

[10] 江偉玉,高能,劉澤藝等.一種云計算中的多重身份認證與授權(quán)方案[J].信息網(wǎng)絡(luò)安全,2012,(08):7-10.

第7篇:計算機視覺技術(shù)范文

關(guān)鍵詞:視覺技術(shù);太陽視位置;算法

DOI:10.16640/ki.37-1222/t.2017.06.204

1 引言

基于太陽能利用涉及的太陽位置算法的研究源于20世紀60年代。1969年的Copper算法、年的Spencer算法、1988年Michalsky提出的基于天文算法的太陽位置算法,以及2004年Reda提出的精度較高的SPA算法。這些算法均需計算出太陽視赤緯、當?shù)靥枙r角,并以此為變量,利用球面三角公式或矢量法計算太陽視位置的地平坐標(高度角、方位角)[1],算法復(fù)雜、計算量大,影響太陽位置時時準確地獲取,不利于實現(xiàn)自動化跟蹤控制?;谝曈X技術(shù)的太陽視位置算法是借助視覺技術(shù)代替人眼通過采集地平坐標系下的影子圖像,經(jīng)圖像處理分析后,建立太陽方位角和高度角的算法,從而確定太陽視位置。這樣的研究是基于機器視覺技術(shù)的新的嘗試,也是目前太陽能跟蹤眾多方法中尚未涉及的新領(lǐng)域。

2 圖像處理

視覺系統(tǒng)采集的圖像,在形成、傳輸、接受和處理的整個過程中,由于受到噪聲和圖像特征衰減等方面的影響,會降低圖像的質(zhì)量。因此,對圖像進行分析之前,必須先對圖像進行處理,以便為后續(xù)圖像分析處理等高層操作提供基礎(chǔ)[2]。處理技術(shù)主要是對被處理圖像進行灰度變換、平滑濾波、圖像增強、幾何變換、灰度均衡化處理[3] ,目的是消除圖像中無關(guān)的信息,恢復(fù)有用的真實信息,增強有關(guān)信息的可檢測性和最大限度地簡化數(shù)據(jù),從而改善圖像數(shù)據(jù),提高特征抽取、圖像分割、匹配和識別的可靠性。

2.1 圖像翻轉(zhuǎn)

圖像翻轉(zhuǎn)是一種幾何變換,可以將原圖像繞著中心點翻轉(zhuǎn)180度,只改變坐標不改變圖像像素值。采集到的影子圖像如圖1(a)所示,處于倒置狀態(tài),不利于獲取影子坐標系,因此在預(yù)處理前應(yīng)當將圖像翻轉(zhuǎn),如圖1(b)所示。

2.2 閥值分割

閾值分割就是確定一個閥值,把圖像中每個像素點的灰度值與閥值進行比較,根據(jù)比較結(jié)果將像素分為前景和背景[4]。經(jīng)過圖像分割后,圖像變成了二值圖像,使后續(xù)圖像輪廓的提取和分析就變得非常簡單[5]。

研究中采集到的圖像是灰度圖像,圖中的影子邊界和坐標標量邊界與背景有些模糊,但圖像和背景的對比度比較高,產(chǎn)生的假邊緣點少,因此通過閥值分割就能將圖像與背景分割(見圖2)。

圖像閥值分割的關(guān)鍵技術(shù)是閥值的選取,常用的閾值選取方法有直方圖谷底閥值法、迭代選擇閥值法、最大熵法、最大類間方差法以及其它一些方法。用以上方法依次對圖1(b)圖像進行分割,所得結(jié)果如表1所示。經(jīng)過數(shù)據(jù)和分割效果對比,迭代選擇閥值法獲取的閥值為最佳閥值。

2.3 邊緣檢測

要想準確獲取太陽高度角和方位角就需要準確檢測出影子的像素長度、圖像標準長度像素值和坐標方向。為了獲取這些參數(shù),采用了邊緣檢測算子。

檢測步驟如下:

(1)對坐標方塊的坐標位置(左方格的左上方坐標和右下方坐標、右方格的右上方坐標和左下方坐標)進行初始化;

(2)通過雙重循環(huán)逐行逐列的掃描搜索獲取四個坐標位置的真實坐標值;

(3)設(shè)計算法,構(gòu)建東西方向向量,計算標準長度的像素值,并標出影子圖像所在區(qū)域;

(4)在區(qū)域下方掃描搜索影子圖像標出邊緣點;

(5)設(shè)計算法,構(gòu)建影子的方向向量,計算影子的像素長度。

3 太陽方位角和高度角計算

經(jīng)邊緣檢測,獲取了坐標標量方塊的四個坐標點和影子圖像的兩端邊緣點,并已通過算法確定了東西方向向量、影子方向向量、標準長度的像素值和影子的像素長度值。通過GUI界面輸入直桿的長度和坐標標定單位長度就可準確地計算出太陽方位角和高度角。

將基于視覺技術(shù)檢測到太陽高度角和方位角與精度較高的SPA算法計算[6,7,8]的太陽高度角和方位角進行對比。

實驗數(shù)據(jù)采集地點為北緯N39°37′2.67″ 、東經(jīng)E109°48′50.29″;采集日期為2016年3月5日。

4 結(jié)論

基于覺技術(shù)檢測獲取的太陽視位置精度高,采集原理可行性高,影子圖像輪廓易于提取,圖像前期處理所需步驟少,大大提高了算法處理速度,消除了以往太陽跟蹤時間滯后和實時性低的不利影響[9]。

參考文獻:

[1]杜春旭,王普,馬重芳等.一種高精度太陽位置算法[J].新能源及工藝,2010(02):41-48.

[2]張春雪.圖像的邊緣檢測方法研究[D].無錫:江南大學(xué),2011.

[3]王東江,劉亞軍.太陽自動跟蹤控制系統(tǒng)的設(shè)計[J].數(shù)字技術(shù)與應(yīng)用,2010(07):19-25.

[4]張錚,王艷平,薛桂香等.數(shù)字圖像處理與機器視覺――Visual C++與Matlab實現(xiàn)[M].北京:人民郵電出版社,2010:361.

[5]徐平,邵定宏,魏楹等.最佳閥值分割和輪廓提取技術(shù)及其應(yīng)用[J].計算機工程與設(shè)計.2009,30(02):437-439.

[6]張菲菲.關(guān)于日出日落方位的淺析[J].城市地理,2015:76.

[7]金衛(wèi)東.揭開太陽方位角的神秘面紗[J].求學(xué),2015(05):53-54.

[8]王國安,米鴻濤,鄧天宏等.太陽高度角和日出日落時刻太陽方位角一年變化范圍的計算[J].氣象與環(huán)境科學(xué),2007(30):161-164.

[9]李平陽.基于圖像處理的太陽質(zhì)心位置檢測算法研究[D].太陽科技大學(xué),2013.

第8篇:計算機視覺技術(shù)范文

【關(guān)鍵詞】云計算 web數(shù)據(jù)挖掘 運用 控制層

1 云計算與web數(shù)據(jù)挖掘

1.1 云計算的概念

所謂云計算,具體是指將分布式、網(wǎng)絡(luò)存儲、網(wǎng)格計算、并行計算以及虛擬化技術(shù)有效融合而形成的技術(shù),是計算機技術(shù)蓬勃發(fā)展的最終產(chǎn)物。

1.2 云計算的關(guān)鍵技術(shù)

1.2.1 數(shù)據(jù)管理技術(shù)

系統(tǒng)處理能夠為用戶提供更為優(yōu)質(zhì)的高質(zhì)量服務(wù),進而可以通過此技術(shù)手段進行管理數(shù)據(jù)。此外,管理技術(shù)的廣泛應(yīng)用,還能夠進一步解決存在的問題,對于數(shù)據(jù)集的整合和處理來說,提供了充足的數(shù)據(jù)參考。

1.2.2 虛擬化技術(shù)

作為一種特別有效資源合理分配劃分的方式,可以將不同等級的系統(tǒng)進行孤立,進而實現(xiàn)存儲、服務(wù)器與設(shè)備之間的劃分,從中凸顯出應(yīng)用系統(tǒng)的實質(zhì)性作用,實現(xiàn)體系結(jié)構(gòu)與管理技術(shù)的廣泛應(yīng)用。

1.2.3 分布式存儲技術(shù)

運存儲數(shù)據(jù)主要就是采用分布式的存儲方式,這種方式在某種程度上來說,可以有效的保障數(shù)據(jù)的可靠性,同時也具備一定的經(jīng)濟性。

1.3 web數(shù)據(jù)挖掘技術(shù)

通常情況下,我們將web數(shù)據(jù)挖掘成為網(wǎng)絡(luò)挖掘,其根本原因是基于互聯(lián)網(wǎng)與數(shù)據(jù)挖掘技術(shù)而形成的。由于當前互聯(lián)網(wǎng)中數(shù)量是非常龐大的,而運用web能夠準確的尋找到有價值的信息。在web數(shù)據(jù)挖掘技術(shù)領(lǐng)域當中,主要是基于機器學(xué)習、統(tǒng)計學(xué)、數(shù)據(jù)庫技術(shù)以及神經(jīng)網(wǎng)絡(luò)等分支來構(gòu)成的。在web數(shù)據(jù)挖掘技術(shù)運用的過程中,由于和傳統(tǒng)挖掘技術(shù)相比,在挖掘方式與挖掘?qū)ο蠓矫媸谴嬖谥^大差異的,因此在流程方面是完全不同的。通常來說,web數(shù)據(jù)挖掘的流程主要可分為四個部分,分別為搜索信息、信息預(yù)處理、模式發(fā)現(xiàn)以及模式分析。

2 基于云計算平臺的web數(shù)據(jù)挖掘體系架構(gòu)

2.1 服務(wù)層

服務(wù)層的功能是用戶與web數(shù)據(jù)挖掘之間的交互。在操作過程中,服務(wù)層能夠?qū)⒂脩舻恼埱蠼邮?,并通過轉(zhuǎn)化的方式向web數(shù)據(jù)挖掘發(fā)送指令,然后web數(shù)據(jù)挖掘?qū)⒌玫降馁Y源返回到用戶。

2.2 控制層

在web數(shù)據(jù)挖掘執(zhí)行的過程中,控制層處于核心地位,其根本原因是在云計算平臺當中,所有的數(shù)據(jù)挖掘的相關(guān)操作都是由控制層來操作與控制的。具體來說,主控節(jié)點會根據(jù)用戶所提出的需求,來對最合理的web數(shù)據(jù)挖掘算法來進行選擇,然后將算法的階段傳輸?shù)襟w系架構(gòu)當中的各個節(jié)點當中,在挖掘任務(wù)完成后則會傳輸?shù)椒?wù)層,最終展現(xiàn)給用戶。

2.3 算法和數(shù)據(jù)存儲層

在基于云計算平臺的web數(shù)據(jù)挖掘的體系架構(gòu)當中,數(shù)據(jù)存儲層的功能是對各種類型的算法進行存儲,當接收到用戶所發(fā)出的信息后,在算法進行選擇后存儲到數(shù)據(jù)存儲層,以實現(xiàn)對數(shù)據(jù)的備份。即便在挖掘過程中出現(xiàn)意外,也能夠瞬間將數(shù)據(jù)恢復(fù)。

2.4 業(yè)務(wù)處理層

眾所周知,在web挖掘技術(shù)當中得到的數(shù)據(jù)與信息,是經(jīng)過數(shù)據(jù)存儲層的解析后,轉(zhuǎn)化為XML文件。對此,業(yè)務(wù)處理層的職責就是將分配的任務(wù)進行處理,在操作完成后返回到控制層,最終由控制層傳輸?shù)椒?wù)層。

3 基于云計算的web數(shù)據(jù)挖掘技術(shù)運用

3.1 數(shù)據(jù)的收集和處理

在數(shù)據(jù)的收集和處理過程中,需要將用戶訪問數(shù)據(jù)與web機器人訪問數(shù)據(jù)相分離,那么則需要運用到?jīng)Q策樹工具。除此之外,基于云計算平臺的web數(shù)據(jù)挖掘算法,在對數(shù)據(jù)進行篩選與整合后,將其轉(zhuǎn)化為半結(jié)構(gòu)化的XML文件,并將其保存到分布式文件體系當中。其中,具有代表性的谷歌公司所研發(fā)的Map-Reduce編程,這種編程模式將負載均衡、并行化以及數(shù)據(jù)布局有效的融合。在操作階段,數(shù)據(jù)的流程包含兩個階段,分別為Map階段與Reduce階段。借助于此編程方式,所收集得到的數(shù)據(jù)量更大,但是需注意的是,系統(tǒng)本身并不包含搜集數(shù)據(jù)與保存掃面的功能,再加上應(yīng)用程序在使用的過程中,還會運用到歷史數(shù)據(jù)的功能,因此對于系統(tǒng)的性能具有一定的負面影響。截止到目前,構(gòu)建相關(guān)系統(tǒng)項目的研究機構(gòu)是逐漸增多的,其中具有代表性的有Aurora以及STREAM等。

3.2 數(shù)據(jù)存儲

當數(shù)據(jù)進行收集之后,需要進行科學(xué)合理的數(shù)據(jù)處理,當完成收集和處理任務(wù)之后,應(yīng)該將數(shù)據(jù)存儲起來,以保證可以對日后的使用起到一定的便捷作用,數(shù)據(jù)在存儲的同時,應(yīng)該始終堅持以云計算為重要的存儲數(shù)據(jù)流程設(shè)定基礎(chǔ),這樣可以有效的保障數(shù)據(jù)的穩(wěn)定性,對數(shù)據(jù)的存儲起到一定的促進作用。在現(xiàn)階段以云計算為核心的web數(shù)據(jù)存儲領(lǐng)域當中,主要被劃分為開源系統(tǒng)與非開源系統(tǒng)。其中,前者運用最多的為hdfs系統(tǒng),該系統(tǒng)是由hadoop公司所開發(fā)的;而后者運用最多的是gfs系統(tǒng),該系統(tǒng)是由谷歌公司所開發(fā)的??偟膩碚f,在各項技術(shù)蓬勃發(fā)展的過程中,在云計算平臺中,web數(shù)據(jù)挖掘技術(shù)的運用范圍是不斷擴展與延伸的。在此背景下,云計算平臺的web數(shù)據(jù)挖掘技術(shù)不但搜索效率方面有著明顯的提升,同時在數(shù)據(jù)處理效率方面的提升也是非常顯著的。

4 結(jié)論

通過全文的分析,能夠看出重點是對于云計算以及數(shù)據(jù)挖掘技術(shù)進行具體的探索和分析,明確在云計算技術(shù)基礎(chǔ)上,數(shù)據(jù)挖掘技術(shù)得到了較大程度上的創(chuàng)新發(fā)展,其未來的發(fā)展前景非常的寬廣。與此同時,相信在云計算領(lǐng)域蓬勃發(fā)展的背景下,web數(shù)據(jù)挖掘在云計算的未來發(fā)展發(fā)揮出了巨大的推動力。

參考文獻

[1]蔡興旺,段夢博.云計算及其在數(shù)據(jù)挖掘上的應(yīng)用研究[J].電腦知識與技術(shù),2010(22).

[2]劉帥,蔣貴凰.數(shù)據(jù)挖掘的現(xiàn)狀及發(fā)展趨勢研究分析[J].現(xiàn)代商業(yè),2015(33).

[3]吳銳,孫銀香.云計算平臺下的Web數(shù)據(jù)挖掘研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(08).

第9篇:計算機視覺技術(shù)范文

【 關(guān)鍵詞 】 云計算;數(shù)據(jù)挖掘;平臺架構(gòu);設(shè)計和實現(xiàn);探究

1 引言

近年來,隨著科學(xué)技術(shù)的飛速發(fā)展,大量的數(shù)據(jù)被存儲到計算機等存儲介質(zhì)當中。通常情況下,所存儲的數(shù)據(jù)多是復(fù)雜的、數(shù)據(jù)量較大的等。因此,難以通過人工而直接獲得。尤其是在科研或是商業(yè)發(fā)展領(lǐng)域中,需要對海量的數(shù)據(jù)進行分析,從而找出更多有價值的信息。為解決上述問題,很多研究人員聚集在一起,研究出一種新型的數(shù)據(jù)挖掘技術(shù)。

近來,由于計算機技術(shù)、云計算技術(shù)的飛速發(fā)展,大量的數(shù)據(jù)都存儲到了網(wǎng)絡(luò)當中,而這些海量的、復(fù)雜式的數(shù)據(jù)信息給數(shù)據(jù)挖掘系統(tǒng)的實現(xiàn)帶來很多的難題,如數(shù)據(jù)相對復(fù)雜,現(xiàn)有的計算能力難以達到技術(shù)要求,而可以借助云計算數(shù)據(jù)挖掘技術(shù)可提升處理復(fù)雜數(shù)據(jù)的能力。

2 云計算數(shù)據(jù)挖掘系統(tǒng)架構(gòu)設(shè)計的分析

2.1 目標系統(tǒng)模型

在云計算環(huán)境下,構(gòu)建目標系統(tǒng)為各種終端用戶提供高透明化的界面服務(wù),并且在此基礎(chǔ)上也提供了開放式的接口支持。這樣一來,用戶不僅能夠通過終端訪問用戶訪問來使用系統(tǒng),也或是利用其它應(yīng)用程序調(diào)用開放式接口間接式的應(yīng)用系統(tǒng)服務(wù)。不管遇到上述哪一種情形,用戶都無需對系統(tǒng)實現(xiàn)而擔心其存儲能力,只需考慮要選擇何種算法進行處理,最后通過任務(wù)形式部署給系統(tǒng)獲得所需的挖掘結(jié)果。除此之外,云計算環(huán)境下的數(shù)據(jù)挖據(jù)平臺中得模塊都是利用用戶界面和開放式接口提供服務(wù)的。其中,由開放式接口提供的服務(wù)均為外部可見服務(wù)。而當涉及到高級權(quán)限使用功能時,可通過用戶界面直接調(diào)用開放式接口服務(wù)功能。

2.2 功能層次框架設(shè)計

2.2.1算法層

該層主要是利用下一層所提供的統(tǒng)一數(shù)據(jù)源來調(diào)用相關(guān)算法及對接口進行合理的管理。由于不同算法的執(zhí)行順序和得到的結(jié)果有所不同而分開的。例如數(shù)據(jù)清洗算法服務(wù),它是針對具有噪聲數(shù)據(jù)的數(shù)據(jù)及在應(yīng)用數(shù)據(jù)挖掘算法前需要進行接口服務(wù)調(diào)用,把清洗后的數(shù)據(jù)利用數(shù)據(jù)層再儲存到云計算平臺中,為后續(xù)數(shù)據(jù)挖掘工作提供更好的服務(wù);數(shù)據(jù)挖掘調(diào)用服務(wù),在應(yīng)用該服務(wù)之前,將已清洗的及不需要清洗的數(shù)據(jù)利用數(shù)據(jù)挖掘技術(shù)統(tǒng)一對數(shù)據(jù)進行調(diào)用。

2.2.2應(yīng)用層

和其它層相比,該層的抽象性較強,它是把海量數(shù)據(jù)挖掘涉及到的數(shù)據(jù)、算法等之間的內(nèi)在關(guān)系描述成任務(wù),同時提供提供應(yīng)用調(diào)用服務(wù)和維護接口等。

2.2.3用戶層

該層主要為用戶提供身份驗證和授權(quán)等功能。

2.3 設(shè)計關(guān)鍵點

2.3.1插件系統(tǒng)設(shè)計

插件是結(jié)合相應(yīng)的應(yīng)用程序開發(fā)接口規(guī)范而實現(xiàn)的一種程序。其中,任何一個插件都是由三大部分構(gòu)成的,即擴展點、業(yè)務(wù)邏輯、調(diào)用下層擴展點,并且這三者都是由相同的負責模塊管理幫頂包跟各種服務(wù)所構(gòu)成的。另外,每個綁定包涉及到一個服務(wù)說明接口與多個服務(wù)調(diào)用接口兩種類型的接口。要求綁定包接口必須滿足相關(guān)規(guī)范要求,若把插件防止到平臺的某個特定目錄下,能夠識別和加載該動態(tài)。除此之外,算法實現(xiàn)不同于以往針對特定個數(shù)、排列數(shù)據(jù)而實現(xiàn)。它是在滿足實現(xiàn)算法的基礎(chǔ)上,利用抽象數(shù)據(jù)提供更多的兼容性。盡管這種算法實現(xiàn)存在很大的難度,但其算法的復(fù)用性有了顯著提升。

2.3.2開放接口設(shè)計

通常情況下,開放接口主要被應(yīng)用數(shù)據(jù)挖掘平臺的開發(fā)使用。利用上述接口,開發(fā)者能夠更好地利用數(shù)據(jù)挖掘平臺提供的資源及數(shù)據(jù)服務(wù)。為實現(xiàn)開放接口高效性、直觀性的目的,其平臺接口主要應(yīng)用的是表述性狀態(tài)轉(zhuǎn)移接口,英文縮寫為:REST。該類接口的優(yōu)勢在于為無態(tài)型。也就是說,在同一個局域網(wǎng)中,瀏覽器中的緩沖裝置可替代服務(wù)的重復(fù)調(diào)用。這樣一來,不僅能夠有效減輕服務(wù)器的運行負擔,而且若用戶量過多造成底層服務(wù)影響整個系統(tǒng)的運行,而此時可利用橫向服務(wù)器數(shù)量的增加擴展線性的吞吐量。因此,利用云計算平臺,能夠為用戶提供無窮大的數(shù)據(jù)吞吐能力,滿足系統(tǒng)的性能要求。

3 云計算數(shù)據(jù)挖掘平臺架構(gòu)的實現(xiàn)

3.1 開發(fā)環(huán)境

Google的云計算開發(fā)環(huán)境主要為App Engine。當遇到重載或是數(shù)據(jù)量非常的情形時,也能輕松構(gòu)建安全的應(yīng)用程序。這是因為此環(huán)境的優(yōu)勢在于可提供動態(tài)服務(wù)、自動擴展等。

3.2 開發(fā)思想和技術(shù)

3.2.1原型開發(fā)模型

首先,需進行快速分析。在相關(guān)人員和用戶的共同合作下,可準確確定出系統(tǒng)的需求,再結(jié)合原型的特征描述需求,來滿足開發(fā)原型的需求。其次,原型的建構(gòu)。在經(jīng)過分析的基礎(chǔ)上,結(jié)合需求快速建構(gòu)一可行性較高的系統(tǒng)。在此情況下,需要有相應(yīng)的軟件工具提供可靠的技術(shù)支持,同時不考慮系統(tǒng)細節(jié)方面的具體要求。再次,原型的運行。此環(huán)節(jié)是為及時發(fā)現(xiàn)問題,從而快速消除問題的一個關(guān)鍵環(huán)節(jié)。最后,對原型的評價。原型運行的前提下,對原型的特性予以科學(xué)性的考核,對運行結(jié)果能否滿足用戶期望而進行分析。而針對該過程中存在的錯誤或是增添的新要求等,提供合理性的修改建議和意見。

3.2.2基于WSGI規(guī)范的開發(fā)

通過分析可知,在基于WSGI規(guī)范基礎(chǔ)上的開發(fā)具有很多的優(yōu)勢。其根本目的是提升系統(tǒng)的可用性和實現(xiàn)跨平臺性操作。因此,基于WSGI規(guī)范的實現(xiàn)遠比傳統(tǒng)的C/S模塊使用簡單的多。用戶通過對瀏覽器來訪問系統(tǒng),同時增加了用戶的終端的可選擇性。此外,由于WSGI規(guī)范是在Python的語言環(huán)境下而實現(xiàn)的。而該種語言屬于一種跨平臺性開發(fā)語言。這樣一來,不管是把已開發(fā)的系統(tǒng)放置到云計算平臺上還是在本地開發(fā)應(yīng)用都是極其方便的。

3.3 開發(fā)步驟

3.3.1算法模塊插件系統(tǒng)

算法模塊主要涉及到數(shù)據(jù)集清洗算法、數(shù)據(jù)挖掘算法、結(jié)果可視化算法等多種。而一個完整的執(zhí)行過程必須在原始數(shù)據(jù)集的噪聲及不規(guī)則數(shù)據(jù)的情況下借助數(shù)據(jù)集清洗算法把數(shù)據(jù)集統(tǒng)一進行整理。也或者是由異狗、分布式等數(shù)據(jù)源中轉(zhuǎn)化而得到,再自動生成規(guī)則的數(shù)據(jù)集。將這些規(guī)則的數(shù)據(jù)集利用數(shù)據(jù)挖掘算法予以處理,進而獲得數(shù)據(jù)挖掘結(jié)果信息,再經(jīng)過可視化算法的處理,最終將數(shù)據(jù)信息傳遞給用戶。其中,任何一個環(huán)節(jié)數(shù)據(jù)的調(diào)用都必須利用REST接口而實現(xiàn),并且接口間的數(shù)據(jù)信息轉(zhuǎn)換和傳遞都是采用XML格式。特別是近年來,由于數(shù)據(jù)挖掘平臺各種算法模塊插件的出現(xiàn),這樣一來,云計算平臺下的數(shù)據(jù)挖掘平臺所提供的功能也會逐步增多。

3.3.2數(shù)據(jù)集訪問模塊

該模塊的實現(xiàn)和上述算法模塊插件系統(tǒng)實現(xiàn)具有很多相同點。它也是通過插件方式進行維護和調(diào)用的。尤其是在訪問數(shù)據(jù)集的過程中,其訪問模塊文件被索引處在被用戶調(diào)用的狀態(tài)。而和算法模塊插件系統(tǒng)的不同之處是在調(diào)用數(shù)據(jù)集訪問模塊前,系統(tǒng)自動把數(shù)據(jù)機實例文件解析成若干個元數(shù)據(jù)組合及物理訪問地址,最后把此類數(shù)據(jù)組合成字典類型結(jié)構(gòu)的參數(shù)傳遞到數(shù)據(jù)機訪問模塊中。

4 結(jié)束語

總體來說,在云計算平臺下的數(shù)據(jù)挖掘系統(tǒng)逐步趨于完善,增強了數(shù)據(jù)規(guī)約的功能,從而更好地解決異構(gòu)數(shù)據(jù)訪問的問題。同時在App Engin開發(fā)平臺上,設(shè)計出一套更為完善的數(shù)據(jù)挖掘系統(tǒng),提升了云計算和數(shù)據(jù)挖掘技術(shù)結(jié)合的可靠性與高效性。文章主要針對基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)設(shè)計與實現(xiàn)予以深入的研究,并且對今后云計算環(huán)境下的數(shù)據(jù)挖掘系統(tǒng)的延伸發(fā)展予以展望,希望能夠通過論述對讀者產(chǎn)生一些積極影響。

參考文獻

[1] 楊慶平.基于云計算的數(shù)據(jù)挖掘平臺架構(gòu)及其關(guān)鍵技術(shù)研究[J].中興通訊技術(shù),2013,19(1);122-123.

[2] 黃章樹.基于云計算服務(wù)模式的數(shù)據(jù)挖掘應(yīng)用平臺的構(gòu)建[J].電信科學(xué),2012,28(1);138-139.

[3] 莊福振.基于云計算的大數(shù)據(jù)挖掘平臺[J].中興通訊技術(shù),2013,19(4);130-131.

作者簡介: