前言:想要寫出一篇引人入勝的文章?我們特意為您整理了決策樹(shù)對(duì)構(gòu)造領(lǐng)域本體的作用范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
本文作者:王夙娟 單位:菏澤學(xué)院計(jì)算機(jī)與信息工程系
領(lǐng)域本體是專業(yè)性的本體,提供了某個(gè)專業(yè)學(xué)科領(lǐng)域中概念的詞表以及概念間的關(guān)系,或在該領(lǐng)域里占主導(dǎo)地位的理論。領(lǐng)域本體構(gòu)建的方法:知識(shí)工程方法、企業(yè)建模法、循環(huán)獲取法、methontology、IDEF-5、Bemerasetal等。然而,要了解本體構(gòu)建完整的過(guò)程,骨架法在所有方法中最具有參考性,它提供一個(gè)本體構(gòu)建的方法學(xué)框架,所以本文使用數(shù)據(jù)倉(cāng)庫(kù)中的一些相關(guān)技術(shù)、數(shù)據(jù)挖掘中決策樹(shù)的分類與預(yù)測(cè)的技術(shù),以骨架法的中心思想作為參考和指導(dǎo)方針來(lái)構(gòu)建領(lǐng)域本體,最后對(duì)構(gòu)建好的本體模型進(jìn)行文檔化。以下提到的本體均指領(lǐng)域本體。
1決策樹(shù)的相關(guān)知識(shí)
決策樹(shù)是一種類似于流程圖的樹(shù)結(jié)構(gòu);其中,每個(gè)內(nèi)部節(jié)點(diǎn)(非樹(shù)葉節(jié)點(diǎn))表示在一個(gè)屬性上的測(cè)試,每個(gè)分枝代表一個(gè)測(cè)試輸出,而每個(gè)樹(shù)葉節(jié)點(diǎn)(終點(diǎn))存放一個(gè)類標(biāo)號(hào),樹(shù)的最頂層節(jié)點(diǎn)是根節(jié)點(diǎn)。在本體的構(gòu)建過(guò)程中樹(shù)節(jié)點(diǎn)代表類或者屬性,節(jié)點(diǎn)間的連接線代表類與類或者類與屬性或者屬性與屬性之間的關(guān)系,即可傳遞性、單繼承性。決策樹(shù)的構(gòu)造不需要任何領(lǐng)域知識(shí)或參數(shù)設(shè)置,因此適合于探測(cè)知識(shí)發(fā)現(xiàn);獲取的知識(shí)用樹(shù)的形式表示是直觀的,并且容易被人理解;決策樹(shù)歸納的學(xué)習(xí)和分類步驟是簡(jiǎn)單和快速的;一般情況下,決策樹(shù)分類器具有很好的準(zhǔn)確率。
1.1骨架法方法的研究
骨架法(MikeUsholddede&KingUsc95)又稱ENTERISE法,是英國(guó)愛(ài)丁堡大學(xué)人工智能應(yīng)用研究所根據(jù)用于企業(yè)建摸的Enter-priseOntology所得出來(lái)的。
1.2骨架法的步驟:
a.確定構(gòu)建本體的目的和范圍;b.構(gòu)建本體;c.本體評(píng)估;d.文檔化本文使用數(shù)據(jù)倉(cāng)庫(kù)中的一些相關(guān)技術(shù)、數(shù)據(jù)挖掘中分類與預(yù)測(cè)的決策樹(shù)技術(shù),以骨架法的中心思想作為參考和指導(dǎo)方針來(lái)構(gòu)建領(lǐng)域本體,最后對(duì)構(gòu)建好的本體根據(jù)決策數(shù)提取規(guī)則的特點(diǎn)進(jìn)行文檔化。
2構(gòu)建本體的過(guò)程———以構(gòu)建現(xiàn)代交通工具本體為例
2.1領(lǐng)域需求分析
領(lǐng)域需求分析是構(gòu)建本體的重要階段,沒(méi)有充足的領(lǐng)域分析就不可能構(gòu)建出好的本體.交通工具是為了滿足人們出行的需求而研制的,并且在不段的發(fā)展變化。所以在進(jìn)行領(lǐng)域分析的時(shí)候要以發(fā)展創(chuàng)造的觀點(diǎn)來(lái)進(jìn)行領(lǐng)域需求分析,即進(jìn)行領(lǐng)域分析的同時(shí)要進(jìn)行趨勢(shì)的預(yù)測(cè)。層次一:客觀描述與記錄(objectivedescriptionandrecord)———對(duì)領(lǐng)域需求進(jìn)行精確、全面地搜集與記錄客戶的需求或相關(guān)的業(yè)務(wù)、數(shù)據(jù)。層次二:模式歸納與發(fā)現(xiàn)(patternsinductionanddiscovery)———按照一定的建模方法論及框架進(jìn)行歸納\建模,并盡量揭示在包含在快照的客觀記述中并非顯而易見(jiàn)的模式或規(guī)律;層次三:模式分析與預(yù)測(cè)(patternsanalysisandinnovation)———在現(xiàn)存模式的基礎(chǔ)上總結(jié)不同模式背后隱含的規(guī)律,研究應(yīng)用對(duì)需求的異化作用,發(fā)覺(jué)深層次規(guī)律,預(yù)測(cè)需求變化,揭示新的工作方式,創(chuàng)建新的、有價(jià)值的模式。
2.2利用決策樹(shù)算法創(chuàng)建本體
本體模型的表示形式有多種,這里采用分類決策樹(shù)來(lái)表示;本體的生成方法有三種,這里采用自頂向下的生成方法。根據(jù)領(lǐng)域需求分析,經(jīng)過(guò)屬性的不斷疊加、迭代,得到本體的決策樹(shù)。
2.2.1領(lǐng)域本體集成。領(lǐng)域本體集成的關(guān)鍵技術(shù)是本體映射,而本體映射定義一套規(guī)則,指明一個(gè)本體中的術(shù)語(yǔ)在另一個(gè)本體中的相關(guān)含義,由中介(mediator)在應(yīng)用程序運(yùn)行時(shí)執(zhí)行。本體決策樹(shù)所提取的規(guī)則之間都是互斥的,每個(gè)樹(shù)葉都有一個(gè)規(guī)則,并且任何一個(gè)屬性都只能映射到一個(gè)樹(shù)葉。
2.2.2本體構(gòu)建工具。在這里使用Protégé,它是由斯坦福大學(xué)研制開(kāi)發(fā)的、基于Java環(huán)境的本體開(kāi)發(fā)工具,它允許用戶自己定制知識(shí)獲取界面的特點(diǎn)來(lái)構(gòu)建本體。
2.3本體評(píng)估
本體構(gòu)建過(guò)程中使用決策樹(shù)構(gòu)建的原理,使用分類決策樹(shù)所構(gòu)建的本體具有很多優(yōu)點(diǎn),如下;利用分類決策樹(shù)所構(gòu)建本體的學(xué)習(xí)和分類步驟是簡(jiǎn)單和快速的,而且本體類中屬性的分類具有很好的準(zhǔn)確率;這種本體的構(gòu)建適合于探測(cè)知識(shí)發(fā)現(xiàn);本體分類決策樹(shù)模型表示是直觀的,并且容易被人理解。
2.4文檔化
對(duì)上面本體的分類決策樹(shù)模型使用IF-THEN規(guī)則分類。使用IF-THEN規(guī)則得到文檔圖,每一條分支為一個(gè)元組,所有的分支數(shù)為數(shù)據(jù)集|D|,設(shè)ncovers為乘坐R交通工具的元組數(shù),ncorrect為正確分類的元組數(shù),則我們可以得到乘坐這種交通工具的覆蓋率和準(zhǔn)確率,公式:Coverage(R)=ncovers/|D|,Accuracy(R)=ncorrect/ncovers,結(jié)果如表1所示。
結(jié)束語(yǔ)
領(lǐng)域本體的構(gòu)建是一個(gè)增量迭代的開(kāi)發(fā)過(guò)程,也是一個(gè)創(chuàng)造性的過(guò)程,對(duì)任何專業(yè)領(lǐng)域來(lái)說(shuō),由于應(yīng)用平臺(tái)不同,設(shè)計(jì)者對(duì)專業(yè)領(lǐng)域的理解不同,構(gòu)建出來(lái)的本體也不同。本文提出的是以骨架法作為參考,運(yùn)用數(shù)據(jù)挖掘中有關(guān)分類與預(yù)測(cè)的決策樹(shù)技術(shù)來(lái)實(shí)現(xiàn)一種具體的領(lǐng)域本體構(gòu)建方法,希望對(duì)大家在本體開(kāi)發(fā)方面有些參考性。