前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術(shù)在土壤肥力評價中應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:土壤肥力狀況直接影響農(nóng)作物的產(chǎn)量,傳統(tǒng)的農(nóng)業(yè)生產(chǎn)自動化水平低,化肥和農(nóng)藥的施放無法做到精確把控,同時缺乏對土壤肥力的實時在線監(jiān)測和評價,不利于農(nóng)作物的生長,嚴重時會給農(nóng)田和生態(tài)環(huán)境帶來較大的污染,影響農(nóng)作物的生產(chǎn)質(zhì)量和產(chǎn)量,對人類和牲畜的人身安全構(gòu)成了較大威脅。為此,深入研究分析了數(shù)據(jù)挖掘技術(shù),并將其應(yīng)用在土壤肥力評價系統(tǒng)中,針對具體的研究區(qū)域進行土壤圖設(shè)計和土壤狀態(tài)分析,建立了土壤肥力采樣數(shù)據(jù)庫,并利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則算法對土壤肥力和農(nóng)作物產(chǎn)量進行等級分類,計算分析得到土壤肥力與農(nóng)作物產(chǎn)量之間的關(guān)聯(lián)關(guān)系。結(jié)果表明:智能數(shù)據(jù)挖掘技術(shù)在土壤肥力評價系統(tǒng)中發(fā)揮了重要作用,在對土壤肥力進行準確監(jiān)控的同時能夠準確評價土壤肥力與農(nóng)作物產(chǎn)量之間的相關(guān)程度,對指導(dǎo)農(nóng)業(yè)生產(chǎn)、提高農(nóng)作物生產(chǎn)質(zhì)量和產(chǎn)量具有重要意義。
關(guān)鍵詞:土壤肥力評價;數(shù)據(jù)挖掘;數(shù)據(jù)庫;關(guān)聯(lián)規(guī)則算法
0引言
我國傳統(tǒng)的農(nóng)藥和化肥施放主要依靠作業(yè)人員的經(jīng)驗進行,施放效率低,農(nóng)藥利用率低,造成了農(nóng)藥和化肥的浪費,給生態(tài)環(huán)境帶來了一定的影響。農(nóng)藥和化肥的不合理利用會對農(nóng)作物的生長產(chǎn)生一定的制約,嚴重時會對消費者的健康造成威脅,因此對農(nóng)藥和化肥的合理利用、對土壤肥力的準確監(jiān)控越來越引起諸多學(xué)者的關(guān)注。隨著科學(xué)技術(shù)的發(fā)展,很多學(xué)者將神經(jīng)網(wǎng)絡(luò)算法、模糊理論及專家系統(tǒng)等先進理論應(yīng)用于土壤肥力監(jiān)測和評價系統(tǒng)中,對土壤肥力的狀態(tài)和信息有了一定的掌握。各種智能算法和先進理論解決了土壤肥力評價指標(biāo)的優(yōu)化問題,但是對土壤肥力評價系統(tǒng)的數(shù)據(jù)來源、數(shù)據(jù)實時性和數(shù)據(jù)可用性無法精準掌握,導(dǎo)致各類智能算法在土壤肥力評價系統(tǒng)中實時性和準確性不高,對土壤肥力評價的指導(dǎo)性不強。為此,筆者深入研究數(shù)據(jù)挖掘技術(shù),通過比較其中的關(guān)聯(lián)規(guī)則法、聚類分析法和人工神經(jīng)網(wǎng)絡(luò)法等不同算法,選用關(guān)聯(lián)規(guī)則法完成對所選研究區(qū)域土壤肥力狀況的分析,繪制了土壤肥力的空間變異圖,實現(xiàn)了對土壤肥力監(jiān)測的可視化,并應(yīng)用關(guān)聯(lián)規(guī)則法得到土壤肥力和農(nóng)作物產(chǎn)量的關(guān)聯(lián)關(guān)系,對指導(dǎo)農(nóng)業(yè)生產(chǎn)作業(yè)、提高農(nóng)業(yè)生產(chǎn)效益具有重要的借鑒意義。
1數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是一個信息探索的過程,是從大量的隨機數(shù)據(jù)中提取有用的潛在信息和數(shù)據(jù),并轉(zhuǎn)換為可以理解的數(shù)據(jù)。此類隨機數(shù)據(jù)多為不完全數(shù)據(jù),并伴隨有噪音、干擾信號等隨機信息。數(shù)據(jù)挖掘的對象既包括數(shù)據(jù)庫,還可以包含各類文本、視頻、圖像和Web數(shù)據(jù)等,解決了傳統(tǒng)數(shù)據(jù)庫無法預(yù)測未來發(fā)展趨勢的難題。數(shù)據(jù)挖掘的分析方法較多,主要包括決策樹、聚類分析法、關(guān)聯(lián)規(guī)則法、人工神經(jīng)網(wǎng)絡(luò)法和時序算法。具體功能如下:1)數(shù)據(jù)總結(jié)。運用統(tǒng)計分析法(求平均值、加權(quán)處理、直方圖)對數(shù)據(jù)源信息進行統(tǒng)計分析,便于數(shù)據(jù)分類。2)數(shù)據(jù)分類。利用分類函數(shù)將待數(shù)據(jù)挖掘的數(shù)據(jù)按不同類型、不同標(biāo)識進行分類。3)聚類。將數(shù)據(jù)庫信息按集群進行劃分,利用聚類分析法找出集群中特性相似的集群進行區(qū)分。4)關(guān)聯(lián)分析。通過關(guān)聯(lián)規(guī)則法計算分析數(shù)據(jù)庫中同一事件的不同項的關(guān)聯(lián)性,根據(jù)關(guān)聯(lián)性預(yù)測結(jié)果。5)預(yù)測。根據(jù)數(shù)據(jù)挖掘的結(jié)果對研究對象的發(fā)展規(guī)律進行預(yù)測,分析后續(xù)變化趨勢。
2研究區(qū)域概況
選取的研究區(qū)域為吉林省農(nóng)安縣開安鎮(zhèn),坐標(biāo)東經(jīng)121°10'、北緯44°10',大陸性季風(fēng)氣候,地下水源豐富,年平均降水量535㎜,為國家農(nóng)業(yè)示范基地。
2.1土壤圖設(shè)計通過查閱資料、查找相關(guān)部門網(wǎng)站信息,得到第2次土壤普查圖(比例1:5)。以此為基礎(chǔ),完成該研究區(qū)域土壤矢量圖的繪制,如圖1所示。
2.2土壤狀態(tài)分析
由圖1可知,農(nóng)安縣土壤的類型較多。按土壤的類型和狀態(tài)可將農(nóng)安縣土壤進行分類,如表1所示。
2.3土壤狀態(tài)采樣
將農(nóng)安縣土壤矢量圖和土壤狀態(tài)等數(shù)據(jù)進行分析處理,構(gòu)建土壤狀態(tài)數(shù)據(jù)庫,重點監(jiān)測土壤養(yǎng)分值和采樣點的經(jīng)緯度。土壤養(yǎng)分值主要包括3個指標(biāo),即堿解氮、有效磷和速效鉀。農(nóng)安縣土壤狀態(tài)采樣數(shù)據(jù)如表2所示。
3土壤肥力分布變化
通過對不同采樣點的土壤肥力狀態(tài)的監(jiān)測,完成了對土壤不同養(yǎng)分堿解氮、有效磷和速效鉀的含量分析和研究,得到土壤中堿解氮、有效磷和速效鉀的空間分布圖,如圖2、圖3所示。為確保數(shù)據(jù)的可靠性,對不同年份的土壤養(yǎng)分值進行匯總和分析,最后得到連續(xù)2年的堿解氮和速效鉀的空間分布變化圖。由圖2和圖3可知:土壤堿解氮含量呈下降趨勢。其中,第1年最小值為108mg/kg,最大值為216mg/kg,差值為108mg/kg;第2年最小值為86mg/kg,最大值為173mg/kg,差值為87mg/kg。這表明,經(jīng)過連續(xù)2年的精準施肥后,土壤肥力的差異逐漸變小。
4數(shù)據(jù)挖掘分析
4.1關(guān)聯(lián)規(guī)則算法
應(yīng)用關(guān)聯(lián)規(guī)則算法進行數(shù)據(jù)挖掘時,主要解決兩個問題,即頻繁項集和關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則算法的作業(yè)步驟為:①挖掘頻繁項集;②生成關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的頻繁項集與支持度相關(guān),即數(shù)據(jù)庫中支持度大于規(guī)定支持度的項目。關(guān)聯(lián)規(guī)則與支持度和可信度相關(guān),即支持度和可信度均大于規(guī)定支持度和可信度的關(guān)聯(lián)規(guī)則。支持度sup的計算公式為sup(A=>B)=sup(a∪b)={T|T∈Dand(a∪b)}D其中:支持度sup表示事件A和事件B同時出現(xiàn)的概率??尚哦萩onf的計算公式為conf(a=>b)=sup(a∪b)sup(a)其中,可信度conf表示條件概率。提升度lift的計算公式為lift=P(B|A)P(B)其中:提升度lift表示事件A對事件B的提升度。lift=1,說明事件A與事件B沒有關(guān)聯(lián);lift>1,說明事件A與事件B相關(guān)聯(lián),且關(guān)聯(lián)規(guī)則較好,關(guān)聯(lián)性好;lift<1,說明事件A與事件B相排斥,得到的關(guān)聯(lián)規(guī)則沒有意義,關(guān)聯(lián)性差。
4.2關(guān)聯(lián)規(guī)則分析
關(guān)聯(lián)規(guī)則算法是基于數(shù)據(jù)挖掘工具Weka軟件完成的。通過對采樣數(shù)據(jù)的分析計算,并將數(shù)據(jù)導(dǎo)入Weka軟件中,建立新的數(shù)據(jù)源,利用軟件自帶的算法庫,篩選頻繁項集,根據(jù)專家經(jīng)驗將數(shù)據(jù)分為6組,進行土壤肥力和農(nóng)作物產(chǎn)量的關(guān)聯(lián)規(guī)則計算,得到土壤肥力和產(chǎn)量數(shù)據(jù)的等級分類,如表3所示。由表3可知:根據(jù)專家經(jīng)驗,土壤養(yǎng)分值劃分為6個等級,農(nóng)作物產(chǎn)量劃分為3個等級。根據(jù)關(guān)聯(lián)規(guī)則,計算分析土壤肥力與農(nóng)作物產(chǎn)量之間的關(guān)聯(lián)性。
4.3關(guān)聯(lián)結(jié)果
運行Weka軟件,選取Apriori算法,設(shè)定支持度sup范圍為10%~100%,提升度lift大于1.0,計算關(guān)聯(lián)規(guī)則,得到關(guān)聯(lián)規(guī)則結(jié)果,如圖4所示。由圖4可知:當(dāng)速效磷等級為D時,農(nóng)作物產(chǎn)量為A的概率為95%;當(dāng)速效鉀為等級D的時候,農(nóng)作物產(chǎn)量為A的概率為63%;當(dāng)速效鉀等級為E時,農(nóng)作物產(chǎn)量為B的概率為46%;當(dāng)農(nóng)作物產(chǎn)量為A時,速效磷等級為D的概率為38%;當(dāng)速效磷等級為D時,農(nóng)作物產(chǎn)量為C的概率為45%。
5結(jié)論
為解決傳統(tǒng)土壤肥力監(jiān)測不及時、肥力評價不準確等問題,深入分析了數(shù)據(jù)挖掘技術(shù),對數(shù)據(jù)挖掘的主要算法和功能進行分析,完成了研究區(qū)域的土壤圖繪制和土壤狀態(tài)分析。同時,對不同采樣點的土壤肥力和經(jīng)緯度進行監(jiān)測,完成了土壤不同養(yǎng)分堿解氮、有效磷和速效鉀的空間分布變化趨勢的分析。應(yīng)用關(guān)聯(lián)規(guī)則算法,利用數(shù)據(jù)挖掘工具Weka,完成土壤肥力與產(chǎn)量的等級分類,得到土壤肥力與農(nóng)作物產(chǎn)量的關(guān)聯(lián)關(guān)系。結(jié)果表明:智能數(shù)據(jù)挖掘技術(shù)在土壤肥力評價系統(tǒng)中發(fā)揮了重要作用,既可以對土壤肥力的空間分布進行準確監(jiān)測,又能夠?qū)r(nóng)作物產(chǎn)量進行準確預(yù)測,在提高農(nóng)藥和化肥利用率的同時減小對生態(tài)環(huán)境的危害,對提高農(nóng)業(yè)生產(chǎn)質(zhì)量具有顯著效果。
作者:徐霖 單位:無錫工藝職業(yè)技術(shù)學(xué)院