前言:想要寫出一篇引人入勝的文章?我們特意為您整理了環(huán)境監(jiān)測數(shù)據(jù)分析中層次聚類分析應用范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:層次聚類分析作為一種常用的聚類分析方法,能有效識別環(huán)境監(jiān)測數(shù)據(jù)集中的隱藏關(guān)系。文章主要介紹了層次聚類分析在水、大氣、土壤等環(huán)境監(jiān)測數(shù)據(jù)分析中的應用,提出以熱圖形式優(yōu)化層次聚類分析可視化結(jié)果,并對熱圖在土壤污染狀況調(diào)查項目的應用進行展望。
關(guān)鍵詞:層次聚類分析;環(huán)境監(jiān)測數(shù)據(jù)分析;熱圖;應用
引言
定期的環(huán)境監(jiān)測會積累龐大而復雜的化學數(shù)據(jù)集,越來越多的研究者開始關(guān)注數(shù)據(jù)集中的內(nèi)在關(guān)系。多元統(tǒng)計分析是研究多變量相互之間關(guān)系的統(tǒng)計分析方法,是環(huán)境監(jiān)測數(shù)據(jù)分析的有力工具。常用的多元統(tǒng)計分析包括聚類分析、主成分/因子分析、判別分析等,其中聚類分析不僅用于環(huán)境管理研究,而且在環(huán)境監(jiān)測領(lǐng)域發(fā)揮巨大作用。聚類分析可識別變量間的隱藏關(guān)系,僅用一小部分因子表示,且沒有損失太多數(shù)據(jù)信息,有利于研究者快速掌握環(huán)境介質(zhì)污染狀況,判別各介質(zhì)中潛在的污染來源[1]。
1聚類分析方法介紹
聚類分析也稱集群分析、分類分析或數(shù)值分類,其基本思想是按照所研究的樣品或變量之間存在相似性或不相似性,以一些能夠度量樣品或變量之間相似程度的統(tǒng)計量作為劃分類型的依據(jù),將數(shù)據(jù)分為若干類別,使類別內(nèi)樣品(或變量)差異盡可能小,類別間差異盡可能大。通常用距離來度量樣品之間的相似性,用相似性系數(shù)來度量變量之間的相似性,結(jié)果以聚類樹狀圖顯示。聚類分析是一種探索性分析,按聚類的方法可分為層次聚類法、非層次聚類法等。其中,常用的是層次聚類法,也稱系統(tǒng)聚類法,其實質(zhì)是根據(jù)變量或樣品之間的親疏程度,從最相似的對象開始,逐步聚成一類[2]。按照分析的對象不同聚類分析也可分為樣本聚類(Q型聚類)和變量聚類(R型聚類)。該文將主要介紹層次聚類分析在環(huán)境監(jiān)測數(shù)據(jù)分析中的應用。
2層次聚類分析在環(huán)境監(jiān)測數(shù)據(jù)分析中的應用
層次聚類分析作為一種常用的聚類分析方法,可有效降低原始監(jiān)測數(shù)據(jù)集的維度,簡化數(shù)據(jù)的復雜程度,以監(jiān)測點位、時間、指標和污染評價結(jié)果等為對象進行聚類分析,便于分析各指標時空分布特征及指標間的相關(guān)性。適用于不同環(huán)境介質(zhì)監(jiān)測過程獲得的數(shù)據(jù)。近年來,層次聚類分析作為傳統(tǒng)多元統(tǒng)計方法,常用于地表水、地下水、大氣和土壤環(huán)境監(jiān)測數(shù)據(jù)分析[3]。對地表水體的監(jiān)測點位和時間進行層次聚類分析,可得到若干點位集群和時間集群,監(jiān)測點位和時間的層次聚類分析結(jié)果可作為采樣斷面和頻率優(yōu)化的重要依據(jù),可有效降低采樣成本[4][5]。除分析監(jiān)測數(shù)據(jù)集的時空變化特征外,層次聚類分析也用于監(jiān)測指標的統(tǒng)計分析,便于判別污染來源。秦文婧等對柳江煤礦所在區(qū)域的地下水中的離子進行層次聚類分析,得到不同離子的相似來源,有助于分析煤礦對區(qū)域地下水水質(zhì)造成的影響[6]。層次聚類分析同樣適用于大氣污染物時空分布特征研究和污染溯源。陳楊歡等在分析上海市大氣PM2.5時空分布特征時引入層次聚類法,揭示不同季節(jié)和地理位置的大氣PM2.5濃度相互關(guān)系[7]。劉杰等對陜西省某工業(yè)園區(qū)春季大氣降塵中的重金屬進行聚類分析,判斷該工業(yè)區(qū)重金屬污染主要受金屬冶煉、交通運輸和燃煤等影響[8]。相對水和大氣環(huán)境的環(huán)境監(jiān)測,土壤環(huán)境監(jiān)測頻次較少,監(jiān)測數(shù)據(jù)集通常由空間維度不同指標監(jiān)測濃度組成。因此,層次聚類分析法也可適用于土壤環(huán)境污染物的空間分布特征分析和污染溯源方面。方淑波等在研究浦東新區(qū)土壤重金屬沿城鄉(xiāng)梯度分布特征時引入層次聚類分析不同金屬的空間差異性,識別出城市土壤重金屬環(huán)境風險的優(yōu)先控制區(qū)域[9]。通過對土壤污染物指標的聚類分析,可協(xié)助識別污染源。如有研究者以鉛鋅尾礦區(qū)的11種重金屬為研究對象,采用層次聚類分析等統(tǒng)計學方法判斷尾礦區(qū)重金屬來源[10]。層次聚類分析在城市、農(nóng)村等土壤環(huán)境污染溯源方面取得了較好的效果,但該方法在建設用地土壤污染狀況調(diào)查數(shù)據(jù)統(tǒng)計分析中的應用鮮有報道[11]。利用層次聚類分析具體地塊土壤污染調(diào)查監(jiān)測數(shù)據(jù)集,既可體現(xiàn)污染物在采樣點位的分布特征,又能判別檢出污染物之間的相似程度,有助于深入剖析地塊土壤污染狀況和污染來源。此外,土壤監(jiān)測數(shù)據(jù)層次聚類分析結(jié)果可佐證資料收集、人員訪談、現(xiàn)場踏勘等工作階段識別的污染源,間接反映出前期調(diào)查的完整度和準確度。
3層次聚類分析可視化結(jié)果的優(yōu)化
層次聚類分析結(jié)果以聚類樹狀圖顯示,僅能顯示單個維度的分析結(jié)果。將樣本和變量之間的層次聚類分析結(jié)果進行組合,可呈現(xiàn)兩個維度的聚類結(jié)果,對于數(shù)據(jù)的分析和表達將更有效。Laursen等建立了雙層次聚類分析,用于識別在正常情況和肝硬化時丹麥人、格陵蘭因紐特人體肝組織中的元素之間的相關(guān)性和協(xié)同作用[12]。雙層次聚類分析同樣適用于環(huán)境監(jiān)測領(lǐng)域。Ma等檢測了黃河的三個區(qū)域沉積物中重金屬的濃度,水平系統(tǒng)樹圖中包括重金屬與pH、總碳、總有機碳和地區(qū)生產(chǎn)總值的聚類結(jié)果;垂直系統(tǒng)樹圖是采樣位點的聚類結(jié)果[13]。由此可知,雙層次聚類分析結(jié)果體現(xiàn)更多的數(shù)據(jù)集信息和統(tǒng)計分析結(jié)果。熱圖是一種常見的可視化方法的形式,可將多維數(shù)據(jù)以二維的方式完全直觀地呈現(xiàn),并用顏色梯度變化來表示數(shù)值的大小[14]。熱圖已在在群落生態(tài)學、生物分類學與系統(tǒng)學等方面應用廣泛[15]。環(huán)境監(jiān)測獲得的數(shù)據(jù)集通常包括時間、空間、指標等多維度信息,熱圖對層次聚類分析結(jié)果的可視化也有利于解釋實際環(huán)境數(shù)據(jù),但將熱圖應用于環(huán)境監(jiān)測數(shù)據(jù)集的統(tǒng)計分析的研究較少。采用熱圖解析環(huán)境監(jiān)測數(shù)據(jù)和相關(guān)污染指標之間的相關(guān)性,既可保留原始數(shù)據(jù)的完整性,也能顯示雙層次聚類分析結(jié)果。因此,在環(huán)境監(jiān)測數(shù)據(jù)集的分析中利用熱圖分析監(jiān)測結(jié)果更為直觀,且有助于污染溯源分析。
結(jié)語
層次聚類分析有助于識別環(huán)境監(jiān)測數(shù)據(jù)集中的內(nèi)在聯(lián)系,能較好地應用于環(huán)境污染物時空差異性分析和污染溯源。目前,該方法主要用于大尺度空間領(lǐng)域的環(huán)境監(jiān)測數(shù)據(jù)統(tǒng)計分析,而在實際項目中的應用較少。鑒于熱圖在統(tǒng)計分析和可視化方面的優(yōu)勢,該方法完全可用于具體土壤污染狀況調(diào)查項目。通過熱圖分析監(jiān)測數(shù)據(jù)集,挖掘闡釋污染物間的相似性以及空間上差異性,以提高污染源識別的有效性和精準度。
作者:汪宇鵬 單位:上海市政工程設計研究總院