公務(wù)員期刊網(wǎng) 論文中心 正文

冠心病中醫(yī)證候數(shù)據(jù)挖掘研究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了冠心病中醫(yī)證候數(shù)據(jù)挖掘研究范文,希望能給你帶來靈感和參考,敬請閱讀。

冠心病中醫(yī)證候數(shù)據(jù)挖掘研究

[摘要]綜述因子分析、聚類分析、貝葉斯網(wǎng)絡(luò)、多因子降維、決策樹、人工神經(jīng)網(wǎng)絡(luò)、支持向量機、文獻挖掘、系統(tǒng)評價9種數(shù)據(jù)挖掘算法及方法相關(guān)內(nèi)容,認識各自優(yōu)勢與不足。概括9種方法在冠心病中醫(yī)證候挖掘中的應(yīng)用,闡釋冠心病中醫(yī)證候分布特征及演變規(guī)律,為冠心病中醫(yī)辨證論治提供客觀化依據(jù)。參考文獻30篇。

[關(guān)鍵詞]冠心?。蛔C候;因子分析;聚類分析;貝葉斯網(wǎng)絡(luò);多因子降維;決策樹;人工神經(jīng)網(wǎng)絡(luò);支持向量機;文獻挖掘;系統(tǒng)評價

1因子分析

因子分析是簡化、分析高維數(shù)據(jù)的一種統(tǒng)計方法,最早由英國心理學(xué)家C.E.斯皮爾曼提出。作為一種非線性多元統(tǒng)計分析方法,通過尋找支配多個原始指標(biāo)相關(guān)關(guān)系的有限個潛在變量,對原始指標(biāo)之間的相關(guān)性或協(xié)方差關(guān)系進行闡釋。簡化變量信息,挖掘隱性變量,來讓數(shù)據(jù)“自己說話”[3]。近年來,因子分析法在系統(tǒng)綜合評價中顯示出優(yōu)勢,分析全面,可排除各指標(biāo)之間的相關(guān)重疊,能有效提取目標(biāo)因子,對各因子權(quán)重具有較好的客觀評定。張琳婷[4]利用因子分析法研究冠心病患者發(fā)病早期證候要素及證候特征,從頻率>20%的88個指標(biāo)變量中提取出29個發(fā)病早期指標(biāo)變量,并對冠心病中醫(yī)癥狀、體征進行探索性因子分析,提取出綜合因子、胸悶因子、嘔吐因子等12個公因子,為早期冠心病中醫(yī)證候要素與證候特征奠定數(shù)據(jù)理論基礎(chǔ)。吳旸等[5]研究348例行冠脈造影病例信息,應(yīng)用因子分析對四診信息降維處理,得出虛證是冠心病主要證型,并獲取痰濕、血瘀、脾腎氣虛、氣陰兩虛等16個公因子,為冠心病發(fā)病提前預(yù)警提供依據(jù)。因子分析法在冠心病證候綜合系統(tǒng)評價中彰顯優(yōu)勢,分析全面,但局限在于僅適用于綜合性評價,且易受數(shù)據(jù)樣本量及成分的影響。

2聚類分析

聚類分析也稱點群分析、集群分析,是理想的多變量統(tǒng)計技術(shù),主要有分層聚類法和迭聚類分析法兩種。同時聚類分析將搜集到的對象信息借助于數(shù)理統(tǒng)計方法進行歸類,是將現(xiàn)象分類的一種統(tǒng)計學(xué)方法,分指標(biāo)聚類(R型聚類)和樣品聚類(Q型聚類)兩種。在中醫(yī)證候研究中,聚類分析可對疾病的一般特征、分類、分級、證型分布及癥狀組成等進行統(tǒng)計學(xué)分析,客觀的將信息結(jié)果進行分類,近年來被廣泛應(yīng)用。王階等[6]對25l例穩(wěn)定型心絞痛患者進行證候分類,采用證素組合規(guī)律研究,將癥狀總結(jié)成心氣虧虛、脾氣虛弱、氣陰兩虛、痰瘀互阻4類,發(fā)現(xiàn)氣虛+血瘀、血瘀+痰濁、心氣虛+痰濁+血瘀為其主要證素組合形式,特別指出運用聚類分析和對應(yīng)分析方法對證候要素組合規(guī)律研究較佳。張明雪等[7]通過聚類統(tǒng)計發(fā)現(xiàn),冠心病在發(fā)生發(fā)展中證候呈現(xiàn)一定規(guī)律,發(fā)展早期以氣滯心胸、氣陰兩虛證為主;發(fā)作期以氣滯痰阻、寒凝心脈、心陽不振、瘀血陽微證為主;緩解期主要以肝脾失調(diào)、心腎陽虛、心肺氣虛證為主;而恢復(fù)期則以心氣虛、氣陰兩虛、陽虛氣滯證占據(jù)多數(shù)。鄒演梅等[8]也通過聚類分析將冠心病心絞痛中醫(yī)證候歸納成6類,即氣虛血瘀、氣陰兩虛、陰虛痰瘀、寒凝血瘀、痰濁內(nèi)阻、氣滯痰熱,并總結(jié)出基于特征加權(quán)的聚類分析得出的冠心病心絞痛證候分型與臨床符合度較高的結(jié)論,在疾病證候分型研究領(lǐng)域中值得進一步推廣。聚類分析模型簡便、直觀,適用于冠心病中醫(yī)證型、證素的分類及比較。局限在于適用樣本量小,難于有效處理大樣本數(shù)據(jù)。

3貝葉斯網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)又稱信念網(wǎng)絡(luò)、因果網(wǎng)絡(luò),是一種基于概率推理的圖形化網(wǎng)絡(luò)[9]。通過將概率推理和網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合,用概率測度的權(quán)重表達變量間的相互關(guān)系。貝葉斯網(wǎng)絡(luò)能將不完整、不確定的信息進行學(xué)習(xí)和推理,以條件概率加以表達。通過辨識中醫(yī)診斷證候,對中醫(yī)診斷學(xué)的發(fā)展及應(yīng)用有重要意義[10]。在處理中醫(yī)臨床癥狀分類方面,準(zhǔn)確度可達98%以上[11],近年來被應(yīng)用于冠心病中醫(yī)證候研究中。吳榮等[12]利用貝葉斯網(wǎng)絡(luò)挖掘名老中醫(yī)診療辨證信息,建立起冠心病名老中醫(yī)診療數(shù)據(jù)庫,總結(jié)出陽虛血瘀、血瘀痰阻等冠心病心絞痛常見證候,提取到冠心病心絞痛8個證候要素,其中血瘀占到92.17%,成為冠心病心絞痛的主要病理因素,并提出氣虛痰濁血瘀證是冠心病的最常見證候。徐璡等[13]收集835例冠心病患者中醫(yī)四診信息,運用貝葉斯網(wǎng)絡(luò)建立融合模型進行分類識別研究,得出血瘀、痰濁、心氣虛、心陰虛、心陽虛5個證型識別率,其中陽虛、血瘀識別率最高,為冠心病中醫(yī)證候分類診斷提供依據(jù),證實了貝葉斯網(wǎng)絡(luò)是中醫(yī)證候客觀化、規(guī)范化研究中的有效方法,并顯示出其良好的應(yīng)用前景。貝葉斯網(wǎng)絡(luò)具有量化評價的優(yōu)勢,評價結(jié)果更為科學(xué)、客觀。龐大的數(shù)據(jù)體系也加大了其分析處理難度,在解決復(fù)雜問題上有所局限。

4多因子降維

多因子降維是近年來流行的一種新的統(tǒng)計分析方法。其中,“因子”作為交互作用研究變量[14],“維”特指多因子組合個數(shù)。目前多因子降維主要被應(yīng)用于衛(wèi)生統(tǒng)計學(xué)、遺傳學(xué)以及流行病學(xué)中。近年來在心血管疾病及惡性腫瘤等復(fù)雜疾病中得到廣泛應(yīng)用。李四維[15]運用多因子降維探究冠心病穩(wěn)定期患者中醫(yī)證候演變規(guī)律,指出冠心病穩(wěn)定期的主要證侯包括血瘀、痰濁、氣虛、毒證,強調(diào)毒證、氣虛證為發(fā)生心血管事件的證候特點。宋慶橋[16]應(yīng)用MDR方法構(gòu)建相關(guān)數(shù)據(jù)模型,分析冠心病穩(wěn)定型心絞痛臨床表現(xiàn)與證候要素、常見證候之間以及與相關(guān)血清蛋白表達的關(guān)系,發(fā)現(xiàn)痰、瘀為冠心病穩(wěn)定型心絞痛的主要證候要素,而氣虛血瘀證、痰瘀互結(jié)證構(gòu)成其主要證候,同時總結(jié)出相關(guān)血清蛋白表達規(guī)律:血清tPAI-1、sVCAM-1、sICAM-1蛋白在痰、瘀、氣虛、陰虛證素中表達升高,在氣虛血瘀、痰瘀互結(jié)等證候中表達升高,在氣虛血瘀痰阻證、氣陰兩虛痰阻證等復(fù)合證候中也有表達升高趨勢。多因子降維能夠彌補Logistic回歸在處理高階交互作用時的局限,在分析連續(xù)變量情況下優(yōu)勢明顯。但面對低維度數(shù)據(jù),多因子降維發(fā)現(xiàn)交互作用的能力也會降低。

5決策樹

決策樹作為一種數(shù)據(jù)挖掘算法,主要用來解決分類問題[17]。通過將問題搜索空間分成若干,以樹形結(jié)構(gòu)的每個結(jié)點引出與之相關(guān)問題的可能答案,并通過葉結(jié)點呈現(xiàn)出對問題解決方案的預(yù)測。模型直觀,描述簡單,分類速度快,效率高,結(jié)果易于理解,對輸入數(shù)據(jù)的高維屬性和分類標(biāo)識彈性及穩(wěn)定性較佳,可很好地擴展到中小數(shù)據(jù)樣本中,能夠同時處理數(shù)據(jù)型和常規(guī)型兩種屬性,易于推出相應(yīng)的邏輯表達式,簡便快捷,特異性高,其中抽象交替決策樹(ADTree)特異性為95.99%,目前在中醫(yī)證候挖掘中得以廣泛應(yīng)用。史琦等[18]用決策樹方法對89個臨床指標(biāo)進行分析,提取出不穩(wěn)定型心絞痛痰瘀互阻證的規(guī)律特征,并形成識別模式,檢驗正確率為79.81%。通過將總膽紅素、高敏C反應(yīng)蛋白、谷氨酰轉(zhuǎn)肽酶、空腹血糖、血小板和P-R間期6個指標(biāo)納入決策樹模型,發(fā)現(xiàn)決策樹模型模式識別清晰、直觀,能夠自動歸納識別規(guī)律,對證型-理化指標(biāo)對應(yīng)模式的數(shù)據(jù)挖掘具有一定優(yōu)勢,在處理冠心病大樣本數(shù)據(jù)中發(fā)揮重要作用,但目前數(shù)據(jù)類型的非連續(xù)性是其局限。

6人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)具有較強的魯棒性、容錯性及自組織性,以神經(jīng)元為基本運算單位,模擬生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與功能,完成對信息的加工與處理,近年來在冠心病中醫(yī)證候數(shù)據(jù)挖掘中得以推廣應(yīng)用,以徑向基神經(jīng)網(wǎng)絡(luò)(RBFN)方法最佳,正確率可達91.49%。孫貴香等[19]以矩陣實驗室(MATLAB)為平臺建立冠心病中醫(yī)證候BP神經(jīng)網(wǎng)絡(luò)模型,運用回顧性及前瞻性檢驗方法對該模型性能進行客觀檢測,對496例回顧性檢驗和132例前瞻性檢驗的診斷準(zhǔn)確率分別為90.5%、91.36%,體現(xiàn)出中醫(yī)整體觀念與辨證論治的內(nèi)涵,較好地驗證了人工神經(jīng)網(wǎng)絡(luò)在冠心病中醫(yī)證候規(guī)律挖掘中的重要意義,表明人工神經(jīng)網(wǎng)絡(luò)對證候內(nèi)在規(guī)則挖掘性能良好,顯示其在中醫(yī)證候規(guī)范化研究方面的應(yīng)用前景廣闊。神經(jīng)網(wǎng)絡(luò)對復(fù)雜數(shù)據(jù)能夠達到精準(zhǔn)預(yù)測,在處理類別及連續(xù)變量樣本方面具備一定優(yōu)勢,但其對高維變量的處理仍有所局限。

7支持向量機

支持向量機作為一種新興統(tǒng)計分類方法,以達到結(jié)構(gòu)風(fēng)險最小化為基本原則,通過將非線性數(shù)據(jù)賦予高維特征性,構(gòu)造出最優(yōu)分類超平面,可以有效彌補傳統(tǒng)算法中維數(shù)災(zāi)難及過擬合等的缺陷,目前主要用于小樣本、非線性及高維模式識別的問題解決[20]。研究指出,在冠心病的中醫(yī)證候數(shù)據(jù)挖掘方法中,支持向量機是其最優(yōu)選擇[21],而在支持向量機中,Libsvm方法最佳。王階等[22]運用支持向量機方法從115例冠心病典型醫(yī)案中提取出血瘀、痰濁、氣虛等8個主要證素,通過量化診斷,闡釋相應(yīng)證素應(yīng)證組合規(guī)律,證素組合形以2、3證組合最為常見,3證組合占到47.83%,2證組合占到41.74%,且以虛實夾雜為主,占72.17%。許文杰等[23]記錄528例冠心病患者中醫(yī)脈圖,運用支持向量機方法應(yīng)用脈象信號非動力學(xué)特征,結(jié)合望診、問診信息,建立冠心病證候診斷模型,發(fā)現(xiàn)問診、望診參數(shù)聯(lián)合脈象信號時域特征參數(shù)建立起的證候模型,平均識別準(zhǔn)確率70.17%,脈象信號RQA特征參數(shù)代替其時域特征參數(shù)參與建立起的證候模型,平均識別準(zhǔn)確率可達82.83%。從而揭示脈象信號非動力學(xué)特征參與冠心病證候診斷模型建立可以有效提高模型平均識別準(zhǔn)確率的規(guī)律。支持向量機在小樣本冠心病中醫(yī)證候研究中發(fā)揮其優(yōu)勢,但對于大樣本或復(fù)雜數(shù)據(jù)模型的處理有一定局限。

8文獻挖掘

文獻挖掘又稱文獻分析,研究對象主要是非結(jié)構(gòu)化數(shù)據(jù),是從文本中發(fā)現(xiàn)潛在、隱藏、歸納性知識的一種方法[24]。具體步驟主要包括對文獻的搜集、鑒別、整理、分析,形成對事實科學(xué)的認識,近年來被廣泛應(yīng)用于冠心病的中醫(yī)臨床研究。田松等[25]基于現(xiàn)代文獻對3300篇相關(guān)文獻進行綜合收集與整理,最終篩選出58篇合格文獻,總計7680例病例,通過對近10年關(guān)于冠心病辨證與證素證型文獻檢索,挖掘出28種冠心病中醫(yī)證型,血瘀、痰濁、氣虛為其主要證素分布規(guī)律。證素組合形式以單證素和兩證素為主,分別占70.75%、26.07%,揭示冠心病主要證候要素為血瘀、痰濁,主要證型以單證素為主,而心血瘀阻型、痰濁阻滯型、心氣不足型分布最為廣泛。李艷娟[26]通過中國生物醫(yī)學(xué)文獻光盤數(shù)據(jù)庫分級檢索1994至2013年近10年國內(nèi)核心期刊文獻,共檢出文獻489篇,篩選出合格文獻25篇,病例3090例,建立計量診斷表,其敏感度、特異性、準(zhǔn)確性均得到了較好的驗證,統(tǒng)計分析冠心病中醫(yī)證候,發(fā)現(xiàn)心血瘀阻證、心氣虧虛證、痰阻心脈證為冠心病心絞痛主要證型,揭示將中醫(yī)病、證規(guī)范化與計量化的可行性,為冠心病心絞痛臨床診斷創(chuàng)新辨證分型模式。毛靜遠等[27]在參閱近40年308篇文獻的基礎(chǔ)上研究出氣虛、陰虛是冠心病虛證常見證素,血瘀、痰濁、氣滯為冠心病實證常見證素,且血瘀、痰濁等實證證候要素比重呈現(xiàn)出逐年增長態(tài)勢。文獻挖掘適用于大樣本、信息復(fù)雜的研究對象,在冠心病中醫(yī)證候研究工作中突顯優(yōu)勢。由于樣本信息龐大且缺乏明確統(tǒng)一標(biāo)準(zhǔn),因而應(yīng)用文獻挖掘法難免存在較大誤差,在準(zhǔn)確度上存在一定局限。

9系統(tǒng)評價

系統(tǒng)評價和Meta分析是循證醫(yī)學(xué)中的重要研究方法。系統(tǒng)評價從某一具體臨床問題入手,系統(tǒng)、全面地搜集現(xiàn)有已發(fā)表或未發(fā)表的臨床研究數(shù)據(jù),以嚴(yán)謹為評價原則[28],篩選出合格文獻,通過定性、定量合成,綜述出可靠結(jié)論,同時可隨臨床研究的新近成果及時進行更新。系統(tǒng)評價具體步驟主要有:確立標(biāo)題→收集文獻→選擇文獻→評價文獻→收集數(shù)據(jù)→分析數(shù)據(jù)→解釋結(jié)果→更新系統(tǒng)評價。陳小光[29]基于系統(tǒng)評價方法探討冠心病中醫(yī)痰證與客觀化指標(biāo)的關(guān)系,通過計算機檢索文獻、篩選文獻、納入客觀化指標(biāo)的步驟,對冠脈狹窄程度、血脂、C反應(yīng)蛋白、同型半胱氨酸4個指標(biāo)進行定性、定量分析(Meta分析),結(jié)果得出中重度冠脈狹窄以痰證、血瘀證為主要證型,三酰甘油對痰證區(qū)分其他證型特異性較強,C反應(yīng)蛋白對痰證辨識度較高,同型半胱氨酸對于冠心病痰證的判斷也有較好的識別價值。系統(tǒng)評價方法在處理不同研究結(jié)果方面有明顯優(yōu)勢,并具有一定的創(chuàng)新性。局限在于研究納入樣本量有限,無法完成對全部相關(guān)數(shù)據(jù)的提取,理論上容易發(fā)生偏性,且對于臨床終點定義往往不明確。

10問題及展望

目前,冠心病中醫(yī)證候數(shù)據(jù)挖掘工作仍處于探索階段,開展過程中也存在一些問題。數(shù)據(jù)挖掘方法各有利弊,在選取上可優(yōu)勢互補,揚長避短。但目前方式單一,單一方法之間關(guān)聯(lián)度不夠,在方式選擇上仍存在缺陷,且不同方法挖掘出的結(jié)論難以有效統(tǒng)一,結(jié)果預(yù)測性不夠精確,缺乏系統(tǒng)、客觀的評價。冠心病中醫(yī)證候信息大規(guī)模數(shù)據(jù)挖掘及建立冠心病中醫(yī)證候模型技術(shù)在國內(nèi)尚未成熟,從醫(yī)案中挖掘出的部分證候規(guī)律與實際臨床間存在一定偏差,數(shù)據(jù)挖掘力度不夠,僅局限于表面層次,提取出的有效信息價值不高。且中醫(yī)醫(yī)案文獻量大繁雜,加之中醫(yī)證候自身復(fù)雜、模糊以及證候信息的多重共線特點,增加了冠心病中醫(yī)證候數(shù)據(jù)挖掘工作的開展難度,仍有待進一步縱深探索。進一步加大數(shù)據(jù)挖掘研究力度并充分利用各方面優(yōu)勢[30],是有效推動中醫(yī)藥防治冠心病的重要步驟。實踐證明,運用數(shù)據(jù)挖掘技術(shù)可以對冠心病中醫(yī)證候信息的收集、分析以及規(guī)律總結(jié)提供方法支持。建立冠心病中醫(yī)臨床信息采集平臺,聯(lián)合多元分析方法,完善系統(tǒng)評價體系,實現(xiàn)信息的有效輸出與歸納,是對冠心病中醫(yī)證候進行數(shù)據(jù)挖掘的四個重要環(huán)節(jié)。數(shù)據(jù)挖掘方法形式多樣,其性能各有優(yōu)勢,做到正確認識不同數(shù)據(jù)挖掘方法的性能特征,對于準(zhǔn)確選擇恰當(dāng)?shù)臄?shù)據(jù)挖掘方法以及明確不同方法所表達的含義具有重要意義。不同挖掘方法在證候信息分析時呈現(xiàn)不同的特點,綜合多種多元統(tǒng)計方法聯(lián)合使用,優(yōu)勢互補,能夠提高分析結(jié)果的準(zhǔn)確性與可靠性。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,分析方法將會更加多元,現(xiàn)代醫(yī)學(xué)相關(guān)指標(biāo)與冠心病中醫(yī)證候相結(jié)合的微觀辨證將成為未來研究的焦點。冠心病中醫(yī)證候研究不斷深入,為中醫(yī)診斷冠心病奠定理論基礎(chǔ),通過加強中西醫(yī)不同角度對于冠心病的認識,擬為冠心病中西醫(yī)結(jié)合診療提供新思路。

[參考文獻]

[1]王小龍,亓詠梅.基于數(shù)據(jù)挖掘探討甘草在冠心病心絞痛中的配伍應(yīng)用[J].中醫(yī)藥導(dǎo)報,2018,24(23):74-76.

[2]李琳,胡志希,凌智.數(shù)據(jù)挖掘在冠心病中醫(yī)證治研究中的應(yīng)用[J].遼寧中醫(yī)雜志,2014,41(12):2727-2729.

[3]李輝.城鎮(zhèn)居民生活水平綜合評價的因子分析研究[D].昆明:云南大學(xué),2011.

[4]張琳婷.基于因子分析的冠心病發(fā)病早期中醫(yī)證候研究[D].沈陽:遼寧中醫(yī)藥大學(xué),2013.

[5]吳旸,王軒,崔杰,等.348例冠心病患者中醫(yī)證候特點因子分析[J].中華中醫(yī)藥學(xué)刊,2009,27(2):392-394.

作者:鐘霞 焦華琛 李運倫 趙天恩 張磊 李焱 單位:山東中醫(yī)藥大學(xué)中醫(yī)學(xué)院 山東中醫(yī)藥大學(xué)附屬醫(yī)院心病科 泰山醫(yī)學(xué)院