前言:想要寫出一篇引人入勝的文章?我們特意為您整理了軟件工程數(shù)據(jù)挖掘技術(shù)應(yīng)用分析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:數(shù)據(jù)挖掘是90年代初期出現(xiàn)的新型數(shù)據(jù)庫技術(shù),經(jīng)過多年發(fā)展,現(xiàn)階段,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為數(shù)據(jù)庫研究主要分支,在軟件工程中,利用數(shù)據(jù)挖掘技術(shù),可以對軟件運行軌跡、代碼庫、bug數(shù)據(jù)庫、修改歷史數(shù)據(jù)進行有效處理。本文首先對數(shù)據(jù)挖掘技術(shù)對于軟件工程開發(fā)的重要作用做出闡述,然后說明數(shù)據(jù)挖掘技術(shù)運作流程、應(yīng)用范圍,最后結(jié)合實際情況,對數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用展開分析,希望可以對業(yè)內(nèi)起到一定參考作用。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;重要作用;應(yīng)用分析
隨著互聯(lián)網(wǎng)技術(shù)、信息技術(shù)的迅速發(fā)展,現(xiàn)階段,計算機數(shù)據(jù)存儲能力、處理能力不斷提升,應(yīng)用計算機與信息技術(shù)管理數(shù)據(jù)信息已經(jīng)成為各行各業(yè)信息管理的主要方式,與此同時,人們所面臨的信息數(shù)據(jù)海洋也在迅速擴張。在信息爆炸時代中,如何在大量數(shù)據(jù)信息中提取有用信息、真實信息,會直接影響人們的工作效率與企業(yè)的生產(chǎn)效率。在此背景下,數(shù)據(jù)挖掘技術(shù)得到了社會各界的廣泛關(guān)注,數(shù)據(jù)挖掘技術(shù)本身融合了人工智能技術(shù)、數(shù)據(jù)庫技術(shù)、機器學(xué)習(xí)技術(shù)、知識工程技術(shù)、統(tǒng)計學(xué)技術(shù)以及信息檢索技術(shù)、數(shù)據(jù)可計算技術(shù),在軟件工程中,通過對數(shù)據(jù)挖掘技術(shù)進行合理應(yīng)用,可以有效提升數(shù)據(jù)信息處理效率,以為軟件工程高質(zhì)量開發(fā)奠定基礎(chǔ)。
1數(shù)據(jù)挖掘技術(shù)對于軟件工程開發(fā)的重要作用
數(shù)據(jù)挖掘技術(shù)對于軟件工程開發(fā)的重要作用可以歸納為:(1)增強數(shù)據(jù)信息理解。在軟件工程開發(fā)工作開展中,數(shù)據(jù)挖掘技術(shù)應(yīng)用具有增強數(shù)據(jù)信息理解的重要作用,對于同一條信息而言,每個人都有著不同理解,如果利用人力方法開展數(shù)據(jù)采集工作、數(shù)據(jù)理解工作,那么就會讓整體時間成本增加,對數(shù)據(jù)信息權(quán)威性造成不利影響,利用數(shù)據(jù)挖掘技術(shù),可以對數(shù)據(jù)信息進行科學(xué)分類處理,讓數(shù)據(jù)就權(quán)威性、準確性得到保證。(2)提高數(shù)據(jù)處理質(zhì)量。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以在短時間內(nèi)多次篩選、處理無效數(shù)據(jù)、混亂數(shù)據(jù),讓數(shù)據(jù)處理質(zhì)量、處理效率得到保證。和傳統(tǒng)技術(shù)相比,數(shù)據(jù)挖掘技術(shù)還可以防止數(shù)據(jù)丟失情況產(chǎn)生,避免企業(yè)損失。(3)增強數(shù)據(jù)利用效率。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從多個角度分類、整理數(shù)據(jù)信息,讓無用數(shù)據(jù)信息轉(zhuǎn)化為可理解信息資源,以為企業(yè)商業(yè)決策工作有效開展提供幫助,以增強數(shù)據(jù)利用效率。
2數(shù)據(jù)挖掘技術(shù)的基本概述
2.1運作流程
數(shù)據(jù)挖掘,主要指的是從不完全、模糊、大量、隨機數(shù)據(jù)中挖掘潛在、有價值、易被理解信息的過程。數(shù)據(jù)挖掘技術(shù)運作流程主要是利用計算機程序、綜合算法進行復(fù)雜運算,在預(yù)處理數(shù)據(jù)信息后,開展數(shù)據(jù)挖掘工作,最后對信息進行收集、整合。在數(shù)據(jù)選擇中,需使用具有強大運算后臺的軟件,以此來保證信息選擇準確性、有效性;在數(shù)據(jù)預(yù)處理中,需要針對選擇、收集原始數(shù)據(jù)信息,采用科學(xué)算法轉(zhuǎn)碼數(shù)據(jù)、識別數(shù)據(jù),保證用戶可以直接得到數(shù)據(jù)信息;在數(shù)據(jù)挖掘中,應(yīng)利用軟件智能算法以及計算機快速運算優(yōu)勢,采集處理數(shù)據(jù)信息,以在海量數(shù)據(jù)信息中得到真實數(shù)據(jù)、原始數(shù)據(jù),在數(shù)據(jù)挖掘工作開展中,一方面,需要依照數(shù)據(jù)信息不同特點,選擇科學(xué)挖掘算法,另一方面,需要對實際運行系統(tǒng)要求、用戶要求,挖掘用戶容易理解、描述性知識,或是用戶想得到預(yù)測性、前瞻性知識;在模式評價和知識表示過程中,根據(jù)某種興趣度量,可以對表示知識真正有趣模式予以識別,以完成模式評價工作,由特定領(lǐng)域用戶、專家、領(lǐng)域標準可以得出度量具體數(shù)值,利用可視化技術(shù)可以轉(zhuǎn)換結(jié)果為用戶易接受形式,并提交給用戶。值得注意的是,數(shù)據(jù)挖掘流程本身具有反復(fù)性特點,例如,在對數(shù)據(jù)信息進行清洗、準備過程中,就有可能在某數(shù)據(jù)源中發(fā)現(xiàn)挖掘數(shù)據(jù)不可用,或是數(shù)據(jù)信息來源于異構(gòu)數(shù)據(jù)源,對此,需要開展預(yù)處理工作,通過反復(fù)挖掘提升數(shù)據(jù)信息充分性、準確性。
2.2應(yīng)用范圍
數(shù)據(jù)挖掘技術(shù)可以完成概念描述工作、關(guān)聯(lián)分析工作、分類與預(yù)測工作、聚類分析工作、異類分析與檢測工作、演化分析工作以及數(shù)據(jù)約簡工作。現(xiàn)階段,數(shù)據(jù)挖掘技術(shù)的應(yīng)用具有面向?qū)嶋H特點,在電信領(lǐng)域、銀行領(lǐng)域、醫(yī)學(xué)領(lǐng)域、保險領(lǐng)域、交通領(lǐng)域中均得到了廣泛應(yīng)用,利用數(shù)據(jù)挖掘技術(shù),可以完成數(shù)據(jù)庫營銷工作、背景分析工作、客戶群體分類工作、市場交叉銷售工作、客戶關(guān)系管理工作等。如在銀行領(lǐng)域中,利用數(shù)據(jù)挖掘技術(shù)就可以分析客戶信譽度情況,避免信用卡欺詐問題產(chǎn)生;如在醫(yī)學(xué)領(lǐng)域中,利用數(shù)據(jù)挖掘技術(shù)就可以完成醫(yī)療診斷工作。除此之外,數(shù)據(jù)挖掘技術(shù)還可以應(yīng)用在農(nóng)業(yè)領(lǐng)域、工業(yè)領(lǐng)域、互聯(lián)網(wǎng)領(lǐng)域以及軍事領(lǐng)域。
3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析
3.1軟件版本信息挖掘
在軟件工程中,軟件版本信息挖掘管理是關(guān)鍵工作內(nèi)容,當前,幾乎所有企業(yè)都會使用版本控制系統(tǒng)維護軟件,保證團隊成員得到一致代碼。在大型軟件開發(fā)團隊中,軟件版本信息管理具有復(fù)雜性,每次更新都有可能產(chǎn)生代碼管理混亂問題。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以有效挖掘軟件變更歷史信息,通過對比分析大量代碼,可以對各個版本、模塊之間內(nèi)部聯(lián)系予以確認,在保證代碼融合效率基礎(chǔ)上,可以避免漏洞問題產(chǎn)生。
3.2軟件執(zhí)行記錄挖掘
利用數(shù)據(jù)挖掘技術(shù)挖掘軟件執(zhí)行記錄,可以對程序進行全面分析,利用程序預(yù)定安裝路徑,可以挖掘運行數(shù)據(jù)信息,利用科學(xué)算法,可以對軟件運行是否符合預(yù)期進行判斷。在執(zhí)行記錄挖掘工作開展中,需要全面查詢安裝路徑,逆向建模處理數(shù)據(jù)結(jié)構(gòu),以對軟件開展維護工作、檢測工作,讓軟件運行存在的漏洞問題得到提前發(fā)現(xiàn),讓軟件運行穩(wěn)定性得到保證。與此同時,需要全面分析安裝系統(tǒng),利用系統(tǒng)、軟件數(shù)據(jù)接口訪問系統(tǒng),可以挖掘相應(yīng)軟件信息,并提取運行需要數(shù)據(jù)信息。
3.3檢測漏洞
在軟件工程中,利用數(shù)據(jù)挖掘技術(shù)可以對軟件漏洞進行有效檢測,以提升數(shù)據(jù)信息穩(wěn)定性、安全性,在錯誤造成嚴重后果之前修復(fù)漏洞。通常情況下,在技術(shù)應(yīng)用中,首先,應(yīng)結(jié)合軟件特點進行合理調(diào)整,在用戶基本需求得到滿足的前提條件下,可以對軟件測評方式進行科學(xué)確認;其次,應(yīng)利用此測評方式,對軟件數(shù)據(jù)錯誤進行排查、修復(fù),以完成數(shù)據(jù)加密工作、保護工作。值得注意的是,針對軟件所需后臺信息,還應(yīng)開展處理工作,對后臺冗余數(shù)據(jù)進行定期清除,針對長時間運行出現(xiàn)數(shù)據(jù),應(yīng)對其進行過濾處理,針對必要關(guān)鍵信息,應(yīng)對其予以保留,讓軟件運行穩(wěn)定性、安全性得到保證。在建模工作中,應(yīng)結(jié)合數(shù)據(jù)信息大小情況、特性對數(shù)據(jù)模型進行合理選擇、對比驗證,讓信息真實性、安全性得到保證。除此之外,應(yīng)針對軟件多種用途,結(jié)合項目需要,對數(shù)據(jù)挖掘方式進行科學(xué)選擇,對多種數(shù)據(jù)信息進行比較分析,保證軟件可以為用戶帶來最佳體驗。
3.4軟件故障檢測中的數(shù)據(jù)挖掘
在軟件故障檢測工作中,通過科學(xué)應(yīng)用數(shù)據(jù)挖掘技術(shù),可以對軟件故障進行有效檢測,并針對故障產(chǎn)生原因、常見類型,開展修復(fù)工作、維護工作。
3.4.1故障檢測在軟件工程中,數(shù)據(jù)挖掘技術(shù)不僅可以提升挖掘任務(wù)完成效率、挖掘程序執(zhí)行記錄具體說明,同時還可以完成故障檢測工作。在程序挖掘過程中,首先,應(yīng)設(shè)定挖掘主要目標,對信息進行跟蹤了解,提升程序熟悉度,為后續(xù)工作高質(zhì)量開展提供保證;其次,應(yīng)對數(shù)據(jù)挖掘方式進行合理選擇,如利用基于規(guī)則和自動化類數(shù)據(jù)挖掘技術(shù),就可以讓抽象處理、抽象挖掘工作得以高質(zhì)量完成。當前,軟件因多種因素影響,可能會產(chǎn)生故障問題,傳統(tǒng)定位技術(shù)固然可以對故障進行處理,但其具有一定煩瑣性、低效性,定位精準度可能存在問題。而利用數(shù)據(jù)挖掘技術(shù),結(jié)合新的定位方法,如使用程序譜抽象定位處理運行軌跡,利用對比方法對故障進行有效排除,就可以讓故障源頭得以迅速找出,讓故障排查效率、檢測準確性得以提升。
3.4.2軟件維護在數(shù)據(jù)挖掘技術(shù)支持下,通過鑒別該評估軟件缺陷程序,可以對軟件修復(fù)環(huán)節(jié)缺陷進行分析,對修復(fù)優(yōu)先順序予以判斷,讓各個缺陷最佳修復(fù)方法得以確定。為保證修復(fù)效率,應(yīng)強化處理檢測重復(fù)缺陷報告技術(shù),在缺陷報告中融入自然語言、執(zhí)行語言相似度信息,保證依照定義向量維度可以完成描述軟件缺陷工作。最后,可以加權(quán)求和處理相似度,以開展缺陷修復(fù)工作。
4結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)的科學(xué)應(yīng)用是信息化時代數(shù)據(jù)信息處理的關(guān)鍵,在軟件工程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以高質(zhì)量開展軟件版本信息挖掘工作、軟件執(zhí)行記錄挖掘工作、檢測漏洞工作、故障檢測工作以及軟件維護工作,以提升軟件工程開發(fā)效率、開發(fā)質(zhì)量,降低軟件工程開發(fā)成本,提升軟件工程開發(fā)經(jīng)濟效益。
參考文獻:
[1]周鶴.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用探究[J].計算機產(chǎn)品與流通,2020(8):22.
[2]李金召.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用與研究[J].計算機產(chǎn)品與流通,2020(5):30.
[3]余世文,王渝波,劉啟明.軟件工程數(shù)據(jù)挖掘研究進展探析[J].農(nóng)家參謀,2020(7):139.
[4]豐婉伊.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].信息通信,2020,33(3):192-193.
[5]黃俊.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].信息通信,2020(02):254-256.
[6]李怡.淺析軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].中國新通信,2018,20(4):102.
作者:王鵬 胥司祿 陳夢杰 孫曉康 金蔓 單位:大連理工大學(xué)城市學(xué)院計算機工程學(xué)院