


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研討軟件工程研討數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研討論文本文關(guān)鍵詞:軟件工程,研討,數(shù)據(jù)挖掘,論文,技術(shù)
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研討論文本文簡介:摘要:信息時代背景下,計算機(jī)技術(shù)等現(xiàn)代信息技術(shù)在社會各個行業(yè)、領(lǐng)域,得到了越來越廣泛且深化的應(yīng)用,極大進(jìn)步人們信息處理效率,方便人們工作、生活的同時,對于數(shù)據(jù)挖掘技術(shù)的科學(xué)應(yīng)用,提出了更高、更新的要求。信息時代背景下,數(shù)據(jù)挖掘技術(shù)表現(xiàn)出廣闊的應(yīng)用前景,是快速處理海量信息的技術(shù)根底。筆者即從數(shù)據(jù)挖掘技
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研討論文本文內(nèi)容:
摘要:信息時代背景下,計算機(jī)技術(shù)等現(xiàn)代信息技術(shù)在社會各個行業(yè)、領(lǐng)域,得到了越來越廣泛且深化的應(yīng)用,極大進(jìn)步人們信息處理效率,方便人們工作、生活的同時,對于數(shù)據(jù)挖掘技術(shù)的科學(xué)應(yīng)用,提出了更高、更新的要求。信息時代背景下,數(shù)據(jù)挖掘技術(shù)表現(xiàn)出廣闊的應(yīng)用前景,是快速處理海量信息的技術(shù)根底。筆者即從數(shù)據(jù)挖掘技術(shù)入手,就其在軟件工程中的應(yīng)用,發(fā)表幾點看法,以供相關(guān)人員參考。
【關(guān)鍵詞】數(shù)據(jù)挖掘技術(shù);軟件工程;應(yīng)用
本文即圍繞數(shù)據(jù)挖掘技術(shù),就其在軟件工程中的詳細(xì)應(yīng)用,進(jìn)展了分析和討論,詳細(xì)內(nèi)容如下:
1數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘〔Datamining〕,也稱為數(shù)據(jù)采礦,是數(shù)據(jù)庫知識發(fā)現(xiàn)的一個根底環(huán)節(jié),是在海量數(shù)據(jù)中自動完成隱藏特殊關(guān)系數(shù)據(jù)搜索的過程,數(shù)據(jù)挖掘技術(shù)就是這一過程應(yīng)用的相關(guān)技術(shù)。一般來說,數(shù)據(jù)挖掘過程可以分為四個環(huán)節(jié)進(jìn)展,分別是選擇軟件庫保存的數(shù)據(jù)、完成選擇數(shù)據(jù)的預(yù)處理、對預(yù)處理得到的格式化數(shù)據(jù)進(jìn)展挖掘、以及最終獲得目的數(shù)據(jù)。軟件工程是數(shù)據(jù)挖掘技術(shù)的重要應(yīng)用領(lǐng)域,詳細(xì)的數(shù)據(jù)挖掘工作普遍分為三個層次進(jìn)展,分別是交互式可視數(shù)據(jù)探查、自動形式提取和建構(gòu)模型。三個層次之間存在著直接的關(guān)聯(lián)聯(lián)絡(luò),其中可視數(shù)據(jù)探查是后兩者的根底,而建構(gòu)模型又是前兩者的指導(dǎo)。軟件工程領(lǐng)域應(yīng)用數(shù)據(jù)挖掘技術(shù)的目的,主要是借助聚類、分析、預(yù)測、統(tǒng)計等技術(shù)手段,在海量數(shù)據(jù)資源中快速分辨、尋找符合人們應(yīng)用需求的數(shù)據(jù)信息,并自動將檢索到的信息反響至軟件系統(tǒng)。此外,為保障數(shù)據(jù)挖掘的科學(xué)性和有效性,數(shù)據(jù)源還應(yīng)盡可能到達(dá)龐大、真實的要求。
2數(shù)據(jù)挖掘技術(shù)的應(yīng)用分析
2.1開源軟件開發(fā)中的應(yīng)用分析
所謂開源軟件,就是源代碼處于開放狀態(tài)的軟件,一般來說,開源軟件普遍對客戶免費(fèi)開放,也正由于開源軟件的這一特性,導(dǎo)致對開源軟件的管理和控制變得相對困難。在這種環(huán)境背景下,在開源軟件開發(fā)階段引入數(shù)據(jù)挖掘技術(shù),可有效進(jìn)步開源軟件的開發(fā)質(zhì)量。以大阪大學(xué)設(shè)計的分布式數(shù)據(jù)挖掘系統(tǒng)為例,該系統(tǒng)就可以在實現(xiàn)大規(guī)模系統(tǒng)挖掘的同時,完成對不同開源軟件的挖掘;再以牛津大學(xué)設(shè)計的數(shù)據(jù)挖掘系統(tǒng)為例,該系統(tǒng)實現(xiàn)了系統(tǒng)開發(fā)者和使用者的持續(xù)跟蹤管理,從而大幅度地進(jìn)步了開源軟甲的使用率。
2.2軟件工程管理中的應(yīng)用分析
數(shù)據(jù)挖掘技術(shù)在軟件工程管理中的應(yīng)用,主要表如今以下兩個方面:
〔1〕版本控制信息挖掘包含的對組織關(guān)系的挖掘;
〔2〕對版本控制信息的挖掘。
就軟件工程管理而言,其本身具有鮮明的系統(tǒng)性和復(fù)雜性特征,對組織關(guān)系的挖掘,是實現(xiàn)各類資源科學(xué)分配和協(xié)調(diào)的重要前提。以整個軟件工程管理過程中產(chǎn)生的電子郵件、共享文檔為例,對此進(jìn)展數(shù)據(jù)挖掘就可以有效區(qū)分不同工種人員的組織關(guān)系,防止秩序混亂問題的發(fā)生,從而保障軟件工程管理工作的順利進(jìn)展。另一方面,版本控制可以實現(xiàn)對文件內(nèi)容變化的詳細(xì)記錄,并作為用戶理解版本修訂情況的根據(jù)和根底。針對版本控制信息應(yīng)用數(shù)據(jù)挖掘技術(shù)可進(jìn)一步降低系統(tǒng)維護(hù)本錢,同時可起到一定的警示作用,及時反映系統(tǒng)修復(fù)記錄中存在的紕漏,最終到達(dá)進(jìn)步軟件工程管理程度的目的。
2.3程序代碼中的應(yīng)用分析
本文涉及的程序代碼,主要是指克隆代碼,即通過簡單的“復(fù)制、粘貼〞操作獲得并再次進(jìn)展使用的代碼。數(shù)據(jù)挖掘在克隆代碼檢測中的應(yīng)用,是數(shù)據(jù)挖掘技術(shù)應(yīng)用的早期形式之一,目前應(yīng)用較為普遍的方法包括基于標(biāo)識符比照方法、基于文本比照方法等幾類。總的來說,數(shù)據(jù)挖掘在克隆代碼檢測中的應(yīng)用還有待進(jìn)一步的開展和完善,尤其是關(guān)于語法信息和語義挖掘的考慮,以進(jìn)步檢測的科學(xué)性和準(zhǔn)確性。對橫切關(guān)注點進(jìn)展挖掘,也是數(shù)據(jù)挖掘技術(shù)的重要應(yīng)用,主要是由于局部關(guān)注點在程序中的代碼具有極高的相似度,甚至是使用一樣代碼導(dǎo)致的。目前,應(yīng)用于Aspect的挖掘方法眾多,根據(jù)不同方法的詳細(xì)特點,可以分為形式概念分析方法、本文和類型分析方法、聚類分析方法、以及自然語言分析方法等等。在對執(zhí)行形式進(jìn)展數(shù)據(jù)挖掘時,應(yīng)優(yōu)先選擇方法執(zhí)行關(guān)系挖掘和形式概念分析法兩種方法。此外,數(shù)據(jù)挖掘技術(shù)還可用于對數(shù)據(jù)庫目的構(gòu)件或代碼的挖掘應(yīng)用,在數(shù)據(jù)挖掘技術(shù)的支持下,可大幅度進(jìn)步檢索速度、效率和準(zhǔn)確度。
2.4故障檢測中的應(yīng)用分析
從故障檢測的角度分析,對程序執(zhí)行記錄進(jìn)展數(shù)據(jù)挖掘,可提供程序的交互形式和說明,而以上信息均可以作為軟件故障定位和檢測的根據(jù)。對程序說明的數(shù)據(jù)挖掘過程,就是對信息的跟蹤和逆向建模的過程,該過程對于加深對程序的理解,以及優(yōu)化程序后續(xù)的維護(hù)管理,具有重要的作用和意義。目前,基于規(guī)那么的挖掘方法是應(yīng)用較為普遍的方法,其主要通過對程序行為的挖掘發(fā)現(xiàn)對應(yīng)的規(guī)那么,進(jìn)而借助時態(tài)邏輯完成表達(dá)。
3數(shù)據(jù)挖掘技術(shù)的主要應(yīng)用方法
3.1分類
數(shù)據(jù)挖掘技術(shù)涉及的相關(guān)分類方法,大致等同于某種預(yù)測分類標(biāo)號的執(zhí)行動作。在實際應(yīng)用過程中,通常需要建構(gòu)相應(yīng)的分析模型,并提早根據(jù)相應(yīng)規(guī)那么輸入概念集或數(shù)據(jù)類集,以作為分析模型的應(yīng)用根底。目前,數(shù)據(jù)挖掘技術(shù)應(yīng)用于軟件工程領(lǐng)域的分類方法中,主要的分類方法包括神經(jīng)網(wǎng)絡(luò)分類法、判斷樹法、貝葉斯分類法、以及支持向量機(jī)等幾類。其中,判斷樹法在分類計算過程中主要借助貪心算法作為邏輯根底,根據(jù)從上而下遞歸的形式完成斷定樹的構(gòu)造,而斷定樹包含的各個子節(jié)點,就分別表示不同的軟件類別標(biāo)號。
3.2聚類
聚類詳細(xì)是指將研究涉及的大量數(shù)據(jù),按照一定標(biāo)準(zhǔn)細(xì)分為不同簇或類的過程,從而在保障一樣簇的對象之間擁有較好相似度的同時,不同的簇的對象之間有著較明顯的差異度。聚類和分類有著本質(zhì)上的差異,聚類過程劃分的類對象具有不可預(yù)知性,即無指導(dǎo)的學(xué)習(xí)方法。聚類分析方法在其他算法的預(yù)處理范疇中有著大范圍的應(yīng)用,尤其在數(shù)據(jù)分布信息獨(dú)立性分析方面有重要應(yīng)用,不僅可更好地挖掘孤立點,同時可進(jìn)步欺詐行為檢測的效率和準(zhǔn)確性。
4結(jié)語
綜上所述,信息時代背景下,數(shù)據(jù)挖掘技術(shù)是快速處理海量信息、準(zhǔn)確尋找目的信息的關(guān)鍵。就軟件工程而言,數(shù)據(jù)挖掘技術(shù)在開源軟件開發(fā)、軟件工程管理、程序代碼、以及故障檢測等方面,均有著重要的應(yīng)用,相關(guān)人員必須進(jìn)步對數(shù)據(jù)挖掘技術(shù)的重視和關(guān)注,實在加強(qiáng)數(shù)據(jù)挖掘技術(shù)的實際應(yīng)用,以促進(jìn)我國軟件工程行業(yè)的進(jìn)一步開展。
參考文獻(xiàn)
【1】張佳新.數(shù)據(jù)挖掘技術(shù)在軟件工程中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 武漢工程科技學(xué)院《攝影與生活》2023-2024學(xué)年第二學(xué)期期末試卷
- 北京航空航天大學(xué)《信號與系統(tǒng)仿真基礎(chǔ)實驗》2023-2024學(xué)年第二學(xué)期期末試卷
- 貴陽信息科技學(xué)院《建設(shè)法規(guī)與工程監(jiān)理概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 北方工業(yè)大學(xué)《衛(wèi)生財務(wù)管理》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西同文職業(yè)技術(shù)學(xué)院《環(huán)境毒理學(xué)B》2023-2024學(xué)年第二學(xué)期期末試卷
- 鄭州師范學(xué)院《數(shù)字邏輯電路》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西機(jī)電職業(yè)技術(shù)學(xué)院《刑事法律診所》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南冶金職業(yè)技術(shù)學(xué)院《應(yīng)用統(tǒng)計學(xué)導(dǎo)論》2023-2024學(xué)年第二學(xué)期期末試卷
- 衡陽師范學(xué)院南岳學(xué)院《計算機(jī)輔助設(shè)計3DSMAX》2023-2024學(xué)年第二學(xué)期期末試卷
- 黔南民族師范學(xué)院《現(xiàn)代化學(xué)與生活》2023-2024學(xué)年第二學(xué)期期末試卷
- T-SUCCA 01-2024 營運(yùn)車輛停運(yùn)損失鑒定評估規(guī)范
- 教育消費(fèi)行為研究-深度研究
- 《基于單片機(jī)紅外遙控電子密碼鎖的設(shè)計(附源程序)》12000字(論文)
- 2025年離婚協(xié)議書范本(無爭議)
- 第12講 反比例函數(shù)的圖象、性質(zhì)及應(yīng)用 課件中考數(shù)學(xué)復(fù)習(xí)
- 手動葫蘆吊裝施工方案1
- 建設(shè)工程質(zhì)量安全監(jiān)督人員考試題庫含答案
- 北森行測測評題庫2022
- 【MOOC期末】《大學(xué)體育射箭》(東南大學(xué))中國大學(xué)慕課答案
- 衛(wèi)星互聯(lián)網(wǎng)應(yīng)用與挑戰(zhàn)
- 醫(yī)院保密知識培訓(xùn)
評論
0/150
提交評論