數據倉庫與數據挖掘決策樹實驗_第1頁
數據倉庫與數據挖掘決策樹實驗_第2頁
數據倉庫與數據挖掘決策樹實驗_第3頁
數據倉庫與數據挖掘決策樹實驗_第4頁
數據倉庫與數據挖掘決策樹實驗_第5頁
免費預覽已結束,剩余16頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

圖圖5完成數據源具體設置圖圖1新建項目實驗3決策樹一、實驗目的1.了解決策樹的基本概念。2.掌握決策樹挖掘分析的操作步驟。二、實驗內容對三國志4武將數據.xIs中的數據進行決策樹分析。三、實驗儀、設備計算機、visualstudio2008 、分析用數據、數據庫服務四、實驗步驟準備工作:三國志4武將數據.xIs數據導入數據庫中。(1)打開visualstudio2008 ,新建項目,選擇商業智能項目,analysisservices項目新建項目娛鞭(1--TTi^u口£1""已安8的饕扳囪翹新的I£?1ZLCd項日-恆S(L_JH決方案S囪翹新的I£?1ZLCd項日-恆S(L_JH決方案S折rJTkrmq**md K計我卯Ihyri&"irr4nEt\¥i?譏Studio w[ft1|簡^£1 ]Z I(Z自膽S決方靜汨杲①

(2) 在解決方案資源管理器中,右鍵單擊 數據源,選擇新建數據源? 歡迎使用數據源向導使用此向導創建新數據源°數據謂表示到數據的連接.數據源不提供緩存元數據、淞力供粟.忝加計算和抵加批注等功能。若要對數據源應用這些功電盟'諳使用此向導來創建數S源」撚后使用數S源視E向導來創建包含相應功能的視圖?圖2數據源向導(3) 在該界面中選擇(3) 在該界面中選擇新建,進行數據源具體設置遙擇如何定義連接嗟性①譽于現有連妾或篩氐接創違數據遞嗟性①譽于現有連妾或篩氐接創違數據遞<£>數據腔接広〕:¥\必筍捋j?■韋超i託稱”■<上一步塑)] 下…占⑧:I亢或邏;X'l圖3新建數據源(4)在服務器名中填寫要連接的數據庫服務器名稱,或者單擊服務器名右方下拉按鈕進行選擇;勾選使用windows身份驗證;選擇或輸入一個數據庫名中填寫將要分析數據所在的數據庫或者單擊右方下拉按鈕進行選擇

12?1 VH刷新? ]iSWat禾5(」膿霍Bfl④怦用耳盼駒證銀1<7$使用SQLSerir^r貝忖舊J全部川廠名心:1書延芒* L1[二n辻按毎」一①薇Jfirt=⑤選弾或酸IE庠名QJ:阿n*O阻+九1—個靜甜庫丈怦創】i:1^iFj.y滬客J-11揑供程序t£:i:占機[ILEDPMicro"貢OILEDBTroviiei-forSBBFerber測HIS按電)窮助圖4數據源具體設置下一步(5) 確定后配置完的數據源已顯示在窗口上,繼續下一步-叵因選擇如何ikjSt連揍他旳攻壽方式Btlii;擇,U1.便迪庭廈駙且連搖字裁豐進行是文.?基于觀有連接或SJf査接館建數據灑<£)霖據i莖接⑩■雇性DaLaSourceTniti-al雇性DaLaSourceTniti-al匚a.Integrated..Frovidorssri新逢氓」<上一號asi1新逢氓」<上一號asi1下一步團> 1芥硯眄?| [ 麻Y自C"S于雖一個對3^也饌超據涯趣(6)勾選使用服務賬戶,繼續下一步模擬信息可以定義局遼yzjzServices悽用何科憑據來連接到數據誘.O使用當前用尸的逐據助0軾認值(V圖6模擬信息設置(7)數據源名稱保持默認,完成完成向導諸提供一個名稱-然后單擊.'完成”以創連新數據邇.數S源名和①1:Hkh預覽(£);連接字符串:Provi<:er=SGLOLEDE_l;I)ataE?rce=;IntegratedSecurity^SPlInitialCatalo^hxE圖7完成數據源設置向導(8) 在解決方案資源管理器中,右鍵單擊 數據源視圖,選擇新建數據源視圖圖圖11選擇包含對象圖圖11選擇包含對象14圈向導二回區歡迎使ffl數據源視圖向導用此向導創逹新的數據潯視圖?從關系數聲庫的裹和視團中創律數據源視s°麟瞬爲黔疇翳磁靈呷嘶更多高級功執圖8數據源視圖向導(9)下一步選擇數據源選樣現白的關東敷菇嗨,或剝連一T天來愍菇游口關系數據派迪);Hjth雇性DataSourceInitialCa.._Integrated-..Prcvi(kthxh3STISQLOLEDB.】圖9選擇數據源(10)在可用對象中,將要分析數據所在表添加到包含的對象中,繼續下一步if—1^—選擇表和《?從要包含在數弱澹視圖中的關系第據庫中選擇對象?可用對集(A):赳含的對象CL1:名稱□dbo三國志4$類型表名稱類型(11)默認名稱,完成圖圖14選擇定義方法H:|xHkE預覽口;二嚼3HihL*1ibo三國志4$圖12完成數據源視圖向導回岡(12)在解決方案資源管理器中,右鍵單擊 挖掘結構,選擇新建挖掘結構回岡民暫據挖掘向導歡迎使用數據挖掘向導使用此向導可刨達新的暢結構和新的挖據福型-挖掘棍型是一種代表已發現的豔麟蠶僖熱躋騁豔蠶轍M果用于創建挖融單擊斥一步”將生成世掘結構利挖掘模型I單擊"取消"馬退出向導?圖13數據挖掘向導(13)勾選從現有關系數據庫或數據倉庫 ,繼續下一步態數據檢te向導叵?選擇定義方法選擇創連挖?結構定文時要使用的方法./>使用何種方法定乂挖掘結構??ss賣羞澤麴ossa說明:此方i趨于現有丈丟數據庫中的表和列走義挖S錯構-(14)選擇microsoft決策樹,繼續下一步

選擇數據挖掘技耒選擇對于悔正執行的分析奧型來說是適用的數SfS掘拄相您要便用何種數據挖挹技術(X)?Microsoft決策樹說明:Microsoft決策樹?】汪是一種適合預測性奩複的分類苴港.謹直法吏持a散屬性和連續屬性酌預泓.圖15創建數據挖掘模型結構(15)下一步旦區旦區選擇數據源視圖選選擇數據源視圖選S対挖?錯構握僕數S的數S源視同?可用蜀據憑視SICA):Hxh3表-Hxh3表-db?.三國吉4$圖圖16選擇數據源視圖(16(16)勾選事例,繼續下一步指定表類型搭定另析時要月的表奘型.指定表類型搭定另析時要月的表奘型.需入表Q):事例0圖17指定表類型圖17指定表類型(17)在鍵列勾選序號碼,在輸入列勾選出身、國別、魅力、統御、武力、政治、忠誠,在可預測列勾選身份,繼續下一步<數據挖據向導皓定定型數摒指走分祈中聲用的列.刻列三區吉《園別名稱身松武才厚<數據挖據向導皓定定型數摒指走分祈中聲用的列.刻列三區吉《園別名稱身松武才厚W碼政拾皆惹回0間口口00口0叼□□n□瓦口□n□U為些苛龐詢]寸預冏直容雄供就入謹謖:圖18指定定型數據(18)下一步匸E?指定列的內容和魅芙型扌旨定憶據結枸列的內君租釵g笑型.51J艷S複型鎊椅毎):51J;==■■--■■■ 1蚤出長X國別CQAtinu^u?jQtblET魅力Coatinu^iiiBoublt,3島撈DiEcrstiTgtS缺CQntinU4U¥iQvbltCMitinuflUSBotbl-E酋序號碼KeyBotBltIl收料Cobtinu4uxBovbliContinu'ousDoilBIe內容類型埜據類型窗!W?

圖19指定內容和數據類型(19)勾選允許鉆取,完成<卿挖摒向導□區完卓尙導対挖掘錨構崔供名秫,從而兗成數搖挖扼向尋.ZU挖拒皓構毛臓血:三凰古1三國志€預覽毬::目別力館御力號沿蕙出國魅舅曲g石攻習列冒II?疸5>1@遼回目別力館御力號沿蕙出國魅舅曲g石攻習列冒II?疸5>1@遼回圖21完成數據挖掘向導(20)單擊挖掘模型查看器 $ $"”龍邁―””i丨否?] $ $"”龍邁―””i丨否?]huxihuan—licrosoftVisualStudio文件世〕蝙矩堪)視團世)頂目?

數據憑觀圖⑤挖掘模型血工眞①貝H>耳/三國志嗎.dM[設計]IBah.血V[役計]H恤」挖,■,主成世〕調訶⑩窗口(t)社區C)?Development氣挖…I塾檢,.I逼搭…卸毎唱匕X福式@1數據庫?稱ft01〕T理穹蘭Hm:,.呂huxihnan〒曰數Jg源;=*■》Hxhds$> 數據源視E*口Hjtti.ilsv&或竝數據集n雖度.忡塩牡姑J1性 .A奢S三國志4數據溥視團SS列C序號碼二]三國志4$〔…J亠序^瑪 二UJ刃 予Li1啟錯諜列表X三國吉電Hinirk^tructuri'r就緒圖22完成設置(21)詢問是否部署項目, 是MicrosoftTisualStudio圖23部署項目(22)詢冋是否繼續,是MicrosoftVisualStudiot!J=-A*i=k囚厲字母順序幣國志°Saac捋走對象名蘇.圖24處理模型(23)單擊運行-'AhitfIKIHWJC-回因對好-ip:坦JPiH-佗—ED-rfli工出1屢JTWBtieLWJftJRWlI咆?Qrwrj殺ixj..J比古:規左IICIFF*毎《犬圭審住=I二*站屮rittE時出L#Fli帚H0=f=II 宴卍沿■忙九1運ER... ill II~1圖25運行挖掘項目B回MB回M處理進虞圖26處理結果(25)關閉處理窗口后,就可在挖掘模型查看器的決策樹中看到系統經過分析得出的結果u***rfii+1u***rfii+1b”rifti+3 ■KwrsmnKisv■(26(26) 在挖掘模型中,右鍵單擊挖掘模型可以設置算法參數u***rfii+1u***rfii+1b”rifti+3 ■KwrsmnKisv■(26(26) 在挖掘模型中,右鍵單擊挖掘模型可以設置算法參數?跳側|匚嚴fllT申[扌世滬丁去*需舉[丁FJSMEPF*|9產《仲甲Eld

伸耐ffitF仙nw冷冠槪B砂丄ViBiUu-IRR區.itfW?Li.rK3■T'csaufiS-主樂碩□kV/i-T依賴關系網絡:I所育璉接HJf■-創話.SUO—I、J15圖27分類關系圖二即Ijfl*:?'fcrh414?W^EKillrliT二事遶牡集%三0咅*to二ftfe4祓丹回五#MMS圖27分類剖面圖二S蠱「dH[■Si+JI'i)txh.dsvllBvHfefeJI弘甩粧鉛構[、構5棟型抹右冏ETM1査看術|£j國?^^確性團養i即曲彌熬蹄碼昂衢力號怡S鳥煩武序&壇碼昂衢力號怡S鳥煩武序&壇d一芻壽芻昌亠「曬In)T列Ini處a挖酩縄和肪率權a(i),處理碩H足).旳輦融⑴邸3把綺][粗也'畑珂X恥一-.環旦…一珈肌圖28算法參數(27)算法參數的意義COMPLEXITY_PENALTY:禁止決策樹生長。減少此值會增加拆解的可能性,而增加此值則會減少拆解的可能性。而不考慮其在FORCE_REGRESSOR:強制算法使用的數據行作為回歸公式的回歸輸入變量,算法計算中的重要性為何。而不考慮其在MAXIMUM_INPUT_ATTRIBUTES: 指定在叫用功能選項之前,算法可以處理輸入屬性的最大數目。MAXIMUM_OUTPUT_ATTRIBUTES: 指定在叫用功能選項之前,算法可以處理輸出屬性的最大數目。MINIMUMSUPPORT:指定分葉節點必須包含的最小個例數目SCORE_METHOD:指定用來計算分割準則的方法。SPLIT_METHOD:指定用來節點分杈的模式。

繩寡法參數值默認值10.043值默認值10.043[潘加⑥刪除(1)確定取消[潘加⑥刪除(1)確定取消幫助?抑制決策狗的生長-i荻值趣小■分的可E宙生越丈:該值越大-拆分的可能性灘小.劉

鷹卿鏘霍禽嗨謬証聽聽猥I』。;如果育網即許圖29設置算法參數(28)設定完算法后,再次點擊挖掘模型查看器進行數據處理,處理完成后所得出的結果就是設置算法后的結果。參數②:值默認值10043(BO,)1,3,4[1.3]a肓■-rui^nn冷.值默認值10043(BO,)1,3,4[1.3]a肓■-rui^nn冷.'fiX.iikJj:jH,+JU<60r-8五、實驗心得體會邊界,當然這個上邊界不超過 邊界,當然這個上邊界不超過 100%邊界,當然這個上邊界不超過 邊界,當然這個上邊界不超過 100%通過這次關于決策樹的實驗,讓我對決策樹的應用有了相對具體的理解, 并且為決策樹的學習提供了一個好的鋪墊,在學習過程中,決策樹中的算法由于利用系統本身, 所以并沒有具體理解ID3這個算法的具體運轉環節,但是有了這次實驗的鋪墊,使自己能夠更加容易之后的ID3算法的學習。六、思考題決策樹對數據分類的正確率是否可以達到 100%?答:不可以達到100%決策樹一般都是自上而下來生成的。決策樹由一個決策圖和可能的結果(包括資源成本和風險)組成,用來創建到達目標的規劃。每個決策或事件都可能引出兩個或多個事件,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝干,所以稱作決策樹。對于那些各類別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論