數據挖掘十大經典算法一_第1頁
數據挖掘十大經典算法一_第2頁
數據挖掘十大經典算法一_第3頁
數據挖掘十大經典算法一_第4頁
數據挖掘十大經典算法一_第5頁
已閱讀5頁,還剩35頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Smart-

Smart-Smart-別

Smart-

??? 6Smart-

己多年保存的數據加以規范化的處理和信息提取、知識發現。用來完成對數據的使用進而提升本身的能力和水數據回饋:個別企業比較注重數據的規范,因為數據的增長速度幾乎是幾何級數,對數據的投入成本也是越來越高,而數據挖掘也算是對這一成本的反饋,此時的數據挖掘成果會指導下一步的數據計劃。總的來說,數據 7Smart-8指標 指標8

指標 指標消 積

指標 指標Smart-Smart-

Smart-

Smart-

模型轉換Smart-

”字ABAB12是無偏轉換案例 ”地挖掘客戶真實需Smart-

戶尚有未記錄,案例二中客戶都是客戶,區別在于的數量和種類。Smart-

出來的城市的平均幾乎一致,這說明,空氣污染(燒煤)是導致人均不一樣的因素5式進行,而淮河以南則沒有。那么,淮河十分接5式進行,而淮河以南則沒有。那么,淮河十分接 Smart-Smart-

Smart-

Smart-

項目中的應用等等。 Smart-

有無Smart-

不 Smart-

y1N2N3P4P5P6N7P8N9PPPPPNSmart- 計算計算I(p,I(p,n)=-

下面分別計算四個屬性A1=outlook,A2=temperature,A3A1=outlook的取值為{sunny,overcast,rain}。訓練集C中14個對象有5個是sunny,2個是正例P,3個是反例N,即 n1=3可計算I(p1,n1)=0.97p2=4 n2=0 I(p2,n2)=0(L‘hospital法則)p3=3 n3=2 I(p3,n3)=0.971則屬性A1=outlook的期望信息要求為:E(A1)=(5/14)I(p1,n1)+(4/14)I(p2,n2)+(5/14)I(p3,n3)=0.694bit屬性outlookGain(outlook)=I(p,n)-E(A1)=0.940-0.694=0.246bitGain(temperature)=0.029bit;Gain(humidity)=0.151bit;Gain(windy) =0.048bitSmart-

;可能會收斂到局部最優解而非全局最優解最 Smart-

Smart-

GainRatio(A)Gain(A)/Spi(A),在表1的例子中,我Smart-

。Smart-

化數值型(本否否慢差是否慢差是是快好2否否慢差2否是快差是否慢差 Smart-

NaiveSmart- Smart- 510101101302061012121311131(T<10|D=0)=4/6,P(T>=10|D=0)=2/6,(T<10|D=1)=3/4,P(S<10000|D=0)=4/6,(S>=10000|D=0)=2/6,=3/4, P(H=1|D=0)=4/6,P(H=2|D=0)=1/6,P(S|1)/P(S|0)*P(S|1)/P(S|0)*,次。 Smart-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論