K-means-About-Fisher's-Iris-data-setPPT優秀課件_第1頁
K-means-About-Fisher's-Iris-data-setPPT優秀課件_第2頁
K-means-About-Fisher's-Iris-data-setPPT優秀課件_第3頁
K-means-About-Fisher's-Iris-data-setPPT優秀課件_第4頁
K-means-About-Fisher's-Iris-data-setPPT優秀課件_第5頁
已閱讀5頁,還剩5頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、About Fishers Iris data setK-means1數據介紹問題:是否能通過前四個數據進行分類?2其實已經有人做過類似這個的事了后來查的資料3Iris-setosa4Iris-versicolor5Iris-virginica6算法介紹k-meansk-means算法算法1 1、先隨機選擇三個中心數據(即、先隨機選擇三個中心數據(即irisiris的四個的四個featurefeature)作為族)作為族j j的的featurefeature,遍歷計算每個數據,遍歷計算每個數據i i(0=i0=i樣本數)和這三個中心的距離樣本數)和這三個中心的距離s s,因為是四個因為是四個f

2、eaturefeature,所以有四個維度。對于各個樣本,所以有四個維度。對于各個樣本i i,取最小的數據,取最小的數據s s,記下屬于的族,記下屬于的族j j。2 2、對于第一步中屬于同一族、對于第一步中屬于同一族j j的樣本的樣本i i,分別計算這些樣本,分別計算這些樣本i i中的中的irisiris四四個個featurefeature的平均值,把這四個值賦予族的平均值,把這四個值賦予族j j的的featurefeature,作為新的中心數,作為新的中心數據,再次遍歷計算每個樣本據,再次遍歷計算每個樣本i i和這三個中心的距離和這三個中心的距離s s,選擇最小的一個作,選擇最小的一個作為樣

3、本為樣本i i新屬于的族新屬于的族j j。3 3、計算此時族、計算此時族j j數據和原族數據和原族j j數據的距離,若大于一個閾值,便重復步數據的距離,若大于一個閾值,便重復步驟驟2 2。否則退出程序,此時每個。否則退出程序,此時每個irisiris數據都屬于一個選好的族了。數據都屬于一個選好的族了。4 4、比較分的族和、比較分的族和irisiris原始品種的重合度,計算誤差。原始品種的重合度,計算誤差。7Matlab畫的聚類前的圖,數據大致分成三堆8Matlab畫的聚類后的圖9同時還可以知道,Iris-virginica(維吉尼亞鳶尾)品種的花萼、花瓣的長、寬都是最大的,Iris-versicolor(變色鳶尾)次之,Iris-setosa(山鳶尾)最小,但它的花萼寬卻反常的比其他兩種的都大。這個結果對區分鳶尾

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論