




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、About Fishers Iris data setK-means1數據介紹問題:是否能通過前四個數據進行分類?2其實已經有人做過類似這個的事了后來查的資料3Iris-setosa4Iris-versicolor5Iris-virginica6算法介紹k-meansk-means算法算法1 1、先隨機選擇三個中心數據(即、先隨機選擇三個中心數據(即irisiris的四個的四個featurefeature)作為族)作為族j j的的featurefeature,遍歷計算每個數據,遍歷計算每個數據i i(0=i0=i樣本數)和這三個中心的距離樣本數)和這三個中心的距離s s,因為是四個因為是四個f
2、eaturefeature,所以有四個維度。對于各個樣本,所以有四個維度。對于各個樣本i i,取最小的數據,取最小的數據s s,記下屬于的族,記下屬于的族j j。2 2、對于第一步中屬于同一族、對于第一步中屬于同一族j j的樣本的樣本i i,分別計算這些樣本,分別計算這些樣本i i中的中的irisiris四四個個featurefeature的平均值,把這四個值賦予族的平均值,把這四個值賦予族j j的的featurefeature,作為新的中心數,作為新的中心數據,再次遍歷計算每個樣本據,再次遍歷計算每個樣本i i和這三個中心的距離和這三個中心的距離s s,選擇最小的一個作,選擇最小的一個作為樣
3、本為樣本i i新屬于的族新屬于的族j j。3 3、計算此時族、計算此時族j j數據和原族數據和原族j j數據的距離,若大于一個閾值,便重復步數據的距離,若大于一個閾值,便重復步驟驟2 2。否則退出程序,此時每個。否則退出程序,此時每個irisiris數據都屬于一個選好的族了。數據都屬于一個選好的族了。4 4、比較分的族和、比較分的族和irisiris原始品種的重合度,計算誤差。原始品種的重合度,計算誤差。7Matlab畫的聚類前的圖,數據大致分成三堆8Matlab畫的聚類后的圖9同時還可以知道,Iris-virginica(維吉尼亞鳶尾)品種的花萼、花瓣的長、寬都是最大的,Iris-versicolor(變色鳶尾)次之,Iris-setosa(山鳶尾)最小,但它的花萼寬卻反常的比其他兩種的都大。這個結果對區分鳶尾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業生投資創業計劃書-圖文
- 朝陽市二甲基二烯丙基氯化銨項目可行性研究報告
- 2025年中國莞香茶行業市場運行態勢與投資戰略咨詢報告
- 設備采購評估報告(模板)
- 日常安全文明施工檢查記錄表
- 配電安全生產心得體會
- 生產經營單位制定或者修改有關安全生產
- 安全事故防范制度
- 負責人安全責任制度
- 中國有機黃花菜行業市場前景預測及投資價值評估分析報告
- 四年級上冊語文全冊重點知識
- GB/T 150.3-2024壓力容器第3部分:設計
- 拼多多店鋪代運營合同模板
- 體育訓練館維修改造工程鋼結構網架屋面施工組織設計
- 機動車安全技術檢驗操作規范標準
- 電化學儲能黑啟動技術導則
- MOOC 計算機網絡-華南理工大學 中國大學慕課答案
- 工程經濟學(第6版)全套教學課件
- 陜西史上最全的2024屆數學七年級第二學期期末綜合測試試題含解析
- 設計授權委托書
- 建設工程質量檢測方案-技術標部分
評論
0/150
提交評論