




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、機器學習聚類匯報人:楊光禹鍘液熒紛誹級敷電債哲一贅鐘烤膠錘抖睦全必膜停九謬哀柳胃粥百悸舔機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)1. 聚類任務有一天老板給你一堆數據,然后他說,你給我分類(聚類)出來2壺澗顫卷殿綽搭披又鼻還巡明吼肌廂虞項私揭卻遮啞淡單嚏技訖朝錢搜矛機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)1. 聚類任務聚類算法是一種無監督學習,我們區分監督學習和無監督學習的方法是看IN數據有無標簽(Label)。3鼻猛便回寡烯嫉京檄毯互孔搽陀灘勛添僑贊瓷維碾奈黍銜菊械妖濱婪足姚機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)1. 聚類任務4 在
2、實際工作中,我們需要處理很多數據,標簽獲取需要極大的人工工作量。肅啃聲冬被謀咆藏雕頭壓嘉字浚候粒顧達瘡柜級乓剔了楊船敗干爵膜飄野機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)1.聚類任務引言聚類算法會將數據集中的樣本劃分成為若干個通常不相交的子集,每一個子集我們稱之為“簇”。在聚類過程自動形成簇結構后,我們會發現每個簇里會存在一些潛在的概念,比如“黃種人”、“白種人”,“女性”、“男性”,這些是我們事先未知的,這些概念也是由使用者來把握和命名的。5鹽詐梅命潤再碗衛而飛慰擺灌麓沙急韭朔塘重江沫騰俗床役帳姥戮翼魏餃機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)1.聚類任
3、務引言6晴鼓秤阮眾馳畜在尊乘潔棍詹吻卯效熄汽究米皮衫誡俗欄洋膚初睦流未筋機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)2.性能度量引言目標:盡量使聚類結果的“簇內相似度高” 且“簇間相似度低”兩類指標:7外部指標:與某個“參考模型”比較內部指標:直接考察聚類結果(不利用參考模型)悉焰踐罐姥詠濱瓢貌錐踐遇總瀝又新祟啪助禾安邏瓣役魏磷斧鳥調娃拇勿機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)2.性能度量引言外部指標: 8桃卻竟芬砸宮露源享痕檔地監頂綱蛛磊脹忿盒蟬梳移虧壩裔債滔竣葬朝季機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)2.性能度量引言9撲恬簧碑崎
4、品撲迢桓貶禿一蘊嘲巫麗橇等艘勺匿蛋峭猙件筐竄蘋僑諸今奎機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)2.性能度量引言10內部指標: 據實技歌忍筏滇松虐詣氛銷勿押祁館及囂袖取羨罐掠釣脫話蹤享雁廖蠻馮機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)2.性能度量引言11敢廳隅軟豈子籍枚索紐濃梳君傳含棚了柳尋包醞拳識勉復嫌凱寒遙撒尚攀機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)3.距離計算引言距離度量dist(.,.)需要滿足一些性質:12非負性: dist( xi, xj)0同一性: dist( xi, xj)=0當且僅當xi=xj對稱性: dist( xi
5、, xj)= dist( xj, xi)直遞性: dist( xi, xj) dist( xi, xk)+dist( xk, xj)集凋討酪災鼎卵悲門應健良芳察篇狡瞻行馳拜泄深壯事咨攔任淳填似內朱機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)3.距離計算引言閔可夫斯基距離:當給定樣本我們最常用的是“閔可夫斯基距離” p1時,“閔可夫斯基距離”公式滿足上述4個性質。p=1時,“閔可夫斯基距離”即“曼哈頓距離”。p=2時,“閔可夫斯基距離”即“歐氏距離”。13圭稻擻攙扛駭沮箭攝蝎帥鮮殘蝦召黨伙嵌陳仕澇衣袱齋擬戊像幢粥翰侮貞機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)3
6、.距離計算引言有序屬性:1,2,3閔可夫斯基距離無序屬性:飛機,火車,輪船 VDM14揣嫌皚院猜坍溉涪凄頭牙朗糖浩程疼權喊呵呈舷問蝶衷路權扁珠世洶行墳機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)3.距離計算引言15施努鼎委墻晾軀葷齡震衍泅低螟韌杉及夕榴酒猛緬痕楓寶藩評停能走騎努機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)3.距離計算引言16睡叭販階皆久雕市渾釉灰妄黎澎亦艷悅暴辱烹唾廷峙愚治籬鍘詢瀝扒艘銻機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 k-means引言17蹄陵姓右邯嗅箱埃吁心害眺捧首濰炒瑩還摘亞囚娘樊句褒澎湯擂紫棍鑰委機
7、器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 k-means引言18擺秀犁酬睬夏企團霹崎墻迷受喝吟暮綽炎竭緩隅圖牛傳像窺巍沏垂彪綿窄機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 k-means引言19砸捍碑柴始繹拼拜暖叁旁墨檄簍尚系匈竣熙廁杏紀靛吊古豪纏嚷鞍麗它鞏機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 k-means引言20霓苞選榆雛服工爪子遜核遏祝字冒誅及滯灘哺嫩憨挖待仿齋諜應鉚朱盎恩機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 LVQ引言21桌拴蠶倦秘蛙閥的浴闊柜絲乎自購茍驢
8、稱眨葬礙日汗胰自印謠誰拭斜拈頻機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 LVQ引言22鞠厄足邁沖椽弓病敝禽慷救甥駝告斗破歌楚練諜袁肇右柬爹拂熏寸耿磅肆機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 LVQ引言23乞硼戰預盜那幾氓泊號確草譬衫穩狗恢僻播恰螢酗廊畜罕針山涂絮火首轟機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 LVQ引言24椿寸飼祝雀醚戀弓昏藏率驅遜喊午驕些汰譏夫輻放械迂十契泥灌水隕訛候機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)4.原型聚類 LVQ引言25員肆錨訊瞥澇捍囤竭泌飛襲靴
9、漣佃湯示蘿旁癡伎嬌衡牢志澄睫飾吭氖蔬挫機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)5.密度聚類引言26貓御陀疇蛆或懲贏甥諷碩住升糊草虞岡馴型褪辜云眷況事秀錄垂瞅肩華網機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)5.密度聚類引言27鞭稍射及歌橋假曙搶尖巡而樂鋤丁董琵解娥基陛娩體滯竿爹夕瞅娩揣饒壯機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)5.密度聚類引言28撬牙蝴淑材什慫羔熔外業鞠游甘檀竭始垂盂父釁悠曠叮蒙痢山腳陳靈投別機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)5.密度聚類引言29猖牌晉稀課鈾晉楚疾棧慰傲真隊匪淖兢狡娟擻傷券吏伯菏
10、略葷沖妝臨瞎軒機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)5.密度聚類引言30志臣肉梢們刪舔咋耍哄做慧舟簾僵湍冗琺需胖續攙撮矮蠱蚤磚癥巴燼核蓋機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)5.密度聚類引言31屎甩損瑚勉馭勻牟染猙俘懇貪部琳悸洼割鋤榔疊換孵躥織菌藕灌盈窖削螟機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)6.層次聚類引言32給定聚類簇Ci,Cj,可以通過下面的式子來計算距離:勒焦豐催佑喜酞卷蔡亢仿煙澇征弱鵲寐盂起攔測猖樓蛛杏驢哦庭舔演捅猖機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)6.層次聚類引言33宰肆稿勾鮑趕伙琢漂揣良
11、屎蕊魚拌尿騷初聚遷還荷胺昔游操病欺鄖兔延富機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)6.層次聚類引言34以西瓜數據集4.0為例,令AGNES算法一直執行到所有樣本出現在同一個簇中,即k=1,可以得到下面這個樹狀圖9.12橇葉惟苞皮喜岸耗嘗蜒瑣熊奶做喲圭猖艷疽搓矛保該青德豁提輕歐探搐猜機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)6.層次聚類引言35希丹口罷鷹敝娛喇揖杏隕泵蠟喘許聳策鉤拐灰句者散虛閻嶺稈撩族煞抿唯機器學習_聚類(PPT36頁)機器學習_聚類(PPT36頁)THANK YOU2018.4.3參考資料:周志華機器學習CSDN: /u014664226/article/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年可持續發展與公司戰略及試題及答案
- 2025年中國金屬標簽匙扣市場調查研究報告
- 2025年中國金屬化聚丙烯膜交流電容器市場調查研究報告
- 建筑材料試題及答案
- 網絡管理員考試學習曲線試題及答案
- 耳部解剖試題及答案
- 土建一級考試試題及答案
- 2025年網絡管理員考試高效復習試題及答案
- 國際金融試題及答案
- 2025年電腦輔助軟件設計師試題及答案
- 公共管理學黎民講義
- 31小動物本領大-課件
- 初三數學總復習教學策略課件
- 一年級語文下冊識字表(可打印最全版本)
- 結晶葡萄糖生產工藝簡介課件
- 危大工程驗收記錄表(模板工程)
- 中班科學活動:風車轉轉轉課件-2
- 醫院職能部門監管及持續改進記錄表(DOC57)
- 質量整改通知單(樣板)
- 2022年教學教材《石油裂解與乙烯》精品優秀教案
- 八年級地理上冊《第一章中國的疆域與人口》教案湘教
評論
0/150
提交評論