基于MATLAB的就業數據的聚類分析_第1頁
基于MATLAB的就業數據的聚類分析_第2頁
基于MATLAB的就業數據的聚類分析_第3頁
基于MATLAB的就業數據的聚類分析_第4頁
基于MATLAB的就業數據的聚類分析_第5頁
已閱讀5頁,還剩2頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、    基于matlab的就業數據的聚類分析    鄒全+常程威+賈月月摘 要: 根據2010年到2013年我院校大學生就業情況,對大學生的就業數據進行分析。數據分析有很多方法,本文主要采用譜系聚類、k均值聚類、模糊c均值聚類三種聚類方法,并得出了結論。關鍵詞: matlab 聚類分析 就業數據隨著中國高校教育的發展,大學生人數急劇增加,就業問題日益突出,大學生就業難的問題已成為社會熱點、難點。根據2010年到2013年近四年我院校大學生就業情況,對大學生的就業數據進行聚類分析。根據就業數據可以對學生選擇就讀的專業及學校本科辦學提供一定的參考價值。聚類分

2、析是多元統計分析的一種,也是非監督模式識別的重要分支,在模式分類、圖像處理和模糊規則處理等眾多領域獲得最廣泛應用。它把一個沒有類別標記的樣本集按某種準則劃分為若干個子集(類),使相似樣本盡可能歸為一類,而將不相似樣本盡量劃分到不同類中。收集和整理2010年到2013年這四年我院校的就業數據,對就業數據中的就業率、考研升學率和男女生首次平均月收入進行matlab編程,得出散點圖,并進行分析。對就業數據中畢業生的就業流向分別采用譜系聚類、k均值聚類和模糊c均值聚類三種聚類分析方法進行分析。如表1。1.譜系聚類算法的步驟譜系聚類首先將每個樣品看成一類,然后把最相似的樣品聚為一小類,再將已聚類的小類按

3、各類之間的相似性進行再聚類,隨著相似度減弱,最后將一切子類都聚為一大類,從而得到一個按相似度大小聚集起來的譜系圖1。利用譜系聚類算法對表1的就業流向數據進行聚類分析。將數據分成3類,從程序輸出的結果得出結論,共可分成3類,常州單獨為一類,南京、蘇州、無錫為一類,剩下的鎮江、揚州、南通之類的歸為一類。也就是說,很多外地畢業生就在常州發展,很大一部分畢業生去南京、蘇州、無錫工作,還有一小部分畢業生去了鎮江、揚州、南通,還有省外等地。2.k均值聚類算法的步驟譜系聚類法是先將每一個樣品看成一類,通過比較距離的大小逐步擴充類,因此,對于給定的數據,譜系聚類一定能將樣品合并成為一類,分類結果唯一,但譜系聚

4、類有一個缺點,就是樣品一旦被分到某一類中就不能改變了,且當樣品容量較大時,計算量相應變大。克服這一缺點的辦法就是k均值聚類法,又稱之為快速聚類法或動態聚類法。利用k均值聚類算法對表1的就業流向數據進行聚類分析。從圖1可知,將地區分成3類。為一類,分別表示常州、蘇州、南京、無錫;一類,分別表示省外、鎮江、揚州;為一類,表示剩下的幾個地區,如鹽城、南通、泰州、宿遷等。換句話說,大部分畢業生選擇在蘇南地區工作,一部分畢業生選擇去省外,如上海和鎮江、揚州工作,只有少數一部分人選擇去淮安、宿遷、鹽城等地工作。3.模糊c均值聚類算法的步驟模糊聚類得到了樣本屬于各個類別的不確定性程度,表達了樣本類屬的中介性

5、,即建立起了樣本對類別的不確定性描述,能更客觀地反映現實世界,從而成為聚類分析研究的主流2。采用模糊c均值聚類算法對表1的就業流向數據進行分析。從輸出聚類的結果來看,常州、南京、蘇州、無錫這四個城市為一類,表示很大一部分畢業生愿意在這幾個城市發展;鎮江、揚州、省外三地為一類,表示有一部分畢業生選擇在這些地方發展;剩下的如南通、鹽城、泰州等七個城市為一類,說明少部分人愿意去這些城市工作發展。4.三種聚類算法對就業流向的分析結論從三種聚類算法的結果可以看出,譜系聚類算法與k均值聚類算法和模糊c均值聚類兩種算法的聚類結果不同。通過比較可以看出,譜系聚類算法的結論不是很理想。k均值聚類算法得出的散點圖更直觀地表現了數據的聚類,所以k均值聚類算法更好一些。通過對就業流向的聚類分析,可以看出極大一部分畢業生選擇在江蘇經濟發達地區工作,如蘇州、南京、無錫、常州這些城市,其中由于我院校在常州,因此很大一部分畢業生愿意留在這個生活了四年的地方工作。畢竟在大城市的選擇和發展機會都比較多。還有一部分畢業生選擇在鎮江、揚州和省外如上海等地工作。只有少數一部分人愿意去如泰州、鹽城、宿遷等地工作。參考文獻:1吳志遠,王遠干.大學

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論