




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
沈航人機智能研究中心普適性核度量標準比較研究王裴巖2015年8月引言
基于核函數(shù)的機器學(xué)習(xí)方法,簡稱核方法,是機器學(xué)習(xí)領(lǐng)域的一類重要方法,被廣泛地應(yīng)用于分類,聚類,回歸和特征選擇等方面.最具有代表性的方法如:支持向量機,譜聚類,嶺回歸,核主成分分析等.
然而核函數(shù)的選擇與參數(shù)優(yōu)化一直是影響核方法效果的核心問題,從而推動了核度量標準,特別是普適性核度量標準(UniversalKernelEvaluationMeasure)的研究.
普適性核度量標準不直接估計泛化誤差界,僅依據(jù)給定的問題和樣本對核函數(shù)質(zhì)量做出量化評價。較高的計算效率,計算代價僅為;
具有算法無關(guān)性,不依賴于具體核學(xué)習(xí)算法與核函數(shù),具有較好的推廣能力。引言引言對KTA,EKTA,CKTA,FSM與KCSM進行了比較研究。發(fā)現(xiàn)了上述5種普適性度量標準具有較為相近的形式,可在統(tǒng)一的框架下進行研究與比較;發(fā)現(xiàn)其度量內(nèi)容為特征空間中線性假設(shè)的平均間隔,與支持向量機最大化最小間隔的優(yōu)化目標存在偏差;使用模擬數(shù)據(jù)研究了類別分布敏感性,線性平移敏感性,異方差數(shù)據(jù)敏感性,指出5種度量標準產(chǎn)生上述問題的原因;在9個UCI數(shù)據(jù)集和20Newsgroups數(shù)據(jù)集上的核函數(shù)選擇實驗比較了5種度量標準的度量效果。5種度量標準簡介KernelTargetAlignment(KTA)5種度量標準簡介CenteredKernelTargetAlignment(CKTA)5種度量標準簡介ExtensionofKernelTargetAlignment(EKTA)5種度量標準簡介FeatureSpacebasedkernelmatrixevaluationMeasures(FSM)5種度量標準簡介KernelClassSeparablityMeasures(KCSM)討論特征空間中的線性假設(shè)線性假設(shè)的期望間隔討論與相互獨立假設(shè)討論討論類別分布敏感性討論討論線性平移敏感性討論討論異方差數(shù)據(jù)敏感性討論實驗KTAEKTACKTAFSMKCSM與10-CV最小錯誤率無顯著性差異的數(shù)量9/199/1910/194/197/19顯著好于其他普適性度量標準的數(shù)量12/1911/1916/194/1910/19
本文使用來自UCI的9個數(shù)據(jù)集和20Newsgroups數(shù)據(jù)集進行核函數(shù)選擇實驗.UCI數(shù)據(jù)集中的多分類問題使用“one-vs-one”策略轉(zhuǎn)化為多個二分類問題。在UCI數(shù)據(jù)集上采用10折交叉驗證的方法估計錯誤率.
20Newsgroups數(shù)據(jù)集,包含樣本18846,特征26214.該數(shù)據(jù)集已經(jīng)劃分訓(xùn)練集和測試集,訓(xùn)練集包含樣本11314(60%),測試集包含樣本7532(40%),在訓(xùn)練集上采用核函數(shù)度量標準選擇核函數(shù),在測試集上驗證所選擇核函數(shù)的分類錯誤率.核方法使用SVM,訓(xùn)練工具采用LIBSVM.參數(shù)為0.1,1,2,4,8,16,32的RBF核與參數(shù)為1,2,3,4的多項式核作為被度量的核函數(shù).SVM的懲罰因子C使用10折交叉驗證從0.01,0.1,1,10,100中選擇。總結(jié)發(fā)現(xiàn)了上述5種普適性度量標準具有較為相近的形式,可在統(tǒng)一的框架下進行研究與比較;發(fā)現(xiàn)其度量內(nèi)容為特征空間中線性假設(shè)的平均間隔,與支持向量機最大化最小間隔的優(yōu)化目標存在偏差;使用模擬數(shù)據(jù)研究了類別分布敏感性,線性平移敏感性,異方差數(shù)據(jù)敏感性,指出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 媒介營銷考試題及答案
- 醫(yī)療健康大數(shù)據(jù)的倫理挑戰(zhàn)融資與隱私權(quán)平衡探討
- 家具行業(yè)設(shè)計中的法律與倫理問題考核試題及答案
- 如何評估家具設(shè)計的市場前景試題及答案
- 工程項目安全管理表格應(yīng)用試題及答案
- 一年級摸底試卷及答案
- 一年級8單元試卷及答案
- 大學(xué)化學(xué)基礎(chǔ)知識的牢固掌握試題及答案
- 開升降機試題及答案
- 2025年建筑施工風(fēng)險評估試題及答案
- 《體育舞蹈》課件
- 高三一模總結(jié)主題班會課件
- 幼兒園優(yōu)質(zhì)公開課:中班語言繪本《明天我再來吃掉你》第二版課件
- 注塑APQP資料參考
- 類比法-創(chuàng)新思維
- DB4403T339-2023城市級實景三維數(shù)據(jù)規(guī)范
- 設(shè)備維護工程師簡歷
- 2023版押品考試題庫必考點含答案
- 口腔與健康智慧樹知到答案章節(jié)測試2023年溫州醫(yī)科大學(xué)
- 挖孔樁基施工方案(水磨鉆)
- 變電檢修技能考試計算
評論
0/150
提交評論