基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用_第1頁
基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用_第2頁
基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用_第3頁
基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用_第4頁
基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用    摘要:針對BP神經網絡學習效率低、容易陷入局部最優等缺點,提出了一種基于主成分分析的混合蛙跳算法(Shuffle Frog Leaping Algorithm)優化的BP神經網絡模型。使用主成分分析法對高維數據進行特征提取,作為網絡輸入;采用混合蛙跳算法優化 BP 神經網絡的權系數和閾值,構建基于混合蛙跳算法神經網絡的帕金森病分類模型。最后,以UCI中Parkinson數據為例,實驗表明,新模型優于傳統的BP網絡。 關鍵詞:主成分分析;混合蛙跳算法;BP神經網絡;帕金森氏病;分類 中圖分類號

2、:TP393 文獻標識碼:A 文章編號:1009-3044(2013)04-0861-05 Based-on PCA of SFLABP Neural Network Model in Application of Parkinson DiseaseS Classification ZHANG Zhi-hao,TANG De-yu (College of Medical Information Engineering,Guangdong Pharmaceutical University,ZhongShan 528458,China) Abstract:For the shortcomings

3、 of BP neural network which is low learning efficiency and is easy to trap into local optimum, according to these problems, a new BP neural network model optimized by Shuffle Frog Leaping Algorithm based on Principal Component Analysis is proposed. Using Principle Component Analysis to extract the f

4、eatures of high dimensional data, the input variables; the bias of BP neural network are optimized by Shuffle Frog Leaping Algorithm and then build the classification model of Parkinson's disease based on SFLABP neural network. At last, taking the data of Parkinson from UCI for example, the expe

5、riment result demonstrates the new model is better than the traditional BP neural network. Key words:principal component analysis (PCA); shuffle frog leaping algorithm (SFLA); BP neural network; Parkinson; classification 隨著智能計算的不斷發展,人工神經網絡由于其自身的適應能力和學習能力,在醫療診斷上的應用越來越廣泛,其中BP神經網絡1是人工神經網絡中應用最廣的一種神經網絡,但

6、由于其具有學習效率低、參數選擇敏感、網絡結構難確定、易陷入局部收斂等缺點,給實際應用帶來了一定的困難,尤其是當網絡輸入變量過多時,網絡結構更復雜,網絡訓練負擔過重,學習效率驟降,將高維數據在不影響較多期望的前提下降維,網絡的學習效率才會有所提高,BP網絡的實際應用也將更有價值。 混合蛙跳算法,是2003年由Eusuff 和Lansay提出的一種基于啟發式搜索的全局優化群體智能算法,它具有全局搜索能力強、參數少、原理簡單易實現等特點,將混合蛙跳算法與BP網絡結合,利用SFLA的全局搜索優化BP網絡的結構參數,可以有效解決BP網絡易陷入局部最優等問題。 為了解決BP網絡中的缺陷,該文利用了主成分分

7、析法降維與SFLA 全局搜索能力強等優點,網絡輸入使用PCA降維,網絡參數使用SFLA優化,提高了BP網絡的學習效率,實驗證明,新模型更優。 1 主成分分析 主成分分析是由霍特林于1933年第一個提出的,主要是根據降維的思想,在損失較少信息期望的前提下,將多個相互關聯的指標轉化為幾個綜合指標的多元統計分析方法。其主要計算步驟為: 設有m個指標<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image1.pdf>,n個對象的各項指標組成了原始數據矩陣<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病

8、分類中的應用 2%-574image2.pdf> 1)對<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image2.pdf>進行標準化處理,使各項指標的均值為0,方差為1,具有可比性,即令: <d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image3.pdf> (1) 2)計算各指標的相關系數矩陣R與R的特征值<D:2013年學術和海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh101.jpg> <

9、;D:2013年學術和海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh102.jpg> (2) 3)確定主成分的個數<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image7.pdf> 計算各個主成分的方差貢獻率<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image8.pdf>與累計貢獻率<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image9.pd

10、f>,一般取累計貢獻率達<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image10.pdf>的特征值<D:2013年學術和海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh103.jpg>所對應的第一、第二、,第p個主成分。 <D:2013年學術和海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh104.jpg> (3) 4)計算主成分的因子載荷矩陣I <D:2013年學術和海外2013年學術交流2013年學術交流

11、第04期排版第一批 905 人工智能 13zzh105.jpg>其中<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image16.pdf>為的特征向量。 (4) 5)根據因子載荷矩陣,確定各主成分表達式,得到各主成分得分。 2 混合蛙跳算法 混合蛙跳算法2,在模擬青蛙群體尋找食物時,將蛙群分為幾個子種群,每個子種群以及每只青蛙覓食的思想相互傳遞相互影響,將全局信息混合交換與局部信息深度搜索相結合,局部深度搜索能夠快速有效地在一個特定區域內尋優,加快尋優速度;而全局混合交換可以避免個體陷入局部最優,使得算法能夠跳出局部最優

12、,不斷靠近全局最優。算法的基本流程3如下: 1)初始化種群X。確定青蛙的數量F、種群以及每個種群青蛙的個數m,n,與青蛙最大步長<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image18.pdf>。 2)隨機產生初始青蛙,計算各個蛙的個體適應度值<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image19.pdf>,并按個體適應度值的大小進行降序排列,并記錄最優解<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用

13、2%-574image20.pdf>。 3)將青蛙進行分組,將青蛙分成m個子種群,每個子種群有n只青蛙,分組規則如下: <d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image21.pdf> (5) 即將第1只青蛙放入第1個子種群,第2只青蛙放入第2個子種群,第m只青蛙放入第m個子種群,第m+1只青蛙放入第1個子種群,第m+2只青蛙放入第2個子種群,依此類推,直至全部青蛙分組完畢。 4)對每一個分組進行模因進化,即局部搜索最優。進化過程如下: a)找出該分組中個體適度值最差<d:飛翔導入圖片目錄4張志豪 基于主成分

14、的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image22.pdf>與最優<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image23.pdf>的個體 b)對個體適度值最差的個體進行更新,更新策略為: i.蛙跳步長更新:<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image24.pdf> (6) ii.位置更新:<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image25.p

15、df> (7) 如果<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image26.pdf>優于<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image22.pdf>,則<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image22.pdf>=<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image27.pdf>,否則<

16、;d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image28.pdf>,再重復i,ii步驟,若此時的<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image26.pdf>還比<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image29.pdf>差,則隨機產生一只新的青蛙代替<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image30.pd

17、f> 2)重新將進化完的各個分組進行混洗,對青蛙進行重新排序和分組,得到最優解<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image20.pdf>。 3)重復計算(3)(4)(5)直至滿足迭代條件為止。 3 BP神經網絡 BP神經網絡1是一種單向傳播的多層前饋網絡,其主要特點是信號前向傳遞,誤差反向傳播。其拓撲結構如圖所示: 由圖1可知,BP神經網絡是一種具有三層或三層以上的神經網絡,包括輸入層、隱含層和輸出層,層與層之間多采用全連接的方式,可以被看成是一個從輸入到輸出的高度非線性映射,即:<D:2013年學術和

18、海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh01.jpg> 以典型的3層BP神經網絡結構為例,轉移函數采用Sigmoid函數,<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image33.pdf>, (8) 則: 其中<D:2013年學術和海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh03.jpg>為權值,<D:2013年學術和海外2013年學術交流2013年學術交流第04期排版第一批 905 人工智能 13zzh04

19、.jpg>為閾值,<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image38.pdf>為隱含層輸出,<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image39.pdf>為輸入層節點數,<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image40.pdf>為輸出層節點數,<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574imag

20、e41.pdf> 4 PCA-SFLA-BP神經網絡模型 標準的BP網絡算法學習效率低,收斂速度慢。當輸入層的節點數較多時,也易陷入“維數災”的問題,同樣會影響其收斂的速度。 主成分分析4基于降維的思想,可以減少BP網絡陷入“維數災”的問題;混合蛙跳算法是一種群體智能優化算法,通過個體間的協作與競爭來實現在多維空間中對最優解的搜索。 因此,在進行BP神經網絡訓練時,我們使用PCA對網絡的輸入層節點數進行降維,使用混合蛙跳算法改進優化BP網絡的權值和閾值,從而提高網絡的學習效率56。其中適應度函數定義如下: 式中,N為網絡輸入節點數,<D:2013年學術和海外2013年學術交流201

21、3年學術交流第04期排版第一批 905 人工智能 13zzh107.jpg>為網絡預測輸出值,<d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image44.pdf>為樣本實際輸出值,q為用于網絡訓練時輸入輸出的數據維數,s為網絡輸出節點數。 整個模型流程圖如圖2所示: 5 實驗結果與分析 為了驗證模型的有效性,選用UCI機器學習數據庫中的Parkinson數據集作為測試,該數據集有195個樣本,由Little于2007年所建,主要針對31位病人,用生物醫學儀器進行約6次的發音測試后記錄而成,共有23個字段,其中有22個字

22、段為測試的屬性,如:MDVP、FO、Jitter、Shimmer、RAP、PPQ、HNR等一些聲學參數,1個類標號(status),其值為0和1,1表示為確定病例。其中1有147例 ,0有48例。 上述數據集兩類中分別隨機選取100例和36例作為網絡訓練,其余的作為網絡測試。并對網絡輸出重新定義,即將類標號進行了處理,其中0 1表示0,1 0表示1。 隱含層節點數l采用公式:其中n為輸入層節點數,m為輸出層節點數,a取1-10。 <d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image50.pdf> (11) 構建BP神經網絡

23、n-l-m,且本文中混合蛙跳算法的各參數分別為:青蛙規模F=20,子種群數量(模因組組數)m=5,每組中蛙的數量n=4,模因進化迭代次數Ne=10,全局迭代次數max gen=10,相當于總迭代次數為在這種平臺上得到了本次實驗結果。 5.1利用主成分分析選取網絡的輸入變量 將UCI中Parkinson8數據集的22個屬性作為原始數據,按照前面主成分分析的步驟對原始數據進行主成分分析。得到特征值碎石圖見圖3,累計方差貢獻率見表1。由表1可確定前4個特征值的累計方差貢獻率已大于80%,所以選取4個主成分,同時也可得出各主成分的表達式與主成分得分,將主成分得分作為網絡的輸入變量。其中之一的表達式如下

24、: 5.2構建SFLA-BP的帕金森病分類模型 利用主成分得分作為網絡的輸入,即輸入層為4,分別以隱含層為4,6,8,10,輸出層為2構造SFLA-BP神經網絡的Parkinson分類模型,隱實驗結果以隨機某10次結果的平均值,其中得到某次實驗(隱含層節點數為10)的均方誤差圖見圖4,結果見表2。 <d:飛翔導入圖片目錄4張志豪 基于主成分的SFLABP網絡模型在帕金森氏病分類中的應用 2%-574image62.png> 由圖4可得,應用了主成分分析法,減少網絡的輸入變量個數,網絡的結構得到了簡化,以及應用了SFLA優化BP的網絡參數,學習率得到提高,網絡訓練的次數減少,由表2可知:網絡的預測效果比較精確,模型有效可用。 5.3 預測結果比較 為了更好地對新模型與傳統BP模型進行比較,該文多做了以下兩個實驗,對未經過主成分分析的數據,建立三層BP神經網絡模型與SFLA-BP模型,實驗結果仍然以隨機某10次結果的平均值,其中得到某

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論