


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、肺癌的診斷問題各國醫學界已作了一些研究,并取得了某些實際的成果。但是,由于肺癌的多種類型以及多種相關因素,使得現有的診斷在準確性和實用性方面都存在著相當的局限性,如建模復雜困難。由于對影響罹病與否的各種因子的作用機制了解得不是很清楚,如何建立診斷模型,以及如何確定新建立的模型在何種程度上與實際情況相吻合還是一個問題;容錯能力不強,適用范圍不廣;依賴于某個病例庫新建立起來的醫學模型往往具有很強的局限性,用于新的病例庫時誤差有時較大。另外,由于醫學方面的原因,我們收集到的數據有時不完整,而現有的研究方法所建立起的醫學模型由于容錯性差,對這些不完整的數據通常都難以處理。以非線性大規模并行分布處理為特
2、點的人工神經網絡理論突破了傳統的線性處理模式,以其高度的并行性,良好的容錯性和自適應能力成為人們研究其賴以生存的非線性世界,探索和研究某些復雜大系統的有力工具。原理與方法神經網絡是一個具有高度非線性的超大規模連續時間動力系統。是由大量的處理單元(神經元)廣泛互連而形成的網絡。它是在現代神經科學研究成果的基礎上提出的,反映了腦功能的基本特征。但它并不是人腦的真實描寫,而只是它的某種抽象、簡化與模擬。網絡的信息處理由神經元之間的相互作用來實現;知識與信息的存儲表現為網絡元件互連間分布式的物理聯系;網絡的學習和計算決定于各神經元連接權系的動態演化過程。因此神經元構成了網絡的基本運算單元。每個神經元具
3、有自己的閾值。每個神經元的輸入信號是所有與其相連的神經元的輸出信號和加權后的和。而輸出信號是其凈輸入信號的非線性函數。如果輸入信號的加權集合高于其閾值,該神經元便被激活而輸出相應的值。在人工神經網絡中所存儲的是單元之間連接的加權值陣列。神經網絡的工作過程主要由兩個階段組成,一個階段是工作期,此時各連接權值固定,計算單元的狀態變化,以求達到穩定狀態。另一階段是學習期(自適應期,或設計期),此時各計算單元狀態不變,各連接權值可修改(通過學習樣本或其他方法),前一階段較快,各單元的狀態亦稱短期記憶(stm),后一階段慢的多,權及連接方式亦稱長期記憶(ltm)1。根據網絡的拓撲結構和學習規則可將人工神
4、經網絡分為多種類型,如不含反饋的前向神經網絡、層內有相互結合的前向網絡、反饋網絡、相互結合型網絡等2。本文的人工神經網絡模型是采用bp算法的多層前饋網絡。該模型的.特點是信號由輸入層單向傳遞到輸出層,同一層神經元之間互不傳遞信息,每個神經元與鄰近層所有神經元相連,連接權用wij表示。各神經元的作用函數為sigmoid函數,設神經網絡輸入層的p個節點,輸出層有q個節點,k-1層的任意節點用l表示,k層的任意節點用j表示,k+1層的任意節點用l表示。wij為k-1層的第i個神經元與k層的第j個神經元相連接的權值。k-1層的節點i輸出為o(k-1)i,k層節點j的輸出為k層節點j的輸出為okj=f(
5、netkj)設訓練樣本為(x,ye),x為p維向量,加到輸入層;ye為q維向量,對應于期望輸出;網絡的實際輸出y也是q維向量。網絡在接受樣本對的訓練過程中,采用bp算法,其權值調整量為wij=-kjo(k-1)i其中,對于輸出層為kj=yj(1-yj)(yej-yj)對于非輸出層為為訓練步長,取1。用樣本集合反復訓練網絡,并不斷修改權值,直到使實際輸出向量達到要求,訓練過程結束3。上述人工神經網絡可以完成多種信息處理任務,如從二進制數據中提取相關知識,完成最近鄰模式分類,實現數據聚集等。而本文要用的是其極強的數學逼近映射能力,即開發合適的函數farnbrn,以自組織的方式響應以下的樣本集合(x
6、1,y1),(x2,y2),(xm,ym),其中yi=f(xi)。這里描述的是一般的數學抽象,像識別與分類這些計算都可以抽象為這樣的一種近似數學映射。所謂診斷,實質上是一個分類問題。即根據候診者的癥狀,醫學檢查結果(如體溫、心跳等)等一些情況,它們可以用一向量(e1,e2,,em)來表示,將其歸類為病人或非病人。這也可以轉化為尋找一差別函數f使得(1)f(e1,e2,em),(e1,e2,em)t(2)f(e1,e2,em),(e1,e2,em)t其中集合t表示患病。因此,病情診斷最終也可作為一類函數的逼近問題。而許多研究已表明,前向神經網絡可作為非線性逼近的標準型。對于實數空間的任一函數,只
7、要它滿足一定的條件,一定存在唯一的具有單一隱層的前向網絡作為它的最優最佳逼近。而含有兩個隱含層的前向網絡可在任意的平方誤差內逼近某一實函數3。診斷步驟肺癌病例數據選自19811994年在某醫院住院的病人,共計551例。其中486例(88%)經病理學、細胞學診斷證實為肺癌。每一病例都包括多項數據,其中用于診斷的數據項有病人的一般情況(如年齡、性別等),家族史、既往史、吸煙史、術后病理、x射線檢查、ct檢查、纖維支氣管鏡檢查、pat痰檢等多達58項。因此,原則上 58項數據應作為神經網絡的輸入項,而神經網絡的輸出值就是病人是否患肺癌的結果。網絡訓練集的確定在最原始的551例病人數據中存在著各種各樣
8、的差別,如性別差異(419例男性,132例女性),診斷結果的差異(486例經證實為肺癌),所患肺癌種類的差異(鱗癌、小細胞癌、大細胞癌等),患病程度上的差異(早、中晚期的不同)等等。顯然,訓練數據集應最大限度地保證兼顧各種病例情況。經過仔細篩選,選擇了含有46個病例的集合作為肺癌診斷用的網絡的訓練集。神經網絡輸入和輸出數據的預處理按照人工神經網絡的理論,神經網絡的輸入輸出數據都應該屬于(,1)區間的實數,為此我們需對原始數據進行如下的規一化處理其中xi為原始數據項,而max=maxxixix,min=minxixix。這里x為原始數據集。經過(7)式變換后,yi將在(,1)區間。因此,可作為神
9、經網絡的輸入輸出。應用神經網絡進行肺癌診斷將描述病人各種情況的數據作為前向網絡的輸入數據加到其輸入端,并按(1)(6)式計算各神經元的輸入和輸出,同時調整神經元之間的連接權值以使網絡的輸出和實際的病例情況相符。即當病人確實患肺癌時網絡的輸出結果也恰好指示為肺癌,反之亦然。如果對所有的訓練樣本集網絡的輸出基本上(95%或更高)能保證與實際結果一致,則訓練過程結束。我們認為神經網絡已建立起病人的各種因素與他是否是肺癌患者之間的函數映射關系。對于一個新的候診病人來說,只要將他的情況輸入到訓練好的神經網絡中去,根據網絡的輸出結果就可以知道他是否已患肺癌。表1基于不同發病因素的診斷網絡模型類型 訓練集精
10、度 測試集精度基于遺傳因素的診斷網 58% 43%基于個人生活習慣的診斷網 51% 49%基于病癥的診斷網 84% 83%基于醫學檢查結果的診斷網 95% 96%上述結果表明不同類型的因素應分開來考慮。于是我們將58項輸入數據分成四類,這四類有各自的bp診斷網,依次稱為診斷一、診斷二、診斷三、診斷四。它們先單獨測定,然后再將它們各自的結果綜合起來得出最后的判斷。上述四種診斷網絡所得結果的可靠性各不相同。其中,根據醫學檢查結果所作的診斷準確性最高,因此在最后的綜合分析中要重點考慮它的診斷結果,我們給它設一個相對最高的權值。其次,根據病人的癥狀所作的診斷往往也具有較高的準確性,因此給它的權值也較高
11、,但比醫學檢查結果的稍低。其他兩類因素在有關肺癌的診斷中僅具參考作用,因而所設的權值相對較小。最后的結果o為o=ao1+ao2+ao3+ao4a1+a2+a3+a4=1其中oi,ai,i=1,2,3,4分別為各診斷網的輸出及其對應的權值。當o.5時最后的診斷結果為患肺癌,反之則正常。對所有的病例數據經上述方法的診斷結果見表2。表2神經網絡對肺癌診斷結果分析神經網絡診斷結果 訓練數據 測試數據肺癌患者 非肺癌患者 肺癌患者 非肺癌患者+ 46 2 25 3- 38 1 22其中對于訓練集,肺癌病人的正確檢出率為1%,非肺癌病人誤診率為5%。對于測試集,肺癌病人的正確檢出率為92%;非肺癌患者正確
12、檢出率為88%,誤診率為12%。討論本研究所采用的人工神經網絡的肺癌診斷方法的結果較好地符合了已知數據,具有較高的準確性,特別是對于肺癌患者一般都能準確地做出診斷,有利于肺癌的早期發現和治療。要想進一步提高該方法的準確性,應該注意收集更多更全面的病例數據。人工神經網絡主要是利用它能自動從數據集中抽取函數的關系的功能。如果我們所使用的數據越多越全面,則其中所蘊含的事物本身的規律性就越強,利用人工神經網絡從中所抽取的函數關系就越具有普遍性,因而就更準確。實現對肺癌的診斷的關鍵在于準確找到罹患肺癌的判定函數,可利用前向網絡的函數逼近功能來實現。但是這里涉及到兩個問題。首先,由于差別函數和預測率函數都
13、是利用人工神經網絡從已知的病例數據集中抽取出來的,它實際反映的是這些數據集中輸入輸出對的映射關系。因此要想保證診斷具有較高的準確性,就應該使用來建立函數關系的這些數據集(稱訓練集)具有充分的代表性,即這些數據應基本蘊含肺癌診斷的醫學原理。這就涉及到如何選擇網絡合理的訓練集及關鍵的輸入項。另一個問題涉及到神經網絡本身的要求,即網絡的輸入輸出數據值都應在區間(,1)中。這可以通過數據的編碼和歸一化來實現。由于某些原因有些病人的病例數據不完整,約占總病例數據的1%左右。顯然,如果按照傳統的方法來建立肺癌病人的診斷模型4,這些有缺項的數據是不太好處理的,但是由于人工神經網絡有較強的容錯性,輸入數據在某些項上的錯誤對網絡最終結果的正確性影響不大。參考文獻焦李成.神經網絡系統理論.第1版.西安西安電子科技大學出版社,1995,3wang
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司福利院慰問活動方案
- 公司福利團建旅游活動方案
- 公司自駕游出行活動方案
- 2025年職業生涯規劃與發展考試試卷及答案
- 2025年應急救援與災難管理考試題及答案
- 2025年新興技術與傳統行業融合發展的能力測試試卷及答案
- 2025年水資源管理與可持續發展考試題及答案
- 2025年生物醫學工程專業綜合考試試題及答案
- 2025年農田水利工程師職業資格考試試卷及答案
- 2025年量子物理基礎知識與應用考試試題及答案
- 黨建考試試題及答案國企
- 客運行業事故隱患內部報告獎勵管理制度2025
- 縱隔腫物護理
- 房屋建筑與市政工程重大事故安全隱患判定標準解讀課件
- DB43-T 1267-2023 機動車檢驗機構建設和運行管理規范
- 公司稅務注銷協議書
- 2025年人力資源管理專業期末考試卷及答案
- 防溺水安全家長會課件
- 第四單元:促銷問題(方案選擇問題)專項練習(學生版+解析)-2024-2025學年六年級數學上冊培優精練(北師大版)
- 放射科實習生入科教育
- 國家開放大學國開電大《幼兒園課程基礎》形考任務1~4答案
評論
0/150
提交評論