




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、生存分析,目錄,概述,定義,生存分析是研究生存現象和響應時間數據及其統計規律的一門學科。由于最初研究的關鍵事件是死亡,故稱為生存分析。生存分析是統計科學的重要分支,其研究的兩個重要變元為“事件”和“壽命”。 事件:生存分析中定義的事件有死亡、損壞、失敗、解雇、病發等等。例如病人的死亡,產品的失效,疾病的發生,職員被解雇。 壽命:從記錄開始到事件發生的時間。,特點,生存分析的優點在于其能夠處理刪失數據。 生存分析的統計資料以生存時間為反應變量,此類資料的生存時間變量大多不服從正態分布,且由于刪失值的存在,不適合用傳統的分析方法處理。此時就應選用生存分析的方法。,研究內容,生存分析研究的內容主要有
2、以下兩個方面: 一 對生存過程的描述 二 分析生存過程的影響因素并對生存的結局加以預測,應用領域,生存分析雖然源自醫學領域,但其在生物學,保險學,可靠性工程學,經濟學,教育學,社會學等領域都有廣泛的應用。比如: 醫療科學中病人的去世 保險行業中的賠償 可靠性工程中產品的失效 金融領域中銀行賬戶從開立到取消的時間的研究 教育行業中學生的中途退學 客戶關系管理中的客戶流失,常用術語,生存數據,生存分析中所分析的數據通常稱為分析數據,一般度量的是某個事件發生所經歷的時間長度。生存數據可以分為完全數據和刪失數據。 完全數據:指提供了完整信息的數據。例如,在研究產品的失效時間時,某個樣品從進入研究直到失
3、效都在我們的觀察中,可以得到該樣品的具體失效時間,這就是一個完全數據。 刪失數據:是指在觀測期內,我們并沒有看見個體的狀態發生改變,無法確定個體具體的生存時間。又分為左刪失數據,右刪失數據,區間刪失數據。,刪失數據示意圖,起始 觀測時間區間 終止,死亡,死亡,死亡,未知,退出,完全數據: A,觀測期內死亡 右刪失數據: B,觀測未終止時因故退出 C,觀測終止時尚未死亡 左刪失數據: D,死亡時間在某一時刻之前,具體時間未知 區間刪失數據: E,死亡時間位于某一區間,具體時間未知,生存函數,生存函數(survival function),又稱為累積生存率,我們用符號T表示個體的生存時間(從開始記
4、錄到事件發生的時間),用 t 表示觀測時間,將生存函數記作 S(t),是指個體生存時間大于 t 的概率。 S(t)= P(T t ),顯然 S(t)是非升函數,且S(0)= 1, S()= 0,,風險函數,風險函數(hazard function),又稱為瞬時死亡率,記作 h(t)。是指在t時刻存活的個體,在t+ t 時刻死亡的概率。 顯然,h(t)非負,且無上限。,分析方法,按照是否使用參數,可以將生存分析中的分析方法分為三類: 參數方法:若已經證明某事件的發展可以用某個參數模型很好地擬合,就可以用參數方法做該事件的生存分析。常用的參數模型有指數分布模型、對數分布模型、正態分布模型,威泊分布
5、模型等。 非參數方法:當被研究事件不能被參數模型很好地擬合時,可以采用非參數方法研究它的生存特征。常用的非參數方法包括生命表分析和K-M分析。 半參數方法:它比參數模型靈活,與非參數方法相比更容易對分析結果進行解釋。生存分析中使用的半參數模型是Cox比例風險模型。,非參數方法,生命表分析 K-M分析,生命表分析,生命表分析將觀測時間分成時間段,按時間段逐個統計事件發生的情況,以此估計生存函數。假設共有k個時間段 t 0 , t 1) , t 1 , t 2) , , t k-1 , t k ) , 每個區間中事件發生的次數分別為 d 1 ,d 2 , , d k , 每個區間中的個體總數分別為
6、 n 1 , n 2 , , n k ,所以在第 i 個區間個體存活的概率為(n i - d i )/ n i ,而個體可以從第一個區間存活到第 i 個區間的概率(累積生存率)為: i = 1 , 2 , ,k ,且S(t)為遞減函數。,K-M分析,Kaplan-Meier分析,也稱為乘積極限分析,是Kaplan和Meier在1958年提出的一種估計生存函數的非參數方法。與生命表分析不同,K-M分析以事件發生的時間點將觀測區間分段,用來估計生存函數。下舉例說明其具體的分析過程。,下表記錄了5個實驗對象的存活時間,其中F代表失效,S代表存活,2和4為右刪失數據。,用S(t)表示實驗對象的累積存活
7、概率,分時間段計算如右:,t,0,31) :此區間5個實驗對象均存活,故 S(t)=5/5=1. 31,65) :個體1在31小時死亡,故本區間 S(t)=14/5=0.8 65,150) :個體2在65小時退出實驗,本區間無個體死亡, S(t)=0.84/4=0.8. 150,220) :個體3在150小時死亡,S(t)=0.82/3=0.53. 220,300) :個體4在220小時退出實驗,本區間無個體死亡, S(t)=0.532/2=0.53. t=300時,個體5死亡,S(300)=0,以SPSS對上例進行K-M分析,結果如下: 1.輸入數據,2.進行K-M分析,參數設置,輸出結果,
8、K-M分析生存函數圖,生命表分析與K-M分析的比較,生命表分析適用于大樣本的情況,特別是沒有個體數據的情形,主要優點是對生存時間的分布沒有要求。 K-M分析中時間區間的劃分是以事件的發生為依據的,因此必須知道每個個體的生存時間數據,適用于小樣本的情況。,半參數方法,生存分析中我們常常遇到個體的生存狀況受到多種因素影響的情況。這些對生存時間有影響的變量稱為協變量。在分析生存數據時要將協變量的影響考慮進去。Cox半參數模型就很好地解決了這個問題。它假定風險函數由兩部分構成:基準風險函數和協變量線性組合的指數。 Cox半參數模型又分為獨立協變量比例風險模型和時間相依性協變量比例風險模型兩種。二者的區
9、別在于協變量的取值是否和時間有關。,Cox獨立協變量比例風險模型,該模型可寫成如下形式: 式中,Z1,Z2,Zm為協變量,這里的協變量與時間無關,1,2,m為對應協變量的未知參數。h 0(t)是基準風險函數。 實際應用中常比較兩個不同個體風險函數的比率,即危險率。可以證明危險率為常數,因此該模型又稱為比例風險模型。 當協變量與時間有關時,危險率將不再是常數,此時稱為時間相依性比例風險模型。,案例分析,兩組小白鼠用來檢驗癌癥的治療狀況。一組使用傳統治療方法,另一組使用試驗方法,試驗人員記錄了小白鼠的存活時間及狀態:Days為存活時間或觀測時間;Status表示生存狀態,取值1表示死亡,0表示存活
10、;Group表示治療方法,取0表示傳統療法,取1表示試驗療法,共有64組數據。,原始數據如下:,首先用生命表分析方法對數據進行處理:,1.輸入數據,2.選擇生命表分析,3.設置參數,4.輸出結果,可以看出,大約在200天時兩種治療方法的生存函數相交,在200天以前傳統治療方法的存活率較高,而在200天以后試驗方法的治療效果明顯優于傳統治療方法。,中位數生存時間是生存率為50%時,生存時間的平均水平。 從中位數生存時間來看,傳統治療方法的中位數為241天,試驗方法的中位數為266天,明顯高于傳統治療方法。可以判斷試驗方法的療效相比傳統治療方法有所提高。,用K-M方法對數據進行處理,結果如下:,生
11、存函數分布和生命表分析的結果相似。K-M方法可以記錄刪失數據,且由于分段較多整體呈現密集的鋸齒,而生命表分析的分布則較為平緩。 在結果檢驗上,不同檢驗方法結果有所差異,其中Log Rank檢驗的p值小于0.05,表明兩種治療方法有顯著性差異。,除了治療方法對小白鼠的生存狀況有影響,其他因素如性別,年齡,體重等都可能對其生存時間造成影響。加入這些數據后,用Cox獨立協變量比例風險模型重新分析。,1.輸入數據,2.設置參數,3.輸出結果,分類變量是指不連續的變量,此例中治療方法的值只取0和1,性別只取F和M。不同于體重、年齡這些連續變量,分類變量在計算風險比例時以參考類別作為參照。如在本案例中治療方法這一因子以試驗方法作為參照。計算結果為傳統方法的風險率相對于參考的倍數。,上表為模型系數的綜合檢驗結果。可以看到p=0,小于0.05,說明這些因素中有些變量對白鼠的生存時間有顯著影響。,此表給出了各個變量的單個模型系數檢驗結果,可以看到體重變量的p=0,說明體重對風險函數有極顯著影響。體重每增加
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司職業鑒定活動方案
- 公司新年拍照策劃方案
- 公司獻血公益活動策劃方案
- 公司種植綠植活動方案
- 公司特賣現場活動方案
- 公司電商短視頻策劃方案
- 公司溫泉度假活動方案
- 公司臘八節慰問活動方案
- 公司水槍大戰活動方案
- 公司相親會會活動方案
- 新教材人教a版選擇性必修第三冊8.1成對數據的統計相關性課件2
- 芬頓試劑投加量計算
- 精選《機械制圖》期末考試題庫388題(含答案)
- 2023年山西萬家寨水務控股集團有限公司招聘筆試題庫及答案解析
- 數碼照片檔案管理夏2014
- GB/T 19249-2003反滲透水處理設備
- 2023年德陽市旌陽區廣播電視臺(融媒體中心)招聘筆試題庫及答案解析
- 小學生職業生涯規劃啟蒙課件PPT
- 鉆井安全操作規范
- 食用菌生產技術 大球蓋菇栽培技術課件
- 花城版小學二年級音樂(下)全冊教案
評論
0/150
提交評論