第15章 生存分析_第1頁
第15章 生存分析_第2頁
第15章 生存分析_第3頁
第15章 生存分析_第4頁
第15章 生存分析_第5頁
已閱讀5頁,還剩15頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

生存分析SurvivalAnalysis一、什么是生存分析?在醫學研究中,常常用追蹤(followup)的方式來研究事物發展的規律。了解某藥物的療效了解手術后的存活時間了解某醫療儀器設備的使用壽命這種研究的特點是追蹤研究的現象都要經過一段時間,統計學上將這段時間稱為生存時間。生存分析就是用來研究生存時間的分布規律以及生存時間和相關因素之間關系的一種統計分析方法。二、生存分析的基本概念生存時間(survivaltime):

從某起始事件起到某終止事件止所經歷的時間跨度稱為生存時間。例如,在臨床研究中,急性白血病患者從骨髓移植治療開始到復發為止之間的時間間隔。冠心病患者在兩次發作之間的時間間隔。在流行病學研究中,從開始接觸某危險因素到發病所經歷的時間。在動物實驗研究中,從開始給藥到發生死亡所經歷的時間。生存時間數據的類型完全數據(completedata):它提供的關于生存時間的信息是完整確切的,也就是說它準確地度量了觀察對象實際生存的時間。截尾數據(censoreddata):它提供的關于生存時間的信息是不完整不確切的,也就是說它沒有準確地度量觀察對象實際生存的時間。例如,在隨訪過程中某些觀察對象失訪;或死于其它原因;或在規定的研究過程結束時觀察對象的終止事件還未發生。生存時間數據的特點:所有觀察值取值非負存在截尾數據生存時間函數:

描述生存時間分布規律的函數,例如,生存函數、死亡函數、死亡密度函數、風險函數生存分析的主要任務:描述生存過程比較生存過程分析危險因素建立數學模型生存函數S(t):觀察對象的生存時間T大于某時刻t的概率稱為生存函數(survivalfunction)。S(t)滿足條件:S(0)=1,S(∞)=0,且0≤S(t)≤1。三、生存時間函數的估計死亡函數F(t):觀察對象的生存時間T不大于某時刻t的概率稱為死亡函數(failurefunction)。F(t)滿足條件:F(0)=0,F(∞)=1,且0≤F(t)≤1。死亡密度函數f(t):觀察對象在某時刻t的瞬時死亡率稱為死亡密度函數(failuredensityfunction)。風險函數h(t):生存到時刻t的觀察對象在時刻t的瞬時死亡率稱為風險函數(hazardfunction)。四、生存分析的基本方法描述法:根據樣本觀察值提供的信息,直接用公式計算出每一時間點或每一個時間區間上的生存函數、死亡函數、風險函數等,并采用列表或繪圖的形式來顯示生存時間的分布規律。優點:方法簡單且對數據的分布無要求。缺點:1)不能比較兩組或多組生存時間分布函數的區別;2)不能分析危險因素對生存時間的影響;3)不能建立生存時間與危險因素之間的關系模型。SurvivalFunctionEstimates1.0+**|**SDF|**N|L*N|L*NN0.5+LLNNN|LLNNNN|LLLNNN|L--LN-N--N||N-------------N---N0.0+LN----+----+----+----+----+----+----+----+----+----+----+----- 0102030405060708090100Time無淋巴結浸潤患者(N)比有淋巴結浸潤患者(L)的平均生存時間長。例如,兩組急性淋巴細胞性白血病患者治療后的隨訪資料:非參數法:估計生存函數時對生存時間的分布沒有要求,并且檢驗危險因素對生存時間的影響時采用的是非參數檢驗方法。優點:1)可以估計生存函數;2)可以比較兩組或多組生存布函數;3)可以分析危險因素對生存時間的影響;4)對生存時間的分布沒有要求。缺點:不能建立生存時間與危險因素之間依存關系的數學模型。參數法:根據樣本觀察值來估計假定的分布模型中的參數,獲得生存時間的概率分布模型。優點:1)可以估計生存函數;2)可以比較兩組或多組生存布函數;3)可以分析危險因素對生存時間的影響;4)可以建立生存時間與危險因素之間依存關系的模型。缺點:需要事先知道生存時間的分布。半參數法:不需要對生存時間的分布作出假定,但卻可以通過一個模型來分析生存時間的分布規律,以及危險因素對生存時間的影響。例如:Cox比例風險回歸模型。優點:1)可以估計生存函數;2)可以比較兩組或多組生存布函數;3)可以分析危險因素對生存時間的影響;4)可以建立生存時間與危險因素之間依存關系的模型。5)不需要事先知道生存時間的分布。重點學習內容五、Cox比例風險回歸模型

設x=(x1,x2,…,xk)是影響生存時間t的k個危險因素。設h(t,x)表示受危險因素x的影響下,在時刻t的風險率,又設h0(t)表示在不受危險因素x的影響下,在時刻t的風險率。顯然h0(t)=h(t,0),并稱h0(t)為基準風險率或基準函數。Cox比例風險回歸模型是:其中,β1,β2…,βk是待估未知參數,h0(t)是未知表達式。因為對于任意一時刻t,都有:

所以,個體在任何時刻的風險率都正比于基準風險率,比例因子為:可見,RH(x)不隨生存時間t的變化而變化。所以這個模型又稱為比例風險模型。而且,RH(x)表示個體在因素x影響下的風險率相對于基準風險率之比。參數的估計方法---最大似然法參數的顯著性檢驗方法:似然比檢驗法,Wald

檢驗法和比分檢驗法等。

H0:βj=0vsH1:βj≠03. 模型的顯著性檢驗:似然比卡方檢驗法

H0:β1=…=βk=0vsH1:βj≠0六、Cox比例風險模型參數的估計和檢驗六、Cox比例風險模型參數的解釋對于一元Cox模型,如果因素x的取值為1和0,分別表示暴露與非暴露于危險因素之下,那么eβ表示受x影響與不受x影響的相對風險。對于一元Cox模型,如果因素x為連續變量,eβ表示相鄰兩個水平的風險率之比(相對風險率)。對于多元Cox模型,eβj表示在其它因素不變的情況下,因素xj的相鄰兩個水平的風險率之比。例:為研究某種藥物是否會改進急性白血病人的預后,延長其緩解時間。將確診病人隨機給予不同的治療。一組為用藥組(傳統治療加某藥),另一組為對照組(傳統治療)。治療前檢測病人白細胞計數(wbc),經一定時間隨訪,白血病病人的緩解時間列在下表中,其中帶-號的是截尾數據。試作Cox模型回歸分析因素變量不能隨時間變化而變化;樣本死亡相對數不能過小;樣本含量要足夠大;因素各水平組的例數要適當;模型擬合要注意因素之間的交互作用;分類型因素變量要建立啞變量;生存曲線不能隨意延長,也不能輕易地用來作預報。七、應用Cox模型的注意事項

線性回歸 Logistic回歸 Cox回歸因變量:連續型變量y分類型變量y 生存時間t 服從正態分布無分布要求 無分布要求模型:y與x的 y取某個值的概率 t的風險函數 線性關系 p與x的關系 h與x的關系系數:b表示x增加一exp(b)=OR,近似表示exp(b)=RH,表示 個單位,y的在x=x*+1時的發病率在x=x*+1時的 改變量 與x=x*時的發病率之風險度與x=x* 比RR 時的風險度之比(在發病率較低時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論