COX模型1解讀課件_第1頁
COX模型1解讀課件_第2頁
COX模型1解讀課件_第3頁
COX模型1解讀課件_第4頁
COX模型1解讀課件_第5頁
已閱讀5頁,還剩99頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

COX回歸模型COX回歸模型1第一節(jié)、隨訪資料的生存分析方法概述第一節(jié)、隨訪資料的生存分析方法概述2在疾病的預(yù)后研究中,一方面看結(jié)局好壞,如疾病痊愈或死亡;另一方面還要看出現(xiàn)這種結(jié)局所經(jīng)歷的時間長短。例如,某醫(yī)生比較新法與舊法對流行性出血熱的療效,結(jié)果如下:⑴分析方法一:組別治療人數(shù)治愈人數(shù)治愈率(%)新法治療12011696.7傳統(tǒng)療法12011495.0合計24023095.8經(jīng)卡方檢驗,X2=0.417,P>0.05,差異無顯著性。在疾病的預(yù)后研究中,一方面看結(jié)局好壞,如疾病痊愈或死亡;3⑵整理方法二:組別治療人數(shù)平均治愈天數(shù)標(biāo)準差新法治療1207.581.23傳統(tǒng)療法12016.355.31經(jīng)t'檢驗,P<0.05,差異有顯著性,新法治療較優(yōu)。⑵整理方法二:4由此可見,將結(jié)局和出現(xiàn)結(jié)局所經(jīng)歷的時間,結(jié)合起來分析,更能全面地反映治療的效果。這種將某事件的結(jié)局和出現(xiàn)這一結(jié)局所經(jīng)歷的時間,結(jié)合起來分析的統(tǒng)計分析方法,統(tǒng)稱為生存分析(因為源于對壽命資料的統(tǒng)計分析)由此可見,將結(jié)局和出現(xiàn)結(jié)局所經(jīng)歷的時間,結(jié)合起來分析,5一、生存分析方法的內(nèi)涵生存分析是用“生存時間”的長短評價慢性病的療效。

狹義生存分析-“生存時間”是指從某個標(biāo)準時點起至死亡止,即患者的存活時間—狹義的“生存時間”。

廣義生存分析-如果把“死亡”定義為某研究目的的“結(jié)果”的發(fā)生,如疾病的痊愈,或腫瘤的復(fù)發(fā),或?qū)m內(nèi)節(jié)育器的失落等,則“生存時間”為某事件開始到出現(xiàn)該事件結(jié)局所經(jīng)歷的時間。如:治療結(jié)束到復(fù)發(fā)所經(jīng)歷的時間,或放節(jié)育器到節(jié)育器失落所經(jīng)歷的時間,或發(fā)電機開始使用到到損毀的時間。—-廣義的“生存時間”。一、生存分析方法的內(nèi)涵生存分析是用“生存時間”的長短評6這樣一來,生存分析應(yīng)用范圍得到了擴大。在臨床上能作生存分析的情形還有很多,例如:1、某病從治療到緩解;2、輸卵管接通到再次懷孕;3、輸尿管、腎結(jié)石體外碎石到復(fù)發(fā)。為減少術(shù)語,這里以狹義的生存分析為例這樣一來,生存分析應(yīng)用范圍得到了擴大。在臨床上能作生存7二、生存分析隨訪資料的結(jié)構(gòu)1、結(jié)局:死亡、未死亡;治愈、未治愈;復(fù)發(fā)、未復(fù)發(fā);失落、未失落等2、“生存時間”:出現(xiàn)這一結(jié)局所經(jīng)歷的時間長短。不論是狹義的或廣義的“生存時間”,均有三個要素:起點、終點和時間尺度(天、周、月、年)3、預(yù)后因素:影響生存時間長短有關(guān)因素。例如:治療措施、病情輕重等因素等。二、生存分析隨訪資料的結(jié)構(gòu)8COX模型1解讀課件9生存時間類型:完全數(shù)據(jù):指從起點到死亡所經(jīng)歷的時間,即死者的存活時間。如患者2、患者5和患者6。完全數(shù)據(jù)提供完全信息。

截尾數(shù)據(jù):(1)研究結(jié)束尚未出現(xiàn)所研究的結(jié)局;(2)失訪;(3)死于其他原因。如:患者1、患者3和患者4。截尾數(shù)據(jù)提供部分信息。生存時間類型:10截尾數(shù)據(jù)產(chǎn)生原因(1)失訪(2)死于其他原因(3)到規(guī)定的截止時點尚活著。截尾數(shù)據(jù)產(chǎn)生原因(1)失訪11隨訪研究:隊列研究隨訪研究:隊列研究12隨訪研究:臨床隨訪研究隨訪研究:臨床隨訪研究13

風(fēng)險函數(shù)(hazarfunction)又稱為危險率函數(shù),條件死亡率、瞬間死亡率等,表示個體在生存過程中,每單位時間死亡的危險度。一般用h(t)表示。風(fēng)險函數(shù)(hazarfunction)又稱為危險率函數(shù)14風(fēng)險函數(shù)隨時間變化的類型h1:穩(wěn)定風(fēng)險率,與時間無關(guān);h2:隨時間而減少的風(fēng)險率;h3:隨時間而增加的風(fēng)險率;h4:U型風(fēng)險函數(shù);h5:山峰型風(fēng)險函數(shù)。生存分析一個重要內(nèi)容就是估計風(fēng)險函數(shù),研究風(fēng)險函數(shù)與危險因素之間的關(guān)系。風(fēng)險函數(shù)隨時間變化的類型h1:穩(wěn)定風(fēng)險率,與時間無關(guān);生存分15風(fēng)險比(harzardratio)指同一時點兩組的風(fēng)險函數(shù)之比,即為相對危險度(RR)。風(fēng)險比(harzardratio)指同一時點兩組的風(fēng)險函數(shù)16生存資料分析方法生存分析非參數(shù)法乘積極限(K-M法)、壽命表法;主要用于估計生存率和作單因素預(yù)后分析參數(shù)法指數(shù)模型、Weibull模型等,一般用作多因素預(yù)后分析,也可計算生存率。半?yún)?shù)法COX模型,用作多因素預(yù)后分析,也可估計生存率生存資料分析方法生存分析非參數(shù)法乘積極限(K-M法)、壽命表17第二節(jié)COX比例風(fēng)險模型第二節(jié)COX比例風(fēng)險模型18生存時間的長短,不僅與治療有關(guān),還受病人的年齡、性別、病情、心理、環(huán)境、社會等因素的影響,如果要確切地顯示治療措施的效果,所有的病人除了治療措施不同以外,其他影響因素必須相同(或相近),但這在實際上是不可能做到的。生存時間的長短,不僅與治療有關(guān),還受病人的年齡、性別19

因此,我們最好能采用多因素分析方法,即分析包括治療措施在內(nèi)的可能因素對生存時間長短的影響(大小和方向)。但生存時間的分布往往不服從正態(tài)分布(大多為正偏態(tài)分布),有時不知道它的分布類型,又存在截尾數(shù)據(jù)(Censoreddata)這樣,就不能用多元線性回歸方法來分析。而傳統(tǒng)的方法只能進行單因素分析,又不能利用截尾數(shù)據(jù)(Censoreddata)。因此,我們最好能采用多因素分析方法,即分析包括治療措201972年,英國統(tǒng)計學(xué)家D.R.COX提出了一種比例風(fēng)險模型(Coxproportionalhazardmodel),簡稱COX模型。它可以分析多種因素對生存時間的影響,而且允許有“截尾”存在。是生存分析中最重要的模型之一。

COX模型主要用于腫瘤和其它慢性病的預(yù)后因素分析,也可以用于一般的臨床療效評價和隊列的病因探索。1972年,英國統(tǒng)計學(xué)家D.R.COX提出了一211、COX模型的基本結(jié)構(gòu)

COX模型不直接考察生存時間與各自變量的關(guān)系,而是用風(fēng)險率作為因變量。COX模型的基本結(jié)構(gòu)為:

1、COX模型的基本結(jié)構(gòu)COX模型不直接考察生存22h(t,X):t時點上m個危險因素起作用時的風(fēng)險率,即在時間t上的死亡率;h0(t):某時間t上當(dāng)m個危險因素為0時的基準風(fēng)險率;X=(X1,X2,…,Xm):與生存時間可能有關(guān)的自變量;β=(β1,β2,…,βm):COX模型的回歸系數(shù)。

h(t,X):t時點上m個危險因素起作用時的風(fēng)險率,即在時間23βj與h(t,X)之間有如下關(guān)系:(1)βj>0,則Xj取值越大,h(t,X)的值越大,表示病人死亡的風(fēng)險率越大;(2)βj=0,則Xj取值對h(t,X)無影響;(3)βj<0,則Xj取值越大,h(t,X)的值越小,表示病人死亡的風(fēng)險率越小。

βj與h(t,X)之間有如下關(guān)系:24h(t)和h0(t)成比例,比例系數(shù)是:故COX模型又稱比例風(fēng)險模型將上式兩邊取自然對數(shù),得:

此式與多元線性回歸模型非常類似,故有人稱COX模型為COX回歸。

由此式可見βj的含義是:在其他自變量不變前提下,自變量Xj改變一個單位,引起的死亡風(fēng)險改變的自然對數(shù)值。h(t)和h0(t)成比例,比例系數(shù)是:故COX模型又稱比例25相對危險度(RR)=expj(Xj2-Xj1)如Xj為0-1數(shù)據(jù),則:

RR=expjRR含義:在其他自變量保持不變前提下,自變量Xj改變一個單位,死亡風(fēng)險比原水平改變exp(j)倍。RR是一個與時間無關(guān)的變量。上式可改寫為相對危險度(RR)=expj(Xj2-Xj1)上式可改寫為26h0(t)是隨時間變化的函數(shù)(其分布類型無任何限定);而h(t)一方面因變量X的不同而不同,另一方面隨時間t而變化。即COX回歸既反映風(fēng)險死亡率在病人與病人之間的差異,又反映風(fēng)險死亡率隨時間變化的情況。因此,此模型是合理的。h0(t)是隨時間變化的函數(shù)(其分布類型無任何限定);而h(27

h0(t)分布類型未作任何限定;但h(t)隨變量X的變化假定為指數(shù)函數(shù)exp(bX)。故COX模型為半?yún)?shù)模型。而且h0(t)分布類型未作任何限定,因而應(yīng)用COX模型不必考慮資料的屬于那一種具體的分布。故適用范圍廣泛,類似于非參數(shù)方法,但其檢驗效率高于非參數(shù)模型,接近于參數(shù)模型。h0(t)分布類型未作任何限定;但h(t)隨變282、Cox回歸模型的主要用途

(1)建立以多個危險因素估計生存或死亡的

風(fēng)險模型,并由模型估計對多個危險因素導(dǎo)致死亡的相對危險度(RR)(2)用已建立的模型,估計患病后隨時間變化的生存率(3)用已建立的模型,估計患病后的危險指數(shù)(或預(yù)后指數(shù)PI)。

2、Cox回歸模型的主要用途(1)建立以多個危險因素估計293、Cox回歸模型的應(yīng)用條件(1)已知觀察對象的生存時間;(2)已知觀察對象在事先確定的觀察時間內(nèi),其是否發(fā)生某事件的結(jié)果;(3)自變量可以是計量資料、計數(shù)資料或等級資料。

(4)等比例風(fēng)險(PH)。指在協(xié)變量的不同狀態(tài),病人的風(fēng)險在不同的時間保持不變。如在研究的10年中,糖尿病人心臟病發(fā)作的可能性是非糖尿病人的3倍,無論在第1年,第2年…….等都如此。3、Cox回歸模型的應(yīng)用條件30等比例風(fēng)險的驗證:(1)、按協(xié)變量分組的Kaplan-Meier生存曲線,如生存曲線明顯交叉,則不滿足PH假定。

等比例風(fēng)險的驗證:31COX模型1解讀課件32(2)、將協(xié)變量與時間作為交互項引入模型,如果交互項沒有統(tǒng)計學(xué)意義,則等比例風(fēng)險成立,若有統(tǒng)計學(xué)意義,則不成立。與時間有關(guān)的風(fēng)險稱為非比例風(fēng)險,采用非比例風(fēng)險模型分析。(2)、將協(xié)變量與時間作為交互項引入模型,如果交互項沒有統(tǒng)計334、COX回歸模型的構(gòu)建方法構(gòu)造偏似然函數(shù),然后用最大似然法求出各參數(shù)的估計值bj。須借助計算機完成。4、COX回歸模型的構(gòu)建方法構(gòu)造偏似然函數(shù),然后用最大似然345、COX回歸分析的假設(shè)檢驗(1)

COX回歸方程的檢驗H0:β1=β2=…..=βp=0

H1:

各βj(j=1,2,…,p)不全為0檢驗方法:最大似然比檢驗(maximumLike-lihoodRatio)-常用

Wald檢驗得分檢驗(Score)5、COX回歸分析的假設(shè)檢驗(1)COX回歸方程的檢驗35(2)

COX回歸系數(shù)的檢驗H0:βj=0

H1:βj(j=1,2,…,p)0檢驗方法:Wald檢驗檢驗統(tǒng)計量為:X2=

bj為βj的估計值,Sbj為bj的標(biāo)準誤。X2服從自由度=1的X2分布(2)COX回歸系數(shù)的檢驗H0:βj=0

H1:βj(j366、

COX回歸分析的一般步驟(1)收集資料首先確定觀察指標(biāo)并將其數(shù)量化,表1(數(shù)量化表),然后收集資料,表2(隨訪表)。收集到資料后,建立數(shù)據(jù)文件。(用SPSS或Excel)

例:研究影響膀胱腫瘤患者生存的因素。6、COX回歸分析的一般步驟(1)收集資料例:研究影響膀37COX模型1解讀課件38COX模型1解讀課件39COX模型1解讀課件40(2)因子初步篩選

A.剔除缺失數(shù)據(jù)較多的因子。

B.剔除變異幾乎為零的因子。

C.對所有的因子逐個作單因素COX模型分析,選擇有統(tǒng)計意義的變量作多因素

COX模型分析。此時的α值可以取稍大些,如α=0.1

。(2)因子初步篩選

A.剔除缺失數(shù)據(jù)較多的因子。

41(3)擬合多因素模型

A.規(guī)定檢驗水準α,初步的探索性研究,可取α=0.10或α=0.15;嚴謹?shù)摹⒆C實性研究,取α=0.05或α=0.01。

B.篩選因子方法:前進法、后退法、逐步法。(3)擬合多因素模型

A.規(guī)定檢驗水準α,初步的探索427、結(jié)果解析與評價⑴模型在一定的檢驗水準α下,入選哪些因素?

⑵入選因素哪些是保護因素,哪些是危險因素?

⑶入選因素哪個對因變量影響(貢獻)最大?7、結(jié)果解析與評價⑴模型在一定的檢驗水準α下,入選哪些因素43

30例膀胱癌患者Cox回歸分析結(jié)果

采用前進逐步法,在α=0.05水準上,在所分析的4個因素中,入選模型有3個因素:腫瘤分級、腫瘤大小和是否復(fù)發(fā)為膀胱腫瘤患者獨立的影響因素。三者回歸系數(shù)均為正,為膀胱腫瘤患者死亡的危險因素。30例膀胱癌患者Cox回歸分析結(jié)果采用前進逐步法,在α44

grade的RR=5.367,即腫瘤分級每增加一個等級,死亡風(fēng)險增加4.367倍;Size的RR=2.393,腫瘤大于等于3.0cm者,死亡風(fēng)險是小于3者的2.939倍;Relapse的RR=2.662,即復(fù)發(fā)者死亡風(fēng)險是不復(fù)發(fā)者的2.662倍。

30例膀胱癌患者Cox回歸分析結(jié)果

grade的RR=5.367,即腫瘤分級每增加45

30例膀胱癌患者Cox回歸分析結(jié)果

grade、size、relapse的標(biāo)準差分別為:0.845、0.507、0.509,其標(biāo)準回歸系數(shù)分別是:1.42、0.55、0.50。從標(biāo)準回歸系數(shù)來看,grade對生存(或死亡)的影響最大,其次是size,最后是replapse。30例膀胱癌患者Cox回歸分析結(jié)果grade、si46標(biāo)準回歸系數(shù)的計算方法A.對原始變量的觀察值作標(biāo)準正態(tài)化變換后,在擬合回歸方程得到的回歸系數(shù),即為標(biāo)準化回歸系數(shù)。

B.直接用以下公式計算:式中,S為X的標(biāo)準差,SE(b)為b的標(biāo)準誤。標(biāo)準回歸系數(shù)的計算方法47COX回歸分析結(jié)果評價小結(jié)1、采用前進逐步法,在α=0.05水準上,從所分析的4個因素中,篩選出3個與膀胱腫瘤患者生存有關(guān)的因素:grade、size、relapse。2、grade、size、relapse都是危險因素。3、grade對膀胱腫瘤患者生存的影響最大,relapse的影響最小。COX回歸分析結(jié)果評價小結(jié)48

例原發(fā)性肝癌(PLC)危險因素分析。擬研究乙型肝炎病毒與肝癌的關(guān)系,進行了前瞻性隊列研究。

3007名HBsAg陽性者作為暴露組,另外3007名HBsAg陰性者作為非暴露組,隨訪4年,觀察PLC發(fā)生的情況。兩個隊列人群的性別構(gòu)成和年齡一致。結(jié)果暴露組有79人發(fā)生PLC,非暴露組有5人。例原發(fā)性肝癌(PLC)危險因素分析。49COX模型1解讀課件50COX模型1解讀課件51結(jié)果顯示,肝癌的發(fā)生與:肝癌家族史(X5:1有,0無)、主食(X6:1-大米,2-玉米)、HBV-DNA(1-陽性,0-陰性)、年齡、性別(1-男,2-女)有關(guān)。有肝癌家族史、以玉米主食、HBV-DNA陽性、年齡越大、男性,能增加肝癌的風(fēng)險性。結(jié)果顯示,肝癌的發(fā)生與:肝癌家族史(X5:1有,0無)、主食52COX回歸模型COX回歸模型53第一節(jié)、隨訪資料的生存分析方法概述第一節(jié)、隨訪資料的生存分析方法概述54在疾病的預(yù)后研究中,一方面看結(jié)局好壞,如疾病痊愈或死亡;另一方面還要看出現(xiàn)這種結(jié)局所經(jīng)歷的時間長短。例如,某醫(yī)生比較新法與舊法對流行性出血熱的療效,結(jié)果如下:⑴分析方法一:組別治療人數(shù)治愈人數(shù)治愈率(%)新法治療12011696.7傳統(tǒng)療法12011495.0合計24023095.8經(jīng)卡方檢驗,X2=0.417,P>0.05,差異無顯著性。在疾病的預(yù)后研究中,一方面看結(jié)局好壞,如疾病痊愈或死亡;55⑵整理方法二:組別治療人數(shù)平均治愈天數(shù)標(biāo)準差新法治療1207.581.23傳統(tǒng)療法12016.355.31經(jīng)t'檢驗,P<0.05,差異有顯著性,新法治療較優(yōu)。⑵整理方法二:56由此可見,將結(jié)局和出現(xiàn)結(jié)局所經(jīng)歷的時間,結(jié)合起來分析,更能全面地反映治療的效果。這種將某事件的結(jié)局和出現(xiàn)這一結(jié)局所經(jīng)歷的時間,結(jié)合起來分析的統(tǒng)計分析方法,統(tǒng)稱為生存分析(因為源于對壽命資料的統(tǒng)計分析)由此可見,將結(jié)局和出現(xiàn)結(jié)局所經(jīng)歷的時間,結(jié)合起來分析,57一、生存分析方法的內(nèi)涵生存分析是用“生存時間”的長短評價慢性病的療效。

狹義生存分析-“生存時間”是指從某個標(biāo)準時點起至死亡止,即患者的存活時間—狹義的“生存時間”。

廣義生存分析-如果把“死亡”定義為某研究目的的“結(jié)果”的發(fā)生,如疾病的痊愈,或腫瘤的復(fù)發(fā),或?qū)m內(nèi)節(jié)育器的失落等,則“生存時間”為某事件開始到出現(xiàn)該事件結(jié)局所經(jīng)歷的時間。如:治療結(jié)束到復(fù)發(fā)所經(jīng)歷的時間,或放節(jié)育器到節(jié)育器失落所經(jīng)歷的時間,或發(fā)電機開始使用到到損毀的時間。—-廣義的“生存時間”。一、生存分析方法的內(nèi)涵生存分析是用“生存時間”的長短評58這樣一來,生存分析應(yīng)用范圍得到了擴大。在臨床上能作生存分析的情形還有很多,例如:1、某病從治療到緩解;2、輸卵管接通到再次懷孕;3、輸尿管、腎結(jié)石體外碎石到復(fù)發(fā)。為減少術(shù)語,這里以狹義的生存分析為例這樣一來,生存分析應(yīng)用范圍得到了擴大。在臨床上能作生存59二、生存分析隨訪資料的結(jié)構(gòu)1、結(jié)局:死亡、未死亡;治愈、未治愈;復(fù)發(fā)、未復(fù)發(fā);失落、未失落等2、“生存時間”:出現(xiàn)這一結(jié)局所經(jīng)歷的時間長短。不論是狹義的或廣義的“生存時間”,均有三個要素:起點、終點和時間尺度(天、周、月、年)3、預(yù)后因素:影響生存時間長短有關(guān)因素。例如:治療措施、病情輕重等因素等。二、生存分析隨訪資料的結(jié)構(gòu)60COX模型1解讀課件61生存時間類型:完全數(shù)據(jù):指從起點到死亡所經(jīng)歷的時間,即死者的存活時間。如患者2、患者5和患者6。完全數(shù)據(jù)提供完全信息。

截尾數(shù)據(jù):(1)研究結(jié)束尚未出現(xiàn)所研究的結(jié)局;(2)失訪;(3)死于其他原因。如:患者1、患者3和患者4。截尾數(shù)據(jù)提供部分信息。生存時間類型:62截尾數(shù)據(jù)產(chǎn)生原因(1)失訪(2)死于其他原因(3)到規(guī)定的截止時點尚活著。截尾數(shù)據(jù)產(chǎn)生原因(1)失訪63隨訪研究:隊列研究隨訪研究:隊列研究64隨訪研究:臨床隨訪研究隨訪研究:臨床隨訪研究65

風(fēng)險函數(shù)(hazarfunction)又稱為危險率函數(shù),條件死亡率、瞬間死亡率等,表示個體在生存過程中,每單位時間死亡的危險度。一般用h(t)表示。風(fēng)險函數(shù)(hazarfunction)又稱為危險率函數(shù)66風(fēng)險函數(shù)隨時間變化的類型h1:穩(wěn)定風(fēng)險率,與時間無關(guān);h2:隨時間而減少的風(fēng)險率;h3:隨時間而增加的風(fēng)險率;h4:U型風(fēng)險函數(shù);h5:山峰型風(fēng)險函數(shù)。生存分析一個重要內(nèi)容就是估計風(fēng)險函數(shù),研究風(fēng)險函數(shù)與危險因素之間的關(guān)系。風(fēng)險函數(shù)隨時間變化的類型h1:穩(wěn)定風(fēng)險率,與時間無關(guān);生存分67風(fēng)險比(harzardratio)指同一時點兩組的風(fēng)險函數(shù)之比,即為相對危險度(RR)。風(fēng)險比(harzardratio)指同一時點兩組的風(fēng)險函數(shù)68生存資料分析方法生存分析非參數(shù)法乘積極限(K-M法)、壽命表法;主要用于估計生存率和作單因素預(yù)后分析參數(shù)法指數(shù)模型、Weibull模型等,一般用作多因素預(yù)后分析,也可計算生存率。半?yún)?shù)法COX模型,用作多因素預(yù)后分析,也可估計生存率生存資料分析方法生存分析非參數(shù)法乘積極限(K-M法)、壽命表69第二節(jié)COX比例風(fēng)險模型第二節(jié)COX比例風(fēng)險模型70生存時間的長短,不僅與治療有關(guān),還受病人的年齡、性別、病情、心理、環(huán)境、社會等因素的影響,如果要確切地顯示治療措施的效果,所有的病人除了治療措施不同以外,其他影響因素必須相同(或相近),但這在實際上是不可能做到的。生存時間的長短,不僅與治療有關(guān),還受病人的年齡、性別71

因此,我們最好能采用多因素分析方法,即分析包括治療措施在內(nèi)的可能因素對生存時間長短的影響(大小和方向)。但生存時間的分布往往不服從正態(tài)分布(大多為正偏態(tài)分布),有時不知道它的分布類型,又存在截尾數(shù)據(jù)(Censoreddata)這樣,就不能用多元線性回歸方法來分析。而傳統(tǒng)的方法只能進行單因素分析,又不能利用截尾數(shù)據(jù)(Censoreddata)。因此,我們最好能采用多因素分析方法,即分析包括治療措721972年,英國統(tǒng)計學(xué)家D.R.COX提出了一種比例風(fēng)險模型(Coxproportionalhazardmodel),簡稱COX模型。它可以分析多種因素對生存時間的影響,而且允許有“截尾”存在。是生存分析中最重要的模型之一。

COX模型主要用于腫瘤和其它慢性病的預(yù)后因素分析,也可以用于一般的臨床療效評價和隊列的病因探索。1972年,英國統(tǒng)計學(xué)家D.R.COX提出了一731、COX模型的基本結(jié)構(gòu)

COX模型不直接考察生存時間與各自變量的關(guān)系,而是用風(fēng)險率作為因變量。COX模型的基本結(jié)構(gòu)為:

1、COX模型的基本結(jié)構(gòu)COX模型不直接考察生存74h(t,X):t時點上m個危險因素起作用時的風(fēng)險率,即在時間t上的死亡率;h0(t):某時間t上當(dāng)m個危險因素為0時的基準風(fēng)險率;X=(X1,X2,…,Xm):與生存時間可能有關(guān)的自變量;β=(β1,β2,…,βm):COX模型的回歸系數(shù)。

h(t,X):t時點上m個危險因素起作用時的風(fēng)險率,即在時間75βj與h(t,X)之間有如下關(guān)系:(1)βj>0,則Xj取值越大,h(t,X)的值越大,表示病人死亡的風(fēng)險率越大;(2)βj=0,則Xj取值對h(t,X)無影響;(3)βj<0,則Xj取值越大,h(t,X)的值越小,表示病人死亡的風(fēng)險率越小。

βj與h(t,X)之間有如下關(guān)系:76h(t)和h0(t)成比例,比例系數(shù)是:故COX模型又稱比例風(fēng)險模型將上式兩邊取自然對數(shù),得:

此式與多元線性回歸模型非常類似,故有人稱COX模型為COX回歸。

由此式可見βj的含義是:在其他自變量不變前提下,自變量Xj改變一個單位,引起的死亡風(fēng)險改變的自然對數(shù)值。h(t)和h0(t)成比例,比例系數(shù)是:故COX模型又稱比例77相對危險度(RR)=expj(Xj2-Xj1)如Xj為0-1數(shù)據(jù),則:

RR=expjRR含義:在其他自變量保持不變前提下,自變量Xj改變一個單位,死亡風(fēng)險比原水平改變exp(j)倍。RR是一個與時間無關(guān)的變量。上式可改寫為相對危險度(RR)=expj(Xj2-Xj1)上式可改寫為78h0(t)是隨時間變化的函數(shù)(其分布類型無任何限定);而h(t)一方面因變量X的不同而不同,另一方面隨時間t而變化。即COX回歸既反映風(fēng)險死亡率在病人與病人之間的差異,又反映風(fēng)險死亡率隨時間變化的情況。因此,此模型是合理的。h0(t)是隨時間變化的函數(shù)(其分布類型無任何限定);而h(79

h0(t)分布類型未作任何限定;但h(t)隨變量X的變化假定為指數(shù)函數(shù)exp(bX)。故COX模型為半?yún)?shù)模型。而且h0(t)分布類型未作任何限定,因而應(yīng)用COX模型不必考慮資料的屬于那一種具體的分布。故適用范圍廣泛,類似于非參數(shù)方法,但其檢驗效率高于非參數(shù)模型,接近于參數(shù)模型。h0(t)分布類型未作任何限定;但h(t)隨變802、Cox回歸模型的主要用途

(1)建立以多個危險因素估計生存或死亡的

風(fēng)險模型,并由模型估計對多個危險因素導(dǎo)致死亡的相對危險度(RR)(2)用已建立的模型,估計患病后隨時間變化的生存率(3)用已建立的模型,估計患病后的危險指數(shù)(或預(yù)后指數(shù)PI)。

2、Cox回歸模型的主要用途(1)建立以多個危險因素估計813、Cox回歸模型的應(yīng)用條件(1)已知觀察對象的生存時間;(2)已知觀察對象在事先確定的觀察時間內(nèi),其是否發(fā)生某事件的結(jié)果;(3)自變量可以是計量資料、計數(shù)資料或等級資料。

(4)等比例風(fēng)險(PH)。指在協(xié)變量的不同狀態(tài),病人的風(fēng)險在不同的時間保持不變。如在研究的10年中,糖尿病人心臟病發(fā)作的可能性是非糖尿病人的3倍,無論在第1年,第2年…….等都如此。3、Cox回歸模型的應(yīng)用條件82等比例風(fēng)險的驗證:(1)、按協(xié)變量分組的Kaplan-Meier生存曲線,如生存曲線明顯交叉,則不滿足PH假定。

等比例風(fēng)險的驗證:83COX模型1解讀課件84(2)、將協(xié)變量與時間作為交互項引入模型,如果交互項沒有統(tǒng)計學(xué)意義,則等比例風(fēng)險成立,若有統(tǒng)計學(xué)意義,則不成立。與時間有關(guān)的風(fēng)險稱為非比例風(fēng)險,采用非比例風(fēng)險模型分析。(2)、將協(xié)變量與時間作為交互項引入模型,如果交互項沒有統(tǒng)計854、COX回歸模型的構(gòu)建方法構(gòu)造偏似然函數(shù),然后用最大似然法求出各參數(shù)的估計值bj。須借助計算機完成。4、COX回歸模型的構(gòu)建方法構(gòu)造偏似然函數(shù),然后用最大似然865、COX回歸分析的假設(shè)檢驗(1)

COX回歸方程的檢驗H0:β1=β2=…..=βp=0

H1:

各βj(j=1,2,…,p)不全為0檢驗方法:最大似然比檢驗(maximumLike-lihoodRatio)-常用

Wald檢驗得分檢驗(Score)5、COX回歸分析的假設(shè)檢驗(1)COX回歸方程的檢驗87(2)

COX回歸系數(shù)的檢驗H0:βj=0

H1:βj(j=1,2,…,p)0檢驗方法:Wald檢驗檢驗統(tǒng)計量為:X2=

bj為βj的估計值,Sbj為bj的標(biāo)準誤。X2服從自由度=1的X2分布(2)COX回歸系數(shù)的檢驗H0:βj=0

H1:βj(j886、

COX回歸分析的一般步驟(1)收集資料首先確定觀察指標(biāo)并將其數(shù)量化,表1(數(shù)量化表),然后收集資料,表2(隨訪表)。收集到資料后,建立數(shù)據(jù)文件。(用SPSS或Excel)

例:研究影響膀胱腫瘤患者生存的因素。6、COX回歸分析的一般步驟(1)收集資料例:研究影響膀89COX模型1解讀課件90COX模型1解讀課件91COX模型1解讀課件92(2)因子初步篩選

A.剔除缺失數(shù)據(jù)較多的因子。

B.剔除變異幾乎為零的因子。

C.對所有的因子逐個作單因素COX模型分析,選擇有統(tǒng)計意義的變量作多因素

COX模型分析。此時的α值可以取稍大些,如α=0.1

。(2)因子初步篩選

A.剔除缺失數(shù)據(jù)較多的因子。

93(3)擬合多因素模型

A.規(guī)定檢驗水準α,初步的探索性研究,可取α=0.10或α=0.15;嚴謹?shù)摹⒆C實性研究,取α=0.05或α=0.01。

B.篩選因子方法:前進法、后退法、逐步法。(3)擬合多因素模型

A.規(guī)定檢驗水準α,初步的探索947、結(jié)果解析與評價⑴模型在一定的檢驗水準α下,入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論