生存分析的概念_第1頁
生存分析的概念_第2頁
生存分析的概念_第3頁
生存分析的概念_第4頁
生存分析的概念_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

生存分析的概念

一、生存分析的概念:

將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時間結(jié)合起來分析的統(tǒng)計(jì)分析方法。

研究生存現(xiàn)象和響應(yīng)時間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的一門學(xué)科。

對一個或多個非負(fù)隨機(jī)變量(生存時間)進(jìn)行統(tǒng)計(jì)分析研究。

對生存時間進(jìn)行分析和推斷,研究生存時間和結(jié)局與眾多影響因素間關(guān)系及其程度的統(tǒng)

計(jì)分析方法。

在綜合考慮相關(guān)因素(內(nèi)因和外因)的基礎(chǔ)上,對涉及生物學(xué)、醫(yī)學(xué)(臨床、流行

?。⒐こ蹋煽啃裕⒈kU精算學(xué)、公共衛(wèi)生學(xué)、社會學(xué)和人口學(xué)(老齡問題、犯罪、

婚姻)、經(jīng)濟(jì)學(xué)(市場學(xué))等領(lǐng)域中,與事件(死亡,疾病發(fā)生、發(fā)展和緩解,失效,狀

態(tài)持續(xù))發(fā)生的時間(也叫壽命、存活時間或失效時間,統(tǒng)稱生存時間)有關(guān)的問題提供

相關(guān)的統(tǒng)計(jì)規(guī)律的分析與推斷方法的學(xué)科。

二、”生存時間"(SurvivalTime)的概念

生存時間也叫壽命、存活時間、失效時間等等。

醫(yī)學(xué):疾病發(fā)生時間、治療后疾病復(fù)發(fā)時間

可靠性工程系:元件或系統(tǒng)失效時間

犯罪學(xué):重罪犯人的假釋時間

社會學(xué):首次婚姻持續(xù)時間

人口學(xué):母乳喂養(yǎng)新生兒斷奶時間

經(jīng)濟(jì)學(xué):經(jīng)濟(jì)危機(jī)爆發(fā)時間、發(fā)行債券的違約時間

保險精算學(xué):保險人的索賠時間、保險公司某一索賠中所付保費(fèi)

汽車工業(yè):汽車車輪轉(zhuǎn)數(shù)

市場學(xué)中:報(bào)紙和雜志的篇幅和訂閱費(fèi)

三、生存分析的應(yīng)用領(lǐng)域:社會學(xué),保險學(xué),醫(yī)學(xué),生物學(xué),人口學(xué),醫(yī)學(xué),經(jīng)濟(jì)學(xué),

可靠性工程學(xué)等

六、生存分析研究的目的

1、描述生存過程:估計(jì)不同時間的總體生存率,計(jì)算中位生存期,繪制生存函數(shù)曲

線。統(tǒng)計(jì)方法包括Kaplan-Meier(K-M)法、壽命表法。

2、比較:比較不同處理組的生存率,如比較不同療法治療腦瘤的生存率,以了解哪種

治療生存分析課程總結(jié)

方案較優(yōu)。統(tǒng)計(jì)方法log-rank檢驗(yàn)等。

3、影響因素分析:研究某個或某些因素對生存率或生存時間的影響作用。如為改善腦

瘤病人的預(yù)后,應(yīng)了解影響病人預(yù)后的主要因素,包括病人的年齡、性別、病程、腫瘤分

期、治療方案等。統(tǒng)計(jì)方法Cox比例風(fēng)險回歸模型等。

4、預(yù)測:建立Cox回歸預(yù)測模型。

主要研究內(nèi)容

描述生存過程:研究人群生存狀態(tài)的規(guī)律,研究生存率曲線的變動趨勢,是人壽保險業(yè)

的基礎(chǔ)。

生存過程影響因素分析及結(jié)局預(yù)測:識別與反應(yīng)、生存及疾病等相關(guān)風(fēng)險因素,預(yù)測生

存結(jié)局,在臨床中應(yīng)用的非常廣泛。

七、主要分析方法

1、參數(shù)法方法:首先要求觀察的生存時間t服從某一特定的分布,采用估計(jì)分布中參

數(shù)的方法獲得生存率的估計(jì)值。生存時間的分布可能為指數(shù)分布、Weibull分布、對數(shù)正

態(tài)分布等,這些分布曲線都有相應(yīng)的生存率函數(shù)形式。只需求得相應(yīng)參數(shù)的估計(jì)值,即可

獲得生存率的估計(jì)值和生存曲線。

2、非參數(shù)方法:實(shí)際工作中,多數(shù)生存時間的分布不符合上述所指的分布,就不宜用

參數(shù)法進(jìn)行分析,應(yīng)當(dāng)用非參數(shù)法。這類方法的檢驗(yàn)假設(shè)與以往所學(xué)的非參數(shù)法一樣,假

設(shè)兩組或多組的總體生存率曲線分布相同,而不論總體的分布形式和參數(shù)如何。非參數(shù)法

是隨訪資料的常用分析方法。

3、半?yún)?shù)方法:只規(guī)定了影響因素和生存狀況間的關(guān)系,但是沒有對時間(和風(fēng)險函

數(shù))的分布情況加以限定。這種方法主要用于分析生存率的影響因素,屬多因素分析方

法,其典型方法是Cox比例風(fēng)險模型。

4、幾種常用的統(tǒng)計(jì)軟件:SAS,SPSS,Stata,Excel,R

第二章數(shù)據(jù)類型

一、完全數(shù)據(jù)(Completedata)

每個個體確切的生產(chǎn)時間都是知道的。這樣的數(shù)據(jù)稱為完全數(shù)據(jù)(Completedata)。

但在實(shí)際的生存分析中,數(shù)據(jù)在很多情況下是很難完全觀察到的。

二、刪失(Censoring)

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213042生存分析課程總結(jié)

生存數(shù)據(jù)一個重要的特點(diǎn)是:在研究結(jié)束時,無法獲得某些個體確切的生存時間。例

如:失去聯(lián)系(病人搬走,電話號碼改變),無法觀察到結(jié)局(死于其他原因),研究截

止,個體仍然存活……在這些情況下獲得的數(shù)據(jù)就是刪失數(shù)據(jù)(Censoreddata)?對存

在刪失的個體,只知道刪失時間(Censoringtime)?

刪失分為右刪失(Rightcensoring)>左刪失(Leftcensoring)和區(qū)間刪失

(Intervalcensoring)

1、右刪失(Rightcensoring)?

在進(jìn)行觀察或調(diào)查時,一個個體的確切生存時間不知道,而只知道其生存時間大于時間

L,則稱該個體的生存時間在L上是右刪失的,并稱L為右刪失數(shù)據(jù)(Right-censored

data)?右刪失有三種類型(按結(jié)束時間差別):I型刪失(TypeIcensoring),H型

刪失(TypeIIcensoring)和III型刪失(Type111censoring)。

(1)1型刪失(TypeIcensoring):對所有個體的觀察停止在一個固定的時間,這種

刪失即為I型刪失(或定時刪失)。例如:動物研究通常是以有固定數(shù)目的動物接受一種

或多種處理開始,由于時間和費(fèi)用的限制,研究者常常不能等到所有動物死亡。一種選擇

就是在一個固定時間周期內(nèi)觀察,在截止時間之后仍可能有些動物活著,但不繼續(xù)觀察

了。這些動物的生存時間是不知道的,只知其不小于研究周期時間。I型刪失的刪失時間

是固定的。

圖表1I型刪失示例

(2)II型刪失(TypeIIcensoring):同時對n個個體進(jìn)行觀察,一直到有一固定數(shù)

目(r<n)的個體死亡(失效)為止,這種刪失即為II型刪失。H型刪失的刪失時間是

隨機(jī)的。

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213043生存分析課程總結(jié)

圖表2II型刪失示例

(3)III型刪失(TypeIIIcensoring):所有個體在不同時間進(jìn)入研究,某些個體在

研究結(jié)束之前死亡,他們的確切生存時間是知道的,其他個體在研究結(jié)束之前退出研究而

不被跟蹤觀察或在研究結(jié)束時仍然活著。進(jìn)入研究的時間可能不同,刪失時間也可能不

同,這種刪失叫做HI型刪失,又稱為隨機(jī)刪失(Randomcensoring)?

?起點(diǎn)事件

△終點(diǎn)事件

x失由

觀察起點(diǎn)觀察終點(diǎn)

圖表3nl型刪失示例

2、左刪失(Leftcensoring)

研究對象在時刻Cl開始接受觀察,而在此之前我們感興趣的時間已經(jīng)發(fā)生,這就是左

刪失。例如:“您初次吸食大麻是在什么時候?”有一種回答:“我吸食過,但我不記

得吸食的具體時間了。”這些回答的吸食時間數(shù)據(jù)就是左刪失。

通過測試確定兒童學(xué)會完成特定任務(wù)的年齡,有些兒童在進(jìn)入研究前就已經(jīng)可以完成某

項(xiàng)特定任務(wù),這些兒童的事件發(fā)生時間也是左刪失。

出現(xiàn)左刪失同時,也可能出現(xiàn)右刪失,稱為雙刪失(Doublecensoring)?例如:對吸食

大麻的

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦32009121304

4

生存分析課程總結(jié)

問卷還有一種回答:“我從來沒有吸食過”,這樣的數(shù)據(jù)就是右刪失。

3、區(qū)間刪失(Intervalcensoring):若個體的確切生存時間不知道,只知道其生存

時間在兩個觀察時間L和R之間(L<R),則稱該個體的生存時間在[L,R]上是區(qū)間刪失

的。實(shí)際工作中,凡是不能或者不愿作連續(xù)監(jiān)測時就會遇到這樣的區(qū)間刪失。

區(qū)間刪失分兩種:第一類區(qū)間刪失(CaseIIntervalcensoring)和第二類區(qū)間刪失

(CaseIIIntervalcensoring)。

當(dāng)對個體只進(jìn)行一次觀察,且個體的確切生存時間不知道,只知道其生存時間是否大于

觀察時間(即L0或R),這種刪失稱為第一類區(qū)間刪失,也稱為現(xiàn)實(shí)狀況數(shù)據(jù)

(Currentdata)(,當(dāng)對個體進(jìn)行次觀察,其觀察時間L和R滿足0LR時,這種

刪失稱為第二類區(qū)間刪失,也稱為一般區(qū)間刪失。

如果初始時間(如艾滋病感染時間)和發(fā)生時間均為區(qū)間刪失,則稱生存時間為雙重區(qū)

間刪失(Doubleintervalcensoring)。

三、截?cái)?Truncation)

在研究或者觀測中,淘汰了一些對象(樣本),使得研究者“意識不到他們的存在”。

對截?cái)鄶?shù)據(jù)的分析構(gòu)造似然采用條件分布。

截?cái)喟▋煞N:左截?cái)?Lefttruncation)和右截?cái)?Righttruncation),

1、左截?cái)?LeftTruncation):只有個體經(jīng)歷某種初始事件以后才能觀察到其生存時

間,稱為左截?cái)?Lefttruncation),此時獲得的數(shù)據(jù)稱為左截?cái)鄶?shù)據(jù)(Left-

truncateddata)

例如:暴露于某疾病、發(fā)生死亡前的中間事件等。退休中心老年居民死亡時間(沒到年

齡沒有進(jìn)入觀測)

左截?cái)嗯c左刪失的區(qū)別:在左截?cái)嗟难芯恐校緵]有考慮那些在進(jìn)入研究之前已經(jīng)經(jīng)

歷了感興趣時間的個體,而在左刪失的研究中,我們能獲得這些個體的部分信息。

即有左截?cái)嘤执嬖谟覄h失的情況,稱為左截?cái)嘤覄h失(Left-truncationandright-

censoring)

2、右截?cái)?RightTruncation)

只有經(jīng)歷了某種終止事件才能觀察到生存時間(將要經(jīng)歷該事件的個體不包含在實(shí)驗(yàn)樣

本中),稱為右截?cái)?Righttruncation),此時獲得的數(shù)據(jù)稱為右截?cái)鄶?shù)據(jù)(Right-

truncateddata)?例如:對艾滋病感染和發(fā)病時間觀測數(shù)據(jù),有些個體感染病毒但尚

未發(fā)病,這樣的個體不在樣本范圍之內(nèi)。

3、截?cái)嗟臄?shù)學(xué)表示

設(shè)Y是一個非負(fù)的表示生存時間的隨機(jī)變量;T是另外一個表示截?cái)鄷r間的隨機(jī)變量。

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213045生存分析課程總結(jié)

在左截?cái)嘞?,只有?dāng)YT時,才能觀察到T和Y;在左截?cái)嘞?,只有?dāng)YT時,才能

觀察到T和Y。

第三章基本函數(shù)和模型

一、生存函數(shù)(SurvivalFunction)

描述生存時間統(tǒng)計(jì)特征的基本函數(shù),也叫生存率(SurvivalRate):設(shè)T表示生存時

間,F(xiàn)(t)為T分布函數(shù),生存函數(shù)定義為:S(t)P(Tt)1F(t),0T

生存函數(shù)性質(zhì):非增函數(shù)。

滿足S(0)limS(x)lx0

S()limS(x)Ox

當(dāng)生存時間為連續(xù)型隨機(jī)變量時:

S(t)P(Tt)1F(t)f(u)du

t

f(t)S'(t)dS(t)

dt

生存函數(shù)S(t)的圖像叫做生存曲線(SurvivalCurve),如下圖:

陡峭的生存曲線表示較低的生產(chǎn)率或較短的生存時間;平緩的生存曲線表示較高的生存

率或較長的生存時間。

離散生存時間產(chǎn)生于舍入操作將失效(或死亡)時間分組從區(qū)間和壽命用整數(shù)計(jì)量等。

離散時間生存函數(shù)是非增的階梯函數(shù),當(dāng)T取值為ala2,且f(ai)P(Tai),

i1,2,,S(t)P(Tai)f(ai),i1,2,

aitait

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213046生存分析課程總結(jié)

離散時間生存函數(shù)是非增的階梯函數(shù)

二、危險率函數(shù)(HazardFunction):

危險率函數(shù):描述觀察個體在某時刻存活條件下,在以后的單位時間內(nèi)死亡的(條件)

概率:(t)limP(TthTt

hh0

當(dāng)T連續(xù)(t)f(t)dln[S(t)];S(t)dt

當(dāng)T離散,取值為ala2,f(ai)P(Tai),i1,2,,則ai處的危險率為

iPTaiaif(ai)S(ai1)S(ai)S(ai)1,i1,2,S(ail)S(ai1

)S(ai1)

S(ai)S(t)(1i)S(a)aitaiti1

危險率函數(shù)在工程上叫做失效率函數(shù)或損壞函數(shù),在生存分析和醫(yī)學(xué)統(tǒng)計(jì)中又稱為風(fēng)險

率函數(shù)

或瞬時死亡率(Simultaneousdeathrate)>或死亡強(qiáng)度(Deathintensity)或條件死

亡率(Conditionaldeathrate)或年齡死亡率(Agedeathrate)等。

常見風(fēng)險函數(shù)曲線

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦32009121304

7

生存分析課程總結(jié)

三、累積風(fēng)險函數(shù)(CumulativeHazardFunction)

累積危險率函數(shù):tudut

tStexptexpudu當(dāng)T連續(xù),0

tInSt

當(dāng)T離散時,危險率函數(shù)有兩種定義形式:

t

tiaiti

iaitin1i

如果i的值很小,兩種定義形式的值接近

四、平均剩余壽命函數(shù)(Expectedresiduallife)

平均剩余壽命函數(shù)定義為:

rtETttstfsdst

St

r0為平均壽命。

五、常用的參數(shù)模型

生存時間的分布一般不呈正態(tài)分布。常用的分布有:指數(shù)分布、威布爾(Weibull)分

布、伽瑪(Gamma)分布、對數(shù)羅吉斯蒂(logistic)分布、對數(shù)正態(tài)分布。

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦32009121304

遞增遞熠:自然老化、

\一.、.駝峨狀

磨損

遞減:較少見;死

1亡發(fā)生較早時

「一常值臉盆:最常見;人

/吊但口死亡率

?駝嵯:手術(shù)成功后

生存建模

、________________一遞咸

浴盆狀

8

生存分析課程總結(jié)

1、指數(shù)分布

生存函數(shù)形式為:stexpt,0,t0

密度函數(shù)為:ftexpt

危險率函數(shù)為:t

指數(shù)分布的一個重要性質(zhì):無記憶性(某事件的發(fā)生時間與歷史記錄無關(guān)),即

PTthtPTt

2、威布爾(Weibull)分布

生存函數(shù)形式為:stexpt,0,0

其中是尺度參數(shù),是形狀參數(shù),1時為指數(shù)分布。

危險率函數(shù)為:tt1

適用于危險率遞增(取1)、遞減(取1)和為常數(shù)(取1)等各種情形。

3、伽瑪(Gamma)分布

1t

ulexpu

生存函數(shù):stdu

0

,0,0

其中ulexpudu稱為伽瑪函數(shù)。

第四章生存數(shù)據(jù)基本特征的非參數(shù)估計(jì)

一、生存函數(shù)的估計(jì)

假設(shè)事件發(fā)生在D個嚴(yán)格區(qū)分的時間點(diǎn)上:tt2tD

在無刪失條件下:St生存時間t的個數(shù)

個體總數(shù)

二、右刪失生存函數(shù)的估計(jì):

StStiSti1St2

iStStlStO

iISti2StlStO

StiPTtiTtiPTtiITti1PT12t2PTtlTtl

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213049生存分析課程總結(jié)

存在右刪失下:PTtiTtiYidi,i1,2,,DYi

Yi:時刻ti面臨危險的個體數(shù);di:時亥ijti失效個體數(shù)

三、乘積限(product-limit)估計(jì)

乘積限估計(jì)又稱Kaplan-Meier估計(jì)

1,ttlS(ti)di(1)ttlYitit

階梯函數(shù),在觀察時間點(diǎn)上發(fā)生跳躍;

跳躍的高度ti與上發(fā)生的事件數(shù)和ti前刪失數(shù)有關(guān);超出觀測上限的時間沒有給出很

好的估計(jì)。

四、乘積限估計(jì)尾部修正

Efron(1967)建議最大觀察時間點(diǎn)以后的生存函數(shù)等于0,即等價于假定最大時間點(diǎn)上

的生存者馬上就會死亡。(負(fù)偏估計(jì))

tmax,即假設(shè)最大時間點(diǎn)上的生StSGill(1980)建議最大觀察時間點(diǎn)

以后的生存函數(shù)

存者永遠(yuǎn)不會死。(正偏估計(jì))

Brown>Hollander和Kowar(1974)建議尾部估計(jì)為一條指數(shù)曲線,即

StexptlnStmax/tmax

五、乘積限估計(jì)的方差

2diGreenwood估計(jì)式:tVarStSttitYiYidi2s

六、生存函數(shù)點(diǎn)估計(jì)的置信區(qū)間

利用漸進(jìn)正態(tài)性的線性置信區(qū)間:

StZ1St,Stz

21

2St

其他變換形式的非線性置信區(qū)間

對數(shù)變換反正弦平方根

七、累積死亡率的估計(jì)

無刪失條件下危險率函數(shù)的估計(jì):

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130410生存分析課程總結(jié)

t

在時間t開始的區(qū)間中死亡的個數(shù)在時間t存活著的個體數(shù)區(qū)間寬度

有刪失條件下累計(jì)死亡率估計(jì):

1.直接利用累積死亡率與生存函數(shù)的關(guān)系:tInSt

2.Nelson-Aalen估計(jì)為方差為:Ht2diYtiti

0,

"(t)Hdi

titYittittl

具有更好的小樣本性質(zhì)

Nelson-Aalen彳占計(jì)的應(yīng)用

1)用于選擇事件發(fā)生時間的參數(shù)模型

2)為危險率提供粗估計(jì)(對估計(jì)進(jìn)行核平滑后計(jì)算斜率)

八、累積死亡力函數(shù)的置信區(qū)間

-tZ線性置信區(qū)間:1

2,tZtHt,Hl2

其他變換形式的非線性置信區(qū)間

對數(shù)變換區(qū)間反正弦平方根變化區(qū)間

注:

1、乘積限估計(jì)和Nelson-Aalen估計(jì)都是建立在非信息刪失(non-informative

censoring)假設(shè)下

2、乘積限估計(jì)的尾部估計(jì):a)取0;b)取最大觀測點(diǎn)的值;c)構(gòu)造指數(shù)曲線

StexptlnStmax/tmax

3、無刪失時,乘積限估計(jì)即為經(jīng)驗(yàn)生存函數(shù)

九、生命時間均值的估計(jì)

平均生存時間:Stdt

0

AtdtS估計(jì)式為:

0

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130411生存分析課程總結(jié)

D"tdt,S方差為:var

i1YYddi

iii2

十、左截?cái)嘤覄h失數(shù)據(jù)生存函數(shù)的估計(jì)

只有生存到某時刻之后才能進(jìn)入觀察

乘積限估計(jì)(獨(dú)立截?cái)嘞率亲畲笏迫还烙?jì))

d、St1i(為條件估計(jì))Yitit

Yi:在時刻ti之前進(jìn)入?yún)^(qū)研究,且至少被研究到ti的個體數(shù);

di:在時刻ti時死亡的個體數(shù)。

Lai和Ying(1991)修正乘積限估計(jì):(當(dāng)風(fēng)險集較小時忽略此處的死亡)

d~St1iYicnI為指數(shù)函數(shù);n為樣本大?。籧0,01為常

數(shù)。Yitit

十、左刪失數(shù)據(jù)生存函數(shù)估計(jì)

利用“時間倒轉(zhuǎn)法”:

即不是從原點(diǎn)處測量時間,而是從很大的一個時間倒著從相反的方向測量,用時間

減去原始時間,得到右刪失數(shù)據(jù)結(jié)構(gòu),利用乘積限估計(jì)式估計(jì)

PXtPXt

純粹左刪失情況很少見。

十二、同時存在左、右刪失情況

設(shè)0tlt2tm為觀察時間點(diǎn),dj表示tj時的死亡數(shù),門表示tj時的右刪失

數(shù),cj表示tj時的左刪失數(shù),則生存函數(shù)的迭代估計(jì)步驟為:

步驟0:忽略左刪失獲得乘積限估計(jì)作為SOtj的初始估計(jì);

SKtj1SKtj

1SKtjji

步驟(K+l)1:使用S的當(dāng)前估計(jì)值通過估計(jì)pijPtj1XtjXti

'dcp步驟(K+l)2:使用上一步驟的結(jié)果,估計(jì)在tj時發(fā)生的事件數(shù)為diijjj

ijm

步驟(K+l)3:使用上一步修正后的右刪失數(shù)據(jù),仍然忽略左刪失計(jì)算乘積限估計(jì)。

如果

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130412生存分析課程總結(jié)

這一估計(jì)在所有tj處都有SK1t接近SKt,則停止迭代,否則繼續(xù)步驟1。

十三、右截?cái)鄶?shù)據(jù)生成函數(shù)的估計(jì)

傳染病的研究中比較常見。設(shè)Ti代表第i個個體被傳染的時間,Xi是從感染到發(fā)病的

時間。研究樣本包含從0到期間病人的觀測值Ti,Xi.(只有在時間之前發(fā)病的人

才進(jìn)入研究)。

利用顛倒時間軸法:令RiXi則變?yōu)镽i左截?cái)嗟?,便可?gòu)造

PRtR0PXtX的乘積限估計(jì)式。

十四、生命表中生存函數(shù)的估計(jì)

生命表(也稱壽命表,lifetable)方法是測定死亡率和描述群體生存現(xiàn)象的最古老的

技術(shù)之一。主要用于保險精算、人口學(xué)、醫(yī)學(xué)等方面。

一組(大規(guī)模)個體在整個考察時間上被連續(xù)觀察,它們的事件發(fā)生時間或刪失時間被

記入k1個相鄰但不重疊的區(qū)間內(nèi)ajl,ajj1,,k1

根據(jù)生命表方法應(yīng)用的范圍不同,可分為人口生命表和臨床生命表,分析方法相似。

生命表方法數(shù)據(jù)假設(shè)

(1)獨(dú)立刪失:假定刪失的事件時間(包括損失和退出)與它們?nèi)绻恢北挥^察到事

件發(fā)生所得到的死亡時間是獨(dú)立的。

(2)假定刪失時間和死亡時間是均勻分布在每個區(qū)間上的。

(3)假定死亡力在區(qū)間內(nèi)是常數(shù)。

生命表的構(gòu)造方法

1.第一列給出相鄰但不重疊的固定區(qū)間

liajl,ajj1,,k1,aO0,ak1事件發(fā)生時間和刪失時間將落入且

只落入其中的一個區(qū)間。

2.第二列給出進(jìn)入第j個區(qū)間的對象數(shù)Yj,這些個體還沒有經(jīng)歷觀察事件的發(fā)生。

3.第三列給出在第j個區(qū)間中失去蹤跡(死亡)或活著退出觀察(遷出)的個體數(shù)Wj

4.第四列給出在第j個區(qū)間中,面臨觀察事件風(fēng)險的暴露數(shù)Yj的一個估計(jì)值,假設(shè)刪

失時間在區(qū)間上是均勻分布的,則YjYiWj/2

09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130413''生存分析課程總結(jié)

5.第五列是在第j個區(qū)間中發(fā)生觀察事件(如死亡)的個體數(shù)dj

6.第六列給出在第j個區(qū)間起點(diǎn)處的生存函數(shù)的估計(jì)Saj1對于第一個區(qū)間

Sa01,且

aS,a1d/YS1dj/YjjjIjj

i1j

'a,基本思想:乘積限方法。生命表分析的主要任務(wù)就是估計(jì)Sj

,a,其中aaa/2它7.第七列給出估計(jì)的第j個區(qū)間中點(diǎn)處的概率密度函數(shù)

fmjmjjj1

表示在第j個區(qū)間上單位時間內(nèi)發(fā)生觀察事件的概率,即

aSaSa/aafmjjIjjj1

"a,由tft/St8.第八列給出在第j個區(qū)間中點(diǎn)處估計(jì)的危險率mj

Aa/S'a區(qū)a/S'af'afAaS'aS'a/22Fa

S'amjmjmjmjjj1jmjjIj

Aad/aaYd/2也可以定義為每個個體單位時間的時間發(fā)生率mjjjjIjj

注:最后一個區(qū)間在理論上是無限的,所以沒有任何危險或概率密度函數(shù)的估計(jì)。

9.第九列是第j個區(qū)間起點(diǎn)生存函數(shù)標(biāo)準(zhǔn)差的估計(jì)值,Greenwood(1976)將其定義為:

'aSj1d/YYd,j2,,k1iiii

i1J1

*a1的估計(jì)的標(biāo)準(zhǔn)差為0其中SO

其形式與乘積限估計(jì)式的標(biāo)準(zhǔn)差估計(jì)一樣。

10.第十列給出在第j個區(qū)間中點(diǎn)處概率密度函數(shù)標(biāo)注差的估計(jì)值,它近似等于

'j=dj/Yj,p,j1qAj.其中q

11.生命表的最后一列給出了第j個區(qū)間中點(diǎn)處危險率函數(shù)的標(biāo)準(zhǔn)差的估計(jì),它近似等

于"(a)(aa)/2]2}l[mjjj109

S(a..)q.叵

,廠;\Z0/(3)]+3

以6)『

陽■析】

2班呂嘉琦3200912130414生存分析課程總結(jié)

第五章相對風(fēng)險回歸模型

一、Cox相對風(fēng)險模型

設(shè)t;xhlimOPtTthTt,x/h0trt,xt0

rt,x成為相對風(fēng)險。0t為基準(zhǔn)風(fēng)險函數(shù)。x為協(xié)變量。

二、相對風(fēng)險回歸模型(Cox模型)取rt,xexpZt'即得Coxmodel

t;x0texpZt,其中:ZtZ1t,,Zpt'為協(xié)

變量x和t的函數(shù)0ttx0,,0'

1,,p為未知的回歸參數(shù)Relativeriskmodel(Coxmodel)

expZt'為參數(shù)部分,'

1,p為未知參數(shù)

0t為非參數(shù)部分,未知基準(zhǔn)函數(shù),因此,相對風(fēng)險模型為半?yún)?shù)模型。在Cox

模型下:生存時

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論