




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生存分析的概念
一、生存分析的概念:
將事件的結(jié)果和出現(xiàn)此結(jié)果所經(jīng)歷的時間結(jié)合起來分析的統(tǒng)計(jì)分析方法。
研究生存現(xiàn)象和響應(yīng)時間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的一門學(xué)科。
對一個或多個非負(fù)隨機(jī)變量(生存時間)進(jìn)行統(tǒng)計(jì)分析研究。
對生存時間進(jìn)行分析和推斷,研究生存時間和結(jié)局與眾多影響因素間關(guān)系及其程度的統(tǒng)
計(jì)分析方法。
在綜合考慮相關(guān)因素(內(nèi)因和外因)的基礎(chǔ)上,對涉及生物學(xué)、醫(yī)學(xué)(臨床、流行
?。⒐こ蹋煽啃裕⒈kU精算學(xué)、公共衛(wèi)生學(xué)、社會學(xué)和人口學(xué)(老齡問題、犯罪、
婚姻)、經(jīng)濟(jì)學(xué)(市場學(xué))等領(lǐng)域中,與事件(死亡,疾病發(fā)生、發(fā)展和緩解,失效,狀
態(tài)持續(xù))發(fā)生的時間(也叫壽命、存活時間或失效時間,統(tǒng)稱生存時間)有關(guān)的問題提供
相關(guān)的統(tǒng)計(jì)規(guī)律的分析與推斷方法的學(xué)科。
二、”生存時間"(SurvivalTime)的概念
生存時間也叫壽命、存活時間、失效時間等等。
醫(yī)學(xué):疾病發(fā)生時間、治療后疾病復(fù)發(fā)時間
可靠性工程系:元件或系統(tǒng)失效時間
犯罪學(xué):重罪犯人的假釋時間
社會學(xué):首次婚姻持續(xù)時間
人口學(xué):母乳喂養(yǎng)新生兒斷奶時間
經(jīng)濟(jì)學(xué):經(jīng)濟(jì)危機(jī)爆發(fā)時間、發(fā)行債券的違約時間
保險精算學(xué):保險人的索賠時間、保險公司某一索賠中所付保費(fèi)
汽車工業(yè):汽車車輪轉(zhuǎn)數(shù)
市場學(xué)中:報(bào)紙和雜志的篇幅和訂閱費(fèi)
三、生存分析的應(yīng)用領(lǐng)域:社會學(xué),保險學(xué),醫(yī)學(xué),生物學(xué),人口學(xué),醫(yī)學(xué),經(jīng)濟(jì)學(xué),
可靠性工程學(xué)等
六、生存分析研究的目的
1、描述生存過程:估計(jì)不同時間的總體生存率,計(jì)算中位生存期,繪制生存函數(shù)曲
線。統(tǒng)計(jì)方法包括Kaplan-Meier(K-M)法、壽命表法。
2、比較:比較不同處理組的生存率,如比較不同療法治療腦瘤的生存率,以了解哪種
治療生存分析課程總結(jié)
方案較優(yōu)。統(tǒng)計(jì)方法log-rank檢驗(yàn)等。
3、影響因素分析:研究某個或某些因素對生存率或生存時間的影響作用。如為改善腦
瘤病人的預(yù)后,應(yīng)了解影響病人預(yù)后的主要因素,包括病人的年齡、性別、病程、腫瘤分
期、治療方案等。統(tǒng)計(jì)方法Cox比例風(fēng)險回歸模型等。
4、預(yù)測:建立Cox回歸預(yù)測模型。
主要研究內(nèi)容
描述生存過程:研究人群生存狀態(tài)的規(guī)律,研究生存率曲線的變動趨勢,是人壽保險業(yè)
的基礎(chǔ)。
生存過程影響因素分析及結(jié)局預(yù)測:識別與反應(yīng)、生存及疾病等相關(guān)風(fēng)險因素,預(yù)測生
存結(jié)局,在臨床中應(yīng)用的非常廣泛。
七、主要分析方法
1、參數(shù)法方法:首先要求觀察的生存時間t服從某一特定的分布,采用估計(jì)分布中參
數(shù)的方法獲得生存率的估計(jì)值。生存時間的分布可能為指數(shù)分布、Weibull分布、對數(shù)正
態(tài)分布等,這些分布曲線都有相應(yīng)的生存率函數(shù)形式。只需求得相應(yīng)參數(shù)的估計(jì)值,即可
獲得生存率的估計(jì)值和生存曲線。
2、非參數(shù)方法:實(shí)際工作中,多數(shù)生存時間的分布不符合上述所指的分布,就不宜用
參數(shù)法進(jìn)行分析,應(yīng)當(dāng)用非參數(shù)法。這類方法的檢驗(yàn)假設(shè)與以往所學(xué)的非參數(shù)法一樣,假
設(shè)兩組或多組的總體生存率曲線分布相同,而不論總體的分布形式和參數(shù)如何。非參數(shù)法
是隨訪資料的常用分析方法。
3、半?yún)?shù)方法:只規(guī)定了影響因素和生存狀況間的關(guān)系,但是沒有對時間(和風(fēng)險函
數(shù))的分布情況加以限定。這種方法主要用于分析生存率的影響因素,屬多因素分析方
法,其典型方法是Cox比例風(fēng)險模型。
4、幾種常用的統(tǒng)計(jì)軟件:SAS,SPSS,Stata,Excel,R
第二章數(shù)據(jù)類型
一、完全數(shù)據(jù)(Completedata)
每個個體確切的生產(chǎn)時間都是知道的。這樣的數(shù)據(jù)稱為完全數(shù)據(jù)(Completedata)。
但在實(shí)際的生存分析中,數(shù)據(jù)在很多情況下是很難完全觀察到的。
二、刪失(Censoring)
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213042生存分析課程總結(jié)
生存數(shù)據(jù)一個重要的特點(diǎn)是:在研究結(jié)束時,無法獲得某些個體確切的生存時間。例
如:失去聯(lián)系(病人搬走,電話號碼改變),無法觀察到結(jié)局(死于其他原因),研究截
止,個體仍然存活……在這些情況下獲得的數(shù)據(jù)就是刪失數(shù)據(jù)(Censoreddata)?對存
在刪失的個體,只知道刪失時間(Censoringtime)?
刪失分為右刪失(Rightcensoring)>左刪失(Leftcensoring)和區(qū)間刪失
(Intervalcensoring)
1、右刪失(Rightcensoring)?
在進(jìn)行觀察或調(diào)查時,一個個體的確切生存時間不知道,而只知道其生存時間大于時間
L,則稱該個體的生存時間在L上是右刪失的,并稱L為右刪失數(shù)據(jù)(Right-censored
data)?右刪失有三種類型(按結(jié)束時間差別):I型刪失(TypeIcensoring),H型
刪失(TypeIIcensoring)和III型刪失(Type111censoring)。
(1)1型刪失(TypeIcensoring):對所有個體的觀察停止在一個固定的時間,這種
刪失即為I型刪失(或定時刪失)。例如:動物研究通常是以有固定數(shù)目的動物接受一種
或多種處理開始,由于時間和費(fèi)用的限制,研究者常常不能等到所有動物死亡。一種選擇
就是在一個固定時間周期內(nèi)觀察,在截止時間之后仍可能有些動物活著,但不繼續(xù)觀察
了。這些動物的生存時間是不知道的,只知其不小于研究周期時間。I型刪失的刪失時間
是固定的。
圖表1I型刪失示例
(2)II型刪失(TypeIIcensoring):同時對n個個體進(jìn)行觀察,一直到有一固定數(shù)
目(r<n)的個體死亡(失效)為止,這種刪失即為II型刪失。H型刪失的刪失時間是
隨機(jī)的。
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213043生存分析課程總結(jié)
圖表2II型刪失示例
(3)III型刪失(TypeIIIcensoring):所有個體在不同時間進(jìn)入研究,某些個體在
研究結(jié)束之前死亡,他們的確切生存時間是知道的,其他個體在研究結(jié)束之前退出研究而
不被跟蹤觀察或在研究結(jié)束時仍然活著。進(jìn)入研究的時間可能不同,刪失時間也可能不
同,這種刪失叫做HI型刪失,又稱為隨機(jī)刪失(Randomcensoring)?
?起點(diǎn)事件
△終點(diǎn)事件
x失由
觀察起點(diǎn)觀察終點(diǎn)
圖表3nl型刪失示例
2、左刪失(Leftcensoring)
研究對象在時刻Cl開始接受觀察,而在此之前我們感興趣的時間已經(jīng)發(fā)生,這就是左
刪失。例如:“您初次吸食大麻是在什么時候?”有一種回答:“我吸食過,但我不記
得吸食的具體時間了。”這些回答的吸食時間數(shù)據(jù)就是左刪失。
通過測試確定兒童學(xué)會完成特定任務(wù)的年齡,有些兒童在進(jìn)入研究前就已經(jīng)可以完成某
項(xiàng)特定任務(wù),這些兒童的事件發(fā)生時間也是左刪失。
出現(xiàn)左刪失同時,也可能出現(xiàn)右刪失,稱為雙刪失(Doublecensoring)?例如:對吸食
大麻的
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦32009121304
4
生存分析課程總結(jié)
問卷還有一種回答:“我從來沒有吸食過”,這樣的數(shù)據(jù)就是右刪失。
3、區(qū)間刪失(Intervalcensoring):若個體的確切生存時間不知道,只知道其生存
時間在兩個觀察時間L和R之間(L<R),則稱該個體的生存時間在[L,R]上是區(qū)間刪失
的。實(shí)際工作中,凡是不能或者不愿作連續(xù)監(jiān)測時就會遇到這樣的區(qū)間刪失。
區(qū)間刪失分兩種:第一類區(qū)間刪失(CaseIIntervalcensoring)和第二類區(qū)間刪失
(CaseIIIntervalcensoring)。
當(dāng)對個體只進(jìn)行一次觀察,且個體的確切生存時間不知道,只知道其生存時間是否大于
觀察時間(即L0或R),這種刪失稱為第一類區(qū)間刪失,也稱為現(xiàn)實(shí)狀況數(shù)據(jù)
(Currentdata)(,當(dāng)對個體進(jìn)行次觀察,其觀察時間L和R滿足0LR時,這種
刪失稱為第二類區(qū)間刪失,也稱為一般區(qū)間刪失。
如果初始時間(如艾滋病感染時間)和發(fā)生時間均為區(qū)間刪失,則稱生存時間為雙重區(qū)
間刪失(Doubleintervalcensoring)。
三、截?cái)?Truncation)
在研究或者觀測中,淘汰了一些對象(樣本),使得研究者“意識不到他們的存在”。
對截?cái)鄶?shù)據(jù)的分析構(gòu)造似然采用條件分布。
截?cái)喟▋煞N:左截?cái)?Lefttruncation)和右截?cái)?Righttruncation),
1、左截?cái)?LeftTruncation):只有個體經(jīng)歷某種初始事件以后才能觀察到其生存時
間,稱為左截?cái)?Lefttruncation),此時獲得的數(shù)據(jù)稱為左截?cái)鄶?shù)據(jù)(Left-
truncateddata)
例如:暴露于某疾病、發(fā)生死亡前的中間事件等。退休中心老年居民死亡時間(沒到年
齡沒有進(jìn)入觀測)
左截?cái)嗯c左刪失的區(qū)別:在左截?cái)嗟难芯恐校緵]有考慮那些在進(jìn)入研究之前已經(jīng)經(jīng)
歷了感興趣時間的個體,而在左刪失的研究中,我們能獲得這些個體的部分信息。
即有左截?cái)嘤执嬖谟覄h失的情況,稱為左截?cái)嘤覄h失(Left-truncationandright-
censoring)
2、右截?cái)?RightTruncation)
只有經(jīng)歷了某種終止事件才能觀察到生存時間(將要經(jīng)歷該事件的個體不包含在實(shí)驗(yàn)樣
本中),稱為右截?cái)?Righttruncation),此時獲得的數(shù)據(jù)稱為右截?cái)鄶?shù)據(jù)(Right-
truncateddata)?例如:對艾滋病感染和發(fā)病時間觀測數(shù)據(jù),有些個體感染病毒但尚
未發(fā)病,這樣的個體不在樣本范圍之內(nèi)。
3、截?cái)嗟臄?shù)學(xué)表示
設(shè)Y是一個非負(fù)的表示生存時間的隨機(jī)變量;T是另外一個表示截?cái)鄷r間的隨機(jī)變量。
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213045生存分析課程總結(jié)
在左截?cái)嘞?,只有?dāng)YT時,才能觀察到T和Y;在左截?cái)嘞?,只有?dāng)YT時,才能
觀察到T和Y。
第三章基本函數(shù)和模型
一、生存函數(shù)(SurvivalFunction)
描述生存時間統(tǒng)計(jì)特征的基本函數(shù),也叫生存率(SurvivalRate):設(shè)T表示生存時
間,F(xiàn)(t)為T分布函數(shù),生存函數(shù)定義為:S(t)P(Tt)1F(t),0T
生存函數(shù)性質(zhì):非增函數(shù)。
滿足S(0)limS(x)lx0
S()limS(x)Ox
當(dāng)生存時間為連續(xù)型隨機(jī)變量時:
S(t)P(Tt)1F(t)f(u)du
t
f(t)S'(t)dS(t)
dt
生存函數(shù)S(t)的圖像叫做生存曲線(SurvivalCurve),如下圖:
陡峭的生存曲線表示較低的生產(chǎn)率或較短的生存時間;平緩的生存曲線表示較高的生存
率或較長的生存時間。
離散生存時間產(chǎn)生于舍入操作將失效(或死亡)時間分組從區(qū)間和壽命用整數(shù)計(jì)量等。
離散時間生存函數(shù)是非增的階梯函數(shù),當(dāng)T取值為ala2,且f(ai)P(Tai),
i1,2,,S(t)P(Tai)f(ai),i1,2,
aitait
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213046生存分析課程總結(jié)
離散時間生存函數(shù)是非增的階梯函數(shù)
二、危險率函數(shù)(HazardFunction):
危險率函數(shù):描述觀察個體在某時刻存活條件下,在以后的單位時間內(nèi)死亡的(條件)
概率:(t)limP(TthTt
hh0
當(dāng)T連續(xù)(t)f(t)dln[S(t)];S(t)dt
當(dāng)T離散,取值為ala2,f(ai)P(Tai),i1,2,,則ai處的危險率為
iPTaiaif(ai)S(ai1)S(ai)S(ai)1,i1,2,S(ail)S(ai1
)S(ai1)
S(ai)S(t)(1i)S(a)aitaiti1
危險率函數(shù)在工程上叫做失效率函數(shù)或損壞函數(shù),在生存分析和醫(yī)學(xué)統(tǒng)計(jì)中又稱為風(fēng)險
率函數(shù)
或瞬時死亡率(Simultaneousdeathrate)>或死亡強(qiáng)度(Deathintensity)或條件死
亡率(Conditionaldeathrate)或年齡死亡率(Agedeathrate)等。
常見風(fēng)險函數(shù)曲線
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦32009121304
7
生存分析課程總結(jié)
三、累積風(fēng)險函數(shù)(CumulativeHazardFunction)
累積危險率函數(shù):tudut
tStexptexpudu當(dāng)T連續(xù),0
tInSt
當(dāng)T離散時,危險率函數(shù)有兩種定義形式:
t
tiaiti
iaitin1i
如果i的值很小,兩種定義形式的值接近
四、平均剩余壽命函數(shù)(Expectedresiduallife)
平均剩余壽命函數(shù)定義為:
rtETttstfsdst
St
r0為平均壽命。
五、常用的參數(shù)模型
生存時間的分布一般不呈正態(tài)分布。常用的分布有:指數(shù)分布、威布爾(Weibull)分
布、伽瑪(Gamma)分布、對數(shù)羅吉斯蒂(logistic)分布、對數(shù)正態(tài)分布。
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦32009121304
遞增遞熠:自然老化、
\一.、.駝峨狀
磨損
遞減:較少見;死
1亡發(fā)生較早時
「一常值臉盆:最常見;人
/吊但口死亡率
?駝嵯:手術(shù)成功后
生存建模
、________________一遞咸
浴盆狀
8
生存分析課程總結(jié)
1、指數(shù)分布
生存函數(shù)形式為:stexpt,0,t0
密度函數(shù)為:ftexpt
危險率函數(shù)為:t
指數(shù)分布的一個重要性質(zhì):無記憶性(某事件的發(fā)生時間與歷史記錄無關(guān)),即
PTthtPTt
2、威布爾(Weibull)分布
生存函數(shù)形式為:stexpt,0,0
其中是尺度參數(shù),是形狀參數(shù),1時為指數(shù)分布。
危險率函數(shù)為:tt1
適用于危險率遞增(取1)、遞減(取1)和為常數(shù)(取1)等各種情形。
3、伽瑪(Gamma)分布
1t
ulexpu
生存函數(shù):stdu
0
,0,0
其中ulexpudu稱為伽瑪函數(shù)。
第四章生存數(shù)據(jù)基本特征的非參數(shù)估計(jì)
一、生存函數(shù)的估計(jì)
假設(shè)事件發(fā)生在D個嚴(yán)格區(qū)分的時間點(diǎn)上:tt2tD
在無刪失條件下:St生存時間t的個數(shù)
個體總數(shù)
二、右刪失生存函數(shù)的估計(jì):
StStiSti1St2
iStStlStO
iISti2StlStO
StiPTtiTtiPTtiITti1PT12t2PTtlTtl
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦320091213049生存分析課程總結(jié)
存在右刪失下:PTtiTtiYidi,i1,2,,DYi
Yi:時刻ti面臨危險的個體數(shù);di:時亥ijti失效個體數(shù)
三、乘積限(product-limit)估計(jì)
乘積限估計(jì)又稱Kaplan-Meier估計(jì)
1,ttlS(ti)di(1)ttlYitit
階梯函數(shù),在觀察時間點(diǎn)上發(fā)生跳躍;
跳躍的高度ti與上發(fā)生的事件數(shù)和ti前刪失數(shù)有關(guān);超出觀測上限的時間沒有給出很
好的估計(jì)。
四、乘積限估計(jì)尾部修正
Efron(1967)建議最大觀察時間點(diǎn)以后的生存函數(shù)等于0,即等價于假定最大時間點(diǎn)上
的生存者馬上就會死亡。(負(fù)偏估計(jì))
tmax,即假設(shè)最大時間點(diǎn)上的生StSGill(1980)建議最大觀察時間點(diǎn)
以后的生存函數(shù)
存者永遠(yuǎn)不會死。(正偏估計(jì))
Brown>Hollander和Kowar(1974)建議尾部估計(jì)為一條指數(shù)曲線,即
StexptlnStmax/tmax
五、乘積限估計(jì)的方差
2diGreenwood估計(jì)式:tVarStSttitYiYidi2s
六、生存函數(shù)點(diǎn)估計(jì)的置信區(qū)間
利用漸進(jìn)正態(tài)性的線性置信區(qū)間:
StZ1St,Stz
21
2St
其他變換形式的非線性置信區(qū)間
對數(shù)變換反正弦平方根
七、累積死亡率的估計(jì)
無刪失條件下危險率函數(shù)的估計(jì):
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130410生存分析課程總結(jié)
t
在時間t開始的區(qū)間中死亡的個數(shù)在時間t存活著的個體數(shù)區(qū)間寬度
有刪失條件下累計(jì)死亡率估計(jì):
1.直接利用累積死亡率與生存函數(shù)的關(guān)系:tInSt
2.Nelson-Aalen估計(jì)為方差為:Ht2diYtiti
0,
"(t)Hdi
titYittittl
具有更好的小樣本性質(zhì)
Nelson-Aalen彳占計(jì)的應(yīng)用
1)用于選擇事件發(fā)生時間的參數(shù)模型
2)為危險率提供粗估計(jì)(對估計(jì)進(jìn)行核平滑后計(jì)算斜率)
八、累積死亡力函數(shù)的置信區(qū)間
-tZ線性置信區(qū)間:1
2,tZtHt,Hl2
其他變換形式的非線性置信區(qū)間
對數(shù)變換區(qū)間反正弦平方根變化區(qū)間
注:
1、乘積限估計(jì)和Nelson-Aalen估計(jì)都是建立在非信息刪失(non-informative
censoring)假設(shè)下
2、乘積限估計(jì)的尾部估計(jì):a)取0;b)取最大觀測點(diǎn)的值;c)構(gòu)造指數(shù)曲線
StexptlnStmax/tmax
3、無刪失時,乘積限估計(jì)即為經(jīng)驗(yàn)生存函數(shù)
九、生命時間均值的估計(jì)
平均生存時間:Stdt
0
AtdtS估計(jì)式為:
0
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130411生存分析課程總結(jié)
D"tdt,S方差為:var
i1YYddi
iii2
十、左截?cái)嘤覄h失數(shù)據(jù)生存函數(shù)的估計(jì)
只有生存到某時刻之后才能進(jìn)入觀察
乘積限估計(jì)(獨(dú)立截?cái)嘞率亲畲笏迫还烙?jì))
d、St1i(為條件估計(jì))Yitit
Yi:在時刻ti之前進(jìn)入?yún)^(qū)研究,且至少被研究到ti的個體數(shù);
di:在時刻ti時死亡的個體數(shù)。
Lai和Ying(1991)修正乘積限估計(jì):(當(dāng)風(fēng)險集較小時忽略此處的死亡)
d~St1iYicnI為指數(shù)函數(shù);n為樣本大?。籧0,01為常
數(shù)。Yitit
十、左刪失數(shù)據(jù)生存函數(shù)估計(jì)
利用“時間倒轉(zhuǎn)法”:
即不是從原點(diǎn)處測量時間,而是從很大的一個時間倒著從相反的方向測量,用時間
減去原始時間,得到右刪失數(shù)據(jù)結(jié)構(gòu),利用乘積限估計(jì)式估計(jì)
PXtPXt
純粹左刪失情況很少見。
十二、同時存在左、右刪失情況
設(shè)0tlt2tm為觀察時間點(diǎn),dj表示tj時的死亡數(shù),門表示tj時的右刪失
數(shù),cj表示tj時的左刪失數(shù),則生存函數(shù)的迭代估計(jì)步驟為:
步驟0:忽略左刪失獲得乘積限估計(jì)作為SOtj的初始估計(jì);
SKtj1SKtj
1SKtjji
步驟(K+l)1:使用S的當(dāng)前估計(jì)值通過估計(jì)pijPtj1XtjXti
'dcp步驟(K+l)2:使用上一步驟的結(jié)果,估計(jì)在tj時發(fā)生的事件數(shù)為diijjj
ijm
步驟(K+l)3:使用上一步修正后的右刪失數(shù)據(jù),仍然忽略左刪失計(jì)算乘積限估計(jì)。
如果
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130412生存分析課程總結(jié)
這一估計(jì)在所有tj處都有SK1t接近SKt,則停止迭代,否則繼續(xù)步驟1。
十三、右截?cái)鄶?shù)據(jù)生成函數(shù)的估計(jì)
傳染病的研究中比較常見。設(shè)Ti代表第i個個體被傳染的時間,Xi是從感染到發(fā)病的
時間。研究樣本包含從0到期間病人的觀測值Ti,Xi.(只有在時間之前發(fā)病的人
才進(jìn)入研究)。
利用顛倒時間軸法:令RiXi則變?yōu)镽i左截?cái)嗟?,便可?gòu)造
PRtR0PXtX的乘積限估計(jì)式。
十四、生命表中生存函數(shù)的估計(jì)
生命表(也稱壽命表,lifetable)方法是測定死亡率和描述群體生存現(xiàn)象的最古老的
技術(shù)之一。主要用于保險精算、人口學(xué)、醫(yī)學(xué)等方面。
一組(大規(guī)模)個體在整個考察時間上被連續(xù)觀察,它們的事件發(fā)生時間或刪失時間被
記入k1個相鄰但不重疊的區(qū)間內(nèi)ajl,ajj1,,k1
根據(jù)生命表方法應(yīng)用的范圍不同,可分為人口生命表和臨床生命表,分析方法相似。
生命表方法數(shù)據(jù)假設(shè)
(1)獨(dú)立刪失:假定刪失的事件時間(包括損失和退出)與它們?nèi)绻恢北挥^察到事
件發(fā)生所得到的死亡時間是獨(dú)立的。
(2)假定刪失時間和死亡時間是均勻分布在每個區(qū)間上的。
(3)假定死亡力在區(qū)間內(nèi)是常數(shù)。
生命表的構(gòu)造方法
1.第一列給出相鄰但不重疊的固定區(qū)間
liajl,ajj1,,k1,aO0,ak1事件發(fā)生時間和刪失時間將落入且
只落入其中的一個區(qū)間。
2.第二列給出進(jìn)入第j個區(qū)間的對象數(shù)Yj,這些個體還沒有經(jīng)歷觀察事件的發(fā)生。
3.第三列給出在第j個區(qū)間中失去蹤跡(死亡)或活著退出觀察(遷出)的個體數(shù)Wj
4.第四列給出在第j個區(qū)間中,面臨觀察事件風(fēng)險的暴露數(shù)Yj的一個估計(jì)值,假設(shè)刪
失時間在區(qū)間上是均勻分布的,則YjYiWj/2
09統(tǒng)計(jì)學(xué)【經(jīng)濟(jì)分析】2班呂嘉琦3200912130413''生存分析課程總結(jié)
5.第五列是在第j個區(qū)間中發(fā)生觀察事件(如死亡)的個體數(shù)dj
6.第六列給出在第j個區(qū)間起點(diǎn)處的生存函數(shù)的估計(jì)Saj1對于第一個區(qū)間
Sa01,且
aS,a1d/YS1dj/YjjjIjj
i1j
'a,基本思想:乘積限方法。生命表分析的主要任務(wù)就是估計(jì)Sj
,a,其中aaa/2它7.第七列給出估計(jì)的第j個區(qū)間中點(diǎn)處的概率密度函數(shù)
fmjmjjj1
表示在第j個區(qū)間上單位時間內(nèi)發(fā)生觀察事件的概率,即
aSaSa/aafmjjIjjj1
"a,由tft/St8.第八列給出在第j個區(qū)間中點(diǎn)處估計(jì)的危險率mj
有
Aa/S'a區(qū)a/S'af'afAaS'aS'a/22Fa
S'amjmjmjmjjj1jmjjIj
Aad/aaYd/2也可以定義為每個個體單位時間的時間發(fā)生率mjjjjIjj
注:最后一個區(qū)間在理論上是無限的,所以沒有任何危險或概率密度函數(shù)的估計(jì)。
9.第九列是第j個區(qū)間起點(diǎn)生存函數(shù)標(biāo)準(zhǔn)差的估計(jì)值,Greenwood(1976)將其定義為:
'aSj1d/YYd,j2,,k1iiii
i1J1
*a1的估計(jì)的標(biāo)準(zhǔn)差為0其中SO
其形式與乘積限估計(jì)式的標(biāo)準(zhǔn)差估計(jì)一樣。
10.第十列給出在第j個區(qū)間中點(diǎn)處概率密度函數(shù)標(biāo)注差的估計(jì)值,它近似等于
'j=dj/Yj,p,j1qAj.其中q
11.生命表的最后一列給出了第j個區(qū)間中點(diǎn)處危險率函數(shù)的標(biāo)準(zhǔn)差的估計(jì),它近似等
于"(a)(aa)/2]2}l[mjjj109
S(a..)q.叵
,廠;\Z0/(3)]+3
以6)『
陽■析】
2班呂嘉琦3200912130414生存分析課程總結(jié)
第五章相對風(fēng)險回歸模型
一、Cox相對風(fēng)險模型
設(shè)t;xhlimOPtTthTt,x/h0trt,xt0
rt,x成為相對風(fēng)險。0t為基準(zhǔn)風(fēng)險函數(shù)。x為協(xié)變量。
二、相對風(fēng)險回歸模型(Cox模型)取rt,xexpZt'即得Coxmodel
t;x0texpZt,其中:ZtZ1t,,Zpt'為協(xié)
變量x和t的函數(shù)0ttx0,,0'
1,,p為未知的回歸參數(shù)Relativeriskmodel(Coxmodel)
expZt'為參數(shù)部分,'
1,p為未知參數(shù)
0t為非參數(shù)部分,未知基準(zhǔn)函數(shù),因此,相對風(fēng)險模型為半?yún)?shù)模型。在Cox
模型下:生存時
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 互聯(lián)網(wǎng)+在儀器儀表行業(yè)的應(yīng)用案例考核試卷
- 廢棄物肥料化處理經(jīng)濟(jì)效益分析考核試卷
- 保健品市場社會責(zé)任信息披露規(guī)范考核試卷
- 財(cái)務(wù)部門個人2024年終工作總結(jié)(30篇)
- 印刷品設(shè)計(jì)的創(chuàng)意與創(chuàng)新考核試卷
- 財(cái)務(wù)會計(jì)求職信11篇 關(guān)于財(cái)務(wù)會計(jì)崗位的求職信
- 2025年中國PU高固透明底漆數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025年中國LCD模塊數(shù)據(jù)監(jiān)測研究報(bào)告
- 2025年中國EAS服務(wù)器系統(tǒng)數(shù)據(jù)監(jiān)測報(bào)告
- 2025年中國90°內(nèi)絲卡套彎頭數(shù)據(jù)監(jiān)測研究報(bào)告
- 2024年江西省公安廳招聘警務(wù)輔助人員考試真題
- 2025年湖北省中考英語真題含答案
- 砂石銷售提成管理制度
- 2025年湖南省中考生物試卷及答案
- 2025至2030中國地效飛行器行業(yè)產(chǎn)業(yè)運(yùn)行態(tài)勢及投資規(guī)劃深度研究報(bào)告
- 2025年四川省眉山市中考化學(xué)試卷及答案
- 2025年重慶市中考語文試卷(含解析)
- 2025年湖北省普通高中學(xué)業(yè)水平合格性考試模擬(三)歷史試題(含答案)
- 廣東省中山市2023-2024學(xué)年八年級下學(xué)期語文期末試卷(含答案)
- 2025至2030中國處方呼吸藥物行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 2025年河南高考真題化學(xué)試題含答案
評論
0/150
提交評論