衛(wèi)生統(tǒng)計(jì)學(xué)講義_第1頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義_第2頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義_第3頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義_第4頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)講義_第5頁(yè)
已閱讀5頁(yè),還剩112頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)統(tǒng)計(jì)學(xué)的幾個(gè)基本概念

A班150人兩個(gè)班男生的身B班170人

男生80人高是否不同男生90人

女生70人女生80人

175cm170cM

兩個(gè)班男生的身高是不同的

班(人)

兩個(gè)班男生的身B1700

高是否不同男生900.女生800

男生155

176cm172cm

兩個(gè)班男生的身高是不同的

一、統(tǒng)計(jì)學(xué)的幾個(gè)基本概念

(一)總體與樣本

總體(population):根據(jù)研究目的確定的同質(zhì)的研究對(duì)象,其某項(xiàng)變量值的全體。

某省2000年14歲男孩的身高

有限總體

總體時(shí)間和空間

無(wú)限總體(某藥治療錯(cuò)尿病的療效)

抽樣(sampling):從研究總體中隨機(jī)抽取一部分有代表性的個(gè)體的方法。

樣本(sample):從研究總體中隨機(jī)抽取的一部分有代表性的個(gè)體(其某項(xiàng)變量值的全體)。

統(tǒng)計(jì)推斷(inference):利用樣本信息推斷總體特征。

推斷

隨機(jī)抽取

,概率論,

部分個(gè)體

(二)同質(zhì)與變異

1.同質(zhì)(homogeneity):一個(gè)總體中有許多個(gè)體大同小異,存在共性,這些個(gè)體處于同一總體。

某省2000年14歲男孩的身高

2.變異(variation):在同質(zhì)基礎(chǔ)上個(gè)體間的差異。

變異性是統(tǒng)計(jì)學(xué)的根本需要

(三)抽樣誤差(samplingerror)

定義:由個(gè)體變異產(chǎn)生,由抽樣引起的總體指標(biāo)(參數(shù))與樣本指標(biāo)(統(tǒng)計(jì)量)以及樣本指標(biāo)之間的差

總體175CMJ

祥本2樣本廣、..「樣本3

17_4_c-m----?1-7--6-cm17_3_an

特點(diǎn):不可避免

目的:減小抽樣誤差

方法:減小個(gè)體間的差異;增大樣本含量

(四)參數(shù)與統(tǒng)計(jì)量

1.參數(shù)(parameter):是由總體中個(gè)體值計(jì)算出來的用于描述總體特征的指標(biāo)。

其大小是客觀存在的,然而往往是未知的。

2.統(tǒng)計(jì)量(statistic):是由樣本中個(gè)體值計(jì)算出來的用于描述樣本特征的指標(biāo)。

統(tǒng)計(jì)學(xué)關(guān)心的常常是總體參數(shù)的大小,其依據(jù)卻是統(tǒng)計(jì)量及其性質(zhì)。

(五)概率(Probability)

幣值朝上的概率是50%

!I!

隨機(jī)事件可能性數(shù)值

定義:描述隨機(jī)事件發(fā)生可能性大小的數(shù)值小)

隨機(jī)事件

取值范圍:不可能事件戶工1必然事件

估計(jì)方法:當(dāng)n足夠大時(shí),用頻率估計(jì)概率

小概率事件深隨機(jī)事件發(fā)生可能性很小^<0,05^<0.01

含義:在一次試驗(yàn)或觀察中某隨機(jī)事件發(fā)生可能性很小

(六)資料類型

變量:根據(jù)研究目的,對(duì)研究對(duì)象的某個(gè)或某些特征(研究指標(biāo)或項(xiàng)目)實(shí)施觀測(cè),這些特征(指標(biāo)或

項(xiàng)目)稱為變量(variable)

資料(數(shù)據(jù)):變量的取值(變量值)

定量資料《身高.體重-特點(diǎn):有單位)

資料

*刷二分類(性別)

無(wú)序

定性資料多分類(血型:A.B.O.AB)

有序(檢晚結(jié)果:+,++,+++)

二、醫(yī)學(xué)統(tǒng)計(jì)工作的基本步驟

^砸定:實(shí)馳設(shè)計(jì)類型、樣本含量的估計(jì)、

統(tǒng)計(jì)設(shè)計(jì)

統(tǒng)計(jì)分析指標(biāo)以及統(tǒng)計(jì)分析方法等等

i

收集資料--獲得完整,準(zhǔn)陰、可嘉的原始資料

O

整理資料1<對(duì)原始資料進(jìn)行凈化、系統(tǒng)化.條理化

n

分析資料,統(tǒng)計(jì)分析包括:統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷

【例題】下面的變量中,屬于分類變量的是

A.脈搏

B.血型

C.肺活量

D.紅細(xì)胞計(jì)數(shù)

E.血壓

【答案】B

【例題】小概率事件在統(tǒng)計(jì)學(xué)上的含義是

A.指發(fā)生概率產(chǎn)&0-5的隨機(jī)事件

B.指一次實(shí)驗(yàn)或觀察中絕對(duì)不發(fā)生的事件

C.指一次實(shí)驗(yàn)或觀察中發(fā)生的可能性很小的事件,一般指尸《0.05

D.指發(fā)生概率FV0-1的隨機(jī)事件

E.以上都不正確

【答案】C

第二節(jié)定量資料的統(tǒng)計(jì)描述

「統(tǒng)計(jì)描述

統(tǒng)計(jì)分析-

.統(tǒng)計(jì)推斷

統(tǒng)計(jì)描述

資料信息

統(tǒng)計(jì)描述——從統(tǒng)計(jì)資料中獲取信息量菱本的方法

-----------基本特征-----------

統(tǒng)計(jì)描述-------——統(tǒng)計(jì)分析

統(tǒng)計(jì)描述:利用統(tǒng)計(jì)表、圖以及統(tǒng)計(jì)指標(biāo)描述資料的數(shù)量特征及其分布規(guī)律

(包含很多統(tǒng)計(jì)指標(biāo))

敷值供住,集中趨勢(shì),>器_?

總體,同質(zhì)

?變?

?變異.性一離散趨勢(shì).類型布

(樣本)資料

(包含很多統(tǒng)計(jì)指標(biāo))用

一、頻數(shù)與頻數(shù)分布

頻數(shù):某個(gè)測(cè)量值的個(gè)(例)數(shù)。

頻數(shù)分布表(frequencydistributiontable):又稱頻數(shù)表,一個(gè)統(tǒng)計(jì)表,有兩個(gè)欄目(列)組成,

其中一個(gè)欄目是觀察單位的觀察值或組段,另一個(gè)欄目是相應(yīng)的頻數(shù)。

是對(duì)樣本量較大的資料進(jìn)行統(tǒng)計(jì)描述的常用方法。通過頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)。

一離散型

定量資料《

_連續(xù)型

1.離散型定量變量的頻數(shù)分布

1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:

0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7等共96個(gè)數(shù)值

96名婦女產(chǎn)前檢查次數(shù)分布的頻數(shù)分布表

1998年某地96名婦女產(chǎn)前檢查次數(shù)分布

檢查次數(shù)頻數(shù)頻率(%)累計(jì)人數(shù)累計(jì)頻率(%)

(1)(2)(3)(4)(5)

44.244.2

177.31111.5

21111.52222.9

31313.53536.5

42627.16163.5

52324.08487.5

>51212.596100.0

合計(jì)96100.0一一

某地96名婦女產(chǎn)前檢查次數(shù)分布

2.連續(xù)型定量變量的頻數(shù)分布

某市2005年進(jìn)行的小學(xué)生體質(zhì)評(píng)價(jià)研究中,120名9歲男孩的肺活量(L)資料如下,試分析其頻數(shù)分

布特征及類型。

1.7061.3261.6321.8762.161

1.6841.5331.1751.8671.676

1.9301.7251.3741.6541.663

1.4381.6451.2141.1841.735

2005年某市120名9歲男孩肺活量(L)頻數(shù)分布

組段(1)頻數(shù)(f)(2)頻率(%)(3)累計(jì)頻數(shù)(4)累計(jì)頻率(%)(5)

0.980?54.1754.17

1.110-54.17108.33

1.240?75.831714.17

1.370?1411.673125.83

1.500?1915.835041.67

1.630?2924.177965.83

1.760-1512.509478.33

1.890?1210.0010688.33

2.020?65.0011293.33

2.150-43.3311696.67

2.280-2.41043.33120100.00

合計(jì)120100.00一一

從*K分串包中可以看出酉個(gè)通粉,?中曲身*)*故13野

頻數(shù)分布圖

從頻數(shù)分布圖中

可以看出兩個(gè)趨勢(shì):

集中趨勢(shì)和離散趨勢(shì)

從頻數(shù)分布圖中可以看出,圖形中間的直條最高,兩邊對(duì)稱(或基本對(duì)稱)地逐漸減少,統(tǒng)計(jì)學(xué)上稱

之為正態(tài)分布。

—分布

I____"KIITTF____

二、集中趨勢(shì)的描述

描述數(shù)值變量資料的集中趨勢(shì)指標(biāo)一一平均數(shù)

平均數(shù):它是一類指標(biāo),統(tǒng)計(jì)中常用的平均數(shù)包括:算術(shù)平均數(shù)、幾何平均數(shù)、中位數(shù)。

平均數(shù)的選取:根據(jù)資料的分布類型

(一)算術(shù)平均數(shù)

算術(shù)平均數(shù)簡(jiǎn)稱均數(shù),總體均數(shù)一〃,樣本均數(shù)一元

1.適用條件:對(duì)稱分布,特別適用于正態(tài)或近似正態(tài)分布資料

2.計(jì)算方法:

(1)直接法一觀察單位較少

西+“2+…+%

X7=--------

公式:閥

某市10名4歲女孩的身高(cm)分別為:112.9,108.0,99.8,102.5,116.3,105.6,100.7,103.2,

104.9,98.9,試求其均數(shù)。

?112.9+108.0+...98.91052.81《卅、

r=---------------------------=---------=10rl5.28(cm)

1010

(2)加權(quán)法一頻數(shù)表資料

”五晝=M+加+…+加

工+石+…+彳

公式:

_=5xl.405+...+4x2.345=200:800=L673(L)

5+…+4120

(二)幾何均數(shù)

幾何均數(shù)(geometricmean)用G表示。

1.適用條件:觀察值呈倍數(shù)關(guān)系或?qū)?shù)正態(tài)分布,多用于描述抗體的平均滴度等。

2.計(jì)算方法:

(1)直接法一觀察單位較少

公式:

6=我々…4

電G=lg0i々…勺)=3占+加馬+...+lg/=-

nnn

G=lgT(Zlg,)=]0序

n

例題某地5例微絲坳血癥患者治療7年后用間接熒光抗體試驗(yàn)測(cè)得其抗體滴度分別為1:10,1:20,1:40,

1:40,1:160,求抗體的平均滴度。

解:平均指標(biāo)選用幾何均數(shù)(觀察值呈倍數(shù)關(guān)系)

首先取觀察值的倒數(shù)

lgl0+lg20+lg40+lg40+lgl60

G=lg*..)=348

5

5份血清抗體效價(jià)的平均滴度為1:34.8

(2)加權(quán)法一頻數(shù)表資料

公式:

/旭西+石旭勺+…+彳愴/

G=lg%)=3"戔等)

Sft

例題:69例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCATgG抗體滴度的分布如下,求其平均抗體滴度。

某醫(yī)院預(yù)防保健科用流腦疫苗為75名兒童進(jìn)行免疫接種,1個(gè)月后測(cè)定其抗體滴度如下表所示,試求

其平均滴度。

75名兒童的平均抗體滴度計(jì)算表

抗體滴度滴度倒數(shù)XIgX頻數(shù)fflgX

1:440.602142.4084

1:880.903198.1279

1:16161.20412125.2861

1:32321.50512030.1020

1:64641.80621221.6744

1:1281282.1072510.5360

1:2562562.408249.6328

合計(jì)一一75107.7676

G=IgT((竽尸1葭(四等尸27.35

(三)中位數(shù)

中位數(shù)(median)用〃表示,是一組觀察值按由小到大的順序排列后,位于中間位置上的那個(gè)數(shù)值。

1.適用條件:

(1)變量值中出現(xiàn)個(gè)別特小或特大的數(shù)值

(2)資料的分布呈明顯的偏態(tài)

(3)變量值分布一端或兩端無(wú)確定數(shù)值,只有小于或大于某個(gè)數(shù)值(<%)。

(4)資料的分布不清

2.計(jì)算方法:

(1)當(dāng)樣本含量為奇數(shù)時(shí),

1,8,2,4,12—1,2,4,8,12

3=4

(區(qū)+區(qū),)

M=———

(2)當(dāng)樣本含量為偶數(shù)時(shí),2

1,8,2,4,12,3—1,2,3,4,8,12

M_3;+*)_?+Z)_(3+4)_35

222

(四)百分位數(shù)

百分位數(shù)(percentile)用只(第x百分位數(shù))表示,也是一種位置指標(biāo),觀察值按由小到大的順

序排列后,一個(gè)百分位數(shù)月將全部變量值分為兩部分,其中有x%的變量值比它小,(100—x)%變量值比

它大。

適用條件同中位數(shù)

月=七+卷8秋-£力)

頻數(shù)表法:力

£:第x百分位數(shù)所在組段的組下限

1:組距

工:第X百分位數(shù)所在組段對(duì)應(yīng)的頻數(shù)

Z九:為小于£的各組段的累計(jì)頻數(shù)

例題測(cè)得某地200名正常人發(fā)汞值(口g/g),試計(jì)算其平均水平及P75百分位數(shù)。

某地200名正常人發(fā)汞值頻數(shù)分布

組段(〃92)(1)頻數(shù)f(2)頻率(%)(3)累計(jì)頻數(shù)(4)累計(jì)頻率(%)(5)

0.3?2010.02010.0

0.7?5025.07035.0

1.1?4623.011658.0

1.5~3015.014673.0

1.9?2512.517185.5

2.3?168.018793.5

2.7?63.019396.5

3.1~42.019798.5

3.5?21.019999.5

3.9?4.310.5200100.0

合計(jì)200100.0一一

M=P5S=L+亍5.x%-£力)

JX

04

1.1+—(200x50%-70)

46

1.36(/4g/g)

與5=£+7?,四力)

04

=1.9+-g(200x75%-146)

=1,964(加加。//2)

定量資料的離散趨勢(shì)指標(biāo)

正態(tài)

算術(shù)平均數(shù)

近似正態(tài)

平均水平

倍數(shù)

數(shù)值集中趨勢(shì)幾何平均數(shù)

變?對(duì)數(shù)正態(tài)分布

軟數(shù)裊

統(tǒng)計(jì)中位數(shù)和百分位數(shù)一?偏態(tài)分布

描述頻數(shù)圖

極差

離散趨勢(shì)四分位數(shù)間距

離散程度方差和標(biāo)準(zhǔn)差

變異程度變異系數(shù)

三、離散趨勢(shì)

(一)極差(全距)

1.定義:極差(冷=最大值一最小值極差越大變異程度越大。

例:甲乙兩組球員身高資料如下:

馬=%=192-184=8c加

甲組:184,186,188,190,192188CM

乙組:180,184,188,192,196年=188c溶&=196-180=16c切

甲乙兩組的集中趨勢(shì)相同(有相同的平均水平),但離散程度不同(乙組大于甲組)。也就是說,既

考慮集中趨勢(shì),又要考慮離散趨勢(shì),這樣才能全面對(duì)數(shù)值變量資料進(jìn)行描述。

2.應(yīng)用范圍:適用于任何分布類型的資料,描述偏態(tài)分布資料。

3.優(yōu)缺點(diǎn)

優(yōu)點(diǎn):計(jì)算簡(jiǎn)單、概念清晰。

缺點(diǎn):

⑴只考慮了最大值與最小值,容易受個(gè)別極端值的影響,且不能反應(yīng)組內(nèi)其它變量值的變異情況。

⑵受樣本含量影響,不穩(wěn)定(一般樣本含量越大越有機(jī)會(huì)觀察到偏小或偏大的數(shù)據(jù))。

(二)四分位數(shù)間距

L定義:Q=片5-

2.應(yīng)用范圍:適用于任何分布類型的資料,主要和中位數(shù)一起描述偏態(tài)分布資料。

3.優(yōu)缺點(diǎn)

優(yōu)點(diǎn):要比極差穩(wěn)定

缺點(diǎn):仍未考慮到全部觀察值的變異程度

(三)方差

解=生宜?樣本方差

b:=X(x;")'總體方差

N

公式的由來

或當(dāng)/

樣本方差

在實(shí)際應(yīng)用時(shí),總體均數(shù)〃常常是未知的,N往往也很大,或者總體內(nèi)的個(gè)體有無(wú)限多個(gè),因此,總

體方差的公式N就不太適合應(yīng)用了。在抽樣研究中往往是用樣本的方差來估計(jì)總體方差,也就是用

X-必,用附一H也即N?,但是經(jīng)數(shù)理統(tǒng)計(jì)學(xué)證明這樣代替后樣本方差值會(huì)變

小,因此統(tǒng)計(jì)學(xué)家進(jìn)一步完善將附?-1其中”T是自由度U

y=隨機(jī)變量可以自由取值的微文-限制)條件的個(gè)數(shù)

(四)標(biāo)準(zhǔn)差

由于方差的單位是原單位的平方,因此為了應(yīng)用方便,對(duì)方差進(jìn)行開方得到,該公

式就是樣本的標(biāo)準(zhǔn)差。

標(biāo)準(zhǔn)差的簡(jiǎn)化公式

方差和標(biāo)準(zhǔn)差主要應(yīng)用于正態(tài)分布

(五)變異系數(shù)

1.應(yīng)用條件:反映資料的相對(duì)變異程度。常用于比較度量衡單位不同或均數(shù)相差懸殊的兩組(或多組)

資料的變異度。

CV=-xlOO%

2.公式:x

例比較單位不同的幾組資料的離散程度

某年某市城區(qū)120名5歲女孩身高均數(shù)為110.15cm,標(biāo)準(zhǔn)差為5.86cm,體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差

為1.44kg,比較其離散程度。

身高3=四_*100%=5.32%

110.15

144

體重3=匕L100%=8.13%

17.71

例比較均數(shù)相差懸殊的幾組資料的離散程度

某年某市城區(qū)120名5歲女孩體重均數(shù)為17.71kg,標(biāo)準(zhǔn)差為1.44kg,同年該地120名5個(gè)月女孩體

重均數(shù)為7.37kg,標(biāo)準(zhǔn)差為0.77kg,比較其離散程度。

144

5歲女孩體重CT=T-X10Q%=8.13%

17.71

n77

5個(gè)月女孩體重CT==10.45%

7.37

【例題】正態(tài)分布資料宜用()來描述其集中趨勢(shì)。

A.算術(shù)平均數(shù)

B.標(biāo)準(zhǔn)差

C.幾何均數(shù)

D.變異系數(shù)

E.四分位數(shù)間距

【答案】A

【例題】變異系數(shù)越大說明

A.標(biāo)準(zhǔn)差越大

B.標(biāo)準(zhǔn)差越小

C.均數(shù)越大

D.均數(shù)越小

E.以均數(shù)為準(zhǔn)變異程度大

【答案】E

【例題】數(shù)列8,-3,5,0,1,4,—1的中位數(shù)是

A.2

B.0

C.2.5

D.0.5

E.1

【答案】E

【例題】原始數(shù)據(jù)呈倍數(shù)關(guān)系的資料,宜用()描述其分布的集中趨勢(shì)。

A.算數(shù)均數(shù)

B.幾何均數(shù)

C.極差

D.中位數(shù)

E.百分位數(shù)

【答案】B

【例題】離散程度指標(biāo)中,最容易受極端值影響的是

A.極差

B.標(biāo)準(zhǔn)差

C.變異系數(shù)

D.方差

E.四分位數(shù)間距

【答案】A

【例題】以下關(guān)于偏態(tài)分布資料的說法,不正確的是

A.正偏態(tài)分布的頻數(shù)分布集中位置偏向數(shù)值大的一側(cè)

B.負(fù)偏態(tài)分布的頻數(shù)分布集中位置偏向數(shù)值大的一側(cè)

C.不宜用均數(shù)描述其集中趨勢(shì)

D.偏態(tài)分布資料頻數(shù)分布左右不對(duì)稱

E.不宜用變異系數(shù)來描述其離散程度

【答案】A

四、正態(tài)分布

正態(tài)分布是醫(yī)學(xué)和生物學(xué)中最常見,也是最重要的一種連續(xù)性分布,如正常人的身高,體重,紅細(xì)胞

數(shù),血紅蛋白等。我們可以從頻數(shù)表和頻數(shù)圖對(duì)正態(tài)分布進(jìn)行研究。

120名正常成年男子紅細(xì)胞計(jì)數(shù)的頻數(shù)表(X10"/L)

組段(1)頻數(shù)(2)頻率(%)(3)累計(jì)頻數(shù)(4)累計(jì)頻率(%)(5)

3.20?21.721.7

3.50?54.275.9

3.80?108.31714.2

4.10-1915.83630.0

4.40?2319.25949.2

4.70?2420.08369.2

5.00?2117.510486.7

5.30?119.211595.9

5.60?43.311999.2

5.90-6.2010.8120100.0

合計(jì)120100.0一一

頻數(shù)分布以均數(shù)為中心,向兩側(cè)逐漸減少,并且基本對(duì)稱

長(zhǎng)方影的面積等于頻軍

所有長(zhǎng)方形面積之和等于I或100%

利用正態(tài)分布曲線特點(diǎn)來描述正態(tài)分布的特征

紅細(xì)胞計(jì)數(shù)

(一)正態(tài)分布的概念和特征

1.概念

如果隨機(jī)變量X的分布服從概率密度函數(shù)

,一(X-,,

f(X)=——-^=e2<jl,-co<X<+co

則稱》服從正態(tài)分布,記作月~秋片小),內(nèi)為X的總體均數(shù),CT為總體標(biāo)準(zhǔn)差。

2.正態(tài)分布的特征

(1)在直角坐標(biāo)的橫軸上方呈鐘形曲線,兩端與*軸永不相交,且以刈為對(duì)稱軸,左右完全

對(duì)稱。

(2)在x=〃處,/(㈤取最大值,其值為"""1西,并且X越遠(yuǎn)離〃,*X)值越小。

(3)正態(tài)分布有兩個(gè)參數(shù):一個(gè)為位置參數(shù)〃,一個(gè)為形態(tài)參數(shù)b。

BI定。,改變〃固定〃,改變。

3、正態(tài)分布曲線下的面積分布規(guī)律

t6827%

("+L96cr,"+2.58o)->?

(二)標(biāo)準(zhǔn)正態(tài)分布

正態(tài)分布是一個(gè)分布簇,對(duì)應(yīng)不同的參數(shù)〃和b會(huì)產(chǎn)生不同位置、不同形狀的正態(tài)分布,為了應(yīng)用方

便我們將正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。

■*一〃

U---------

<T

X~N(u,(r2)------------u-N(Q,Y)

標(biāo)題變換

(耳.?2)

由于我們實(shí)際面對(duì)的大多是正態(tài)分布,因此可采用如下的方法求其曲線下面積:

正態(tài)分布一?標(biāo)準(zhǔn)正態(tài)分布一?查表求面積

美元——?人民幣——?商品

正態(tài)分布的應(yīng)用

例:調(diào)查某單位101名正常成年女子的血清總膽固醇,得其均數(shù)刀=4.06mm。"Z,標(biāo)準(zhǔn)差

S=0.654mmolfLo試估計(jì)該單位正常女子血清總膽固醇在4.00mmol/L以下者及5.00mmol/L以下者各占

正常女子總?cè)藬?shù)的百分比。

應(yīng)一〃-X4.00-4.06

CJ=S=0.654

4—〃Xj—X5.00—4.06

crS0.654

五、參考值范圍

(一)基本概念

1.定義

醫(yī)學(xué)參考值(medicalreferencevalue):是指包括絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等

各種生理及生化指標(biāo)常數(shù),也稱正常值。

2.一點(diǎn)說明

由于個(gè)體間存在差異,醫(yī)學(xué)參考值并非常數(shù),而是在一定范圍內(nèi)波動(dòng),因此采用醫(yī)學(xué)參考值范圍

(referenceranges)作為判定正常和異常的參考標(biāo)準(zhǔn)。

(二)制定參考值范圍的步驟

1.從正常人總體中抽樣

2.控制測(cè)量誤差

3.判定是否需要分組確定參考值范圍

4.決定取單側(cè)還是雙側(cè)

5.選定合適的百分界限

6.根據(jù)資料的分布類型選定適當(dāng)?shù)姆椒ㄟM(jìn)行參考值范圍的估計(jì)

1.從正常人總體中抽樣:

注意以下幾點(diǎn):

⑴正確理解正常人的含義

正常人:不是一點(diǎn)小病都沒有的人,而是排除了對(duì)研究指標(biāo)有影響的疾病或因素的人。

例如:研究某市成人血鉛的參考值范圍,是以留住該市一年以上、無(wú)明顯肝腎疾病、無(wú)鉛作業(yè)或接觸

史的成人作為被研究的正常人總體。

⑵抽樣應(yīng)遵循隨機(jī)化的原則

保證總體中每一個(gè)個(gè)體都有相同的機(jī)會(huì)被抽中

⑶抽取的樣本含量應(yīng)足夠大

原因:參考值范圍是根據(jù)樣本數(shù)據(jù)估計(jì)的。

只有樣本含量足夠大時(shí),樣本分布才越接近總體分布,

所得結(jié)果才能比較真實(shí)的反映總體的情況。

樣本含量的要求:一般nNlOO

2.控制測(cè)量誤差

統(tǒng)一測(cè)量的方法、儀器、試劑、精密度、操作熟練程度,以便將測(cè)量的誤差控制在一定的范圍內(nèi)。

3.判斷是否需要分組測(cè)定參考值范圍

例:欲制定正常人肺活量的參考值范圍,經(jīng)研究發(fā)現(xiàn)該指標(biāo)在男女間有明顯的差別,且差別具有實(shí)際

意義,因此肺活量的參考值范圍應(yīng)按照不同的性別分別制定。

4.確定取單側(cè)還是雙側(cè)

依據(jù):實(shí)際用途和專業(yè)知識(shí)

例:

指標(biāo)異常情況單、雙側(cè)上、下限

紅細(xì)胞過高與過低雙側(cè)上限和下限

尿鉛過高單側(cè)上限

肺活量過低單側(cè)下限

5.選擇合適的百分界限

參考值范圍是指絕大多數(shù)正常人的測(cè)定值應(yīng)該所在的范圍。

“絕大多數(shù)”:習(xí)慣上指80%、90樂95%或99%。

上跟值

以單側(cè)上限為例

目的:

(1)減少假陽(yáng)性(確診病人)一減少把正常人診斷為病人的可能性。較大的百分界限

(2)減少假陰性(病人初篩)一減少把病人診斷為正常人的可能性。較小的百分界限

實(shí)際中最好結(jié)合正常人和病人的數(shù)據(jù)分布特點(diǎn),權(quán)衡假陽(yáng)性和假陰性的比例,選擇一個(gè)適當(dāng)?shù)陌俜纸?/p>

限。

6.根據(jù)資料的分布類型選定適當(dāng)?shù)姆椒ㄟM(jìn)行參考值范圍的估計(jì)

不同分布類型下的95%參考值范圍估計(jì)方法

公式

分布類型估計(jì)方法

雙側(cè)單側(cè)上限單側(cè)下限

正態(tài)分布正態(tài)分布法了±1.96SN+l.64sX-1.64S

偏態(tài)分布百分位數(shù)法&和35%A

正態(tài)分布法

例:已知正常成年女子血清總膽固醇均數(shù)?=S=0.654加加。//£,試估計(jì)正常成年女子

血清總膽固醇的95%參考值范圍(雙側(cè))。

計(jì)算:下限:2-1.96^=4.06-1.96x0.654=2.73(mmol(L)

上限:2+1.96^=4.06+1.96x0.654=534(^0//Z)

所以正常成年女子血清總膽固醇的95%參考值范圍為(2.78mmol/L-5.34mmol/L)

百分位數(shù)法

例:測(cè)得某年某地282名正常人的尿汞值如下表,試制定正常人尿汞值的95%參考值范圍。

某年某地282名正常人尿汞值測(cè)量結(jié)果

尿汞值頻數(shù)r累計(jì)頻數(shù)累計(jì)頻率(%)

0?454516.0

8.0?6410938.6

16.0?9620572.7

24.0?3824386.2

32.0?2026393.3

40.0?1127497.2

48.0?527998.9

56.0?228199.6

64.0—72.01282100.0

由頻數(shù)分布表可知尿汞值呈偏態(tài)分布,且尿汞值僅以過高為異常(單側(cè)),所以采用百分位數(shù)法計(jì)算

上側(cè)界值即求第95百分位數(shù)P95o

Px=L+—(wxx%-2%)

公式:力

gn

/i=40.0+—(282x95%-263)=43.6(^/Z)

所以該地正常人的尿汞值的95%醫(yī)學(xué)參考值范圍為〈4363〃)

【例題】下列關(guān)于正態(tài)分布描述錯(cuò)誤的是

A.是醫(yī)學(xué)和生物學(xué)中常見的一種連續(xù)型分布

B.正態(tài)分布曲線的對(duì)稱軸是x=P這條直線

C.正態(tài)分布曲線有兩個(gè)參數(shù),口為形態(tài)參數(shù),。為位置參數(shù)

D.正態(tài)分布曲線是一簇曲線

E.正態(tài)分布曲線下的總面積為1

【答案】C

【例題】在正態(tài)曲線下,區(qū)間("+L9654+2.58H所包含的面積為

A.1%

B.1.5%

C.97%

D.2%

E.95%

【答案】D

【例題】下列關(guān)于標(biāo)準(zhǔn)正態(tài)分布的說法中錯(cuò)誤的是

A.標(biāo)準(zhǔn)正態(tài)分布曲線下總面積為1

B.標(biāo)準(zhǔn)正態(tài)分布是總體均數(shù)為0,總體標(biāo)準(zhǔn)差為1的正態(tài)分布

C.標(biāo)準(zhǔn)正態(tài)分布的曲線是一簇曲線

D.標(biāo)準(zhǔn)正態(tài)分布是對(duì)稱分布

E.不同的正態(tài)分布都可以通過變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布

【答案】C

第三節(jié)總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)

計(jì)量資料

「點(diǎn)值估計(jì)

-區(qū)間估計(jì)

總體均數(shù)的參數(shù)估計(jì)

一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤

二、t分布

三、總體均數(shù)的估計(jì)

假設(shè)檢驗(yàn)

四、假設(shè)檢驗(yàn)的原理和步驟

五、t檢驗(yàn)

六、假設(shè)檢驗(yàn)的兩型錯(cuò)誤

一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤

例若某市1999年18歲男生身高服從均數(shù)口、標(biāo)準(zhǔn)差。的正態(tài)分布。從該正態(tài)分布167.7,5.32)

總體中隨機(jī)抽樣,共抽了100次,每次樣本含量n」=10人,得到每個(gè)樣本均數(shù)及標(biāo)準(zhǔn)差如下圖

1999年某市18歲男生身高”(167.7,5.32)的抽樣示意

抽樣示意圖顯示:

1.樣本均數(shù)與總體均數(shù)之間不一定恰好相等。

2.樣本均數(shù)之間也不一定恰好相等。

思考:樣本均數(shù)與總體均數(shù)以及樣本均數(shù)之間的差異是有什么原因造成的?個(gè)體變異

均數(shù)的抽樣誤差:由個(gè)體變異引起,由抽樣產(chǎn)生的樣本均數(shù)與總體均數(shù)之間以及樣本均數(shù)與樣本均數(shù)

之間的差異。

由于個(gè)體變異是客觀存在的,因此抽樣誤差(均數(shù))是不可避免的,但是有一定的規(guī)律可循,可以用

特定的指標(biāo)描述抽樣誤差的大小

N(167.7,5.32)總體中100個(gè)隨機(jī)樣本的均數(shù)與標(biāo)準(zhǔn)差

樣本號(hào)X,.

JJ

1167.412.74

2165.566.57

3168.205.36

100165.695.09

我們把樣本均數(shù)N(戶1、2、3、…、100)看作是一個(gè)新的變量,那么這100個(gè)變量值構(gòu)成一個(gè)新的

平均身高

樣本均數(shù)的分布特征:圍繞著總體均數(shù)(167.7cm),中間多,兩邊少,左右基本對(duì)稱,也服從正態(tài)分

從上面的實(shí)例可以看出(以下兩個(gè)結(jié)論可通過中心極限定理證明):

從正態(tài)總體中隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)刀同樣也服從正態(tài)分布;即使是從偏態(tài)總體中抽樣,

當(dāng)n足夠大時(shí)(比如n>50),樣本均數(shù)X也近似服從正態(tài)分布。

從均數(shù)為刀,標(biāo)準(zhǔn)差為b的正態(tài)總體中抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)也為",樣本均

數(shù)的標(biāo)準(zhǔn)差為?

其中為了與反映觀察值離散程度的標(biāo)準(zhǔn)差?相區(qū)別,統(tǒng)計(jì)學(xué)中把樣本均數(shù)的標(biāo)準(zhǔn)差稱為樣本均數(shù)

的標(biāo)準(zhǔn)誤,簡(jiǎn)稱為標(biāo)準(zhǔn)誤(standarderror)。

均數(shù)標(biāo)準(zhǔn)誤的含義:均數(shù)標(biāo)準(zhǔn)誤就是均數(shù)的標(biāo)準(zhǔn)差,因此它反映的是樣本均數(shù)間的離散程度,也反映

樣本均數(shù)與相應(yīng)總體均數(shù)間的差異,因而它說明了均數(shù)抽樣誤差的大小,也就是說標(biāo)準(zhǔn)誤越大,抽樣誤差

也就越大,樣本均數(shù)的離散程度高,與總體均數(shù)的差異程度越大一一標(biāo)準(zhǔn)誤是描述均數(shù)的抽樣誤差大小的

統(tǒng)計(jì)指標(biāo)。

抽樣誤差標(biāo)準(zhǔn)誤

又手K又手K

X^XX^X

可證明均數(shù)標(biāo)準(zhǔn)誤的計(jì)算公式為

(JS

0x=TS^=~T

理論值計(jì)算公式估計(jì)值計(jì)算公式

標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比,與樣本含量的平方根成反比。

均數(shù)標(biāo)準(zhǔn)誤的用途

1.可用來衡量樣本均數(shù)的可靠性

標(biāo)準(zhǔn)誤一抽樣誤差一均數(shù)間的差異(樣本和總體)一樣本均數(shù)估計(jì)總體均數(shù)

小小小可靠

2.與樣本均數(shù)結(jié)合,可用于估計(jì)總體均數(shù)的置信區(qū)間

3.可用于進(jìn)行均數(shù)的假設(shè)檢驗(yàn)

二、t分布

Lt分布的概念

正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布

X~標(biāo)準(zhǔn)正一變換"~耿°」)

3~'3,C)標(biāo)準(zhǔn)正,變換”~秋°,D

SR

實(shí)際工作中,由于。未知,用?代替,這樣U不再服從標(biāo)準(zhǔn)正態(tài)分布,而服從方分布,即

XX=X仁,?=%一1"為自由度(degreeoffreedom)

$£S/5

統(tǒng)計(jì)量力的分布稱為t分布。力分布與自由度有關(guān),不同的自由度對(duì)應(yīng)著不同的力分布曲線。

2.t分布的圖形與特征

t分布的圖形:t分布是一簇曲線,自由度不同,曲線的形狀不同,t分布的圖形與自由度有關(guān)。當(dāng)

V—8,6分布趨近于標(biāo)準(zhǔn)正態(tài)分布,但當(dāng)自由度較小時(shí),2分布與標(biāo)準(zhǔn)正態(tài)分布的差異較大。其圖形

如下圖

不同自由度下的t分布圖

t分布特征:

⑴單峰分布,以0為中心,左右對(duì)稱

⑵自由度V越小,峰部越矮,而尾翹得越高

⑶當(dāng)vT8,1逼近分布逼近U分布(標(biāo)準(zhǔn)正態(tài)分布),將標(biāo)準(zhǔn)正態(tài)分布看做t分布的特例。

t界值表簡(jiǎn)介:

橫標(biāo)目為自由度,縱標(biāo)目為概率P,表中數(shù)字表示自由度為P為&(單側(cè)或雙側(cè)概率)時(shí),t的界

值,單側(cè)常記為%v,雙側(cè)常記為蜀

由于t分布是以0為中心的對(duì)稱分布,表中只列出正值,查表示不管t正負(fù)都用絕對(duì)值。

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

11.0003.0786.31412.70631.82163.657127.321318.309636.619

20.8161.8862.9204.3036.9659.92514.08922.32731.599

30.7651.6382.3533.1824.5415.8417.45310.21512.924

40.7411.5332.1322.7763.7474.6045.5987.1738.610

50.7271.4762.0152.5713.3654.0324.7735.8936.869

60.7181.4401.9432.4473.1433.7074.3175.2085.959

70.7111.4151.8952.3652.9983.4994.0294.7855.408

80.7061.3971.8602.3062.8963.3553.8334.5015.041

90.7031.3831.8332.2622.8213.2503.6904.2974.781

概率

自由度單尾0.250.10.050.0250.010.0050.00250.0010.0005

雙尾0.50.20.10.050.020.010.0050.0020.001

100.7001.3721.8122.2282.7643.1693.5814.1444.587

110.6971.3631.7962.2012.7183.1063.4974.0254.437

120.6951.3561.7822.1792.6813.0553.4283.9304.318

130.6941.3501.7712.1602.6503.0123.3723.8524.221

140.6921.3451.7612.1452.6242.9773.3263.7874.140

150.6911.3411.7532.1312.6022.9473.2863.7334.073

160.6901.3371.7462.1202.5832.9213.2523.6864.015

170.6891.333

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論