醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)復(fù)習(xí)提綱_第5頁(yè)
已閱讀5頁(yè),還剩74頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的含義

1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)定義

醫(yī)學(xué)統(tǒng)計(jì)學(xué)(statistics)作為一門(mén)學(xué)科的定義是:關(guān)于醫(yī)學(xué)數(shù)據(jù)收集、表達(dá)和分析

的普遍原理和方法。

2、醫(yī)學(xué)統(tǒng)計(jì)學(xué)研究方法:通過(guò)大量重復(fù)觀察,發(fā)現(xiàn)不確定的醫(yī)學(xué)現(xiàn)象背后隱藏的統(tǒng)計(jì)學(xué)

規(guī)律。

3、醫(yī)學(xué)統(tǒng)計(jì)推論的基礎(chǔ):在一定條件下,不確定的醫(yī)學(xué)現(xiàn)象發(fā)生可能性,即概率。

第二節(jié)、統(tǒng)計(jì)學(xué)的幾個(gè)重要概念

一.資料的類(lèi)型

1、計(jì)量資料(數(shù)值變量):對(duì)每一觀察對(duì)象用定量的方法,測(cè)定某項(xiàng)指標(biāo)所得的資料。一

般有度量衡單位,每個(gè)對(duì)象之間有量的區(qū)別。

2、計(jì)數(shù)資料-(分類(lèi)變量):對(duì)觀察對(duì)象按屬性或類(lèi)型分組計(jì)數(shù)所得的資料。每個(gè)對(duì)象之間沒(méi)

有量的差異,只有質(zhì)的不同。

3、等級(jí)資料(有序分類(lèi)變量):對(duì)觀察對(duì)象按屬性或類(lèi)型分組計(jì)數(shù),但各屬性或類(lèi)型之間

又有程度的差別。

注意:不同類(lèi)型的資料采用的統(tǒng)計(jì)分析方法不同;三類(lèi)資料類(lèi)型可以相互轉(zhuǎn)化。

二、總體

根據(jù)研究目的所確定的同質(zhì)的所有觀察對(duì)象某項(xiàng)變量值的集合

—1、有限總體:只包括在確定時(shí)間、空間范圍內(nèi)的有限個(gè)觀察對(duì)象。

2、無(wú)限總體:沒(méi)有時(shí)間、空間范圍的限制,觀察對(duì)象的數(shù)量是不確定的,無(wú)限的

三、樣本

從總體中隨機(jī)抽取部分觀察對(duì)象,其某項(xiàng)變量值的集合。

從總體中隨機(jī)抽取樣本的目的是:用樣本信息來(lái)推斷總體特征。

四、隨機(jī)事件

可以發(fā)生也可以不發(fā)生,可以這樣發(fā)生也可以那樣發(fā)生的事件。亦稱(chēng)偶然事件。

五、概率

描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,記作P,其取值范圍0WPW1,一般用小數(shù)表示。

P=o,事件不可能發(fā)生必然事件(隨機(jī)事件的特例);P=l,事件必然發(fā)生;P-0,事件發(fā)

生的可能性愈??;P-1,事件發(fā)生的可能性愈大

六、小概率事件

習(xí)慣上將PW0.05或PW0.01的隨機(jī)事件稱(chēng)小概率事件。表示某事件發(fā)生的可能性很小。

七、參數(shù)和統(tǒng)計(jì)量

參數(shù):總體指標(biāo),如總體均數(shù)、總體率,一般用希臘字母表示

統(tǒng)計(jì)量:樣本指標(biāo),如樣本均數(shù)、樣本率,一般用拉丁字母表示

八、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的方法

1、重點(diǎn)掌握“四基”:基本知識(shí)、基本概念、基本原理和基本方法;

2、重視統(tǒng)計(jì)方法在實(shí)際中應(yīng)用,重視實(shí)習(xí)和綜合訓(xùn)練;注意學(xué)習(xí)每種統(tǒng)計(jì)方法的應(yīng)用范圍、

應(yīng)用條件,大多數(shù)公式只要求了解其意義和使用方法,不用記憶和探究數(shù)理推導(dǎo)。

第三節(jié)統(tǒng)計(jì)工作的基本步驟

統(tǒng)計(jì)設(shè)計(jì)收集資料整理資料分析資料

一、統(tǒng)計(jì)設(shè)計(jì)

1、調(diào)查設(shè)計(jì)

2、實(shí)驗(yàn)設(shè)計(jì)

(詳見(jiàn)第十三章)

二、收集資料

資料來(lái)源

(1)統(tǒng)計(jì)報(bào)表

(2)日常醫(yī)療工作原始記錄和報(bào)告卡

(3)專(zhuān)題調(diào)查

三、整理資料

1.目的將收集的原始資料系統(tǒng)化、條理化,便于進(jìn)一步計(jì)算和分析

2.整理分組方式

(1)性質(zhì)分組

(2)數(shù)量分組

三、分析資料

1、統(tǒng)計(jì)描述

2、統(tǒng)計(jì)推斷

第四節(jié)統(tǒng)計(jì)圖表

一、統(tǒng)計(jì)表

1、統(tǒng)計(jì)表的作用

代替冗長(zhǎng)的文字?jǐn)⑹?,便于?jì)算、分析和對(duì)比。

2、統(tǒng)計(jì)表的結(jié)構(gòu)

1)標(biāo)題

2)標(biāo)目橫標(biāo)目(主語(yǔ)):說(shuō)明表各橫行數(shù)字的涵義,通常列在表的左側(cè)

縱標(biāo)目(謂語(yǔ)):說(shuō)明表各縱欄數(shù)字的涵義

主語(yǔ)和謂語(yǔ)連貫起來(lái)能讀成一句完整而通順的話

3、統(tǒng)計(jì)表的種類(lèi):

1)簡(jiǎn)單表:只按單一變量分組

2)組合表:按兩個(gè)或兩個(gè)以上變量分組

某地1980年男、女HBsAg陽(yáng)性率

性別調(diào)查數(shù)陽(yáng)性數(shù)陽(yáng)性率(%)

男42343037.16

女45301814.00

合計(jì)87644845.52

4、列表原則:重點(diǎn)突出,簡(jiǎn)單明了;主謂分明,層次分明

5、統(tǒng)計(jì)表的基本要求:

1)標(biāo)題:概括地說(shuō)明表的內(nèi)容,必要時(shí)注明資料的時(shí)間和地點(diǎn),寫(xiě)在表上方。常見(jiàn)的缺

點(diǎn):過(guò)于簡(jiǎn)略,甚至不寫(xiě)標(biāo)題;或過(guò)于繁瑣;或標(biāo)題不確切。

2)標(biāo)目:文字簡(jiǎn)明扼要,有單位的標(biāo)目要注明單位。常見(jiàn)的缺點(diǎn):標(biāo)目過(guò)多,層次不清

3)線條:不宜過(guò)多,除上面的頂線,下面的底線,縱標(biāo)目與合計(jì)之間的橫線外,其余線

條一般均省去。表的左上角不宜有斜線。

4)數(shù)字:

A、數(shù)字一律用阿拉伯?dāng)?shù)字表示

B、同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次對(duì)齊

C、表內(nèi)不宜留空格,暫缺或未記錄,用“…”表示,無(wú)數(shù)字,用“一”表示,數(shù)字為0,

填寫(xiě)0

D、絕對(duì)數(shù)太小而無(wú)法計(jì)算指標(biāo),則用“…”代替。

5)備注:般不列入表內(nèi),必要時(shí)可用“*”號(hào)標(biāo)出,寫(xiě)在表的下面。

二、統(tǒng)計(jì)圖

1、統(tǒng)計(jì)圖作用:

通過(guò)點(diǎn)、線、面等形式表達(dá)統(tǒng)計(jì)資料,直觀地反映事物之間的數(shù)量關(guān)系。但需注意,由于統(tǒng)計(jì)

圖對(duì)數(shù)量的表達(dá)較粗糙,不便于作深入細(xì)致的分析,?般需附相應(yīng)的統(tǒng)計(jì)表。

2、常見(jiàn)統(tǒng)計(jì)圖種類(lèi):

條圖、百分條圖,圓圖,線圖,半對(duì)數(shù)線圖,直方圖,散點(diǎn)圖

3、制圖的基本要求:

1)按資料的性質(zhì)和分析目的,選用適合的圖形

2)要有標(biāo)題,扼要說(shuō)明資料的內(nèi)容,必要時(shí)注明時(shí)間、地點(diǎn),一般寫(xiě)在圖的下面。

3)橫軸尺度從左到右,縱軸尺度從下而上,數(shù)量一律由小到大。橫軸與縱軸坐標(biāo)長(zhǎng)度比例一

般為5:7

4)比較不同事物,用不同線條或顏色表示,并附上圖例說(shuō)明。

4、常見(jiàn)統(tǒng)計(jì)圖適用范圍及其繪制要點(diǎn)

1)條圖:

(1)適用范圍:相互獨(dú)立的資料,常用形式:?jiǎn)问胶蛷?fù)式

(2)繪制要點(diǎn):

A.用等寬的直條的長(zhǎng)短反映各指標(biāo)的數(shù)量大小。

B.縱軸的尺度必須從0開(kāi)始。

C.各直條之間的間隙應(yīng)相等,?般將比較的指標(biāo)按大小順序排列。

2)百分條圖:

(1)適用范圍:構(gòu)成比資料

(2)繪制要點(diǎn):

A.將長(zhǎng)條全長(zhǎng)為100%,

B.將各百分構(gòu)成比在長(zhǎng)條上分割若干段,

C.各段按大小順序排列。

3)圓圖

(1)適用范圍:構(gòu)成比資料

(2)繪制要點(diǎn):

A.將圓面積為100%,

B.將各百分構(gòu)成比乘以3.6度,變?yōu)閳A心角度數(shù),

C.在圓上繪出各扇型面積

D.各扇型面積按大小順序排列。

4)普通線圖

(1)適用范圍:連續(xù)性資料

(2)繪制要點(diǎn):

A.縱橫軸均用算術(shù)尺度,

B.縱橫軸尺度比一般為5:7

C.相鄰兩點(diǎn)用直線連接。

(3)意義:反映事物的變化趨勢(shì)。

5)半對(duì)數(shù)線圖

(1)適用范圍:連續(xù)性資料

(2)繪制要點(diǎn):

A.橫軸用算術(shù)尺度,縱軸用對(duì)數(shù)尺度,

B.縱橫軸尺度比一般為5:7

C.相鄰兩點(diǎn)用直線連接。

(3)意義:反映事物的變化速度。

6)直方圖

(1)適用范圍:計(jì)量的頻數(shù)表資料

(2)繪制要點(diǎn):

A.橫軸表示被觀察事物,縱軸表示頻數(shù)或頻率,

B.用等寬的矩形面積表示各組段的頻數(shù)或頻率

7)散點(diǎn)圖:

(1)適用范圍:雙變量資料

(2)分析目的:用點(diǎn)的密度程度和趨勢(shì)表示兩變量間的相關(guān)關(guān)系

第一講緒論

一、《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》的理論基礎(chǔ)和研究對(duì)象:

a)問(wèn)題的提出:

在人們的實(shí)踐活動(dòng)中,常常會(huì)遇到類(lèi)似下面的一些問(wèn)題:

一種新的疫苗,如何判斷它是否有效?

吸煙會(huì)不會(huì)使得肺癌的機(jī)會(huì)增加?

如何抽檢兒百或兒千人來(lái)估計(jì)某種病的流行程度?

某批產(chǎn)品中合格品究竟有多少?該不該報(bào)廢?

如何消耗最少的資源和人力來(lái)得到我們所需要的某種信息?

某種實(shí)驗(yàn)方法(或飼料配方)有沒(méi)有明顯改進(jìn)?

患者分組是否具有可比性?

所觀察對(duì)象的數(shù)量是否足夠說(shuō)明其結(jié)論?

試驗(yàn)結(jié)果的誤差有多大?

研究結(jié)果是否適用于觀察樣本以外的同類(lèi)對(duì)象?……等等.

其共同特點(diǎn):只知道事情的不完全信息,或者是單個(gè)實(shí)驗(yàn)的結(jié)

果有某種不確定性。

例如:為了知道產(chǎn)品合格與否或它的使用壽命,我們常常需要

對(duì)它作破壞性檢驗(yàn),此時(shí)顯然不能把所有的產(chǎn)品都檢驗(yàn)一下,而只能

滿(mǎn)足于對(duì)少數(shù)兒個(gè)作品的抽檢,這樣獲得的信息顯然是不完全的;

要檢驗(yàn)疫苗的有效性,就一般來(lái)說(shuō),接種過(guò)疫苗的動(dòng)物也不一定

全不發(fā)病,而未接種的也不會(huì)全發(fā)病.那么發(fā)病與不發(fā)病的差別究竟

到多大時(shí)我們才能認(rèn)為接種是有效的呢?

這些均涉及了我們?nèi)绾卧u(píng)價(jià)一些并不確定的實(shí)驗(yàn)結(jié)果的問(wèn)題。要

從這類(lèi)問(wèn)題中得出科學(xué)的、可靠的結(jié)論,就必須依靠統(tǒng)計(jì)學(xué).有人干

脆給統(tǒng)計(jì)學(xué)下了這樣的定義:“統(tǒng)計(jì)學(xué)就是從不完全的信息里取得準(zhǔn)

確知識(shí)的一系列技巧”。

另外,當(dāng)必須根據(jù)有限的、完全的信息作出決策時(shí)(例如決定一

批產(chǎn)品是出廠還是報(bào)廢,某種新藥是否有效等等),統(tǒng)計(jì)學(xué)可以提供

一種方法,使我們不僅能做出合理的決策,而且知道所冒風(fēng)險(xiǎn)的大小,

并幫助我們把可能的損失減至最小。

其次,如何花費(fèi)最小代價(jià)取得所關(guān)心的信息,也是統(tǒng)計(jì)學(xué)的一大

課題(實(shí)險(xiǎn)設(shè)計(jì)).不注意這一點(diǎn)可能使辛辛苦苦的工作全成為一種

浪費(fèi).

2.理論基礎(chǔ):“根據(jù)數(shù)理統(tǒng)計(jì)的原理、方法緊密結(jié)合醫(yī)學(xué)實(shí)踐,

研究醫(yī)藥衛(wèi)生領(lǐng)域中的資料收集、整理、分析和推斷的一門(mén)應(yīng)用學(xué)科,

來(lái)分析和解釋生物界各種現(xiàn)象和實(shí)驗(yàn)調(diào)查資料的科學(xué)”。隨著生物醫(yī)

學(xué)研究的不斷發(fā)展,運(yùn)用統(tǒng)計(jì)學(xué)方法來(lái)認(rèn)識(shí)、推斷和解釋生命過(guò)程中

的各種現(xiàn)象也越來(lái)越廣泛。運(yùn)用統(tǒng)計(jì)學(xué)方法可以幫助人們分析占有信

息,達(dá)到去偽存真,去粗取精,正確認(rèn)識(shí)世界的目的。

3.研究對(duì)象:人體及與人體健康有關(guān)的各種具有不確定性的

醫(yī)學(xué)數(shù)據(jù)(變異、數(shù)量、同質(zhì))。

二、《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》的主要任務(wù)和作用:

任務(wù):1、結(jié)合專(zhuān)業(yè)知識(shí)和具體研究的要求進(jìn)行統(tǒng)計(jì)設(shè)計(jì)

2、對(duì)收集資料進(jìn)行整理、做統(tǒng)計(jì)描述

3、對(duì)資料進(jìn)行統(tǒng)計(jì)分析和解釋

作用:1、保證調(diào)查或試驗(yàn)設(shè)計(jì)的科學(xué)性、完整性

2、指標(biāo)的確定應(yīng)具有特異性、客觀性,靈敏性和精密度高

3、樣本含量足夠大,數(shù)據(jù)真實(shí)可靠

4、選用統(tǒng)計(jì)分析方法正確

三、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容:

1、統(tǒng)計(jì)設(shè)計(jì)(design)

在進(jìn)行統(tǒng)計(jì)工作和研究之前必須有一個(gè)周密的設(shè)計(jì),設(shè)計(jì)的內(nèi)容

包括資料收集、整理和分析全過(guò)程總的設(shè)想和安排。

統(tǒng)計(jì)設(shè)計(jì)可按照在研究過(guò)程中對(duì)研究對(duì)象是否進(jìn)行干預(yù)分作調(diào)

查研究設(shè)計(jì)和實(shí)驗(yàn)研究設(shè)計(jì)。

調(diào)查研究設(shè)計(jì):研究者旨在客觀地描述研究總體,未加任何干預(yù)

措施,如:調(diào)查了解某地的學(xué)齡兒童缺鐵性貧血的患病率,某地新生

兒畸形的發(fā)生率,北京地區(qū)潰瘍病患病率等,其目的在于了解某一醫(yī)

學(xué)現(xiàn)象的實(shí)際情況,疾病的危害程度,以便為防治和研究這些疾病提

供依據(jù)。調(diào)查設(shè)計(jì)主要有抽樣方法、調(diào)查技術(shù)、質(zhì)量控制技術(shù)等。

實(shí)驗(yàn)研究設(shè)計(jì):研究者根據(jù)目的(研究假設(shè)),主動(dòng)加以干預(yù)措

施,并觀察總結(jié)其結(jié)果,回答研究假設(shè)所提出的問(wèn)題。

如:研究脂健乳是否有降脂作用,首先如一脂健乳可以降低血

脂,再將條件相似的20只大鼠先用高脂飼料喂養(yǎng)做成高脂血癥的模

型,然后將動(dòng)物隨機(jī)分為實(shí)驗(yàn)組和對(duì)照組,實(shí)驗(yàn)組服用脂健乳和豆奶,

對(duì)照組單純服用豆奶,喂養(yǎng)一個(gè)月后觀察比較兩組之間各項(xiàng)血脂指標(biāo)

的差別有無(wú)統(tǒng)計(jì)學(xué)意義,進(jìn)而得出脂健乳是否具有降低血脂的保健作

用的結(jié)論。

實(shí)驗(yàn)設(shè)計(jì)主要有各種實(shí)驗(yàn)設(shè)計(jì)模型、分組方法、樣本量估計(jì)等。

由于統(tǒng)計(jì)設(shè)計(jì)的質(zhì)量直接影響著試驗(yàn)結(jié)果的準(zhǔn)確性、可靠性、嚴(yán)

密性和代表性,一旦出現(xiàn)設(shè)計(jì)上的失誤或缺陷,可能導(dǎo)致整個(gè)研究的

失敗。因此,專(zhuān)業(yè)設(shè)計(jì)是研究者對(duì)專(zhuān)業(yè)知識(shí)的把握能力,直接影響著

實(shí)驗(yàn)的深度和水平,而統(tǒng)計(jì)設(shè)計(jì)是研究者對(duì)醫(yī)學(xué)統(tǒng)計(jì)知識(shí)的正確運(yùn)

用,以保證統(tǒng)計(jì)描述和推斷正確的基礎(chǔ)。

調(diào)查設(shè)計(jì)與實(shí)驗(yàn)研究設(shè)計(jì)

專(zhuān)業(yè)設(shè)計(jì)統(tǒng)計(jì)設(shè)計(jì)

運(yùn)用專(zhuān)業(yè)知識(shí)進(jìn)行設(shè)計(jì)運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)進(jìn)行設(shè)計(jì)

要求

選題、調(diào)查(實(shí)驗(yàn))、方法、材料確定設(shè)計(jì)方案、收集整理資料、確定

統(tǒng)計(jì)指標(biāo)、分析和推斷方法

向家

探討實(shí)驗(yàn)、觀察結(jié)果的適用性和創(chuàng)探討實(shí)驗(yàn)、觀察結(jié)果的可重復(fù)性、高

造性效性

方向

回答和解決科研課題,驗(yàn)證假說(shuō),減少和控制誤差。保證樣本的代表性

保證科研結(jié)果的先進(jìn)性和可靠性,保證實(shí)驗(yàn)結(jié)果的精確性和

目的

可重復(fù)性

2、收集資料(collectionofdata)

方式:1、統(tǒng)計(jì)報(bào)表2、經(jīng)常性工作記錄3、專(zhuān)題調(diào)查或?qū)嶒?yàn)

3、整理資料(sortingdata)

將原始數(shù)據(jù)進(jìn)行核對(duì)一、整理,使其系統(tǒng)化、條理化,對(duì)數(shù)據(jù)進(jìn)行

邏輯檢查,糾正錯(cuò)誤,提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定數(shù)

據(jù)的數(shù)量特征。

4、分析資料(analysisofdata)

根據(jù)不同的資料類(lèi)型,選擇不同的統(tǒng)計(jì)處理方法,計(jì)算有關(guān)指標(biāo),

反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。

統(tǒng)計(jì)分析包括:

①統(tǒng)計(jì)描述(descriptivestatistics):用統(tǒng)計(jì)指標(biāo)、

統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行測(cè)定

和描述。

②統(tǒng)計(jì)推斷(inferentialstatistics):包括如何抽樣,

以及如何在隨機(jī)變量的樣本值基礎(chǔ)上推斷概率分布和總體值。統(tǒng)

計(jì)推斷中涉及的各種統(tǒng)計(jì)分析方法是本次授課的重點(diǎn)內(nèi)容。

四、醫(yī)學(xué)統(tǒng)計(jì)學(xué)在科研中的作用:

1、系統(tǒng)積臬和表達(dá)經(jīng)驗(yàn)

臨床經(jīng)驗(yàn)的積累在于大量的臨床實(shí)踐。實(shí)際上這些經(jīng)驗(yàn)都可以整

理和表達(dá)為統(tǒng)計(jì)信息,掌握了一定的統(tǒng)計(jì)學(xué)知識(shí),就可以將積累的經(jīng)

驗(yàn),通過(guò)對(duì)資料的收集、整理和分析,轉(zhuǎn)變?yōu)檎?guī)和系統(tǒng)的統(tǒng)計(jì)信息,

用以報(bào)告或發(fā)表,使人類(lèi)醫(yī)學(xué)知識(shí)寶庫(kù)不斷充實(shí)和發(fā)展。

2、完成科研工作

生物學(xué)是一門(mén)實(shí)驗(yàn)科學(xué),不管你從事的是生物學(xué)的哪一個(gè)分支,

都不可能完全脫離實(shí)驗(yàn),只進(jìn)行邏輯推理.而實(shí)驗(yàn)所得到的結(jié)果兒乎

無(wú)例外地都帶有或多或少的不確定性,即實(shí)驗(yàn)誤差.在這種情況下,

不用統(tǒng)計(jì)學(xué)要想得到正確的結(jié)論是不可能的,可以毫不夸張地說(shuō),作

為一個(gè)實(shí)驗(yàn)科學(xué)工作者,離開(kāi)了統(tǒng)計(jì)學(xué)就寸步難行,希望通過(guò)這門(mén)課

程的學(xué)習(xí),能夠掌握常用的統(tǒng)計(jì)方法,尤其是它們的條件,適用范圍、

優(yōu)缺點(diǎn)等,從而能夠應(yīng)用它們?nèi)ソ鉀Q實(shí)踐中遇到的問(wèn)題。否則,他將

無(wú)法知道其研究結(jié)果是否具有科學(xué)意義上的可重復(fù)性。要一一回答這

些問(wèn)題,要求研究者必須在整個(gè)研究過(guò)程中貫穿和運(yùn)用統(tǒng)計(jì)學(xué)的理論

和方法。

3、撰寫(xiě)研究報(bào)告和閱讀書(shū)刊

醫(yī)學(xué)研究中往往要涉及大量的數(shù)據(jù),但在撰寫(xiě)研究報(bào)告和論文

時(shí),只能使用經(jīng)過(guò)整理和歸納的統(tǒng)計(jì)指標(biāo),并且用規(guī)范的統(tǒng)計(jì)表和統(tǒng)

計(jì)圖表達(dá)。止匕外,在閱讀國(guó)外期刊時(shí).,如果不具備統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí),

則不能判斷別人研究結(jié)果的可信性和局限性,更談不上吸收和借鑒。

五、《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》中幾個(gè)重要的基本概念:

(1)總體(population)、樣本(sample)、個(gè)體(observedunit)

a.總體:根據(jù)研究目的所確定的性質(zhì)相同的所有個(gè)體的某種

變量值的集合。如:調(diào)查某地1999年正常成年男子的紅細(xì)胞數(shù),則

4察對(duì)衣:該地1999年正常成年男子。

4察草依:統(tǒng)計(jì)研究中的最基本單位,如:一個(gè)人、一個(gè)家庭、

一個(gè)地區(qū)等。

更察值(變量值人每個(gè)人測(cè)得的紅細(xì)胞數(shù)。

該地1999年正常成年男子的紅細(xì)胞數(shù)就構(gòu)成一個(gè)總體。

同質(zhì)基礎(chǔ):同一地區(qū)、同一年份、同為正常成人、同為男性

有限總體(finitepopulation):有確定的時(shí)間、空間和有限個(gè)觀

察單位,如上例。

無(wú)限總體(infinitepopulation):沒(méi)有確定的時(shí)間和空間限制,觀

察單位數(shù)為無(wú)限。如研究用某藥治療缺鐵性貧血的療效,此時(shí),總體

的同質(zhì)基礎(chǔ)是貧血患者,同時(shí)用某藥治療,該總體應(yīng)包括用該藥治療

的所有貧血患者的治療結(jié)果。

b.樣本:從總體中隨機(jī)抽取部分個(gè)體所組成的集合。

(隨機(jī)化原則:總體中每一個(gè)觀察單位均有同等機(jī)會(huì)被抽取)

(2)參數(shù)(parameter)、統(tǒng)計(jì)量(statistics)

統(tǒng)計(jì)學(xué)中把總體的指標(biāo)稱(chēng)為參數(shù),把所得樣本的平均數(shù)稱(chēng)為統(tǒng)計(jì)量。

(3)誤差(error):

抽祥篌差(samplingerror)由于總體中的個(gè)體間往往存在著

變異,隨機(jī)抽取的樣本僅是總體中的一部分個(gè)體,因而樣本測(cè)得的指

標(biāo)(統(tǒng)計(jì)量)往往與總體指標(biāo)(參數(shù))存在著差異,這種山于隨機(jī)抽

樣而造成的樣本的統(tǒng)計(jì)量與總體參數(shù)之間的差異,稱(chēng)為抽樣誤差,它

既不定量,也不定性。

系統(tǒng)篌差:由于設(shè)計(jì)不嚴(yán),測(cè)量?jī)x器不準(zhǔn)確,測(cè)量者水平的偏

差而造成的,這種誤差是定量的,可控的。

(4)統(tǒng)計(jì)資料

對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量和觀察,其特征稱(chēng)為變量,

對(duì)變量的測(cè)值稱(chēng)為變量值,亦稱(chēng)為資料。

"計(jì)量資料(quantitativedata)

統(tǒng)計(jì)資料類(lèi)型“計(jì)數(shù)資料(qualitativedata)

I等級(jí)資料(rankeddat)

①、定量資料(quantitativedata)乂稱(chēng)藥計(jì)量資■料:

用專(zhuān)業(yè)儀器測(cè)量,具有計(jì)量單位的測(cè)量數(shù)據(jù),表現(xiàn)為數(shù)值的大小,

如身高(cm)、體重(kg)、血壓(kPa)等。

特點(diǎn),每個(gè)現(xiàn)察單位的現(xiàn)察他同有蜃的區(qū)別

②、定嵯資料(qualitativedata):其觀察值是定性的,表現(xiàn)為

互不相容的類(lèi)別或?qū)傩?即將觀察單位按某種屬性或類(lèi)別分組,所得

各組的觀察單位數(shù))。

特點(diǎn),每個(gè)現(xiàn)察單位的現(xiàn)察他間有質(zhì)的區(qū)別

分兩種情況:

1、無(wú)序分類(lèi)(unorderedcategories)X稱(chēng)為計(jì)數(shù)資料

a.二項(xiàng)分類(lèi)檢驗(yàn)結(jié)果可以是陽(yáng)性或陰性、治療結(jié)果可以是治

愈或未愈、性別屬性等,表現(xiàn)為兩類(lèi)間互相對(duì)立。

氏多項(xiàng)分類(lèi)某種觀察結(jié)果為互不相容的多個(gè)類(lèi)別,如血型、

職業(yè)等。

2、有序分類(lèi)(ordinaCcategories)W稱(chēng)為等級(jí)資料

介于定量測(cè)量和定性觀察之間的半定量觀察結(jié)果,如測(cè)定某人

群血清反應(yīng),以人為觀察單位,結(jié)果分為一、土、+、++四級(jí),又如

觀察以某種藥治療某病患者的治療結(jié)果,以每個(gè)患者為觀察單位,結(jié)

果分為治愈、顯效、好轉(zhuǎn)、無(wú)效四級(jí),通常有兩個(gè)以上等級(jí)。

等級(jí)資料與計(jì)數(shù)資料的區(qū)別在于,等級(jí)資料雖然是多分類(lèi)資料,

但各個(gè)類(lèi)別存在著大小和程度上的差別。

特點(diǎn):各類(lèi)之間/程度的差別

資料的轉(zhuǎn)化和分析:根據(jù)分析問(wèn)題的需要,各類(lèi)變量可以互相轉(zhuǎn)化。

如:觀察某人群成年男子的血紅蛋白量(g/L),屬數(shù)值變量;

若分析比較某種病人的血紅蛋白水平與正常人有無(wú)差別,須按計(jì)

量資料進(jìn)行處理。

序號(hào)正常人組病人組

-T

2

3

4

5

6

7

8

9

若按血紅蛋白正常與偏低分為兩類(lèi),可按二項(xiàng)分類(lèi)資料處理;

正常人組病人組

正常

_____偏低

合計(jì)

若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白含量分為五個(gè)等級(jí):重度貧血、

中度貧血、輕度貧血、正常、血紅蛋白增高,可按等級(jí)資料處理。

正常人組病人組

重度貧血

中度貧血

輕度貧血

正常

血紅蛋白增高

合計(jì)

(5)頻率(frequency)、概率(probability)

醫(yī)學(xué)研究的大多數(shù)現(xiàn)象是隨機(jī)現(xiàn)象,例如用同一種治療方法治

療某病的一群患者,可以知道治療的結(jié)果有四種,但對(duì)于一個(gè)病人其

治療后的結(jié)果是不確定的,此時(shí)的每一種可能發(fā)生的結(jié)果都是一個(gè)隨

機(jī)事件(偶然事件、事件)。

定義:在n次隨機(jī)試驗(yàn)中,隨機(jī)事件A發(fā)生了k次,記力⑹=£

n

則稱(chēng)⑹為隨機(jī)事件A在n次試驗(yàn)中出現(xiàn)的頻率。

實(shí)踐證明,大量的試驗(yàn)中隨機(jī)事件會(huì)呈現(xiàn)出頻率穩(wěn)定性。

定義:描述隨機(jī)事件A發(fā)生可能性大小的數(shù)值,稱(chēng)為A的概率,

記作P(A),簡(jiǎn)記為P。假如臨床觀察中治療200病人的樣本,求得

治愈率為75%,這只是一個(gè)頻率。實(shí)際應(yīng)用中,當(dāng)概率不易求得時(shí)一,

常用n—8時(shí)的頻率作為概率的估計(jì)值。但當(dāng)n較少時(shí),頻率的波動(dòng)

性是很大的,用于估計(jì)概率是不可靠的。

隨機(jī)事件概率的大小在0與1之間。

P值越接近1,表示某事件發(fā)生的可能性越大;

P值越接近0,表示某事件發(fā)生的可能性越小。

嚴(yán)格說(shuō),P=1表示事件必然發(fā)生,P=0表示事件不可能發(fā)生,他

們是確定性的,不是隨機(jī)事件,但可把他們看成隨機(jī)事件的特例。

統(tǒng)計(jì)分析中的很多結(jié)論都是帶有概率性的。習(xí)慣上將PW0.05

稱(chēng)為小概率事件,表示在一次實(shí)驗(yàn)或觀察中該事件發(fā)生的可能性很

小,可以視為很可能不發(fā)生。

《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》的學(xué)習(xí)重點(diǎn)是:

1、掌握其基本知識(shí)、基本技能、基本概念、基本方法。

建立邏輯思維方法和提高分析問(wèn)題的能力。

2、掌握調(diào)查設(shè)計(jì)和試驗(yàn)設(shè)計(jì)的基本原則。

培養(yǎng)收集、整理、分析統(tǒng)計(jì)資料的系統(tǒng)工作能力。

3、掌握一套統(tǒng)計(jì)軟件的使用方法(SAS、SPSS、STATA等)。

能夠達(dá)到在完成《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》課程后,獨(dú)立完成科研論

文和正確應(yīng)用統(tǒng)計(jì)方法。

第二講集中趨勢(shì)

舉例

設(shè)有A、B兩名新戰(zhàn)士,他們的射擊技術(shù)可用下面的分布來(lái)表示:

戰(zhàn)士A戰(zhàn)士B

擊中環(huán)數(shù)8910擊中環(huán)數(shù)8910

對(duì)應(yīng)概率0.30.10.6對(duì)應(yīng)概率0.20.50.3

問(wèn)哪一個(gè)戰(zhàn)士射擊技術(shù)較好?1、頻數(shù)分布表

1人頻數(shù)表的編制

相同觀察結(jié)果出現(xiàn)的次數(shù)稱(chēng)為頻數(shù)。將所有觀察結(jié)果的頻數(shù)按一定順序排列

在,?起便是頻數(shù)友(frequencytable)。

步驟:

①找出最大和最小值,計(jì)算極差R=Xmax-Xmin

②根據(jù)斯梯階公式確定組距

1+3.3221ogn

③掃描樣本值,劃記后獲得頻數(shù)

2人頻數(shù)表的用途

①大樣本數(shù)據(jù)(不限于計(jì)量資料)常用的表達(dá)方式。

②便于觀察數(shù)據(jù)的分布類(lèi)型。

③便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值,必要時(shí)經(jīng)

檢驗(yàn)后舍去。

④當(dāng)樣本含量足夠大時(shí),各組段的分布頻率作為分布概率的估計(jì)值。

例7.我國(guó)某地農(nóng)村1995年已婚育齡婦女現(xiàn)有子女?dāng)?shù)的分布

子女?dāng)?shù)婦女?dāng)?shù)f頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)

(1)(2)(3)(4)(5)

0137519.45137519.45

12519117.303892226.75

23042620.916934847.65

32856019.629790867.28

42171914.9211962782.20

5136959.4113332291.61

672554.9814057796.60

732682.2514384598.85

81510.1014499699.64

93730.2614536999.89

N101560.11145525100.00

合計(jì)145525100.00——

2、集中位置的描述

平均數(shù)(average)是統(tǒng)計(jì)中最廣泛、最重要的一個(gè)指標(biāo)體系。用來(lái)描述一組變

量的集中趨勢(shì)、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡(jiǎn)

明概括的印象,又便于組間的比較。常用平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。

(―)>均數(shù)(mean)的計(jì)算

①直接法〃〃

例1、10名7歲男童體重(kg)分別為17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,

24.0,25.5.求平均體重。

元=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)

②頻數(shù)表法:

F_/否+2+hX;+....+f/k_Zfx

■力苫

例2:某地隨機(jī)檢查了140名成年男性紅細(xì)胞數(shù)(10"/L)

4.765.265.6115.954.464.574.315.184.924.274.774.88

5.004.734.475.344.704.814.935.044.405.274.635.50

5.244.974.714.444.945.054.784.524.635.515.244.98

4.334.834.565.444.794.914.264.384.874.995.604.46

4.955.074.805.304.654.774.505.375.495.224.585.07

4.814.543.824.014.894.625.124.854.595.084.824.93

5.054.404.145.014.375.244.604.714.824.945.054.79

4.524.644.374.874.604.724.835.334.684.804.154.65

4.764.884.613.974.084.584.314.054.165.045.154.50

4.624.734.474.584.704.814.554.284.784.514.634.36

4.484.595.095.205.325.054.414.524.644.754.494.22

4.715.214.944.685.174.915.024.76

紅細(xì)胞數(shù)(10'7L)頻數(shù)f組中值XFx

(1)(2)(3)(4)=(2)*(3)

3.80-23.907.8

4.00-64.1024.6

4.20-114.3047.3

4.40-254.50112.5

4.60-324.70150.4

4.80-274.90132.3

5.00-175.1086.7

5.20-135.3068.9

5.40-45.5022.0

5.60-25.7011.4

5.80-15.905.9

合計(jì)140(Zf)669.8(SfX)

T:_/|斗++于3毛+.…+于占_

£fF

=4.78(107L)

均數(shù)的兩個(gè)重要特征:

①各離均差的總和等于零

Z(x-X)=O

證明:-x)=22七一〃x=Zx,—22七=0

②各離均差的平方和小于各觀察值X與任何數(shù)a之差的平方

Z(x-X)2<Z(x-ap

均數(shù)的應(yīng)用:

1.用來(lái)描述一組變量值的平均水平,具有代表性,因此變量值必須是同質(zhì)的。

2.適用于呈正態(tài)分布(對(duì)稱(chēng)分布)的資料。

(2)幾何均數(shù)(geometricmean)的計(jì)算

1)直接法

G=4須-x2?x3???xn

G=lg-'*?+—+…lgx")=lg-.(Z]g±)

nn

例3:5人的血清滴度為:1:2,1:4,1:8,1:16,1:32,求平均滴度。

G=^/2x4x8xl6x32

LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903

G=lg'0.903=8故平均滴度為1:8。

2)頻數(shù)表法

G=lg-'(容臀)

例4:40名麻疹疫苗接種麻疹疫苗后一個(gè)月,血凝抑制抗體滴度見(jiàn)下表,

求平均滴度。

抗體滴度人數(shù)f滴度倒數(shù)XLgXf*lgX

(1)(2)(3)(4)(5)=(2)*(4)

14140.60210.6021

18580.90314.5155

1166161.20417.2246

1322321.50513.0102

1647641.806212.6434

1128101282.107221.0720

125642562.40829.6328

151255122.709313.5465

4072.2471

LgG=(ZflgX/XD=72.2471/40=1.8062G=lg'1.8062=64

血凝抑制抗體滴度的平均滴度為1:64

幾何均數(shù)的應(yīng)用:用于等比級(jí)數(shù)資料和對(duì)數(shù)正態(tài)分布資料,

如:某些傳染病的潛伏期、抗體滴度、細(xì)菌計(jì)數(shù)等。

(3)、中位數(shù)和百分位數(shù)的計(jì)算

中位數(shù)(median,M)是將一組觀察值從小到大按順序排列,位次居中

的數(shù)值對(duì)應(yīng)的觀察值就是中位數(shù)。因而全部觀察值中,大于和小于中位數(shù)的

Da接法:將原訟觀察值按大小順序排列:

M=X四

n為奇數(shù)時(shí),-

X“,+X

n為偶數(shù)時(shí),M=1=―一一」

例5.測(cè)得5個(gè)人的低密度脂蛋白中載體B蛋白的含量(mg/dl)分別為0.84,2.58,

5.46,8.58,9.60,求其中位數(shù).

M=Xn+i

W

=X3=5.46mg/dl

例6.8名新生兒的身長(zhǎng)(cm)依此為50,51,52,53,54,54,55,58,求

其中位數(shù)。

X弓)+X(>1)_53+

2—2

2)頻數(shù)表法

乙=乙+.("%%一£九)

例7.對(duì)某地630名50歲~60歲的正常女性檢查了血清甘油三脂含量,并制成如

下頻數(shù)表,試求中位數(shù)及第25、75、90百分位數(shù)。

甘油三脂mg/dl頻數(shù),f累計(jì)頻數(shù)累計(jì)頻率(%)

(1)(2)(3)(4)

10~27274.3

40~16919631.1

70~16736357.6

100-9445772.5

130-8153885.4

160-4258092.1

190-2860896.5

220-1462298.7

250-462699.4

280-362999.8

310-1630100.0

合計(jì)630——

”630x0.5-196”…、

m=70H------------------x30=91.4(mg/dl)

4八630x0.25-27“0?/」八

“25=40H-----------------------x30=63.2(〃2g/dl)

i630x0.75-457”……,」八

p=130+---------------------x30=135.1(mg/dl)

1581

v八630x0.90-538.1。八十…、

〃9o=160H--------------------------x30=180.7(mg/d/)

例8.某日大氣中SO2的日平均濃度(ug/n?)見(jiàn)下表,分別求第25、75、95

百分位數(shù)及中位數(shù)。

濃度(ug/mD天數(shù),f累計(jì)頻數(shù)累計(jì)頻率(%)

(1)(2)(3)(4)

5~393910.8

50~6710629.4

75~6417047.1

100-6323364.5

125-4527877.0

150-3030885.3

175-1732590.0

200-933492.5

225-734194.5

634796.1

275-535297.5

300-335598.3

325-6361100.0

361

P,=/+/(〃.x%_£力)

253o

/^5=50+-(361x25%-39)=69.12(//g/m)

67

252

P75=125+1|(361x75%-233)=145.97(〃g/m3)

25a3

/^5=250+—(361x95%-341)=258.12(//g/m)

6

253

/^0=100+—(361/2-170)=104.17(/zg/m)

63

中位數(shù)和百分位數(shù)的應(yīng)用:

1.用于描述偏態(tài)分布資料的集中位置。反映位次居中的觀察值的水平。

2.百分位數(shù)是用于描述樣本或總體觀察值序列在某百分位置水平,最常用

的百分位數(shù)是中位數(shù)。

3.百分位數(shù)常用來(lái)確定醫(yī)學(xué)參考值范圍。

第三講離散趨勢(shì)

離散程度的描述

三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢(shì)與離散趨勢(shì)。

甲組2628303234X甲=30kgR=8S=3.16

已組2427303336X乙=30kgR=12S=4.74

丙組2629303134X丙=30kgR=8S=2.91

哪一組數(shù)值的代表性好?

(1)極差(range)

一組觀察值中,最大值與最小值差,反映個(gè)體差異的范圍。極差大,說(shuō)明變

異度大,各變量值離均數(shù)越遠(yuǎn),數(shù)據(jù)越分散;反之亦然。

(2)四分位數(shù)(quartile)間距

可看成是特定的百分位數(shù),用它說(shuō)明個(gè)體差異比極差穩(wěn)定。

Q=P75-P25

一般來(lái)說(shuō),樣本例數(shù)越多,四分位間距越穩(wěn)定。

(3)方差(variance)與標(biāo)準(zhǔn)差的計(jì)算

方差:o2=X(x-|i)2/N

n-\

由上式可知:方差考慮了總體中每個(gè)變量值x與總體均數(shù)之差(x-m,稱(chēng)

為離均差平方和(SS),因此方差近似等于離均差平方和的算數(shù)均數(shù),故又稱(chēng)為

均方差(MS),由于SS利用了每一個(gè)觀察值的信息,因而反映一批數(shù)據(jù)的變異

程度優(yōu)于極差和四分位間距。

(4)標(biāo)準(zhǔn)差(standarddeviation)

方差開(kāi)方后稱(chēng)為標(biāo)準(zhǔn)差,其單位與變量值單位及均數(shù)單位相同,變異度越

大,則離均差平方和越大,標(biāo)準(zhǔn)差越大,說(shuō)明個(gè)體差異越大,均數(shù)的代表性越差。

為了簡(jiǎn)化計(jì)算,標(biāo)準(zhǔn)差的計(jì)算公式還可寫(xiě)為:

J〃

n-1

分組資料的計(jì)算:

n

S寸n-\

如上例:n=110£僅2=1584990£fx=13194

s=1-

但84990-131942/110

Viio-i

(5)變異系數(shù)(cofflcientofvariation,CV)

定義:標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,cv=4x100%

X

其描述了相對(duì)于算術(shù)均數(shù)而言標(biāo)準(zhǔn)差的大小,即描述數(shù)據(jù)的變異相對(duì)于其平

均水平來(lái)說(shuō)是大還是小。

與前面介紹的四種離散程度指標(biāo)相比,變異系數(shù)有以下兩個(gè)不同之處:

1:它描述的不是數(shù)據(jù)分布的絕對(duì)離散程度,而是相對(duì)離散程度;

2:它不象極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差那樣具有取值單位。

這兩個(gè)特點(diǎn)決定了變異系數(shù)的應(yīng)用也不同于前面四個(gè)離散程度指標(biāo)。

它常用于:

1、比較度量衡單位不同的多組資料的變異度:

例如:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;

其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg.欲比較身高與體重的變異何者為大,

由于度量單位不同,不能比較其標(biāo)準(zhǔn)差而應(yīng)比較其變異系數(shù)

身高cv=495夕〃*io。%=2.98%

166.06c機(jī)

體重CV=496版X100%=923%

53.72kg

由此可見(jiàn),該地20歲男子體重的變異大于身高的變異。

2.比較均數(shù)相差懸殊的多組資料的變異度:

某地不同年齡組男子身高的變異程度

年齡組人數(shù)均數(shù)土標(biāo)準(zhǔn)差變異系數(shù)(%)

3—3.5歲10090.1±3.13.2

30—35歲100170.2±5.00.3

表中可見(jiàn),雖然30?35歲組的標(biāo)準(zhǔn)差明顯大于3-3.5歲組的標(biāo)準(zhǔn)差,但事

實(shí)上30?35歲組男子身高的變異并不大,而3?3.5歲組男童身高的變異卻很

大。這種均數(shù)相差懸殊的資料比較變異程度時(shí),應(yīng)當(dāng)用變異系數(shù)說(shuō)明其變異情況。

小結(jié)

為了解數(shù)值變量的分布規(guī)律,可將觀察值編制頻數(shù)表,繪制頻數(shù)分布圖,

用于描述資料的分布特征(集中趨勢(shì)和離散趨勢(shì)),以及分布類(lèi)型(對(duì)稱(chēng)分布

和偏態(tài)分布)。

平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo),它代表一組觀察值的平均水平,

常用平均數(shù)的指標(biāo)下表:

平均數(shù)意義應(yīng)用場(chǎng)合

均數(shù)平均數(shù)量水平應(yīng)用甚廣,最適用于對(duì)稱(chēng)分布,特別是正態(tài)分布

幾何均數(shù)平均增(減)倍數(shù)等比級(jí)數(shù)資料,對(duì)數(shù)正態(tài)分布

中位數(shù)位次居中的觀察值水平偏態(tài)分布,分布不明,分布末端無(wú)確定值

百分位數(shù)描述觀察序列在某百分位置的水平,是分布的百分界值,可用于

醫(yī)學(xué)參考值范圍,適用于任何分布。

二、描述頻數(shù)分布離散程度的指標(biāo)有:

1)極差與四分位間距,后者較穩(wěn)定,但均不能綜合反映各觀察值的變異程度;

2)方差和標(biāo)準(zhǔn)差,最為常用,對(duì)正態(tài)分布尤為重要;

3)變異系數(shù)常用于:不同測(cè)量單位的幾組資料變異度的比較;均數(shù)相差懸殊

的兒組資料變異度的比較。

第四講正態(tài)分布及其應(yīng)用

一、正態(tài)分布的概念和特征

根據(jù)頻數(shù)表資料繪制成直方圖,可以設(shè)想,如果將觀察人數(shù)

逐漸增多,線段不斷分細(xì),圖中直條將逐漸變窄,其頂端將逐漸

接近一條光滑的曲線,這條曲線稱(chēng)為頻數(shù)曲線或頻率曲線,略呈

鐘型,兩頭低,中間高,左右對(duì)稱(chēng),近似于數(shù)學(xué)上的正態(tài)分布(normal

distribution)o由于頻率的總和等于100%或1,故橫軸上曲線下的

面積等于100%或lo

有極其重要的地位。許多生物學(xué)現(xiàn)象所產(chǎn)生的數(shù)據(jù),都服從正態(tài)

分布。

1、正態(tài)分布的圖形有了正態(tài)分布的密度函數(shù)f(X),即正態(tài)

上式中右側(cè)JR為均數(shù),b為標(biāo)準(zhǔn)差,x為自變量。當(dāng)x確定

后,就可由此式求得其密度函數(shù)f(x),也就是相應(yīng)的縱坐標(biāo)的高度。

所以,已知和就能繪出正態(tài)曲線的圖形。

2、正態(tài)分布的特征

(1)正態(tài)分布以日為中心,左右對(duì)稱(chēng)。

(2)正態(tài)分布有兩個(gè)參數(shù),即日和o。日是位置參數(shù),當(dāng)o恒定

后,日越大,則曲線沿橫軸越向右移動(dòng);口越小,則曲線沿橫

軸越向左移動(dòng)。o是變異參數(shù),當(dāng)日恒定時(shí),o越大,表示數(shù)

據(jù)越分散,曲線越“胖”;a越小,表示數(shù)據(jù)越分散,曲線越

,,瘦二

(3)正態(tài)分布的偏斜度Yi=O,峭度Y2=0

為了應(yīng)用方便,常將上式作如下變換,

X-LI

U=-----------

(J

也就是將原點(diǎn)移到日的位置,使橫軸尺度以Q為單位,使

口=0,b=l,則正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布。(standardnormal

distribution),u稱(chēng)為標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)

標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為:

1--

一般用N(口,er2)表示均方為w方差為o?的正態(tài)分布。于是

標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。

標(biāo)準(zhǔn)正態(tài)分布有以下特征:

(1)在u=0時(shí),<p(u)達(dá)到最大值。

(2)當(dāng)u無(wú)論向哪個(gè)方向遠(yuǎn)離0時(shí),(p(u)的值都減小。

(3)曲線關(guān)于Y軸對(duì)稱(chēng),即(p(u)=(p(-u)o

(4)曲線和橫軸所夾的面積等于1。

二、標(biāo)準(zhǔn)正態(tài)曲線下面積的計(jì)算

P(ui<IU|<u2)=(p(u2)-<p(U!)

舉例

已知高梁品種“三尺三”的株高服從正態(tài)分布N(156.2,4.822),

求:(l)X<161cm的概率;(2)X>161cm的概率;(3)X在152-162cm

間的概率。

(1)依題意:

P(X<161)=火F:;:?)=/⑴=0.84134

所以,“三尺三”的株高低于161cm的概率為084134。

(2)依題意得:

P(X>164)==1—0(1.62)=1-0.94738=0.05262

(3)依題意得:

P(152<X<162)=制162;;;6.2)_火152;;;6.2)=例|_^>(-0.87)=0.88493-0.19215=0.69278

下列一些值很重要,應(yīng)予記憶:

U=-1到U=1面積=0.6827

u=-1.96至Uu=1.96面積=0.9500

u=-2.58至I」u=2.58面積=0.9900

三、小結(jié)

1、正態(tài)分布是一種連續(xù)性的分布,不少醫(yī)學(xué)現(xiàn)象服從正態(tài)分布

或近似正態(tài)分布.(如同性別、同年齡兒童的身高,同性別健康成人的

紅細(xì)胞數(shù)、血紅蛋白量、脈搏數(shù)等,以及實(shí)驗(yàn)中的隨機(jī)誤差等);或

經(jīng)變量變換轉(zhuǎn)換為正態(tài)分布(如某些病人的潛伏期以及醫(yī)院病人住院

天數(shù)等),可按正態(tài)分布規(guī)律來(lái)處理,它也是許多統(tǒng)計(jì)方法的理論基

礎(chǔ)。

2、正態(tài)分布的特征是:

(1)曲線在橫軸上方,均數(shù)處最高;

(2)以均數(shù)為中心,左右對(duì)稱(chēng);

(3)確定正態(tài)分布的兩個(gè)參數(shù)是均數(shù)目和標(biāo)準(zhǔn)差

正態(tài)分布用N(|i,Q2)表示,為了應(yīng)用的方便,常對(duì)變量x作

u=(x-p)/a使口=0,a=l,則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布用N(0,

1)表示。

3、運(yùn)用正態(tài)曲線下面積的分布規(guī)律,可計(jì)算醫(yī)學(xué)參考值范圍和

質(zhì)量控制等。

第四講:總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)

醫(yī)學(xué)統(tǒng)計(jì)學(xué)的最基本問(wèn)題是研究總體與樣本的關(guān)系。

總體與樣本的關(guān)系,可從兩方面研究:

(1)由已知的總體,研究樣本的分布規(guī)律,即由總體到樣本的

研究過(guò)程;

(2)由樣本如何去推斷未知的總體,屬于從樣本到總體的研究

過(guò)程。

1、從一個(gè)正態(tài)總體中抽取的樣本統(tǒng)計(jì)量分布

生物學(xué)中遇到最多的是正態(tài)總體。對(duì)于正態(tài)總體,可以用數(shù)

學(xué)推演的方法,得出嚴(yán)格的樣本統(tǒng)計(jì)量的抽樣分布,有了嚴(yán)格的樣

本分布規(guī)律,就可以由樣本來(lái)推斷總體了。

標(biāo)準(zhǔn)差已知時(shí)的樣本平均數(shù)的分布——u分布

平均數(shù)為山標(biāo)準(zhǔn)差為b的正態(tài)總體中,獨(dú)立隨機(jī)的抽取含

量為n的樣本,貝I」:

(T

樣本平均數(shù)是一服從正態(tài)分布的隨機(jī)變量,記為Xo

將平均數(shù)標(biāo)準(zhǔn)化,則:

x-U

LI=

(J

其中的分母稱(chēng)為平均數(shù)的標(biāo)準(zhǔn)誤差(standarderrorofmean)0如果

變量是正態(tài)的或近似正態(tài)的,則標(biāo)準(zhǔn)化的變量服從或近似地服從N

(0,1)分布。

1、標(biāo)準(zhǔn)差已知

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論