




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一節(jié)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的含義
1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)定義
醫(yī)學(xué)統(tǒng)計(jì)學(xué)(statistics)作為一門(mén)學(xué)科的定義是:關(guān)于醫(yī)學(xué)數(shù)據(jù)收集、表達(dá)和分析
的普遍原理和方法。
2、醫(yī)學(xué)統(tǒng)計(jì)學(xué)研究方法:通過(guò)大量重復(fù)觀察,發(fā)現(xiàn)不確定的醫(yī)學(xué)現(xiàn)象背后隱藏的統(tǒng)計(jì)學(xué)
規(guī)律。
3、醫(yī)學(xué)統(tǒng)計(jì)推論的基礎(chǔ):在一定條件下,不確定的醫(yī)學(xué)現(xiàn)象發(fā)生可能性,即概率。
第二節(jié)、統(tǒng)計(jì)學(xué)的幾個(gè)重要概念
一.資料的類(lèi)型
1、計(jì)量資料(數(shù)值變量):對(duì)每一觀察對(duì)象用定量的方法,測(cè)定某項(xiàng)指標(biāo)所得的資料。一
般有度量衡單位,每個(gè)對(duì)象之間有量的區(qū)別。
2、計(jì)數(shù)資料-(分類(lèi)變量):對(duì)觀察對(duì)象按屬性或類(lèi)型分組計(jì)數(shù)所得的資料。每個(gè)對(duì)象之間沒(méi)
有量的差異,只有質(zhì)的不同。
3、等級(jí)資料(有序分類(lèi)變量):對(duì)觀察對(duì)象按屬性或類(lèi)型分組計(jì)數(shù),但各屬性或類(lèi)型之間
又有程度的差別。
注意:不同類(lèi)型的資料采用的統(tǒng)計(jì)分析方法不同;三類(lèi)資料類(lèi)型可以相互轉(zhuǎn)化。
二、總體
根據(jù)研究目的所確定的同質(zhì)的所有觀察對(duì)象某項(xiàng)變量值的集合
—1、有限總體:只包括在確定時(shí)間、空間范圍內(nèi)的有限個(gè)觀察對(duì)象。
2、無(wú)限總體:沒(méi)有時(shí)間、空間范圍的限制,觀察對(duì)象的數(shù)量是不確定的,無(wú)限的
三、樣本
從總體中隨機(jī)抽取部分觀察對(duì)象,其某項(xiàng)變量值的集合。
從總體中隨機(jī)抽取樣本的目的是:用樣本信息來(lái)推斷總體特征。
四、隨機(jī)事件
可以發(fā)生也可以不發(fā)生,可以這樣發(fā)生也可以那樣發(fā)生的事件。亦稱(chēng)偶然事件。
五、概率
描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,記作P,其取值范圍0WPW1,一般用小數(shù)表示。
P=o,事件不可能發(fā)生必然事件(隨機(jī)事件的特例);P=l,事件必然發(fā)生;P-0,事件發(fā)
生的可能性愈??;P-1,事件發(fā)生的可能性愈大
六、小概率事件
習(xí)慣上將PW0.05或PW0.01的隨機(jī)事件稱(chēng)小概率事件。表示某事件發(fā)生的可能性很小。
七、參數(shù)和統(tǒng)計(jì)量
參數(shù):總體指標(biāo),如總體均數(shù)、總體率,一般用希臘字母表示
統(tǒng)計(jì)量:樣本指標(biāo),如樣本均數(shù)、樣本率,一般用拉丁字母表示
八、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的方法
1、重點(diǎn)掌握“四基”:基本知識(shí)、基本概念、基本原理和基本方法;
2、重視統(tǒng)計(jì)方法在實(shí)際中應(yīng)用,重視實(shí)習(xí)和綜合訓(xùn)練;注意學(xué)習(xí)每種統(tǒng)計(jì)方法的應(yīng)用范圍、
應(yīng)用條件,大多數(shù)公式只要求了解其意義和使用方法,不用記憶和探究數(shù)理推導(dǎo)。
第三節(jié)統(tǒng)計(jì)工作的基本步驟
統(tǒng)計(jì)設(shè)計(jì)收集資料整理資料分析資料
一、統(tǒng)計(jì)設(shè)計(jì)
1、調(diào)查設(shè)計(jì)
2、實(shí)驗(yàn)設(shè)計(jì)
(詳見(jiàn)第十三章)
二、收集資料
資料來(lái)源
(1)統(tǒng)計(jì)報(bào)表
(2)日常醫(yī)療工作原始記錄和報(bào)告卡
(3)專(zhuān)題調(diào)查
三、整理資料
1.目的將收集的原始資料系統(tǒng)化、條理化,便于進(jìn)一步計(jì)算和分析
2.整理分組方式
(1)性質(zhì)分組
(2)數(shù)量分組
三、分析資料
1、統(tǒng)計(jì)描述
2、統(tǒng)計(jì)推斷
第四節(jié)統(tǒng)計(jì)圖表
一、統(tǒng)計(jì)表
1、統(tǒng)計(jì)表的作用
代替冗長(zhǎng)的文字?jǐn)⑹?,便于?jì)算、分析和對(duì)比。
2、統(tǒng)計(jì)表的結(jié)構(gòu)
1)標(biāo)題
2)標(biāo)目橫標(biāo)目(主語(yǔ)):說(shuō)明表各橫行數(shù)字的涵義,通常列在表的左側(cè)
縱標(biāo)目(謂語(yǔ)):說(shuō)明表各縱欄數(shù)字的涵義
主語(yǔ)和謂語(yǔ)連貫起來(lái)能讀成一句完整而通順的話
3、統(tǒng)計(jì)表的種類(lèi):
1)簡(jiǎn)單表:只按單一變量分組
2)組合表:按兩個(gè)或兩個(gè)以上變量分組
某地1980年男、女HBsAg陽(yáng)性率
性別調(diào)查數(shù)陽(yáng)性數(shù)陽(yáng)性率(%)
男42343037.16
女45301814.00
合計(jì)87644845.52
4、列表原則:重點(diǎn)突出,簡(jiǎn)單明了;主謂分明,層次分明
5、統(tǒng)計(jì)表的基本要求:
1)標(biāo)題:概括地說(shuō)明表的內(nèi)容,必要時(shí)注明資料的時(shí)間和地點(diǎn),寫(xiě)在表上方。常見(jiàn)的缺
點(diǎn):過(guò)于簡(jiǎn)略,甚至不寫(xiě)標(biāo)題;或過(guò)于繁瑣;或標(biāo)題不確切。
2)標(biāo)目:文字簡(jiǎn)明扼要,有單位的標(biāo)目要注明單位。常見(jiàn)的缺點(diǎn):標(biāo)目過(guò)多,層次不清
3)線條:不宜過(guò)多,除上面的頂線,下面的底線,縱標(biāo)目與合計(jì)之間的橫線外,其余線
條一般均省去。表的左上角不宜有斜線。
4)數(shù)字:
A、數(shù)字一律用阿拉伯?dāng)?shù)字表示
B、同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次對(duì)齊
C、表內(nèi)不宜留空格,暫缺或未記錄,用“…”表示,無(wú)數(shù)字,用“一”表示,數(shù)字為0,
填寫(xiě)0
D、絕對(duì)數(shù)太小而無(wú)法計(jì)算指標(biāo),則用“…”代替。
5)備注:般不列入表內(nèi),必要時(shí)可用“*”號(hào)標(biāo)出,寫(xiě)在表的下面。
二、統(tǒng)計(jì)圖
1、統(tǒng)計(jì)圖作用:
通過(guò)點(diǎn)、線、面等形式表達(dá)統(tǒng)計(jì)資料,直觀地反映事物之間的數(shù)量關(guān)系。但需注意,由于統(tǒng)計(jì)
圖對(duì)數(shù)量的表達(dá)較粗糙,不便于作深入細(xì)致的分析,?般需附相應(yīng)的統(tǒng)計(jì)表。
2、常見(jiàn)統(tǒng)計(jì)圖種類(lèi):
條圖、百分條圖,圓圖,線圖,半對(duì)數(shù)線圖,直方圖,散點(diǎn)圖
3、制圖的基本要求:
1)按資料的性質(zhì)和分析目的,選用適合的圖形
2)要有標(biāo)題,扼要說(shuō)明資料的內(nèi)容,必要時(shí)注明時(shí)間、地點(diǎn),一般寫(xiě)在圖的下面。
3)橫軸尺度從左到右,縱軸尺度從下而上,數(shù)量一律由小到大。橫軸與縱軸坐標(biāo)長(zhǎng)度比例一
般為5:7
4)比較不同事物,用不同線條或顏色表示,并附上圖例說(shuō)明。
4、常見(jiàn)統(tǒng)計(jì)圖適用范圍及其繪制要點(diǎn)
1)條圖:
(1)適用范圍:相互獨(dú)立的資料,常用形式:?jiǎn)问胶蛷?fù)式
(2)繪制要點(diǎn):
A.用等寬的直條的長(zhǎng)短反映各指標(biāo)的數(shù)量大小。
B.縱軸的尺度必須從0開(kāi)始。
C.各直條之間的間隙應(yīng)相等,?般將比較的指標(biāo)按大小順序排列。
2)百分條圖:
(1)適用范圍:構(gòu)成比資料
(2)繪制要點(diǎn):
A.將長(zhǎng)條全長(zhǎng)為100%,
B.將各百分構(gòu)成比在長(zhǎng)條上分割若干段,
C.各段按大小順序排列。
3)圓圖
(1)適用范圍:構(gòu)成比資料
(2)繪制要點(diǎn):
A.將圓面積為100%,
B.將各百分構(gòu)成比乘以3.6度,變?yōu)閳A心角度數(shù),
C.在圓上繪出各扇型面積
D.各扇型面積按大小順序排列。
4)普通線圖
(1)適用范圍:連續(xù)性資料
(2)繪制要點(diǎn):
A.縱橫軸均用算術(shù)尺度,
B.縱橫軸尺度比一般為5:7
C.相鄰兩點(diǎn)用直線連接。
(3)意義:反映事物的變化趨勢(shì)。
5)半對(duì)數(shù)線圖
(1)適用范圍:連續(xù)性資料
(2)繪制要點(diǎn):
A.橫軸用算術(shù)尺度,縱軸用對(duì)數(shù)尺度,
B.縱橫軸尺度比一般為5:7
C.相鄰兩點(diǎn)用直線連接。
(3)意義:反映事物的變化速度。
6)直方圖
(1)適用范圍:計(jì)量的頻數(shù)表資料
(2)繪制要點(diǎn):
A.橫軸表示被觀察事物,縱軸表示頻數(shù)或頻率,
B.用等寬的矩形面積表示各組段的頻數(shù)或頻率
7)散點(diǎn)圖:
(1)適用范圍:雙變量資料
(2)分析目的:用點(diǎn)的密度程度和趨勢(shì)表示兩變量間的相關(guān)關(guān)系
第一講緒論
一、《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》的理論基礎(chǔ)和研究對(duì)象:
a)問(wèn)題的提出:
在人們的實(shí)踐活動(dòng)中,常常會(huì)遇到類(lèi)似下面的一些問(wèn)題:
一種新的疫苗,如何判斷它是否有效?
吸煙會(huì)不會(huì)使得肺癌的機(jī)會(huì)增加?
如何抽檢兒百或兒千人來(lái)估計(jì)某種病的流行程度?
某批產(chǎn)品中合格品究竟有多少?該不該報(bào)廢?
如何消耗最少的資源和人力來(lái)得到我們所需要的某種信息?
某種實(shí)驗(yàn)方法(或飼料配方)有沒(méi)有明顯改進(jìn)?
患者分組是否具有可比性?
所觀察對(duì)象的數(shù)量是否足夠說(shuō)明其結(jié)論?
試驗(yàn)結(jié)果的誤差有多大?
研究結(jié)果是否適用于觀察樣本以外的同類(lèi)對(duì)象?……等等.
其共同特點(diǎn):只知道事情的不完全信息,或者是單個(gè)實(shí)驗(yàn)的結(jié)
果有某種不確定性。
例如:為了知道產(chǎn)品合格與否或它的使用壽命,我們常常需要
對(duì)它作破壞性檢驗(yàn),此時(shí)顯然不能把所有的產(chǎn)品都檢驗(yàn)一下,而只能
滿(mǎn)足于對(duì)少數(shù)兒個(gè)作品的抽檢,這樣獲得的信息顯然是不完全的;
要檢驗(yàn)疫苗的有效性,就一般來(lái)說(shuō),接種過(guò)疫苗的動(dòng)物也不一定
全不發(fā)病,而未接種的也不會(huì)全發(fā)病.那么發(fā)病與不發(fā)病的差別究竟
到多大時(shí)我們才能認(rèn)為接種是有效的呢?
這些均涉及了我們?nèi)绾卧u(píng)價(jià)一些并不確定的實(shí)驗(yàn)結(jié)果的問(wèn)題。要
從這類(lèi)問(wèn)題中得出科學(xué)的、可靠的結(jié)論,就必須依靠統(tǒng)計(jì)學(xué).有人干
脆給統(tǒng)計(jì)學(xué)下了這樣的定義:“統(tǒng)計(jì)學(xué)就是從不完全的信息里取得準(zhǔn)
確知識(shí)的一系列技巧”。
另外,當(dāng)必須根據(jù)有限的、完全的信息作出決策時(shí)(例如決定一
批產(chǎn)品是出廠還是報(bào)廢,某種新藥是否有效等等),統(tǒng)計(jì)學(xué)可以提供
一種方法,使我們不僅能做出合理的決策,而且知道所冒風(fēng)險(xiǎn)的大小,
并幫助我們把可能的損失減至最小。
其次,如何花費(fèi)最小代價(jià)取得所關(guān)心的信息,也是統(tǒng)計(jì)學(xué)的一大
課題(實(shí)險(xiǎn)設(shè)計(jì)).不注意這一點(diǎn)可能使辛辛苦苦的工作全成為一種
浪費(fèi).
2.理論基礎(chǔ):“根據(jù)數(shù)理統(tǒng)計(jì)的原理、方法緊密結(jié)合醫(yī)學(xué)實(shí)踐,
研究醫(yī)藥衛(wèi)生領(lǐng)域中的資料收集、整理、分析和推斷的一門(mén)應(yīng)用學(xué)科,
來(lái)分析和解釋生物界各種現(xiàn)象和實(shí)驗(yàn)調(diào)查資料的科學(xué)”。隨著生物醫(yī)
學(xué)研究的不斷發(fā)展,運(yùn)用統(tǒng)計(jì)學(xué)方法來(lái)認(rèn)識(shí)、推斷和解釋生命過(guò)程中
的各種現(xiàn)象也越來(lái)越廣泛。運(yùn)用統(tǒng)計(jì)學(xué)方法可以幫助人們分析占有信
息,達(dá)到去偽存真,去粗取精,正確認(rèn)識(shí)世界的目的。
3.研究對(duì)象:人體及與人體健康有關(guān)的各種具有不確定性的
醫(yī)學(xué)數(shù)據(jù)(變異、數(shù)量、同質(zhì))。
二、《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》的主要任務(wù)和作用:
任務(wù):1、結(jié)合專(zhuān)業(yè)知識(shí)和具體研究的要求進(jìn)行統(tǒng)計(jì)設(shè)計(jì)
2、對(duì)收集資料進(jìn)行整理、做統(tǒng)計(jì)描述
3、對(duì)資料進(jìn)行統(tǒng)計(jì)分析和解釋
作用:1、保證調(diào)查或試驗(yàn)設(shè)計(jì)的科學(xué)性、完整性
2、指標(biāo)的確定應(yīng)具有特異性、客觀性,靈敏性和精密度高
3、樣本含量足夠大,數(shù)據(jù)真實(shí)可靠
4、選用統(tǒng)計(jì)分析方法正確
三、醫(yī)學(xué)統(tǒng)計(jì)學(xué)的主要內(nèi)容:
1、統(tǒng)計(jì)設(shè)計(jì)(design)
在進(jìn)行統(tǒng)計(jì)工作和研究之前必須有一個(gè)周密的設(shè)計(jì),設(shè)計(jì)的內(nèi)容
包括資料收集、整理和分析全過(guò)程總的設(shè)想和安排。
統(tǒng)計(jì)設(shè)計(jì)可按照在研究過(guò)程中對(duì)研究對(duì)象是否進(jìn)行干預(yù)分作調(diào)
查研究設(shè)計(jì)和實(shí)驗(yàn)研究設(shè)計(jì)。
調(diào)查研究設(shè)計(jì):研究者旨在客觀地描述研究總體,未加任何干預(yù)
措施,如:調(diào)查了解某地的學(xué)齡兒童缺鐵性貧血的患病率,某地新生
兒畸形的發(fā)生率,北京地區(qū)潰瘍病患病率等,其目的在于了解某一醫(yī)
學(xué)現(xiàn)象的實(shí)際情況,疾病的危害程度,以便為防治和研究這些疾病提
供依據(jù)。調(diào)查設(shè)計(jì)主要有抽樣方法、調(diào)查技術(shù)、質(zhì)量控制技術(shù)等。
實(shí)驗(yàn)研究設(shè)計(jì):研究者根據(jù)目的(研究假設(shè)),主動(dòng)加以干預(yù)措
施,并觀察總結(jié)其結(jié)果,回答研究假設(shè)所提出的問(wèn)題。
如:研究脂健乳是否有降脂作用,首先如一脂健乳可以降低血
脂,再將條件相似的20只大鼠先用高脂飼料喂養(yǎng)做成高脂血癥的模
型,然后將動(dòng)物隨機(jī)分為實(shí)驗(yàn)組和對(duì)照組,實(shí)驗(yàn)組服用脂健乳和豆奶,
對(duì)照組單純服用豆奶,喂養(yǎng)一個(gè)月后觀察比較兩組之間各項(xiàng)血脂指標(biāo)
的差別有無(wú)統(tǒng)計(jì)學(xué)意義,進(jìn)而得出脂健乳是否具有降低血脂的保健作
用的結(jié)論。
實(shí)驗(yàn)設(shè)計(jì)主要有各種實(shí)驗(yàn)設(shè)計(jì)模型、分組方法、樣本量估計(jì)等。
由于統(tǒng)計(jì)設(shè)計(jì)的質(zhì)量直接影響著試驗(yàn)結(jié)果的準(zhǔn)確性、可靠性、嚴(yán)
密性和代表性,一旦出現(xiàn)設(shè)計(jì)上的失誤或缺陷,可能導(dǎo)致整個(gè)研究的
失敗。因此,專(zhuān)業(yè)設(shè)計(jì)是研究者對(duì)專(zhuān)業(yè)知識(shí)的把握能力,直接影響著
實(shí)驗(yàn)的深度和水平,而統(tǒng)計(jì)設(shè)計(jì)是研究者對(duì)醫(yī)學(xué)統(tǒng)計(jì)知識(shí)的正確運(yùn)
用,以保證統(tǒng)計(jì)描述和推斷正確的基礎(chǔ)。
調(diào)查設(shè)計(jì)與實(shí)驗(yàn)研究設(shè)計(jì)
專(zhuān)業(yè)設(shè)計(jì)統(tǒng)計(jì)設(shè)計(jì)
運(yùn)用專(zhuān)業(yè)知識(shí)進(jìn)行設(shè)計(jì)運(yùn)用統(tǒng)計(jì)學(xué)知識(shí)進(jìn)行設(shè)計(jì)
要求
選題、調(diào)查(實(shí)驗(yàn))、方法、材料確定設(shè)計(jì)方案、收集整理資料、確定
統(tǒng)計(jì)指標(biāo)、分析和推斷方法
向家
探討實(shí)驗(yàn)、觀察結(jié)果的適用性和創(chuàng)探討實(shí)驗(yàn)、觀察結(jié)果的可重復(fù)性、高
造性效性
方向
回答和解決科研課題,驗(yàn)證假說(shuō),減少和控制誤差。保證樣本的代表性
保證科研結(jié)果的先進(jìn)性和可靠性,保證實(shí)驗(yàn)結(jié)果的精確性和
目的
可重復(fù)性
2、收集資料(collectionofdata)
方式:1、統(tǒng)計(jì)報(bào)表2、經(jīng)常性工作記錄3、專(zhuān)題調(diào)查或?qū)嶒?yàn)
3、整理資料(sortingdata)
將原始數(shù)據(jù)進(jìn)行核對(duì)一、整理,使其系統(tǒng)化、條理化,對(duì)數(shù)據(jù)進(jìn)行
邏輯檢查,糾正錯(cuò)誤,提供整理和描述數(shù)據(jù)資料的科學(xué)方法,確定數(shù)
據(jù)的數(shù)量特征。
4、分析資料(analysisofdata)
根據(jù)不同的資料類(lèi)型,選擇不同的統(tǒng)計(jì)處理方法,計(jì)算有關(guān)指標(biāo),
反映數(shù)據(jù)的綜合特征,闡明事物的內(nèi)在聯(lián)系和規(guī)律。
統(tǒng)計(jì)分析包括:
①統(tǒng)計(jì)描述(descriptivestatistics):用統(tǒng)計(jì)指標(biāo)、
統(tǒng)計(jì)表、統(tǒng)計(jì)圖等方法,對(duì)資料的數(shù)量特征及分布規(guī)律進(jìn)行測(cè)定
和描述。
②統(tǒng)計(jì)推斷(inferentialstatistics):包括如何抽樣,
以及如何在隨機(jī)變量的樣本值基礎(chǔ)上推斷概率分布和總體值。統(tǒng)
計(jì)推斷中涉及的各種統(tǒng)計(jì)分析方法是本次授課的重點(diǎn)內(nèi)容。
四、醫(yī)學(xué)統(tǒng)計(jì)學(xué)在科研中的作用:
1、系統(tǒng)積臬和表達(dá)經(jīng)驗(yàn)
臨床經(jīng)驗(yàn)的積累在于大量的臨床實(shí)踐。實(shí)際上這些經(jīng)驗(yàn)都可以整
理和表達(dá)為統(tǒng)計(jì)信息,掌握了一定的統(tǒng)計(jì)學(xué)知識(shí),就可以將積累的經(jīng)
驗(yàn),通過(guò)對(duì)資料的收集、整理和分析,轉(zhuǎn)變?yōu)檎?guī)和系統(tǒng)的統(tǒng)計(jì)信息,
用以報(bào)告或發(fā)表,使人類(lèi)醫(yī)學(xué)知識(shí)寶庫(kù)不斷充實(shí)和發(fā)展。
2、完成科研工作
生物學(xué)是一門(mén)實(shí)驗(yàn)科學(xué),不管你從事的是生物學(xué)的哪一個(gè)分支,
都不可能完全脫離實(shí)驗(yàn),只進(jìn)行邏輯推理.而實(shí)驗(yàn)所得到的結(jié)果兒乎
無(wú)例外地都帶有或多或少的不確定性,即實(shí)驗(yàn)誤差.在這種情況下,
不用統(tǒng)計(jì)學(xué)要想得到正確的結(jié)論是不可能的,可以毫不夸張地說(shuō),作
為一個(gè)實(shí)驗(yàn)科學(xué)工作者,離開(kāi)了統(tǒng)計(jì)學(xué)就寸步難行,希望通過(guò)這門(mén)課
程的學(xué)習(xí),能夠掌握常用的統(tǒng)計(jì)方法,尤其是它們的條件,適用范圍、
優(yōu)缺點(diǎn)等,從而能夠應(yīng)用它們?nèi)ソ鉀Q實(shí)踐中遇到的問(wèn)題。否則,他將
無(wú)法知道其研究結(jié)果是否具有科學(xué)意義上的可重復(fù)性。要一一回答這
些問(wèn)題,要求研究者必須在整個(gè)研究過(guò)程中貫穿和運(yùn)用統(tǒng)計(jì)學(xué)的理論
和方法。
3、撰寫(xiě)研究報(bào)告和閱讀書(shū)刊
醫(yī)學(xué)研究中往往要涉及大量的數(shù)據(jù),但在撰寫(xiě)研究報(bào)告和論文
時(shí),只能使用經(jīng)過(guò)整理和歸納的統(tǒng)計(jì)指標(biāo),并且用規(guī)范的統(tǒng)計(jì)表和統(tǒng)
計(jì)圖表達(dá)。止匕外,在閱讀國(guó)外期刊時(shí).,如果不具備統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí),
則不能判斷別人研究結(jié)果的可信性和局限性,更談不上吸收和借鑒。
五、《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》中幾個(gè)重要的基本概念:
(1)總體(population)、樣本(sample)、個(gè)體(observedunit)
a.總體:根據(jù)研究目的所確定的性質(zhì)相同的所有個(gè)體的某種
變量值的集合。如:調(diào)查某地1999年正常成年男子的紅細(xì)胞數(shù),則
4察對(duì)衣:該地1999年正常成年男子。
4察草依:統(tǒng)計(jì)研究中的最基本單位,如:一個(gè)人、一個(gè)家庭、
一個(gè)地區(qū)等。
更察值(變量值人每個(gè)人測(cè)得的紅細(xì)胞數(shù)。
該地1999年正常成年男子的紅細(xì)胞數(shù)就構(gòu)成一個(gè)總體。
同質(zhì)基礎(chǔ):同一地區(qū)、同一年份、同為正常成人、同為男性
有限總體(finitepopulation):有確定的時(shí)間、空間和有限個(gè)觀
察單位,如上例。
無(wú)限總體(infinitepopulation):沒(méi)有確定的時(shí)間和空間限制,觀
察單位數(shù)為無(wú)限。如研究用某藥治療缺鐵性貧血的療效,此時(shí),總體
的同質(zhì)基礎(chǔ)是貧血患者,同時(shí)用某藥治療,該總體應(yīng)包括用該藥治療
的所有貧血患者的治療結(jié)果。
b.樣本:從總體中隨機(jī)抽取部分個(gè)體所組成的集合。
(隨機(jī)化原則:總體中每一個(gè)觀察單位均有同等機(jī)會(huì)被抽取)
(2)參數(shù)(parameter)、統(tǒng)計(jì)量(statistics)
統(tǒng)計(jì)學(xué)中把總體的指標(biāo)稱(chēng)為參數(shù),把所得樣本的平均數(shù)稱(chēng)為統(tǒng)計(jì)量。
(3)誤差(error):
抽祥篌差(samplingerror)由于總體中的個(gè)體間往往存在著
變異,隨機(jī)抽取的樣本僅是總體中的一部分個(gè)體,因而樣本測(cè)得的指
標(biāo)(統(tǒng)計(jì)量)往往與總體指標(biāo)(參數(shù))存在著差異,這種山于隨機(jī)抽
樣而造成的樣本的統(tǒng)計(jì)量與總體參數(shù)之間的差異,稱(chēng)為抽樣誤差,它
既不定量,也不定性。
系統(tǒng)篌差:由于設(shè)計(jì)不嚴(yán),測(cè)量?jī)x器不準(zhǔn)確,測(cè)量者水平的偏
差而造成的,這種誤差是定量的,可控的。
(4)統(tǒng)計(jì)資料
對(duì)每個(gè)觀察單位的某項(xiàng)特征進(jìn)行測(cè)量和觀察,其特征稱(chēng)為變量,
對(duì)變量的測(cè)值稱(chēng)為變量值,亦稱(chēng)為資料。
"計(jì)量資料(quantitativedata)
統(tǒng)計(jì)資料類(lèi)型“計(jì)數(shù)資料(qualitativedata)
I等級(jí)資料(rankeddat)
①、定量資料(quantitativedata)乂稱(chēng)藥計(jì)量資■料:
用專(zhuān)業(yè)儀器測(cè)量,具有計(jì)量單位的測(cè)量數(shù)據(jù),表現(xiàn)為數(shù)值的大小,
如身高(cm)、體重(kg)、血壓(kPa)等。
特點(diǎn),每個(gè)現(xiàn)察單位的現(xiàn)察他同有蜃的區(qū)別
②、定嵯資料(qualitativedata):其觀察值是定性的,表現(xiàn)為
互不相容的類(lèi)別或?qū)傩?即將觀察單位按某種屬性或類(lèi)別分組,所得
各組的觀察單位數(shù))。
特點(diǎn),每個(gè)現(xiàn)察單位的現(xiàn)察他間有質(zhì)的區(qū)別
分兩種情況:
1、無(wú)序分類(lèi)(unorderedcategories)X稱(chēng)為計(jì)數(shù)資料
a.二項(xiàng)分類(lèi)檢驗(yàn)結(jié)果可以是陽(yáng)性或陰性、治療結(jié)果可以是治
愈或未愈、性別屬性等,表現(xiàn)為兩類(lèi)間互相對(duì)立。
氏多項(xiàng)分類(lèi)某種觀察結(jié)果為互不相容的多個(gè)類(lèi)別,如血型、
職業(yè)等。
2、有序分類(lèi)(ordinaCcategories)W稱(chēng)為等級(jí)資料
介于定量測(cè)量和定性觀察之間的半定量觀察結(jié)果,如測(cè)定某人
群血清反應(yīng),以人為觀察單位,結(jié)果分為一、土、+、++四級(jí),又如
觀察以某種藥治療某病患者的治療結(jié)果,以每個(gè)患者為觀察單位,結(jié)
果分為治愈、顯效、好轉(zhuǎn)、無(wú)效四級(jí),通常有兩個(gè)以上等級(jí)。
等級(jí)資料與計(jì)數(shù)資料的區(qū)別在于,等級(jí)資料雖然是多分類(lèi)資料,
但各個(gè)類(lèi)別存在著大小和程度上的差別。
特點(diǎn):各類(lèi)之間/程度的差別
資料的轉(zhuǎn)化和分析:根據(jù)分析問(wèn)題的需要,各類(lèi)變量可以互相轉(zhuǎn)化。
如:觀察某人群成年男子的血紅蛋白量(g/L),屬數(shù)值變量;
若分析比較某種病人的血紅蛋白水平與正常人有無(wú)差別,須按計(jì)
量資料進(jìn)行處理。
序號(hào)正常人組病人組
-T
2
3
4
5
6
7
8
9
若按血紅蛋白正常與偏低分為兩類(lèi),可按二項(xiàng)分類(lèi)資料處理;
正常人組病人組
正常
_____偏低
合計(jì)
若按貧血的診斷標(biāo)準(zhǔn)將血紅蛋白含量分為五個(gè)等級(jí):重度貧血、
中度貧血、輕度貧血、正常、血紅蛋白增高,可按等級(jí)資料處理。
正常人組病人組
重度貧血
中度貧血
輕度貧血
正常
血紅蛋白增高
合計(jì)
(5)頻率(frequency)、概率(probability)
醫(yī)學(xué)研究的大多數(shù)現(xiàn)象是隨機(jī)現(xiàn)象,例如用同一種治療方法治
療某病的一群患者,可以知道治療的結(jié)果有四種,但對(duì)于一個(gè)病人其
治療后的結(jié)果是不確定的,此時(shí)的每一種可能發(fā)生的結(jié)果都是一個(gè)隨
機(jī)事件(偶然事件、事件)。
定義:在n次隨機(jī)試驗(yàn)中,隨機(jī)事件A發(fā)生了k次,記力⑹=£
n
則稱(chēng)⑹為隨機(jī)事件A在n次試驗(yàn)中出現(xiàn)的頻率。
實(shí)踐證明,大量的試驗(yàn)中隨機(jī)事件會(huì)呈現(xiàn)出頻率穩(wěn)定性。
定義:描述隨機(jī)事件A發(fā)生可能性大小的數(shù)值,稱(chēng)為A的概率,
記作P(A),簡(jiǎn)記為P。假如臨床觀察中治療200病人的樣本,求得
治愈率為75%,這只是一個(gè)頻率。實(shí)際應(yīng)用中,當(dāng)概率不易求得時(shí)一,
常用n—8時(shí)的頻率作為概率的估計(jì)值。但當(dāng)n較少時(shí),頻率的波動(dòng)
性是很大的,用于估計(jì)概率是不可靠的。
隨機(jī)事件概率的大小在0與1之間。
P值越接近1,表示某事件發(fā)生的可能性越大;
P值越接近0,表示某事件發(fā)生的可能性越小。
嚴(yán)格說(shuō),P=1表示事件必然發(fā)生,P=0表示事件不可能發(fā)生,他
們是確定性的,不是隨機(jī)事件,但可把他們看成隨機(jī)事件的特例。
統(tǒng)計(jì)分析中的很多結(jié)論都是帶有概率性的。習(xí)慣上將PW0.05
稱(chēng)為小概率事件,表示在一次實(shí)驗(yàn)或觀察中該事件發(fā)生的可能性很
小,可以視為很可能不發(fā)生。
《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》的學(xué)習(xí)重點(diǎn)是:
1、掌握其基本知識(shí)、基本技能、基本概念、基本方法。
建立邏輯思維方法和提高分析問(wèn)題的能力。
2、掌握調(diào)查設(shè)計(jì)和試驗(yàn)設(shè)計(jì)的基本原則。
培養(yǎng)收集、整理、分析統(tǒng)計(jì)資料的系統(tǒng)工作能力。
3、掌握一套統(tǒng)計(jì)軟件的使用方法(SAS、SPSS、STATA等)。
能夠達(dá)到在完成《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》課程后,獨(dú)立完成科研論
文和正確應(yīng)用統(tǒng)計(jì)方法。
第二講集中趨勢(shì)
舉例
設(shè)有A、B兩名新戰(zhàn)士,他們的射擊技術(shù)可用下面的分布來(lái)表示:
戰(zhàn)士A戰(zhàn)士B
擊中環(huán)數(shù)8910擊中環(huán)數(shù)8910
對(duì)應(yīng)概率0.30.10.6對(duì)應(yīng)概率0.20.50.3
問(wèn)哪一個(gè)戰(zhàn)士射擊技術(shù)較好?1、頻數(shù)分布表
1人頻數(shù)表的編制
相同觀察結(jié)果出現(xiàn)的次數(shù)稱(chēng)為頻數(shù)。將所有觀察結(jié)果的頻數(shù)按一定順序排列
在,?起便是頻數(shù)友(frequencytable)。
步驟:
①找出最大和最小值,計(jì)算極差R=Xmax-Xmin
②根據(jù)斯梯階公式確定組距
1+3.3221ogn
③掃描樣本值,劃記后獲得頻數(shù)
2人頻數(shù)表的用途
①大樣本數(shù)據(jù)(不限于計(jì)量資料)常用的表達(dá)方式。
②便于觀察數(shù)據(jù)的分布類(lèi)型。
③便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值,必要時(shí)經(jīng)
檢驗(yàn)后舍去。
④當(dāng)樣本含量足夠大時(shí),各組段的分布頻率作為分布概率的估計(jì)值。
例7.我國(guó)某地農(nóng)村1995年已婚育齡婦女現(xiàn)有子女?dāng)?shù)的分布
子女?dāng)?shù)婦女?dāng)?shù)f頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)
(1)(2)(3)(4)(5)
0137519.45137519.45
12519117.303892226.75
23042620.916934847.65
32856019.629790867.28
42171914.9211962782.20
5136959.4113332291.61
672554.9814057796.60
732682.2514384598.85
81510.1014499699.64
93730.2614536999.89
N101560.11145525100.00
合計(jì)145525100.00——
2、集中位置的描述
平均數(shù)(average)是統(tǒng)計(jì)中最廣泛、最重要的一個(gè)指標(biāo)體系。用來(lái)描述一組變
量的集中趨勢(shì)、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡(jiǎn)
明概括的印象,又便于組間的比較。常用平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。
(―)>均數(shù)(mean)的計(jì)算
①直接法〃〃
例1、10名7歲男童體重(kg)分別為17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,
24.0,25.5.求平均體重。
元=(17.3+18.0+19.4+20.6+21.2+21.8+22.5+23.2+24.0+25.5)/10=21.35(kg)
②頻數(shù)表法:
F_/否+2+hX;+....+f/k_Zfx
■力苫
例2:某地隨機(jī)檢查了140名成年男性紅細(xì)胞數(shù)(10"/L)
4.765.265.6115.954.464.574.315.184.924.274.774.88
5.004.734.475.344.704.814.935.044.405.274.635.50
5.244.974.714.444.945.054.784.524.635.515.244.98
4.334.834.565.444.794.914.264.384.874.995.604.46
4.955.074.805.304.654.774.505.375.495.224.585.07
4.814.543.824.014.894.625.124.854.595.084.824.93
5.054.404.145.014.375.244.604.714.824.945.054.79
4.524.644.374.874.604.724.835.334.684.804.154.65
4.764.884.613.974.084.584.314.054.165.045.154.50
4.624.734.474.584.704.814.554.284.784.514.634.36
4.484.595.095.205.325.054.414.524.644.754.494.22
4.715.214.944.685.174.915.024.76
紅細(xì)胞數(shù)(10'7L)頻數(shù)f組中值XFx
(1)(2)(3)(4)=(2)*(3)
3.80-23.907.8
4.00-64.1024.6
4.20-114.3047.3
4.40-254.50112.5
4.60-324.70150.4
4.80-274.90132.3
5.00-175.1086.7
5.20-135.3068.9
5.40-45.5022.0
5.60-25.7011.4
5.80-15.905.9
合計(jì)140(Zf)669.8(SfX)
T:_/|斗++于3毛+.…+于占_
£fF
=4.78(107L)
均數(shù)的兩個(gè)重要特征:
①各離均差的總和等于零
Z(x-X)=O
證明:-x)=22七一〃x=Zx,—22七=0
②各離均差的平方和小于各觀察值X與任何數(shù)a之差的平方
Z(x-X)2<Z(x-ap
均數(shù)的應(yīng)用:
1.用來(lái)描述一組變量值的平均水平,具有代表性,因此變量值必須是同質(zhì)的。
2.適用于呈正態(tài)分布(對(duì)稱(chēng)分布)的資料。
(2)幾何均數(shù)(geometricmean)的計(jì)算
1)直接法
G=4須-x2?x3???xn
G=lg-'*?+—+…lgx")=lg-.(Z]g±)
nn
例3:5人的血清滴度為:1:2,1:4,1:8,1:16,1:32,求平均滴度。
G=^/2x4x8xl6x32
LgG=(lg2+lg4+lg8+lg16+lg32)/5=0.903
G=lg'0.903=8故平均滴度為1:8。
2)頻數(shù)表法
G=lg-'(容臀)
例4:40名麻疹疫苗接種麻疹疫苗后一個(gè)月,血凝抑制抗體滴度見(jiàn)下表,
求平均滴度。
抗體滴度人數(shù)f滴度倒數(shù)XLgXf*lgX
(1)(2)(3)(4)(5)=(2)*(4)
14140.60210.6021
18580.90314.5155
1166161.20417.2246
1322321.50513.0102
1647641.806212.6434
1128101282.107221.0720
125642562.40829.6328
151255122.709313.5465
4072.2471
LgG=(ZflgX/XD=72.2471/40=1.8062G=lg'1.8062=64
血凝抑制抗體滴度的平均滴度為1:64
幾何均數(shù)的應(yīng)用:用于等比級(jí)數(shù)資料和對(duì)數(shù)正態(tài)分布資料,
如:某些傳染病的潛伏期、抗體滴度、細(xì)菌計(jì)數(shù)等。
(3)、中位數(shù)和百分位數(shù)的計(jì)算
中位數(shù)(median,M)是將一組觀察值從小到大按順序排列,位次居中
的數(shù)值對(duì)應(yīng)的觀察值就是中位數(shù)。因而全部觀察值中,大于和小于中位數(shù)的
Da接法:將原訟觀察值按大小順序排列:
M=X四
n為奇數(shù)時(shí),-
X“,+X
n為偶數(shù)時(shí),M=1=―一一」
例5.測(cè)得5個(gè)人的低密度脂蛋白中載體B蛋白的含量(mg/dl)分別為0.84,2.58,
5.46,8.58,9.60,求其中位數(shù).
M=Xn+i
W
=X3=5.46mg/dl
例6.8名新生兒的身長(zhǎng)(cm)依此為50,51,52,53,54,54,55,58,求
其中位數(shù)。
X弓)+X(>1)_53+
2—2
2)頻數(shù)表法
乙=乙+.("%%一£九)
例7.對(duì)某地630名50歲~60歲的正常女性檢查了血清甘油三脂含量,并制成如
下頻數(shù)表,試求中位數(shù)及第25、75、90百分位數(shù)。
甘油三脂mg/dl頻數(shù),f累計(jì)頻數(shù)累計(jì)頻率(%)
(1)(2)(3)(4)
10~27274.3
40~16919631.1
70~16736357.6
100-9445772.5
130-8153885.4
160-4258092.1
190-2860896.5
220-1462298.7
250-462699.4
280-362999.8
310-1630100.0
合計(jì)630——
”630x0.5-196”…、
m=70H------------------x30=91.4(mg/dl)
4八630x0.25-27“0?/」八
“25=40H-----------------------x30=63.2(〃2g/dl)
i630x0.75-457”……,」八
p=130+---------------------x30=135.1(mg/dl)
1581
v八630x0.90-538.1。八十…、
〃9o=160H--------------------------x30=180.7(mg/d/)
例8.某日大氣中SO2的日平均濃度(ug/n?)見(jiàn)下表,分別求第25、75、95
百分位數(shù)及中位數(shù)。
濃度(ug/mD天數(shù),f累計(jì)頻數(shù)累計(jì)頻率(%)
(1)(2)(3)(4)
5~393910.8
50~6710629.4
75~6417047.1
100-6323364.5
125-4527877.0
150-3030885.3
175-1732590.0
200-933492.5
225-734194.5
634796.1
275-535297.5
300-335598.3
325-6361100.0
361
P,=/+/(〃.x%_£力)
253o
/^5=50+-(361x25%-39)=69.12(//g/m)
67
252
P75=125+1|(361x75%-233)=145.97(〃g/m3)
25a3
/^5=250+—(361x95%-341)=258.12(//g/m)
6
253
/^0=100+—(361/2-170)=104.17(/zg/m)
63
中位數(shù)和百分位數(shù)的應(yīng)用:
1.用于描述偏態(tài)分布資料的集中位置。反映位次居中的觀察值的水平。
2.百分位數(shù)是用于描述樣本或總體觀察值序列在某百分位置水平,最常用
的百分位數(shù)是中位數(shù)。
3.百分位數(shù)常用來(lái)確定醫(yī)學(xué)參考值范圍。
第三講離散趨勢(shì)
離散程度的描述
三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢(shì)與離散趨勢(shì)。
甲組2628303234X甲=30kgR=8S=3.16
已組2427303336X乙=30kgR=12S=4.74
丙組2629303134X丙=30kgR=8S=2.91
哪一組數(shù)值的代表性好?
(1)極差(range)
一組觀察值中,最大值與最小值差,反映個(gè)體差異的范圍。極差大,說(shuō)明變
異度大,各變量值離均數(shù)越遠(yuǎn),數(shù)據(jù)越分散;反之亦然。
(2)四分位數(shù)(quartile)間距
可看成是特定的百分位數(shù),用它說(shuō)明個(gè)體差異比極差穩(wěn)定。
Q=P75-P25
一般來(lái)說(shuō),樣本例數(shù)越多,四分位間距越穩(wěn)定。
(3)方差(variance)與標(biāo)準(zhǔn)差的計(jì)算
方差:o2=X(x-|i)2/N
n-\
由上式可知:方差考慮了總體中每個(gè)變量值x與總體均數(shù)之差(x-m,稱(chēng)
為離均差平方和(SS),因此方差近似等于離均差平方和的算數(shù)均數(shù),故又稱(chēng)為
均方差(MS),由于SS利用了每一個(gè)觀察值的信息,因而反映一批數(shù)據(jù)的變異
程度優(yōu)于極差和四分位間距。
(4)標(biāo)準(zhǔn)差(standarddeviation)
方差開(kāi)方后稱(chēng)為標(biāo)準(zhǔn)差,其單位與變量值單位及均數(shù)單位相同,變異度越
大,則離均差平方和越大,標(biāo)準(zhǔn)差越大,說(shuō)明個(gè)體差異越大,均數(shù)的代表性越差。
為了簡(jiǎn)化計(jì)算,標(biāo)準(zhǔn)差的計(jì)算公式還可寫(xiě)為:
J〃
n-1
分組資料的計(jì)算:
n
S寸n-\
如上例:n=110£僅2=1584990£fx=13194
s=1-
但84990-131942/110
Viio-i
(5)變異系數(shù)(cofflcientofvariation,CV)
定義:標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,cv=4x100%
X
其描述了相對(duì)于算術(shù)均數(shù)而言標(biāo)準(zhǔn)差的大小,即描述數(shù)據(jù)的變異相對(duì)于其平
均水平來(lái)說(shuō)是大還是小。
與前面介紹的四種離散程度指標(biāo)相比,變異系數(shù)有以下兩個(gè)不同之處:
1:它描述的不是數(shù)據(jù)分布的絕對(duì)離散程度,而是相對(duì)離散程度;
2:它不象極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差那樣具有取值單位。
這兩個(gè)特點(diǎn)決定了變異系數(shù)的應(yīng)用也不同于前面四個(gè)離散程度指標(biāo)。
它常用于:
1、比較度量衡單位不同的多組資料的變異度:
例如:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm;
其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg.欲比較身高與體重的變異何者為大,
由于度量單位不同,不能比較其標(biāo)準(zhǔn)差而應(yīng)比較其變異系數(shù)
身高cv=495夕〃*io。%=2.98%
166.06c機(jī)
體重CV=496版X100%=923%
53.72kg
由此可見(jiàn),該地20歲男子體重的變異大于身高的變異。
2.比較均數(shù)相差懸殊的多組資料的變異度:
某地不同年齡組男子身高的變異程度
年齡組人數(shù)均數(shù)土標(biāo)準(zhǔn)差變異系數(shù)(%)
3—3.5歲10090.1±3.13.2
30—35歲100170.2±5.00.3
表中可見(jiàn),雖然30?35歲組的標(biāo)準(zhǔn)差明顯大于3-3.5歲組的標(biāo)準(zhǔn)差,但事
實(shí)上30?35歲組男子身高的變異并不大,而3?3.5歲組男童身高的變異卻很
大。這種均數(shù)相差懸殊的資料比較變異程度時(shí),應(yīng)當(dāng)用變異系數(shù)說(shuō)明其變異情況。
小結(jié)
為了解數(shù)值變量的分布規(guī)律,可將觀察值編制頻數(shù)表,繪制頻數(shù)分布圖,
用于描述資料的分布特征(集中趨勢(shì)和離散趨勢(shì)),以及分布類(lèi)型(對(duì)稱(chēng)分布
和偏態(tài)分布)。
平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo),它代表一組觀察值的平均水平,
常用平均數(shù)的指標(biāo)下表:
平均數(shù)意義應(yīng)用場(chǎng)合
均數(shù)平均數(shù)量水平應(yīng)用甚廣,最適用于對(duì)稱(chēng)分布,特別是正態(tài)分布
幾何均數(shù)平均增(減)倍數(shù)等比級(jí)數(shù)資料,對(duì)數(shù)正態(tài)分布
中位數(shù)位次居中的觀察值水平偏態(tài)分布,分布不明,分布末端無(wú)確定值
百分位數(shù)描述觀察序列在某百分位置的水平,是分布的百分界值,可用于
醫(yī)學(xué)參考值范圍,適用于任何分布。
二、描述頻數(shù)分布離散程度的指標(biāo)有:
1)極差與四分位間距,后者較穩(wěn)定,但均不能綜合反映各觀察值的變異程度;
2)方差和標(biāo)準(zhǔn)差,最為常用,對(duì)正態(tài)分布尤為重要;
3)變異系數(shù)常用于:不同測(cè)量單位的幾組資料變異度的比較;均數(shù)相差懸殊
的兒組資料變異度的比較。
第四講正態(tài)分布及其應(yīng)用
一、正態(tài)分布的概念和特征
根據(jù)頻數(shù)表資料繪制成直方圖,可以設(shè)想,如果將觀察人數(shù)
逐漸增多,線段不斷分細(xì),圖中直條將逐漸變窄,其頂端將逐漸
接近一條光滑的曲線,這條曲線稱(chēng)為頻數(shù)曲線或頻率曲線,略呈
鐘型,兩頭低,中間高,左右對(duì)稱(chēng),近似于數(shù)學(xué)上的正態(tài)分布(normal
distribution)o由于頻率的總和等于100%或1,故橫軸上曲線下的
面積等于100%或lo
有極其重要的地位。許多生物學(xué)現(xiàn)象所產(chǎn)生的數(shù)據(jù),都服從正態(tài)
分布。
1、正態(tài)分布的圖形有了正態(tài)分布的密度函數(shù)f(X),即正態(tài)
上式中右側(cè)JR為均數(shù),b為標(biāo)準(zhǔn)差,x為自變量。當(dāng)x確定
后,就可由此式求得其密度函數(shù)f(x),也就是相應(yīng)的縱坐標(biāo)的高度。
所以,已知和就能繪出正態(tài)曲線的圖形。
2、正態(tài)分布的特征
(1)正態(tài)分布以日為中心,左右對(duì)稱(chēng)。
(2)正態(tài)分布有兩個(gè)參數(shù),即日和o。日是位置參數(shù),當(dāng)o恒定
后,日越大,則曲線沿橫軸越向右移動(dòng);口越小,則曲線沿橫
軸越向左移動(dòng)。o是變異參數(shù),當(dāng)日恒定時(shí),o越大,表示數(shù)
據(jù)越分散,曲線越“胖”;a越小,表示數(shù)據(jù)越分散,曲線越
,,瘦二
(3)正態(tài)分布的偏斜度Yi=O,峭度Y2=0
為了應(yīng)用方便,常將上式作如下變換,
X-LI
U=-----------
(J
也就是將原點(diǎn)移到日的位置,使橫軸尺度以Q為單位,使
口=0,b=l,則正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布。(standardnormal
distribution),u稱(chēng)為標(biāo)準(zhǔn)正態(tài)離差(standardnormaldeviate)
標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)為:
1--
一般用N(口,er2)表示均方為w方差為o?的正態(tài)分布。于是
標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示。
標(biāo)準(zhǔn)正態(tài)分布有以下特征:
(1)在u=0時(shí),<p(u)達(dá)到最大值。
(2)當(dāng)u無(wú)論向哪個(gè)方向遠(yuǎn)離0時(shí),(p(u)的值都減小。
(3)曲線關(guān)于Y軸對(duì)稱(chēng),即(p(u)=(p(-u)o
(4)曲線和橫軸所夾的面積等于1。
二、標(biāo)準(zhǔn)正態(tài)曲線下面積的計(jì)算
P(ui<IU|<u2)=(p(u2)-<p(U!)
舉例
已知高梁品種“三尺三”的株高服從正態(tài)分布N(156.2,4.822),
求:(l)X<161cm的概率;(2)X>161cm的概率;(3)X在152-162cm
間的概率。
(1)依題意:
P(X<161)=火F:;:?)=/⑴=0.84134
所以,“三尺三”的株高低于161cm的概率為084134。
(2)依題意得:
P(X>164)==1—0(1.62)=1-0.94738=0.05262
(3)依題意得:
P(152<X<162)=制162;;;6.2)_火152;;;6.2)=例|_^>(-0.87)=0.88493-0.19215=0.69278
下列一些值很重要,應(yīng)予記憶:
U=-1到U=1面積=0.6827
u=-1.96至Uu=1.96面積=0.9500
u=-2.58至I」u=2.58面積=0.9900
三、小結(jié)
1、正態(tài)分布是一種連續(xù)性的分布,不少醫(yī)學(xué)現(xiàn)象服從正態(tài)分布
或近似正態(tài)分布.(如同性別、同年齡兒童的身高,同性別健康成人的
紅細(xì)胞數(shù)、血紅蛋白量、脈搏數(shù)等,以及實(shí)驗(yàn)中的隨機(jī)誤差等);或
經(jīng)變量變換轉(zhuǎn)換為正態(tài)分布(如某些病人的潛伏期以及醫(yī)院病人住院
天數(shù)等),可按正態(tài)分布規(guī)律來(lái)處理,它也是許多統(tǒng)計(jì)方法的理論基
礎(chǔ)。
2、正態(tài)分布的特征是:
(1)曲線在橫軸上方,均數(shù)處最高;
(2)以均數(shù)為中心,左右對(duì)稱(chēng);
(3)確定正態(tài)分布的兩個(gè)參數(shù)是均數(shù)目和標(biāo)準(zhǔn)差
正態(tài)分布用N(|i,Q2)表示,為了應(yīng)用的方便,常對(duì)變量x作
u=(x-p)/a使口=0,a=l,則正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布用N(0,
1)表示。
3、運(yùn)用正態(tài)曲線下面積的分布規(guī)律,可計(jì)算醫(yī)學(xué)參考值范圍和
質(zhì)量控制等。
第四講:總體均數(shù)的估計(jì)和假設(shè)檢驗(yàn)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)的最基本問(wèn)題是研究總體與樣本的關(guān)系。
總體與樣本的關(guān)系,可從兩方面研究:
(1)由已知的總體,研究樣本的分布規(guī)律,即由總體到樣本的
研究過(guò)程;
(2)由樣本如何去推斷未知的總體,屬于從樣本到總體的研究
過(guò)程。
1、從一個(gè)正態(tài)總體中抽取的樣本統(tǒng)計(jì)量分布
生物學(xué)中遇到最多的是正態(tài)總體。對(duì)于正態(tài)總體,可以用數(shù)
學(xué)推演的方法,得出嚴(yán)格的樣本統(tǒng)計(jì)量的抽樣分布,有了嚴(yán)格的樣
本分布規(guī)律,就可以由樣本來(lái)推斷總體了。
標(biāo)準(zhǔn)差已知時(shí)的樣本平均數(shù)的分布——u分布
平均數(shù)為山標(biāo)準(zhǔn)差為b的正態(tài)總體中,獨(dú)立隨機(jī)的抽取含
量為n的樣本,貝I」:
(T
樣本平均數(shù)是一服從正態(tài)分布的隨機(jī)變量,記為Xo
將平均數(shù)標(biāo)準(zhǔn)化,則:
x-U
LI=
(J
其中的分母稱(chēng)為平均數(shù)的標(biāo)準(zhǔn)誤差(standarderrorofmean)0如果
變量是正態(tài)的或近似正態(tài)的,則標(biāo)準(zhǔn)化的變量服從或近似地服從N
(0,1)分布。
1、標(biāo)準(zhǔn)差已知
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 防火墻設(shè)置與管理試題及答案
- 考前心理調(diào)適2025年信息系統(tǒng)項(xiàng)目管理師試題及答案
- 知識(shí)提升信息系統(tǒng)項(xiàng)目管理師試題及答案
- 長(zhǎng)線備考西方政治考試的方案試題及答案
- 機(jī)電工程2025年外部環(huán)境試題及答案
- 西方政治制度與文化遺產(chǎn)保護(hù)的結(jié)合探討試題及答案
- 政治變革中的青年參與關(guān)系試題及答案
- 網(wǎng)絡(luò)工程中的團(tuán)隊(duì)協(xié)作與試題及答案
- 解析軟件設(shè)計(jì)師考試問(wèn)答試題及答案
- 機(jī)電工程國(guó)際技術(shù)標(biāo)準(zhǔn)試題及答案
- 納米陶瓷噴涂施工方案范本
- 銀行訴訟案件管理辦法
- 危險(xiǎn)性較大的分部分項(xiàng)工程專(zhuān)項(xiàng)施工方案編制指南
- 云南省昆明市成考專(zhuān)升本2023年醫(yī)學(xué)綜合真題及答案
- 生物質(zhì)材料及應(yīng)用淀粉
- GB/T 4223-2004廢鋼鐵
- GB/T 36148.1-2018船舶與海上技術(shù)海上環(huán)境保護(hù)圍油欄第1部分:設(shè)計(jì)要求
- GB 2811-1989安全帽
- 端子壓接規(guī)范標(biāo)準(zhǔn)
- 新版《藥品管理法》解讀課件
- 東南大學(xué)附屬中大醫(yī)院ECMO操作記錄單
評(píng)論
0/150
提交評(píng)論