02-1個體變異與變量分布課件_第1頁
02-1個體變異與變量分布課件_第2頁
02-1個體變異與變量分布課件_第3頁
02-1個體變異與變量分布課件_第4頁
02-1個體變異與變量分布課件_第5頁
已閱讀5頁,還剩71頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章個體變異與變量分布一、個體變異二、頻數分布三、定量資料的統計指標四、定性資料與等級資料的統計指標102-1個體變異與變量分布個體變異(individualvariation)是同質觀察對象間表現出的差異。變異是生物體在一種或多種、已知或未知的不可控因素作用下所產生的綜合反映。就個體而言:變異是隨機的(random)。就總體而言:個體變異是有規律的。202-1個體變異與變量分布幻燈片1個體變異是統計學應用的前提個體變異抽樣誤差統計推斷302-1個體變異與變量分布(一)定量資料的頻數分布例:某市1997年12歲男童120人的身高(cm)資料142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9402-1個體變異與變量分布1.頻數分布表的制作步驟(1)計算極差(R)

R=Xmax

–Xmin=160.9-125.9=35(cm)

(2)確定組數、組距:

組數:8~12

組距:i=R/組數=35/10=3.5≈4(cm)(4)確定組段:含下限,不含上限

第一組段下限≤Xmin

最后一組上限>Xmax

(4)劃記:計算頻數、頻率2.分布圖502-1個體變異與變量分布124~10.0083128~20.0167132~100.0833136~220.1834140~370.3083144~260.2167148~150.1250152~40.0333156~20.0167組段頻數頻率160~16410.0083合計1201.0000

1997年某市120名12歲男童的身高(cm)頻數分布劃記

正正正正正正正正正正正正正正正正正正正正正正正上一張幻燈片602-1個體變異與變量分布

某市120名12歲男童身高的頻數分布124132140148156164010203040人數身高(cm)702-1個體變異與變量分布定性資料的整理:根據指標的自然屬性歸類,計數頻數等級資料的整理:根據指標的不同等級歸類,計數頻數

507名傣族人血型的頻數分布O20540.43A11222.09B15029.59血型頻數頻率(%)AB407.89合計507100.00(二)定性資料及等級資料的頻數分布802-1個體變異與變量分布709對肺癌患者和非肺癌患者吸煙情況

肺癌6472

4119709組別男性女性合計吸煙不吸煙

吸煙不吸煙對照62227

2832709合計126929

69511418

此表是Doll和Hill于1948年至1952年間采用回顧性配對調查方法研究了吸煙與肺癌的關系得到的資料(此表分類方法是交叉分類)902-1個體變異與變量分布例:某醫院探討不同期次矽肺的胸部平片肺門密度變化,資料如下表,問矽肺患者肺門密度的增加與矽肺期次有無關系?Ⅰ肺門密度級別+++++4318814245Ⅱ19672169Ⅲ6175578

合計50301141492合計矽肺期次1002-1個體變異與變量分布描述分布類型描述分布的特征便于發現特大、特小的可疑值便于計算有關指標、統計分析與處理頻數分布表和頻數分布圖的用途1102-1個體變異與變量分布(三)數據的分布類型

對稱分布:非對稱分布(偏態分布)對稱分布:頻數以中間最多,兩側逐漸減少,基本對稱右偏態(正偏態):高峰在左側,尾部拖在右側左偏態(負偏態):高峰在右側,尾部拖在左側單峰分布:雙峰或多峰分布:

正偏態(右)負偏態(左)分布的對稱峰的多少1202-1個體變異與變量分布

某市120名12歲男童身高的頻數分布124132140148156164010203040人數身高(cm)1302-1個體變異與變量分布70

3

5

7

9

11

13

15

17

19

21

10

20

30

40

50

60

0

1

發汞含量()239人發汞含量的頻數分布人數1402-1個體變異與變量分布0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自評分

某城市892名老年人生存質量自評分的頻數分布人數1502-1個體變異與變量分布0

5

10

15

20

25

30

35

40

45

0

10203040

生存時間(月)102名黑色素瘤患者的生存時間頻數分布人數1602-1個體變異與變量分布0

10

20

30

40

50

60

70

80

0

1000

2000

3000

4000

人數死亡年齡(歲)某地某年10000例死亡者年齡分布1702-1個體變異與變量分布分布類型對稱分布正偏態(右)負偏態(左)幻燈片11802-1個體變異與變量分布

集中位置的描述

離散趨勢的描述三、定量資料的統計指標1902-1個體變異與變量分布

是描述一組變量值的集中趨勢或平均水平的統計指標。是一組變量值的集中水平的代表值。種類:算術均數、幾何均數、中位數、眾數、加權均數等注意:同質的變量值才能在一起求平均數!平均數(集中位置描述)2002-1個體變異與變量分布(一)算術均數(arithmeticmean)簡稱均數(mean)1.適用條件:單峰對稱分布、正態分布的資料2.計算公式:①小樣本:加權系數例:某門功課的成績:平時占0.2,期中占0.3,期末占0.5

則平均成績為:2102-1個體變異與變量分布②大樣本:各組段的頻數各組段的組中值2202-1個體變異與變量分布124~10.0083128~20.0167132~100.0833136~220.1834140~370.3083144~260.2167148~150.1250152~40.0333156~20.0167組段頻數頻率160~16410.0083合計1201.00001997年某市120名12歲男童的身高(cm)組中值1261301341381421461501541581622302-1個體變異與變量分布例:五人血清抗體滴度:

1:10,1:100,1:1000,1:10000,1:100000看一個實例2402-1個體變異與變量分布1適用條件:各變量值成倍數或對數正態分布的資料2公式:3計算(二)幾何均數(geometricmean)2502-1個體變異與變量分布例、有5份血清的抗體效價分別為

1:10,1:20,1:40,1:80,1:160,求平均抗體效價?此5人血清的平均抗體效價為1:40。

2602-1個體變異與變量分布使用注意:(1)變量值中不能有0;(2)同一組變量值不能同時存在正,負值;(3)若變量全為負值,計算時將負號除去,算完后再加上。有25份血清的抗體效價分別為抗體效價1:10,1:20,1:40,1:80,1:160,人數25873所以,這25份血清的平均效價是1:44.7。2702-1個體變異與變量分布(三)中位數(median)及百分位數(percentile)將一組變量值從小到大排列,居中的那個變量值。

1.適用條件:任何分布(偏態、分布不明、兩端無界限)

2.計算公式:小樣本:當n為偶數例、有10人的發汞值()1.1,1.8,3.5,4.2,4.8,5.6,5.9,7.1,10.5,16.3當n為奇數:2802-1個體變異與變量分布L:M所在組的下限i:M所在組的組距fm:M所在組的頻數:M所在組前一組累積頻數大樣本:57發汞值60M572902-1個體變異與變量分布例2.16在某市測得239名正常人發汞,資料見表2.11,試計算其95%參考值范圍。表2.11某市239名正常人發汞值發汞值

(

g/g)

男性女性合計頻數

1~81220203~313566865~2832601467~2325481949~1171821211~1241622813~33623415~10123517~1

0123619~21213239合計120119239--

某市239名正常人發汞值累積頻數3002-1個體變異與變量分布百分位數0PxM100%

百分位數是一個位置指標,以PX表示。一個百分位數將全部觀察值分為兩部分:

x%的變量值小于PX;(100-x)%的變量值大于PX

。有10人的發汞值(umol/Kg)1.1,1.8,3.5,4.2,4.8,5.6,5.9,7.1,10.5,16.33102-1個體變異與變量分布

1~81220203~313566865~2832601467~2325481949~1171821211~1241622813~33623415~10123517~10123619~21213239合計120119239--

某市239名正常人發汞值發汞值男性女性合計頻數累積頻數3202-1個體變異與變量分布

應用中位數和百分位數時注意事項:①所有分布類型的資料均可計算中位數和百分位數;②例數較少時,接近兩端的百分位數不穩定,不宜用兩端的百分位數估計頻數分布范圍;③中位數抗極端值的影響,比均數好,但不及均數精確;當資料可計算均數或幾何均數時,不宜計算中位數。3302-1個體變異與變量分布

描述集中趨勢的指標:平均數種類適用條件計算公式正態分布對數正態

任何分布

3402-1個體變異與變量分布有甲、乙兩組同性別同年齡兒童體重(公斤)

:甲組26,28,30,32,34

乙組24,27,30,33,36看一個實例上述兩組數據的特點:集中位置相同:均為30kg

離散程度不同:各觀察值與均數的的差值不同3502-1個體變異與變量分布離散趨勢的描述全距(range)四分位數間距(interquartilerangeQ)方差、標準差(varianceandstandarddeviation)變異系數(coefficientofvariation)3602-1個體變異與變量分布1.全距(極差)

R=Xmax-Xmin反映資料的分布范圍

R大→變異程度大,R小→變異程度小

優點:簡單明了

缺點:不靈敏:只考慮了最大、最小值抽樣誤差大,不穩定3702-1個體變異與變量分布

2.四分位數間距(Q)

即P75

與P25

之差

P25

:1/4的觀察值小于它,稱下四分位數P25

~QL。

P75

:1/4的觀察值大于它,稱上四分位數P75

~QU。

Q=QU-QL,其間包含了中間的50%變量值,即中間50%變量值的極差。Q值大→變異程度大,Q小→變異程度小偏態分布資料集中趨勢…中位數離散趨勢…四分位數3802-1個體變異與變量分布3.方差與標準差離均差總和

離均差平方和

方差標準差自由度3902-1個體變異與變量分布

=(1-4)+(2-4)+(3-4)+(4-

=-3-2-1+0+1+2+3=0對于對稱分布或正態分布資料其離均差總和恒等于0。4)+(5-4)+(6-4)+(7-4)例:1、2、3、4、5、6、74002-1個體變異與變量分布計算公式:甲組:26,28,30,32,34乙組:24,27,30,33,36標準差表示一組變量值與均數的平均距離直接、全面、平均地描述一組變量值的離散程度。4102-1個體變異與變量分布標準差是描述變量值變異程度的指標。標準差大變異程度大均數的代表性差標準差小變異程度小均數的代表性好用途1表示變異程度的大小2計算標準誤、變異系數3估計正常值范圍幻燈片31標準差的意義4202-1個體變異與變量分布一個實例例:某地20歲男子100人,身高均數為166.06cm,標準差為4.95cm;體重均數為53.7kg,標準差為4.96kg,問:體重和身高,哪個變異大?4302-1個體變異與變量分布

使用條件:

均數相差較大時,比較各組資料的變異度;度量衡單位不同時,比較各組資料的變異程度。

4.變異系數(離散系數)4402-1個體變異與變量分布年齡組人數均數標準差CV(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.1某地6歲以下兒童身高(cm)的變異絕對變異受平均水平的影響相對變異排除了平均水平的影響4502-1個體變異與變量分布

描述離散程度的指標

種類應用條件計算公式

R任何資料R=Xmax-XminQ偏態分布資料

S2

(S)正態,單位同均數相差不大

CV單位不同,均數差大

4602-1個體變異與變量分布小結:定量資料的描述列表描述:頻數分布表、一覽表……圖形描述:頻數分布圖、趨勢圖……指標描述定量資料 集中位置:算術均數、幾何均數、中位數、百分位數 離散程度:極差、四分位數間距、方差、標準差定性或等級資料 相對數指標:率、構成比、比4702-1個體變異與變量分布平均數與變異度的關系

平均數表示的集中性與變異度表示的離散性,是從兩個不同的角度闡明計量資料的特征變異度越小,平均數對各變量值的代表性越好

變異度越大,平均數對各變量值的代表性越差

4802-1個體變異與變量分布平均數與變異度的關系通常,平均數與變異指標一起描述資料的分布特征。用均數和標準差描述正態分布資料的特征;用中位數和四分位數間距描述偏態分布資料的特征。

4902-1個體變異與變量分布絕對數的概念與意義調查研究和實驗研究得到的定性資料或等級資料經過整理,清點數目得到的數值稱為絕對數。如某病的發病人次數、醫院收容人數、治愈人數等。絕對數反映一定條件下某種事物的規?;蛩?是計劃或總結工作的依據,絕對數是計算相對數與平均數的基礎。絕對數往往不便于比較。5002-1個體變異與變量分布例:調查得某年小學生中流腦發?。杭椎貐^

63例,乙地區35例。甲地區流腦流行比乙地區嚴重×√

如已知小學生總人數:甲地區50051人,乙地區14338人,可算出兩個發病率:

甲地區流腦發病率:63/50051×1000‰=1.26‰乙地區流腦發病率:35/14338×1000‰=2.44‰

乙地區流腦流行比甲地區嚴重5102-1個體變異與變量分布相對數的概念和意義概念:相對數是兩個有聯系的指標之比。兩個特點:表示事物出現的頻度。

把基數化作相等,便于比較。常用相對數

率、構成比、相對比

5202-1個體變異與變量分布率

率(rate)又稱頻率指標,用以說明某事物或某現象在其可能發生的范圍內實際發生的頻率或強度。計算公式為:

5302-1個體變異與變量分布

表1.5某市某年各區急性傳染病發生數及其相對數市區年平均急性傳染病各區與I區構成比發病率人口數發生數發病數之比(%)(1/萬)

163672324331.0018.938.21238954030331.2523.577.86369971216500.6812.823.58432836315030.6211.645.77528696712820.5310.044.67631750418530.7614.458.36715383811300.468.873.45合計281264712884—100.045.815402-1個體變異與變量分布關于率的幾點說明(一)分子和分母都是計數值,從定義上來看,分子應為分母的一部分,但在實際應用中一些率的指標可能并不符合率的定義,但它們是約定俗成、沿習使用的。根據頻率的穩定性,分母較大時,可以用率作為該事件發生機會(即概率)的近似值。例如:醫治100例病人,90例痊愈,則:治愈率=90/100=90%。 它近似的反映了病人治愈機會的大小。5502-1個體變異與變量分布關于率的幾點說明(二)0≤rate≤1率常以百分率(%)、千分率(‰)、萬分率(1/萬)、十萬分率(l/10萬)等表示。

比例基數(K)可以是100%、1000‰、……,其選取是根據習慣用法和需要選用,主要使算得的率至少保留1~2位整數,便于閱讀。

患病率、發病率、感染率:百分率(%)人口出生率與死亡率:千分率(‰)腫瘤死亡率: 十萬分率(l/10萬)5602-1個體變異與變量分布構成比

構成比(proportion)又稱構成指標,表示某一事物內部各組成部分所占的比重或分布,常以百分數表示,計算公式為:

5702-1個體變異與變量分布設某事物個體數的合計由A1,A2,…,Ak個部分組成,構成比計算為:5802-1個體變異與變量分布5902-1個體變異與變量分布構成比的特點:同一事物內部的k個組成部分構成比總和為100%。各部分構成比之間是相互影響的,某一部分比重的變化受到兩方面因素的影響:其一是這個部分自身數值的變化,其二受其他部分數值變化的影響。6002-1個體變異與變量分布6102-1個體變異與變量分布相對比相對比(ratio)亦稱比,是

A、B兩個有關指標之比。

說明A為B的若干倍或百分之幾,它是對比的最簡單形式。A、B兩個指標可以是絕對數,也可以是相對數;可以性質相同,也可以性質不同;可以是定性資料,也可以是定量資料。

6202-1個體變異與變量分布正確應用相對數(一)

計算相對數的分母不宜過小

例數較少,相對數波動較大。如:0/2,1/2,2/2例數較少時,宜用絕對數表示,必須用相對數時,可同時列出其可信區間。6302-1個體變異與變量分布分析時不能以構成比代替率率反映的是頻率或者強度構成比反映的是比重或分布正確應用相對數(二)

6402-1個體變異與變量分布正確應用相對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論