




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數值變量資料的統計描述預防醫學
預防醫學教研室1編輯版ppt數值變量資料的統計描述預防醫學
第五章數值變量資料的統計描述第一節數值變量資料的頻數分布2編輯版ppt第五章數值變量資料的統計描述2編輯版ppt
一、頻數表對一組研究對象進行觀察,某變量或指標數值出現的次數稱為頻數(frequency)。3編輯版ppt一、頻數表3編輯版ppt
例8.1某地區2002年132名55~58歲健康成人的空腹血糖(mmol/L)測定值如下:
5.175.564.864.87
…
…
…
…4.555.165.155.164編輯版ppt例8.1某地區2002年132名55~585編輯版ppt5編輯版ppt
①極差,或稱全距(R)
R=最大值-最小值
=5.59-3.60=1.99(mmol/L)②組距(i)
i=R÷組數=1.99÷10≈0.2(mmol/L)(組數一般分8~15,組距盡可能取整)6編輯版ppt①極差,或稱全距(R)6編輯版ppt③組段
每一組的起點稱為組下限,終點稱為組上限。
70分~80分(下限)(上限)
第一組應包括最小值,最后一組應包括最大值。7編輯版ppt③組段7編輯版ppt
④頻數(f)劃記、合計每組的變量個數。8編輯版ppt④頻數(f)8編輯版ppt某地2002年55~58歲健康成人的空腹血糖值(mmol/L)血糖(mmol/L)劃記頻數(f)
3.60-33.80-34.00-84.20-234.40-244.60-254.80-205.00-125.20-105.40-5.604
合計1329編輯版ppt某地2002年55~58歲健康成人的空腹血糖值(mmol/L
二、頻數分布的特征①集中趨勢(centraltendency):頻數向中間集中,中等水平的人數最多。②離散趨勢(tendencyofdispersion):隨變量值逐漸變大變小,人數越來越少,即向兩端分散。10編輯版ppt二、頻數分布的特征10編輯版ppt1、頻數分布的圖示以變量值(血糖)為橫軸,以頻數為縱軸,每一組段畫一直條,直條的面積與該組頻數成正比,稱為直方圖(histogram)。11編輯版ppt1、頻數分布的圖示11編輯版ppt12編輯版ppt12編輯版ppt
2、頻數分布的類型(1)對稱分布:觀察值向中央部分集中,以中等數據居多,左右兩側分布大體對稱。13編輯版ppt2、頻數分布的類型13編對稱分布14編輯版ppt對稱分布14編輯版ppt
(2)偏態分布:觀察值偏離中央,尾部偏向數軸正側,稱正偏態,尾部偏向數軸負側,稱負偏態。15編輯版ppt(2)偏態分布:觀察值偏離中央,尾部偏向數軸正側,正偏態分布:高峰偏于左側,長尾向右側伸延負偏態分布:高峰偏于右側,長尾向左側伸延16編輯版ppt正偏態分布:高峰偏于左側,長尾向右側伸延負偏態分布:高峰偏于對稱分布17編輯版ppt對稱分布17編輯版ppt
第二節集中趨勢指標
平均數(average):描述一組數值變量資料的集中趨勢、平均水平或中心位置的指標。常用的平均數有算術平均數、幾何均數和中位數。18編輯版ppt第二節集中趨勢指標18編輯版ppt
一、算術平均數(arithmeticmean)
簡稱均數,總體均數用μ表示,樣本均數用X表示。
適用條件:對稱分布資料,特別是正態分布資料。19編輯版ppt一、算術平均數19編輯版ppt
1、直接計算法觀察例數不多或計算機分析選用。20編輯版ppt1、直接計算法20編輯版ppt
例:某地抽樣得5名7歲男孩體重(kg)分別為:17.3,18.0,19.4,20.6,21.2。求其均數。=19.3(kg)21編輯版ppt例:某地抽樣得5名7歲男孩體重(kg)分別為:
2、加權法觀察例數多又無計算機處理時選用。
22編輯版ppt2、加權法22編輯版ppt
例計算某地區2002年55~58歲健康成人的空腹血糖(mmol/L)的平均值。①組中值=(本組下限+下組下限)/2②fx=f?x③fx2=x?fx=f?x2④23編輯版ppt例計算某地區2002年55~58歲健康成人的空空腹血糖值(mmol/L)平均數和標準差計算表
血糖頻數(f)組中值(x)fxfx23.60-33.711.141.073.80-33.911.745.634.00-84.132.8134.484.20-234.398.9425.274.40-244.5108.0486.004.60-254.7117.5552.254.80-204.998.0480.205.00-125.161.2312.125.20-105.353.0280.905.40-5.6045.522.0121.00
合計132614.22878.9224編輯版ppt空腹血糖值(mmol/L)平均數和標準差計算表血糖
二、幾何均數(G)(geometricmean)
適用條件對數正態分布資料:變量值呈倍數關系,當變量值取對數后服從正態分布或近似正態分布。25編輯版ppt二、幾何均數(G)25編輯版ppt
1、直接法觀察例數不多時選用。26編輯版ppt1、直接法26編輯版ppt
例題:6份鉤端螺旋體顯凝試驗的血清效價為:1:50,1:100,1:200,1:400,1:800,1:1600。求其平均血清效價。27編輯版ppt例題:6份鉤端螺旋體顯凝試驗的血清效價為:1:5
=lg-1(2.4515)=282.5
故其平均血清效價為1:282.5。28編輯版ppt28編輯版ppt
2、加權法觀察例數較多時選用。先將資料編成頻數分布表,再按公式計算:29編輯版ppt2、加權法29編輯版ppt
例8.4計算某地60人抗體效價的平均滴度。
=lg-1(1.31602)=20.705
平均滴度為1:20.705。30編輯版ppt例8.4計算某地60人抗體效價的平均滴效價倒數(X)人數(f)lgXflgX570.698974.8927910111.0000011.0000020221.3010328.6226640121.6020619.224728081.9030915.22472
合計60-78.96489某地60人抗體效價幾何均數計算表31編輯版ppt效價倒數(X)人數(f)
三、中位數(median)和百分位數
適用條件①偏態分布資料②分布類型不清的資料;③數據一端或兩端無界限的資料。32編輯版ppt三、中位數(median)和百分位數32編輯版ppt組段X頻數(f)<20014200-25220-52240-8260-5280-1300-2>3002合計109兩端無界限資料舉例33編輯版ppt組段X頻數(f)兩端無界限資料舉例33編輯版pp
1、中位數一組從小到大排列的變量值,位于正中間位置的變量值稱為中位數。用M表示。34編輯版ppt1、中位數34編輯版ppt
(1)直接計算方法將變量值從小到大排列,再按下式計算:n為奇數M=X(n+1)/2
n為偶數35編輯版ppt(1)直接計算方法35編輯版ppt
例:11例顱腦外傷病人的傷后來院時間為1、2、4、5、7、8、8、10、12、16、20小時,求其傷后來醫院治療的平均時間。
本例n=11為奇數
M=X(n+1)/2=X6=8(h)
若本例只收前10例病人,則(h)36編輯版ppt例:11例顱腦外傷病人的傷后來院時間為1、2、4
(2)頻數表計算方法將資料編制成頻數分布表,再計算:L:中位數所在組段的下限
fx:中位數所在組段的頻數∑fL
:中位數所在組段以前的累積頻數37編輯版ppt(2)頻數表計算方法37編輯版ppt
例8.6某傳染病的潛伏期(天)見表8-3,求其平均潛伏期。38編輯版ppt例8.6某傳染病的潛伏期(天)見表8-3,潛伏期(天)頻數f累計頻數累計頻率(%)
2~262623.634~487467.276~259990.008~610595.4510~310898.1812~2110100.00某傳染性的潛伏期(天)的中位數和百分數數計算表39編輯版ppt潛伏期(天)頻數f累計頻數組段2~4—4~6—6~8—位次
1、2、…2627、…7475、…99%0.9…23.624.5…67.368.2…90.0
中位數所在組的確定1、累計頻數剛超過n/2所在組2、累計頻率剛超過50%所在組40編輯版ppt組段2~4—4
2、百分位數將n個觀測值從小到大排列,分成100等份,與第x百分位次對應的觀測值稱為第x百分位數,用Px表示。百分位數是一種位置指標。41編輯版ppt2、百分位數41編輯版ppt
一個百分位數將全部觀察值分為兩部分,理論上有x%的觀察值比它小,(100-x)%觀察值比它大。0%x
%
100%x%觀察值(100-x)%觀察值42編輯版ppt一個百分位數將全部觀察值分為兩部分,理論上有x%的
中位數是一個特定的百分位數,即P50在全部觀察值中,有50%的觀察值比它小,(100-50)%觀察值比它大。43編輯版ppt中位數是一個特定的百分位數,即P50在全部觀察值
用頻數表計算百分位數的公式:
L:第x百分位數所在組段的下限
fx:第x百分位數所在組段的頻數∑fL:第x百分位數所在組段以前的累積頻數44編輯版ppt用頻數表計算百分位數的公式:44編輯版ppt潛伏期(天)頻數f累計頻數累計頻率(%)
2~262623.634~487467.276~259990.008~610595.4510~310898.1812~2110100.00某傳染性的潛伏期(天)的中位數和百分數數計算表45編輯版ppt潛伏期(天)頻數f累計頻數
應用中位數和百分位數時注意
1、對資料的分布沒有特殊要求,所有的資料均可計算。2、分布在中間的百分位數(50%)較穩定,靠近兩端的百分位數(99%)不穩定。46編輯版ppt應用中位數和百分位數時注意2、分布在
3、中位數不如均數精確,但抗極端值的影響比均數的穩定性好。當資料適合計算均數或幾何均數時,不宜計算中位數表示其平均水平。47編輯版ppt3、中位數不如均數精確,但抗極端值的影響
第三節離散程度指標
離散指標又稱變異指標,它描述數值變量資料頻數分布的離散趨勢。常用指標有:全距、方差、標準差、變異系數和四分位數間距。48編輯版ppt第三節離散程度指標48編輯版p
例:二組變量值(單位略)
A:8、9、10、11、12XA=10B:6、9、10、11、14XB=10
均數只描述集中趨勢,沒有描述變量值之間的差異,變異指標描述變量的變異(離散)趨勢。49編輯版ppt例:二組變量值(單位略)均數只描述
一、全距(極差,R)
R=最大值-最小值
RA=12-8=4RB=14-6=8
說明B組觀測值的變異程度大A組。
極差只表示兩極端數值的差異,而不能綜合反映每個變量值的變異情況。50編輯版ppt一、全距(極差,R)極差只表
二、四分位數間距(Q)
Q是上四分位數Qu(P75)與下四分位數QL(P25)之差。
Q=Qu-QL
其間包括全部觀察值的一半。P75P25MP0P10051編輯版ppt二、四分位數間距(Q)P75P25MP0P1
Q和R類似,比R穩定,但仍未考慮到每個觀察值的變異程度。
Q與M配合使用(M±Q),用于描述偏態分布資料、分布末端無界限而不能計算全距、方差和標準差的資料。
52編輯版pptQ和R類似,比R穩定,但仍未考慮到每個觀察值的變異程
三、方差和標準差為衡量每個變量值的變異情況,計算:
離均差之和∑(X-μ)但∑(X-μ)=0。53編輯版ppt三、方差和標準差53編輯版ppt
于是計算:
離均差平方和∑(X-μ)2
用SS或表示,它又受樣本含量(變量值個數)大小的影響,所以取其平均值表示,稱為方差(MS)。54編輯版ppt于是計算:54編輯版ppt
方差是另一變異指標,方差越大,表示變量值的變異程度越大。55編輯版ppt方差是另一變異指標,方差越大,表示變量值的變異程
方差的單位被平方,與均數單位不一致,不便于比較,于是取其平方根,稱為(總體)標準差(σ)。標準差是最常用的變異指標。56編輯版ppt方差的單位被平方,與均數單位不一致,不便于比較,
總體均數μ常是未知的,只能用樣本均數X代替,而得樣本標準差(S)
,作為總體標準差的估計值。57編輯版ppt總體均數μ常是未知的,只能用樣本均數X代替,而得
數理統計研究:樣本標準差較總體標準差偏小,因此用n-1代替n,n-1稱為自由度(v)。58編輯版ppt數理統計研究:樣本標準差較總體標準差偏小,因此用n-1代
1、標準差的計算方法(1)直接法(小樣本)為方便計算,前式變為:59編輯版ppt1、標準差的計算方法59編輯版ppt
XX2
86498110100111211214450510A組資料S計算表B組資料S計算表
XX2
6369811010011121141965053460編輯版pptXX2A組資料S計算表B組資料
(2)加權法(大樣本)先將資料編成頻數表,再按公式計算:61編輯版ppt(2)加權法(大樣本)61編輯版ppt以例8.1資料為例計算62編輯版ppt以例8.1資料為例計算62編輯版ppt空腹血糖值(mmol/L)平均數和標準差計算表
血糖頻數(f)組中值(x)fxfx23.60-33.711.141.073.80-33.911.745.634.00-84.132.8134.484.20-234.398.9425.274.40-244.5108.0486.004.60-254.7117.5552.254.80-204.998.0480.205.00-125.161.2312.125.20-105.353.0280.905.40-5.6045.522.0121.00
合計132-614.22878.9263編輯版ppt空腹血糖值(mmol/L)平均數和標準差計算表血糖
(3)標準差的應用①適用于對稱分布,特別是正態分布資料,表示觀測值分布的離散程度。64編輯版ppt(3)標準差的應用64編輯版ppt
標準差大,說明觀測值的變異程度大,即觀測值圍繞均數分布較離散,均數的代表性較差;標準差小,說明觀測值的變異程度小,即觀測值圍繞均數分布較密集,均數的代表性較好。65編輯版ppt標準差大,說明觀測值的變異程度大,即觀測值圍繞均
②估計觀測值的頻數分布和醫學參考值范圍。③計算標準誤。④計算變異系數66編輯版ppt②估計觀測值的頻數分布和醫學參考值范圍。6
四、變異系數(CV)
比較均數相差懸殊或單位不同的兩組(或多組)觀測值的變異程度時,不宜用標準差,而需計算變異系數進行比較。67編輯版ppt四、變異系數(CV)67編輯版ppt
例某地7歲男孩身高(單位cm)X1=114.82,s1=5.52;體重(單位kg)X2=20.91,s2=2.05。比較身高和體重的變異程度。CV1<CV2,體重的變異程度大于身高。68編輯版ppt例某地7歲男孩身高(單位cm)X1=114
第四節正態分布和醫學參考值一、正態分布(nomaldistribution)
從例8.1頻數分布圖看:頻數分布以均數為中心,靠近均數兩側的頻數較多,較遠兩側頻數逐漸減少,兩側基本對稱。69編輯版ppt第四節正態分布和醫學參考值69編輯版pp70編輯版ppt70編輯版ppt71編輯版ppt71編輯版ppt
如果不斷增多觀測例數、縮小組距,則圖形趨向于光滑曲線。這是一條中間高、兩頭低、左右對稱的鐘型曲線,在統計學上稱為正態分布曲線,表示為
N(μ,σ2)
。72編輯版ppt如果不斷增多觀測例數、縮小組距,則圖形趨向73編輯版ppt73編輯版ppt
為應用方便,將任何正態分布N(μ,σ2)變換成的正態分布N(0,1),稱為標準正態分布(u分布)。
變換方法是將變量值X變換為u(標準正態離差)74編輯版ppt為應用方便,將任何正態分布變換方75編輯版ppt75編輯版ppt
二、正態分布的特征1、在均數處最高。2、以均數為中心,左右對稱,逐漸降低,兩端永不與橫軸相交。76編輯版ppt二、正態分布的特征76編輯版ppt
3、有兩個參數
均數μ:位置參數,決定曲線的中心位置;μ越大,曲線越向右移;μ越小,則曲線越向左移。77編輯版ppt3、有兩個參數77編輯版ppt78編輯版ppt78編輯版ppt
標準差σ:形狀參數,決定曲線的陡峭或扁平:σ越大,曲線越扁平(矮胖);σ越小,曲線越陡峭(瘦高)。79編輯版ppt標準差σ:形狀參數,決定曲線的陡峭或扁平:σ越大80編輯版ppt80編輯版ppt
4、正態曲線下的面積有一定的規律在正態圖形中,橫軸為變量X,縱軸為頻數f。可用曲線下的面積代表頻數分布。81編輯版ppt4、正態曲線下的面積有一定的規律81編輯版ppt
若以曲線下的面積為100%,正態曲線下面積的分布規律變量值
曲線下面積(變量值出現概率)μ±1.0σ68.27%μ±1.96σ95.00%μ±2.58σ99.00%82編輯版ppt若以曲線下的面積為100%,正態曲線下面積的分布規律83編輯版ppt83編輯版ppt84編輯版ppt84編輯版ppt85編輯版ppt85編輯版ppt
如果資料呈正態分布,且樣本足夠大(如n>100),可樣本指標代替總體指標變量值
曲線下面積(變量值出現概率)X±1.0S68.27%X±1.96S95.00%X±2.58S99.00%86編輯版ppt如果資料呈正態分布,且樣本足夠大(如n>100),可變量值
曲線下面積(變量值出現概率)
±1.068.27%
±1.9695.00%
±2.5899.00%標準正態曲線下面積87編輯版ppt變量值曲線下面積±1.068區間體重范圍(kg)實際人數(%)理論人數(%)
X±1.0S45.29~52.3786(71.67)82(68.27)X±1.96S41.89~55.77114(95.00)114(95.00)X±2.58S39.70~57.96120(100.00)119(99.00)某地120名21歲女大學生體重的實際分布與理論分布88編輯版ppt區間體重范圍(kg)實際人數(%)理
三、醫學參考值范圍(一)醫學參考值的意義
醫學參考值:正常人(或動物)的個體形態、功能和代謝產物等的各種生理和生化常數。由于個體指標的變異,需要確定其波動范圍,即醫學參考值范圍。89編輯版ppt三、醫學參考值范圍89編輯版ppt(二)制定參考值的基本步驟
1、選擇樣本含量足夠大的“正常人”足夠大的樣本含量,一般認為每組
n>100。
“正常人”指排除了影響所研究指標的疾病和有關因素的同質人群。90編輯版ppt(二)制定參考值的基本步驟90編輯版ppt
2、控制測量誤差測量誤差控制在一定的范圍內。
3、判斷是否需要分組確定參考值范圍原則上組間差別明顯,差別有實際意義應分開,否則應當合并確定。91編輯版ppt2、控制測量誤差91編輯版ppt
4、決定單側和雙側界限根據專業知識確定:
雙側:指標過高、過低均為異常
單側上限:指標過高為異常
單側下限:指標過低為異常92編輯版ppt4、決定單側和雙側界限92編輯版ppt
5、選擇適當的百分界值醫學參考值范圍是指絕大多數正常人的變量值所在的范圍。“絕大多數”習慣包括80%、90%、95%、99%,最常用為95%。93編輯版ppt5、選擇適當的百分界值93編輯版ppt6、對資料的分布進行正態性檢驗
7、選擇估計方法94編輯版ppt6、對資料的分布進行正態性檢驗94編輯版ppt(三)估計方法
1、正態分布法(95%界值)適用于正態或近似正態分布資料。
雙側界值:X±us(X±1.96s)
單側上限:X+us(X+1.64s)
單側下限:X-us(X-1.64s)95編輯版ppt(三)估計方法95編輯版ppt正常參考值范圍(%)單側雙側0.8241.2821.2821.6451.6451.960992.3262.576常用u值表96編輯版ppt正常參考值范圍(%)單側雙側
例8.1
X=4.653(mmol/L)
s=0.401(mmol/L)計算95%正常參考值范圍:
X±us=4.653±1.96×0.401=3.87~5.44(mmol/L)97編輯版ppt例8.1X±us=4.6
2、對數正態分布法實用于對數正態或近似分布資料3、百分位數法實用于偏態分布資料
雙側界值:P2.5~P97.5
單側上限:≤P95
單側下限:≥P598編輯版ppt2、對數正態分布法3、百分位數
數值變量資料的統計描述預防醫學
預防醫學教研室99編輯版ppt數值變量資料的統計描述預防醫學
第五章數值變量資料的統計描述第一節數值變量資料的頻數分布100編輯版ppt第五章數值變量資料的統計描述2編輯版ppt
一、頻數表對一組研究對象進行觀察,某變量或指標數值出現的次數稱為頻數(frequency)。101編輯版ppt一、頻數表3編輯版ppt
例8.1某地區2002年132名55~58歲健康成人的空腹血糖(mmol/L)測定值如下:
5.175.564.864.87
…
…
…
…4.555.165.155.16102編輯版ppt例8.1某地區2002年132名55~58103編輯版ppt5編輯版ppt
①極差,或稱全距(R)
R=最大值-最小值
=5.59-3.60=1.99(mmol/L)②組距(i)
i=R÷組數=1.99÷10≈0.2(mmol/L)(組數一般分8~15,組距盡可能取整)104編輯版ppt①極差,或稱全距(R)6編輯版ppt③組段
每一組的起點稱為組下限,終點稱為組上限。
70分~80分(下限)(上限)
第一組應包括最小值,最后一組應包括最大值。105編輯版ppt③組段7編輯版ppt
④頻數(f)劃記、合計每組的變量個數。106編輯版ppt④頻數(f)8編輯版ppt某地2002年55~58歲健康成人的空腹血糖值(mmol/L)血糖(mmol/L)劃記頻數(f)
3.60-33.80-34.00-84.20-234.40-244.60-254.80-205.00-125.20-105.40-5.604
合計132107編輯版ppt某地2002年55~58歲健康成人的空腹血糖值(mmol/L
二、頻數分布的特征①集中趨勢(centraltendency):頻數向中間集中,中等水平的人數最多。②離散趨勢(tendencyofdispersion):隨變量值逐漸變大變小,人數越來越少,即向兩端分散。108編輯版ppt二、頻數分布的特征10編輯版ppt1、頻數分布的圖示以變量值(血糖)為橫軸,以頻數為縱軸,每一組段畫一直條,直條的面積與該組頻數成正比,稱為直方圖(histogram)。109編輯版ppt1、頻數分布的圖示11編輯版ppt110編輯版ppt12編輯版ppt
2、頻數分布的類型(1)對稱分布:觀察值向中央部分集中,以中等數據居多,左右兩側分布大體對稱。111編輯版ppt2、頻數分布的類型13編對稱分布112編輯版ppt對稱分布14編輯版ppt
(2)偏態分布:觀察值偏離中央,尾部偏向數軸正側,稱正偏態,尾部偏向數軸負側,稱負偏態。113編輯版ppt(2)偏態分布:觀察值偏離中央,尾部偏向數軸正側,正偏態分布:高峰偏于左側,長尾向右側伸延負偏態分布:高峰偏于右側,長尾向左側伸延114編輯版ppt正偏態分布:高峰偏于左側,長尾向右側伸延負偏態分布:高峰偏于對稱分布115編輯版ppt對稱分布17編輯版ppt
第二節集中趨勢指標
平均數(average):描述一組數值變量資料的集中趨勢、平均水平或中心位置的指標。常用的平均數有算術平均數、幾何均數和中位數。116編輯版ppt第二節集中趨勢指標18編輯版ppt
一、算術平均數(arithmeticmean)
簡稱均數,總體均數用μ表示,樣本均數用X表示。
適用條件:對稱分布資料,特別是正態分布資料。117編輯版ppt一、算術平均數19編輯版ppt
1、直接計算法觀察例數不多或計算機分析選用。118編輯版ppt1、直接計算法20編輯版ppt
例:某地抽樣得5名7歲男孩體重(kg)分別為:17.3,18.0,19.4,20.6,21.2。求其均數。=19.3(kg)119編輯版ppt例:某地抽樣得5名7歲男孩體重(kg)分別為:
2、加權法觀察例數多又無計算機處理時選用。
120編輯版ppt2、加權法22編輯版ppt
例計算某地區2002年55~58歲健康成人的空腹血糖(mmol/L)的平均值。①組中值=(本組下限+下組下限)/2②fx=f?x③fx2=x?fx=f?x2④121編輯版ppt例計算某地區2002年55~58歲健康成人的空空腹血糖值(mmol/L)平均數和標準差計算表
血糖頻數(f)組中值(x)fxfx23.60-33.711.141.073.80-33.911.745.634.00-84.132.8134.484.20-234.398.9425.274.40-244.5108.0486.004.60-254.7117.5552.254.80-204.998.0480.205.00-125.161.2312.125.20-105.353.0280.905.40-5.6045.522.0121.00
合計132614.22878.92122編輯版ppt空腹血糖值(mmol/L)平均數和標準差計算表血糖
二、幾何均數(G)(geometricmean)
適用條件對數正態分布資料:變量值呈倍數關系,當變量值取對數后服從正態分布或近似正態分布。123編輯版ppt二、幾何均數(G)25編輯版ppt
1、直接法觀察例數不多時選用。124編輯版ppt1、直接法26編輯版ppt
例題:6份鉤端螺旋體顯凝試驗的血清效價為:1:50,1:100,1:200,1:400,1:800,1:1600。求其平均血清效價。125編輯版ppt例題:6份鉤端螺旋體顯凝試驗的血清效價為:1:5
=lg-1(2.4515)=282.5
故其平均血清效價為1:282.5。126編輯版ppt28編輯版ppt
2、加權法觀察例數較多時選用。先將資料編成頻數分布表,再按公式計算:127編輯版ppt2、加權法29編輯版ppt
例8.4計算某地60人抗體效價的平均滴度。
=lg-1(1.31602)=20.705
平均滴度為1:20.705。128編輯版ppt例8.4計算某地60人抗體效價的平均滴效價倒數(X)人數(f)lgXflgX570.698974.8927910111.0000011.0000020221.3010328.6226640121.6020619.224728081.9030915.22472
合計60-78.96489某地60人抗體效價幾何均數計算表129編輯版ppt效價倒數(X)人數(f)
三、中位數(median)和百分位數
適用條件①偏態分布資料②分布類型不清的資料;③數據一端或兩端無界限的資料。130編輯版ppt三、中位數(median)和百分位數32編輯版ppt組段X頻數(f)<20014200-25220-52240-8260-5280-1300-2>3002合計109兩端無界限資料舉例131編輯版ppt組段X頻數(f)兩端無界限資料舉例33編輯版pp
1、中位數一組從小到大排列的變量值,位于正中間位置的變量值稱為中位數。用M表示。132編輯版ppt1、中位數34編輯版ppt
(1)直接計算方法將變量值從小到大排列,再按下式計算:n為奇數M=X(n+1)/2
n為偶數133編輯版ppt(1)直接計算方法35編輯版ppt
例:11例顱腦外傷病人的傷后來院時間為1、2、4、5、7、8、8、10、12、16、20小時,求其傷后來醫院治療的平均時間。
本例n=11為奇數
M=X(n+1)/2=X6=8(h)
若本例只收前10例病人,則(h)134編輯版ppt例:11例顱腦外傷病人的傷后來院時間為1、2、4
(2)頻數表計算方法將資料編制成頻數分布表,再計算:L:中位數所在組段的下限
fx:中位數所在組段的頻數∑fL
:中位數所在組段以前的累積頻數135編輯版ppt(2)頻數表計算方法37編輯版ppt
例8.6某傳染病的潛伏期(天)見表8-3,求其平均潛伏期。136編輯版ppt例8.6某傳染病的潛伏期(天)見表8-3,潛伏期(天)頻數f累計頻數累計頻率(%)
2~262623.634~487467.276~259990.008~610595.4510~310898.1812~2110100.00某傳染性的潛伏期(天)的中位數和百分數數計算表137編輯版ppt潛伏期(天)頻數f累計頻數組段2~4—4~6—6~8—位次
1、2、…2627、…7475、…99%0.9…23.624.5…67.368.2…90.0
中位數所在組的確定1、累計頻數剛超過n/2所在組2、累計頻率剛超過50%所在組138編輯版ppt組段2~4—4
2、百分位數將n個觀測值從小到大排列,分成100等份,與第x百分位次對應的觀測值稱為第x百分位數,用Px表示。百分位數是一種位置指標。139編輯版ppt2、百分位數41編輯版ppt
一個百分位數將全部觀察值分為兩部分,理論上有x%的觀察值比它小,(100-x)%觀察值比它大。0%x
%
100%x%觀察值(100-x)%觀察值140編輯版ppt一個百分位數將全部觀察值分為兩部分,理論上有x%的
中位數是一個特定的百分位數,即P50在全部觀察值中,有50%的觀察值比它小,(100-50)%觀察值比它大。141編輯版ppt中位數是一個特定的百分位數,即P50在全部觀察值
用頻數表計算百分位數的公式:
L:第x百分位數所在組段的下限
fx:第x百分位數所在組段的頻數∑fL:第x百分位數所在組段以前的累積頻數142編輯版ppt用頻數表計算百分位數的公式:44編輯版ppt潛伏期(天)頻數f累計頻數累計頻率(%)
2~262623.634~487467.276~259990.008~610595.4510~310898.1812~2110100.00某傳染性的潛伏期(天)的中位數和百分數數計算表143編輯版ppt潛伏期(天)頻數f累計頻數
應用中位數和百分位數時注意
1、對資料的分布沒有特殊要求,所有的資料均可計算。2、分布在中間的百分位數(50%)較穩定,靠近兩端的百分位數(99%)不穩定。144編輯版ppt應用中位數和百分位數時注意2、分布在
3、中位數不如均數精確,但抗極端值的影響比均數的穩定性好。當資料適合計算均數或幾何均數時,不宜計算中位數表示其平均水平。145編輯版ppt3、中位數不如均數精確,但抗極端值的影響
第三節離散程度指標
離散指標又稱變異指標,它描述數值變量資料頻數分布的離散趨勢。常用指標有:全距、方差、標準差、變異系數和四分位數間距。146編輯版ppt第三節離散程度指標48編輯版p
例:二組變量值(單位略)
A:8、9、10、11、12XA=10B:6、9、10、11、14XB=10
均數只描述集中趨勢,沒有描述變量值之間的差異,變異指標描述變量的變異(離散)趨勢。147編輯版ppt例:二組變量值(單位略)均數只描述
一、全距(極差,R)
R=最大值-最小值
RA=12-8=4RB=14-6=8
說明B組觀測值的變異程度大A組。
極差只表示兩極端數值的差異,而不能綜合反映每個變量值的變異情況。148編輯版ppt一、全距(極差,R)極差只表
二、四分位數間距(Q)
Q是上四分位數Qu(P75)與下四分位數QL(P25)之差。
Q=Qu-QL
其間包括全部觀察值的一半。P75P25MP0P100149編輯版ppt二、四分位數間距(Q)P75P25MP0P1
Q和R類似,比R穩定,但仍未考慮到每個觀察值的變異程度。
Q與M配合使用(M±Q),用于描述偏態分布資料、分布末端無界限而不能計算全距、方差和標準差的資料。
150編輯版pptQ和R類似,比R穩定,但仍未考慮到每個觀察值的變異程
三、方差和標準差為衡量每個變量值的變異情況,計算:
離均差之和∑(X-μ)但∑(X-μ)=0。151編輯版ppt三、方差和標準差53編輯版ppt
于是計算:
離均差平方和∑(X-μ)2
用SS或表示,它又受樣本含量(變量值個數)大小的影響,所以取其平均值表示,稱為方差(MS)。152編輯版ppt于是計算:54編輯版ppt
方差是另一變異指標,方差越大,表示變量值的變異程度越大。153編輯版ppt方差是另一變異指標,方差越大,表示變量值的變異程
方差的單位被平方,與均數單位不一致,不便于比較,于是取其平方根,稱為(總體)標準差(σ)。標準差是最常用的變異指標。154編輯版ppt方差的單位被平方,與均數單位不一致,不便于比較,
總體均數μ常是未知的,只能用樣本均數X代替,而得樣本標準差(S)
,作為總體標準差的估計值。155編輯版ppt總體均數μ常是未知的,只能用樣本均數X代替,而得
數理統計研究:樣本標準差較總體標準差偏小,因此用n-1代替n,n-1稱為自由度(v)。156編輯版ppt數理統計研究:樣本標準差較總體標準差偏小,因此用n-1代
1、標準差的計算方法(1)直接法(小樣本)為方便計算,前式變為:157編輯版ppt1、標準差的計算方法59編輯版ppt
XX2
86498110100111211214450510A組資料S計算表B組資料S計算表
XX2
63698110100111211419650534158編輯版pptXX2A組資料S計算表B組資料
(2)加權法(大樣本)先將資料編成頻數表,再按公式計算:159編輯版ppt(2)加權法(大樣本)61編輯版ppt以例8.1資料為例計算160編輯版ppt以例8.1資料為例計算62編輯版ppt空腹血糖值(mmol/L)平均數和標準差計算表
血糖頻數(f)組中值(x)fxfx23.60-33.711.141.073.80-33.911.745.634.00-84.132.8134.484.20-234.398.9425.274.40-244.5108.0486.004.60-254.7117.5552.254.80-204.998.0480.205.00-125.161.2312.125.20-105.353.0280.905.40-5.6045.522.0121.00
合計132-614.22878.92161編輯版ppt空腹血糖值(mmol/L)平均數和標準差計算表血糖
(3)標準差的應用①適用于對稱分布,特別是正態分布資料,表示觀測值分布的離散程度。162編輯版ppt(3)標準差的應用64編輯版ppt
標準差大,說明觀測值的變異程度大,即觀測值圍繞均數分布較離散,均數的代表性較差;標準差小,說明觀測值的變異程度小,即觀測值圍繞均數分布較密集,均數的代表性較好。163編輯版ppt標準差大,說明觀測值的變異程度大,即觀測值圍繞均
②估計觀測值的頻數分布和醫學參考值范圍。③計算標準誤。④計算變異系數164編輯版ppt②估計觀測值的頻數分布和醫學參考值范圍。6
四、變異系數(CV)
比較均數相差懸殊或單位不同的兩組(或多組)觀測值的變異程度時,不宜用標準差,而需計算變異系數進行比較。165編輯版ppt四、變異系數(CV)67編輯版ppt
例某地7歲男孩身高(單位cm)X1=114.82,s1=5.52;體重(單位kg)X2=20.91,s2=2.05。比較身高和體重的變異程度。CV1<CV2,體重的變異程度大于身高。166編輯版ppt例某地7歲男孩身高(單位cm)X1=114
第四節正態分布和醫學參考值一、正態分布(nomaldistribution)
從
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 客戶禮品費管理制度
- 家樂福考勤管理制度
- 家居實訓室管理制度
- 庫房輔料庫管理制度
- 引進種雞苗管理制度
- 影視類項目管理制度
- 微商代理商管理制度
- 快易購銷售管理制度
- 念佛堂值班管理制度
- 總公司安全管理制度
- 瀘州理綜中考試題及答案
- 內鏡室患者服務專員職責與流程
- 2025龍巖市上杭縣藍溪鎮社區工作者考試真題
- 2025建設銀行ai面試題目及最佳答案
- 養老院養老服務糾紛調解管理制度
- 潛水作業合同協議書
- 2025-2031年中國天然氣勘探行業市場運行態勢及投資潛力研判報告
- 北京開放大學2025年《裝配式技術與應用》形成性考核2答案
- 2024年國家知識產權局知識產權發展研究中心招聘考試真題
- 四川綿陽公開招聘社區工作者考試高頻題庫帶答案2025年
- 《水利工程造價與招投標》課件-模塊六 招投標程序
評論
0/150
提交評論