




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章第二章定量數據的統計描述定量數據的統計描述【例例2-1】2006年某市年某市120名名10歲男孩的身高歲男孩的身高(cm)資料如下資料如下135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141
2、.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 14
3、1.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5 【問題問題2-1】該資料為何種類型資料?該資料為何種類型資料?如何對該資料進行描述?如何對該資料進行描述?第一節第一節 頻數表和頻數圖頻數表和頻數圖第二節第二節 集中趨勢的描述集中趨勢的描述第三節第三節 離散趨勢的離散趨勢的描述描述第四節
4、第四節 正態分布及其應用正態分布及其應用頻數表和頻數圖頻數表和頻數圖由于個體變異的存在,醫學研究中某指標在各個由于個體變異的存在,醫學研究中某指標在各個體上的觀察結果不是恒定不變的,但也不是雜亂體上的觀察結果不是恒定不變的,但也不是雜亂無章的,而是有一定規律的,呈一定的分布無章的,而是有一定規律的,呈一定的分布(distribution)。將原始數據按照一定的標準劃分為若干個組,合將原始數據按照一定的標準劃分為若干個組,合計各組的頻數,得到頻數分布表;也可再將頻數計各組的頻數,得到頻數分布表;也可再將頻數表繪制成頻數分布圖表繪制成頻數分布圖。頻數頻數(frequency):一組資料中各觀察值或
5、不:一組資料中各觀察值或不同組段內觀察值出現的頻繁程度(次數)同組段內觀察值出現的頻繁程度(次數)。頻數分布表頻數分布表(frequency table):由變量值及:由變量值及其頻數編制而成的表其頻數編制而成的表。一、頻數分布表(一)頻數表的編制1. 求極差求極差(range): 極差又稱全距,是指全部觀察值中最極差又稱全距,是指全部觀察值中最大值與最小值之差,用符號大值與最小值之差,用符號R表示。表示。 R=xmax-xmin155.4 130.225.2Rcm2. 確定組數和組距確定組數和組距 (1) 根據樣本含量的大小及研究目的確定組數根據樣本含量的大小及研究目的確定組數: 一般設一般
6、設815個組。個組。 (n50,915)。 (2)確定組距(確定組距(class interval):相鄰兩個組相鄰兩個組段下限之差為組距,一般采用等距分組。段下限之差為組距,一般采用等距分組。 i=R/組數組數,為了方便資料整理匯總,組距,為了方便資料整理匯總,組距一般取整數一般取整數。25.2 102.522.00icm 3. 確定組段確定組段組段起點稱為下限(組段起點稱為下限(lower limit)組段終點稱為上限(組段終點稱為上限(upper limit)注意:注意:第一組段必須包含最小值,最后一個組第一組段必須包含最小值,最后一個組段必須包括最大值,各組段不能重疊。除最末段必須包括
7、最大值,各組段不能重疊。除最末一個組段需同時寫出上下限外,其余組段只寫一個組段需同時寫出上下限外,其余組段只寫出其下限出其下限。4. 歸組計數,整理成表歸組計數,整理成表用計算機或手工劃記法匯總,得到各組段觀察用計算機或手工劃記法匯總,得到各組段觀察單位個數,單位個數,繪制成頻數分布表。繪制成頻數分布表。表表2-1 2006年某市年某市120名名10歲男孩身高(歲男孩身高(cm)的頻數表)的頻數表身高身高(1)頻數頻數(2)頻率(頻率(%)(3)累計頻數累計頻數(4)累計頻率(累計頻率(%)(5)130132134136138140142144146148150152 154156 1 3 4
8、 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.7 8.3 5.0 2.5 0.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.7 13.3 23.3 37.5 55.0 71.7 83.3 91.7 96.7 99.2100.0合計合計 120 100.0 (二)頻數分布表的用途(二)頻數分布表的用途1. 揭示揭示頻數分布特征頻數分布特征2. 揭示揭示頻數分布類型頻數分布類型3. 便于發現特大或特小的可疑值便于發現特大或特小的可疑值4. 便于進一步計算統計指標和進行統便于進一步計算統
9、計指標和進行統計分析計分析頻數分布的兩個特征頻數分布的兩個特征集中趨勢(集中趨勢(central tendency):指一組數:指一組數據向某個位置聚集或集中的傾向據向某個位置聚集或集中的傾向。 離散趨勢離散趨勢(dispersion tendency):指一組:指一組數據的分散性或變異度數據的分散性或變異度。 肌紅蛋白47.545.042.540.037.535.032.530.027.525.022.520.017.515.012.510.07.55.02.50.0人數121086420Std. Dev = 10.75 Mean = 27.1N = 91.00血清總膽固醇(mmol/L)5
10、.755.505.255.004.754.504.254.003.753.503.253.002.752.502.2520100抗體滴度1250.01000.0750.0500.0250.00.03020100頻 數頻頻 數數頻頻 數數血清肌紅蛋白血清肌紅蛋白(g/ml)負(左)偏態負(左)偏態對稱分布對稱分布正(右)偏態正(右)偏態二、頻數分布圖頻數分布圖(頻數分布圖(graph of frequency)是以變)是以變量值為橫坐標、頻數(或頻率)為縱坐標量值為橫坐標、頻數(或頻率)為縱坐標(不等距分組時以頻率(不等距分組時以頻率/組距組距=頻率密度為頻率密度為縱坐標),以每個等寬的距形面積
11、表示每縱坐標),以每個等寬的距形面積表示每組的頻數(或頻率)組的頻數(或頻率)。連續型定量資料:頻數圖中各距形是相連連續型定量資料:頻數圖中各距形是相連的,又稱的,又稱直方圖直方圖(histogram)。離散型定量資料:頻數圖中各距形是間隔離散型定量資料:頻數圖中各距形是間隔的,又稱的,又稱直條圖直條圖(bar graph)。圖圖2-1 2006年某市年某市120名名10歲男孩身高的頻數圖歲男孩身高的頻數圖離散型計量資料的頻數表 434名少數民族已婚婦女現有子女數頻數分布圖名少數民族已婚婦女現有子女數頻數分布圖集中趨勢的描述集中趨勢的描述平均數平均數(average)是一類描述計量資料是一類描
12、述計量資料集中集中位置或平均水平位置或平均水平的統計指標,在醫學領域的統計指標,在醫學領域中常用的平均數有中常用的平均數有算術均數、幾何均數、算術均數、幾何均數、中位數中位數、眾數、調和均數、眾數、調和均數。一、算術均數一、算術均數(arithmetic mean)簡稱均數簡稱均數(mean),總體均數用希臘字母總體均數用希臘字母 (miu)表示,樣本均數用表示,樣本均數用 (x bar)表表示。均數描述一組數據在數量上的平均示。均數描述一組數據在數量上的平均水平水平。x直接法直接法將所有數據直接相加,再除以總例數將所有數據直接相加,再除以總例數:是希臘字母,讀作是希臘字母,讀作sigma,為
13、求和符號,為求和符號。12.nxxxxxnn1. 計算方法計算方法【例例2-2】某醫生測量了某醫生測量了10名腦出血患者的血尿素氮名腦出血患者的血尿素氮(mmol/L)分別是:)分別是:7.4、6.7、6.9、7.3、7.6、6.5、 7.8、8.2、8.0、6.6,試計算該組數據的均數。,試計算該組數據的均數。7.46.76.96.67.310 xxn1 12212iikkkif xf xf xf xxffff加權法加權法 用于頻數表資料或樣本中相同觀察值較多用于頻數表資料或樣本中相同觀察值較多時,將相同觀察值的個數時,將相同觀察值的個數(頻數頻數 f )乘以該乘以該觀察值觀察值 x,以代替
14、相同觀察值逐個相加,以代替相同觀察值逐個相加。【例例2-3】根據表根據表2-1資料,用加權法求資料,用加權法求120名名10歲男孩身高的均數歲男孩身高的均數f 起了起了“權數權數”的作用,權衡了各組中值由的作用,權衡了各組中值由于頻數不同對均數的影響。于頻數不同對均數的影響。加權法計算的加權法計算的均數是近似的。均數是近似的。1 1313 1334 135135 cm131120iiif xxf 適用于描述單峰對稱分布,特別適用于描述單峰對稱分布,特別是是正態分布或近似正態分布資料正態分布或近似正態分布資料的集中趨勢。的集中趨勢。均數在描述正態分布特征方面有均數在描述
15、正態分布特征方面有重要意義。重要意義。均數的應用均數的應用我也我也知道知道了!了!例例 現有現有5人,其血清抗體效價分別為人,其血清抗體效價分別為1:10、 1:100、 1:1000、 1:10000和和 1:100000,求,求其效價倒數的平均水平其效價倒數的平均水平。若計算效價倒數的算術均數若計算效價倒數的算術均數用算術均數反映這類資料的平均水平是用算術均數反映這類資料的平均水平是不不合適的合適的。22222x 先求效價倒數對數值的均數,然后求反對數先求效價倒數對數值的均數,然后求反對數1000位于位于10、100、1000、10000、100000的中間的中間位置,具有很好的表性,這種
16、平均數就稱為位置,具有很好的表性,這種平均數就稱為幾何幾何均數均數。1lg10lg100lg1000lg10000lg100000lg35lg31000GGu是是n個觀察值乘積的個觀察值乘積的n次方根,又稱倍數次方根,又稱倍數均數,用均數,用G表示表示 。 幾何均數(幾何均數(geometric mean) 二、幾何均數二、幾何均數(Geometric mean,G)直接法:當直接法:當 n 較小時,直接將較小時,直接將 n 個個觀察值的乘積開觀察值的乘積開n 次方次方。12nnGx xx1lglg ()xGn1. 計算方法計算方法二、幾何均數二、幾何均數(Geometric mean,G)
17、【例例2-4】 某實驗室測得某實驗室測得7人血清中某種抗人血清中某種抗體的滴度分別為體的滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平,試求平均滴度均滴度。 111lg4 lg8lg25610.5361lglglg 1.5052 3277G 加權法:當資料中出現相同觀察值較多或資料已加權法:當資料中出現相同觀察值較多或資料已編制成頻數表時,也可用加權法計算幾何均數。編制成頻數表時,也可用加權法計算幾何均數。11112212lglglglglglgiikkkifxfxfxfxGffff【例例2-6】50名麻疹易感兒接種麻疹疫苗后,測得血凝名麻疹易感兒接種麻
18、疹疫苗后,測得血凝抑制抗體滴度資料見表抑制抗體滴度資料見表4-3,求抗體的平均滴度。,求抗體的平均滴度。表表4-3 50名麻疹易感兒血凝抑制抗體滴度名麻疹易感兒血凝抑制抗體滴度1111 lg43 lg87 lg256lg1 3786.9977lglg 1.73995450G 即即50名麻疹易感兒接種麻疹疫苗后血凝名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為抑制抗體的平均滴度為1/54。 2. 應用及注意事項應用及注意事項幾何均數應用于:幾何均數應用于: 等比資料,如抗體平均滴度;等比資料,如抗體平均滴度; 對數正態分布資料。對數正態分布資料。Remember!使用幾何均數時應注意:使用幾
19、何均數時應注意: 觀察值不能有觀察值不能有0; 觀察值不能同時有正值和負值。若全為觀察值不能同時有正值和負值。若全為負值,在計算時先把負號去掉,得出結負值,在計算時先把負號去掉,得出結果再加上負號果再加上負號。Be careful! 【例例2-7】200名食物中毒患者潛伏期資料如表名食物中毒患者潛伏期資料如表2-4,研究人員據此采用加權法計算均數得平,研究人員據此采用加權法計算均數得平均潛伏期為均潛伏期為27小時。小時。(1)該組數據在分布上有何特點?)該組數據在分布上有何特點? (2)用均數描述該資料的平均水平是否合適?)用均數描述該資料的平均水平是否合適?三、中位數與百分位數三、中位數與百
20、分位數表表2-4 200名食物中毒患者的潛伏期名食物中毒患者的潛伏期潛伏期(小時)潛伏期(小時)(1)頻數頻數(2)累計頻數累計頻數(3)累計頻率(累計頻率(%)(4)=(3)/n 030 3015.0127110150.5244915075.0362817889.0481419296.060 719999.5 7284 1200 100.0合計合計 200中位數中位數(median):):一組觀察值從小到大一組觀察值從小到大排列,位次居中的觀察值即中位數,是一排列,位次居中的觀察值即中位數,是一個位置指標個位置指標。直接法直接法 n為奇數,為奇數, n為偶數,為偶數,1 222 12nnnM
21、xMxx【例例2-8】某實驗師對某實驗師對10只小白鼠染毒后觀察各小只小白鼠染毒后觀察各小鼠的生存時間(分鐘),得數據為:鼠的生存時間(分鐘),得數據為:35,60,62,63,63,65,66,68,69,69,試計算小白鼠的平,試計算小白鼠的平均生存時間均生存時間將將10個觀察值由小到大排列:個觀察值由小到大排列:35,60,62,63,63,65,66,68,69,69 22 126365264nnMxx 頻數表法頻數表法()2MLMinMLffLM 中位數所在組段下限中位數所在組段下限Mf Lfi組距組距中位數所在組段的頻數中位數所在組段的頻數中位數所在組段前一組的累計頻數中位數所在組
22、段前一組的累計頻數【例例2-9】根據例根據例4-7的資料計算中位數的資料計算中位數表表2-4 200名食物中毒患者的潛伏期名食物中毒患者的潛伏期潛伏期(小時)潛伏期(小時)(1)頻數頻數(2)累計頻數累計頻數(3)累計頻率(累計頻率(%)(4)=(3)/n 030 3015.0127110150.5244915074.5362817889.0481419296.060 719999.5 7284 1200 100.0合計合計 200()212 200 12(30)71223.8MLMinMLff 百分位數(百分位數(percentile):是指將一組觀察值):是指將一組觀察值由小到大排序后,將
23、其平均分成由小到大排序后,將其平均分成100等份,等份,對應于每一分割位置上的數值就稱為一個百對應于每一分割位置上的數值就稱為一個百分位數,用分位數,用 表示表示。xP 是一種位置指標,一個百分位數將一組觀是一種位置指標,一個百分位數將一組觀察值分為兩部分,理論上有察值分為兩部分,理論上有x%的觀察值比它小,的觀察值比它小,有(有(100-x)%的觀察值比它大。的觀察值比它大。xP(%)xLxiPLn xff(%)xxLxiPLnxffixfxLLf式中:式中:第第x百分位數所在組段下限百分位數所在組段下限組距組距第第x百分位數所在組段的頻數百分位數所在組段的頻數第第x百分位數所在組段前一組百
24、分位數所在組段前一組的累計頻數的累計頻數【例例4-10】根據表根據表4-4,計算,計算P25、P7525(%)1212(200 25%30)15.471xLxiPLnxff75(%)1224(200 75% 101)3649xLxiPLnxff適用條件:適用條件: 偏態分布資料偏態分布資料 分布類型不明確的資料分布類型不明確的資料 “開口資料開口資料”(即一端或兩端無確切數值的資料即一端或兩端無確切數值的資料)Understand?均數、中位數均數、中位數正態分布正態分布時:時: 均數中位數均數中位數正偏態分布正偏態分布時:時:均數均數 中位數中位數負偏態分布負偏態分布時時:均數均數中位數中位
25、數集中趨勢指標小結1.即計量資料分布與平均數的選擇即計量資料分布與平均數的選擇2.2.計量資料的分布與統計分析計量資料的分布與統計分析 分布類型分布類型 算術均數算術均數幾何均數幾何均數中位數中位數 正態分布正態分布對數正態分布對數正態分布其他分布其他分布正態分布正態分布非正態分布非正態分布可轉換為正態分布可轉換為正態分布其他分布其他分布應用手段豐富應用手段豐富應用手段有限應用手段有限離散趨勢的描述離散趨勢的描述描述離散趨勢的常用指標描述離散趨勢的常用指標極差極差(range)四分位數間距四分位數間距(interquartile range)方差方差(variance)和標準差和標準差(sta
26、ndard deviation) 變異系數變異系數(coefficient of variation)1. 極差極差/全距全距(range) 全部觀察值中最大值與最小值之差,用符號全部觀察值中最大值與最小值之差,用符號R表示,表示, 即即常用于描述單峰對稱分布小樣本資料的變異常用于描述單峰對稱分布小樣本資料的變異程度,或用于初步了解資料的變異程度程度,或用于初步了解資料的變異程度maxminRxx極差描述離散趨勢的局限極差描述離散趨勢的局限只考慮最大值與最小值之差異,不能反只考慮最大值與最小值之差異,不能反映組內其它觀察值的變異程度映組內其它觀察值的變異程度樣本含量越大,極差可能越大,樣本含樣
27、本含量越大,極差可能越大,樣本含量相差懸殊時不宜用極差作比較量相差懸殊時不宜用極差作比較 四分位數四分位數 : P25,P50,P75三個點將全部觀三個點將全部觀察值等分為四部分,處于分位點上的數值察值等分為四部分,處于分位點上的數值就是四分位數就是四分位數下四分位數即第下四分位數即第25百分位數,用百分位數,用QL表示表示 上四分位數即第上四分位數即第75百分位數,用百分位數,用QU表示表示2. 四分位數間距四分位數間距四分位數間距四分位數間距(interquartile range)即上、即上、下四分位數之差下四分位數之差200名食物中毒患者的潛伏期資料,名食物中毒患者的潛伏期資料,P25
28、=15.4, P75=36ULQQQ36 15.420.6Q 四分位數間距常用于描述偏態分布及分布四分位數間距常用于描述偏態分布及分布的一端或兩端無確切數值資料的離散程度的一端或兩端無確切數值資料的離散程度四分位數間距較全距穩定,但仍不能全面四分位數間距較全距穩定,但仍不能全面概括所有觀察值的變異情況概括所有觀察值的變異情況x()x2()x22()xNx22()xN22()1xxsn3. 方差方差(variance)和標準差和標準差(SD)式中式中 n 1 稱為自由度稱為自由度(Degree of freedom),允許自由取值的變量值個數,用符號允許自由取值的變量值個數,用符號 (niu)表
29、示表示方差的度量單位是原度量單位的平方方差的度量單位是原度量單位的平方方差開方后即與原數據的度量單位相同,方差開方后即與原數據的度量單位相同,這就是這就是標準差標準差(standard deviation)2()xN 標準差應用公式標準差應用公式 直接法直接法 加權法加權法222()()11xxxxnsnn221fxfxnsn 【例例2-13】某醫生測量了某醫生測量了10名腦出血患者名腦出血患者的血尿素氮(的血尿素氮(mmol/L)分別是:)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數據的標準差試計算該組數據的標準差22222(7.46.
30、76.96.6 ) (7.4 6.7 6.96.6) /100.61(mmol/L)10 1s【例例2-14】根據表根據表4-1資料,計算資料,計算120名名10歲男歲男孩身高的標準差孩身高的標準差描述對稱分布,特別是正態分布或近似正態描述對稱分布,特別是正態分布或近似正態分布資料的變異程度分布資料的變異程度222()(17202)24686321204.79(cm)1120 1iiiiiif xf xfsf 【例例2-15】某醫院預防保健科,對一組某醫院預防保健科,對一組5歲男孩歲男孩進行體檢,測量身高、體重等指標。得身高均進行體檢,測量身高、體重等指標。得身高均數與標準差為數與標準差為11
31、5.8cm和和4.5cm,體重均數與標,體重均數與標準差為準差為20.2kg和和0.56kg,由此認為身高的變異,由此認為身高的變異程度比體重大。程度比體重大。上述結論是否正確?上述結論是否正確?4. 變異系數變異系數(coefficient of variation) 【例例2-16】某實驗室分別測量了某實驗室分別測量了10只小白鼠只小白鼠和和10只家兔的體重,得小白鼠體重的均數只家兔的體重,得小白鼠體重的均數與標準差分別為與標準差分別為22g和和3g,家兔體重的均數,家兔體重的均數與標準差分別為與標準差分別為1500g和和100g。經比較得出。經比較得出結論,因家兔體重的標準差大于小白鼠體
32、結論,因家兔體重的標準差大于小白鼠體重的標準差,所以家兔體重的變異程度比重的標準差,所以家兔體重的變異程度比小白鼠體重的變異程度大。小白鼠體重的變異程度大。變異系數(變異系數(coefficient of variation, CV):):是一組觀察值的標準差與其均數的比值是一組觀察值的標準差與其均數的比值用途:用途:比較度量衡單位不同的資料的變異度比較度量衡單位不同的資料的變異度比較均數相差懸殊的資料的變異度比較均數相差懸殊的資料的變異度100%sCVx4.5 100%3.89%115.80.56 100%2.77%20.2HeightCVWeightCV描述數值變量資料集中趨勢的指標描述數
33、值變量資料集中趨勢的指標平均數平均數 意義意義 應用場合應用場合 均數均數 平均數量水平平均數量水平 對稱分布, 尤其正態分布對稱分布, 尤其正態分布 幾何均數幾何均數 平均增減倍數平均增減倍數 等比、對數正態分布等比、對數正態分布 中位數中位數 位次居中的觀察值水平位次居中的觀察值水平 偏態、 分布不明確、 分布偏態、 分布不明確、 分布末端無確定值末端無確定值 描述數值變量資料離散趨勢的指標描述數值變量資料離散趨勢的指標離散趨勢指標離散趨勢指標 意義意義 應用應用 極差極差 四分位數間距四分位數間距 方差和標準差方差和標準差 變異系數變異系數 反映一組數據的變異范圍反映一組數據的變異范圍
34、反映全部觀察值居中一半的范圍反映全部觀察值居中一半的范圍 反映全部觀察值之間的變異程度反映全部觀察值之間的變異程度 標準差相對于均數的大小標準差相對于均數的大小 資料不限資料不限 資料不限資料不限 適用于對稱分布,尤正態適用于對稱分布,尤正態 適用于單位不同或均數適用于單位不同或均數差別較大的變量之間的差別較大的變量之間的比較比較 描述頻數分布特征的指標總結描述頻數分布特征的指標總結對稱分布對稱分布偏態分布偏態分布對數正態分布對數正態分布集中趨勢集中趨勢均數均數中位數中位數幾何均數幾何均數離散趨勢離散趨勢標準差標準差四分位數間距四分位數間距 對數標準差的對數標準差的反對數反對數正態分布及其應用
35、正態分布及其應用圖圖2-2 頻數分布逐漸接近正態分布示意圖頻數分布逐漸接近正態分布示意圖1. 正態分布的概念及特征正態分布的概念及特征正態分布正態分布(Normal distribution),也稱高斯,也稱高斯分布分布(Gaussian distribution),是一種非常是一種非常重要的連續型隨機變量的概率分布,重要的連續型隨機變量的概率分布,是自是自然界中最常見的一種分布然界中最常見的一種分布正態分布(正態分布(normal distribution)稱為高斯分)稱為高斯分布(布(Gauss distribution),如果連續型隨機),如果連續型隨機變量變量X的概率密度函數為:的概率
36、密度函數為: 概念概念正態分布的概念與特征正態分布的概念與特征 則稱隨機變量則稱隨機變量X服從參數為服從參數為 和和 的正態分布,的正態分布,記作:記作: 22()21( )2xf xex ,XN 正態曲線(正態曲線(normal curve)在橫軸上方均數)在橫軸上方均數處最高;并以均數為中心,左右對稱;兩端處最高;并以均數為中心,左右對稱;兩端與橫軸永不相交,呈鐘形的曲線。與橫軸永不相交,呈鐘形的曲線。 正態分布特征正態分布特征正態分布的概念與特征正態分布的概念與特征 正態曲線正態曲線正態分布有兩個參數,即位置參數正態分布有兩個參數,即位置參數 和形狀和形狀參數參數 正態分布的概念與特征正
37、態分布的概念與特征 -6-5-4-3-2-10123456321123位置參數方差相等、均數不等的正態分布圖示312-3-2-10123332121形態參數正態分布的概念與特征正態分布的概念與特征 均數相等、方差不等的正態分布圖示213正態分布的概念與特征正態分布的概念與特征 正態曲線下面積的分布有一定的規律。正態曲線下面積的分布有一定的規律。 正態分布曲線下一定區間內的面積代表了取值正態分布曲線下一定區間內的面積代表了取值于相應區間內的觀察值個數在全部觀察值總數中于相應區間內的觀察值個數在全部觀察值總數中所占的比例(概率),或者是觀察值落在該區間所占的比例(概率),或者是觀察值落在該區間內的
38、概率。內的概率。正態分布的概念與特征正態分布的概念與特征 正態曲線下面積的分布規律:正態曲線下面積的分布規律: 正態曲線與橫軸之間的面積恒等于正態曲線與橫軸之間的面積恒等于1或或100%;對稱分布,對稱軸兩側的面積各為對稱分布,對稱軸兩側的面積各為50;在在 區間的面積為區間的面積為68.27 在在 區間的面積為區間的面積為95.00 在在 區間的面積為區間的面積為99.00 , 1.96 ,1.96 2.58 ,2.58 正態曲線下的面積規律-+15.87%15.87%68.27%-1.96+1.962.5%2.5%95%-2.58+2.580.5%0.5%99% 若若X服從正態分布服從正態
39、分布 ,則,則Z就服從就服從 。 ,N 0,1NXZ012. 標準正態分布標準正態分布標準正態分布與標準化變換(標準正態分布與標準化變換(Z變換)變換)標準正態分布曲線下面積分布規律標準正態分布曲線下面積 (z) z 0.00 0.02 0.04 0.06 0.08-3.00.00130.00130.00120.00110.0010-2.50.00620.00590.00550.00520.0049-2.00.02280.02170.02070.01970.0188-1.90.02870.02740.02620.02500.0239-1.60.05480.05260.05050.04850.0
40、465-1.00.15870.15390.14920.14460.1401-0.50.30850.30150.29460.28770.2810 00.50000.49200.48400.47610.46810z 【例例2-18】 已知某地已知某地2003年年18歲男大學生身高的均歲男大學生身高的均數數 cm,標準差,標準差 cm,且,且18歲男大歲男大學生的身高服從正態分布。問該地學生的身高服從正態分布。問該地18歲男大學生歲男大學生中身高在中身高在166.8 cm及其以下者占多大的比例?及其以下者占多大的比例? 173.503.42()/166.8 173.5 /3.421.96zx 查附表
41、查附表3:表的左側找:表的左側找-1.9,表的上方找,表的上方找0.06,相,相交處為交處為0.025 3. 正態分布的應用正態分布的應用估計頻率分布估計頻率分布 【例例2-19】某地某地2003年抽樣調查了年抽樣調查了100名名18歲男大學生身高,算得均數為歲男大學生身高,算得均數為172.70cm,標準差為標準差為4.01cm。該地。該地18歲男大學生中身歲男大學生中身高在高在162.35cm183.05cm范圍內者所占的范圍內者所占的比例是多少?比例是多少?查附表查附表3, 左側的面積為左側的面積為0.005,由正態分布曲,由正態分布曲線的對稱性可知,線的對稱性可知, 右側的面積也為右側
42、的面積也為0.005,又,又由正態分布曲線下的總面積為由正態分布曲線下的總面積為1,可得,可得-2.58與與2.58之間之間的面積為的面積為1-20.005=0.99=99% 。11()/(162.35 172.0)/4.012.58zxxS 22()/(183.05 172.7)/4.012.58zxxS58. 22Z58. 21Z制定醫學參考值范圍制定醫學參考值范圍 醫學參考值范圍也稱正常值范圍醫學參考值范圍也稱正常值范圍 絕大多數正常人某觀察指標的波動范圍。絕大多數正常人某觀察指標的波動范圍。絕大絕大多數:多數:90%、95%、99%等,最常用的是等,最常用的是95% 正常人:不是指完全
43、健康的人,而是指排除了正常人:不是指完全健康的人,而是指排除了影響研究指標的疾病和有關因素的同質人群影響研究指標的疾病和有關因素的同質人群正常人正常人病人病人假陽性率假陽性率假陰性率假陰性率正常人與病人的數據分布重疊示意圖正常人與病人的數據分布重疊示意圖( (單側單側) ) 制定醫學參考值范圍的注意事項:制定醫學參考值范圍的注意事項:要確定一批樣本含量足夠大的要確定一批樣本含量足夠大的“正常人正常人”根據研究目的和使用要求選定適當的百分界值根據研究目的和使用要求選定適當的百分界值根據專業知識確定單側或雙側界值根據專業知識確定單側或雙側界值根據資料的分布選用恰當的計算方法根據資料的分布選用恰當的計算方法 根據醫學專業知識確定!根據醫學專業知識確定!單側:下限單側:下限: 肺活量、肺活量、IQ 上限上限: 轉氨酶、尿鉛、發汞轉氨酶、尿鉛、發汞雙側:白細胞計數、血清總膽固醇雙側:白細胞計數、血清總膽固醇 過低異常過低異常-單側下限單側下限 過高異常過高異常-單側上限單側上限 過低、過高均異常過低、過高均異常-雙側雙側單側下限單側下限異常異常正常正常單側上限單側上限異常異常正常正常異常異常正常正常雙側下限雙側下限雙側上限雙側上限異常異常正態分布法:適用于正態或近似正態分布的資料正態分布法:適用于正態或近似正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 出租車司機培訓補貼及職業發展合同
- 編織袋行業市場調研與分析服務合同
- 保險市場占有率提升合同
- 車輛指標租賃與車輛購置稅代繳合同
- 老兵短線技術課件下載
- 翻身技巧護理課件
- 美術種類介紹課件
- 美術教師課件介紹
- 楚辭考試題及答案
- 美縫培訓課件圖片
- 江蘇省南京市六校聯合體2024-2025學年高一下學期期末考試物理試卷
- DB64∕T 1914-2023 裝配式混凝土結構技術規程
- 冠心病不穩定型心絞痛護理查房講課件
- 微風發電可行性研究報告
- 嚴格標準物質管理制度
- 體育課期末課程總結匯報
- 論語十二章 導學案 統編版高中語文選擇性必修上冊
- 新生兒呼吸機相關性肺炎的防控
- 兒童籃球教學課件視頻
- 道路運輸行業員工安全考試試卷及答案
- 注塑公司規章管理制度
評論
0/150
提交評論