




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章計量資料的統計描述第一節頻數分布(frequencydistribution)1第二章計量資料的統計描述第一節頻數分布112101名正常成年女子的血清總膽固醇(mmol/L)頻數分布表2101名正常成年女子的血清總膽固醇(mmol/L)頻數分2求極差極差(range)也稱全距,即最大值和最小值之差,記作R。本例:R=5.71-2.35=3.36(mmol/L)確定組數與組距根據原始數據多少,組段數通常取組8~15組組距i=全距R/組數k,本例i=3.36/10=0.336≈0.30確定組限資料中的每一個數據都必須能夠歸屬于某一組,且只能歸屬于該組。統計頻數編制頻數表
3求極差334445556667三、頻數分布表的用途可代替繁雜的原始資料,便于進一步分析。便于觀察數據的分布類型。便于發現資料中某些遠離群體的特大或特小的可疑值。當樣本含量較大時,可用各組段的頻率作為概率的估計值。7三、頻數分布表的用途可代替繁雜的原始資料,便于進一步分析。78圖2-2115名正常成年女子的血清轉氨酶的頻數分布右偏態分布或正偏態分布圖2-3101名正常人的血清肌紅蛋白的頻數分布左偏態分布或負偏態分布8圖2-2115名正常成年女子的血清轉氨酶的頻數分布右偏態8第二節
集中趨勢的描述9第二節
集中趨勢的描述9910平均數(average)
平均數是描述一組觀察值集中位置和平均水平的統計指標。常用的平均數包括:算數均數(mean)幾何均數(geometricmean)中位數(median)和百分位數(percentile)10平均數(average)平均數是描述一1011算數均數直接法
加權法均數的應用適用用于對稱分布或偏度不大的資料,能夠很好的反映數據的集中位置和平均水平。算數均數容易受到頻數分布尾端極大或極小值的影響。11算數均數直接法11101名正常成年女子的血清總膽固醇
直接法:
加權法:12101名正常成年女子的血清總膽固醇
直接法:
加權法1213幾何均數(geometricmean)
觀察值間按倍數變化的資料可以計算幾何均數(G)以描述其平均水平。計算公式為:加權法為:13幾何均數(geometricmean)觀察值間1314141415注意點:適用于數據呈等比分布或呈對數正態分布的資料。數據中出現0或負數時,需對數據進行轉換。15注意點:適用于數據呈等比分布或呈對數正態分布的資料。1516中位數和百分位數中位數
一組觀察值按從大到小順序排列,居中心位置的數即為中位數(median)。將所以n個觀察值按升序排列,n為奇數時:中位數n為偶數時:中位數16中位數和百分位數中位數16171717百分位數百分位數(percentile)是一種位置指標,用PX來表示。直接法當nX%為帶有小數位時:PX=X(trunc(nX%)+1)當nX%為整數時:
PX=1/2(X(nX%)+X(nX%+1))18百分位數百分位數(percentile)是一種位置指18頻數表法計算公式:19L、iX、fX分別為PX所在組段的下限、組距和頻數,fL為PX所在組段之前各組段的累計頻數。頻數表法19L、iX、fX分別為PX所在組段的下限、組距和頻1920202021注意點:算術均數,幾何均數以及中位數都能反映一組數據的集中趨勢和水平。算術均數適用對稱分布的計量資料,幾何均數適用于呈等比分布計量資料,中位數適用于任何頻數分布資料。中位數對于對稱分布資料,沒有均數穩定,不便于進行統計運算。多個百分位數結合使用常可以說明某一特定的問題。21注意點:21第三節離散趨勢的描述22第三節222223對甲乙2名高血壓患者連續觀察5天,測得的收縮壓分別為:甲患者(mmHg)162145178142186()乙患者(mmHg)164160163159166()甲乙患者收縮壓的均數很相似,但是甲患者的血壓波動范圍較大。23對甲乙2名高血壓患者連續觀察5天,測得的收縮壓分2324衡量離散趨勢的指標大體分為2大類:按間距計算:極差和四分位數間距按平均偏差計算:離均差平方和、方差、標準差和變異系數24衡量離散趨勢的指標大體分為2大類:2425極差和四分位數間距極差(range):觀測值中最大值和最小值之差,用R表示。R甲
=186-142=44(mmHg)R乙
=166-159=7(mmHg)四分位數間距(quartile):百分位數P75和P25之間的差。Q=P75–P2525極差和四分位數間距25表2-6中,已知P25=39.2,P75=67.7,計算118名鏈球菌咽喉炎患者潛伏期的四分位數間距。
QR=67.7-39.2=28.5(天)
四分位數間距主要用于衡量明顯偏態分布資料的變異程度。
26表2-6中,已知P25=39.2,P75=67.7,計算112627離均差平方和(sumofsquare,SS)方差(meanofsquare,MS)離均差平方和再取平均,其結果為方差。對于樣本資料,分母取n–1作為自由度(degreeoffreedom,df),式中MS為樣本方差,方差越大說明數據的變異越大。27離均差平方和(sumofsquare,SS)方差(m2728標準差(standarddeviation,SD)方差的平方根稱為標準差。
SD越大說明其變異程度越大。如果是頻數表資料,可用以下的公式:28標準差(standarddeviation,SD)方差282929例如對于前例經計算有甲患者:
乙患者:2929例如對于前例經計算有2930標準差的量綱與原變量一致。標準差可以直接用于代數運算。標準差與均數結合能夠完整地概括一個正態分布。標準差越大意味著個體差異越大。30標準差的量綱與原變量一致。3031變異系數(coefficientofvariation,CV)某地7歲男孩身高的均數為123.10cm,標準差為4.71;體重均數為22.59kg,標準差為2.26kg,比較其變異度?身高體重不同量綱的變量間變異程度的比較。均數差別較大的變量間變異程度的比較。31變異系數(coefficientofvariatio31第四節
正態分布32第四節
正態分布3232正態分布首先由德國數學家和天文學家德·莫阿弗爾(A.deMovre,1667-1754)于1733年提出。德國數學家Gauss將其運用于天文學研究中,從而使正態分布為世人所知。
因此,正態分布又稱為Gauss分布。33A.deMovreGauss正態分布首先由德國數學家和天文學家德·莫阿弗爾(A.33343434將血清總膽固醇的橫坐標用變量X表示,第i組的組距和人數分別為△Xi和fi表示,n為總觀察例數,則在[X,X+△Xi)區間內每單位血清總膽固醇的頻率為:
f(X)=(fi/n)/△Xi
35
各矩形的面積恰好等于紅細胞在區間內的頻率(f(X)△Xi=fi/n)面積的總和為1。將血清總膽固醇的橫坐標用變量X表示,第i組的組距和人3536
假設觀察的人數增多,組段不斷細分,則直方圖將逐漸接近于一條均勻連續的曲線,這條曲線所描述的分布,簡稱為正態分布。36假設觀察的人數增多,組段不斷細分,則直方圖3637正態分布的密度函數,曲線方程為:
π和e是圓周率和自然對數的底,其近似值分別為3.14159和2.71828。
μ和σ是正態分布的兩個參數,分別是總體的均數和標準差。總體的自由度是n而不是n-137正態分布的密度函數,曲線方程為:π和e是圓3738正態分布的特征正態分布以均數μ為中心,左右對稱。正態分布曲線下面積集中在以均數μ為中心的中心部分,越遠離中心曲線下面積越小。正態分布曲線下面積分布有一定的規律。38正態分布的特征38正態分布曲線下面積的計算可以通過對其概率密度函數積分來實現:39正態分布曲線下面積的計算可以通過對其概率密度函數積分3940正態分布完全由參數μ和σ決定。40正態分布完全由參數μ和σ決定。40標準正態分布及曲線下面積
41
標準正態分布
(StandardNormalDistribution)
對任何參數的正態分布,都可以通過一個簡單的變量變換化成μ=0和s=1的標準正態分布。通常,可以利用標準正態分布表求出與原始變量X有關的概率值。標準正態分布及曲線下面積41標準正態分布(Standa4142代入:42代入:4243查附表1
Φ(-1.96)=?Φ(-2.58)=?43查附表14344
成年男性的紅細胞數近似服從正態分布,假設其均數為4.78×1012/L,標準差為0.38×1012/L,想知道紅細胞數在4×1012/L以下所占的比例。
然后查附表1得Φ(-2.05)=0.0202,表明紅細胞數在4×1012/L以下所占的比例為總體的2%。44成年男性的紅細胞數近似服從正態分布,假設其均數為4445正態分布的應用利用正態分布可以很容易確定資料中任意數值出現的概率,醫學參考值范圍的估計。準確地進行誤差分析和質量控制。正態分布是以后學習各種統計推斷方法的理論基礎。45正態分布的應用45第五節
醫學參考值范圍的制定46第五節
醫學參考值范圍的制定464647醫學參考值范圍的概念正常人的解剖、生理、生化、免疫及組織代謝產物的含量等各種數據的波動范圍。目的:基于臨床事件,著眼于個體,作為劃分正常人和異常人的界限。基于預防醫學實踐,著眼于人群,制定各種生理指標的等級標準。47醫學參考值范圍的概念4748醫學參考值范圍的制定方法選擇足夠數量的正常人作為參照樣本。對選定的正常人進行準確的測定。決定取單側范圍還是雙側范圍值。血清總膽固醇,過高或過低均屬異常取雙側。血清轉氨酶僅過高屬異常,取單側。肺活量僅過低屬異常,取單側。48醫學參考值范圍的制定方法4849選擇適當的百分范圍。49選擇適當的百分范圍。4950正態分布法計算醫學參考值范圍。單側:雙側:50正態分布法計算醫學參考值范圍。5051百分位數法計算醫學參考值范圍。51百分位數法計算醫學參考值范圍。5152百分位數法與正態分布法前者適合任何分布類型的資料,實際中最為常用。后者僅適用于正態分布資料,適用范圍較狹窄。前者必須有較大的樣本含量,否則結果不穩定。后者的結果比較穩定。52百分位數法與正態分布法52535353計算正常人尿汞的95%參考值范圍。54計算上側界值第95的百分位數計算正常人尿汞的95%參考值范圍。54計算上側界值第95的百54小結計量資料的統計描述,頻數表的編制方法,及主要用途。集中趨勢的統計描述,各類均數的計算方法,適用范圍。離散趨勢的統計描述,衡量變異程度的各類統計學指標的含義,以及其適用資料的類型。正態分布、標準正態分布的特征,以及適用的資料類型。醫學參考值制定的方法。55小結計量資料的統計描述,頻數表的編制方法,及主要用途。5555第二章計量資料的統計描述第一節頻數分布(frequencydistribution)56第二章計量資料的統計描述第一節頻數分布15657101名正常成年女子的血清總膽固醇(mmol/L)頻數分布表2101名正常成年女子的血清總膽固醇(mmol/L)頻數分57求極差極差(range)也稱全距,即最大值和最小值之差,記作R。本例:R=5.71-2.35=3.36(mmol/L)確定組數與組距根據原始數據多少,組段數通常取組8~15組組距i=全距R/組數k,本例i=3.36/10=0.336≈0.30確定組限資料中的每一個數據都必須能夠歸屬于某一組,且只能歸屬于該組。統計頻數編制頻數表
58求極差35859459605606166162三、頻數分布表的用途可代替繁雜的原始資料,便于進一步分析。便于觀察數據的分布類型。便于發現資料中某些遠離群體的特大或特小的可疑值。當樣本含量較大時,可用各組段的頻率作為概率的估計值。7三、頻數分布表的用途可代替繁雜的原始資料,便于進一步分析。6263圖2-2115名正常成年女子的血清轉氨酶的頻數分布右偏態分布或正偏態分布圖2-3101名正常人的血清肌紅蛋白的頻數分布左偏態分布或負偏態分布8圖2-2115名正常成年女子的血清轉氨酶的頻數分布右偏態63第二節
集中趨勢的描述64第二節
集中趨勢的描述96465平均數(average)
平均數是描述一組觀察值集中位置和平均水平的統計指標。常用的平均數包括:算數均數(mean)幾何均數(geometricmean)中位數(median)和百分位數(percentile)10平均數(average)平均數是描述一6566算數均數直接法
加權法均數的應用適用用于對稱分布或偏度不大的資料,能夠很好的反映數據的集中位置和平均水平。算數均數容易受到頻數分布尾端極大或極小值的影響。11算數均數直接法66101名正常成年女子的血清總膽固醇
直接法:
加權法:67101名正常成年女子的血清總膽固醇
直接法:
加權法6768幾何均數(geometricmean)
觀察值間按倍數變化的資料可以計算幾何均數(G)以描述其平均水平。計算公式為:加權法為:13幾何均數(geometricmean)觀察值間6869146970注意點:適用于數據呈等比分布或呈對數正態分布的資料。數據中出現0或負數時,需對數據進行轉換。15注意點:適用于數據呈等比分布或呈對數正態分布的資料。7071中位數和百分位數中位數
一組觀察值按從大到小順序排列,居中心位置的數即為中位數(median)。將所以n個觀察值按升序排列,n為奇數時:中位數n為偶數時:中位數16中位數和百分位數中位數71721772百分位數百分位數(percentile)是一種位置指標,用PX來表示。直接法當nX%為帶有小數位時:PX=X(trunc(nX%)+1)當nX%為整數時:
PX=1/2(X(nX%)+X(nX%+1))73百分位數百分位數(percentile)是一種位置指73頻數表法計算公式:74L、iX、fX分別為PX所在組段的下限、組距和頻數,fL為PX所在組段之前各組段的累計頻數。頻數表法19L、iX、fX分別為PX所在組段的下限、組距和頻7475207576注意點:算術均數,幾何均數以及中位數都能反映一組數據的集中趨勢和水平。算術均數適用對稱分布的計量資料,幾何均數適用于呈等比分布計量資料,中位數適用于任何頻數分布資料。中位數對于對稱分布資料,沒有均數穩定,不便于進行統計運算。多個百分位數結合使用常可以說明某一特定的問題。21注意點:76第三節離散趨勢的描述77第三節227778對甲乙2名高血壓患者連續觀察5天,測得的收縮壓分別為:甲患者(mmHg)162145178142186()乙患者(mmHg)164160163159166()甲乙患者收縮壓的均數很相似,但是甲患者的血壓波動范圍較大。23對甲乙2名高血壓患者連續觀察5天,測得的收縮壓分7879衡量離散趨勢的指標大體分為2大類:按間距計算:極差和四分位數間距按平均偏差計算:離均差平方和、方差、標準差和變異系數24衡量離散趨勢的指標大體分為2大類:7980極差和四分位數間距極差(range):觀測值中最大值和最小值之差,用R表示。R甲
=186-142=44(mmHg)R乙
=166-159=7(mmHg)四分位數間距(quartile):百分位數P75和P25之間的差。Q=P75–P2525極差和四分位數間距80表2-6中,已知P25=39.2,P75=67.7,計算118名鏈球菌咽喉炎患者潛伏期的四分位數間距。
QR=67.7-39.2=28.5(天)
四分位數間距主要用于衡量明顯偏態分布資料的變異程度。
81表2-6中,已知P25=39.2,P75=67.7,計算118182離均差平方和(sumofsquare,SS)方差(meanofsquare,MS)離均差平方和再取平均,其結果為方差。對于樣本資料,分母取n–1作為自由度(degreeoffreedom,df),式中MS為樣本方差,方差越大說明數據的變異越大。27離均差平方和(sumofsquare,SS)方差(m8283標準差(standarddeviation,SD)方差的平方根稱為標準差。
SD越大說明其變異程度越大。如果是頻數表資料,可用以下的公式:28標準差(standarddeviation,SD)方差838484例如對于前例經計算有甲患者:
乙患者:2929例如對于前例經計算有8485標準差的量綱與原變量一致。標準差可以直接用于代數運算。標準差與均數結合能夠完整地概括一個正態分布。標準差越大意味著個體差異越大。30標準差的量綱與原變量一致。8586變異系數(coefficientofvariation,CV)某地7歲男孩身高的均數為123.10cm,標準差為4.71;體重均數為22.59kg,標準差為2.26kg,比較其變異度?身高體重不同量綱的變量間變異程度的比較。均數差別較大的變量間變異程度的比較。31變異系數(coefficientofvariatio86第四節
正態分布87第四節
正態分布3287正態分布首先由德國數學家和天文學家德·莫阿弗爾(A.deMovre,1667-1754)于1733年提出。德國數學家Gauss將其運用于天文學研究中,從而使正態分布為世人所知。
因此,正態分布又稱為Gauss分布。88A.deMovreGauss正態分布首先由德國數學家和天文學家德·莫阿弗爾(A.88893489將血清總膽固醇的橫坐標用變量X表示,第i組的組距和人數分別為△Xi和fi表示,n為總觀察例數,則在[X,X+△Xi)區間內每單位血清總膽固醇的頻率為:
f(X)=(fi/n)/△Xi
90
各矩形的面積恰好等于紅細胞在區間內的頻率(f(X)△Xi=fi/n)面積的總和為1。將血清總膽固醇的橫坐標用變量X表示,第i組的組距和人9091
假設觀察的人數增多,組段不斷細分,則直方圖將逐漸接近于一條均勻連續的曲線,這條曲線所描述的分布,簡稱為正態分布。36假設觀察的人數增多,組段不斷細分,則直方圖9192正態分布的密度函數,曲線方程為:
π和e是圓周率和自然對數的底,其近似值分別為3.14159和2.71828。
μ和σ是正態分布的兩個參數,分別是總體的均數和標準差。總體的自由度是n而不是n-137正態分布的密度函數,曲線方程為:π和e是圓9293正態分布的特征正態分布以均數μ為中心,左右對稱。正態分布曲線下面積集中在以均數μ為中心的中心部分,越遠離中心曲線下面積越小。正態分布曲線下面積分布有一定的規律。38正態分布的特征93正態分布曲線下面積的計算可以通過對其概率密度函數積分來實現:94正態分布曲線下面積的計算可以通過對其概率密度函數積分9495正態分布完全由參數μ和σ決定。40正態分布完全由參數μ和σ決定。95標準正態分布及曲線下面積
96
標準正態分布
(StandardNormalDistribution)
對任何參數的正態分布,都可以通過一個簡單的變量變換化成μ=0和s=1的標準正態分布。通常,可以利用標準正態分布表求出與原始變量X有關的概率值。標準正態分布及曲線下面積41標準正態分布(Standa9697代入:42代入:9798查附表1
Φ(-1.96)=?Φ(-2.58)=?43
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論