醫學統計學緒論、定量資料的統計描述_第1頁
醫學統計學緒論、定量資料的統計描述_第2頁
醫學統計學緒論、定量資料的統計描述_第3頁
醫學統計學緒論、定量資料的統計描述_第4頁
醫學統計學緒論、定量資料的統計描述_第5頁
已閱讀5頁,還剩87頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1醫學統計學

(medicalstatistics)2緒論3觀察單位的特征—變量

變量的測定值—變量值(資料)

定量資料(計量資料)(quantitativedata)

分類資料(categoricaldata)

無序分類(unorderedcategories)(計數資料)二項分類

多項分類

有序分類(orderedcategories)(等級資料)統計資料的類型P.24

表100例高血壓患者治療后臨床記錄患者年齡性別治療組舒張壓體溫療效編號X1

X2

X3

X4X5

X6137男A11.2737.5顯效

245女B12.5337.0有效

343男A10.9336.5有效

459女B14.6737.8無效

┆10054男B16.8037.6無效標識變量用于數據管理分析變量-表示試驗效應或觀察結果大小的

變量或指標分組變量反應變量56

72024/6/278資料間的相互轉化例:以人為單位,測得一群人Hb值(g/L),此資料為

;按Hb量的多少分為:<60(重度貧血),60~(中度貧血),90~(輕度貧血),120~160(正常)及>160(Hb增高)。此時資料為

。按Hb正常和異常分為兩類,此資料為

;分類資料數量化:性別:男—0女—1貧血程度:正常—0,輕度貧血—1,中度貧血—2,重度貧血—3。9統計數據的錄入格式P.606

數據庫文件:dBASE、FoxBASE、Epidata,等Excel文件統計應用軟件的相應數據文件:SPSS(.sav),等數據錄入原則:便于錄入、便于核查、便于轉換、便于分析。案例:大學生傷害調查研究10casevariable11統計工作的步驟P.4

設計收集資料整理資料分析資料1)專業設計2)統計設計1)統計報表2)醫療衛生工作記錄3)專題調查和實驗1)對數據檢查、核對2)按分析要求分組、匯總1)統計描述2)統計推斷1213

定量資料的統計描述如何選用正確的統計指標描述一個定量資料?例2.2某年某市抽樣調查的120名5歲女孩身高(cm),資料如下14105.5118.6110.5104.2110.9107.9108.199.1104.8116.5110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6109.1108.1109.4118.2103.9116.0110.199.6109.3107.5108.6100.6108.8103.895.3104.4102.7101.0112.1118.7……………………………………124.0……………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0第一節頻數分布15定量資料的頻數表和頻數圖(直方圖)圖2.1某市城區120名5歲女孩身高頻數分布表2.2某市120名5歲女孩身高頻數表組段(cm)頻數(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合計120161、頻數分布的特征(1)集中趨勢(centraltendency)(2)離散趨勢(dispersion)17(1)對稱分布其中一種常見的類型為正態分布。(2)偏態分布有正(左)偏態、負(右)偏態之分。2、頻數分布的類型18表2.2某市120名5歲女孩身高頻數表組段(cm)頻數(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-1251合計1201920第二節集中趨勢的描述——平均數21常用平均數的意義及其應用場合平均數意義應用場合均數平均數量水平應用甚廣,最適用于對稱分布,特別是正態分布幾何均數平均增減倍數①等比資料;②對數正態分布資料中位數位次居中的觀察值水平①偏態資料;②分布不明資料;③分布一端或兩端出現不確定值221.均數(mean):

應用:正態分布或近似正態分布的定量資料。

計算:1)直接法:2)加權法:式中:f—各組段的頻數(相同觀察值的個數)

X—各組段的組中值=(下限值+上限值)/2SPSS232.幾何均數(geometricmean):G計算:(1)直接法:(2)加權法24

例:6份血清的抗體效價為1:10,1:20,1:40,1:80,1:80,1:160,求其平均效價。

先求平均效價的倒數:該6份血清抗體的平均效價為1:45。SPSS25(2)加權法:例SPSS26

應用:(1)變量值呈倍數關系(2)對數正態分布何謂對數正態分布?已知:X1,X2,……Xn呈偏態分布。設:Y1=lgX1,Y2=lgX2,……Yn=lgXn。則:Y1,Y2,……Yn呈正態分布。

此時,將對數值還原為原始數值,則:273.中位數(median):M概念:是一組由小到大按順序排列的觀察值中位次居中的數值。計算:(1)直接法:某病患者發病潛伏期為2、3、3、3、4、5、6、9、16天,求中位數。若在第20天又發現1例患者呢?n為奇數時,n為偶數時,28(2)頻數表法:

利用百分位數計算公式進行計算.

百分位數(PX)是一種位置指標,PX將一組觀察值分為兩部分, 有X%的觀察值比它小,有(100-X)%的觀察值比它大。中位數是一個特定的百分位數,即M=P50

29百分位數計算公式:30應用:(1)偏態分布資料;(2)資料分布一端或兩端有未確定值。31例:SPSS32第三節離散趨勢的描述33描述離散程度的常用指標全距(極差)

(R)2、四分位數間距(Q)3、方差(

2,S2)和標準差(、S)4、變異系數(CV)意義指標數值越小,說明觀察值的變異度越小,平均數的代表性越好。主要用于偏態分布的資料用于正態分布用于兩組或多組間的比較1.全距(極差)(range,R)意義:

反映一組同質觀察值個體差異的范圍。計算:R=Xmax-XminR甲=8;R乙=12;R丙=8。

缺點:(1)不能反映組內其它觀察值的變異度。(2)樣本含量越大,則全距可能也越大。34352.四分位數間距(interquartilerange,IQR)

即P75-P25

四分位數可看作是一組同質觀察值居中的50%變量值的變異范圍。與全距比較有何優點?不受極值影響,較穩定。應用:(1)偏態分布;(2)資料一端或兩端有未確定值。363.方差(variance,

2,

S2)和標準差(standarddeviation,S)

374.標準差:

標準差或方差越大,說明個體差異越大,則均數的代表性越差。?應用:對稱分布,尤其是正態分布38樣本標準差(S)直接法:加權法:

S2稱為——

樣本方差

式中n-1稱為自由度,用希臘字母表示。SPSS395.變異系數(CV)?應用:(1)比較單位不同的幾組資料的變異程度(2)比較均數相差懸殊的幾組資料的變異程度40

例某地調查120名5歲女孩,其身高均數為110.15cm,標準差為5.86cm;其體重均數為17.71kg,標準差為1.44kg,試比較兩者變異度。說明體重的變異程度較身高大。41第四節

正態分布及其應用一、正態分布的概念4243(1)在橫軸上方,均數處最高,為單峰分布(2)以均數為中心,左右對稱(3)有兩個參數,μ

和σ。X~N(μ,σ)(4)正態曲線下面積分布有一定規律二、正態分布的圖形與特征4445正態曲線下某一區間的面積占總面積的百分數有何意義?即該區間的例數占總例數的百分數(頻數分布)或觀察值落在該區間的概率。三、正態曲線下面積分布的規律4647四、標準正態分布X~N(0,1)——標準正態分布標準化變換:z~N(0,1)標準正態曲線下的面積,φ(z)值(P.695附表1)z=u48五、正態分布的應用1.估計頻數分布2.制定參考值范圍3.質量控制4.統計處理方法的基礎49估計頻數分布例2.2出生體重低于2500克為低體重兒。若由某項研究得某地嬰兒出生體重均數為3100克,標準差為300克,估計該地當年出生低體重兒所占比例。出生體重X~N(3100,300)查附表1得:φ(-2.00)=0.0228即X≤2500的比例為2.28%。50制定參考值范圍1)一定數量(n>100)符合條件的觀察對象2)選定適當的百分界限;

如80%、90%、95%和99%,常用為95%。3)確定單側或雙側51雙側:P2.5~P97.5單側:若高不正常,則<P95若低不正常,則>P5雙側:單側:若高不正常,則<若低不正常,則>4)方法:a:正態分布法b:百分位數法以取95%界限為例52如何判斷資料是否呈正態分布?頻數表和頻數圖P-P圖或Q-Q圖正態性檢驗53偏態分布:

中位數(四分位數間距)小結:如何描述一個定量資料?正態分布:

均數±標準差偏態分布:

小結:如何估計正常值范圍?以雙側95%為例。正態分布:

P2.5~P97.55657585960611.區分計量資料與計數資料實例1:“小兒皮膚血管瘤雌、孕激素受體的研究”(中華××××雜志×年×月第3期)。該研究采用免疫組化方法對毛細血管瘤、混合型血管瘤、海綿狀血管瘤、淋巴管瘤及正常皮膚組織的雌激素受體ER、孕激素受體PR進行檢測。全部標本經10%福爾馬林固定,常規石蠟包埋。每例選一典型蠟塊,4-6切片,進行免疫組化染色,高倍鏡下每例腫瘤區內計數500個細胞,計數ER、PR陽性細胞百分率,資料見表1。計量資料統計描述實例作者采用卡方檢驗比較各組間的差異。

分析:一般認為帶有“率”的資料就是定性資料,似應判斷為定性資料。然而問題的關鍵在于,原作者的觀察單位并不是細胞本身,而是每一個病例標本,作者關心的是4種疾病病例標本和一組正常人標本的ER、PR陽性細胞率之均值是否相同,從每一個病例標本中得到的是ER和PR的陽性細胞率,他們是具體的數值,因而應屬于定量資料。

結論:判斷資料性質的關鍵是把資料還原為基本觀察單位的具體取值形式,而不要被資料的表現所迷惑。本資料的受試對象為病例標本,測量指標為“陽性細胞百分率”,因而應為定量資料。

66實例2:某研究人員為了評價一項新的治療方法的效果,將8個病人隨機等分為兩組,分別接受兩種治療方法(傳統方法、新方法)。由于療效不適合用客觀指標直接測量,因此,研究者請專家為不同組的病人治療效果進行評分,最低為0分,最高為4分,分數越高說明治療效果越好。各組得分結果的原始記錄如下,見表2:67作者將上述實驗結果表達如下:

傳統方法組:1.05±0.19(n=4)新方法治療組:2.15±0.44(n=4)68

分析:評分一般情況下是可以當作計量資料的,比如學生考試成績就是一種評分,可以用來表示。但本例中的評分嚴格來說是一種等級資料。當作計數資料進行統計描述和處理更為合適。69思考題下面是300名肝硬化患者的有關資料:編號X1(病程,天)X2(出血次數)X3(血型)X4(性別)X5(療法)X6(白蛋白,g/L)001910B男A35002350A男B40003541O男B2500482A女C41…………………1、請指出各指標(編號除外)對應的變量類型;2、現欲對上述肝硬化患者的白蛋白測定結果進行統計描述,請寫出你的統計分析思路。71第十章統計表與統計圖一、統計表

statisticaltable二、統計圖

statisticalchart72一、統計表statisticaltable(一)統計表的結構(二)制表的基本要求(三)統計表的種類73表號標題縱標目 橫標目合計頂線標目線合計線底線*(一)統計表的結構統計表由5個部分組成:

標題、標目、線條、數字、備注7475(二)制表的基本要求1.標題概括說明表的內容,必要時包括時間地點。位于表的正上方。

某年某地不同型流腦病死率比較

病型病人數死亡人數病死率(%)菌血型5946.78

腦型778486.17混合型784394.97

合計1621915.61762.標目有橫標目、縱標目之分。

橫標目:是統計表的主語部分,位于左側;

縱標目:是統計表的謂語部分,位于上側。

某年某地不同型流腦病死率比較

病型病人數

死亡人數病死率(%)菌血型

5946.78

腦型

778486.17混合型

784394.97

合計1621915.61773.線條一般為3~4條橫線,不能出現豎線或斜線。

某年某地不同型流腦病死率比較

病型病人數死亡人數病死率(%)菌血型5946.78

腦型778486.17混合型784394.97

合計1621915.61784.數字注意同一指標的小數位數要一致,位次對齊。表內不宜留空格。暫缺用“…”表示,無數字用“——”表示。

某年某地不同型流腦病死率比較

病型病人數死亡人數病死率(%)菌血型5946.78

腦型778486.17混合型784394.97

合計1621915.61795.備注必要是可用符號如“*”引出,寫在表的下方,但不宜過多。

某年某地不同型流腦病死率比較

病型病人數死亡人數病死率(%)菌血型5946.78

腦型778486.17混合型784394.97

合計1621915.61*:各型流腦病死率比較:P>0.0580(三)統計表的種類1、簡單表simpletable

按一個特征或標志分組的統計表。2、復合表combinativetable

按兩個或兩個以上特征或標志分組統計表。81

某年某地不同型流腦病死率比較

病型病人數死亡人數病死率(%)菌血型5946.78

腦型778486.17混合型784394.97

合計1621915.611、簡單表82

某年某地不同型及不同病情流腦病死率比較

輕中重病型病人數死亡病死率病人數死亡病死率病人數死亡病死率人數(%)人數(%)人數(%)菌血型2500.002700.007

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論