01描述性統(tǒng)計課件_第1頁
01描述性統(tǒng)計課件_第2頁
01描述性統(tǒng)計課件_第3頁
01描述性統(tǒng)計課件_第4頁
01描述性統(tǒng)計課件_第5頁
已閱讀5頁,還剩50頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

01描述性統(tǒng)計醫(yī)學統(tǒng)計學

方積乾中山大學公共衛(wèi)生學院01描述性統(tǒng)計

緒論01描述性統(tǒng)計統(tǒng)計學(Statistics):Thedisciplineconcernedwiththetreatmentofnumericaldataderivedfromgroupsofindividuals(P.Armitage).

關(guān)于處理數(shù)據(jù)的學科。Thescienceandartofdealingwithvariationindatathroughcollection,classificationandanalysisinsuchawayastoobtainreliableresults(JMLast).

通過收集、分類和分析,處理數(shù)據(jù)變異性的科學與藝術(shù),旨在取得可靠的結(jié)果。01描述性統(tǒng)計醫(yī)學統(tǒng)計學(MedicalStatistics):

數(shù)理統(tǒng)計學在醫(yī)學中的應(yīng)用。

為什麼學習醫(yī)學統(tǒng)計學?(1)醫(yī)學研究需要;(2)更新醫(yī)學知識需要;(3)處理自身工作和研究的數(shù)據(jù)。01描述性統(tǒng)計基本概念同質(zhì):同類個體具有共性。變異:同類個體間的差異,如身高、體重…1.同質(zhì)與變異01描述性統(tǒng)計

總體(population):打算研究的全部個體----大同小異樣本(sample):總體中,具有代表性的一部分隨機化(randomization):使樣本具有代表性的重要方法2.總體與樣本01描述性統(tǒng)計隨機(Random)隨機事件:在一次試驗中可能發(fā)生,也可能不發(fā)生的事件.

在試驗之前,無人知道發(fā)生還是不發(fā)生。

經(jīng)大量試驗,這類事件是有一定規(guī)律的.01描述性統(tǒng)計3.概率度量隨機事件發(fā)生的可能性大小。

A:隨機事件P(A):隨機事件A發(fā)生的概率P(A)=1,事件A一定發(fā)生.P(A)=0,事件A絕對不發(fā)生.01描述性統(tǒng)計觀察次數(shù):n(足夠大)事件A的發(fā)生數(shù):mP(A)

m/n

(頻率或相對頻率)

概率的估計----頻率01描述性統(tǒng)計4.參數(shù)與統(tǒng)計量參數(shù):定量反映總體的某個性質(zhì)

通常用希臘字母表示,如μ,π----常常未知統(tǒng)計量:定量反映樣本的某個性質(zhì)通常用拉丁字母表示,如s,p01描述性統(tǒng)計

統(tǒng)計工作的基本步驟1.研究設(shè)計2.收集數(shù)據(jù)3.整理數(shù)據(jù)4.數(shù)據(jù)分析01描述性統(tǒng)計學習目的與方法(1)統(tǒng)計思維享用一生事件的不確定性----概率由樣本推斷總體,結(jié)論的不確定性----有可能犯錯誤

統(tǒng)計學任務(wù)

----限定犯錯誤概率的大小,在此前提下,作決策01描述性統(tǒng)計(2)理解概念是首位研究設(shè)計的原則確定樣本量的依據(jù)參數(shù)估計的精度決策的兩類錯誤

案例辨析:在辨析中提高,從反面吸取教訓

----平時爭論、課堂討論01描述性統(tǒng)計(3)重在理解和解釋結(jié)果通過計算,體驗統(tǒng)計概念和思想正確理解、解釋和表達計算結(jié)果

中英文結(jié)果報告:內(nèi)容齊全,表達規(guī)范

----作業(yè)要按照規(guī)格撰寫01描述性統(tǒng)計(4)電腦實驗用電腦模擬現(xiàn)實世界,從實驗中看隨機現(xiàn)象統(tǒng)計軟件:反復實踐,靈活運用

----機房開放,勤動手!01描述性統(tǒng)計(5)考試

*筆試:理論、方法不記公式,無數(shù)學推導,無復雜計算*上機考試:已做過的電腦實驗;不編程序01描述性統(tǒng)計教科書:

方積乾.醫(yī)學統(tǒng)計學與電腦實驗(第三版).上海科學技術(shù)出版社2006參考書:

方積乾.生物醫(yī)學研究的統(tǒng)計方法.北京:高等教育出版社200701描述性統(tǒng)計第

1章描述性統(tǒng)計01描述性統(tǒng)計

統(tǒng)計學:統(tǒng)計描述

統(tǒng)計推斷統(tǒng)計描述:

描述樣本的特征.主要手段:表格、圖形和數(shù)字特征01描述性統(tǒng)計

1.1變量和數(shù)據(jù)

1.1.1數(shù)據(jù)的結(jié)構(gòu)和特征

01描述性統(tǒng)計變量的類型變量(variable):個體特性的數(shù)量描述(1)定性變量

(i)分類變量(categoricalvariable)或名義變量(nominativevariable)。分類變量的水平(level)代碼(code)用1、2、3、4、5等來表示各個水平。二分類變量(binaryvariable),也稱0-1變量或假變量(dummyvariable)(ii)有序變量(ordinalvariable)

種種可能的“取值”中自然地存在著次序。

01描述性統(tǒng)計(2)定量變量

(i)離散型變量只能取整數(shù)值。例如,手術(shù)病人數(shù);新生兒數(shù)

(ii)連續(xù)型變量可以取實數(shù)軸上的任何數(shù)值。由測量而得到的大多屬于連續(xù)型變量例如,血壓、身高、體重等“連續(xù)”:指該變量可以在實數(shù)軸上連續(xù)變動。變通:紅細胞記數(shù)也視為連續(xù)型變量。(一個、兩個、三個之間的差別并不重要)01描述性統(tǒng)計變量類型的轉(zhuǎn)化:只能由高級向低級轉(zhuǎn)化,

不能作相反方向的轉(zhuǎn)化

連續(xù)型→有序→分類→二值離散型變量常常通過適當?shù)淖儞Q或連續(xù)性校正后借用連續(xù)型變量或有序變量的方法來分析。01描述性統(tǒng)計1.2頻數(shù)表與直方圖描述樣本特征直觀反映概率分布1.2.1頻數(shù)表1.離散型變量的頻數(shù)表01描述性統(tǒng)計Table1.3108名患者的職業(yè)分布01描述性統(tǒng)計Table1.4150名患者某項半定量檢驗結(jié)果的頻數(shù)分布01描述性統(tǒng)計2.連續(xù)型變量的頻數(shù)表

Example1.3某縣居民中隨機選擇120正常成年男子。其紅血球記數(shù)資料如下:5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.045.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69請為這批資料作頻數(shù)表。01描述性統(tǒng)計(1)極差R

最大值=6.18,最小值=3.29,極差R=6.18-3.29=2.89.(2)組段長度i

將極差分成8-15個組段.

R/10=2.89/10=0.289≈0.30令

i=0.30.01描述性統(tǒng)計1.2.2頻數(shù)圖和直方圖

1.離散型變量的頻數(shù)圖–直條圖01描述性統(tǒng)計2.連續(xù)型變量的頻數(shù)圖

----

直方圖

01描述性統(tǒng)計01描述性統(tǒng)計1.3平均水平的度量數(shù)量特征:

平均水平

變異性1.3.1算術(shù)均數(shù)

直方圖接近對稱時用個體觀察值記為

算術(shù)均數(shù)記為(1.1)01描述性統(tǒng)計1.3.2幾何均數(shù)對數(shù)值的直方圖接近對稱時用例一組樣品的抗體滴度為1:

4,1:8,1:16,1:16,1:64,1:128.

4,8,16,16,64,128的

算術(shù)均數(shù)=39.3

幾何均數(shù)=20.16

01描述性統(tǒng)計1.3.3中位數(shù)直方圖單蜂而不對稱時用中位數(shù)=由小到大排隊后,中間的數(shù)值例1

數(shù)據(jù){1,1,2,2,3,4,6,9,10}中位數(shù)=3例2數(shù)據(jù){1,1,2,2,3,4,6,9,10,13}中位數(shù)=(3+4)/2=3.5當n

為奇數(shù),

中位數(shù)=第(n+1)/2個數(shù)值當n

為偶數(shù),中位數(shù)=

第n/2個數(shù)值+第(1

+n/2)個數(shù)值

2

01描述性統(tǒng)計想一想如何計算百分位數(shù)?25百分位數(shù)P25

:25%的觀察值小于P25,75%的觀察值大于P25.75百分位數(shù)P75

:75%的觀察值小于P75,25%的觀察值大于P75.5百分位數(shù)P5?95百分位數(shù)P95?P2.5?

P97.5?

01描述性統(tǒng)計1.4變異性的度量1.4.1極差R

R=最大值–最小值R

不穩(wěn)健.

缺點:僅取決于兩頭的數(shù)值,與中間的數(shù)值無關(guān)

觀察個數(shù)越多,極差越大.(Why?)01描述性統(tǒng)計1.4.2四分位數(shù)差距(Inter-quartilerange)

下四分位數(shù):25percentile,P25or上四分位數(shù):75percentile,P75or四分位數(shù)差距=P75-P25=-=13.120–8.083=5.03701描述性統(tǒng)計1.4.3方差和標準差離均差:離均差平方:總體方差:離均差平方在總體中的平均總體標準差:01描述性統(tǒng)計

總體均數(shù)未知時,取代離均差:平方離均差:樣本方差:平方離均差的平均樣本標準差:自由度:(n-1)01描述性統(tǒng)計Example男嬰的體重2.85,2.90,2.96,3.00,3.05,3.18均數(shù)和標準差常聯(lián)合表示為例如,170

6(cm)01描述性統(tǒng)計1.4.4變異系數(shù)例9-10正常年輕男子的身高變異大還是體重變異大?01描述性統(tǒng)計1.5相對數(shù)和標準化1.5.1比、頻率和強度

相對數(shù)廣泛應(yīng)用于生命統(tǒng)計和流行病學.

注意:有三類不同的相對數(shù),雖然它們常常都稱為“…率”.01描述性統(tǒng)計比:

任何兩個量之比例如,01描述性統(tǒng)計2.頻率

特殊類型的“比”:分子、分母都是個數(shù);分子是分母的一部分;數(shù)值介于0和1之間例如,01描述性統(tǒng)計3.強度另一種特殊類型的“比”:分母是一定時段內(nèi)總的觀察人年數(shù);分子是該時段內(nèi)發(fā)生某事件的人數(shù);數(shù)值不一定介于0和1之間例如,01描述性統(tǒng)計單位:“人/(人年)”死亡率可以看作是單位時間內(nèi)校正的死亡頻率.

一般說,強度可以看作是“單位時間內(nèi)校正的頻率”,反映單位時間內(nèi)某事件發(fā)生的頻率.01描述性統(tǒng)計1.5.2粗死亡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論