衛生統計學第一章_第1頁
衛生統計學第一章_第2頁
衛生統計學第一章_第3頁
衛生統計學第一章_第4頁
衛生統計學第一章_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、統計工作步驟統計工作步驟統計資料的類型統計資料的類型統計學的基本概念統計學的基本概念衛生統計學2基本內容基本內容 統計描述統計描述統計推斷統計推斷(1)統計推斷統計推斷(2)數值變量數值變量 頻數分布頻數分布集中趨勢集中趨勢離散趨勢離散趨勢統計圖表統計圖表抽樣誤差抽樣誤差標準誤標準誤可信區間可信區間 t u F檢驗檢驗非參檢驗非參檢驗直線相關與回歸直線相關與回歸偏相關偏相關多元線性回歸多元線性回歸分類變量分類變量相對數相對數統計圖表統計圖表u 、 2檢驗檢驗可信區間可信區間非參檢驗非參檢驗Logistic回歸回歸統計工作步驟統計工作步驟統計資料類型統計資料類型統計學基本概念統計學基本概念緒緒

2、論論統統計計工工作作步步驟驟第一講 統計學基本概念5來自臨床研究的實例 例如:例如:妊娠期糖代謝異常對妊娠結局的影響妊娠期糖代謝異常對妊娠結局的影響 如何進行如何進行研究?研究?第一講 統計學基本概念6 第一步第一步 研究設計研究設計(Design) 第二步第二步 收集資料收集資料(Collection of data) 第三步第三步 整理資料整理資料(Sorting data) 第四步第四步 分析資料分析資料(Analysis of data)7設計設計收集收集整理整理分析分析正確、周密的正確、周密的設計是研究成設計是研究成敗的敗的關鍵關鍵準確可靠。來源:準確可靠。來源:統計報表、工作統計報

3、表、工作記錄、專題調查記錄、專題調查或實驗或實驗原始資料的清原始資料的清理、錄入、檢理、錄入、檢查查統計描述和統計推斷,統計描述和統計推斷,由樣本估計總體,由由樣本估計總體,由樣本統計量估計總體樣本統計量估計總體參數;參數;闡明事物的內在聯系闡明事物的內在聯系和規律,合理呈現和規律,合理呈現【案例案例1-11-1】某研究者探討銀屑病的發某研究者探討銀屑病的發病與血型的關系,對病與血型的關系,對6464例銀屑病患者例銀屑病患者的血型進行觀察,結果發現的血型進行觀察,結果發現O O型型3030例,例,占占46.88%46.88%,居首位;,居首位;A A型和型和B B型均為型均為1717例,各占例

4、,各占26.56%26.56%;ABAB型型0 0例,居末。由例,居末。由此研究者認為銀屑病的發病與血型有此研究者認為銀屑病的發病與血型有明顯關系,明顯關系,O O型血的人最容易患銀屑型血的人最容易患銀屑病。病?!景咐咐?-21-2】某研究者欲研究其所在地區某研究者欲研究其所在地區居民對實施家庭病床的認同態度,擬從所居民對實施家庭病床的認同態度,擬從所有的居民小區中隨機抽取三個小區的住戶有的居民小區中隨機抽取三個小區的住戶為樣本,以戶為單位進行入戶調查。調查為樣本,以戶為單位進行入戶調查。調查員在小區門口對出入的居民進行了調查,員在小區門口對出入的居民進行了調查,然后對所得數據進行統計分析,

5、結果發現然后對所得數據進行統計分析,結果發現“該地區居民認為不需要設置家庭病床該地區居民認為不需要設置家庭病床”?!景咐咐?-31-3】某疾病控制中心開展了一項研某疾病控制中心開展了一項研究,以了解當地肺癌的患病情況,從十萬人究,以了解當地肺癌的患病情況,從十萬人口中隨機抽取口中隨機抽取20002000人進行調查,調查內容包人進行調查,調查內容包括流行病學資料和臨床實驗室檢查資料。其括流行病學資料和臨床實驗室檢查資料。其中男性中男性11001100人,患肺癌者人,患肺癌者6 6人;女性人;女性900900人,人,患肺癌者患肺癌者3 3人。由此,研究者計算得出,男人。由此,研究者計算得出,男性

6、肺癌發病率為性肺癌發病率為0.55%0.55%,女性肺癌發病率為,女性肺癌發病率為0.33%0.33%,并認為男性肺癌的發病率高于女性。,并認為男性肺癌的發病率高于女性。統統計計資資料料類類型型一、統計數據的分類:基本概念:變量及變量值 研究者對每個觀察單位的某項特征進行觀察和測量,這種特征稱為變量,變量的測得值值叫變量值(也叫觀察值),全部變量值的集合也稱為資料。【案例案例1-41-4】某醫師觀察復方板藍根治療成人急性氣管炎某醫師觀察復方板藍根治療成人急性氣管炎的療效,用紅霉素作對照,在進行臨床實驗設計時,考慮觀察的療效,用紅霉素作對照,在進行臨床實驗設計時,考慮觀察病人的年齡、性別病人的年

7、齡、性別 、民族、文化程度、職業、血型、病情、民族、文化程度、職業、血型、病情、病程、血常規、臨床治療效果等病程、血常規、臨床治療效果等2525個指標。隨機抽取成人急性個指標。隨機抽取成人急性氣管炎患者氣管炎患者120120人作為研究對象,隨機分成治療組和對照組,人作為研究對象,隨機分成治療組和對照組,治療組用復方板藍根治療治療組用復方板藍根治療6060人,治愈人,治愈2020人,顯效人,顯效2020人,有效人,有效1515人,無效人,無效5 5人,總有效人,總有效5555人,總有效率人,總有效率91.7%91.7%;對照組用紅霉素;對照組用紅霉素治療治療6060人,治愈人,治愈1212人,顯

8、效人,顯效1515人,有效人,有效2020人,無效人,無效1313人,總有人,總有效效4747人,總有效率人,總有效率78.3%78.3%,治療組和對照組的療效分布差異有,治療組和對照組的療效分布差異有統計學意義(統計學意義(z=2.544z=2.544,p=0.011p=0.011),治療組治愈率高于對照組,),治療組治愈率高于對照組,治療組和對照組的總有效率比較差異有統計學意義治療組和對照組的總有效率比較差異有統計學意義(=4.183=4.183,p=0.041p=0.041)治療組總有效率高于對照組)治療組總有效率高于對照組。按按變量值的性質變量值的性質可將資料分為:可將資料分為: 定性

9、資料定性資料(qualitative) 定量資料定量資料 (quantitative) 等級資料等級資料(ranked)定義:定義:將全體觀測單位按照將全體觀測單位按照某種性質或特征某種性質或特征 分組,然后再分別清點各組觀察單位分組,然后再分別清點各組觀察單位 的個數。的個數。特點:沒有特點:沒有度量衡度量衡單位單位 多為多為間斷性間斷性資料資料 (通過枚舉或記數得來)(通過枚舉或記數得來)可分為可分為二項二項與與多項多項定性資料定性資料1. 定性資料(計數資料、分類資料)2.定量資料定量資料(計量資料、數值變量)(計量資料、數值變量)定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標

10、的量的大小,得到的一系列數據資料。例如:體重與身高特點:表現為數值大小 有度量衡單位 多為連續性資料 (通過測量得到)定義:定義: 介于計量資料和計數資料之間的一種資介于計量資料和計數資料之間的一種資 料,通過料,通過半定量方法半定量方法測量得到。測量得到。特點:特點: 每一個觀察單位沒有確切值每一個觀察單位沒有確切值 各組之間有性質上的差別或程度上的不各組之間有性質上的差別或程度上的不 同。同。示例:示例: 檢查尿蛋白,觀察單位是每一份尿標本,檢查尿蛋白,觀察單位是每一份尿標本, 按結果等級不同可分為、按結果等級不同可分為、 、等。、等。3. 等級資料(有序變量)三類數據間的關系三類數據間的

11、關系 例:一組2040歲成年人的血壓(變量)以12kPa為界分為正常與異常兩組,統計每組例數 8 低血壓 8 正常血壓 12 輕度高血壓 15 中度高血壓 17 重度高血壓定量數據等級數據定性數據三類數據的編碼與計算三類數據的編碼與計算(1)(1) 例:一組2040歲成年人的血壓以12kPa為界分為正常(0)與異常(1)兩組,統計每組例數 8 低血壓 4 1 8 正常血壓 10 2 12 輕度高血壓 13 3 15 中度高血壓 16 4 17 重度高血壓 18 5定量數據等級數據定性數據三類數據的編碼與計算三類數據的編碼與計算(2)(2)1.定量數據:允許計算均數、標準差等(可采用t、F檢驗等

12、,可當做有序或定性數據處理)2.定性數據:編碼是任意的,不能對編碼執行均數標準差等計算,但可計算率或比(可采用卡方檢驗等) 調查14名男子的婚姻狀況分類編碼頻數(frequency)單身13已婚25離異32分居443. 有序數據:允許基于順序的計算,如計算中位數、百分位數(可當做定性數據處理)變量類型變量類型變量值表現變量值表現資料類型資料類型例子例子可選分析方法可選分析方法定量變量(數值變量)定量變量(數值變量)離散型變量離散型變量不連續的數值不連續的數值計量資料計量資料出生孩子數出生孩子數t檢驗、方差檢驗、方差分析、相關回歸分析、相關回歸分析分析連續型變量連續型變量連續的數值連續的數值身高

13、、體重、血紅身高、體重、血紅蛋白、血清鐵含量蛋白、血清鐵含量分類變量分類變量無序分類:二分無序分類:二分類類定性對立的兩類定性對立的兩類計數資料計數資料性別性別檢驗、檢驗、z檢驗檢驗無序分類:多分無序分類:多分類類類間無程度差異類間無程度差異血型、職業血型、職業檢驗檢驗有序分類有序分類類間有程度差異類間有程度差異等級資料等級資料文化程度、臨床治文化程度、臨床治療效果療效果秩和檢驗、秩和檢驗、Ridit分析分析統統計計學學基基本本概概念念同同質質與與變變異異概念:概念:研究對象具有的相同的狀況或屬性研究對象具有的相同的狀況或屬性等共性稱等共性稱同質性同質性;對于同質的各觀察單位,;對于同質的各觀

14、察單位,其某變量值之間的差異,稱為其某變量值之間的差異,稱為變異變異。 例如:研究某新藥治療胃潰瘍的效果,所有研究對象都必須是確診為胃潰瘍的病人且病情相似,在這種同質的基礎上觀察治療效果,有的人治愈,有的人未愈,這種差異就是變異。從本質上說,統計學就是研究變異的科學總總體體與與樣樣本本1.總體與樣本總體與樣本(population & sample )總體:總體:根據研究根據研究目的目的確定的確定的同質的同質的、所有觀察單位所有觀察單位的某的某 種變量值的種變量值的集合集合。 例:例:20142014級醫護分院護理專業女生身高;級醫護分院護理專業女生身高; 20142014級醫護分級醫

15、護分院女生的身高;院女生的身高;成都職業技術學院女生的身高(高血壓病人;成都職業技術學院女生的身高(高血壓病人; 肥胖病人)肥胖病人) 分類:分類: 有限總體:有限總體:理論上說,觀察單位的數量是理論上說,觀察單位的數量是 可知的、有限的??芍?、有限的。 無限總體:無限總體:沒有時間和地點的限制,觀察沒有時間和地點的限制,觀察 單位總數量是不可知的。單位總數量是不可知的。 目標總體目標總體 研究總體研究總體鑒于總體的巨大或不可知性鑒于總體的巨大或不可知性 能否研究其中的一部分?不可能或沒有必要對全體中的每一個對象進行研究樣本樣本(sample)概念:概念:從總體中從總體中隨機抽取隨機抽取的、

16、具有的、具有代表性代表性的的 部分研究對象,其部分研究對象,其實測值實測值的的集合集合。如何從總體中得到有代表性的一部分?如何從總體中得到有代表性的一部分?得到多少合適呢?得到多少合適呢?2.隨機抽樣隨機抽樣 random sampling為了保證樣本的可靠性和代表性,需要采用隨機的方法抽取樣本(在總體中每個個體具有相同的機會被抽到樣本中)。Target population(目標總體) Population sampled(抽樣總體) Sample(樣本)能不能成功的達到從樣本推斷總體的目的,關鍵是抽樣方法,樣本的代表性和推斷的技術,這些是統計學的核心內容。 概率(隨機)抽樣概率(隨機)抽樣

17、 等概率抽樣系統抽樣分層抽樣非等概率抽樣簡單隨機抽樣整群抽樣 抽樣方法:抽樣方法:誤差大小:整群抽樣誤差大?。赫撼闃?簡單隨機抽樣簡單隨機抽樣 系統抽樣系統抽樣 分層抽樣分層抽樣樣本樣本總體總體統計推斷統計推斷隨機抽樣隨機抽樣從特殊到一般從特殊到一般參參數數與與統統計計量量(parameter and statistic)參數:總體的統計指標,如總體均數、總體標準差,分別用希臘字母記為、。固定的常數 樣本抽取部分觀察單位 推斷inference統計量:樣本的統計指標,如樣本均數、標準差,采用拉丁字母分別記為 。 參數附近波動的隨機變量 。SX、頻頻率率與與概概率率(frequency and

18、 probabilityfrequency and probability)頻率:樣本的實際發生率稱為頻率。設在相 同條件下,獨立重復進行n次試驗, 事件A出現m次,則事件A出現的頻率 為f = m /n。概率:隨機事件發生的可能性大小,用大寫 的P 表示;取值0,1。 必然事件 P = 1隨機事件 0 P 1不可能事件 P = 0 統計學上把P 0.05(5)稱為小概率事件(習慣) ,認為不大可能發生。通常我們把經常遇到的事件分為三種類型:頻率與概率間的關系: 1. 樣本頻率總是圍繞概率上下波動; 2. 樣本含量n越大,波動幅度越小,頻 率越接近概率。統 考 真 題 再 現【試題試題1-11-1】統計工作中最關鍵的一步是(統計工作中最關鍵的一步是( )A A統計設計統計設計 B B收集資料收集資料 C C整理資料整理資料 D D分析資料分析資料 (20142014年年1 1月、月、1010月試題)月試題)【試題試題1-21-2】若以成年男性血紅蛋白低于若以成年男性血紅蛋白低于120g/L120g/L為貧為貧血的判斷標準,調查某地成年男性血的判斷標準,調查某地成年男性10001000人,記錄每人,記錄每人是否患有貧血,結果有人是否患有貧血,結果有1919名貧血患者,名貧血患者,981981名非貧名非貧血患者,則該資料的類型為(血患者,則該資料的類型為( )A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論