研統計1緒論收集和整理_第1頁
研統計1緒論收集和整理_第2頁
研統計1緒論收集和整理_第3頁
研統計1緒論收集和整理_第4頁
研統計1緒論收集和整理_第5頁
已閱讀5頁,還剩83頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、張建軍張建軍汕大醫學院預防醫學教研室汕大醫學院預防醫學教研室Tel:mail: 北京某醫院某大夫使用北京某醫院某大夫使用“烏貝散烏貝散” (烏賊骨(烏賊骨3錢,白芨錢,白芨3錢,川貝錢,川貝3錢錢, 甘草甘草3錢錢,共研細末過共研細末過120目篩,沖服)目篩,沖服)治療胃潰瘍病出血治療胃潰瘍病出血107107例,有效例,有效101101例,有效率為例,有效率為94.4% 94.4% 別的醫院,其他大夫使用別的醫院,其他大夫使用“烏貝散烏貝散”來治療胃來治療胃潰瘍病出血,其有效率也一定是潰瘍病出血,其有效率也一定是94.4%94.4%嗎?嗎?求求 置信區間置信區間

2、北京某醫院有位老大夫,用北京某醫院有位老大夫,用“冠心靈冠心靈”治療冠心病,治療冠心病,其對照組用西藥,觀察結果如下表:其對照組用西藥,觀察結果如下表: 表表1-1 1-1 冠心靈與單純西藥療效對比冠心靈與單純西藥療效對比 顯顯 效效 有有 效效 無無 效效 合計合計 單純西藥單純西藥 9 25 6 40 9 25 6 40 冠冠 心心 靈靈 19 18 5 42 19 18 5 42冠心靈是否比單純西藥有效?冠心靈是否比單純西藥有效?假設檢驗假設檢驗 (test of significance) (test of significance), 俗稱要算俗稱要算值。值。l 統計有三大特性,用三

3、句話予以簡單的概括:統計有三大特性,用三句話予以簡單的概括: l實用性:實用性:除了實情,數據能證明一切。除了實情,數據能證明一切。 l豐富性:豐富性:方法多樣,發展之中。方法多樣,發展之中。 l公平性:公平性:我們相信上帝,其它人請用數據說我們相信上帝,其它人請用數據說話。話。 定義:統計學(定義:統計學(Statistics) )是研究是研究數據搜集、數據搜集、整理與分析整理與分析的科學,是認識社會和自然現的科學,是認識社會和自然現象象數量特征數量特征的重要工具。的重要工具。醫用統計學(醫用統計學(Medical Statistics) ):運用:運用概率概率論和數理統計論和數理統計的原理

4、,方法,結合醫學實的原理,方法,結合醫學實際,研究際,研究數字資料的搜集,整理,分析,數字資料的搜集,整理,分析,推斷推斷的一門學科。的一門學科。數學數學統計學統計學醫學醫學數理統計學數理統計學醫用統計學醫用統計學醫用數學醫用數學醫學統計學是交叉學科醫學統計學是交叉學科數據的重要性:數據的重要性:對對事物本質的理解事物本質的理解-科學性(具體科學性(具體/量化);量化);對對偶然、眾多現象的分析偶然、眾多現象的分析-數據的規律性;數據的規律性;醫學的醫學的發展發展-數據的依賴性(標準數據的依賴性(標準/診斷準確診斷準確率);率);比如:現象間的關系:相關比如:現象間的關系:相關-因果?因果?統

5、計模型統計模型(Statistical Model)的建立的建立-現象之現象之間的數量關系;間的數量關系; Y=-17.3618+0.2219X (直線回歸方程)直線回歸方程) Y: 體重(體重(g);X:大白鼠進食量(:大白鼠進食量(g)利用大白鼠進食量推測體重增加情況利用大白鼠進食量推測體重增加情況還可以研究多因素對某一因素的影響還可以研究多因素對某一因素的影響統計結論的正確取決于:統計結論的正確取決于:實驗設計,資料搜實驗設計,資料搜集,數據管理等集,數據管理等; 統計學的應用意義統計學的應用意義(Application):Vaccinated groupInfection rate20

6、%Unvaccinated groupInfection rate10%e.g. Evaluation on a new vaccineHow can we conclude? 1. Really effective? or By chance? Methods are needed to differentiate these two situations.2. Any bias in vaccinated people? e.g. age, nutrition, or social class. A suitable design can exclude the bias.統計學離不開計算

7、工具的進步:統計學離不開計算工具的進步:計算機,軟件的發展;計算機,軟件的發展;SPSS (Statistics Package for Social Science)- Statistical Product and Service Solutions, SAS, Stata, PEMS (Package for Encyclopedia of Medical Statistics)1、有變異(、有變異(variation)的事物的事物l變異來源各種各樣;是客觀存在的;統計必變異來源各種各樣;是客觀存在的;統計必須在一定數量的觀察基礎上進行。須在一定數量的觀察基礎上進行。l隨機事件(隨機事件

8、(Random event):一次試驗結果一次試驗結果不確定不確定,在一定數量重復條件下呈現出規律性。在一定數量重復條件下呈現出規律性。2、同質(、同質(homogeneity)的事物的事物 研究的事物性質基本相同;避免將風馬牛不研究的事物性質基本相同;避免將風馬牛不相及的事物作統計分析;相及的事物作統計分析; (3 mules+2 donkeys)/5=? l1、總體(、總體(population):):l是根據是根據研究目的研究目的確定的、確定的、同質的全部研究對同質的全部研究對象象中所有觀察單位中所有觀察單位某種變量值某種變量值的集合。的集合。l同質基礎:時間、空間、條件等同質基礎:時間

9、、空間、條件等l(1)有限總體)有限總體(finite population):有限觀察:有限觀察單位單位l(2)無限總體)無限總體(infinite population):很多為:很多為無限總體。無限總體。l如研究某地如研究某地2003年健康成年男性的身高(年健康成年男性的身高(cm),),則該地則該地2003年全部健康成年男子的身高構成一個總年全部健康成年男子的身高構成一個總體。體。該總體只包括有限個觀察單位,稱為該總體只包括有限個觀察單位,稱為有限總有限總體體。l有時總體是有時總體是設想的設想的,是抽象的。,是抽象的。l例如:研究用某藥治療冠心病患者的療效,其總例如:研究用某藥治療冠心

10、病患者的療效,其總體的同質基礎是同用該藥治療的冠心病患者,而體的同質基礎是同用該藥治療的冠心病患者,而總體為設想用該藥治療的所有冠心病患者的治療總體為設想用該藥治療的所有冠心病患者的治療結果,這里結果,這里沒有確定的時間和空間范圍的限制沒有確定的時間和空間范圍的限制,因而觀察單位數無限,稱為因而觀察單位數無限,稱為無限總體無限總體。l2、樣本、樣本l根據隨機化原則從總體中抽取的一定數量根據隨機化原則從總體中抽取的一定數量(sample size)的個體,稱為樣本(的個體,稱為樣本(sample),),用樣本信息來推斷總體特征。用樣本信息來推斷總體特征。l從總體中抽取部分個體的過程稱為從總體中抽

11、取部分個體的過程稱為抽樣抽樣(sampling)。l抽樣必須遵循隨機化原則,即要使總體中每抽樣必須遵循隨機化原則,即要使總體中每一個體有同等的機會被抽取,這樣的樣本對一個體有同等的機會被抽取,這樣的樣本對總體有較好的總體有較好的代表性代表性,能根據其統計量推斷,能根據其統計量推斷總體特征。總體特征。l(隨機化,足夠樣本含量使樣本具有代表性)(隨機化,足夠樣本含量使樣本具有代表性)l樣本的樣本的可靠性可靠性:l總體確定后,使樣本中的每個觀察單位確屬預先總體確定后,使樣本中的每個觀察單位確屬預先確定的同質總體。確定的同質總體。l如:正確診斷,正確分期;規定動物的種屬、原如:正確診斷,正確分期;規定

12、動物的種屬、原始體重,控制非實驗因素等;始體重,控制非實驗因素等;l抽樣的必要性抽樣的必要性:l無限總體;無限總體;l有限總體:人力、財力、不可能性、不必要性有限總體:人力、財力、不可能性、不必要性 (高血壓病人等)。(高血壓病人等)。l3、同質、同質l同質(同質(homogeneity)是指影響被研究指標的)是指影響被研究指標的非實非實驗因素相同驗因素相同。l有些影響因素往往是難以控制的、甚至是未知的,有些影響因素往往是難以控制的、甚至是未知的,如遺傳、營養、心理等。如遺傳、營養、心理等。l實際中只有實際中只有相對的同質相對的同質,即影響被研究指標較大的、,即影響被研究指標較大的、可以控制的

13、主要因素可以控制的主要因素盡可能相同盡可能相同。如研究兒童的身。如研究兒童的身高,則要求影響身高這一指標較大的、易控制的因高,則要求影響身高這一指標較大的、易控制的因素如素如性別、年齡、民族、地區性別、年齡、民族、地區要相同,而不能控制要相同,而不能控制的因素,如遺傳、營養等影響因素可以略去。的因素,如遺傳、營養等影響因素可以略去。l4、變異(、變異(variation, variablility )l同質基礎上的各觀察單位(亦稱為個體)之間的同質基礎上的各觀察單位(亦稱為個體)之間的差異為變異。如同性別、同年齡、同民族、同地差異為變異。如同性別、同年齡、同民族、同地區兒童的身高有高有低,稱為

14、身高的變異。區兒童的身高有高有低,稱為身高的變異。l統計學是研究變異的科學。沒有變異就不需要統統計學是研究變異的科學。沒有變異就不需要統計學。計學。l在醫學研究中,這種變異表現在人與人之間的差在醫學研究中,這種變異表現在人與人之間的差異。異。l雖然有時我們感興趣的是變異本身,但更多時候雖然有時我們感興趣的是變異本身,但更多時候我們試圖找出隱藏在變異背后的我們試圖找出隱藏在變異背后的規律性規律性。l5、參數(、參數(parameter)和統計量(和統計量(statistic)l總體的統計指標稱為參數。總體的統計指標稱為參數。l如:總體均數(如:總體均數(),總體發病率,總體死亡率,總體發病率,總

15、體死亡率,等,等,l樣本的統計指標稱為統計量樣本的統計指標稱為統計量l如:樣本均數如:樣本均數(x),樣本發病率,樣本死亡率,樣本發病率,樣本死亡率,等,等,l統計學上用不同的符號表示。統計學上用不同的符號表示。l6、誤差(、誤差(error) l觀察值與實際值的差異,成為誤差。觀察值與實際值的差異,成為誤差。l分為:過失誤差;系統誤差;隨機測量誤差;分為:過失誤差;系統誤差;隨機測量誤差;隨機抽隨機抽樣誤差樣誤差;(1)過失誤差過失誤差(mistaken error):過失所致的誤差(不:過失所致的誤差(不認真,錯誤判斷,記錄等原因);認真,錯誤判斷,記錄等原因);(2)系統誤差系統誤差(s

16、ystematic error):儀器未校準所致的:儀器未校準所致的誤差(統一偏高,或偏低);誤差(統一偏高,或偏低);l這兩類誤差可以避免。這兩類誤差可以避免。(3)隨機測量誤差隨機測量誤差(random measurement error):不同觀察者或同一觀察者多次觀察值的不相同。不同觀察者或同一觀察者多次觀察值的不相同。這種誤差不可避免。這種誤差不可避免。 那么,抽樣誤差又怎樣呢?那么,抽樣誤差又怎樣呢?(4)抽樣誤差抽樣誤差(sampling error): 總體中存在個體變異,抽樣研究中所抽取的樣本,總體中存在個體變異,抽樣研究中所抽取的樣本,只包含總體中一部分個體,因而樣本均數(

17、或率)只包含總體中一部分個體,因而樣本均數(或率)往往不等于總體均數(或率),表現為多次抽樣的往往不等于總體均數(或率),表現為多次抽樣的樣本均數或率不同。樣本均數或率不同。這種由抽樣引起的差異稱為抽樣誤差這種由抽樣引起的差異稱為抽樣誤差。抽樣誤差愈小,用樣本推斷總體的精確度愈高;反之,抽樣誤差愈小,用樣本推斷總體的精確度愈高;反之,其精確度愈低。其精確度愈低。由于生物的個體變異是客觀存在的,因而抽樣誤差是由于生物的個體變異是客觀存在的,因而抽樣誤差是不可避免不可避免的,但抽樣誤差有一定的的,但抽樣誤差有一定的規律性規律性。l7、概率(、概率(probability)幾率,或然率)幾率,或然率

18、 l概率是反映某一事件發生的可能性大小的量,常用概率是反映某一事件發生的可能性大小的量,常用符號符號P表示。表示。lThe probability of an event is the events long run relative frequency(相對頻率)(相對頻率) in repeated trials under similar conditions. It can be any value from 0 to 1.l絕對事件絕對事件(absolute event):概率等于:概率等于1或或0。l隨機事件隨機事件(random event): 概率在概率在0和和1之間。之間。 E

19、vent A, occurs B times in C trials, the ratio B /C is called the probability of A. P(A) = B /C lP0.05和和P0.01分別表示事件發生的可能性分別表示事件發生的可能性等于或小于等于或小于0.05和和0.01。l習慣上把習慣上把P0.05或或0.01的事件稱為小概率事件,的事件稱為小概率事件,表示某事件發生的可能性很小。表示某事件發生的可能性很小。l“小概率事件一次抽樣不可能發生小概率事件一次抽樣不可能發生” 小概率事件小概率事件定理定理P=1P=0P=0.5Random EventAbsolute

20、 EventAbsolute Eventl8、變量及變量值、變量及變量值l變量變量(variable):觀察對象的特征或指標。對變量進觀察對象的特征或指標。對變量進行取值所采用的工具或標準成為測量尺度(行取值所采用的工具或標準成為測量尺度(scale)。l測量的結果稱為測量的結果稱為變量值變量值(value of variable) 或觀察值或觀察值(observed value, measurements)。l如健康成年男性的血壓值:某個人是觀察單位,血如健康成年男性的血壓值:某個人是觀察單位,血壓是變量,千帕是測量尺度,千帕數值為觀察值。壓是變量,千帕是測量尺度,千帕數值為觀察值。l也可以

21、將變量定性:性別,職業,等。也可以將變量定性:性別,職業,等。Sample100Sampling Parameters Statistics Population50000With relatively same features(homogeneity) but still varied among all(variation)Observed unit with ProbabilityRepresentative(random, size)Inferencel9、隨機化(、隨機化(randomization)l使總體中的每個個體有均等的機會成為樣本觀察單使總體中的每個個體有均等的機會成為樣

22、本觀察單位的過程,稱為位的過程,稱為隨機化隨機化。l醫學研究從總體中抽出一定數量的樣本進行研究,醫學研究從總體中抽出一定數量的樣本進行研究,得出規律,推及總體。為使樣本代表總體,必須縮得出規律,推及總體。為使樣本代表總體,必須縮小抽樣誤差。小抽樣誤差。l隨機抽樣旨在隨機抽樣旨在避免人的主觀性,讓機遇起作用避免人的主觀性,讓機遇起作用,以,以反映總體的客觀情況。反映總體的客觀情況。l隨機不是隨便隨機不是隨便(free and easy, casual)或或 隨意隨意(ad libitum)。l常用:抽簽法,隨機數目表法,計算器隨機數法;常用:抽簽法,隨機數目表法,計算器隨機數法;最簡單、最基本的

23、抽樣方法最簡單、最基本的抽樣方法從總體從總體N N個對象中,利用抽簽或其他隨機方法抽取個對象中,利用抽簽或其他隨機方法抽取n n個個總體中每個對象被抽到的概率相等總體中每個對象被抽到的概率相等 Simple random sampling 按照一定順序,機械地每隔若干單位抽取一個單位的按照一定順序,機械地每隔若干單位抽取一個單位的抽樣方法。抽樣方法。將總體各個個體單位按某種標志排列、連續編號將總體各個個體單位按某種標志排列、連續編號根據總體數根據總體數N和確定的樣本數和確定的樣本數n,計算抽樣距離(,計算抽樣距離(N/n)用單純隨機方法在第一組中確定一個起始號用單純隨機方法在第一組中確定一個起

24、始號從此起始點開始,每隔從此起始點開始,每隔K(K=N/n)個單位抽取一個作)個單位抽取一個作為研究對象為研究對象 Systemic sampling系統抽樣示意圖系統抽樣示意圖 將總體單位按某種特征分為若干次級(層),然后從每一層內將總體單位按某種特征分為若干次級(層),然后從每一層內單純隨機抽樣組成一個樣本。單純隨機抽樣組成一個樣本。分類按比例分配按比例分配(proportional allocation)分層隨機抽樣分層隨機抽樣 各層內抽樣比例相同各層內抽樣比例相同最優分配最優分配(optimum allocation) 分層隨機抽樣分層隨機抽樣 各層抽樣比例不同,內部變異小的層抽樣比例

25、小,內各層抽樣比例不同,內部變異小的層抽樣比例小,內部變異大的層抽樣比例大部變異大的層抽樣比例大 Stratified sampling 將總體分成若干群組,抽取其中部分群組作為觀察將總體分成若干群組,抽取其中部分群組作為觀察單位組成樣本單位組成樣本分類單純整群抽樣單純整群抽樣(Simple cluster sampling) 被抽到的群組中的全部個體均作為調查對象被抽到的群組中的全部個體均作為調查對象二階段抽樣二階段抽樣(Two stages sampling) 通過再次抽樣后調查部分個體通過再次抽樣后調查部分個體 Cluster samplingl1、統計學是工具、統計學是工具l杜絕統計無

26、用,統計萬能論點杜絕統計無用,統計萬能論點。拓寬醫學研究思路拓寬醫學研究思路l統計學知識統計學知識-指導課題設計指導課題設計-資料分析資料分析l單因素單因素-多因素多因素-探討病因探討病因-預后預后l單純比較均數單純比較均數-相關、回歸相關、回歸l2、科研設計科學合理,提高效率、科研設計科學合理,提高效率l運用實驗設計的原則,從動物選擇、分組、指標運用實驗設計的原則,從動物選擇、分組、指標測定、結果分析等方面達到最優化。測定、結果分析等方面達到最優化。l統計不能創造規律,只能在一定的限度內,彌補統計不能創造規律,只能在一定的限度內,彌補實驗設計的不足。實驗設計的不足。l3、采集準確可靠的資料,

27、對資料合理使用,尤其、采集準確可靠的資料,對資料合理使用,尤其對多因素影響的疾病。對多因素影響的疾病。l4、選擇合適的統計方法進行分析,正確解釋、選擇合適的統計方法進行分析,正確解釋分析結果。分析結果。l統計結論是概率性的,在給出統計結論后,統計結論是概率性的,在給出統計結論后,恰當地指出專業意義。恰當地指出專業意義。l避免使用:避免使用:證明(或類似語氣)證明(或類似語氣);一般采用:;一般采用:提示,可以認為提示,可以認為等等 較為客觀。較為客觀。l1、著重理解醫學統計學的、著重理解醫學統計學的基本原理與基本基本原理與基本概念概念,掌握搜集、整理與分析資料的基本知掌握搜集、整理與分析資料的

28、基本知識與技能,常用統計指標與基本統計方法的識與技能,常用統計指標與基本統計方法的正確應用正確應用。l重視原始資料的完整性與可靠性,對數據的重視原始資料的完整性與可靠性,對數據的處理應持嚴肅、認真和實事求是的科學態度,處理應持嚴肅、認真和實事求是的科學態度,反對偽造和篡改統計數字反對偽造和篡改統計數字。l2、注意培養科學的統計思維方法、注意培養科學的統計思維方法l如:統計工作步驟間的內在聯系;生物個體如:統計工作步驟間的內在聯系;生物個體差異的客觀存在,抽樣誤差不可避免,因而差異的客觀存在,抽樣誤差不可避免,因而樣本指標的比較時,不能僅從數字表面大小樣本指標的比較時,不能僅從數字表面大小看問題

29、;統計結論具有概率性的思想;統計看問題;統計結論具有概率性的思想;統計檢驗的基本思想;檢驗的基本思想;l3、必須聯系實際,結合專業,才能學好和用、必須聯系實際,結合專業,才能學好和用好醫學統計學。如:多聯系醫學文獻和醫學好醫學統計學。如:多聯系醫學文獻和醫學科研工作,評價其統計設計與分析的優缺點。科研工作,評價其統計設計與分析的優缺點。l4、對數理統計公式,要理解其意義、用途和、對數理統計公式,要理解其意義、用途和應用條件,不必深究其數學推導。應用條件,不必深究其數學推導。l統計資料的類型統計資料的類型l統計工作的基本步驟統計工作的基本步驟l1、根據是否定量劃分:、根據是否定量劃分:l(1)計

30、量資料()計量資料(measurement data)l用用定量方法測量定量方法測量每個觀察單位的某項指標,所得的每個觀察單位的某項指標,所得的數值資料為計量資料,亦稱數值變量資料。一般有數值資料為計量資料,亦稱數值變量資料。一般有度量衡單位。度量衡單位。l如如7歲男童的身高(歲男童的身高(cm)、體重()、體重(kg)和血壓)和血壓(kPa); 空氣中空氣中CO2濃度(濃度(mg/L);l常用:常用:平均數,標準差,平均數,標準差,t檢驗,方差分析,相關檢驗,方差分析,相關與回歸與回歸 等分析等分析。l為研究體位對高血壓患者收為研究體位對高血壓患者收縮壓的影響,隨機抽取了縮壓的影響,隨機抽取

31、了10名高血壓患者,分別在其坐名高血壓患者,分別在其坐位位10分鐘后和臥位分鐘后和臥位10分鐘后分鐘后測量其收縮壓,結果見表,測量其收縮壓,結果見表,試問這兩種體位對患者的收試問這兩種體位對患者的收縮壓是否有影響?縮壓是否有影響? l(2)計數資料)計數資料(enumeration data)l將觀察單位按某種將觀察單位按某種屬性或類別分組屬性或類別分組,然后清點各組的觀察單,然后清點各組的觀察單位數,為計數資料(亦稱分類變量資料,無序分類資料)。位數,為計數資料(亦稱分類變量資料,無序分類資料)。l如血型分布,按如血型分布,按A、B、O、AB型分組得各血型的人數為計型分組得各血型的人數為計數

32、資料。數資料。l職業類型:工人,農民,干部,軍人;某單位患流感人數與職業類型:工人,農民,干部,軍人;某單位患流感人數與未患流感人數;某藥治療后痢疾病人的治愈人數與未治愈人未患流感人數;某藥治療后痢疾病人的治愈人數與未治愈人數;數;l分屬于各組的觀察單位間有質的差別,不同質的觀察單位不分屬于各組的觀察單位間有質的差別,不同質的觀察單位不能歸在同一個組內能歸在同一個組內。l常用:常用:率、構成比、卡方檢驗率、構成比、卡方檢驗等。等。l用某新藥治療不同類型關節炎的療效,問該藥用某新藥治療不同類型關節炎的療效,問該藥治療不同類型關節炎的療效是否有差別?治療不同類型關節炎的療效是否有差別?l(3)等級

33、資料)等級資料 (ranked data) 將觀察單位按某種將觀察單位按某種屬性的不同程度分組屬性的不同程度分組,所得各組,所得各組的觀察單位數為等級資料,亦稱有序分類資料。的觀察單位數為等級資料,亦稱有序分類資料。具有計數資料的特點,但分組又是按一定順序如由輕具有計數資料的特點,但分組又是按一定順序如由輕到重、由小到大排列。到重、由小到大排列。如:臨床療效按控制、顯效、好轉和無效分組所得各如:臨床療效按控制、顯效、好轉和無效分組所得各組人數。組人數。按尿蛋白結果將病人分類,按尿蛋白結果將病人分類,-,+-,+, +人數;人數;常用:常用:率、構成比、秩和檢驗率、構成比、秩和檢驗等。等。l某醫

34、院用中草藥治療兩種不同類型小兒肺炎的療效,某醫院用中草藥治療兩種不同類型小兒肺炎的療效,問:該藥對兩種類型肺炎患者的療效是否不同。問:該藥對兩種類型肺炎患者的療效是否不同。與計數資料不同:屬性的分組有程度差別,各與計數資料不同:屬性的分組有程度差別,各組大小順序排列;組大小順序排列;與計量資料不同:每個觀察單位未確切定量,與計量資料不同:每個觀察單位未確切定量,稱為半定量資料。稱為半定量資料。等級資料介于計量資料與計數資料之間。等級資料介于計量資料與計數資料之間。根據分析的需要,三類資料可以相互轉化根據分析的需要,三類資料可以相互轉化血紅蛋白含量(血紅蛋白含量(計量資料計量資料)按正常與異常分

35、組得到各組人數(按正常與異常分組得到各組人數(計數資料計數資料)按血紅蛋白多少分五個等級:按血紅蛋白多少分五個等級:6(1616(血紅蛋白增高)(血紅蛋白增高)得各組人數(得各組人數(等級資料等級資料)l2、根據測量的整數之間有無小數劃分、根據測量的整數之間有無小數劃分l(1)連續性資料()連續性資料(continuous data):l測定的整數之間有無限多位小數。測定的整數之間有無限多位小數。l如:體重,身高,等大多數計量資料。如:體重,身高,等大多數計量資料。l(2)非連續性資料()非連續性資料(discrete data):l整數間無任何小數。如:病人數,細胞數,整數間無任何小數。如:

36、病人數,細胞數,動物死亡數動物死亡數;l不同的數據類型間可以根據需要相互轉換;不同的數據類型間可以根據需要相互轉換;l數據類型不同,統計分析方法不同。數據類型不同,統計分析方法不同。l即設計即設計(design)、搜集資料、搜集資料(data collection)、整理資料整理資料(data sorting)、分析資料、分析資料(data analysis)。是相互聯系,不可分割的。是相互聯系,不可分割的。 l制定周密的醫學研究計劃,是關鍵的一步。制定周密的醫學研究計劃,是關鍵的一步。l有有調查設計調查設計和和實驗設計實驗設計之分。之分。(1)調查設計()調查設計(survey design

37、)l應用人群調查的方法,發現某些特定的醫學應用人群調查的方法,發現某些特定的醫學問題。問題。l調查設計一般包括調查設計一般包括專業設計和統計設計專業設計和統計設計。專。專業設計:指調查要達到的專業目的和要求,業設計:指調查要達到的專業目的和要求,解決專業問題。統計設計包括資料搜集、整解決專業問題。統計設計包括資料搜集、整理與分析過程中的理與分析過程中的統計設想和科學安排統計設想和科學安排。l關于搜集資料的調查計劃,在整個設計中占關于搜集資料的調查計劃,在整個設計中占主要地位,應解決的問題是:主要地位,應解決的問題是:lA: 明確調查目的和指標明確調查目的和指標 l了解參數,用以了解參數,用以說

38、明總體特征。說明總體特征。如:某地居如:某地居民某病患病率、環境中某有害物質的平均濃民某病患病率、環境中某有害物質的平均濃度;度;l研究現象間的相關聯系,以研究現象間的相關聯系,以探索病因。探索病因。如:如:環境污染與健康的關系。環境污染與健康的關系。l要把調查目的具體到指標:要把調查目的具體到指標:l癌癥死亡率:年齡別,地區別,等癌癥死亡率:年齡別,地區別,等l指標靈敏度、特異度高。如:細胞學,指標靈敏度、特異度高。如:細胞學,x光對光對食管癌。食管癌。lB確定調查對象和觀察單位確定調查對象和觀察單位 l調查對象是根據調查目的和指標確定的調查調查對象是根據調查目的和指標確定的調查總體的同質范

39、圍;觀察單位是要調查的總體總體的同質范圍;觀察單位是要調查的總體中的個體,可以是:一個人,一個病例,一中的個體,可以是:一個人,一個病例,一個家庭,一個集體單位,人次,采樣點,等。個家庭,一個集體單位,人次,采樣點,等。lC調查方法調查方法 l可分為可分為普查(普查(census)和和非全面調查非全面調查。l普查是將組成總體全部觀察單位加以調查。普查是將組成總體全部觀察單位加以調查。l非全面調查包括非全面調查包括典型調查和抽樣調查典型調查和抽樣調查兩種。兩種。l典型調查典型調查是有意識的選擇好的、中間的或壞的典型來調查,是有意識的選擇好的、中間的或壞的典型來調查,一般多用于社會調查或檢查衛生工

40、作等;一般多用于社會調查或檢查衛生工作等;l抽樣調查抽樣調查是通過隨機抽樣來推測總體特征,在實際工作中應是通過隨機抽樣來推測總體特征,在實際工作中應用最多。用最多。l此外:病例對照研究(此外:病例對照研究(case-control study),定群研究,定群研究(cohort study),lD調查方式調查方式 l直接觀察、采訪、填表和通信四種方式。直接觀察、采訪、填表和通信四種方式。l前兩種調查資料由參加研究的人員直接記錄,前兩種調查資料由參加研究的人員直接記錄,質量可靠。后兩種則由被調查者自己填寫,質量可靠。后兩種則由被調查者自己填寫,誤差較大,只有在必要時才應用。誤差較大,只有在必要時

41、才應用。lE調查項目和調查表設計調查項目和調查表設計l 把調查項目列成調查表,要精簡明了,必需把調查項目列成調查表,要精簡明了,必需的項目不要遺漏,無關項目不要列入表內,的項目不要遺漏,無關項目不要列入表內,便于填表人理解和正確填寫。便于填表人理解和正確填寫。l擬訂調查表應注意以下事項:擬訂調查表應注意以下事項:l只包括能解決調查任務所必需的問題;只包括能解決調查任務所必需的問題;l只包括那些能得到答復的問題;只包括那些能得到答復的問題;l避免引起被調查者的疑慮;避免引起被調查者的疑慮;l問題答案定義要明確。問題答案定義要明確。lF樣本含量的估計樣本含量的估計l 根據研究目的要求、研究對象特點

42、和抽樣方根據研究目的要求、研究對象特點和抽樣方法決定樣本大小。法決定樣本大小。l詳細的估計,要根據預試和容許誤差通過公詳細的估計,要根據預試和容許誤差通過公式計算。(第式計算。(第41章,章,509頁)頁) l(2) 實驗設計實驗設計(experiment design)l實驗設計是實驗研究極其重要的一個環節。實驗設計是實驗研究極其重要的一個環節。l醫學實驗醫學實驗的基本要素包括的基本要素包括處理因素處理因素、受試對象受試對象和和實驗效應實驗效應三部分。三部分。l如:用某種鐵制劑治療缺鐵性貧血患者,觀察如:用某種鐵制劑治療缺鐵性貧血患者,觀察血紅蛋白升高情況,該血紅蛋白升高情況,該鐵制劑鐵制劑

43、即處理因素,缺即處理因素,缺鐵性鐵性貧血患者貧血患者即受試對象,即受試對象,血紅蛋白血紅蛋白的測量值的測量值即實驗效應。即實驗效應。l實驗設計應遵循實驗設計應遵循對照、隨機、重復對照、隨機、重復(即樣本(即樣本例數)的原則例數)的原則 。lA、對照:首要原則。、對照:首要原則。l“齊同對比齊同對比”,除了要觀察研究的因素外,除了要觀察研究的因素外,實驗組與對照組一切條件應盡量相同,要有實驗組與對照組一切條件應盡量相同,要有完全的可比性,才能排除其他影響因素。完全的可比性,才能排除其他影響因素。l空白對照,試驗對照,安慰劑對照,配對對空白對照,試驗對照,安慰劑對照,配對對照,組間對照,照,組間對

44、照,lB、隨機化(、隨機化(randomization)l如前所述。如前所述。lC、重復(、重復(replication)l實驗樣本必須夠大,在一次試驗中有充分的重復;實驗樣本必須夠大,在一次試驗中有充分的重復;l如果一批實驗結果可靠,應經得起重復試驗的考驗。如果一批實驗結果可靠,應經得起重復試驗的考驗。l決定樣本數(重復性)的因素:決定樣本數(重復性)的因素:l處理效果;實驗誤差;抽樣誤差;資料性質;顯著處理效果;實驗誤差;抽樣誤差;資料性質;顯著性檢驗要求的水平;實驗結果的可能性;實驗設計性檢驗要求的水平;實驗結果的可能性;實驗設計的類型;的類型;l動物實驗:大動物:動物實驗:大動物:5-

45、15,中等動物:,中等動物:10-20,小動,小動物:物:15-30l按設計的要求及時取得準確、完整的原始數據。按設計的要求及時取得準確、完整的原始數據。l(1)資料來源:資料來源:(A 統計報表統計報表 B 報告卡(單)報告卡(單) C 日常醫療衛生工作記錄日常醫療衛生工作記錄 D 專題調查或實驗專題調查或實驗 (試驗)(試驗))lA 統計報表統計報表l如疫情報表、醫院工作報表等,這些都是根據國如疫情報表、醫院工作報表等,這些都是根據國家規定的報告制度,由醫療衛生機構定期逐級上報家規定的報告制度,由醫療衛生機構定期逐級上報的。這些報表提供了較全面的居民健康狀況和醫療的。這些報表提供了較全面的

46、居民健康狀況和醫療衛生機構的主要數據,是總結、檢查和制訂衛生工衛生機構的主要數據,是總結、檢查和制訂衛生工作計劃的重要依據。作計劃的重要依據。 l對統計報表的檢查:對統計報表的檢查:l數字檢查:縱、橫的合計是否吻合。數字檢查:縱、橫的合計是否吻合。l專業邏輯檢查:專業邏輯檢查: 年齡組、性別組等。年齡組、性別組等。l確信數據的來源及正確性。應有專業人員填確信數據的來源及正確性。應有專業人員填寫。寫。B 報告卡(單)報告卡(單) l如傳染病和職業病發病報告卡、腫瘤發病及如傳染病和職業病發病報告卡、腫瘤發病及腫瘤死亡報告卡、出生報告單及死亡報告單腫瘤死亡報告卡、出生報告單及死亡報告單等。要做到及時

47、填卡(單),防止漏報。等。要做到及時填卡(單),防止漏報。l例如,出生后不久即死亡的新生兒要同時填例如,出生后不久即死亡的新生兒要同時填寫出生報告單和死亡報告單。寫出生報告單和死亡報告單。 l對報告卡的檢查:常有漏報,重報等。對報告卡的檢查:常有漏報,重報等。l報告卡上應有病例、報告人詳細的聯系方法,報告卡上應有病例、報告人詳細的聯系方法,如電話等。如電話等。C 日常醫療衛生工作記錄日常醫療衛生工作記錄l如門診病歷、住院病歷、健康檢查記錄、衛如門診病歷、住院病歷、健康檢查記錄、衛生監測記錄等。要做到登記完整、準確。生監測記錄等。要做到登記完整、準確。l注意事項:注意事項:l不能計算發病率,患病

48、率;不能計算發病率,患病率;l不同醫院的記錄,比較時要慎重。不同醫院的記錄,比較時要慎重。l醫院病人病種的比例,不能很好代表居民中醫院病人病種的比例,不能很好代表居民中病種比例。病種比例。l同科室不同時期病人病情會不同。同科室不同時期病人病情會不同。l注意標準的一致性。對病情的診斷標準,注意標準的一致性。對病情的診斷標準,.D 專題調查或實驗專題調查或實驗 (試驗)(試驗)l一般統計報表和醫院病歷資料的內容都有局一般統計報表和醫院病歷資料的內容都有局限性,要做到深入分析往往感到資料不全。限性,要做到深入分析往往感到資料不全。經常采用專題調查或實驗(試驗)研究。經常采用專題調查或實驗(試驗)研究

49、。l這些資料的質量高,是理想的統計資料。這些資料的質量高,是理想的統計資料。(2)資料的記錄資料的記錄 recording 和貯存和貯存 storagel調查表中項目的記錄(自學)。調查表中項目的記錄(自學)。(3)記錄表的目視檢查()記錄表的目視檢查(checking)(自學)(自學)l資料整理的目的是把雜亂無章的原始資料資料整理的目的是把雜亂無章的原始資料系統化、條理化,便于進一步計算統計指標系統化、條理化,便于進一步計算統計指標和分析。和分析。l資料整理的過程如下:資料整理的過程如下:(1)在資料整理之前將收集到的數據和各種資)在資料整理之前將收集到的數據和各種資料進行檢查和核對。補充或

50、剔除,料進行檢查和核對。補充或剔除,需要很大需要很大的耐心的耐心。(2)設計分組)設計分組A質量分組:質量分組: 即將觀察單位按其屬性或類別(如性即將觀察單位按其屬性或類別(如性別、職業、疾病分類、婚姻狀況等)歸類分組;別、職業、疾病分類、婚姻狀況等)歸類分組;B數量分組:數量分組: 即將觀察單位數值大小(如年齡大小、即將觀察單位數值大小(如年齡大小、血壓高低等)分組。血壓高低等)分組。兩種分組往往結合使用,一般是在質量分組基礎上進兩種分組往往結合使用,一般是在質量分組基礎上進行數量分組。如先按性別分組,再按身高的數值大行數量分組。如先按性別分組,再按身高的數值大上分組。上分組。 按分組要求設

51、計整理表,進行手工匯總(劃記法或分按分組要求設計整理表,進行手工匯總(劃記法或分卡法)或用計算機匯總。卡法)或用計算機匯總。 l頻數表的繪制頻數表的繪制l頻數分布表(頻數分布表(frequency distribution table)l對資料中各變量值的頻數匯總而成的表格對資料中各變量值的頻數匯總而成的表格,用來反,用來反映各變量值與其頻數間的關系,可以觀察該資料的映各變量值與其頻數間的關系,可以觀察該資料的分布類型。分布類型。l是最基礎的統計描述是最基礎的統計描述。l例:某市例:某市1995年年110名名7歲男童的身高歲男童的身高(cm)。)。121.4119.2124.712511511

52、2.8120.2110.2120.9120.1125.5120.3122.3118.2116.7121.7116.8121.6120.2122121.7118.8121.8124.5121.7122.7116.3124119124.5121.8124.9130123.5128.1119.7126.1131.3123.8116.7122.2122.8128.6122132.5122123.5116.3126.1119.2126.4118.4121119.1116.9131.1120.4115.2118122.4120.3116.9126.4114.2127.2118.3127.8123117.4

53、123.2119.9122.1120.4124.8122.1114.4120.5120122.8116.8125.8120.1124.8122.7119.4128.2124.1127.2120122.7118.3127.1122.5116.3125.1124.4112.3121.3127113.5118.8127.6125.2121.5122.5129.1122.6134.5118.3132.8某市某市19951995年年110110名名7 7歲男童的身高歲男童的身高(cm(cm)資料如下,)資料如下, l(1)計算極差:找出觀察值中最大值與最小)計算極差:找出觀察值中最大值與最小值,二者之差稱為極差(全距值,二者之差稱為極差(全距Range)。R 表表示。示。l本例本例134.5-110.2=24.3。l(2)決定組數()決定組數(class number)、組段、組段(class)、組距、組距(class interval):l組數組數:原始數據能夠被劃分為不同范圍的個數。根據:原始數據能夠被劃分為不同范圍的個數。根據研究目的及觀察例數確定。不宜過多或過少。研究目的及觀察例數確定。不宜過多或過少。l組段組段:變量值的范圍。有上限

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論