




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
流行病學數據統計分析策略中南大學湘雅公共衛生學院譚紅專教授流行病學數據統計分析策略共40頁,您現在瀏覽的是第1頁!2022/11/212主要內容概述專題研究的數據分析常規收集的流行病學數據的分析流行病學數據統計分析策略共40頁,您現在瀏覽的是第2頁!2022/11/213節概述流行病學研究與流行病學數據流行病學數據分析的目的流行病學數據中的變量分類流行病學數據分析的內容流行病學數據統計分析策略共40頁,您現在瀏覽的是第3頁!2022/11/214二、流行病學數據分析的目的流行病學數據分析是針對明確研究問題、具有明確目的、采用特定方法對流行病學數據進行統計整理、統計描述、統計推斷和總結。流行病學研究的問題涉及疾病分布、病因與危險因素、診斷、預防和治療效果評價等。數據分析的根本是正確地回答有意義的問題,而不是統計學數字游戲。流行病學數據統計分析策略共40頁,您現在瀏覽的是第4頁!2022/11/215三、流行病學數據中的變量分類
典型的流行病學研究中變量可根據其用途分為五類:暴露變量:因,自變量,可以有多個結局變量:果,因變量,是數據分析的核心混雜因素:需要控制效應修飾因素:需要描述其他變量:流行病學數據統計分析策略共40頁,您現在瀏覽的是第5頁!2022/11/216四、流行病學數據分析的內容
描述研究對象的數量變動;變量分類和數據整理;描述和比較組間基線資料;估計結局事件發生頻率;估計效應大小及其可信區間;識別和控制混雜;識別和測量效應修飾作用;識別和測量劑量反應關系;其他分析。流行病學數據統計分析策略共40頁,您現在瀏覽的是第6頁!2022/11/217流行病學數據統計分析策略共40頁,您現在瀏覽的是第7頁!2022/11/218三、描述基線資料基線資料就是有關研究對象代表性和混雜因素的信息資料。基線資料描述的基本目的:一是交待研究對象的特征,提供其代表人群的信息,據此判斷結果的外推人群和外推性;二是評估暴露組和非暴露組之間混雜因素的可比性,檢查存在混雜的可能性。描述基線資料時,通常在總體描述基礎上,對暴露組和非暴露組還要分別進行描述。流行病學數據統計分析策略共40頁,您現在瀏覽的是第8頁!2022/11/219五、估計效應值效應就是暴露或治療對結局作用或影響的大小,多用暴露組與非暴露組或治療組與對照組間發病率的差別來表達。流行病學數據統計分析策略共40頁,您現在瀏覽的是第9頁!2022/11/2110六、估計效應可信區間由于隨機誤差,各效應指標的點估計不能代表效應的真實值,可信區間(ConfidenceInterval,CI)可用來表達由隨機誤差引起的效應估計值的不確定性。實踐中一般采用95%可信區間,可以將其理解為真實效應值有95%的可能在這個區間之內。若效應指標的點估計值為X,標準誤為SE,該效應指標的95%可信區間:95%CI=X±1.96SE,其中,(X-1.96SE)為其下限,(X+1.96SE)為其上限。流行病學數據統計分析策略共40頁,您現在瀏覽的是第10頁!2022/11/2111混雜的控制就是控制混雜的第三個條件,辦法有:設計階段有三種方法:限制、匹配和隨機分組;數據分析階段也有三種方法:直接標化法、分層分析和多元回歸分析。流行病學數據統計分析策略共40頁,您現在瀏覽的是第11頁!2022/11/2112交互作用模型及其相對性
決策應基于相加模型流行病學數據統計分析策略共40頁,您現在瀏覽的是第12頁!2022/11/2113第三節常規收集的
流行病學數據的分析常規數據分析的特殊性有三點:,對研究問題的設定和對分析結果真實性的評估;第二,由于沒有預先設定研究問題,可研究的問題取決于資料內容和性質;第三,設計框架不清楚或不完善,存在多種偏倚,結果真實性較差或不確定。本節將以醫院的病人資料為例,說明常規數據分析的目的、方法、步驟和注意事項。流行病學數據統計分析策略共40頁,您現在瀏覽的是第13頁!2022/11/2114(二)變量的特征和分類按照臨床特征可將常規數據中的變量分為治療措施、診斷結果、病因/危險因素、預后因素、結局、服務相關因素(如藥價、醫療保險等)。變量決定可能的研究問題。例如,數據中無治療信息,則無法研究療效和副作用;無診斷結果,則無從研究診斷準確性。無結局信息,則不能研究療效、預后因素、危險因素。流行病學數據統計分析策略共40頁,您現在瀏覽的是第14頁!2022/11/2115三、常規數據“研究設計”的缺陷流行病學數據統計分析策略共40頁,您現在瀏覽的是第15頁!2022/11/2116四、估計相應的指標根據研究目的以及最佳研究設計,就能夠確定需要估計的指標?,F況研究中,只需要估計有關變量的均數和百分數;評估治療效果時,主要估計治療對結局作用的大??;評估診斷的準確性,主要估計靈敏度和特異度;研究副作用,主要估計治療對不良結局的作用大小值。流行病學數據統計分析策略共40頁,您現在瀏覽的是第16頁!2022/11/2117五、評估數據中的偏倚分析常規數據時,針對偏倚需考慮以下問題:設計框架中,是否具有病因(或治療)、結局和混雜因素的信息,結局的測量是否發生在病因或治療發生后的一段時間內;是否存在選擇偏倚:數據代表性及失訪率等;是否存在信息偏倚;是否存在混雜偏倚:有關混雜因素的基線信息是否完整。流行病學數據統計分析策略共40頁,您現在瀏覽的是第17頁!2022/11/2118(二)評估數據中的信息偏倚
數據的準確性和可靠性取決于醫療機構水平的高低;另一個常見問題是數據質量不一致,原因包括同一個醫院不同時期使用的檢查儀器、試劑、方法和標準不同,檢驗員的水平不同;隨訪時間不足也可能造成測量誤差。流行病學數據統計分析策略共40頁,您現在瀏覽的是第18頁!2022/11/2119六、常規資料的利用診斷方法準確性的評估急性病住院病人的轉歸和預后圍產期和新生兒問題的研究急診問題的研究罕見疾病的病因和轉歸研究疾病危險因素初探藥物毒副作用的研究某類病人特征的觀察有關服務和用藥的研究。流行病學數據統計分析策略共40頁,您現在瀏覽的是第19頁!2022/11/2120提高使用效果的措施利用部分常規數據,再依據研究問題收集少量新數據,可以擴展常規數據的研究用途,尤其在診斷準確性研究、病因和副作用的病例對照研究、罕見病的轉歸和預后研究領域。擴大數據來源。例如,一個科室或醫院的病人可能代表性差、失訪率高;如果匯總一個大城市所有醫院的數據,將會大大增加代表性,降低失訪率;電子病歷使跨醫院和地區臨床數據的合并成為可能。同時利用多個不同性質的常規數據。例如,死亡作為觀察結局時,可以同時利用一個地區或全國的死亡登記資料。流行病學數據統計分析策略共40頁,您現在瀏覽的是第20頁!七、臨床研究結果的解釋觀察指標的意義:緩解癥狀還是減少死亡;效應的大小及其可信區間;結果的真實性;結果的外推性2022/11/2121流行病學數據統計分析策略共40頁,您現在瀏覽的是第21頁!2022/11/2122一、流行病學研究與流行病學數據狹義的流行病學數據(epidemiologicaldata)指任何來自針對明確研究目的而開展特定流行病學研究所收集的資料。廣義的流行病學數據還包括出于其他目的和用途而收集的、可以用來定量地探索疾病健康或醫療衛生服務其他問題的資料。即一切可為流行病學所用的數據。目前的臨床大數據是個寶庫。流行病學數據統計分析策略共40頁,您現在瀏覽的是第22頁!2022/11/2123流行病學數據分析的目的估計有關統計學指標,如相對危險度;估計該統計學指標的可信區間;控制可能的混雜因素;分析劑量反應關系;分析可能的效應修飾因子;分析可能存在的偏倚。流行病學數據統計分析策略共40頁,您現在瀏覽的是第23頁!2022/11/2124按統計學分類定性:二分類和多分類(無序多分類)定量:在多數流行病學研究中被轉化為分類變量半定量(分級,有序多分類)同一個研究中,因變量和自變量的關系應該是固定的、不能互換。但在不同的研究中,一個變量在這個研究中可能是果,在另一個研究中也可能是因。例如,高血壓可能是遺傳的結果,血壓也可能是心腦血管事件的原因。流行病學數據統計分析策略共40頁,您現在瀏覽的是第24頁!2022/11/2125第二節流行病學專題研究的數據分析一、描述研究對象的數量變動數據分析的步須對研究對象數量隨時間的變動進行描述,這是判斷選擇偏倚是否存在及其大小的主要依據;對選樣、抽樣和篩選都應交代原則和方法;對退出和失訪都應記錄數量和原因。流行病學數據統計分析策略共40頁,您現在瀏覽的是第25頁!2022/11/2126二、流行病學變量的分類與數據轉換轉換目的:習慣、專業考量、模型限制轉換類型:定量轉定性或分級,定性轉定量轉換常用原則:借鑒既往同類研究的分級方法;按照通用的分級標準,如年齡可按國際通用的嬰兒、幼兒、青少年、青年、中年、老年的年齡切點來分級;把研究人群分成每組人數均等的3~5組等。流行病學數據統計分析策略共40頁,您現在瀏覽的是第26頁!2022/11/2127四、結局事件發生的頻率一般要求用率表示,如發病率。發病率由三個因素決定:觀察時間、可能發病的總人數和實際發病人數。一般情況下,發病率的分子是在一定時間內發病的總人數。分母則因研究設計不同而異。當發病率較低,且每個人的觀察時間長短基本一致,可用研究開始時該組人數作分母計算發病率,叫做累積發病率(cumulativeincidence)。當結局事件發生率較高(如晚期癌癥治療試驗中的死亡)或每個人的觀察時間相差較大時,這時可用人時數(如人年數,person-years)做分母計算發病率,稱作人時發病率(person-timeincidencerate或發病密度(incidencedensity),流行病學數據統計分析策略共40頁,您現在瀏覽的是第27頁!2022/11/2128流行病學數據統計分析策略共40頁,您現在瀏覽的是第28頁!2022/11/2129七、識別和控制混雜混雜是由于同一個研究里暴露對某疾病的作用與其他病因的作用交織在一起導致暴露效應估計上的誤差?;祀s必須同時具備三個條件:其一,是疾病確定的病因或危險因素;其二,不是暴露和疾病間的中間因素;其三,可疑的混雜因素在暴露組和非暴露組的分布不均衡。如性別可能就是吸煙與肺癌關系中的一個混雜因素。流行病學數據統計分析策略共40頁,您現在瀏覽的是第29頁!2022/11/2130八、交互作用交互作用不同于混雜?;祀s是粗效應值估計時的一種偏倚,需要控制和消除;交互作用是效應大小隨第三因素暴露強度或劑量變化而變化的現象。區別交互作用和混雜的方法是一致性檢驗。如果層間差異無顯著性(P>0.05),說明不存在交互作用,這時可按混雜處理,可以用一個加權平均效應值來表達,如果平均效應值與粗效應值一致,說明無混雜。流行病學數據統計分析策略共40頁,您現在瀏覽的是第30頁!2022/11/2131九、識別和測量劑量反應關系識別和測量劑量反應關系的分析方法主要有分層分析和回歸分析。流行病學數據統計分析策略共40頁,您現在瀏覽的是第31頁!2022/11/2132一、常規數據的特征(一)數據的時間框架和分類時間框架指數據的時間特征,主要分為隨訪數據(隊列數據)和非隨訪數據(現況數據)?,F況數據主要探索病人現況、服務狀況和診斷準確性,偶爾用于初步探索病因、療效和不良反應。隊列數據可用于大多數臨床問題的探索。流行病學數據統計分析策略共40頁,您現在瀏覽的是第32頁!2022/11/2133二、形成研究問題根據數據的變量特征,可以初步形成可研究問題的范圍。欲進行診斷準確性研究,數據庫里必須有檢查結果和疾病診斷信息。研究副作用,基線資料中必須有治療信息,隨訪資料中須有副作用的信息。評估療效,基線資料中須有治療的信息,隨訪資料中須有結局信息。研究危險因素,基線資料中須有可疑病因的信息,隨訪資料中須有有關疾病的信息。對研究者最大的挑戰不是如何進行分析,而是如何形成研究問題?流行病學數據統計分析策略共40頁,您現在瀏覽的是第33頁!2022/11/2134研究設計最重要的三個因素是時間、人群和變量。時間因素包括時點還是時間段,如何定義起始時間、時間走向、變量間的時間關系;人群因素包括人群特征,選擇過程,及比較組的形成;變量因素包括測量指標、何時測量、測量的準確性。通過比較常規數據收集的“設計框架”和最佳研究設計,可以發現常規數據的設計缺陷,判斷可能引起的偏倚。在時間、人群和變量特征上與最佳設計的差異,就是常規數據的缺陷所在,也是偏倚可能出現的地方。主要缺陷是非隨機,失訪或變量缺失。流行病學數據統計分析策略共40頁,您現在瀏覽的是第34頁!2022/11/2135常規數據分析的具體步驟分析數據的時間框架和變量的特征;提出可探索的問題,確定最終研究的問題;與最佳研究設計比較,檢查數據的“研究設計”缺陷;估計必要的指標及其可信區間與其它必要的分析;分析數據中可能存在的其他偏倚,例如選擇偏倚、信息偏倚和混雜偏倚;綜合設計缺陷、偏倚和結果,對研究問題做出結論。流行病學數據統計分析策略共40頁,您現在瀏覽的是第35頁!2022/11/2136(一)評估數據中的選擇偏倚很多數據的代表性很差或總體不明。病人還經過了檢驗檢查的選擇。最嚴重的選擇偏倚是選擇性隨訪
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司月度獎懲活動方案
- 公司消防比賽活動方案
- 公司盆栽種植活動方案
- 公司相親對象活動方案
- 公司現場招聘會策劃方案
- 公司組織溫泉玩活動方案
- 公司活動方案獎勵方案
- 公司行政生日會策劃方案
- 公司教育活動策劃方案
- 2025年廣東省廣州市南沙區中考二模道德與法治試題
- 2025屆重慶市普通高中學業水平選擇性考試預測歷史試題(含答案)
- 2025-2030中國眼底照相機行業市場發展趨勢與前景展望戰略研究報告
- 2024年深圳市大鵬新區區屬公辦中小學招聘教師真題
- 人教版小學語文四年級下冊作文范文2
- 大學語文試題及答案琴
- 紅十字會資產管理制度
- 2025屆四川成都錦江區數學七下期末質量檢測試題含解析
- 無人機飛行器結構與性能試題及答案
- 廣東深圳2025年公開招聘農村(村務)工作者筆試題帶答案分析
- 《蔚來汽車》課件
評論
0/150
提交評論