科研據的種類及處理方法_第1頁
科研據的種類及處理方法_第2頁
科研據的種類及處理方法_第3頁
科研據的種類及處理方法_第4頁
科研據的種類及處理方法_第5頁
已閱讀5頁,還剩34頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、科研數據的種類及處理方法廣東省心血管病研究所麥勁壯什么是統計學? 統計學是一門處理數據中變異性的科學與藝術 內容包括 數據收集、整理、分析、解釋和推斷統計學與醫學研究 統計學思維和方法已經滲透到醫學研究中 如:醫學雜志 課題申請 藥物開發 相對隨機化有對照的臨床試驗而言,醫生個人的臨床經驗是無計劃、雜亂的,而且是非常不可靠的統計工作步驟1. 統計設計 2. 資料收集3. 資料整理4. 數據分析5. 寫出報告數據分類數據分類有多種方法 計數資料、計量資料 連續資料、離散資料變量的類型一)定量變量二)定性變量一)定量變量 變量值是定量的,有大小之分,有度衡量單位,這種變量稱定量變量,1. 離散型2

2、. 連續型1.離散型定量變量 只能取整數,這些定量變量稱離散型定量變量,如人數、手術數量、紅細胞數量等2.連續型定量變量 直接測量獲得,可以是任意大小,可以有小數點,有度量單位,如血壓、身高等測量值。定量變量常用的統計描述 均數、全距、幾何均數、中位數、分位數、眾數、方差 、標準差、變異系數、偏度系數等 資料分布不同,要用相應指標 均數:近似服從對稱分布 幾何均數:等比數資料 中位數和分位數:偏態資料,尤其包 含不完全信息的資料,比如簡易血糖儀 測量的血糖值定量資料的統計分析 單因素: 單組 t檢驗(滿足正態性)、非參數檢驗 兩組 t檢驗(滿足正態性)、非參數檢驗 多組(大于2組) 方差分析(

3、滿足正態性)、非參數檢驗 多因素: 相關 回歸 定量資料的統計分析 單因素多組(3組以上) 使用方差分析 分別有: 一般方差分析 配伍設計方差分析 拉丁方設計方差分析 交叉設計方差分析 析因設計方差分析 重復測量數據方差分析定量資料的統計分析 單因素定量資料假設檢驗,均須滿足 正態性和方差齊性否則,需作變量變換或選用非參數檢驗 二)定性變量1.二分類變量與無序定性變量 2.有序定性或等級變量 二)定性變量 二分類變量與無序定性變量 雖然這些變量可能用1、2、3等數字表示,但并不一定代表其大小或水平 1.1二分類變量 科學研究中,常用1、2代表男女,0、1代表疾病有無,這些就是二分類變量,這里0

4、、1、2并無大小、水平之分,可以用字母代替。1.2 無序定性變量 一些變量雖然可以用1、2、3代表,但是也是無大小或水平之分的,如職業、民族等,其中的工、農、商、干部、技術人員等,并無大小、等級或水平之分,這些也可以用a、b、c等代表,因此稱無序的定性變量,也稱分類變量或名義變量。2. 有序定性或等級變量 一些定性變量是有序或有等級的,這種定性變量就是有序定性或等級變量。 例如,臨床檢驗結果、 、等, 療效:治愈、顯效、好轉、無效、死亡 定性資料的統計描述通過頻率分布及相對數指標來描述其分布特征 百分比 構成比 發(患)病概率 感染率 相對比(男女比) or(比值比)/ rr(相對危險度)定性

5、資料的統計分析 常見錯誤:直接根據率的大小作出統計推斷例如:用某藥治療某病,甲醫院治療100人,40人有效,乙醫院治療5人,2人有效,兩家醫院有效率均為40%,從而判斷甲、乙醫院療效相差不大。定性資料的統計分析 另外一個常見錯誤:用 2分析一切列聯表資料 一般來說,22列聯表一般用 2分析,但是,來自不同研究,分析又略有不同 rc表須根據行列數據性質不同,選擇不同方法定性資料的統計分析 來自橫斷面研究的資料有效無效治療組3010對照組1158兩種藥物治療某病患者療效觀察結果該表可以選擇一般的 檢驗公式進行計算2定性資料的統計分析來自隊列研究設計的22表 例子: “中美心血管疾病危險因素研究”,

6、研究基線血壓對10年后心腦血管事件發生的影響,列表如下定性資料的統計分析基線血壓狀況隨訪10年心血管腦卒中事件結果心血管腦卒中事件基線血壓發生沒有發生高血壓58398正常血壓623541. 先進行一般 檢驗,如果p0.05,進行第2步,否則停止;2. 計算相對危險度rr(relative risk,rr);3. 用mh 檢驗rr與1之間的差異是否顯著。22定性資料的統計分析 來自病例對照研究設計的22表子代染色體母親是否服藥異常正常服藥3468未服藥30128婦女孕前6個月服用某藥者其子代染色體異常的調查結果1. 先進行一般 檢驗,如果p 有序無序 二分類這樣轉換,不能作相反方法轉換 有的時候

7、,離散型定量變量可以通過適當的變換變成連續型定量變量進行分析 常見例子,通過連續型定量變量“血壓值”,變換成二分類變量“是否高血壓”啞變量 logistic、cox回歸分析中,如果自變量是分類變量,如職業、血型,或特殊目的時,需要變換成多個啞變量才能分析以血型為例,血型有a、b、ab 、o型,需轉換成4-1=3個啞變量(假設x1、x2、x3),具體方法如下啞變量啞變量血型(x)是x1x2x3a100b010ab001o000這里是選定“o“型為基準轉換成啞變量,意味著,假如血型x=a,則x1=1,x2=0,x3=0;x=b,則x1=0,x2=1,x3=0;x=ab,則x1=0,x2=0,x3=

8、1;x=o,則x1=0,x2=0,x3=0;如果分類變量有n個水平,則需建立n-1個啞變量。啞變量 啞變量意義 在logistic回歸中,單純用血型(x)作為自變量,分析結果x對應的or是1.89,這時是沒有辦法解釋結果的,因為,不知道誰跟誰比,徒有結果,但沒有意義啞變量 但是,如果用3個啞變量作為自變量,結果對應的or分別是orx1=1.90、 orx2=0.89、 orx3=2.11,這樣,我們可以解釋為,相對“o”型血,a型血相對危險是1.90倍、b型是0.89倍、ab型是2.11倍。啞變量同樣,如果連續型定量變量,我們也可以變成啞變量,例如,如果我們單純用收縮壓(spb)作自變量,計算orsbp=1.02,按此結果,我們僅能作以下解釋:spb每變化1個單位,危險增加0.02

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論