衛生統計學簡答題(共4頁)_第1頁
衛生統計學簡答題(共4頁)_第2頁
衛生統計學簡答題(共4頁)_第3頁
衛生統計學簡答題(共4頁)_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優質文檔-傾情為你奉上衛生統計學簡答題方差分析的基本思想和應用條件是什么? 答:方差分析的基本思想是,對于不同設計的方差分析,其思想都一樣,即均將處理間平均變異與誤差平均變異比較。不同之處在于變異分解的項目因設計不同而異。具體來講, 根據試驗設計的類型和研究目的,將全部觀測值總的離均差平方和及其自由度分解為兩個或多個部分,除隨機誤差作用外,每個部分的變異可由某個因素的作用加以解釋,通過比較不同變異來源的均方,借助F分布作出統計推斷,從而推論各種研究因素對試驗結果有無影響。 其應用條件是, 各樣本是相互獨立的隨機樣本,均服從正態分布; 各樣本的總體方差相等,即方差齊性。多組定量資料比較時,統

2、計處理的基本流程是什么? 答:多組定量資料比較時首先應考慮用方差分析,對其應用條件進行檢驗,即方差齊性及各樣本的正態性檢驗。若方差齊性,且各樣本均服從正態分布,選單因素方差分析。若方差不齊,或某樣本不服從正態分布,選Kruskal-Wallis秩和檢驗,或通過某種形式的數據變換使其滿足方差分析的條件。若方差分析或秩和檢驗結果有統計學意義,則需選擇合適的方法(如Bonferonni、LSD法等)進行兩兩比較。簡述秩和檢驗的優缺點秩和檢驗的優點是(1)不受總體分布限制,適用面廣;(2)適用于等級資料及兩端無確定值的資料;(3)易于理解,易于計算。缺點是符合參數檢驗的資料,用秩和檢驗,則不能充分利用

3、信息,檢驗效能低。試述假設檢驗與置信區間的聯系與區別。 答:區間估計與假設檢驗是由樣本數據對總體參數作出統計學推斷的兩種主要方法。置信區間用于說明量的大小,即推斷總體參數的置信范圍;而假設檢驗用于推斷質的不同,即判斷兩總體參數是否不等。試述兩類錯誤的意義及其關系。 答:類錯誤(typeerror):如果檢驗假設0H實際是正確的,由樣本數據計算獲得的檢驗統計量得出拒絕0H的結論,此時就犯了錯誤,統計學上將這種拒絕了正確的零假設0H(棄真)的錯誤稱為類錯誤。 類錯誤(type error):假設檢驗的另一類錯誤稱為類錯誤(type error),即檢驗假設0H原本不正確(1H正確),由樣本數據計算

4、獲得的檢驗統計量得出不拒絕0H(納偽)的結論,此時就犯了類錯誤。類錯誤的概率用 表示。 在假設檢驗時,應兼顧犯類錯誤的概率()和犯類錯誤的概率()。犯類錯誤的概率()和犯類錯誤的概率()成反比。如果把類錯誤的概率定得很小,勢必增加犯類錯誤的概率,從而降低檢驗效能;反之,如果把類錯誤的概率定得很小,勢必增加犯類錯誤的概率,從而降低了置信度。為了同時減小和,只有通過增加樣本含量,減少抽樣誤差大小來實現。什么資料適合用秩和檢驗進行檢驗?簡述秩和檢驗步驟。答:提示:進行有序資料的比較時宜采用秩和檢驗。(1)等級資料; (2)偏態資料; (3)分布不明的資料; (4)資料中各組方差不齊,且轉換后不能達到

5、方差齊性;(5)一端或兩端無界。秩和檢驗步驟為: 建立假設H0和H1,并確定檢驗水準; 根據不同的設計類型對資料進行編秩并計算秩和; 根據計算的秩和直接查表或計算相應的統計量再查表,確定P值下結論。進行有序資料的比較時宜采用秩和檢驗。服從二項分布及Poisson分布的條件分別是什么? 答:二項分布成立的條件:每次試驗只能是互斥的兩個結果之一;每次試驗的條件不變;各次試驗獨立。Poisson分布成立的條件:除二項分布成立的三個條件外,還要求試驗次數n很大,而所關心的事件發生的概率很小。 2. 二項分布、Poisson分布分別在何種條件下近似正態分布? 簡答: 二項分布的正態近似:當n較大,不接近

6、0也不接近1時,二項分布B(n,)近似正態分布N(n, )1(n)。Poisson分布的正態近似:Poisson分布)(,當相當大時(20),其分布近似于正態分布簡述簡單線性回歸分析的基本步驟。 答: 繪制散點圖,考察是否有線性趨勢及可疑的異常點; 估計回歸系數; 對總體回歸系數或回歸方程進行假設檢驗; 列出回歸方程,繪制回歸直線; 統計應用。簡述線性回歸分析與線性相關的區別與聯系。 答:區別:(1)資料要求上,進行直線回歸分析的兩變量,若X為可精確測量和嚴格控制的變量,則對應于每個X的Y值要求服從正態分布;若X、Y都是隨機變量,則要求X、Y服從雙變量正態分布。直線相關分析只適用于雙變量正態分

7、布資料。 (2)應用上,說明兩變量線性依存的數量關系用回歸(定量分析),說明兩變量的相關關系用相關(定性分析)。 (3)兩個系數的意義不同。r說明具有直線關系的兩變量間相互關系的方向與密切程度,b表示X每變化一個單位所導致Y的平均變化量。 (4)兩個系數的取值范圍不同:-1r1,<<b。 (5)兩個系數的單位不同:r沒有單位,b有單位。 聯系: (1)對同一雙變量資料,回歸系數b與相關系數r的正負號一致。b0時,r0,均表示兩變量X、Y同向變化;b0時,r0,均表示兩變量X、Y反向變化。 (2)回歸系數b與相關系數r的假設檢驗等價,即對同一雙變量資料,rbtt=。由于相關系數r的假

8、設檢驗較回歸系數b的假設檢驗簡單,故在實際應用中常以r的假設檢驗代替b的假設檢驗。 (3)用回歸解釋相關:由于決定系數2R=SS回 /SS總 ,當總平方和固定時,回歸平方和的大小決定了相關的密切程度。回歸平方和越接近總平方和,則2R越接近1,說明引入相關的效果越好。例如當r=0.20,n=100時,可按檢驗水準0.05拒絕H0,接受H1,認為兩變量有相關關系。但2R=(0.20)2=0.04,表示回歸平方和在總平方和中僅占4,說明兩變量間的相關關系實際意義不大直線相關與回歸有何聯系與區別? 聯系: (1)對符合相關回歸條件的資料,其相關系數與回歸系數的正負號相同。 (2)回歸系數與相關系數的假

9、設檢驗是等價的,對同一樣本的資料,回歸系數的t檢驗與相關系數的t檢驗其數值相等,即tr=tb。 (3)可以用回歸解釋相關。r的平方稱為決定系數(coefficient of determination)。區別: 回歸要求因變量Y是正態分布的隨機變量;X可以是精確測量或嚴格控制的變量,也可以是呈正態分布的隨機變量,當X是精確測量或嚴格控制的變量時,此時的回歸稱型回歸。當X是呈正態分布的隨機變量時,此時的回歸稱為型回歸。相關要求變量X、Y都是呈正態分布的隨機變量。當說明兩變量間依存變化的數量關系時用回歸,當說明兩變量間的相關關系時用相關標準差與標準誤有何區別和聯系? 標準差和標準誤都是變異指標,但

10、它們之間有區別,也有聯系。區別: 概念不同;標準差是描述觀察值(個體值)之間的變異程度;標準誤是描述樣本均數的抽樣誤差;用途不同;標準差與均數結合估計參考值范圍,計算變異系數,計算標準誤等。標準誤用于估計參數的可信區間,進行假設檢驗等。它們與樣本含量的關系不同: 當樣本含量 n 足夠大時,標準差趨向穩定;而標準誤隨n的增大而減小,甚至趨于0 。聯系: 標準差,標準誤均為變異指標,當樣本含量不變時,標準誤與標準差成正比。(聯系: 1、二者都是表示變異度大小的統計指標 2、標準誤與標準差大小成正比,與抽樣例數n的平方根成反比)何謂假設檢驗?其一般步驟是什么? 所謂假設檢驗,就是根據研究目的,對樣本

11、所屬總體特征提出一個假設,然后根據樣本所提供的信息,借助一定的分布,觀察實測樣本情況是否屬于小概率事件,從而對所提出的假設作出拒絕或不拒絕的結論的過程。假設檢驗一般分為以下步驟: 建立假設:包括: H0,稱無效假設;H1: 稱備擇假設; 確定檢驗水準:檢驗水準用表示,一般取0.05; 計算檢驗統計量:根據不同的檢驗方法,使用特定的公式計算;確定P值:通過統計量及相應的界值表來確定P值;推斷結論:如P,則接受H0,差別無統計學意義;如P,則拒絕H0, 差別有統計學意義。常用統計圖的適用范圍是什么? 常用的統計圖及適用條件是: 條圖,適用于相互獨立的資料,以表示其指標大小;百分條圖及遠圓圖,適用于

12、構成比資料,反映各組成部分的大小;普通線圖: 適用于連續性資料,反映事物在時間上的發展變化的趨勢,或某現象隨另一現象變遷的情況。半對數線圖,適用于連續性資料,反映事物發展速度(相對比)。直方圖: 適用于連續性變量資料,反映連續變量的頻數分布。散點圖: 適用于成對數據,反映散點分布的趨勢。簡述率的標準化法的基本思想 當比較兩個總率時,如果兩組內部某種重要特征在構成上有差別,則直接比較這兩個總率是不合理的;因為這些特征構成上的不同,往往造成總率的升高或下降,從而影響兩個總率的對比。率標準化法的基本思想就是采用統一的內部構成計算標準化率,以消除內部構成不同對指標的影響,使算得的標準化率具有可比性。例

13、如比較兩人群的死亡率、出生率、患病率時,常要考慮人群性別、年齡的構成是否相同;試驗組和對照組治愈率的比較時,常要考慮兩組病情輕重、年齡、免疫狀態等因素的構成是否相同。如其構成不同,需采用統一的標準進行校正,然后計算校正后的標準化率進行比較,這種方法稱為標準化法。簡述2檢驗的的基本思想 2檢驗是檢驗理論頻數與實際頻數的吻合程度,從基本公式(TTA22)(=)可以看出,在檢驗假設成立的情況下,T(理論頻數)與A(實際頻數)之差一般不會很大,此時2值也較小;反之,2值較大。當2值較大,且大于一定的界值時,就拒絕H0,接受H1,認為兩樣本率有統計學差異。當2值較小,且小于特定的界值時,就不拒絕H0,認

14、為兩樣本率差異無統計學意義簡述當不滿足行×列的2檢驗的條件時的處理辦法。 當不滿足行×列的2檢驗的條件(R×C表中不宜有1/5的格子數小于5,或有一個格子的理論頻數小于1時,可采用下述方法處理:(1)增大樣本例數,(2)刪除理論數較小的行和列,(3)將理論數較小的行或列與性質相近的行或列合并,但在合并時應注意合并的合理性。(2)和(3)兩種處理方法會丟失部分信息。請簡述正態分布的特征1、曲線在橫軸上方均數處最高; 2、以均數為中心,左右對稱; 3、正態分布有兩個參數: (1): 位置參數 ,確定曲線位置 當 一定時,越大,曲線越向右移動;越小,曲線越向左移動。 (2): 離散度參數,決定曲線的形態: 當一定時,越大,表示數據越分散,曲線越“胖”;越小,表示數據越集中,曲線越“瘦”。 4、正態分布曲線下的面積有一定的分布規律簡述直線相關與秩相關的區別 Pearson積差相關 Spearman秩相關 雙變量正態分布 r為參數統計量 原始數據 偏峰分布、分布未知、 等級資料 rs為非參數統計量 秩次 都用于刻畫兩變量間線性相關的方向與密切程度 都要求各個體間滿足獨立性參數檢驗與非參數檢驗有何區別,各有何優缺點? (1)區別: 參數檢驗:以已知分布(如正態分布)為假定條件,對總體參數進行估計或檢驗。 非參數檢驗:不依賴總體分布的具體形式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論