




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
衛生統計學簡答題匯總衛生統計學簡答題匯總衛生統計學簡答題匯總衛生統計學簡答題匯總編制僅供參考審核批準生效日期地址:電話:傳真:郵編:統計學簡答匯總:緒論(無):定量變量的統計描述1.均數﹑幾何均數和中位數的適用范圍有何異同答:相同點,均表示計量資料集中趨勢的指標。不同點:表2-5.表2-5均數,幾何均數和中位數的相異點平均數意義應用場合均數平均數量水平應用甚廣,最適用于對稱分布,特別是正態分布幾何均數平均增減倍數①等比資料;②對數正態分布資料中位數位次居中的觀①偏態資料;②分布不明資料;③分布一端或兩察值水平端出現不確定值中位數與百分位數在意義上﹑計算和應用上有何區別與聯系答:意義:中位數是百分位中的第50分位數,常用于描述偏態分布資料的集中位置,反映位次居中的觀察值水平。百分位數是用于描述樣本或總體觀察值序列在某百分位置的水平,最常用的百分位是P50即中位數。多個百分位數結合使用,可更全面地描述總體或樣本的分布特征。(2)計算:中位數和百分位數均可用同一公式計算,即Px=L+(i/fx)(n·x%-ΣfL)可根據研究目的選擇不同的百分位數代入公式進行計算分析。(3)應用:中位數常用于描述偏態分布資料的集中趨勢;百分位數常用于醫學參考值范圍的確定。中位數常和其它分位數結合起來描述分布的特征,在實際工作中更為常用。百分位數還可以用來描述變量值的離散趨勢(四分位數間距)。3.同一資料的標準差是否一定小于均數答:不一定。同一資料的標準差的大小與均數無關,主要與本資料的變異度有關。變異大,標準差就大,有時比均數大;變異小,標準差小。4.測得一組資料,如身高或體重等,從統計上講,影響其標準差大小的因素有哪些(1)樣本含量的大小,樣本含量越大,標準差越穩定。(2)分組的多少(3)分布形狀的影響,偏態分布的標準差較近似正態分布大(4)隨機測量誤差大小的影響(5)研究總體中觀察值之間變異程度大小標準差與變異系數的異同點有哪些答:標準差:是以算數平均數為中心,反映各觀測值離散程度的一個絕對指標.當需要對同一總體不同時期或對不同總體進行對比時,缺乏可比性.當總體平均水平不同或計量單位不同時,用標準差是無法實現兩組數據離散程度大小對比的.變異系數:標準差與平均數的比值稱為變異系數,記為C·V.變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。如何表達一批計量數據的基本特征答:從集中趨勢和離散趨勢兩方面回答。7.描述計量資料離散程度(差別大小)的指標有哪些,各適用于什么情況答:常見的幾種描述離散程度的指標:極差或全距,四分位數差距,方差與標準差,變異系數。極差適合:數據分布非對稱的情形。四分位數差距適合:數據分布非對稱的情形。方差與標準差適合:對稱分布或近似正態分布資料,能充分利用全部個體的信息。變異系數適用:當比較兩資料的變異程度大小時,如果變量單位不同或均數差別較大時,直接比較無可比性,適用變異系數比較。標準差有何用途答:=1\*GB3①描述正態分布的變異程度;=2\*GB3②正態分布時,均數與標準差同時寫出:+S;=3\*GB3③計算變異系數;=4\*GB3④用標準差估計變量值的頻數分布;=5\*GB3⑤用標準差計算標準誤。9.統計描述的基本方法有哪些,各自有何特點答:統計描述的基本方法:用表、圖和數字的形式概括原始資料的主要信息。表:詳細、精確。圖:直觀。指標:綜合性好。10.簡述變異系數的實用時機。答:變異系數適用于變量單位不同或均數差別較大時,直接比較無可比性,適用變異系數比較。11.怎樣正確描述一組計量資料答:(1).根據分布類型選擇指標。(2).正態分布資料選用均數與標準差,對數正態分布資料選用幾何均數,一般偏態分布資料選用中位數與四分位數間距。原始數據單位變換后,對均數和方差有何影響答:均數和方差均改變。用實例說明。13.列表的原則和基本要求是什么答:(1)列表的原則:重點突出,簡單明了;主謂分明,層次清楚。(2)列表的基本要求:應有簡明扼要說明統計表內容的標題。既不能過與簡略,也不呢能過于繁瑣或不確切。標目文字要簡明,有單位的標目要注明,標目不宜過多,層次應清楚。線條不宜過多。除頂線、底線、縱標目下與合計行上面的線條外,其他線條一般均應省去。表的左上角不宜有斜線。表內數字小數位數保留應一致,位次應對齊,不宜留空格。暫缺或未記錄用“…”表示,無數字用“—”表示,數字是“0”則應填寫“0”。備注一般不列入表內,應用“*”號引出,寫在表的下面。14.常用的統計圖有哪幾種他們的適用條件是什么答:常用的統計圖有條圖、百分條圖、圓圖、線圖、半對數線圖、直方圖、散點圖和統計地圖等。(1)直條圖:用等寬直條的長短來表示相互獨立的各項指標的數值大小,如發病率等。(2)百分條圖、圓圖:用長條各段的面積、圓的扇形面積來表示事物內部各構成部分的分布情況,即各構成比重的大小,如構成比。(3)普通線圖:用線段的升降來表示連續性資料隨時間的變遷、某事物現象的動態及變化趨勢。(4)半對數線圖:用線段的升降來表示連續性資料隨時間的變遷和某事物現象發展變化的速度。(5)直方圖:用直方面積的大小表示數值變量資料頻數分布的情況。(6)散點圖:用點的密集程度和趨勢表示兩變量間的相關關系。(7)統計地圖:用不同的紋線或顏色說明指標高低,描述某事物現象在行政區域上的分布情況。15.半對數線圖的圖形如何做分析答:用于表示事物的發展速度(相對比)。其橫軸為算數尺度,縱軸為對數尺度,在比較幾組數據的變化速度(相對比)時,特別是兩組數據相差懸殊時,宜用半對數線圖。第三章:定性變量的描述1.為什么不能以構成比代率答:二者說明的問題不同。構成比只能說明某事物內部各組成部分在全體中所占的比重或分布,不能說明某現象發生的頻率或強度。2.簡述相對數標準化的基本思想。答:基本思想:采用統一的標準人口年齡構成,以消除不同人口構成對兩地死亡率的影響,使得到的標準化死亡率具有可比性。3.解釋在何種情況下應選用率的直接標化法,何種情況選用間接標化法答:率的直接標化法:已知各組的年齡別死亡率pi。間接標化法:已知各組的死亡總數和各年齡組人口數.4.率的直接標化法,與間接標化法有何不同答:(1)適用條件不同(見第上題);(2)“標準”不同:前者選定一個“標準人口”或“標準人口構成”。后者選定一套“標準年齡別死亡率”。5.應用相對數時應注意哪些問題答:應用相對數指標的時候要注意:分母不宜過小;不要以比代率;資料的可比性;樣本指標比較時應做假設檢驗。6.常用相對數指標有哪些它們的意義上有何不同答:常用相對數指標:率、構成比、比。率又稱頻率指標或強度相對數。說明某現象發生的頻率或強度。常用來表示某一事物發展的趨勢或水平及特征。構成比又稱構成指標或結構相對數。部分與全部之比,說明某事物內部各組成部分在全體中所占的比重或分布。常用來表示疾病或死亡的順位、位次或所占比重。比(又稱相對比)表示同類的或有聯系的兩個現象間的對比關系,常用倍數或百分數表示。7.統計學上資料是否“具有可比性”指的是什么你能舉出一些不可比的例子嗎答:除研究因素外,其余重要影響因素應相同或相近。一般觀察單位同質,研究方法相同,觀察時間相等,以及地區、民族等客觀條件一致。例如內科和外科的治愈率就無可比性。8.何謂人口老齡化請簡述其影響因素。答1:人口老齡化是指老年人口(65歲及以上)在人口中所占的比重升高的現象。在沒有遷移的情況下,人口老齡化的進程主要受生育率和死亡率兩種因素的影響。生育率下降,使低年齡人口的比重降低,高年齡人口的比重相應增加;死亡率(主要是中老年人口的死亡率)降低,使壽命延長,老年人口比重增加。一般來說,人口老齡化的速度和程度主要取決于生育率的下降速度。當生育率水平下降達到很低的水平且很難再有較大程度的降低時,中老年人口死亡率的降低對人口老齡化的影響才比較明顯。9.發病率、時點患病率、時期患病率的區別。答:(1)發病率是指觀察期內,可能發生某病的人群中新發病例的頻率,其觀察期多為年、月、日等,急性常見病多計算發病率。(2)時點患病率反映在檢查或調查時點一定人群中某病的現患情況(包括該病的新舊病例數)。觀察時點在理論上是無長度的,但實際上觀察時間不宜過長,一般不超過個月。(3)時期患病率反映在觀察期間一定人群中存在或流行某病的頻度,包括觀察期間的新發病例和現患病例數,為慢性病的統計指標。10.疾病統計的觀察單位“病人”和“病例”的區別。答:(1)一個人每次患病都可作為一個病例。以病例為單位的疾病統計,可研究居民各種疾病的頻度、疾病的種類及疾病的變動,以獲得居民患病的基本規律。(2)病人是指一個有病的人。在觀察期間內,觀察對象患有疾病即算作一個病人,不管其患病的種類及患病次數的多少。以病人為單位的疾病統計,在一定程度上反映居民的患病頻度,可找出具體的患病人群,便于開展對病人個人的防治工作。11.病死率和死亡率的區別。答:(1)某病病死率表示在規定的觀察期內,某病患者中因該病而死亡的頻率。它是反映疾病的嚴重程度的指標。在用病死率進行比較時應注意病情輕重等內部構成不同的影響。計算公式為:觀察期內因某病死亡的人數某病病死率=同期該病患者數×1000‰(2)某病死亡率表示在規定的觀察期內,人群中因某病而死亡的頻率。它可以反映不同地區或年代某種疾病的死亡水平。計算公式為:觀察期內因某病死亡的人數某病死亡率=同期平均人口數×1000‰12.簡述嬰兒死亡率指標的實際意義。答:嬰兒死亡率指某地某年不滿一周歲嬰兒的死亡數與同期活產總數的比值。嬰兒死亡率=某年不滿周歲嬰兒死亡數×1000‰/同期活產數嬰兒死亡率的高低對平均壽命有重要的影響,它是反映社會衛生狀況和嬰兒保健工作的重要指標,也是死亡統計指標中較為敏感的指標。嬰兒死亡率不受年齡的影響,不同國家或地區之間可以相互比較。13.請說明頻率型指標與強度型指標的主要區別答:主要區別:指標的解釋不同,頻率型指標是表示事物內部某個組成部分所占的比重或分布,或指某現象發生的頻率。強度型指標是指單位時間內某現象發生的頻率。14.標準化法的基本思想答:采用統一標準構成以消除某因素的內部構成不同對總率的影響,使通過標準化后的標準化率具有可比性。15.請比較發病率和患病率的不同。答:發病率表示一定時期內,在可能發生某病的一定人群活過的總人年中,新發生的某病病歷數,其分子是新病歷數,分母是總人年數;患病率,又稱現患率,指某時點上受檢人數中先患某種病的人數,通常用于描述病程較長或發病時間不易明確的疾病的患病情況,其分子包括新舊病例數,分母是受檢總人數。在一定的人群和時間內,發病率和患病率有密切關系,兩者與病程(D)的關系是:PR=IR×D。16.請比較死亡率與病死率的不同。答:死亡率與病死率的分子是一樣的,均表示因某病死亡的人數,但死亡率的分母是總人年數,側重反映發生的強度,或單位時間內死亡的概率;病死率的分母是患某病的人數,反映疾病死亡的概率。17.應用相對數應注意的事項。答:1.理解相對數的含義不可望文生義;2.頻率型指標的解釋要緊扣總體和屬性;3.計算相對數時分母應有足夠數量;4.正確地合并頻率(強度)型指標;5.相對數間的比較要具備可比性;6.對相對數的統計推斷。18.應用標準化的注意事項。答:1.標準化的應用范圍很廣,適用于“某事件的發生率”可以是治愈率,也可以是患病率,還可以是發病率、病死率等。當某個分類變量在兩組中分布不同時,這個分類變量就成為兩組頻率比較的混雜因素,標準化法的目的就是消除這個混雜因素的影響。疾病統計有幾類指標,各有什么意義答:發病率、時點患病率、期間患病率、治愈率、生存率、殘疾患病率。前3種詳見上述簡答題。治愈率:表示受治病人中治愈的頻率。有效率表示受治病人中治療有效的頻率。兩個率主要用于對急性病危害或防治效果的評價。但治愈和有效的標準要有明確而具體的規定,只有在標準相同的情況下才可以相互比較。生存率:病人能活到某一時點的概率。常用于對慢性病及心血管病等的治療效果評價和預后評估。反映疾病的預防效果和治療效果的指標有哪些各有什么特點答:=1\*GB3①發病率:疾病防治效果;=2\*GB3②患病率:慢性病預防效果;=3\*GB3③治愈率:急性病防治效果;=4\*GB3④生存率:慢性病的治療效果。各指標含義詳見上述簡答題。測量生育水平有幾個指標各指標有什么不同答:=1\*GB3①粗生育率;=2\*GB3②總生育率;=3\*GB3③年齡別生育率;=4\*GB3④總和生育率。各指標含義詳見教材P41。測量人口再生育水平有幾個指標各指標有什么不同答:=1\*GB3①自然增長率;=2\*GB3②粗再生育率;=3\*GB3③凈再生育率。各指標含義詳見教材P42。人口統計應包括哪幾個方面答:醫學人口統計是從衛生保健的角度研究和描述人口數量、分布、結構、變動及其規律,研究人口與衛生事業發展的相互關系,是衛生統計學的重要組成部分。包括描述人口學特征的指標,生育和人口死亡的指標。詳見書本P40-44。人口金字塔有幾種典型的形狀各說明什么答:人口金字塔直觀地表示了人口的年齡、性別結構。每一層代表一個年齡組的人口,上部代表老年人,下部代表少年兒童,左半部代表男性,右半部代表女性,水平方向的長度表示男性和女性人口的數量各在總人口中所占的百分比。人口金字塔一共分3種類型:=1\*GB3①年輕型:下寬上窄,呈真正的金字塔形,表明少年兒童人口占總人口的比重大,預示著未來人口的發展趨勢是增長的。其人口增長模式一般為“高-低-高”模式,主要存在有發展中國家;=2\*GB3②成年型:底部與中部的寬窄基本相近,出生率、死亡率差不多,預示著未來人口的發展趨勢是穩定的。其人口增長模式一般為“低-低-低”模式;=3\*GB3③老年型:上寬下窄,表明少年兒童人口的比重縮小,老年人口比重增大,是出生率長期下降的結果。這種類型的人口問題主要是育齡人口比重低,如果生育水平不變,預示著未來人口的發展趨勢是負增長的。其人口增長模式一般為“低-低-低”模式,一般存在于發達國家。:常用概率分布1.正態分布﹑標準正態分布與對數正態分布在概念上和應用上有何異同答:概念上:①相同點:正態分布、標準正態分布與對數正態分布都是變量的連續型分布。其特征是:分布曲線在橫軸上方,略呈鐘型,以均數為中心,兩邊對稱,均數處最高,兩邊逐漸減小,向外延伸,不與橫軸相交。②相異點:表示方法不同,正態分布用N(μ,σ2)表示,標準正態分布用N(0,1)表示,對數正態分布N(μlgX,σ2lgX)表示。應用上:①相同點:正態分布、對數正態分布都可以轉換為標準正態分布。②相異點:標準正態分布是標準正態變量u的分布,標準正態曲線下的面積唯一的由u決定,給應用帶來極大方便。對醫學資料呈偏態分布的數據,有的經對數變換后服從正態分布。正態分布、對數正態分布可描述變量值的分布特征,可用于正常值范圍估計和質量控制等。正態分布是很多統計方法的理論基礎。2.醫學中參考值范圍的含義是什么確定的原則和方法是什么含義:參考值范圍亦稱正常值范圍,它是指特定健康狀況人群(排除了有關疾病和因素對所研究指標有影響的所謂“正常人”不同于“健康人”概念)的解剖、生理、生化等數據絕大多數人的波動范圍。(2)原則:①抽取有代表性的足夠例數的正常人群樣本,樣本分布越接近總體,所得結果越可靠。一般認為樣本含量最好在100例以上,以能得到一個分布較為穩定的樣本為原則。②對選定的正常人進行準確而統一的測定,保證測定數據可靠是確定正常值范圍的前提。③判定是否要分組(如男女、年齡、地區等)確定正常值范圍。④決定取雙側范圍值還是單側范圍值。⑤選擇適當的百分范圍⑥確定可疑范圍⑦估計界值(3)方法:①百分位數法:Px=L+(i/fx)(n·x%-ΣfL)②正態分布法(對數正態分布):百分位數法用于各種分布型(或分布不明)資料;正態分布法用于服從或近似正態分布(服從對數正態分布)的資料。3.對稱分布資料在“均數±倍標準差”的范圍內,也包括95%的觀察值嗎答:不一定。均數±倍標準差是正態分布的分布規律,對稱分布不一定是正態分布。4.正態分布的主要特征有哪些答:(1)正態曲線在橫軸上方均數處最高。(2)正態分布以均數為中心,左右對稱。(3)正態分布有兩個參數,即均數(位置參數)和標準差(變異度參數)。(4)正態曲線下的面積分布有一定規律。5.參考值范圍是指什么答:參考值范圍又稱正常值范圍,即大多數正常人某指標值的范圍。“正常人”是指排除了影響研究指標的疾病和有關因素的同質人群。6.簡述估計參考值范圍的步驟與要點。答:設計:①樣本:“正常人”,大樣本n≥100。②單側或雙側。③指標分布類型。計算:①若直方圖看來像正態分布,用正態分布法。②若直方圖看來不像正態分布,用百分位數法。7.簡述正態分布的用途。答:(1)估計頻數分布。(2)制定參考值范圍。(3)質量控制。(4)統計檢驗的理論基礎。8.簡述可信區間在假設檢驗問題中的作用。答:可信區間不僅能回答差別有無統計學意義,而且還能提示差別有無實際意義。可信區間只能在預先規定的概率即檢驗水準的前提下進行計算,而假設檢驗能夠獲得一個較為確切的概率P值。故將二者結合起來,才是對假設檢驗問題的完整分析。9.二項分布、Poisson分布各有哪些特征答:二項分布和Poisson分布都是離散型分布。二項分布的形狀取決于與n的大小:=時,不論n大小,分布對稱。≠時,圖形呈偏態,隨n的增大,逐漸對稱。當n足夠大,或1-不太小,二項分布B(n,)近似于正態分布N(n,n(1-))。Poisson分布:值愈小分布愈偏,愈大分布趨于對稱,當足夠大時,分布接近正態分布N(,)。10.簡述二項分布、Poisson分布、正態分布的關系。答:當n足夠大,或1-不太小時,二項分布近似于正態分布。當n足夠大,或1-很小時,二項分布近似于Poisson分布。較大時,Poisson分布近似于正態分布。11.二項分布的應用條件是什么答:⑴每次試驗有且僅有兩個互相排斥的結果(A或非A)。⑵每次試驗中,發生A的概率相同,均為π。⑶各次試驗獨立,即n次觀察結果相互獨立。12.醫學參考值范圍確定的方法是什么答:百分位數法和正態分布法。13.簡述二項分布、Poisson分布、正態分布的區別與聯系。答:區別:二項分布、Poisson分布是離散型概率分布,用概率函數描述其分布狀況,而正態分布是連續型概率分布,用密度函數和分布函數描述其分布狀況。聯系:Poisson分布可以視為n很大而π很小的二項分布。當n很大而π和1—π都不是很小的時候二項分布漸近正態分布,當λ》=20的時候Poisson分布漸近正態分布。14.控制圖的基本原理。答:當影響某一數值指標的隨機因素很多,而每個因素所起的作用均不太大時,這個指標的隨機波動屬于隨機誤差,則往往服從正態分布。相反,如果除隨機誤差外,還存在某些影響較大的因素導致的誤差,稱為系統誤差,這時指標的波動就不再服從正態分布。15.二項分布的特征答:二項分布圖的高峰在μ=nπ處或附近;π為時,圖形是對稱的;當π不等于時,分布不對稱,且對同一n,π離愈遠,對稱性愈差。對同一π,隨著n的增大,分布趨于對稱。當n→∞時,只要π不太靠近0或1,二項分布趨于對稱。分布的特征答:(1)Poisson分布的總體均數與總體方差相等,均為λ。(2)當λ較小時,圖形呈偏態分布;當λ較大時,圖形呈正態分布。(3)Poisson分布的觀察結果具有可加性。17.正態分布曲線的位置與形狀的特點答:(1)關于χ=μ對稱。(2)在χ=μ處取得該概率密度函數最大值,在χ=μ±σ處有拐點。(3)曲線下面積為1。(4)μ決定曲線在橫軸上的位置,μ增大,曲線沿橫軸向右移;反之,μ減小,曲線沿橫軸向左移。(5)σ決定曲線的形狀,當μ恒定時,σ越大,數據越分散,曲線越“矮胖”;σ越小,數據越集中,曲線越“瘦高”。什么叫標準正態分布答:標準正態分布又稱為u分布,是以0為均數、以1為標準差的正態分布,記為N(0,1)。標準正態分布曲線下面積分布規律是:在~+范圍內曲線下的面積等于,在~+范圍內曲線下面積為。統計學家還制定了一張統計用表(自由度為∞時),借助該表就可以估計出某些特殊u1和u2值范圍內的曲線下面積。確定醫學參考值范圍的方法及特點答:=1\*GB3①百分位數法:雙側95%醫學參考值范圍是(,),單側范圍是P95以下(人體有害物質如血鉛、發汞等),或P5以上(如肺活量)。該法適用于任何分布類型的資料。=2\*GB3②正態分布法:若X服從正態分布,醫學參考值范圍還可以依正態分布的規律計算。二項分布的定義是什么二項分布有哪些基本性質答:定義:二項分布是n個獨立的是/非實驗中成功次數的離散概率分布,其中每次實驗成功的概率均為p。基本性質:=1\*GB3①圖形特征:具體見15題簡答題;=2\*GB3②二項分布的均數和標準差:詳見教材P66頁公式。二項分布原理可進行哪些統計分析答:資料需首先滿足以下條件:=1\*GB3①每次實驗只能發生兩種對立的可能結果之一,分別發生兩種結果的概率之和恒等于1;=2\*GB3②每次實驗產生某種結果的概率π固定不變;=3\*GB3③重復實驗是相互獨立的,任何一次實驗結果的出現不會影響其他實驗結果出現的概率。可做統計分析包括:=1\*GB3①總體率的區間估計:n≦50時,用查表法;n≧50時,用正態近似法,(p-ZαSp,p+ZαSp);=2\*GB3②樣本率與總體率的比較:n≦50時,直接概率法;n≧50時,用正態近似法;=3\*GB3③兩樣本率的比較。二項分布的擬合優度檢驗有什么實際意義答:擬合優度檢驗,即依據總體分布狀況,計算出分類變量中各類別的期望頻數,與分布的觀察頻數進行對比,判斷期望頻數與觀察頻數是否有顯著差異,從而達到從分類變量進行分析的目的。實際意義在于可以判斷某些疾病是否具有家族聚集性等。Poisson分布的定義列舉幾個Poisson分布變量分布的實例答:Poisson分布屬于離散型分布,用以描述單位時間、空間、面積等的罕見事件發生次數的概率分布。例如:每毫升水中的大腸桿菌數、每個立升空氣中的粉塵計數等。Poisson分布理論可進行哪些統計分析答:資料首先滿足以下條件:=1\*GB3①事件發生的概率π固定不變;=2\*GB3②每個事件的發生相互獨立。可做統計分析包括:=1\*GB3①區間估計;=2\*GB3②單樣本資料Z檢驗;=3\*GB3③兩獨立樣本資料Z檢驗。對數正態分布數據如何制定正常值范圍答:log-1—log-1(Yba+;其中:Y=logX。:參數估計基礎1.標準差和標準誤有何區別和聯系表3-6標準差與標準誤的區別標準差(α或s)標準誤()意義上描述一組變量值之間的離散趨勢描述樣本均數間的離散趨勢應用上①s越小,表示變量值圍繞①越小,表示樣本均數與均值分布越密集,說明均數總體均數越接近,說明樣本的代表性越好。均數推斷總體均數可靠性越大。②可用估計變量值分②可用估計總體布范圍均數可信區間與n的關系n越大,s越趨于穩定n越大,越小(2)聯系①二者均是表示變異度大小的統計指標。②標準誤與標準差大小成正比,與抽樣例數n的平方根成反比。③當n一定時,同一份資料,標準差越大,標準誤也越大。2.可信區間和參考值范圍有何不同參考值范圍是指同質總體中個體變量值的分布范圍,如X±說明有95%的變量值分布在此范圍內,它與標準差的大小有關,若個體變異越大,該范圍越寬,分布也就越散。而可信區間是指在可信度為(1-α)時,估計總體參數可能存在的范圍。即從同一總體中隨機抽樣,當n一定時,每抽一次即可得一個樣本均值,以計算可信區間,如95%可信區間,類似的隨機抽樣進行一百次,平均有95次,即有95個可信區間包括了總體均數,有5次沒有包括括總體均數,5%是小概率事件,實際發生的可能性很小,因此實際應用中就認為總體均數在求得的可信區間。這種估計方法犯錯誤的可能性最大不超過5%。可信區間與標準誤大小有關,標準誤越大,可信區間則越大。分布圖形的特征答:(1)單峰分布,以0為中心,左右對稱;(2)ν越小,t值越分散,曲線的峰部越矮,尾部越高;(3)隨著ν逐漸增大,t分布逐漸接近標準正態分布;(4)當ν趨向∞時,t分布趨近標準正態分布。4.總體分布的形態和樣本含量對樣本均數的抽樣分布會產生何種影響答:無論原始數據的總體分布形態如何,即對于任意分布而言,在樣本含量足夠大時,其樣本均數的分布近似于正態分布,且樣本均數的均數等于原分布的均數,樣本均數的標準誤有公式(6-1)計算。5.樣本均數的標準誤的意義是什么與原變量的標準差有何區別與聯系答:樣本均數的標準誤可以反映樣本均數之間的離散程度及抽樣誤差的大小。標準誤與標準差的區別:(1)前者表示均數變異的指標,后者是表示觀察值變異的指標。(2)用途不同,標準差與均數結合估計參考值范圍,計算變異系數,和標準誤等;標準誤用于估計參數的可信區間,進行假設檢驗等。(3)它們與樣本含量n的關系不同,當樣本含量n足夠大時,標準差趨向穩定,而標準誤隨的增大而減小。聯系:當樣本量n一定時,標準誤隨標準差的大小而變化。6.用同一個樣本統計量分別估計總體參數的95%置信區間和99%置信區間,哪一個估計的精度更好為什么答:95%置信區間的精度要好于99%置信區間。因為置信度或置信水平有95%提高到99%時,置信區間由窄變寬,估計的精度下降。7.滿足什么條件時可以采取正態近似法估計總體概率的置信區間答:當n足夠大,且樣本頻率p和1—p均不太小時,如np與n(1—p)均大于5時,可用正態近似法求總體概率的置信區間。8.什么是抽樣誤差如何減少抽樣誤差答:抽樣誤差:從某一總體中隨機抽取一個或多個樣本,所得的樣本統計量與相應的總體參數之間的差異,或者各個樣本統計量之間的差異稱為抽樣誤差。可通過增加樣本量來減少抽樣誤差。總體分布的形態和樣本含量對樣本均數的抽樣誤差分布會產生何種影響答:在服從正態分布的總體中進行隨機抽樣,樣本均數呈近似正態分布。在非正態分布的總體中隨機抽樣,當樣本量較小時,樣本均數的分布呈非正態分布;當樣本量足夠大時(如n≧30),樣本均數的分布近似服從正態分布。樣本均數的分布有哪些基本特征答:=1\*GB3①樣本均數恰好等于總體均數是極其罕見的;=2\*GB3②樣本均數之間存在差異;=3\*GB3③樣本均數圍繞總體均數,中間多,兩邊少,左右基本對稱,呈近似正態分布;=4\*GB3④樣本均數之間的變異明顯小于原始變量之間的變異。總體均數的可信區間中的可信度和區間的寬度各說明什么問題答:可信度:反映了估計準確度;區間寬度的一半:反映了估計的精度。12.抽樣誤差的大小受哪些因素的影響答:①抽樣單位的數目。在其他條件不變的情況下,抽樣單位的數目越多,抽樣誤差越小;抽樣單位數目越少,抽樣誤差越大。這是因為隨著樣本數目的增多,樣本結構越接近總體。抽樣調查也就越接近全面調查。當樣本擴大到總體時,則為全面調查,也就不存在抽樣誤差了。②總體被研究標志的變異程度。在其他條件不變的情況下,總體標志的變異程度越小,抽樣誤差越小。總體標志的變異程度越大,抽樣誤差越大。抽樣誤差和總體標志的變異程度成正比變化。這是因為總體的變異程度小,表示吝惜體各單位標志值之間的差異小。則樣本指標與總體指標之間的差異也可能小;如果總體各單位標志值相等,則標志變動度為零,樣本指標等于總體指標,此時不存在抽樣誤差。③抽樣方法的選擇。重復抽樣和不重復抽樣的抽樣誤差的大小不同。采用不重復抽樣比采用重復抽樣的抽樣誤差小。④抽樣組織方式不同。采用不同的組織方式,會有不同的抽樣誤差,這是因為不同的抽樣組織所抽中的樣本,對于總體的代表性也不同。通常,我們不常利用不同的抽樣誤差,做出判斷各種抽樣組織方式的比較標準。13.可信區間的含義是什么可信區間的準確度和精密度指的是什么答:可信區間:將樣本統計量與標準誤結合起來,確定一個具有較大置信度的包含總體參數的范圍,該范圍稱為總體參數的置信區間。準確度:即為置信度;精確度:置信區間寬度的一半。:假設檢驗基礎1.假設檢驗和區間估計有何聯系假設檢驗和區間估計都屬于統計推斷的內容。假設檢驗用以推斷總體參數間是否有質的區別,并可獲得樣本統計量,以得到相對精確的概率值。而可信區間用于推斷總體參數的大小,它不僅可用以回答假設檢驗的問題,尚可比假設檢驗提供更多的信息。但這并不意味著用可信區間代替假設檢驗,因為假設檢驗可得到P值,比較精確地說明結論的概率保證,而可信區間只能告訴我們在某α水準上有無統計意義,卻不能像P那樣提供精確的概率。因此,只有將二者有機地結合起來,相互補充,才是完整的分析。2.假設檢驗時,一般當P<時,則拒絕H0,理論依據是什么假設檢驗時,當P<,則拒絕Ho,其理論依據是在Ho成立的條件下,出現大于等于現有檢驗統計量的概率P<,它是小概率事件,即在一次抽樣中得到這么小概率是事件是不大可能發生的,因而拒絕它。由此可見,假設檢驗的結論是具有概率性的,它存在犯錯誤的可能性小于等于。檢驗和方差分析的應用條件有何異同(1)相同點:在均數比較中,t檢驗和方差分析均要求各樣本來自正態總體;各處理組總體方差齊且各隨機樣本間相互獨立,尤在小樣本時更需注意。不同點:t檢驗僅用于兩組資料的比較,除雙側檢驗外,尚可進行單側檢驗,亦可計算一定可信度的可信區間,提示差別有無實際意義。而方差分析用于兩組及兩組以上均數的比較,亦可用于兩組資料的方差齊性檢驗。4.怎樣正確使用單側檢驗和雙側檢驗根據專業知識推斷兩個總體是否有差別時,是甲高于乙,還是乙高于甲,兩種可能都存在時,一般選雙側;若根據專業知識,如果甲不會低于乙,或研究者僅關心其中一種可能時,可選用單側。一般來講,雙側檢驗較穩妥故較多用,在預實驗有探索性質時,應以專業知識為依據,它充分利用了另一側的不可能性,故檢出效率高,但應慎用。
5.第一類錯誤與第二類錯誤的區別及聯系何在了解這兩類錯誤有何實際意義(1)假設檢驗中Ⅰ、Ⅱ型錯誤的區別。Ⅰ型錯誤是拒絕了實際上成立的Ho,也稱為“棄真”錯誤,用α表示。統計推斷時,根據研究者的要求來確定。Ⅱ型錯誤是不拒絕實際上不成立的Ho,也稱為“存偽”錯誤,用β表示。它只能與特定的H1結合起來才有意義,一般難以確切估計。(2)Ⅰ、Ⅱ型錯誤的聯系。①當抽樣例數一定時,α越大,β越小;反之,α越小,β越大。②統計推斷中,Ⅰ、Ⅱ型錯誤均有可能發生,若要使兩者都減小,可適當增加樣本含量。③根據研究者要求,n一定時,可通過確定α水平來控制β大小。(3)了解兩類錯誤的實際意義。①可用于樣本含量的估計。②可用來計算可信度(1-α),表明統計推斷可靠性的大小。③可用于計算把握度(1-β),來評價檢驗方法的效能等。④有助于研究者選擇適當的檢驗水準。⑤可以說明統計結論的概率保證。6.簡述可信區間在假設檢驗問題中的作用。答:可信區間不僅能回答差別有無統計學意義,而且還能提示差別有無實際意義。可信區間只能在預先規定的概率即檢驗水準的前提下進行計算,而假設檢驗能夠獲得一個較為確切的概率P值。故將二者結合起來,才是對假設檢驗問題的完整分析。7.假設檢驗時,當P≤,則拒絕H0,理論依據是什么答:P值為H0成立的條件下,比檢驗統計量更極端的概率,即大于等于檢驗統計量的概率。當P≤時,說明在H0成立的條件下,得到現有檢驗結果的概率小于,因為小概率事件幾乎不可能在一次試驗中發生,所以拒絕H0。下差別“有統計學”意義的結論的同時,我們能夠知道可能犯錯誤的概率不會大于,也就是說,有了概率保證。8.假設檢驗中與P的區別何在答:以t檢驗為例,與P都可用t分布尾部面積大小表示,所不同的是:值是指在統計推斷時預先設定的一個小概率值,就是說如果H0是真的,允許它錯誤的被拒絕的概率。P值是由實際樣本獲得的,是指在H0成立的前提下,出現大于或等于現有檢驗統計量的概率。9.什么叫兩型錯誤作統計學假設檢驗為什么要加以考慮答:如果H0正確,檢驗結果卻拒絕H0,而接受H1,則犯I型錯誤,記為α;如果H0錯誤,檢驗結果卻不拒絕H0,未能接受H1,則犯II型錯誤,記為β。一般情況下,α越大,β越小;α越小,β越大。如果要同時減少兩類錯誤,則需最大樣本含量。因為假設檢驗的結論都有犯錯誤的可能性,所以實驗者在下假設檢驗有無統計學意義的結論時,都要考慮到兩型錯誤。10.配對比較是不是就比成組比較好什么情況下用配對比較比較好答:配對比較可以控制實驗單位個體間的變異,從而減少實驗誤差,提高檢驗性能。但這并不是說凡是配對試驗就一定比成組比較好。實驗是否應做配對比較,首先應根據業務知識判斷,看配成對子的個體間是否比不配對的個體間相似程度更高。11.t檢驗有幾種各適用于哪些情況答:t檢驗以t分布為理論基礎。小樣本時要求假定條件:資料服從正態分布,方差齊同。一般分為三種:一是樣本均數與總體均數比較的t檢驗。即將一個樣本均數X與一已知的總體均數作比較;二是配對資料的t檢驗。例如治療前后的比較,或配成對子的實驗動物之間的比較。三是兩個樣本均數比較的t檢驗;兩組的樣本量可以不相同。此外尚有相關系數、回歸系數的t檢驗。12.什么叫假設檢驗醫學研究中常用的假設檢驗有哪些答:判斷總體與樣本之間、樣本與樣本之間的差異有無統計學意義的統計分析方法,一般步驟是:①提出檢驗假設0H,確定單雙側與檢驗水準α;②計算檢驗統計量;③確定概率P值;④判斷結果。在醫學研究中常用的顯著性檢驗有u檢驗、t檢驗、F檢驗、2檢驗及非參數秩和檢驗等多種,不論那種檢驗均以假設成立時得到的統計量的概率來判斷。13.通過實例說明為什么假設檢驗的結論不能絕對化答:統計的結論為概率性的結論。拒絕H0時,可能犯Ⅰ型錯誤。不拒絕H0時,可能犯Ⅱ型錯誤。14.假設檢驗的理論依據是什么(或者問基本思想)答:采用邏輯上的反證法,利用“小概率思想”。小概率思想是是指概率事件(p<或p<)在一次試驗中基本上不會發生。反證法思想是先提出假設(檢驗假設H0),再用適當的統計方法確定假設成立的可能性大小,如可能性小,則認為假設不成立;如可能性大,則還不能認為假設不成立。15.假設檢驗的一般步驟。答:(1)根據所討論的實際問題建立原假設H0及備擇假設H1;(2)選擇合適的檢驗統計量,并明確其分布;(3)對預先給定的小概率α,由確定臨界值;(4)由樣本值具體計算統計量的觀察值,并作出判斷接受H0還是拒絕H0。16.假設檢驗的兩類錯誤之間的區別與聯系是什么答:假設檢驗時,拒絕實際上成立的H0,犯第Ⅰ類錯誤,俗稱“棄真”錯誤;不拒絕實際上并不成立的H0,范第Ⅱ類錯誤,俗稱“存偽”錯誤。犯第Ⅰ類錯誤錯誤的概率用α表示,假設檢驗時,根據研究者的要求來確定;犯第二類錯誤的概率用β表示,它只有與特定的H1結合起來才有意義。對于某一具體的檢驗來說,當樣本含量n一定時,α越小,β越大;α越大,β越小。17.檢驗假設中P值的意義是什么答:如果總體狀況與H0一致,統計量獲得現有數值以及更不利于H0的數值的概率。18.如何確定檢驗水準答:檢驗水準確定需根據研究設計的類型、研究目的、變量類型及變異水平、樣本大小等諸多因素。19.如何恰當地應用單側與雙側檢驗答:單側與雙側檢驗的應用首先應考慮所要解決問題的目的,根據專業知識來確定。若從專業知識判斷一種方法的結果不可能低于或高于另一種方法的結果時,可用單側檢驗;在尚不能從專業知識判斷兩種結果誰高誰低時,則用雙側檢驗。一般認為雙側檢驗較保守和穩妥。檢驗的應用條件是什么答:(1)隨機事件,(2)來自正態分布總體,(3)均數比較時,要求兩總體方差相等。21.配對t檢驗與兩樣本t檢驗的基本原理有何不同答:=1\*GB3①獨立樣本t檢驗:用于檢驗兩個獨立樣本是否來自具有相同均值的總體,相當于兩個正態分布總體的均值是否相等,即假設檢驗:H0:μ1=μ2是否成立,此檢驗以t分布為檢驗基礎;=2\*GB3②配對t檢驗:檢驗兩個相關的樣本是否來自具有相同均值的正態總體,即檢驗假設H0:d=0,實質就是檢驗差值的均值和零均值之間的顯著性。兩樣本均數比較時為什么要做假設檢驗答:因為要確定兩樣本所表現出來的差異是兩個總體本質上不同導致的,還是在相同總體中抽樣由抽樣誤差導致的。在假設檢驗中,無效假設與備擇假設的含義是什么兩種假設之間有何關系答:無效假設:研究者想收集證據予以反對的假設,又稱“0假設”,總是有符號=、≧和≦,表示為H0。備擇假設:研究者想收集證據予以支持的假設,也稱“研究假設”,總是有符號≠,<或>,表示為H1。原假設和備擇假設是一個完備事件組,并且相互對立;在一項假設檢驗中,原假設和備擇假設有且僅有一個成立;先確定備擇假設再確定原假設;等號“=”總是放在原假設上;因研究目的不同,對同一問題可能提出不同的假設。樣本均數與總體均數比較時,何時用t檢驗,何時用u檢驗答:t檢驗與u檢驗均可用于樣本均數與總體均數的比較或兩樣本均數的比較。理論上要求樣本來自正態分布總體。但在實際應用時,只要樣本例數n≧50,或者n較小但總體標準差σ已知時,可用u檢驗。n小且總體標準差σ未知時,可用t檢驗,但要求樣本來自正態分布總體。兩樣本均數比較時,還要求兩總體方差齊。什么是配對設計如何使配對研究設計的更好答:配對設計:將起始條件一致的兩個實驗個體配成對,并設有多個配對,每對個體分別隨機給予不同處理,即為配對設計,目的是提高同質性,減少誤差。配對設計分為以下幾種情形:=1\*GB3①配對的兩個受試對象分別接受兩種不同的處理;=2\*GB3②同一受試對象接受兩種不同的處理;=3\*GB3③同一受試對象處理前后的結果進行比較;=4\*GB3④同一對象的兩個部位給予不同的處理。正確應用配對設計:=1\*GB3①實驗對象的同質性欠佳時,采用配對設計可以提高處理組間的可比性和均衡性;=2\*GB3②配對設計的成敗取決于配對的條件,只有當兩組觀察值間的相關大于0時,配對才是成功的,且能提高檢驗效能;=3\*GB3③當采用左右配對設計時,實驗因素的效應必須是局部的,不可經過其他途徑影響對側;=4\*GB3④采用自身前后配對設計時,應考慮到環境、氣候或疾病的自然進程等引起的效應改變;=5\*GB3⑤配對設計的資料結合相關或回歸分析,有時能得到更豐富的結論。方差不齊時,兩樣本均數比較應采取什么方法做假設檢驗答:=1\*GB3①若兩小樣本,且來自正態總體,則用t,檢驗;=2\*GB3②若兩小樣本,不來自正態總體,則用秩和檢驗;=3\*GB3③若為兩大樣本,n均>50,則用u檢驗。:方差分析基礎1.方差分析的基本思想是什么答:方差分析的基本思想是把全部觀察值間的變異按設計和需要分解成兩個或多個組成部分,然后將各個部分的變異與隨機誤差進行比較,以判斷各部分的變異是否具有統計學意義。2.方差分析的應用條件是什么答:(1)各樣本是相互獨立的隨機樣本,(2)都采自正態總體,(3)各個總體方差相等。3.方差分析的檢驗假設(H0)是什么答:各總體均數相等4.方差分析中,各離均差平方和之間有何聯系各自由度之間又有何聯系完全隨機設計、隨機區組設計的方差分析的離均差平方和與自由度分別如何分解答:總的離均差平方和等于各部分離均差平方和之和.總的自由度等于各部分自由度之和.完全隨機設計:SS總=SS組內+SS組間V總=V組內+V組間隨機區組設計:SS總=SS組內+SS處理組間+SS區組間V總=V組內+V處理組間+V區組間5.三組均數比較時,為什么不能直接作一般的兩兩均數比較的t檢驗答:增大犯第一類錯誤的可能性.6.兩組均數差別的假設檢驗能否作方差分析,為什么答:可以.方差分析與t檢驗關系:k=2時,F=t2,P值相等,即兩檢驗等價。7.方差分析中,組間變異是來源于那些方面的變異答:該變異除隨機原因的影響外,有可能存在處理因素的作用。8.對多組均數作方差分析的主要步驟和結果有那些答:(1)建立檢驗假設和檢驗水準(2)計算統計量F值(列出方差分析表)(3)確定P值和作出推斷結論(4)作兩兩均數之間的比較(若P>則可省略此步驟)。方差分析是用于研究何種數據的統計方法答:用于定量變量資料,可以比較兩個及兩個以上均數的差別,并且應滿足以下條件:=1\*GB3①各樣本是相互獨立的隨機樣本,均服從正態分布;=2\*GB3②各樣本的總體方差相等,即方差齊。兩獨立樣本t檢驗與完全隨機設計資料的方差分析有何關系配對樣本t檢驗與隨機區組設計資料的方差分析有何關系答:對同一資料而言,兩獨立樣本t檢驗等價于完全隨機設計資料的ANOVA,且有F=t2;對同一資料,配對樣本t檢驗等價于隨機區組設計資料的ANOVA,且有F=t2。SNK-q檢驗Dunnett-t檢驗都可用于均數的多重比較,它們有何不同答:SNK-q檢驗和Dunnett-t檢驗雖然都可用于ANOVA得出多個總體均數不全等提示后的多重比較,但SNK-q檢驗常用于探索性研究,是對多個均數每兩個均數間的比較;而Dunnett-t檢驗常用于事先有明確假設的證實性研究,用于在設計階段就根據研究目的或專業知識而計劃好的某些均數間的兩兩比較,如多個處理組與對照組的比較,某一對或某幾對在專業上有特殊意義的均數間的比較等。數據變換在資料處理中起到什么作用答:資料不滿足方差分析條件時,處理方法之一是數據變換。對于明顯偏離正態性和方差不齊的資料,通過適當的數據變換可以近似的滿足假定條件,便于進行方差分析。13.什么是方差分析方差分析的主要用途是什么答:方差分析:又稱F檢驗,包括單因素方差分析和多因素方差分析。無論哪種方差分析都是通過對數據變異的分解,判斷不同樣本所代表的總體均數是否相同。用途:=1\*GB3①均數差別的顯著性檢驗;=2\*GB3②分離各有關因素并估計其對總變異的作用;=3\*GB3③分析因素間的交互作用;=4\*GB3④方差齊性檢驗。何為單因素方差分析和雙因素方差分析,各適用于什么情況答:單因素方差分析:即影響樣本的因素只有一個,用于完全隨機設計的多個樣本均數間的比較,其統計判斷是判斷各樣本所代表的總體均數是否相等。雙因素方差分析:影響樣本的因素有兩個,雙因素方差分析是對影響因素進行檢驗,研究是一個因素在起作用,還是兩個因素都起作用,或是兩個因素的影響都不明顯。有人說,多個樣本均數間的兩兩比較無非就是做若干次t檢驗。您的看法如何答:不正確,多個樣本均數間兩兩比較時,若采用t檢驗的方法,則會增大第一類錯誤的概率,即拒絕實際上成立H0,接受H1,可能將實際上無差異的兩個總體均數誤判為有差異,造成了假陽性。應采用專用的兩兩比較的方法。t檢驗與方差分析的區別是什么答:t檢驗只能用于兩樣本均數及樣本均數與總體均數之間的比較;方差分析可以用于兩樣本及以上樣本之間的比較。t檢驗和方差分析的應用條件有何異同答:相同點:=1\*GB3①獨立隨機;=2\*GB3②正態;=3\*GB3③方差齊;=4\*GB3④配伍組比較的方差分析是配對比較t檢驗的推廣,成組設計多個樣本均數比較的方差分析是兩樣本均數比較t檢驗的推廣;=5\*GB3⑤對于兩個樣本之間的比較,方差分析和t檢驗是等效的,F=t2。不同點:t檢驗只能用于兩樣本均數的比較,而方差分析可以用于兩樣本及以上樣本之間的比較。第八章:χ2檢驗2檢驗適用于解決那些問題對資料的設計類型和應用條件有何不同要求(1)X2檢驗適用于:①兩個及兩個以上的率或構成比的比較;②計數資料兩因素間的相關關系;③頻數分布的擬合優度檢驗。(2)對資料的設計類型和應用條件。1)四格表的X2檢驗:基本公式T>5且n>40專用公式校正公式1<T<5且n>40或當T<1或n<40時,可使用確切概率計算法直接計算概率,應用時注意區分單、雙側檢驗。雙側檢驗。雙側檢驗取兩側累積概率,單側檢驗只取一側累積概率。2)行×列(R×C)表資料的X2檢驗:基本公式與四格表基本公式相同。專用公式:可使用實際頻數計算X2。適用條件①行×列表不宜有1/5以上的格子的理論頻數小于5,或有一格理論頻數小于1。②當多個樣本率(或構成比)比較的X2檢驗,拒絕檢驗假設,只能認為各總體率(或構成比)之間總的有差別,但不能說明彼此間都有差別或某兩者間有差別,若要進一步解決此問題,可用X2分割法。③對單向有序列聯表,X2檢驗只說明各處理組的效應在構成比上有無差別。3)列聯表資料的X2檢驗:R×C列聯表公式:與R×C(行×列)表相同,但檢驗假設不同,R×C列聯表用于檢驗有無關聯,而R×C(行×列)表用于多個率或構成比的比較。適用條件與行×列表適用條件①相同。2×2列聯表或配對資料X2檢驗,檢驗兩個處理有無差別。b+c>40或校正公式b+c<40檢驗兩種處理間有無相關,公式同四格表所用公式4)頻數分布擬合優度的X2公式適用條件遇有理論頻數小于5時,可與相鄰組合并。2.X2檢驗的基本思想是什么答:X2檢驗的基本思想是實際數與理論編數的吻合程度,它是根據檢驗假設來確定的,如作兩樣本率的比較,我們先假設兩組的總體率相同,均等于兩組合計的總率,如果檢驗假設成立,則實際數與理論數之差一般不會很大。出現很大的X2值的概率是很小的若P<X我們就懷疑檢驗假設成立的可能性很小,因而拒絕,若P>X則沒有理由拒絕它3.四表格資料在何種情況下需要進行校正為什么在1≤T<5n≥40時,需要計算校正X2推斷統計量X2時是用一種連續概率分布(X2分布)作為對觀測頻數概率分布的近似,為改善此近似提出了一個修正,即取平方之前將正偏差(A-T)減,負偏差加,這樣使X2值降低,校正后的概率更接近確切的概率。4.行X列表X2檢驗的注意事項有哪些答:(1)X2檢驗要求理論數不宜太小,否則將導致分析的偏性,一般認為行X列表中不宜有1/5以上格子的理論頻數小于5,或有一個理論數小于1。對理論數頻數大小有三種處理方法:最好增加樣本例數以增加理論頻數刪去上述理論頻數太小的行或列將太小理論頻數所在行或列與性質相近的鄰行鄰列的實際頻數合并。后兩法可能會損失信息,也會損失樣本的隨機性,不同的合并方式有可能影響推斷結論,故不宜作常規方法。(2)當多個樣本率(或構成比)比較的X2檢驗,結論為拒絕檢驗假設,只能認為各總體率(或總體構成比)之間總的來說有差別,但不能說明它們彼此見都有差別,或某兩個間有差別,實際工作中,常常還需要知道各組間比較的情況,若要進一步解決此問題,不能采用一般四格表的X2檢驗進行兩兩比較,因為這會增大犯Ⅰ型錯誤的概率,可采用以下方法:①改變顯著水準后的兩兩比較法(Brunden法)前已述及,若將多個樣本兩兩構成四格表,用一般的四格表方法會增大Ⅰ型錯誤,那么,一種自然的想法就是能否將顯著水準適當降低,從而一方面相當于抵消Ⅰ型誤差的增加,一方面又可采用一般的四格表方法處理改變顯著性水準的方法正是基于這種思想。Brunden法系將檢驗水準α調整為αα’=α/2(K-1)()式中K為樣本數,然后用求得的各四格表的X2值與X2α值比較,從而作出推斷,也就是說,若取α=,K=6(則α’=),則不能用(1)=為界值,而要用(1)=為界值。此外,也可用各四X2檢驗對應的P值與α’比較而得出結論。②改變顯著界值的兩兩比較法:該法類似于上法,但考慮到了處理組數a,因而更合理,處理組數a是各組按率的大小排列后,欲比較的兩組間包括的組數,表列出了用蒙特卡洛模擬法求出K×2表分割為非獨立的四格表的顯著界值。有了此顯著界值后,只要用各四格表的X2值與相應的界值相比即可作出結論。5.檢驗的用途有哪些答:主要適用于計數資料,(1)兩個及兩個以上的率或構成比的比較(2)交叉分類資料兩屬性間的關聯性檢驗(3)頻數分布的擬合優度。6.以下表資料說明χ2檢驗的基本思想。(不用計算)答:基本思想:假設觀察值來自理論分布,則觀察值與理論值就不會差別太大,如果差距太大,則懷疑H0是否成立。完全符合則為0或特別小,x2值越小,越支持H0。7.四格表資料檢驗的條件有哪些答:T<1或n<40確切概率法n≥40但有1T<5要校正n≥40并且T>5不必校正8.某病的發病率對全國人口來說是%,現在某縣回顧一年,抽樣調查了120人,有16人發病,如果要考察該縣的發病率是否高于全國,請問可不可以對該份資料作檢驗,你認為應該用什么方法答:不能,用單樣本率比較的u檢驗。9.比較兩個獨立樣本頻率分布的χ2檢驗,和比較兩個配對樣本頻率分布的χ2檢驗在設計方法、資料整理、假設檢驗等方面的差別是什么答:前面針對的是“兩獨立樣本”,行合計是事先固定的;而后者實質上是一組樣本,及時可以看成兩個樣本,也是“兩個互不獨立的樣本”,樣本含量都是n,是固定的,而行合計與列合計卻是事先不確定的。前者原始數據可以表示為教材中表9-3所示的四格表形式,而后者原始數據表示為表9-9所示的四格表形式。檢驗統計量,前者用教材中公式9-5和公式9-7,而后者用9-9和9-10。10.如果實驗效應應用等級資料表示,欲比較兩組總體效應間差別是否有統計學意義,為什么不能用χ2檢驗請舉例說明。答:關鍵在于此時χ2檢驗差別有統計意義,只能推斷兩頻率分布不同,而頻率分布不同不能說明兩總體平均水平不同。為什么有些四格表(或RXC表)必須要計算確切概率答:因為只有在大樣本時檢驗統計量(那個公式)才近似地服從χ2分布;樣本量不夠大時,如果n>40,且T≧1尚可以校正;如果樣本量更小,χ2檢驗就不適用了,只能計算確切概率。12.行X列表資料做χ2檢驗的目的是什么答:=1\*GB3①行X列表資料卡方檢驗用于多個率或多個構成比的比較;=2\*GB3②行X列列聯表卡方檢驗用于檢驗雙向無序分類資料間有無關聯。配對χ2檢驗適用于什么情況為什么要做四格表的配對設計答:有時對樣本中各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類變量的計數結果。兩份樣本實際上是一樣的,不是相互獨立的,比較的樣本資料并非具有相互獨立的條件,不能直接用單純的行列表公式進行假設檢驗,此時配對卡方檢驗最為適用。用于檢驗兩種處理有無差別。四格表確切概率法檢驗的基本原理是什么答:在四格表周邊合計數固定不變的條件下,計算表內4個實際頻數變動時的各種組合之概率Pi,再按檢驗假設求得單側或雙側的累計概率P,依據所取得檢驗水準α作出推斷。卡方檢驗的應用條件有哪些答:=1\*GB3①隨機樣本數據;=2\*GB3②卡方檢驗的理論頻數不能太小。兩個獨立樣本比較可以分以下3種情況:=1\*GB3①所有的理論數T≥5并且總樣本量n≥40,用Pearson卡方進行檢驗。=2\*GB3②如果理論數T<5但T≥1,并且n≥40,用連續性校正的卡方進行檢驗。=3\*GB3③如果有理論數T<1或n<40,則用Fisher’s檢驗。上述是適用于四格表。R×C表卡方檢驗應用條件:=1\*GB3①R×C表中理論數小于5的格子不能超過1/5;=2\*GB3②不能有小于1的理論數。如果實驗中也不符合R×C表的卡方檢驗。可以通過增加樣本數、列合并來實現。四格表的u檢驗與卡方檢驗有何異同答:相同點:凡是能用u檢驗進行的兩個率比較檢驗的資料,都可用卡方檢驗,二者是等價的:u2=χ2。不同點:=1\*GB3①u檢驗可進行單側檢驗;=2\*GB3②滿足四格表u檢驗的資料,計算兩個率之差的可信區間,可從專業上判斷兩個率之差有無實際意義;=2\*GB3②χ2檢驗可用于2X2列聯表資料有無關聯的檢驗。(有待補充):基于秩次的非參數檢驗1.參數檢驗與非參數檢驗的區別何在各有何優缺點答:(1)參數檢驗與非參數檢驗的區別。1)參數檢驗:以已知分布(如正態分布)為假定條件,對總體參數進行估計或檢驗。2)非參數檢驗:不依賴總體分布的具體形式和檢驗分布(如位置)是否相同。(2)參數檢驗與非參數檢驗的優缺點。參數檢驗:優點是符合條件時,檢驗效率高;其缺點是對資料要求嚴格,如等級數據、非確定數據(>50mg)不能使用參數檢驗,而且要求資料的分布型已知和總體方差相等。非參數檢驗:優點是應用范圍廣、簡便、易掌握;缺點是若對符合參數檢驗條件的資料用非參數檢驗,則檢驗效率低于參數檢驗。如無效假設是正確的,非參數法與參數法一樣好,但如果無效假設是錯誤的,則非參數檢驗效果較差,如需檢驗出同樣大小的差異的差異往往需要較多的資料。另一點是非參數檢驗統計量是近似服從某一部分,檢驗的界值表也是有近似的(如配對秩和檢驗)因此其結果有一定近似性。2.非參數檢驗適用那些情況答:(1)等級順序資料。(2)偏態資料。當觀察資料呈偏態或極度偏態分布而有未經變量變換,或雖經變量變換但仍未達到正態或近似正態分布時,宜用非參數檢驗。(3)未知分布型資料(4)要比較的各組資料變異度相差較大,方差不齊,且不能變換達到齊性。(5)初步分析。有些醫學資料由于統計工作量過大,可采用非參數統計方法進行初步分析,挑選其中有意義者再進一步分析(包括參數統計內容)(6)對于一些特殊情況,如從幾個總體所獲得的數據,往往難以對其原有總體分布作出估計,在這種情況下可用非參數統計方法。3.為什么秩和檢驗的編秩在不同對比組間出現相同數據要給予“平均秩次”,而同一組的相同數據不必計算“平均秩次答:因為在不同對比組,不取平均秩次會加大或減小某一組的秩和;而在同一組內,出現相同數據不編平均秩次,該組秩和不受影響。4.兩樣本比較的秩和檢驗當n1>10,n2-n1>10時采用u檢驗,這時檢驗是屬于參數檢驗還是非參數檢驗,為什么答:兩組比較的秩和檢驗,當n大時,秩和分布近似正態分布,此時不必要再編制比n更大的T檢驗界值表,而利用秩和分布隨n增大漸近正態分布的性質,進行u檢驗,故仍屬于非參數檢。5.秩和檢驗有哪些優缺點答:其主要的優點:(1)適用范圍廣:①等級資料。②偏態資料。當觀察資料呈偏態或極度偏態分布而又未作變量交換,或雖經變量變換仍未達到正態或近似正態分布時,宜用非參數檢驗。③各組離散程度相差懸殊,即方差明顯不齊,且不能通過變量變換達到齊性。④個體數據偏離過大,或資料為單側或雙側沒有上限或下限。⑤分布類型不明。㈥初步分析。(有些醫學資料由于統計工作量大,可采用非參數檢驗統計方法進行初步分析,挑選其中有意義者再進一步分析。)⑦對于一些特殊情況,如從幾個總體所獲得的數據,往往難以對其原有總體分布做出估計,在這種情況下可用非參數統計方法。(2)方法簡便、易于理解和掌握。主要缺點:損失信息量,適用于參數檢驗條件的資料用非參數檢驗,檢驗效能降低。6.兩組或多組有序分類資料的比較,為什么宜用秩和檢驗而不是χ2檢驗答:指標為等級資料,宜用多組有序變量資料的秩和檢驗;若采用列聯表χ2檢驗進行分析,其比較的就不再是實驗效應,而是幾組資料的間的分布有無差別,即比較幾類資料構成比總體上有無不同,所以不能用χ2檢驗。7.兩獨立樣本比較的Wilcoxon秩和檢驗,當n1>10或n2—n1>10時用Z檢驗,這時檢驗是屬于參數檢驗還是非參數檢驗,為什么答:屬于非參數檢驗,因為這時的Z檢驗是比較例數較小組秩和與其總體均數n(N+1)/2的差別。8.請指出非參數檢驗與參數檢驗相比的優、缺點。答:非參數檢驗適用范圍廣,收集資料、統計分析也比較方便。但檢驗效率沒有參數檢驗高,犯第二類錯誤的概率較大。9.簡述參數檢驗與非參數檢驗的定義及兩者的區別。答:參數統計是總體的分布類型是已知的,對其中某些未知的參數進行估計和檢驗的統計方法。特點:依賴于特定的分布類型,比較的是參數。非參數統計是不依賴于總體分布具體形式的統計方法。特點:不受總體參數的影響,比較的是分布或分布位置,而不是參數。10.簡述配對比較秩和檢驗的編秩方法。答:求差值,差值編秩;差值0刪去,相同值取平均秩次。11.配對設計差值的符號秩和檢驗步驟。答:(1)H0:差值的總體中位數Md=0;H1:Md≠0;=(2)求差值(3)編秩:依差值的絕對值從小到大秩次。絕對值相等者,若符號不同取平均秩次;零差值不參與編秩,同時樣本數-1;將差值的正負標在秩次之前。(4)求秩和確定檢驗統計量:分別求正、負秩次之和,任取T+或T—作檢驗統計量T,(5)確定P值,作推斷結論。12.兩組比較的秩和檢驗的編秩方法。答:將兩樣本混合編秩次。若有“相同數據”,處于不同組,便取平均秩次;處于同一組,不必取平均秩次。13.對同一資料,又出自同一研究目的,用參數檢驗和非參檢驗結果不一致時,宜以何為準答:當資料滿足參數檢驗方法的條件時,應使用參數檢驗方法;當資料不滿足參數檢驗方法的條件時,必須采用非參數檢驗方法。14.非參數檢驗的適用范圍。答:①各種資料的初步分析;②等級資料:某種標志不便準確測定,只能以嚴重程度、優劣等級、成效大小、名次先后或綜合判斷等方式定出次序;③資料分布類型不能確定或偏態分布;④綜合分析同質性較差的資料,如不同地點、不同年份的某種實驗結果;⑤組內個別數據偏離過大,或各組內相差懸殊。第十、十一章:兩變量關聯性分析,簡單線性回歸(回歸與相關)1.應用直線回歸和相關分析時應注意那些問題答:(1)作回歸分析和相關分析時要有實際意義,不能把毫無關聯的兩種現象作回歸、相關分析,必須對兩種現象間的內在聯系有所認識。(2)在進行回歸和相關分析之前,應繪制散點圖。當觀察點的分布有直線趨勢時,才適宜作回歸、相關分析。如散點圖呈明顯曲線趨勢,應使之直線化再行分析。散點圖還能提示資料有無可疑異常點。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國開發區發展行業發展監測及投資戰略規劃研究報告
- 中國電動會標行業市場發展前景及發展趨勢與投資戰略研究報告(2024-2030)
- 文化傳媒企業報銷制度流程
- 2025年中國穩壓接頭閥行業市場發展前景及發展趨勢與投資戰略研究報告
- 2024-2030年中國果酒行業市場全景監測及投資前景展望報告
- 體育機構代理記賬財務管理制度范文
- 高中物理滬科版必修2學案第4章能量守恒與可持續發展4.2.2研究機械能守恒定律(二)實驗探究驗證機械能守恒定律
- 青霉-鏈格孢菌共代謝天然產物和結構衍生物抗帕金森病模型細胞氧化損傷研究
- 寧夏第三排水溝中磷的賦存形態與釋放特征研究
- 香菇多糖改善糖尿病心肌病的作用及其機制研究
- 北師大版七年級上冊數學27有理數的乘法課件(2課時)
- 安全生產標準化推進計劃 模板
- 2023年黑龍江省文化和旅游系統事業單位人員招聘筆試模擬試題及答案解析
- 2023年江西新余市數字產業投資發展有限公司招聘筆試題庫含答案解析
- LY/T 3323-2022草原生態修復技術規程
- 部編版六年級語文下冊課件第1課《北京的春節》《臘八粥》
- 涂裝工模擬練習題含答案
- 2023-2024學年河南省永城市小學數學二年級下冊期末評估測試題
- 乳腺疾病的超聲診斷 (超聲科)
- 服務精神:馬里奧特之路
- 《建筑施工安全檢查標準》JGJ59-2011圖解
評論
0/150
提交評論