




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第 1 章緒論案例辨析及參考答案案例 1- 1 某研究者的論文題目為 “大學生身心健康狀況及其影響因素研究”, 以某地職業技術學院理、工、文、醫學生(三年制)為研究對象,理、工、文、醫學生分別挑選了60、38、 19和 46人,以問卷方式調查每位學生的一般健康狀況、焦慮程度、抑郁程度等。得出的結論是: “大學生身心健康狀況不容樂觀,學業問題、就業壓力、身體狀況差、人際交往不良、社會支持不力為主要影響因素”。請問其結論合理嗎?為什么?應該如何?案例辨析 樣本不能代表總體??傮w是 “大學生”, 而樣本僅為某地三年制職業技術學院學生; 社會學調查的樣本含量顯得不足;“理、工、文、醫學生分別挑選”這種
2、說法中隱含人為“挑選”的意思,不符合統計學要求。正確做法應在論文的題目中明確調查的時間范圍和地點,還應給 “大學生”下一個明確的定義,以便確定此次調查的“總體”;對“大學生身心健康狀況”可能有影響的因素很多,應結合具體問題擬定出少數最可能有影響的因素(如學科、在學年限等)進行分層隨機抽樣, 以保證樣本有較好的代表性;還應根據已知條件找到估計樣本含量的計算公式,不可隨意確定各學科僅調查幾十人;當然,調查表中項目的設置也是十分重要的,此處從略。案例1-2兩種藥用于同一種病, A藥治療5例,4例好轉;B藥治療50例,36例好轉。結 論是:A藥優于B藥。請問其結論合理嗎?為什么?應該如何?案例辨析 A
3、藥樣本僅5例,樣本含量太少; 得出“A藥優于B藥”沒有交待是否 采用了統計學推斷方法,若用目測法得出結論,則結論沒有說服力;未明確研究目的和研究結果將被使用的范圍。正確做法 應明確研究目的和研究結果將被使用的范圍,若是個別研究者或臨床醫生想了解這兩種藥的大致療效,屬于小規模的臨床觀察,其結論僅供少數人在今后臨床實踐中參考,其樣本含量可能不需要很大,因為觀察指標是定性的(有效、無效),一般來說,每個藥物組也需要幾十例(以不少于20例為宜);若屬于新藥的H期臨床試驗,那就要嚴格按有關規定,比較準確地估計出所需要的樣本含量,不僅如此,還有很多嚴格的要求,詳見本書中臨床試驗設計一章;從明確定義的總體中
4、隨機抽樣進行實驗研究,得到的實驗結果不能僅憑數據大小作出判斷,應進行假設檢驗,以提高結論的可信度。案例 1-3 某研究者為了探討原發性高血壓患者腎小管早期損害的監控指標,選取尿常規、 蛋白定性檢查陰性,血肌酐、尿素氮均在正常范圍內的原發性高血壓患者74例作為病例組,其中男43例,女31 例,平均年齡61歲( 40 73歲)。根據高血壓的病程將患者分為三組,I組高血壓病期v 10年,n組高血壓病期10 20年,出組高血壓病期 20年。另選取53名體檢健康的職工為對照組。觀測兩組尿視黃醇結合蛋白(retinal binding protein, RBP )、微量白蛋白(microalbumin,
5、mALB) 、3 2 微球蛋白(3 2 microglobulin, 3 2皿6)和乙酰-3 -D-氨基葡萄糖甘酶(N-acetyl-3 -D-glucosaminidase, NAG)四項定量指標的取值。結論為:尿RBP mALB 2-MG口 NAG1原發性高血壓患者腎小球、腎小管早期損害的敏感指標。請辨析這樣設計實驗存在什么問題?正確的做法是什么?案例辨析研究對象的選取在病例組和對照組之間存在不均衡性,即兩組受試者之間,除了一組患有高血壓,另一組未患高血壓以外,在其他很多與評價高血壓可能導致壞影響的方面都不一致。對照組選取的是53 名體檢健康的職工,未明確寫出平均年齡以及年齡所在的范圍,也
6、未交代性別構成情況。但由我國現行的退休制度可知,在職職工的年齡通常在18 60 歲之間,平均年齡大約40 歲。由臨床醫學基本常識可知,很多因素(比如年齡、性別等)不僅對血壓有影響(通常是隨著年齡的增大,血壓有升高的趨勢),而且對腎功能也有一定程度的影響;況且,高血壓患者與健康職工還在“體力和腦力勞動強度、生活方式、心理和精神的緊張程度等諸多方面不具有可比性,而這些重要的非實驗因素可能對腎功能也存在不同程度的影響。 總之, 原研究者所選取的病例組與對照組在很多重要的非實驗因素方面(特別是年齡)不具有可比性,降低了結論的說服力。正確做法欲探討高血壓早期腎損害的監控指標,應根據高血壓患者病程所分的三
7、個組確定受試者的年齡段,從患者所取自的人群范圍內隨機選取一定數量的正常健康人(而不應僅局限在原研究者所在單位內),將正常健康人也分成相應的三個年齡段,并應盡可能確保在每個年齡段中,病例組與對照組受試者在其他重要非實驗因素方面(如性別構成、體力和腦力勞動強度、生活方式、心理和精神的緊張程度等)均衡一致,采用相應的統計分析方法去比較定量指標的測定結果之間的差別,其結論才具有較高的可信度。案例 1- 4 某部隊共有1 200 人,在某段時間內患某病的人數有120 人,其中男性114人, 女性 6 人。 某衛生員進行統計分析后說,經假設檢驗,該病的兩性發病率( 114/120=95%與 6/120=5
8、% )之間的差別有統計學意義,由此得出結論: “該病男性易得”。你對這個結論有何看法?若結論是錯誤的,那么,錯誤的實質是什么?正確的做法是什么?案例辨析這個結論是錯誤的!因為在這1 200 人中,究竟有多少男性和多少女性并不清楚,無法計算男性發病的頻率和女性發病的頻率。假如其中有1 194 名男性和6 名女性, 則男性發病率為(120/1 194) 100% = 10.05%,而女性全部發?。ㄅ钥偫龜堤?,不宜用百 分之百發病率來描述)。顯然,原來的結論是不成立的。該衛生員所犯錯誤的實質是將發病 人員中性別的頻率錯誤地當作人群中發病的頻率了,因而得出毫無根據的錯誤結論。正確做法 若這1 20
9、0人是從一個總體中抽出來的樣本,要弄清在這1 200人中男、女人數各是多少,設分別為n男和n女,然后,分別計算男性和女性的發病頻率,即1206口,一、,一一八 一印 100% , P 100% ;要想得出兩個發病頻率之間的差別是否能反映總 n男n女體的情況,還應進行統計推斷(即進行假設檢驗,此處從略)。第2章統計描述案例辨析及參考答案案例2-1 本章的例2-1中,該醫生同時還觀察了1 402名臨產母親的住院天數(教材表2-14),并得到平均住院天數為6.6天。請對此發表評論。教材表2-14 1 402名臨產母親生產期間的住院天數組段(1)組中值Xi(2)頻數(3)頻率fi(4)12795.63
10、3431622.545655939.877824317.33910896.351112574.071314231.641516191.36171890.64192010.07212220.14232420.14252630.21合計1 4021.00由加權法的計算公式(2-2)求出平均住院天數X 2 0.056 3 4 0.225 424 0.001 4 26 0.0021 6.6(天)案例辨析首先觀察資料的分布形式,由于呈正偏峰分布,選用上述結果描述住院天數的平均水平不合適。正確做法宜選用不受定量資料分布情況限制的中位數來描述住院天數的平均水平。本例計算結果為M =6.1 (天)。案例2-2
11、 某人編制了一張統計表(教材表2-15),你認為哪些需要改進?教材表2-15 19761979年吉林市各型惡性腫瘤的死亡率組疾015355575胃 癌無1.13/10 萬19.92/10 萬150/10 萬313.44/10 萬食管癌無0.1/10 萬2.18/10 萬35.20/10 萬73.56/10 萬癌0.34/10 萬1.64/10 萬25.30/10 萬97.51/10 萬134.33/10 萬肺癌無0.41/10 萬20.21/10 萬125.10/10 萬137.53/10 萬案例辨析 原表格存在的問題:標題不準確;線條過多,出現了斜線、 豎線和多余的橫線;數字區域出現了文字;
12、小數位數不統一,小數點沒有縱向對齊;量綱的標注位置有誤。正確做法 將原統計表中存在的上述錯誤糾正過來,修改后的統計表見案例表2-1。案例表2- 1 1976-1979年吉林市各年齡組人群部分惡性腫瘤死亡情況調查結果各年齡組死亡率(1/10萬)疾病 015355575胃 癌0.001.1319.92150.00313.44食管癌0.000.102.1835.2073.56肝癌0.341.6425.3097.51134.33肺癌0.000.4120.21125.10137.53案例2-3教材圖2- 11 1952年與1972年某地肺結核、心臟病和惡性腫瘤的死亡率案例辨析 原圖形存在的問題:缺標題;
13、復式條圖誤用為單式條圖;縱軸的量綱未注明;未正確給出圖例。正確做法 將原圖中存在的上述錯誤糾正過來,重新繪圖(案例圖2-1)。死因案例圖2-1 某地三種疾病死亡率在 1952與1972年間的變化案例2-4 以病死率為考察指標,對兩所醫院某病的治療水平進行比較,結果見教材表 2-16,由合計的病死率得出結論為乙醫院治療水平優于甲醫院,請評述這個結論。教材表2- 16 2000年兩所醫院某病的病死率比較病情嚴重程度出院人數病夕匕數病死率/ %出院人數病夕匕數病死率/ %輕10088.06506510.0中3003612.02504016.0重6009015.01001818.0合計1 000134
14、13.41 00012312.3案例辨析由教材表2-16可以看出,此表編制得不夠規范,更為嚴重的是,雖然甲醫院各種病情患者的病死率均低于乙醫院,但總的病死率卻是甲醫院高于乙醫院。這個矛盾的出現,是由于甲醫院收治的重病人多,輕病人少,乙醫院則是重病人少,輕病人多。兩家醫院收治患者的病情不均衡,不宜直接比較基于各自病情狀況的病死率“粗病死率”正確做法 因各醫院收治的患者在病情方面不均衡,直接進行比較是不正確的,而是要進行標準化處理后再比較。標準化( standardization)有直接標準化法和間接標準化法兩種。(1)直接標準化 首先確定一個標準組,將其病情分布視作標準分布,即兩家醫院理論上共同
15、的病情分布狀況。例如,某省內兩家醫院的對比,可以將全省、全國該類型患者入院時的病情分布作為標準組。這里,將兩家醫院各種程度病情的患者數對應相加,“構造”出標準組,這是在不能獲得參考文獻關于全省、全國情況時的做法。直接標準化計算過程見案例表2-2。PiNi X pi重程度數Ni甲醫院乙醫院甲醫院乙醫院輕7508.010.06075中55012.016.06688重70015.018.0105126合計2 00013.412.3231289案例表2-2用直接標準化法對 2000年兩所醫院某病的病死率作比較甲醫院的標準化病死率:依照標準組的病情分布預期死亡數之和標準組的總人數231100% 11.5
16、5%2 000乙醫院的標準化病死率:依照標準組的病情分布預期死亡數之和p乙標準組的總人數289100% 14.45%2 000經標準化,甲醫院的標準化病死率低于乙醫院,正確反映了兩組病死率水平的對比關 系。以甲醫院的計算為例,粗病死率密是以甲醫院實際病情分布為權重,對甲醫院病死率水平的加權平均; 標準化的p甲則是以標準組病情分布為權重,對甲醫院病死率水平的加權平均。即100 8% 300 12% 600 15%1001 0001 0008%30012%1 000600 z15%1 00013.4%750 8% 550 12% 700 15%20007502 0008%黑12%箴15%11.55
17、%當進行對比的兩組率為樣本率時,下結論前需做假設檢驗,這里略去。(2)間接標準化 也需首先確定一個標準組(由文獻獲得),并給定標準組的各年齡別病死率及總的病死率。由案例表2-3求出兩家醫院各自收治的患者按標準組的病死率水平將 發生的總的死亡數。標準組的選擇依據同直接標準化法。案例表2- 3用間接標準化法對 2000年兩所醫院某病的病死率作比較病情嚴標準組出院人數預期病死率數Ni x pi重程度病死率Pi甲醫院乙醫院甲醫院乙醫院輕9.01006509.058.5中14.030025042.035.0重16.060010096.016.0合計13.51 0001 000147.0109.5按標準組
18、的病死率水平,甲醫院有 147例死亡,而實際甲醫院僅有134例死亡,甲醫院實際的病死發生程度低于標準組,兩者程度之比134/147=0.91稱作標化死亡比(standardmortality ratio , SMR),于是p 甲SMR 甲 13.5% 12.31%同理,p乙SMR乙 13.5% (123/109.5) 13.5% 1.12 13.5% 15.16% o結果,認為乙醫院的病死率高于甲醫院。這是根據數值大小得出的直觀判斷結果。若希望得出兩醫院標準化病死率之間的差別是否具有統計學意義,應進行假設檢驗,此處從略。本題目是以“病死率”為例闡述了陽性率的標準化的問題,其余如死亡率、發病率、
19、治愈率等同理。第3章概率分布案例辨析及參考答案案例3-1為估計某地居民尿汞值的參考值范圍,測得某地200名正常成人的尿汞值如教材表3-6。教材表3-6 某地200名正常成人的尿汞值/然g L 1尿汞值04812162024283236 404448例數45304120151213546342試根據該樣本資料估計1地居民尿汞值的95%正常值范圍。卜面給出了多種解法,請辨析正誤并講出道理。若有正確的,請指出來;若沒有正確的,請一定要補充上。解法一:計算得該樣本資料的均數X 13.78 ( L 1),標準差S 11.71 ( Lg L 1),于是估計該地居民尿汞值的 95%正常值范圍為(X 1.96
20、S, X 1.96S)=( 9.17,36.73) g L 1 o解法二:估計該地居民尿汞值的95%正常值范圍為(X 0.95S, X 0.95S) = (2.66, 24.90)解法三:估計該地居民尿汞值的95%正常值范圍為(X1.64S, X 1.64S) = ( 5.42,32.98)解法四:估計該地居民尿汞值的95%正常值范圍為(0,1.64S) = (0, 32.98) ( m L解法五:估計該地居民尿汞值的95%正常值范圍為(0,1.96S) = (0, 36.73) ( m L解法六:估計該地居民尿汞值的95%正常值范圍為(0,0.95S) = (0, 24.90) ( m L解
21、法七:估計該地居民尿汞值的95%正常值范圍為(X._ 、/_ 11.64S, X ) = ( 5.42,13.78)( L 1)o解法八:估計該地居民尿汞值的95%正常值范圍為(X11.96S, X )=( 9.17,13.78)(L 1)o解法九:估計該地居民尿汞值的95%正常值范圍為(X1 1、0.95S , X ) = (2.66, 13.78) ( p g L 1 )。案例辨析以上所有解法均是錯誤的。本案例解法一至解法九均利用正態分布法估計正常值范圍,但卻忽略了對該資料的正態性判斷或檢驗。正確做法嚴格的正態性檢驗常用的方法有Z檢驗(通常稱為矩法)、W檢驗、D檢驗等,需要借助統計軟件完成
22、。在這里我們用粗略判斷的方法:作出頻率分布圖看是否對稱,如果對稱可初步判斷為正態分布,否則判為非正態。該例頻率分布明顯不對稱(案 例圖3-1)。048 7 &2) 242 娶 李 40 4 8尿汞值(四g/L)度密率頻案例圖3-1表3-6資料的頻率分布由此圖可粗略判斷尿汞值這個指標不服從正態分布(經對數變換后頻率分布仍不對 稱),所以不能用正態分布法估計正常值范圍,而應用適合描述偏態分布的百分位數法, 計算P95 38 ,故估計該地居民尿汞值的 95%正常值范圍不高于 38 (然g L 1 )。在本例中,如果該地居民尿汞值呈正態分布,則上述解法四計算公式是正確的,因為汞是對人身體有害的微量元素
23、,越少越好,又不可能取負值,下限應該為0,只需求出單側上限即可。案例3-2某地區10萬人口中出現了 20例流行性腮腺炎病例,有人希望據此推斷該地區10萬人口中不少于20人患流行性腮腺炎的概率。 于是,有幾位愛動腦筋的學生給出了自 己的解法。請辨析他們的解法之正誤,并講出道理。解法一:P(X20)P(X 20)200(e0!0201 1e1!202 2 e2!201919!20 2020(0) 10.5 0.5解法P(X 20) 1 P( 20)00100 0001199 9991 (C100000 0.000 2 0.9998 C100000 0.000 2 0.999 8C100000 0.
24、000 2 19 0.9998 99981) 0.529 75解法三:P(X 20)202020e20!212021e21!100 00020100 000e 0.529 74100 000!解法四:P(X 20)Cw0 000 0.000 2 20 0.9998 99980 C200000 0.000 2 21 0.9998 99979_ 100 000100 000C100000 0.000 2) 0.529 75案例辨析上述解法均是錯誤的。解法一將發生流行性腮腺炎的人數看作是服從n 20的Poisson分布,并近似服從正態分布,來計算相應的概率。 但本例各觀察單位是否患病不是互相獨立的,
25、不滿足Poisson分布的應用條件,所以不能按照Poisson分布模型處理。解法二按照二項分布計算概率,同樣因為各觀察單位是否患病非獨立,不滿足二項分布的應用條件。解法三也是按照Poisson分布計算概率,因為模型選擇的錯誤,所以導致結果錯誤,同樣可分析解法四。正確做法就本例而言,因患這種病是有傳染性的,即不滿足獨立性條件,沒有合適的 統計計算方法;若滿足獨立性,則以上四種計算方法均正確。在解法一中,因20,將Poisson分布用正態分布來近似, 近似程度較差,故計算出來的概率與直接按 Poisson分布或 二項分布計算的結果有較大出入。第4章參數估計案例辨析及參考答案案例4-1某研究者測得某
26、地120名正常成人尿鉛含量(mg L-1)如下:尿鉛含量04812162024283236 例數1422291815106321120試據此資料估計正常成人平均尿鉛含量的置信區間及正常成人尿鉛含量的參考值范圍。由表中數據得到該例的 n 120, S 8.0031, SX0.730 6 ,某作者將這些數據代入公式(4-20),即采用X z SX計算得到正常成人平均尿鉛含量100(1) %置信區間為(,14.068 4);采用公式X Z S計算得到正常成人尿鉛含量100(1) %參考值范圍為(,26.030 6)。請問這樣做是否合適?為什么?應當怎么做?案例辨析 該定量資料呈偏峰分布,不適合用正態
27、分布法計算100(1)%參考值范圍。正確做法 可以用百分位數法求正常成人尿鉛含量100(1) %參考值范圍的單側上限。例如,當 =0.05時,可直接求P95分位數,(0, P95)就是所求的正常成人尿鉛含量的95%正常值范圍。欲求正常成人尿鉛含量總體均數白置信區間,當樣本含量n較大(比如說,n大于30或50)時,樣本均數就較好地接近正態分布 (根據數理統計上的中心極限定理) 。本例,因 為n 120較大,不必對原始數據作對數變換就可以用 X Z SX估計總體均數的置信區間。案例4-2在BiPAP呼吸機治療慢性阻塞性肺病的療效研究中,某論文作者為了描述試驗前的某些因素是否均衡, 在教材表4-5中
28、列出了試驗前患者血氣分析結果。由于作者覺得自己數據的標準差較大,幾乎和均數一樣大,將標準差放在文中顯得不雅觀,于是他采用“均數土標準誤 (X Sx),而不是“均數土標準差”(X S)來對數據進行描述。問在研究論文中以教材表 4-5方式報告結果正確嗎?為什么?教材表4- 5試驗組和對照組治療前血氣分析結果(XSX )例數/PHPa(CO2)/kPapa (O2)/kPaSa(O2)/%試驗組1263.004.337.360.0563.004.339.25 0.5585.121.73對照組1062.503.957.380.0663.004.339.16 0.6286.452.25案例辨析描述數據的
29、基本特征不能采用X Sx ,因為SX為反映抽樣誤差大小的指標,只表示樣本均數的可靠性,而不能反映個體的離散程度。不僅如此,因SX僅為與其對應的s的1/Jn,有時,即使s很大(甚至大于 X),用sx表示離散度時,不易被察覺出來,因此,用 X Sx表達定量資料時,往往具有欺騙性。正確做法當各組定量資料服從或近似服從正態分布時,反映個體的離散程度應該采用標準差,即描述數據的基本特征必須采用X S;否則,需要采用M (Q1 Q3)描述數據的基本特征。此處,M為中位數、Q1和Q3分別為第1四分位數和第3四分位數。案例4-3 某市往年的12歲男孩平均身高為140.0 cm,現在從該市的12歲男孩中隨機抽得
30、120名作為研究對象,得到平均身高為143.1 cm,標準差為6.3 cm。請估計該樣本對應總體均數的95%置信區間,并確定該均數是否與往年不同。某學生的回答如下:“該例12歲男孩平均身高的點估計值為143.1 cm,按公式(4-21)計算得到該點估計值的95%置信區間為141.9144.2 cm。因為往年12歲男孩平均身高為140.0 cm ,沒有落在所計算的95置信區間以內,所以可以認為現有男孩平均身高與往年身高有差異”。請指出學生回答中的不恰當之處。案例辨析 不恰當之處有三:“點估計值的95%置信區間”的說法不對;“以往男孩平均身高沒有落在所計算的95%置信區間以內”的說法不對;“現有男
31、孩平均身高與往年身高有差異”的說法不對。正確做法 應該說“點估計值對應總體均數的95%置信區間”;應該說“95%置信區間沒有覆蓋(包括)以往男孩平均身高”; 應該說 “現有男孩平均身高與往年男孩平均身高的差異有統計學意義”。第 5 章 假設檢驗 案例辨析及參考答案案例 5- 1 為了比較一種新藥與常規藥治療高血壓的療效,以血壓下降值為療效指標,有人作了單組設計定量資料均數比較的t 檢驗,隨機抽取25 名患者服用了新藥,以常規藥的療效均值為0,進彳ft檢驗,無效假設是0,對立假設是0,檢驗水平”=1%。結果t值很大,拒絕了無效假設?!熬芙^了無效假設”意味著什么?下面的說法你認為對嗎?( 1)你絕
32、對否定了總體均數相等的無效假設。( 2)你得到了無效假設為真的概率是1%。( 3)你絕對證明了總體均數不等的備擇假設。( 4)你能夠推論備擇假設為真的概率是99%。( 5)如果你決定拒絕無效假設,你知道你將犯錯誤的概率是1%。( 6)你得到了一個可靠的發現,假定重復這個實驗許多次,你將有99%的機會得到具有統計學意義的結果。提示:就類似的問題,Haller 和 Kruss( 2002)在德國的6 個心理系問了30 位統計學老師、 44 位統計學學生和39 位心理學家。結果所有的統計學學生、35 位心理學家和24 位統計學老師認為其中至少有一條是正確的;10 位統計學老師、13 位心理學家和26
33、 位統計學學生認為第4 題是正確的。(見 Statistical Science, 2005, 20(3) : 223-230. )案例辨析6 個選擇均不正確。(1)可能犯I類錯誤。(2) a= 1%是表示在無效假設成立的條件下,犯I類錯誤的概率。(3)可能犯I類錯誤。(4) a= 1%是表示在無效假設成立的條件下,犯I類錯誤的概率,而不是推論備擇假設為真的概率是99%。( 5)在無效假設成立的條件下,就該例拒絕無效假設犯錯誤的概率是P 。( 6) 在無效假設成立的條件下,還可能犯錯誤,并不是完全 “可靠” 的發現; 1-=99%是指無效假設成立的條件下不犯錯誤的概率是99%。正確做法 “拒絕
34、了無效假設”意味著在無效假設成立的條件下,推斷犯錯誤的概率為P。案例 5-2 某工廠生產的某醫療器械的合格率多年來一直是80.0。 最近從該廠一次抽取 20 個該器械檢測,合格 13 個, 計算得到合格率為65.0;一周后又抽取15 個器械檢測,合格10個,計算得到合格率為 66.7%,分別進行Z檢驗,得到兩總體率相等的結論,表明合格率沒下降,兩個合格率的平均值為65.85%,進行Z檢驗,得到兩總體率不等的結論,表明合格率下降了。請對這一結論發表你的意見。案例辨析不正確,因為分別用n =20 和 n =15 的兩個小樣本計算的樣本頻率與總體概率80.0%比較,進行兩次 Z檢驗,樣本量太小,檢驗
35、功效太小,不能得到總體概率不等的結論。正確做法加大樣本量,對樣本頻率所代表的總體概率與已知總體概率80.0進行假設檢驗,具體方法從略。(樣本量的估計見本書第15 章樣本含量估計)第 6 章 兩樣本定量資料的比較案例辨析及參考答案案例 6- 1 為研究直腸癌患者手術前后血清CEA 含量有無差異,作者收集了以下資料:術 前( 24 例) : 31.5 30.0 28.6 39.7 45.2 20.3 37.3 24.0 36.2 20.5 23.1 29.033.1 35.2 28.9 26.4 25.9 23.8 30.4 31.6 27.9 33.0 34.0 32.7術后(12 例):2.0
36、3.22.33.11.92.21.51.83.23.02.82.1(1)有人采用了兩獨立樣本的 t檢驗,結果t=15.92, =34, P 0.05。從而得出結論: 手術前后血清CEA含量有差異,術前 CEA含量高于術后。(2)也有人覺得上述分析方法不對,應該采用兩獨立樣本的秩和檢驗,結果為:Z 4.83, P0.05。(3)還有人認為應該采用校正t檢驗,Z果:t =22.51, P28的肥胖患者隨機分成兩組, 每組10人,測得他們服藥前及服藥2個月后體重的變化(教材表6-10)。試評價:A、B兩種藥物對肥胖患者是否有效。A、B兩種藥物的療效有無差別。教材表6-10兩組肥胖患者服藥前后體重變化
37、/kg藥物12345678910A服藥前75.661.267.877.273.265.480.074.482.668.6服藥后73.060.263.672.074.660.869.477.479.663.4B 服藥前 69.489.966.863.470.086.690.474.867.484.4服藥后 60.895.561.662.069.478.071.076.658.275.4(1)假設數據服從正態分布,且總體方差齊,在評價 A、B兩種藥物對肥胖患者是否有 效時,作者對A、B兩組患者分別采用了獨立樣本的t檢驗,果:A組患者服藥前后比較t =1.040, P=0.312; B組患者服藥前后
38、比較t =1.125, P=0.275。從而得出結論,兩種藥物均無效。(2)有人認為這種方法不太好,他采用獨立樣本的t檢驗,首先比較服藥前兩組基線水平,結果t=1.533, P=0.160,表明差異沒有統計學意義,兩組有可比性。進而,比較 治療后兩組體重的差異,結果t=0.346, P=0.734 ,從而得出結論:A、B兩種藥物的療效差異無統計學意義。請對以上兩種作法發表你的看法。案例辨析(1)誤用獨立樣本的t檢驗取代配對設方t定量資料的t檢驗。(2)本案例中采用獨立樣本的t檢驗單純比較兩組治療后體重有無差異去推斷兩種藥物的療效差別是不正確的。因為兩組肥胖患者治療前體重可能不同,缺乏組間可比性
39、。因為未充分發揮兩組患者服藥前的信息,使結論的可信度降低。正確做法(1)欲評價A、B兩種藥物對肥胖患者是否有效,應分別對A、B兩組患者服藥前后體重進彳T配對t檢驗,求得t值后與界值t(0.05,9)進行比較,從而得出藥物治療前后體重變化 有無差異的推斷。另外,即使在進行配對t檢驗時獲得了一個較小的P值,拒絕了 H。,下結論也一定要慎重。差異有統計學意義并不能說明藥物就有效,藥物是否有效以及療效的好壞一方面要結合專業知識方可得出結論,另一方面服藥前后肥胖患者的飲食習慣、運動情況等因素對體重都會有影響。因此,對同一個體處理前后某項指標進行比較,一定要保證非處理因素在處理前后保持不變,否則難以得出正
40、確的結論。(2)欲評價A、B兩種藥物的療效有無差別,應分別計算出各組治療前后體重的差值,然后作完全隨機設計兩樣本比較的t檢驗,因為A、B兩組樣本是從同一總體中隨機抽取的,肥胖病沒有傳染性,兩組受試者間是相互獨立的,由題中條件可知,定量資料滿足正態性和方差齊性的前提條件??傊绻謩e評價 A、B兩種藥物是否有效,可以首先按照自身對照設計資料,考 慮采用配對t檢驗并結合專業與實際進行推斷。另外,可以同時設定一個平行對照幫助推斷。如果欲評價A、B兩種藥物的療效有無差別,可以采用以下兩種方法之一:分別計算出各組治療前后體重的差值,然后作完全隨機設計兩樣本比較的t檢驗;以治療前兩組體重數據作為協變量
41、的值,采用多重回歸扣除治療前體重的影響(參見本書第11章)。案例6-3為研究長跑運動對增強普通高校學生的心功能的效果,某學校隨機抽取15名男生,進行5個月的長跑鍛煉,5個月前后測得的晨脈數據如教材表6-11所示,問長跑鍛煉前后的平均晨脈次數有無不同?教材表6-11某校15名學生5個月長跑鍛煉前后的晨脈次數 /(次min-1)學生號123456789101112131415鍛煉前707656636356586067657566565972鍛煉后485460644855544550485648624950作者認為該研究屬于配對設計的定量資料,通過對差值進行正態性檢驗,發現差值不是來自正態總體(W檢
42、驗:P=0.041),所以用配對資料的符號秩和檢驗,結果為T=10,查T界值表,得雙側P0.05。因此認為長跑后的平均晨脈次數低于長跑前的平均晨脈次數。你認為上述分析是否合適?請說明理由。案例辨析“同一受試對象處理前后的比較” 嚴格地說不是合格的配對設計, 因為處理 前的個體接受的是空白處理, 而處理后的同一個體接受的是 “處理(長跑)+時間(5個月)”, 因此,即便長跑前后的晨脈次數有差別, 也不能就判斷是長跑的作用, 因為有5個月的時間 效應混雜在其中。正確做法處理此類問題的最好辦法是加一個平行對照,使“時間效應”在兩組比較時互相抵消,從而可以更真實地揭示“長跑與否”產生的效應之間的差別有
43、無統計學意義。第7章 多組定量資料的比較案例辨析及參考答案案例7-1某醫院婦產科測定幾種卵巢功能異常患者血清中促黃體素的含量(U/L),結果如下:卵巢發育不良42.50 38.31 35.76 33.60 31.38丘腦性閉經6.71 3.32 4.59 1.67 10.51 2.96 11.82 3.86?8.26 2.63 2.20垂體性閉經4.50 2.75 11.14 5.98 1.90 5.43 11.05 22.03研究者運用t檢驗進行兩兩比較,共比較了 3次。結論是卵巢發育不良者血清中促黃體素的含量高于丘腦性閉經和垂體性閉經者。這樣做是否妥當?為什么?正確的做法是什么?案例辨析原
44、作者用3次t檢驗處理此定量資料是不妥當的,因為這樣做割裂了原先的整體設計,對資料的利用率較低,對誤差的估計不夠合理,檢驗統計量的自由度較小,結論的可信度降低。正確做法這是從三個子總體內完全隨機抽取受試對象的單因素3水平設計定量資料的假設檢驗問題,應選用與此設計對應的統計分析方法。若定量資料滿足參數檢驗的三個前提條件(即獨立性、正態性和方差齊性) ,應選用單因素 3水平設計定量資料方差分析;若 定量資料不滿足參數檢驗的三個前提條件,可選用Kruskal-Wallis秩和檢驗。假定3組定量資料滿足獨立性要求,對3組定量資料用 W檢驗分別進行正態性檢驗,得:卵巢發育不良組為 W =0.979, P
45、=0.930;丘腦性閉經組為 W =0.874, P =0.087 ;垂體 性閉經組為 W =0.844 , P =0.083。因3組正態性檢驗結果均有 P 0.05 ,說明3組定量資 料滿足正態性要求。再對3組定量資料進行方差齊性檢驗(采用 Levene檢驗),得:F =1.416, P =0.265。 說明3組定量資料滿足方差齊性的要求。因該定量資料滿足方差分析的前提條件,故建議采用單因素3水平設計定量資料方差分析處理。經方差分析, F =74.64, Pv 0.001;進而經Bonferroni檢驗,卵巢發育不良組高于丘腦性閉經組(P 0.001 ),卵巢發育不良組高于垂體性閉經組 (P
46、 0.001 ),而丘腦性 閉經組與垂體性閉經組之間的差異無統計學意義(P = 0.234);雖然結論與原作者的相同 (巧合),但原作者的處理過程不妥。案例7-2 某研究人員將15只小白鼠隨機分為 3組,比較小白鼠接種3種不同的細菌 后存活的天數是否有差別,實驗數據如下:A細菌24579B 細菌457812C 細菌89101723該研究者對數據進行了方差分析(教材表7-10),進而經LSD檢驗,Cffl菌與A細菌、C細菌與B細菌之間均有統計學差異,而B細菌與C細菌之間無統計學差異。A細菌教材表7-10小白鼠接種3種不同的細菌后存活的天數細菌類別例數 X S F值P值5.402.70B細菌57.
47、203.114.530.034C細菌513.406.43請問該研究者所作統計處理是否合理?為什么?正確的做法是什么?案例辨析進行方差分析,首先要進行方差齊性及各樣本的正態性檢驗。從3組生存天數的方差看,A細菌為7.29, B細菌為9.67, C細菌為41.34。大小方差比近5倍之多,可 能方差不齊。通過 Levene檢驗,F =4.14, P= 0.043,方差不齊,因此,直接進行方差分析 不妥當。正確做法通過平方根數據變換使其盡可能接近方差分析的前提條件。通過 Levene檢 驗,F =1.15, P = 0.348,方差齊;經過正態性檢驗,A細菌組 W=0.989, P =0.976 ;
48、B細菌組 W =0.968, P =0.860; C細菌組 W =0.875 , P =0.286。即3組正態性檢驗結果均有 P 0.10 ,說明3組定量資料經平方根變換后滿足正態性要求。因此,平方根數據變換后滿足了方差分析的前提條件,可進行方差分析。經方差分析,F =4.96, P=0.027,即小白鼠接種3種不同的細菌后存活的天數有差別。進一步用LSD法進行多重比較,C細菌與A細菌、C細菌與B細菌之間均有統計學差異,而B細菌與C細菌之間無統計學差異。另外,亦可通過非參數檢驗(如 Kruskal-Wallis秩和檢驗)進行分析。案例7-3 某地用三種藥物殺滅釘螺,每次用 200只活釘螺,用藥
49、后清點每批釘螺的死 亡率()如下:甲46.539.540.532.549.530.0乙36.029.020.522.516.526.0丙24.08.59.26.5研究者直接對數據進行了方差分析,得F =17.06, P0.001 ;進而經Bonferroni檢驗,這三種藥物的效果為兩兩間均有差別(P 0.05)。請問該研究者所做統計處理是否合理?為什么?正確的做法是什么?案例辨析 多組比較,但數據都是0和1之間的百分比,例如,某種細胞或成分的百分比、發病率、感染率等服從二項分布的資料,直接作方差分析是不妥當的,因為此類資料不服從正態分布。正確做法這類情形應當作了反正弦變換后作方差分析。該資料經
50、反正弦變換為甲42.9938.9439.5234.7644.7133.21乙36.8732.5826.9228.3223.9730.66丙29.3316.9517.6614.77經SPSS運算,結果F =17.719 , P 0.001 ;進而經Bonferroni檢驗,這三種藥物的效果兩兩間差別均有統計學意義(PV0.05),即甲藥殺滅釘螺效果好于乙藥與丙藥,而乙藥好于丙藥。另外,該案 例資料 也可直 接用非參 數檢3敘Kruskal-Wallis 檢驗進行分析。通過一 .2Kruskal-Wallis檢驗, 10.99, P =0.004 ,故可認為二種藥物殺火釘螺時,釘螺的死亡率總體分布不同或不全相同。進一步進行兩兩比較,檢驗水準=0.05/3=0.017, Z0.0172.12(案例表7-1)。案例表7-1三種藥物殺滅汀螺時釘螺死亡率兩兩比較對比組RiRj|Ri RzJjP(1)(2)(3)(4)(5)甲與乙5.842.752.120.017甲與內
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年1月鐵路橋隧工三級(城軌)模擬題含答案
- 胎兒護理智能學習分析系統試卷
- 胎兒護理信息交流與協作試卷
- 第3課時 認識立體圖形(3) 教案 2025人教版數學一年級上冊
- 勘探工鉆頭選型與使用考試試卷
- 建筑公司勞保用品發放與使用管理制度
- 航空維修工程管理課件
- 勘探工地質市場行情考試試卷
- 2024云南藝術學院文華學院輔導員招聘筆試真題
- 2024華北理工大學輔導員招聘筆試真題
- 全同態加密算法概述
- 【酒店管理系統的設計與開發(論文)】
- 電流、電壓指針儀表校驗報告
- 六年級下冊英語素材-Unit-6-General-revision-3-知識點-人教精通版
- 2023年云南玉溪市直事業單位選調45人筆試備考試題及答案解析
- BS2000標準操作規程
- 中等職業學校英語課程標準(2020年版)(word精排版)
- 毛絨玩具驗貨報告 格式
- 小學學校教務處年終工作總結以及計劃PPT模板下載
- GB/T 20319-2017風力發電機組驗收規范
- GB/T 18391.4-2009信息技術元數據注冊系統(MDR)第4部分:數據定義的形成
評論
0/150
提交評論