




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、上海交通大學網絡教育學院醫學院分院醫學統計學課程練習冊第一章緒論一、單選題1 .小概率事件是指P()B.P<0.052 .從一個數值變量資料的總體中抽樣,產生抽樣誤差的原因是A總體中個體值存在差別3 .調查中國放射科醫生接觸射線情況,全國放射科醫生的全部組成為A.研究總體4 .若以舒張壓90mmHg、收縮壓130 mmHg為高血壓陽性臨界點,調查 3000人 中有300名血壓超過臨界值,這份資料屬于:B.分類資料5 .下列屬于統計量的指標是C樣本標準差6 .調查某地區高血壓的患病情況,抽樣調查了2000名居民,得到了 2000對舒張壓與收縮壓的數據,請問此資料是:C定量資料7 .下列屬于
2、參數的指標是D總體標準差8 .用樣本做統計推斷,樣本應是 B.總體中有代表性一部分9 .統計推斷的內容為D. A和B均是10 .隨機調查社區2000人,得到平均體重為60公斤,則該資料屬于A.計量資料二、名詞解釋1 .抽樣誤差:由于總體中各觀察單位間存在個體變異,抽樣研究中抽取的樣本,只包含總體的一部分觀察單位,因而樣本指標不一定恰好等于相應的總體指標。樣本指標與總體指標的差異稱為抽樣誤差。2 .總體:根據研究目的性質相同的觀察單位的全體。3 .分類變量:用定性方法測得,表現為互不相容的類別或屬性,如性別等。4 .數值變量:用定量方法測量得到,表現為數值大小,一般有計量單位,如身高、體重。三、
3、問答題1 .什么叫計量資料,它的統計分析方法有哪些(包括統計描述和統計推斷)?在科研中,用測量方法獲得數據,對各觀察單位用定量方法測定某項指標量的大小,這類資料一般有度量衡單位。計量資料的統計分析包括統計描述和統計推斷:統計描述主要是統計圖表、集中趨勢和離散趨勢的描述,集中趨勢中可以計算算術均數、 幾何均數、 中位數和眾數,離散趨勢可以計算極差、標準差、方差和變異系數。統計推斷包括點估計、區間估計和假設檢驗。常用的假設檢驗方法包括: t 檢驗、 u 檢驗、方差分析( F 檢驗)和秩和檢驗。2 .舉例說明總體與樣本的關系。總體是根據研究目的確定的同質的所有觀察單位某項觀察值(變量值)的集合。例如
4、研究某地 2002 年正常成人白細胞數, 觀察對象是該地2002 年全部正常成人, 觀察單位是每個人,觀察值是每人測得的白細胞數,則該地2002 年全部正常成人的白細胞數就構成了一個總體;從總體中隨機抽取部分觀察單位其某項指標的實測值組成樣本。從上述的某地2002年正常成人中隨機抽取150 人, 這 150 正常成人的白細胞數就是樣本。 抽取樣本的目的是用樣本的信息推論總體特征。第二章 定量數據的統計描述一、單選題1. 若資料為偏態分布,最好計算下列哪個指標來衡量集中程度D 中位數2. 若資料為正態分布, 最好計算下列哪個指標來衡量集中程度B 算術均數3. 對數正態分布資料計算集中趨勢應該用
5、A 幾何均數4. 抗體滴度資料通常使用哪個集中趨勢指標B 幾何均數5. 平均數指標體系中不包括A 全距6. 抽樣調查了 10 名居民體重資料,請問平均體重該用哪個指標計算C 算術均數7. 樣本標準差的的取值情況是A 大于或等于零8. 若資料為正態分布,最好計算下列哪個指標來衡量離散程度C 標準差9. 若資料為偏態分布,最好計算下列哪個指標來衡量離散程度()B 四分位間距10. 若資料末端沒有截尾值,最好計算下列哪個指標來衡量離散程度( )D 四分位間距11. 一組資料的例數等于25,方差等于16,標準差等于A 412. 一組資料的標準差等于 5,變異系數等于10%,樣本均數等于B 5013.
6、標準差與算術均數的使用條件()B 相同14. 比較兩組正態分布數據離散度大小的指標,如果單位不同該用()B變異系數15可以反映個體離散程度的指標不包括()C標準誤16 .仃表小()A總體方差17 . 一組資料的例數等于25,均數為20,標準差等于5,則方差等于()B 2518 .四分位間距的使用條件與哪個指標是一致的A 中位數19 .四分位間距是指D P25-P75二、名詞解釋1 .幾何均數:常用符號 G表示,適用于原始數據呈偏態分布,但經過對數變換后呈正態分布 或近似正態分布的資料。醫學上的血清抗體滴度和血清凝集效價等適宜用幾何均數描述其集 中趨勢。2 .中位數:一組觀察值由小到大順序排列,
7、位次居中的數值,適用于偏態分布和分布末端無確切值的資料。3 .變異系數:變異系數(coefficient of variance)為標準差與均數之比,用百分數表示,CV越大,表示觀察值的離散程度越大;CV越小,表示觀察值的離散程度越小。4 .四分位間距:第 75百分位數(P75)稱為上四分位數Q u,第25百分位數(P25)稱為下四分位數Q L,則四分位數間距(quartile interval) Q = Q U-Q Lo四分位數間距內包括了全部觀察值的一半,可看作為中間一半觀察值的全距。三、計算題1. 10 名 12 歲男孩身高(cm)分別為 125.5, 126.0, 127.0, 128
8、.5, 147.0, 131.0,1.132.0, 141.5.0, 122.5, 140.0。求平均數。= 132.1125.5 126 . 122.5 140102.2. 6份血清抗體滴度為:1:2, 1:4, 1:8, 1:8, 1:16, 1:32,求平均數c I lg 2 1g 4 1g 8 1g 8 1g16 1g 32,,G =lg = lg 0.9031 =83.某醫院調查30個乙肝表面抗原陽性患者抗體水平,求平均抗體水平抗體水平分布抗體水平 1:10 1:1001:10001:100001:100000人數 4510923.=lg(,flgX f34)-1000lg10 4
9、lg100 5 lg1000 10 lg10000 9 lg100000 230平均抗體水平為1:10004. 107名正常人尿鉛含量分布,求平均尿鉛含量尿鉛(mg/l)例數f累計頻數2 fL累計頻率(%)0141413.14223633.68296560.712 188377.616 159891.620 610497.124 110598.128 2107100.04.M =L i nfL =8 4 107 -36 =10.41(mg/L)f 2 L 29 2四、問答題1 .均數、幾何均數和中位數的適用范圍是什么?(1)均數適用于描述對稱分布,特別是正態分布的數值變量資料的平均水平;(2)
10、幾何均數適用于描述原始數據呈偏態分布,但經過對數變換后呈正態分布或近似正態分布的數值變量資料的平均水平;(3)中位數適用于描述呈明顯偏態分布(正偏態或負偏態) ,或分布 情況不明,或分布的末端有不確切數值的數值變量資料的平均水平。2 .標準差用于計量資料中正態或者近似正態分布的統計描述標準差的應用有四個方面:(1)表示個體變異的大小(2)用來結合均數計算醫學參考值范圍(3)計算變異系數(4)計算標準誤3 .變異系數與標準差的聯系和區別是什么?變異系數等于標準差單位一致的條件。而聯系:變異系數與標準差都是用于正態分布資料的離散程度的指標, 除以均數后乘以100%得到。區別:在比較離散程度大小時,
11、用標準差一定要滿足均數相近,變異系數可以用在以上兩個條件任意一個不能滿足的情況。第三章正態分布與醫學參考值范圍一、單選題1 .正態分布條件理論上()D算術均數、中位數是一致的2 .中位數特別適用于()D嚴重偏態分布資料3 .頻數分布中,如果集中位置趨向于數據較小的一端,叫做()C正偏態分布4 . 一組數據呈正態分布,其中大于 X-1.96s的變量有:()D 97.5%5 . 一組數據呈正態分布,其中大于 X+1.96S的變量有:()B 2.5%6 . 一組數據呈偏態分布,其雙側 95%的參考值范圍為:()B P2.5-P97.57 .正態分布曲線的形態參數應該是()B方差8 .對于臨床上計算尿
12、鉛的95%正常值可用哪個百分位數表示()A Po P959 .標準正態分布曲線下(-1 , 1)之間的面積約為:()B 68.27%10 .偏態資料的醫學參考值范圍估計方法是()B百分位法11 .一組身高資料和一組體重資料比較其離散度大小應該用哪個指標()D 變異系數12 . 標準差表示:()B 個體變異13 . 正態分布曲線下在均數加減一個標準差之間的面積大約占()B 6814 . 標準正態分布曲線的位置參數和形態參數分別是()A 0和115 . 評價一個個體指標是否正常可以用()A 醫學參考值范圍二、名詞解釋1.醫學參考值范圍:醫學參考值是指正常人(或動物)的人體形態、機能和代謝產物等的各
13、種生理及生化常數。 由于個體指標的變異使其常數不僅因人而異, 而且同一個體還會隨機體 內外環境的改變而改變,因此需要確定其波動的范圍,即醫學參考值范圍。三、問答題1 . 正態分布的特征是什么?正態分布有如下特征: 正態分布曲線在在橫軸上方均數處最高; 正態分布以均數為中心,左右對稱;正態分布上有兩個參數:均數科和標準差(T,均數科是位置參數,決定正態曲線的中心位置,科越大,曲線越向右移動;科越小,曲線越向左移動,標準差b是形狀參數, 決定正態分布曲線的陡峭或扁平程度,b越小,表示數據越集中,曲線越陡峭,b越大,表示數據越分散,曲線越扁平;正態分布曲線下的面積分布有一定的規律。2 .四分位數間距
14、、標準差、變異系數各有何特點?( 1)四分位數間距內包括了全部觀察值的一半,可看作為中間一半觀察值的全距,它比全距穩定, 但仍未考慮每個觀察值的離散度, 它適用于描述偏態分布資料, 特別是分布末 端無確定數據資料的離散度。( 2)方差開方,即為標準差,它適宜于描述對稱分布,特別是正態分布的數值變量資料的離散程度.( 3)變異系數是標準差與均數之比,它適宜于描述度量單位不同的觀察值的離散程度和度量單位相同但均數相差懸殊的觀察值的離散程度。3制定醫學參考值范圍的一般原則是什么?( 1 ) 抽取樣本含量足夠大的“正常人” 。一般認為樣本含量應在100 例以上, 并以取得一個比較穩定的樣本分布為原則。
15、( 2)對抽取的正常人進行準確而統一的測定,控制測量誤差。( 3 )判斷是否需要分組制定參考值范圍。( 4 )決定參考值范圍的單側或雙側界值。( 5)選擇適當的百分界值。( 6 )根據資料的分布類型選用恰當的方法估計參考值范圍。四、計算題1.已知正常人的體溫水平符合正態分布,在某地調查了 100名成年女子測得其 體溫為36.8攝氏度,標準差為0.2攝氏度,問如果該地有一女子自述體溫異常 就醫,測得其體溫為37.5攝氏度,請問該女子的體溫水平是否正常?1 . X _ 1.96s = 36.8 , 1.96 0.2 = (36.408,37.192)故體溫收入的95%參考值范圍為36.408-37
16、.19綱氏度,該女子體溫偏 高2 .調查某醫院護士的年齡分布和收入狀況,假設該人群的年齡和收入水平都呈正態分布。共調查了 100名護士,平均年齡為24.5歲,標準差為3.6歲,平均年收入為3.6萬元,標準差為1.0萬元(1)請比較該醫院護士年齡和收入水平的離散程度(2)如某護士年收入為1.8萬元,請評價該收入水平是否屬于正常范圍2.(1)36CV =100% -14.69%24.5-1C,“CV := 100% =27.8%3.6故收入的變異大于年齡(2)X _ 1.96s =3.6 二 1.96 1 =(1.64,4.56)故護士收入的95%參考值范圍為1.64-4.56萬,該護士收入屬于正
17、 常范圍3.某地20歲男子100人,其身高均數為166.06cm,標準差為4.95cm,其體均數為53.72kg ,標準差為4.96kg。請比較何者變異度較大。3. .495496CV 100% =2.98% CV =100% =9.23%166.0653.724. 調查某地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態分布,其 血紅蛋白平均值為117.4 (g/L),標準差為10.2 (g/L),試估計該地健康女性 血紅蛋白的95%醫學參考值范圍。5. _x 1.96s =117.41.96 10.2 =(97.41,137.39)故該地健康女性血紅蛋 白的95%參考值范圍為97.4
18、1137.39g/L第四章 定性數據的統計描述、單選題1 .已知男性的肝癌發病率高于女性, 今欲比較甲、乙地的肝癌發病率,但甲地中女性多于男性,而乙地中男性多于女性,適當的比較方法是()D對性別進行標準化后再比較2 . n足夠大,樣本率不接近于1或0,估計總體率95%勺可信區間用()A p_1.96Sp3 .若僅知道樣本率,估計率的抽樣誤差用哪個指標表示。()D S p4 .反映某一事物發生強度的指標應選()B 率5 .發病率和患病率中會超過100%勺是()C 發病率6 .甲地老年人口比重比乙地大,標準化后的食管癌死亡率甲、乙兩地相等, 那么()A原食管癌死亡率是甲地高于乙地7 .下列指標不屬
19、于相對數的是()D百分位數16.某醫師用新藥治療一組高血壓病人 23例,21例好轉,估計該療法好轉率95% 的可信區間,用A p_1.96Sp9.比較兩地某疾病的嚴重程度,可用哪個指標。()D發病率二、名詞解釋1 .相對比:相對比又稱為對比指標,是指兩個有關指標之比,通常以倍數或百分數表示。2 .率:率又稱為頻率指標,它是用來說明某現象在一定條件下發生的頻率大小或強度。通 常是某現象實際發生的例數與可能發生某現象的總數之比。3 .構成比:構成比又稱為構成指標,它表示事物內部某組成部分占其全部的比重或分布, 通常以100%乍為比例基數,以百分比的形式表示。三、問答題1 .應用相對數的注意事項應用
20、相對數時應注意以下幾個事項( 1)計算率和構成比時觀察單位不宜過小;(2)注意正確區分構成比和率,不能以比代率;(3)對率和構成比進行比較時, 應注意資料的可比性 (4)當比較兩個總率時,若其內部構成不同,需要進行率的標準化。(5)兩樣本率比較時應進行假設檢驗2 .簡述率的標準化法的基本思想當比較兩個總率時,如果兩組內部某種重要特征在構成上有差別,則直接比較這兩個總率是不合理的;因為這些特征構成上的不同,往往造成總率的升高或下降,從而影響兩個總率的對比。率標準化法的基本思想就是采用統一的內部構成計算標準化率,以消除內部構成不同對指標的影響,使算得的標準化率具有可比性。例如比較兩人群的死亡率、出
21、生率、 患病率時,常要考慮人群性別、年齡的構成是否相同;試驗組和對照組治愈率的比較時,常要考慮兩組病情輕重、年齡、 免疫狀態等因素的構成是否相同。如其構成不同,需采用統一的標準進行校正,然后計算校正后的標準化率進行比較,這種方法稱為標準化法。3 .率的標準化應注意的問題(1)當各比較組內部構成(如年齡、性別、職業、民族等)不同,并足以影響總率的比較 時,應對率進行標準化,然后再作比較。(2)率的標準化的目的是采用統一的標準,消除混雜因素的影響,使其具有可比性。根據 選用的標準不同,所計算的標準化率也不同。標準化率只表明各標化組率的相對水平,而不代表其實際水平。(3)各年齡組對應的率出現明顯交叉
22、,如低年齡組死亡率甲地高于乙地,而高年齡組則甲 地低于乙地,此時宜分別比較各年齡組死亡率,而不用標準化進行比較。(4)如是抽樣研究,兩樣本標準化率的比較也應作假設檢驗。四、計算題1.請完成以下空白并進行描述性分析。年齡 (歲)人口數死亡總數瘤死亡 數亡占總死亡的亡率(1/10萬)年齡別死亡率(%0)0-82920(138)42.90(4.8 )(1.66)20-(46638 )63(12 )19.0525.73(1.35 )40-2816117242(24.42 )(149.4 )(6.11 )60-(9371)(342 )32(9.36 )(341.5 )(36.5 )合計167090715
23、9012.59(53.86 )(4.28 )第五章統計表與統計圖、單選題1 .某病隨著事件推移疾病發病率的變化可以作B線圖2 .比較某地兩種疾病發病率差別可以作C 直條圖3 連續性頻數分布資料該作()A 直方圖4. 散點圖通常用于 ()B 雙變量資料5. 統計表中線條要求只能有()A 橫線6. 關于統計表中說法錯誤的是: ()B 一都要有備注7. 下列關于統計圖表的說法,不正確的是:()D 統計表均有備注附在表的下方8. 用統計圖表示某地三種死因別死亡率,可選用 ()C 直條圖9. 流行性乙型腦炎發病率的高低與年齡有關,據調查,38 歲兒童是發病的高峰。為反映患者年齡的頻數分布規律,統計圖應選
24、用: ()B 直方圖10. 欲比較某地區 1980 年以來三種疾病的發病率在各年度的發展速度,宜繪制()D半對數線圖11. 擬以圖示某市19901994年三種傳染病發病率隨時間的變化, 宜采用 ()A 普通線圖二、問答題1 .統計表的基本結構要求是什么?(1) 標題標題是統計表的總名稱,應簡明扼要說明內容,必要時注明資料的時間、地點。列在表的上端中央(2) 標目標目是表格內的項目,分為橫標目和縱標目。縱橫標目的排列要得當,順序應按時間順序、 事物的重要性、數字的大小等有規律地排列, 并注明單位。 一般橫標目列在表的左側,表示表中研究對象,縱標目列在表的上端,說明研究對象的各個統計指標。(3)
25、線條 力求簡潔,主要有3 條線:上面的頂線,下面的底線以及隔開縱標目與數字的橫線。部分表格可用橫線隔開合計,或用短橫線分割多重縱標目。其他豎線和斜線均可省去。( 4 )數字 表內數字必須準確,用阿拉伯數字表示。位數對齊,小數的位數要一致,不留空格,是“0"則填"0",暫缺或未記錄可用"-"或“”表示。可用“ *”號標出,寫在表的下面。(5)說明 文字不列入表內,特殊情況須用備注說明時,2.統計圖的制圖通則是什么?(1)根據資料性質和分析目的選用適當的圖形。(2)標題應扼要地說明圖的內容,地點和時間,一般寫在圖的下端。有多張圖時要將編號 寫在標題
26、前面。(3)有坐標的圖形(條圖、散點圖、線圖及半對數線圖、直方圖),應有縱橫兩軸的標目 和標目單位。(4)橫軸尺度自左至右,縱軸尺度自下而上, 數值一律由小到大, 縱橫比例一般為5:7 (或7: 5)。(5)圖中用不同線條、顏色代表不同事物時,需用圖例說明。一般放在圖的下方。第六章參數估計與假設檢驗一、單選題A標準誤的理論值2 . SX的含義是()C標準誤的估計值3 . t分布是()A近似正態分布4 . 一組100個樣本的資料均數等于5,變異系數等于20%,則標準誤等于()C 0.15 .標準誤反映()C均數變異6 . t分布中,當自由度為無窮大,t分布逼近()C標準正態分布7 . H0:(i
27、=(i0, Hi:(1*(10屬于()A雙側檢驗8 .下列屬于單側檢驗的是()C 已知A藥療效不會比B藥差9 .檢驗水準的符號是()D10 .已知A藥對某病有效。現發明一種增效劑 B,試圖提高A藥的療效,想通過臨床試驗了解A+B的療效是否顯著地優于單用 A藥的療效,應選用: ()D雙側檢驗11 .下列哪個變量為標準正態變量()X -12 .以一定概率由樣本均數估計總體均數, 宜采用()D區間估計13 .下面哪一指標較小時可說明用樣本均數估計總體均數的可靠性大()C標準誤二、名詞解釋1 .標準誤:為了與前面所述的一般變量值與均數的離散程度的指標-標準差相區別,我們把樣本均數的標準差稱為標準誤,用
28、仃又表示。標準誤愈大,樣本均數的抽樣誤差愈大;標準誤愈小,樣本均數的抽樣誤差愈小。2 .統計推斷:在醫學研究中,常常是采用抽樣研究的方法,即從總體中用隨機的方法抽取 部分個體(樣本)進行研究,目的是用樣本的信息推論總體的特征,這在統計學上稱為統計 推斷。3 .檢驗水準:檢驗水準也稱顯著性水準,符號為a ,是假設檢驗時發生第一類錯誤的概率三、問答題1 .標準誤的用途?(1)可用于反映樣本均數的可靠性。標準誤小表示樣本均數與總體均數較接近,用樣本均數代表總體均數的可靠程度較大;反之標準誤大,則表示用樣本均數代表總體均數的可靠程度較小。(2)可用于估計總體均數的可信區間。(3)可用于均數的假設檢驗。
29、2 . t分布的特征是什么?t分布有以下特征:以 0為中心,左右對稱 ;t分布曲線形態與n (確切地說與自 由度v )大小有關。與標準正態分布曲線相比,自由度 V愈小,t分布曲線愈平坦,曲線中 間愈低,曲線兩側尾部翹得愈高;自由度 V愈大,t分布曲線愈接近正態分布曲線,當自由 度丫 = OO時,t分布曲線為標準正態分布曲線。3 .標準差與標準誤有何區別和聯系?標準差和標準誤都是變異指標,但它們之間有區別,也有聯系。區別 :概念不同;標準差 是描述觀察值(個體值)之間的變異程度;標準誤是描述樣本均數的抽樣誤差;用途不同; 標準差與均數結合估計參考值范圍,計算變異系數,計算標準誤等。標準誤用于估計
30、參數的可信區間,進行假設檢驗等。它們與樣本含量的關系不同:當樣本含量 n足夠大時,標準差趨向穩定;而標準誤隨 n的增大而減小,甚至趨于 0。聯系:標準差,標準誤均為變異指標,當樣本含量不變時,標準誤與標準差成正比。4 .何謂假設檢驗?其一般步驟是什么?所謂假設檢驗,就是根據研究目的,對樣本所屬總體特征提出一個假設,然后根據樣本所提供的信息,借助一定的分布,觀察實測樣本情況是否屬于小概率事件,從而對所提出的假設作出拒絕或不拒絕的結論的過程。假設檢驗一般分為以下步驟 : 建立假設:包括:H0,稱無效假設;H1:稱備擇假設; 確定檢驗水準:檢驗水準用 ”表示,a一般取0.05; 計 算檢驗統計量:根
31、據不同的檢驗方法,使用特定的公式計算;確定 P值:通過統計量及 相應的界值表來確定 P值;推斷Z論:如 P> a ,則接受H0,差別無統計學意義;如 P < a ,則拒絕H0 ,差別有統計學意義。四、計算題1.已知正常人的體溫水平符合正態分布,在某地調查了 100名成年女子測得其 體溫為36.8攝氏度,標準差為0.2攝氏度,請計算當地女子體溫總體均數的 95% 可信區間。?1 .當地女子體溫總體均數的95%可信區為-0.20.2.100,100x -1.96SX =(36.8 -1.96。“ 一,36.8 1.96,) )= (36.76,36.84)2 .某地100名3歲女孩平均
32、身高為92.8cm,標準差為4.6cm,求其標準誤S 4 61002 . S x =二0.46 cm3 .調查某地100名健康女性血紅蛋白,直方圖顯示,其分布近似于正態分布,其 血紅蛋白平均值為117.4 (g/L),標準差為10.2 (g/L),試估計該地健康女性 血紅蛋白總體均數95%的可信區間。4 .該地健康女性血紅蛋白總體均數95%的可信區間為_ c10.210.2100x ± 1.96SX = (117.4 1.96 父,117.4 +1.96M =) =(115.4,119.4)1389.總體均數的95%T信區間為:x -1.96SX -(92.8 -1.96 0.38,
33、92.8 1.96 0.38)即:(92.1, 93.5 ) 即該地3歲女孩身高總體均數的95%信區間為92.193.5cm。第七章t檢驗一、單選題1 .兩樣本比較作t檢驗,差別有顯著性時,P值越小說明()C越有理由認為兩總體均數不同2 .兩樣本比較時,分別取以下檢驗水準,哪一個的犯II類錯誤最小()D 二=0.203 .當樣本含量n固定時,選擇下列哪個檢驗水準得到的檢驗功效最低()A 二=0.014 .假設檢驗中的第二類錯誤是指()D不拒絕實際上不成立的H。5 . I類錯誤指的是()B真實的的H0被拒絕的可能性6 .兩樣本均數比較用t檢驗,其目的是檢驗()C兩個總體均數是否相同7 .配對設計
34、兩樣本均數間的差別的假設檢驗時,查t界值表的自由度為 ()A n-18 .兩樣本均數的t檢驗對資料的要求是()A正態性、獨立性、方差齊性B資料具有代表性C為定量資料*D以上均對9 .兩組獨立樣本t檢驗要求:()C兩組數據總體方差相等二、問答題1 . t檢驗、u檢驗的應用條彳各是什么 ?t檢驗的應用條件是: b未知而且n較小時,要求樣本來自正態總體;兩小樣本均數比 較時,還要求兩樣本所屬總體的方差相等。u檢驗的應用條件是: b已知;b未知但樣本含量較大。2 .在醫學研究中,常見的配對設計資料有哪些情況?配對的兩個受試對象分別接受兩種處理的數據;同一受試對象兩個部位的數據;同一樣品用兩種方法(儀器
35、等)檢驗的結果。此類設計的目的是推斷兩種處理(方法等)的結果有無差別。三、計算題6.5 mmol/L,1. 15例長期服用某種避孕藥的婦女,其血清膽固醇含量的均數為標準差為0.7mmol/L, 一般健康婦女血清膽固醇含量的均數為4.4 mmol/L,問長期服用該種避孕藥的婦女其血清膽固醇含量的均數與一般健康婦女有無差 別? ( t 0.05, 14 =2.145)1 .(1)建JiZ(初設H ° :0 =4.4 , H i :科 W 科 0 oc =0.05X -0SX6.5 - 4.40.7 15(2)計算 t 值 X =6.5,科0=4.4, S=0.7, n=15。代入公式(1
36、5.12)。二 11.667(3)確定P值和作出推斷結論。t 0.05, 14=2.145 ,本例 t =11.667> t 0.05, 14 =2.145 ,所以,P<0.05。因P<0.05,故在a =0.05水準上拒絕H0,接受H。可認為長期服用該種避孕藥的婦女 其血清膽固醇含量的均數與一般健康婦女的差別有統計學意義,前者較高。2 .按性別相同、年齡相近、病情相近把16例某病患者配成8對,每對分別給予 A藥和B藥治療,現測得治療后的血沉(mm小時)結果如表,問不同藥物治療 后病人血沉水平是否有差異? ( t 0.01, 7 =3.499)不同藥物治療后某病患者的血沉值/
37、(mm/小時) 2對子號 A 藥 B 藥 d d(1)(2)(3)(4) = (2) - (3)(5)11064162139416363394111011510100067439782636885392d=242d2=962.(1)建立假設H 0:a d 0)Hi:20, a =0.05(2) 計算 t 值 今 n= 8, 12 d=24, 12 d2= 96,d ="d /n =24/8 =3_2_222Sd -、d O /n,96.24/8 <8528-1d -0SddSd 、n31.852 8=4.582(3)確定P值和推斷作出結論Y =n 1=81 = 7,查 t 界值
38、表,t 0.01,7 =3.499,本例 t =4.582> t 0.01, 7 =3.499 ,所以,P<0.01。因P<0.01 ,故在a =0.05水準上拒絕H),接受H ,可認為不同藥物治療后病人血沉水 平不同。3 .為考察出生時男嬰是否比女嬰重,研究者從加州大學伯克利分校的兒童健康與發展研究中心隨機抽取了 12例白種男嬰和12例白種女嬰的出生資料(單位:磅)。男嬰 x17.37.97.98.09.37.86.57.66.68.46.77.5女嬰 x27.17.96.46.68.06.07.26.87.85.36.67.3(1)該資料是數值變量資料還是分類資料?數值變
39、量資料(2)要比較白種人男性與女性的出生體重是否不同,應當選用成組 t檢驗還是配對t檢驗?成組t檢驗(3)經過計算t值為2.16,已知自由度22時,雙側面積0.05對應的t界值 為2.07,自由度11時,雙側面積0.05對應的t界值為2.20。試寫出假設檢驗 的全過程并下結論。3.答:H0:白種人男嬰與女嬰的出生體重是相同的即科1=科2H1:科 1 w 科 2 a =0.05t=2.16 y =22t>t0.05/2,22=2.07 p<0.05在a =0.05水平上拒絕H0,認為白種人男嬰與女嬰的出生體重是不同的,男嬰重于女嬰。第八章方差分析一、選擇題:答題說明:每個考題下面都有
40、A, B, C, D四個備選答案,答題時只許從中選出一 個最合適的答案,把這個答案前的編號字母圈出。1.成組設計的方差分析中,必然有 。D. SS總=SSw . S班內2.配伍組設計的兩因素方差分析有 。A. S$.=S®1 + SS五 + SS吳差3.完全隨機設計的方差分析中,若處理因素無作用,理論上應有。B. F=14.欲比較12名氟作業工人工前、工中,工后的尿氟濃度,采用兩因素方差分析,處理組問與配伍組問自由度分別為 。C. 2,115.方差分析的目的是檢驗。B.兩個或多個總體均數是否不全相同6.多組均數的兩兩比較中,若不用 q檢驗而用t檢驗,則。C.會把一些無差別的總體判斷為
41、有差別的概率加大7.對滿足方差齊性和正態分布的同一資料,當處理組數k=2時,單因素方差分析的結果與t檢驗的結果。B.完全等價8 .以下那條不屬于完全隨機設計的方差分析的應用條件?D.各比較組樣本方差相等9 .在單因素方差分析中,組間變異反映的是 的影響。B.研究因素和隨機誤差二、回答下列問題1 .試述方差分析的基本思想。答:方差分析的基本思想為:將總的變異分解成若干部分,每一部分都與某種效應 相對應;總的自由度也被分為相應的各個部分。將這些可能由某因素所致的變異與 隨機誤差比較,了解該因素對結果有無影響。第九章/檢驗一、選擇題:答題說明:每個考題下面都有A, B, C, D四個備選答案,答題時
42、只許從中選出一個最合適的答案,把這個答案前的編號字母圈出。1 .兩組計數配對資料比較,當(b+c) <40,用 公式計算檢驗統計量來判斷兩組差異的來源。D. ( b-c-1) 2/( b+c)2 .完全隨機設計四格表資料,當n40,且有一個理論數1&T<5,計算檢驗統 計量可用 公式。B.三(A-T-0.5) 2/T3. 4行X 2列表卡方檢驗的自由度為 。B. 34.某醫師用注射療法治療椎間盤突出,治療 26例12人治愈,用手術方法治療 27人,22人治愈,若進行胃檢驗,用 公式。2A. Z(A-T) /T5 .某醫師用電針灸加中藥治療抑郁癥病人,治療 16例15人治愈,
43、用西藥治療 23人,21人治愈,若比較兩組的治療效果,用 公式。D.確切概率法6 .三個樣本率作比較,/2 >裔01(2),可認為。A.各總體率不同或不全相同7 .某醫師用中西藥結合法治療腰肌病病人,治療 35例其中28人好轉,用單純 中藥治療27人其中16人好轉,用西藥治療22人,其中16人好轉,若進行E 檢驗,自由度為。B.28 .關于卡方值,說法正確的是。D.卡方值不可能小于零二、計算題1.腦膠質瘤患者43人,28例采用手術方法治療,其中22人發生腦功能損傷, 15例采用放療方法治療,其中7人發生腦功能損傷,試比較兩種方法治療后腦 功能損傷發生率有無差異。表9-1兩種治療方法后腦功
44、能損傷率的比較治療方法腦功能損傷合計有無手術22628放療7815合計2914431 . H0:q=n2, H 1: n1 n2 , a =0.05樣本總數n=43>40,最小的理論頻數為T22: 丁22=15* = 4.8843T22 <5 ,故使用校正公式計算72值。v =1(22 8 -6 7 -43 2)2 43 八28 29 15 14- 3.19 ,胃c胃0.05=3.84 ,故P >0.05,按a =0.05的水準不拒絕H。,尚不能認為兩種治 療方法的腦功能損傷率不同。2 .兩種方法檢查已確診的乳腺癌患者 120名,甲法的檢出率為60%乙法為50%兩方法一致檢出
45、率為35%問兩方法有無差別?表9-2兩種方法的乳腺癌檢出情況甲法-合計十一十423072一183048合計60601202.H 0 : % = H 2 ,Hi:i "-0.052230 -183 3 ,30 18b+c =30+ 18 >40,故使用配對卡方檢驗專用公式v =1工2 c(i)=3.84,故P >0.05,按口 =0.05的水準,不拒絕H。,認為兩法的檢出率無統計學差異。、選擇題:第十章非參數秩和檢驗答題說明:每個考題下面都有A, B, C, D四個備選答案,答題時只許從中選出一 個最合適的答案,把這個答案前的編號字母圈出。1 .以下檢驗方法中屬于參數檢驗的
46、是 A. t檢驗2 .等級資料比較宜用 。C.秩和檢驗3 .在作兩樣本均數比較時,已知及均小于30、總體方差不齊且呈極度偏態 的資料宜用。D.秩和檢驗4 .符合參數檢驗條件的數值變量資料如果采用非參數檢驗,則 。B.第二類錯誤增大5 .配對秩和檢驗的基本思想是:若 H假設成立,對樣本來說 。D,正秩和與負秩和的絕對值不會相差很大6 .三組比較的秩和檢驗,樣本例數均為 5,確定P值時應查。B.H界值表7 .完全隨機設計兩樣本秩和檢驗中樣本統計量 T值應取。8 .樣本量小的一組的秩和8 .以下關于非參數檢驗說法錯誤的是。A. t檢驗也屬于非參數檢驗9 .多樣本均數比較時,當分布類型不清時,應選 。
47、B. H檢驗10 .完全隨機多樣本秩和檢驗中,當各組樣本例數超過 5時,需查 表,以確定P值的范圍。C.k界值表11 .在完全隨機設計的兩樣本秩和檢驗中,當相同秩次出現的比例超過 時,需對u值進行校正。C.25%二、回答下列問題:1.非參數檢驗的適用資料主要包括哪些?答:非參數檢驗主要用于當參數檢驗的應用條件得不到滿足時,具體主要包括以下 資料:(1)總體分布為偏態或分布形式未知的資料;(2)等級資料;(3)個別數據 偏大或數據的某一端無確定數值的資料;(4)各總體方差不齊的資料。2,非參數檢驗的優缺點各有哪些?2 .答:非參數檢驗優點是不受總體分布的限定,適用范圍廣;非參數檢驗的缺點是 符合
48、作參數檢驗的資料,若用非參數檢驗,檢驗效率低于參數檢驗,一般犯第二類 錯誤的概率B比參數檢驗大。3 .配對設計的秩和檢驗如何編秩?3.答:先求各對數值的差值,然后再進行編秩:(1)按差值的絕對值由小到大編秩 , 將秩次按差值的正負分兩欄;(2)差值為0,則棄去不計,同時樣本例數相應減 1;(3)遇差值的絕對值相等,符號相反應取平均秩次,符號相同順次排列。章線性回歸與相關一、選擇題答題說明:每個考題下面都有A, B, C, D四個備選答案,答題時只許從中選出一 個最合適的答案,把這個答案前的編號字母圈出。1.進行直線相關分析時,如|r| 0.05(n/)時,可認為兩變量X與Y問。B.有直線相關關
49、系2.已知r =1 ,則一定有。C. Sy.x = 03 .已知兩樣本,A =也,那么。D.兩樣本的決定系數相等4 .對直線相關系數的假設檢驗,其無效假設H。是 o8. :=05 .若r產,下列表述正確的是 。 DD. t b1 = t r16 .用樣本求得R=0.9,則同一資料b值應。A. b>07 . Syx表示D.Y對Y的離散程度8 .用最小二乘法確定直線回歸方程的原則是各觀察點距直線的 B.縱向距離的平方和最小9 .計算直線相關系數要求。B.兩變量均要求服從正態分布10.直線回歸系數的假設檢驗,其自由度為 。C. n-211 .回歸系數的假設檢驗。A.能用同一資料的r的檢驗代替B
50、. 能用t檢驗C.能用F檢驗* D.三者均可12 .關于直線相關系數與回歸系數的關系描述錯誤的是 A. r大,則b也一定大13 .對直線回歸系數的假設檢驗,其無效假設是D. =014 .兩組資料中,回歸系數較大的一組 。D .則r可能大也可能小15 .計算直線回歸系數要求。A.只要應變量服從正態分布二、解釋下列名詞:1 .直線回歸系數:回歸系數b即為回歸直線的斜率,其統計學意義是 X每增加 和減少一個單位,Y平均改變b個單位。b越大表示直線變化的趨勢越陡。b >0, 表示Y隨X呈同向直線變化;b<0,表示Y隨X呈反向直線變化;b=0,表示 Y與X無線性回歸關系。2 .直線相關系數:
51、兩變量之間相關性的強度可用直線相關系數來描述, 用r表示, 相關系數r是個無單位的的數值,-1<1; r>0表示正相關,r<0表示負相關,r二0表示零相關;r的大小描述雙變量相關程度的大小,r越接近于1則 相關性越好,反之接近于0,則相關性越差。三、回答下列問題:1.直線相關和直線回歸分析有哪些區別和聯系?答:(1)區別:1)在資料要求上,回歸要求因變量 Y服從正態分布;X是可以 精確測量和嚴格控制的變量,一般稱為 I型回歸;2)在應用上,說明兩變量問 依存變化的數量關系用回歸,說明變量間雙向的相互關系時用相關。(2)聯系:1)對一組數據若同時計算r與b,它們的正負號是一致的。r為正號說明兩變量 間的相互關系是同向
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國棲麗紗印花方巾市場調查研究報告
- 2025年中國木紋床腳市場調查研究報告
- 2025年中國無機硅酸鋅防銹漆底漆市場調查研究報告
- 教育信息化背景下學生學習行為分析研究
- 2025年中國掛墻網絡機柜市場調查研究報告
- 2025年中國抓癢刷市場調查研究報告
- 2022-2027年中國空調密封件市場競爭態勢及投資規劃建議報告
- 2025年中國小五金用具市場調查研究報告
- 2025年中國女絹扇市場調查研究報告
- 跨學科融合教學中中華傳統文化與紅色革命教育的實施路徑
- 社工社會考試試題及答案
- 跨文化交際知識體系及其前沿動態
- 2025浙江中考:歷史必背知識點
- 衛星遙感圖像傳輸質量評估-全面剖析
- 2025-2030中國跨境支付行業市場發展現狀及競爭格局與投資前景研究報告
- 2025年果品購銷合同簡易模板
- 胰島素皮下注射團體標準解讀 2
- 《眼科手術新技術》課件
- 《SLT631-2025水利水電工程單元工程施工質量驗收標準》知識培訓
- 2025氮氣、氬氣供應合同
- 2024年貴州省普通高校招生信息表(普通類本科提前批C段-物理組合)
評論
0/150
提交評論