




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第五章均值比較與T檢驗統計分析常常采取抽樣研究的方法。即從總體中隨機抽取一定數量的樣本進行研究來推論總體的特性。由于總體中的每個個體間均存在差異,即使嚴格遵守隨機抽樣原則也會由于多抽到一些數值較大或較小的個體致使樣本統計量與總體參數之間有所不同。由此可以得出這樣的認識:均值不相等的兩個樣本不一定來自均值不同的總體。能否用樣本均數估計總體均數,兩個變量均數接近的樣本是否來自均值相同的總體?換句話說,兩個樣本某變量均值不同,其差異是否具有統計意義,能否說明總體差異?這是各種研究工作中經常提出的問題。這就要進行均值比較。對來自正態總體的兩個樣本進行均值比較常使用T檢驗的方法。T檢驗要求兩個被比較的樣本來自正態總體。兩個樣本方差相等與不等時使用的計算t值的公式不同。進行方差齊次性檢驗使用F檢驗。對應的零假設是:兩組樣本方差相等。p值小于0.05說明在該水平上否定原假設,方差不齊;否則兩組方差無顯著性差異。F值的計算公式是:F=S12(較大)/S22(較小)進行均值比較及檢驗的過程MEANS過程Ttest過程單一樣本T檢驗獨立樣本的T檢驗配對樣本的T檢驗單因素方差分析SPSS的均值過程是描述和分析尺度變量(Scale)的一種有用的方法,可以獲得需要分析變量的許多中心趨勢和離散趨勢的統計指標,同時它可以對不同的組別或者交叉組別進行比較。當觀測量按一個分類變量分組時,均值過程可以進行分組計算。例如:要計算學生的平均身高,SEX變量把學生按性別分為男、女生兩組,均值過程可以分別計算男、女生平均身高。注意用于形成分組的變量應該是其值數量少且能明確表明其特征的變量。
一、MEANS過程
使用均值過程求若干組的描述統計量,目的在于比較。因此必須分組求均值。這是與Descriptives過程不同之處。
MEANS過程的基本功能是分組計算指定變量的描述統計量。包括均值、標準差、總和、觀測量數、方差等一系列單變量描述統計量。也可以從該過程獲得單因素方差分析、eta和線性相關檢驗。Mean過程的數據文件要求:至少有一個連續變量、一個分類變量(離散變量)。對連續變量求其基本描述統計量。分類變量用來分組。以30個學生的身高為例說明操作步驟(學生身高體重數據.sav)變量number編號,sex性別,age年齡,height身高,weight體重。相同年齡的男孩和女孩是否身高有所不同?是否身高隨年齡的增長呈線性關系?如果解決這樣的問題,只建立一個控制層就不夠了。應該考慮,選擇身高作為因變量,分類變量年齡作為第一層控制變量,性別為第二層控制變量。兩個分類變量分別放在兩層中,且使用選擇項。ANOVAtableandeta:輸出第一層控制變量給出的方差分析表和eta統計值η和η2
。η統計量表明因變量和自變量之間聯系的強度。η2
是組間平方和與總平方和之比。Testforlinearity:線性檢驗,輸出R和R2,只有在控制變量有基本的控制級,且自變量有三個水平以上時才能選用。對第一層變量的方差分析結果身高*年齡(方差分析的變量信息):分析不同年齡的身高均值間是否存在顯著性差異;SumofSquares(偏差平方和);df(自由度);Meansquare(均方);F(方差值);sig(P值);BetweenGroups(組間偏差平方和):由兩部分組成:Linearity是由因變量與控制變量之間的線性關系引起的;Deviationfromlinearity不是由因變量與控制變量之間的線性關系引起的;WithinGroups(組內偏差平方和):各組內的變異相對于組均值的變異;Total(偏差平方和的總和):為組間偏差平方和與組內偏差平方和之和。線性檢驗結果R是因變量身高的觀測值與預測值之間的的相關系數,R值越接近1表明回歸方程的預測性越好;Eta:即η值(0~1)說明因變量與自變量之間的聯系程度;EtaSquared:η2為組間偏差平方和與偏差平方和總和之比。練習題試按性別、年齡對體重做平均數分析。單樣本T檢驗單樣本T檢驗即檢驗某個變量的樣本均值和某指定值(總體均值)之間是否存在著顯著性差異。如果是大樣本的單樣本檢驗,統計教科書上稱為U檢驗,它采用服從正態分布的U統計量作為檢驗統計量;如果是小樣本并且樣本服從正態分布,則采用服從t分布的t統計量進行單樣本T檢驗;否則,采取非參數檢驗。T檢驗穩健性(Robust)較好,如果樣本分布偏離正態分布不太嚴重,也可采用T檢驗。二、Ttest過程1、單一樣本T檢驗(One-sampleTTest)
檢驗單個變量的均值是否與給定的常數(一般為理論值、標準值或經過大量觀察所得的穩定值等)之間存在差異。樣本均數與總體均數之間的差異顯著性檢驗屬于單一樣本T檢驗。如某廠的燈泡壽命的平均值為1500小時,后采用新工藝組織生產,要想了解燈泡壽命是否提高?方法:從新工藝下生產的燈泡中隨機抽查若干只燈泡,測得壽命,并計算平均壽命,再與1500小時進行比較,判斷是否有顯著差異?如果是大樣本的單樣本檢驗,統計教科書上稱為U檢驗,它采用服從正態分布的U統計量作為檢驗統計量;如果是小樣本并且樣本服從正態分布,則采用服從t分布的t統計量進行單樣本T檢驗;否則,采取非參數檢驗。T檢驗穩健性(Robust)較好,如果樣本分布偏離正態分布不太嚴重,也可采用T檢驗。例:收集26家保險公司人員構成數據,希望對目前保險公司從業人員受高等教育程度和年輕化程度進行推斷。具體而言,就是推斷具有高等教育水平的員工平均比例是否不低于0.8,年輕人的平均比例是否為0.5,具體數據文件名為保險公司人員構成情況.sav提出原假設:保險公司具有高等教育水平的員工比例的平均值不低于0.8,即H0:u>=(u0=0.8)年輕人比例的平均值與0.5無顯著差異,即:H0:u=u0=0.5分析過程:計算具有高等教育水平的員工數,35歲以下員工數占總員工數的比例。(利用轉換菜單計算)進行單樣本t檢驗分析:由于調查的26家公司,有7家在文化程度變量上有缺失值,因此在選項窗口中選擇【按分析順序排除個案】進行缺失值處理。Confidenceinterval:95%:置信區間項,可以自定義。MissingValues:選擇對缺失值的處理方法
Excludecasesanalysisbyanalysis:帶有缺失值的觀測值當它與分析有關時才被剔除;
Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項受高等教育比例的基本描述統計量被調查的26家保險公司有效的19家,其中具有高等教育水平員工比例的平均數是0.745,標準差為0.167,標準誤為0.038單樣本T檢驗分析結果95%ConfidenceIntervaloftheDifference(差值的95%置信區間):95%的置信區間=均值±1.96標準誤。根據上表比例總體均值的95%置信區間是0.745±1.96×0.038即(0.664,0.8255)。由此推出,該范圍與總體均數之差為0.664-0.8~0.8255-0.8,即表中-0.1358和0.0255的含義。單樣本t檢驗中t統計量的雙尾概率p-為0.168,若顯著性水平a為0.05,則p>a,由此接受原假設,也就是保險公司員工受高等教育比例顯著高于0.8。(0.8大于95%的置信區間下限)練習:年輕人比例t檢驗操作年輕人比例的基本描述統計量調查的26家保險公司,年輕人比例的平均數是0.7139,標準差為0.151,標準誤為0.03單樣本T檢驗分析結果95%ConfidenceIntervaloftheDifference(差值的95%置信區間):95%的置信區間=均值±1.96標準誤。根據上表比例總體均值的95%置信區間是0.7139±1.96×0.03即(0.655,0.773)。由此推出,該范圍與總體均數之差為0.655-0.5~0.773-0.5,即表中0.1530和0.2747的含義。單樣本t檢驗中t統計量的雙尾概率p-為0,若顯著性水平a為0.05,則p<a,由此拒絕原假設,樣本均數與總體均數有顯著性差異。也就是保險公司年輕人比例與0.5存在顯著性差異。練習題已知某水樣中含CaCO3的真值為20.7mg/L,現用某方法重復測定該水樣11次CaCO3的含量(mg/L)為:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00,22.00。問該方法測得的均值是否偏高?2、IndependentSampleTtest
(獨立樣本T檢驗)獨立樣本的T檢驗用于檢驗兩個不相關的樣本是否來自具有相同均值的總體。兩獨立樣本是指兩個樣本所來自的總體相互獨立,兩個獨立樣本各自接受相同的測量,研究者或分析者的主要目的是分析兩個獨立樣本的均值是否有顯著的統計差異。獨立樣本T檢驗必須注意使用這種檢驗的條件是必須具有來自兩個不相關組(非配對)的觀測量,其均值必須是對你想在兩組中都計算的變量的綜合測度。例如,比較女性和男性的身高,教育從業者和金融從業者的起始工資等,都是兩獨立樣本的例子。
兩獨立樣本T檢驗的前提條件獨立性:兩樣本所來自的總體互相獨立。正態性:樣本來自的兩個總體應服從正態分布。在樣本所來自的總體不滿足正態性條件時,如果兩個樣本的分布形狀相似,它們的樣本量相差不是太大并且樣本量較大,仍然可以應用T檢驗。方差齊性:待比較的兩個樣本的方差相同。如果兩個組的樣本量大致相等,略微偏離了方差齊性對檢驗結果的精度影響不大。在T檢驗中,SPSS提供了方差齊性的Levene檢驗,當方差齊性不滿足時,會提供方差齊性校正后的T檢驗結果。如果分組樣本彼此不獨立,例如測量的是研究對象用藥前后某項指標,要求比較用藥前后某項指標均值是否有顯著性差異,應該使用配對T檢驗的功能(PairedSampleTtest)。如果分組不止兩個,應該使用One-WayANOV過程進行單變量方差分析。如果你試圖比較的變量明顯不是正態分布的,則應該考慮使用一種非參數檢驗過程(Nonparametrictest)。如果想比較的變量是分類變量,應該使用Crosstabs功能。例:學生參加為期三天的計算機等級測試培訓,有15名學生報名參加A公司的培訓,12名參加B公司的培訓,培訓結束后學生參加測試,想知道學生在這兩家公司不同培訓方法下,測試成績的均值是否存在顯著差異。分析:培訓方式A與培訓方式B可以看成是兩個獨立樣本Spss操作步驟Usespecialvalues使用指定值:按分組變量的值進行分組Cutpoint割點:當分組變量為連續變量時,選擇該選項后,在后面的矩形框中輸入一個連續變量值,將觀測量分為大于該值和小于該值的兩個組,檢驗在這兩個組之間進行,比較其因變量在兩組的均數間是否有顯著性差異。Confidenceinterval:95%:置信區間項,可以自定義。MissingValues:選擇對缺失值的處理方法
Excludecasesanalysisbyanalysis:帶有缺失值的觀測值當它與分析有關時才被剔除;
Excludecaseslistwise:剔除所有列在Test、Grouping矩形框中的變量帶缺失值的項分析變量的簡單描述性統計量左第一欄為分析變量標簽和分類變量標簽N觀測量數目Mean均值Std.Deviation標準差Std.ErrorMean標準誤參加培訓方法A的學生的平均測試成績47.73,低于培訓方法B學生的平均測試成績8.77分兩組學生測試成績的標準差相差不大,參加培訓方法A的略大獨立樣本T檢驗結果Levene’sTestforEqualityofVariances:方差齊性檢驗F方差值:0.258Sig:P值為0.616>0.05,接受原假設即方差相等。t-testforEqualityofMeans為T檢驗結果欄t:t值;df:自由度;Sig:顯著性概率即P值=0<0.05,拒絕原假設u1-u2=0;MeanDifference:兩組均值之差。表現培訓方法A學生平均測試成績低于培訓方法B學生成績8.767;Std.ErrorDifference:差值的標準誤為1.686;95%ConfidenceIntervaloftheDifference:差值的95%置信區間。在-12.24~-5.294之間,不包括0即兩組均值之差與0有顯著性差異。例題二有29名13歲男生的身高、體重、肺活量數據(學生肺活量數據.sav),試分析大于等于155cm的與身高小于155cm的兩組男生的肺活量均值是否有顯著差異。分析:155以下和155以上身高的男生平均肺活量顯著性檢驗例題二身高大于等于155cm與身高小于155cm的兩組男生的肺活量平均值在95%水平上顯著存在差異。練習題某克山病區測得11例急性克山病患者與13名健康人的血磷值如下:患者:2.60,3.24,3.73,3.73,4.32,5.18,4.73,5.58,5.78,6.40,6.53健康人:1.67,1.98,1.98,2.33,2.34,2.50,3.60,3.73,4.14,4.17,4.57,4.82,5.78問該地區急性克山病患者與健康人的血鱗值是否不同?三、配對樣本T檢驗配對樣本T檢驗(PairedSampleTtest)用于檢驗兩個相關的樣本是否來自具有相同均值的總體。這種相關的或配對的樣本常常來自這樣的實驗結果,在實驗中被觀測對象在實驗前后均被觀測。兩個變量可以是beforeafter,配對分析的測度也不是必須來自同一個觀測對象。一對可以兩者組合而成。
進行配對樣本的T檢驗要求被比較的兩個樣本有配對關系。要求兩個樣本均來自正態總體。而且均值是對于檢驗有意義的描述統計量。均值的配對比較是比較常見(見以下幾個例子)。同一窩實驗用白鼠按性別、體重相同的配對,再隨機分到實驗組和對照組,分別喂加入海藻的飼料和普通飼料,三個月后,分別將每對白鼠置于水中,測量其到溺死前的游泳時間。比較兩組白鼠游泳時間均值,從而比較兩種飼料對抗疲勞的作用。在研究人體各部位體溫是否有差別,一個人的兩個部位的溫度構成一對數據。測量若干人的同樣兩個部位的溫度數據,可以比較這兩個部位平均溫度是否有顯著性差異。使用配對t檢驗。
同一組高血壓病人在進行體育療法前后,測量其血壓。每個病人在體育療法前后的血壓測量值構成觀測量對??梢郧筮@組病人體育療法前后血壓平均值。進行配對T檢驗,分析體育療法對降血壓的療效。配對樣本T檢驗實際上是先求出每對測量值之差值,對差值求均值,檢驗配對變量均值之間差異是否顯著。其實質檢驗的假設實際上是差值的均值與零均值之間差異的顯著性。如果差值均值與零均值無顯著性差異說明配對變量均值之間無顯著性差異。配對樣本T檢驗與獨立樣本T檢驗均使用T-TEST過程,但調用該過程的菜單不同,對數據文件結構的要求不同和所使用的命令語句也有區別。進行配對樣本T檢驗的數據文件中一對數據必須作為同一個觀測量中兩個變量值。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畜產品加工產業政策動態分析與對策考核試卷
- 計算機二級JAVA性能調優試題及答案
- 橋梁工程深基坑開挖專項施工方案
- 計算機二級Web考試學習方法試題及答案
- 牧場奶牛養殖委托運營管理與風險管理協議
- 氫能源產業知識產權共享與保護協議
- 抖音青少年網絡素養提升合作協議
- 2025年中國保健紅糖行業市場規模調研及投資前景研究分析報告
- 燒烤業網紅店區域代理合作協議范本
- 能源監測數據實時采集與處理協議
- 2023學年完整公開課版井岡翠竹
- 兒童成長相冊PPT
- 2023年安徽馬鞍山市市場監督管理局招聘編外聘用人員29人(共500題含答案解析)筆試必備資料歷年高頻考點試題摘選
- 英語1 山大本科考試題庫及答案
- 高中音樂-《音樂與詩詞》教學課件設計
- 九個特種設備安全員守則
- 中國哲學經典著作導讀知到章節答案智慧樹2023年西安交通大學
- 2023年鄭州大學第一附屬醫院住院醫師規范化培訓招生(口腔科)考試參考題庫+答案
- 保潔員(五級)技能理論考試題庫(匯總版)
- 拖拉管施工專項施工方案(交叉口)
- 七年級下冊英語第三次月考試題
評論
0/150
提交評論