spss19統計分析基礎與案例應用教程_第1頁
spss19統計分析基礎與案例應用教程_第2頁
spss19統計分析基礎與案例應用教程_第3頁
spss19統計分析基礎與案例應用教程_第4頁
spss19統計分析基礎與案例應用教程_第5頁
已閱讀5頁,還剩33頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

推斷統計與參數檢驗單一樣本t檢驗兩獨立樣本t檢驗兩配對樣本t檢驗參數檢驗是推斷統計的重要組成部分。推斷統計方法是根據樣本數據推斷總體特征的方

法,它在對樣本數據描述的基礎上,以概率

的形式對統計總體的未知數量特征(如均值、方差等)進行表述。通過對樣本數據的研究來推斷總體特征主要出于以下兩大原因:第一,總體數據無法全

部收集到;第二,在某些情況下雖然總體數

據能夠收集到,但實施時會耗費大量的人力、物力和財力

對總體特征的推斷一般采用參數估計(點估計和區間估計)和假設檢驗兩類方法實現。SPSS兼顧了這兩類方式,由于其核心原理基本類似,這里僅以對假設檢驗的基本思想做重點討論。假設檢驗的基本思想是首先對總體參數提出假設,然后利用樣本告之的信息去驗證提出的假設是否成立。如果樣本數據不能充分證明和支持假設,則在一定的概率條件下,應拒絕該假設;相反,如果樣本數據不能夠充分證明或者支持假設是不成立的,則不能推翻假設。上述假設檢驗推斷過程所依據的基本信息是小概率原理,即發生概率很小的隨機事件,在某一次特定的實驗中是幾乎不可能發生的。第一、提出零假設(記為H0)即根據推斷檢驗的目標,對待推斷的總體參數或分布提出一個基本假設。第二、選擇檢驗統計量在假設檢驗中,樣本值(或更極端值)發生的概率并不是直接由樣本數據得到的,而是通過計算檢驗統計量觀測值發生的概率而間接得到的。這些檢驗統計量服從或者近似服從某種已知的理論分布。對于不同的假設檢驗問題以及不同的總體條件,會有不同的選擇檢驗統計量的理論、方法和策略,這是統計學家研究的課題。應用匯總

只需要依據實際,明確問題,遵循理論套用即可。第三、計算檢驗統計量觀測值發生的概率選定檢驗統計量之后,在認為零假設成立的條件下,利用樣本數據便可計算出檢驗統計量觀測值發生的概率,即概率p值或者稱為相伴概率(即指該檢驗統計量在某個特定的極端區域取值在H0成立時的概率),該概率值間接地給出了樣本值(或更極端值)在零假設成立條件下發生的概率。對此可以依據一定的標準來判定其發生的概率是否為小概率,是否是一個小概率事件。第四、給定顯著性水平,并做出統計決策顯著性水平是指零假設正確但卻被錯誤地拒絕了的概率或風險,一般人為確定為0.05或者0.1等,意味著零假設正確同時也正確地接受了的可能性(概率)為95%或99%。5.2.1單樣本t檢驗的目的單樣本t檢驗的目的是利用來自某總體的樣本數據,推斷該總體的均值與指定的檢驗值之間的差異在統計上是否是顯著的。它是對總體均值的假設檢驗。5.2.2單樣本t檢驗的基本步驟1、提出零假設0

0H

:

m

=

m其中

m

為總體均值,

m0

檢驗值2、選擇檢驗統計量當方差未知時2當方差已知時

Zns=

X

-

m

2SnX

-

m

0Z

=3、計算檢驗統計量觀測值和概率p值該步目的是計算檢驗統計量的觀測值和相應的概率

p值。SPSS將自動將自動將計算t統計量的觀測值和對應的概率p值。4、給出顯著性水平a,并做出決策給出顯著性水平a

,與檢驗統計量的概率p值做比較。如果概率p值小于顯著性水平,則應拒絕零假設,認為總體均值與檢驗值之間存在顯著差異;反之,如果概率p值大于顯著性水平,則不應拒絕零假設,認為總體均值與檢驗值之間無顯著差異。單樣本t檢驗的基本操作(1)選擇選項分析→比較均值→單樣本T檢驗,出現如圖5-1所示的窗口(2)在【檢驗變量】框中輸入檢驗值。(3)單擊【選項】按鈕定義其他選項,出現如圖5-2所示的窗口。“選項”用來指定缺失值的處理方法。其中,“按分析順序排除個案”表示當計算時涉及的變量上有缺失值,則剔除在該變量上為缺失值得個案;按列表排除個案表示剔除所有在任意變量上含有缺失值的個案后再進行分析。可見,較第二種方式,第一種處理方式較充分地利用了樣本數據。至此,SPSS將自動計算t統計量和對應的概率p值。單樣本t檢驗的應用舉例例5.1

從一批鋼管抽取10根,測得其內徑(單位:mm)為:100.36

100.31

99.99 100.11

100.64100.85

99.42

99.91

99.35 100.10

,檢驗其平均值是否為100mm提出假設:1、按照順序:分析→比較均值→單樣本T檢驗,進入單一樣本T檢驗對話框,將左側“鋼管內徑”變量選入【檢驗變量(T)】中,右下角的【檢驗值(V)】框中輸入已知的總體均值,默認為0,本題中為100.如圖5-1所示SPSS計算步驟:H

0:

m

=

1

0

02、單擊【選項】按鈕,彈出【單一樣本T檢驗:選項】對話框,如圖5-2所示,置信區間百分比,SPSS默認值為95%(即顯著性水平0.05)。對于獨立樣本和配對樣本的均值檢驗,對置信區間操作都相同。3、單擊【繼續】,回到【單一樣本T檢驗】對話框,單擊【確定】。輸出結果見表5-1,5-2表5-1給出了單一樣本均值檢驗的描述性統計量、標準差和均值標準誤差。鋼管內徑均值為100.1040,接近總體100表5-1單個樣本統計量N均值標準差均值的標準誤鋼管內徑10100.1040.47596.15051表5-2是單一樣本均值檢驗的結果列表,給出了t統計量、自由度、雙尾概率以及顯著性水平及置信區間。雙尾概率P=0.507>顯著性水平0.05,接受原假設,說明鋼管內徑與平均值100無顯著差異。5.3

兩獨立樣本t檢驗5.3.1

兩獨立樣本t檢驗的目的兩獨立樣本t檢驗的目的是:利用來自兩個總體的獨立樣本,推斷兩個總體的均值是否存在顯著差異。這里,方法設計的兩個總體,并采用t檢驗的方法。同時要求兩組樣本相互獨立,即從一總體中抽取一組樣本對從另一總體中抽取一組樣本沒有任何影響,兩組樣本的個案數目可以不等。因此稱為獨立樣本t檢驗。兩獨立樣本t檢驗的前提是,兩樣本相互獨立。兩獨立樣本t檢驗的基本步驟1、提出零假設分別為第一個和第二個總體的均值。2、選擇檢驗統計量第一種情況:當兩總體方差未知且相等時H0

:

m1

=

m2m1,

m21

2

1

222sX

-

X

-

(

m

1

-

m

)t

=21212ppS

2

S

2nns=+(n

-1)S

2

+((n

-1)S

2Sp

=

1

1

2

2

n1

+

n2

-

2第二種情況:當兩總體方差位置且不相等時S

2

S

22n1

n23、計算檢驗統計量的觀測值和概率p值該步目的是計算F統計量和t統計量的觀測值以及相應的概率p值。SPSS將自動一句單因素方差分析的方法計算F統計量和概率p值,并自動將兩組樣本的均值、樣本數、抽樣分布方差帶入式(5.7),計算出t統計量的觀測值和對應的概率p值。4、給出顯著性水平,并做出決策s12

=

1

+

2

兩獨立樣本t檢驗的基本操作SPSS兩獨立樣本t檢驗的基本操作步驟:選擇菜單分析→比較均值→獨立樣本T檢驗,于是如圖5-5所示的窗口。出現無法顯示該圖片。選擇檢驗變量到【檢驗變量】框。選擇總體標識變量到【分組變量】框中。單擊【定義組】按鈕定義兩總體的標識值,顯示如圖5-6所示的窗口。其中,【使用指定值】表示分別輸入兩個對應兩個不同總體的變量值;【割點】框中應輸入一個數字,小于該值的對應一個總體,大于該值的對應另一個總體。兩獨立樣本t檢驗的【選項】含義與單樣本t檢驗的相同。例5.3下面給出兩種型號的計算器充電后所能使用的時間的觀測值型號1:

5.5

5.6

6.3

4.6

5.3

5.0

6.2

5.85.1

5.2

5.9型號2:

3.8

4.3

4.2

4.0

4.9

4.5

5.2

4.84.5

3.9

3.7

4.6設兩樣本獨立且數據所屬的兩總體的密度函數至多差一個平移量。能否認為兩種型號的電池使用時間相同。輸出結果如表5-5,5-6所示表5-5給出了獨立樣本均值檢驗的描述性統計量,包括兩個樣本的均值,標準差和均值的標準誤。從表中可以看出,型號1的使用平均時間為5.5,型號2的使用平均時間為

4.3667,兩者之間存在一定的差異。無法顯示該圖片。表5-6獨立樣本檢驗方差方程的

Levene檢驗均值方程的t檢驗FSig.tdfSig.(雙側)均值差值標準誤差值差分的95%置信區間下限上限電池使用 假設方差.100.7555.48421.0001.133.20665.70351.563時間 相等33908假設方差5.45620.17.0001.133.20771.70031.566不相等233036表5-6是獨立樣本均值檢驗的結果列表,給出了F值,t統計量,自由度,雙尾概率,以及顯著性水平及置信區間。檢驗結果分為兩行,第一行表示方差相等時的檢驗結果,第二行表示方差不等時的檢驗結果。表中P分別為0.000,0.000,都小于顯著性水平0.05,故拒絕原假設,說明型號1和型號2的電池

使用平均時間有顯著性的差異。5.4

兩配對樣本t檢驗兩配對樣本t檢驗的目的

兩配對樣本t檢驗的目的是:利用來自兩個總體的配對樣本,推斷兩個總體的均值是否存在顯著差異。配對樣本t檢驗與獨立樣本t檢驗的差別之一是要求樣本是配對的。所謂配對樣本可以是個案在“前”“后”兩種狀態下某屬性的兩種不同特征,也可以是對某事務兩個不同側面或方面的描述。其差別在于抽樣不是相互對立,而是互相關聯的。因此,配對樣本通常具有兩個特征:第一,兩組樣本的樣本數相同;第二,兩組樣本觀測值的先后順序是一一對應,不能隨意更改。兩配對樣本t檢驗正是利用兩組配對樣本的數據,對其總體均值有無顯著差異做出推斷步驟與前面類似,不在累贅。兩配對樣本t檢驗的基本操作1、選擇菜單分析→比較均值→配對樣本T檢驗,于是出現如圖5-9所示的窗口。2、選擇一對或若干對檢測變量到【成對變量】框。3、兩配對樣本t檢驗的【選項】含義與單樣本t檢驗的相同。至此,SPSS將自動計算t統計量和對應的概率p值例5.5為研究某種減肥茶是否具有明顯的減肥效果,某減肥茶廠商對35名肥胖志愿者進行了減肥跟蹤調研。首先將其喝減肥茶以前的體重記錄下來,三個月后再依次將這35名志愿者喝茶后的體重記錄下來。通過這兩組樣本數據的對比分析,推斷減肥茶是否具有明顯的減肥作用。具體數據如下:喝茶前體重:90.0095.0082.0091.00100.0087.0091.0090.00喝茶后體重:63.0071.0079.0073.0074.0065.0067.0073.00喝茶前體重:86.0087.0098.0088.0082.0087.0092.0093.00喝茶后體重:60.0076.0071.0072.0075.0062.0067.0074.00喝茶前體重:95.0084.0083.0089.0087.0090.082.0095.00喝茶后體重:78.0068.0074.0071.0060.0070.0067.0069.00喝茶前體重:81.0083.0086.0093.0095.0096.0097.0081.00喝茶后體重:79.0073.0074.0060.0060.0075.0077.0070.00喝茶前體重:88.0085.0095.00喝茶后體重:63.0073.0068.00具體操作(1) 選擇菜單分析→比較均值→配對樣本T檢驗,于是出現如圖5-9所示的窗口。(2)

選擇左側“喝茶前體重”“喝茶后體重”到【成對變量】框。(3) 兩配對樣本t檢驗的選項含義與單樣本t檢驗的相同分析結果如下:表5-10給出了喝茶前與喝茶后體重的基本描述統計量,表明喝茶前與喝茶后樣本的平均值有較大差異。喝茶后的平均體重低于喝茶前的平均體重。表5-10成對樣本統計量均值N標準差均值的標準誤對1喝茶前體重89.2571355.33767.90223喝茶后體重70.0286355.66457.95749表5-11給出了喝茶前與喝茶后體重的簡單相關關系及檢驗表5-11成對樣本相關系數N相關系數Sig.對

1

喝茶前體重

&

喝茶后體重35-.052.7685-12

成對樣本檢驗成對差分tdfSig.(雙側)均值標準差均值的標準誤差分的95%置信區間下限上限對

喝茶

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論