




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、. 統計分析的目的是研究總體的數量特征。為實現上述分析,統計分析的目的是研究總體的數量特征。為實現上述分析,往往采用兩種方式實現:第一,數值計算,即計算常用的基本往往采用兩種方式實現:第一,數值計算,即計算常用的基本統計量的值,通過數值來準確反映數據的基本統計特征;第二,統計量的值,通過數值來準確反映數據的基本統計特征;第二,圖形繪制,即繪制常見的基本統計圖形,通過圖形來直觀展現圖形繪制,即繪制常見的基本統計圖形,通過圖形來直觀展現數據的分布特點。通常,這兩種方式都是混合使用的。數據的分布特點。通常,這兩種方式都是混合使用的。 . 1.1.使用目的使用目的 頻數分布表是描述性統計中最常用的方法
2、之一。它頻數分布表是描述性統計中最常用的方法之一。它主要能夠了解變量取值的狀況,對把握數據分布特主要能夠了解變量取值的狀況,對把握數據分布特征非常有用。例如,了解某班學生考試的學習成績、征非常有用。例如,了解某班學生考試的學習成績、了解某地區居民的收入水平等都可以借助于頻數分了解某地區居民的收入水平等都可以借助于頻數分析。析。 3.1.1 3.1.1 頻數分析的基本原理頻數分析的基本原理. 頻率分析頻率分析 過程就是專門為產生頻數表而設計的。它不過程就是專門為產生頻數表而設計的。它不僅可以產生詳細的頻數表,還可以按要求給出某百分僅可以產生詳細的頻數表,還可以按要求給出某百分位點的數值以及常用的
3、條圖、餅圖等統計圖。同時,位點的數值以及常用的條圖、餅圖等統計圖。同時,SPSSSPSS的頻數分析還可以進行分位數、描述集中趨勢的的頻數分析還可以進行分位數、描述集中趨勢的基本統計量等計算功能。這些統計量的具體分析會在基本統計量等計算功能。這些統計量的具體分析會在以后章節中講解。以后章節中講解。.(1 1)采用重抽樣技術從原始樣本中抽取一定數量(自)采用重抽樣技術從原始樣本中抽取一定數量(自己給定)的樣本,此過程允許重復抽樣。己給定)的樣本,此過程允許重復抽樣。 (2 2)根據抽出的樣本計算給定的統計量)根據抽出的樣本計算給定的統計量T T。 (3 3)重復上述)重復上述N N次(一般大于次(
4、一般大于10001000),得到),得到N N個統計量個統計量T T。 (4 4) 計算上述計算上述N N個統計量個統計量T T的樣本值,最終得到統計的樣本值,最終得到統計量的估計值。量的估計值。. 選擇菜單欄中的選擇菜單欄中的【分析分析】【描述統計描述統計】【頻率頻率】命令,彈出命令,彈出【頻率頻率】對話框,如圖對話框,如圖3-1所示,所示,這這是頻數分析的主操作窗口。是頻數分析的主操作窗口。Step 01圖圖3-13-1【頻率頻率】對話框對話框. 在左側的候選變量列表框中,選取一個或多個在左側的候選變量列表框中,選取一個或多個待分析變量,單擊待分析變量,單擊 按鈕,將它們移入右側的按鈕,將
5、它們移入右側的【變量變量】列列表框中。表框中。 勾選勾選【顯示頻率表格顯示頻率表格】復選框,輸出頻數分析表。復選框,輸出頻數分析表。 在該對話框中還可以單擊在該對話框中還可以單擊【統計量統計量】和和【圖表圖表】等按鈕,進行其他基本統計分析,這些選項提供了豐富的統等按鈕,進行其他基本統計分析,這些選項提供了豐富的統計輸出結果。計輸出結果。Step02Step03Step 04. 單擊單擊【統計量統計量】按鈕,彈出如圖按鈕,彈出如圖3-2所示的所示的【頻率:頻率:統計量統計量】對話框,該對話框主要用于輸出各類基本統計對話框,該對話框主要用于輸出各類基本統計量結果。量結果。圖圖3-2 3-2 【頻率
6、:統計量頻率:統計量】對話框對話框. 單擊單擊【圖表圖表】按鈕,彈出如圖按鈕,彈出如圖3-3所示的所示的【頻率:頻率:圖圖表表】對話框對話框,該對話框主要用于輸出圖形結果。該對話框主要用于輸出圖形結果。圖圖3-3 3-3 【頻率:圖表頻率:圖表】對話框對話框. 單擊圖單擊圖3-1中的中的【格式格式】按鈕,彈出如圖按鈕,彈出如圖3-4所示的所示的【頻率:格式頻率:格式】對話框,在此對話框中可以設對話框,在此對話框中可以設置頻數表輸出的格式。置頻數表輸出的格式。Step 05圖圖3-4 3-4 【頻率:格式頻率:格式】對話框對話框. 單擊圖單擊圖3-1中的中的【Bootstrap】按鈕,彈出如圖按
7、鈕,彈出如圖3-5所示的所示的【Bootstrap】對話框,在此對話框中可以進行下述對話框,在此對話框中可以進行下述統計量的統計量的Bootstrap估計估計。 支持均值、標準差、方差、中位數、偏度、峰度和百分支持均值、標準差、方差、中位數、偏度、峰度和百分位位數的數的Bootstrap估計。估計。 支持百分比的支持百分比的Bootstrap估計。估計。Step 06圖3-5 【Bootstrap】對話框. 單擊單擊【確定確定】按鈕結束操作,按鈕結束操作,SPSS軟軟件自動件自動輸出結果。輸出結果。Step 07. 假設某公司每周大約賣出假設某公司每周大約賣出20002000萬件產品,但市場的
8、需求萬件產品,但市場的需求不不穩定,該公司的生產經理想更好的掌握近期該產品的分布情穩定,該公司的生產經理想更好的掌握近期該產品的分布情況。假設下面給出的銷售數字(單位:百萬)代表近期公司況。假設下面給出的銷售數字(單位:百萬)代表近期公司該產品每周的銷售數據。利用頻數分析你能得到什么有助于該產品每周的銷售數據。利用頻數分析你能得到什么有助于生產及銷售的的信息?生產及銷售的的信息? 24 18 18 26 24 23 16 18 21 20 21 24 19 24 18 18 26 24 23 16 18 21 20 21 24 19 19 14 22 21 26 27 15 19 17 20
9、20 19 22 19 14 22 21 26 27 15 19 17 20 20 19 22 23 16 23 21 15 19 21 20 22 15 24 1923 16 23 21 15 19 21 20 22 15 24 19. 打開打開SPSS軟件和數據文件軟件和數據文件3-1.sav,選擇菜單欄,選擇菜單欄中的中的【分析分析】【描述統計描述統計】【頻率頻率】命令,彈出命令,彈出【頻率頻率】對話框,如圖對話框,如圖3-6所示。所示。Step 01圖圖3-6 3-6 【頻率頻率】對話框對話框. 在左側的候選變量列表框中選擇在左側的候選變量列表框中選擇“sale”變量,將變量,將其添加
10、至其添加至【變量變量】列表框中,表示它是進行頻數分析的變量,列表框中,表示它是進行頻數分析的變量,如圖如圖3-7所示。所示。Step 02圖圖3-7 3-7 選擇分析變量選擇分析變量. 單擊單擊【統計量統計量】按鈕,彈出如圖按鈕,彈出如圖3-8所示的所示的【頻頻率:率:統計量統計量】對話框;勾選對話框;勾選【四分位數四分位數】復選框,要求輸出四分復選框,要求輸出四分數,然后單擊數,然后單擊【繼續繼續】按鈕,返回按鈕,返回【頻率頻率】對話框。對話框。Step 03圖圖3-8 3-8 選擇輸出統計量選擇輸出統計量. 單擊單擊【圖表圖表】按鈕,彈出如圖按鈕,彈出如圖3-9所示的所示的【頻率:頻率:圖
11、圖表表】對話框,由于該數據屬于數值型,因此點選對話框,由于該數據屬于數值型,因此點選【條形圖條形圖】單選鈕,表示結果輸出條形圖;再單擊單選鈕,表示結果輸出條形圖;再單擊【繼續繼續】按鈕,返回按鈕,返回【頻率頻率】對話框。對話框。Step 04圖圖3-9 3-9 選擇輸出圖形類型選擇輸出圖形類型. 單擊單擊【確定確定】按鈕完成操作。按鈕完成操作。(1 1)基本統計結果輸出)基本統計結果輸出 Step 05 頻數分析基本統計結果頻數分析基本統計結果N N有效有效3838缺失缺失0 0PercentilesPercentiles252518.0018.00505020.0020.00757523.0
12、023.00.(2)頻數分析表輸出)頻數分析表輸出 頻數分析表頻數分析表頻率頻率百分百百分百 有效百分比有效百分比 累積百分比累積百分比有有效效14141 12.62.62.62.62.62.615153 37.97.97.97.910.510.516162 25.35.35.35.315.815.817171 12.62.62.62.618.418.418183 37.97.97.97.926.326.319196 615.815.815.815.842.142.120204 410.510.510.510.552.652.621215 513.213.213.213.265.865.822
13、223 37.97.97.97.973.773.723233 37.97.97.97.981.681.624244 410.510.510.510.592.192.126262 25.35.35.35.397.497.427271 12.62.62.62.6100.0100.0TotTotal al3838100.0100.0100.0100.0.(3)(3)直方圖直方圖.3.2.1 3.2.1 描述統計分析的基本原理描述統計分析的基本原理 1.1.使用目的使用目的 2.2.刻畫集中趨勢的描述統計量刻畫集中趨勢的描述統計量 3. 3.刻畫離散程度的描述統計量刻畫離散程度的描述統計量 4. 4.
14、刻畫分布形態的描述統計量刻畫分布形態的描述統計量. 描述過程過程是連續資料統計描述應用最多的一個過程,描述過程過程是連續資料統計描述應用最多的一個過程,它可對變量進行描述性統計分析計算,并列出一系列相應的它可對變量進行描述性統計分析計算,并列出一系列相應的統計指標。這和其他過程相比并無不同。但該過程還有個特統計指標。這和其他過程相比并無不同。但該過程還有個特殊功能,就是可將原始數據轉換成標準化值,并以變量的形殊功能,就是可將原始數據轉換成標準化值,并以變量的形式保存。式保存。 . 選擇菜單欄中的選擇菜單欄中的【分析分析】【描述統計描述統計】【描描述述】命令,彈出命令,彈出【描述性描述性】對話框
15、,如圖對話框,如圖3-12所示,該對所示,該對話話框是描述性統計分析的主操作窗口。框是描述性統計分析的主操作窗口。Step 01圖圖3-12 3-12 【描述描述】對話框對話框. 在在左側的候選變量列表框中選取一個或多左側的候選變量列表框中選取一個或多個待分個待分析變量,將它們移入右側的析變量,將它們移入右側的【變量變量】列表框中。列表框中。 單擊單擊【選項選項】按鈕,彈出如圖按鈕,彈出如圖3-13所示的所示的【描描述:選項述:選項】對話框,該對話框用于指定輸出的描述性統計對話框,該對話框用于指定輸出的描述性統計量。這些統計量的含義是:均數、總和、標準差、方差、量。這些統計量的含義是:均數、總
16、和、標準差、方差、全距、最小值)、最大值、標準誤差、峰度系數和偏度系全距、最小值)、最大值、標準誤差、峰度系數和偏度系數。數。Step 02Step 03圖圖3-133-13【描述:選項描述:選項】對話框對話框. 在在【描述性描述性】對話框中,勾選對話框中,勾選【將標準化得分另將標準化得分另存為變量存為變量】復選框,表示對所選擇的每一個變量進行標準化復選框,表示對所選擇的每一個變量進行標準化處理,同時產生相應的處理,同時產生相應的Z得分,并作為新變量保存到數據窗得分,并作為新變量保存到數據窗口中。口中。 單擊單擊【Bootstrap】按鈕,彈出如圖按鈕,彈出如圖3-5所示所示的的【Bootst
17、rap】對話框,在此對話框中可以進行均值、標準對話框,在此對話框中可以進行均值、標準差、方差、偏度和峰度的差、方差、偏度和峰度的Bootstrap估計。估計。 單擊單擊【確定確定】按鈕結束操作,按鈕結束操作,SPSS軟件自動輸軟件自動輸出結果。出結果。Step 04Step 05Step 06.請你分析不同性別演員獲得奧斯卡獎的年齡差異性。請你分析不同性別演員獲得奧斯卡獎的年齡差異性。 男演員:男演員:32 37 36 32 51 53 33 61 35 32 37 36 32 51 53 33 61 35 45 55 39 76 37 42 40 32 60 38 56 45 55 39 7
18、6 37 42 40 32 60 38 56 48 48 40 43 62 43 42 44 41 56 39 48 48 40 43 62 43 42 44 41 56 39 46 31 47 45 6046 31 47 45 60 女演員:女演員:50 44 35 80 26 28 41 21 61 50 44 35 80 26 28 41 21 61 38 49 33 74 30 33 41 31 35 41 42 38 49 33 74 30 33 41 31 35 41 42 37 26 34 34 35 26 61 60 34 24 30 37 37 26 34 34 35 26
19、61 60 34 24 30 37 31 27 39 3431 27 39 34. 打開隨書光盤中的數據文件打開隨書光盤中的數據文件3-2.sav,其中,其中“male”和和“female”列分別表示男演員和女演員;選擇列分別表示男演員和女演員;選擇菜單欄中的菜單欄中的【分析分析】【描述性統計描述性統計】【描述描述】命令,彈命令,彈出出【描述性描述性】對話框,如圖對話框,如圖3-14所示。所示。Step 01圖圖3-14 3-14 【描述性描述性】對話框對話框. 在左側的候選變量列表框中選擇在左側的候選變量列表框中選擇“male”和和“female”變量,將其添加至變量,將其添加至【變量變量】
20、列表框中,表示它是列表框中,表示它是進行描述性統計分析的變量,如圖進行描述性統計分析的變量,如圖3-15所示。所示。Step 02圖圖3-15 3-15 選擇分析變量選擇分析變量. 單擊單擊【選項選項】按鈕,其主要目的是選擇需要輸出按鈕,其主要目的是選擇需要輸出的描述性統計量,這里除了選擇系統默認的統計量外,還勾的描述性統計量,這里除了選擇系統默認的統計量外,還勾選了范圍、偏度系數和峰度系數復選框;再單擊選了范圍、偏度系數和峰度系數復選框;再單擊【繼續繼續】按按鈕,返回鈕,返回【描述性描述性】對話框,如圖對話框,如圖3-16所示。所示。 單擊單擊【確定確定】按鈕完成操作。按鈕完成操作。Step
21、 03Step 04圖圖3-16 3-16 選擇輸出圖形類型選擇輸出圖形類型.男演員女演員Valid N (listwise)N統計量363636全距統計量4559極小值統計量3121極大值統計量7680均值統計量45.1438.94標準差統計量10.40613.546偏度統計量0.8981.503標準誤0.3930.393峰度統計量0.7042.111標準誤0.7680.768.3.3.1 3.3.1 探索性分析的基本原理探索性分析的基本原理 1.1.使用目的使用目的 探索性數據分析(探索性數據分析(Exploratary Data AnalysisExploratary Data Anal
22、ysis,簡稱簡稱EDAEDA)的基本思想是從數據本身出發,不拘泥于模)的基本思想是從數據本身出發,不拘泥于模型的假設而采用非常靈活的方法來探討數據分布的大型的假設而采用非常靈活的方法來探討數據分布的大致情況,也可以為進一步結合模型的研究提供線索,致情況,也可以為進一步結合模型的研究提供線索,為傳統的統計推斷提供良好的基礎和減少盲目性。為傳統的統計推斷提供良好的基礎和減少盲目性。.2.2.主要內容主要內容一般來說,進行探索性分析主要考察以下內容。一般來說,進行探索性分析主要考察以下內容。(1)(1)檢查數據是否有錯。過大或過小的數據均可能是異檢查數據是否有錯。過大或過小的數據均可能是異常值、影
23、響點或錯誤值。要檢查這樣的數據,并分析常值、影響點或錯誤值。要檢查這樣的數據,并分析原因,然后決定是否從分析中剔除這些數據。原因,然后決定是否從分析中剔除這些數據。(2)(2)獲得數據分布特征。很多統計方法模型對數據的分獲得數據分布特征。很多統計方法模型對數據的分布有要求,如方差分析就需要數據服從正態分布。布有要求,如方差分析就需要數據服從正態分布。(3)(3)對數據的初步觀察,發現一些內在規律對數據的初步觀察,發現一些內在規律。. SPSS SPSS中的探索過程用于計算指定變量的探索性統計量和中的探索過程用于計算指定變量的探索性統計量和有關的圖形。它既可以對觀測量整體分析,也可以進行分組有關
24、的圖形。它既可以對觀測量整體分析,也可以進行分組分析。從這個過程可以獲得箱線圖、莖葉圖、直方圖、各種分析。從這個過程可以獲得箱線圖、莖葉圖、直方圖、各種正態檢驗圖、頻數表、方差齊性檢驗等結果,以及對非正態正態檢驗圖、頻數表、方差齊性檢驗等結果,以及對非正態或正態非齊性數據進行變換,并表明和檢驗連續變量的數值或正態非齊性數據進行變換,并表明和檢驗連續變量的數值分布情況。分布情況。. 選擇菜單欄中的選擇菜單欄中的【分析分析】【描述統計描述統計】【探索探索】命令,彈出命令,彈出【探索探索】對話框,如圖對話框,如圖3-17所示所示,該對話框是探索性分析的主操作窗口。該對話框是探索性分析的主操作窗口。S
25、tep 01圖圖3-17 3-17 【探索探索】對話框對話框. 在對話框左側的候選變量列表框中選取一個或多在對話框左側的候選變量列表框中選取一個或多個待分析變量,將它們移入右側的個待分析變量,將它們移入右側的【因變量列表因變量列表】列表框中列表框中,表示要進行探索性分析的變量。,表示要進行探索性分析的變量。 在候選變量列表框中可以選取一個或多個分組變在候選變量列表框中可以選取一個或多個分組變量,將它們移入右側的量,將它們移入右側的【因子列表因子列表】列表框中。分組變量的列表框中。分組變量的選擇可以將數據按該變量中的觀測值進行分組分析。如果選選擇可以將數據按該變量中的觀測值進行分組分析。如果選擇
26、的分組變量不止一個,那么會以分組變量的不同取值進行擇的分組變量不止一個,那么會以分組變量的不同取值進行組合分組。組合分組。 從候選變量列表框中選擇一個變量作為標識變量從候選變量列表框中選擇一個變量作為標識變量,并將其移入,并將其移入【標注個案標注個案】列表框中。選擇標識變量的作用列表框中。選擇標識變量的作用在于,當系統在數據探索過程中發現異常值時,便可利用標在于,當系統在數據探索過程中發現異常值時,便可利用標識變量加以標記,以便于用戶找這些異常值。如果不選擇它識變量加以標記,以便于用戶找這些異常值。如果不選擇它,系統默認以,系統默認以ID變量作為標識變量。變量作為標識變量。Step 02Ste
27、p 03Step 04. 在在【探索探索】對話框下面的對話框下面的【輸出輸出】選項組中可選項組中可以選擇以下輸出項。以選擇以下輸出項。 兩者都:輸出圖形以及描述性統計量。兩者都:輸出圖形以及描述性統計量。 統計量:只輸出描述統計量。統計量:只輸出描述統計量。 圖:只輸出圖形。圖:只輸出圖形。 在在【探索探索】對話框中還可以點選對話框中還可以點選【統計量統計量】單單選鈕,這個選項提供了各類基本描述性統計輸出結果;選鈕,這個選項提供了各類基本描述性統計輸出結果;Step 06Step 07圖圖3-18 3-18 【探索:統計量)探索:統計量)】對話框對話框. 在在【探索探索】對話框中還可以點選對話
28、框中還可以點選【繪制繪制】單選鈕,單選鈕,它提供了圖形輸出類型。它提供了圖形輸出類型。Step 07圖圖3-19 3-19 【探索:圖探索:圖】對話框對話框. 在在【探索探索】對話框中還可以單擊對話框中還可以單擊【選項選項】按鈕按鈕,彈出如圖,彈出如圖3-20所示的所示的【探索:選項探索:選項】對話框,在該對話對話框,在該對話框中確定對待缺失值的方式。框中確定對待缺失值的方式。Step 08圖圖3-20 3-20 【探索:選項探索:選項】對話框對話框. 單擊單擊【Bootstrap】按鈕,彈按鈕,彈【Bootstrap】對話框,在該對話框中可以進行如下統計量對話框,在該對話框中可以進行如下統計
29、量Bootstrap估計。估計。 支持均值、支持均值、5% 切尾均值、標準差、方差、中位數、切尾均值、標準差、方差、中位數、偏度、峰度和內距的偏度、峰度和內距的Bootstrap估計。估計。 M估計量表支持估計量表支持Huber的的M估計量、估計量、Tukey的雙權重的雙權重、Hampel的的M 估計量和估計量和Andrew的的Wave的的Bootstrap 估計。估計。 百分位數表支持百分位數的百分位數表支持百分位數的Bootstrap估計。估計。 單擊單擊【確定確定】按鈕結束操作,按鈕結束操作,SPSS軟件自軟件自動輸出結果。動輸出結果。Step 09Step 10. 打開隨書光盤中的數據
30、文件打開隨書光盤中的數據文件3-3.sav,其中增加變,其中增加變量量“地域地域”表示所在城市的區域位置,表示所在城市的區域位置,“1”表示南方城市,表示南方城市,“2”表示北方城市。選擇菜單欄中的表示北方城市。選擇菜單欄中的【分析分析】【描述統描述統計計】【探索探索】命令,彈出命令,彈出【探索探索】對話框,如圖對話框,如圖3-21所所示。示。Step 01圖圖3-21 3-21 【探索探索】對話框對話框. 在候選變量列表框中將變量在候選變量列表框中將變量“年平均溫度年平均溫度”添加至添加至【因變量列表因變量列表】列表框中,表示它是進行探索列表框中,表示它是進行探索性分析的變量。性分析的變量。
31、 將變量將變量“地域地域”添加至添加至【因子列表因子列表】列表列表框中,表示根據地域位置不同來進行數據分析。框中,表示根據地域位置不同來進行數據分析。Step 02Step 03. 選擇變量選擇變量“城市城市”移入移入【標注個案標注個案】列表列表框作為標識變量,如圖框作為標識變量,如圖3-22所示。所示。Step04圖圖3-22 3-22 選擇變量選擇變量. 單擊單擊【統計量統計量】按鈕,在彈出的如圖按鈕,在彈出的如圖3-23所示所示的的【探索:統計量探索:統計量】對話框中勾選對話框中勾選【M-估計量估計量】復選框,分復選框,分析析樣本數據的穩定性,其他選項保持默認狀態;單擊樣本數據的穩定性,
32、其他選項保持默認狀態;單擊【繼續繼續】按鈕,返回按鈕,返回【探索探索】對話框。對話框。Step05圖圖3-23 3-23 【探索:統計量探索:統計量】對話框對話框. 單擊單擊【確定確定】按鈕完成操作。按鈕完成操作。Step 06.(1)(1)基本統計信息匯總基本統計信息匯總 基本統計信息基本統計信息地地域域案例有效有效缺失缺失合計合計N N百分比百分比百百分分比比N N百分比百分比年平年平均氣均氣溫溫南南方方1616100.0100.0%0 0 0%0% 1616100.0%100.0%北北方方1717100.0100.0%0 0 0%0% 1717100.0%100.0%.(2 2)描述性統
33、計量表)描述性統計量表 地域地域統計量統計量標準誤標準誤年年平平均均氣氣溫溫南方南方均值均值18.700018.70000.672000.67200均值的均值的95% 95% 置置信區間信區間下限下限17.267717.2677上限上限20.132320.13235% 5% 修整均值修整均值18.577818.5778均值均值17.800017.8000方差方差7.2257.225標準差標準差2.688002.68800極小值極小值14.6014.60極大值極大值25.0025.00范圍范圍10.4010.40四分位距四分位距3.253.25偏度偏度1.0011.0010.5640.564峰度
34、峰度0.7820.7821.0911.091.北方北方均值均值11.035311.03530.800780.80078均值的均值的95% 95% 置置信區間信區間下限下限9.33779.3377上限上限12.732912.73295% 5% 修整均值修整均值11.105911.1059均值均值11.000011.0000方差方差10.90110.901標準差標準差3.301693.30169極小值極小值5.405.40極大值極大值15.4015.40范圍范圍10.0010.00四分位距四分位距5.655.65偏度偏度-0.251-0.2510.5500.550峰度峰度-1.178-1.1781
35、.0631.063.(3 3)M M估計量估計量 M M估計量結果表估計量結果表a. a. 權數取值為權數取值為 1.339.1.339.b. b. 權數取值為權數取值為4.685.4.685.c. c. 權數取值分別為權數取值分別為1.700,3.400, 1.700,3.400, and 8.500and 8.500d. d. 權數取值為權數取值為1.3401.340* *pi.pi.地域地域HubeHuber r的的M-M-估計估計器器a aTukeyTukey的雙的雙權重權重b bHampelHampel的的M-M-估計器估計器c cAndrewsAndrews波波d d年平均氣年平均
36、氣溫溫南方南方18.0618.06949417.7217.72080817.977617.977617.718217.7182北方北方11.2011.20757511.1711.17060611.174111.174111.169611.1696.探索性分析的莖葉探索性分析的莖葉圖年平均氣溫年平均氣溫Stem-and-LeafPlotfor地域地域=南方南方FrequencyStem&Leaf1.001.411.001.667777778893.002.0121.00Extremes(=25)Stemwidth:10.0Eachleaf:1case(s)年平均氣溫年平均氣溫Stem-a
37、nd-LeafPlotfor地域地域=北方北方FrequencyStem&Leaf6.000.5668898.001.001133343.001.555Stemwidth:10.0Eachleaf:1case(s).3.4.1 3.4.1 列聯表分析的基本原理列聯表分析的基本原理 1.1.使用目的使用目的 列聯表是指一個頻率對應兩個變量的表(一個列聯表是指一個頻率對應兩個變量的表(一個變量用來對行分類,第二個變量用來對列分類)。列變量用來對行分類,第二個變量用來對列分類)。列聯表非常重要,它經常被用來分析調查結果。它有兩聯表非常重要,它經常被用來分析調查結果。它有兩個基本任務:第一,根
38、據收集到的樣本數據產生二維個基本任務:第一,根據收集到的樣本數據產生二維或多維交叉列聯表;第二,在列聯表基礎上,對兩兩或多維交叉列聯表;第二,在列聯表基礎上,對兩兩變量間是否存在一定的相關性進行分析。變量間是否存在一定的相關性進行分析。.2.2.交叉列聯表交叉列聯表 .3.3.行列變量間關系的分析行列變量間關系的分析 列聯表的頻數分布不可能用來直接確定行、列變量列聯表的頻數分布不可能用來直接確定行、列變量之間的關系及關系的強弱。令人感興趣的二維列聯表之間的關系及關系的強弱。令人感興趣的二維列聯表的檢驗問題是行、列變量的獨立性檢驗。的檢驗問題是行、列變量的獨立性檢驗。 獨立性檢驗指的是對列聯表中
39、行變量和列變量無關獨立性檢驗指的是對列聯表中行變量和列變量無關這個零假設進行的檢驗,即檢驗行、列變量之間是否這個零假設進行的檢驗,即檢驗行、列變量之間是否彼此獨立。常用的衡量變量間相關程度的統計量是簡彼此獨立。常用的衡量變量間相關程度的統計量是簡單相關系數,但在交叉列聯表分析中,由于行、列變單相關系數,但在交叉列聯表分析中,由于行、列變量往往不是連續等距變量,不符合計算簡單相關系數量往往不是連續等距變量,不符合計算簡單相關系數的前提要求。的前提要求。.所以,一般采用的檢驗方法是卡方(所以,一般采用的檢驗方法是卡方(2 2)檢驗,)檢驗,它的計算公式為:它的計算公式為:202eefff其中,其中
40、,f f0 0表示實際觀察頻數,表示實際觀察頻數,f fe e表示期望頻數。表示期望頻數。 . 選擇菜單欄中的選擇菜單欄中的【分析分析】【描述統計描述統計】【交交叉表叉表】命令,彈出命令,彈出【交叉表交叉表】對話框,如圖對話框,如圖3-25所示,這所示,這是是列聯表分析的主操作窗口。列聯表分析的主操作窗口。Step 01圖圖3-25 3-25 【交叉表交叉表】對話框對話框. 在左側的候選變量列表框中選取一個或多個待分析在左側的候選變量列表框中選取一個或多個待分析變量,將它們移入右側的變量,將它們移入右側的【行行】列表框中,作為列聯表的行列表框中,作為列聯表的行變量;同理,選擇若干候選變量移入右
41、側的變量;同理,選擇若干候選變量移入右側的【列列】列表框中列表框中,作為列聯表的列變量。,作為列聯表的列變量。 如果要進行三維或多維列聯表分析,可以根據需如果要進行三維或多維列聯表分析,可以根據需要選擇控制變量進入要選擇控制變量進入【層層1的的1】列表另外一個控制變量,列表另外一個控制變量,首首先單擊先單擊【下一張)下一張)】按鈕,再選入一個變量;單擊按鈕,再選入一個變量;單擊【上一張上一張】按鈕可以重新選擇以前確定的變量。按鈕可以重新選擇以前確定的變量。 在在【交叉表交叉表】對話框下面有兩個復選框,它們用對話框下面有兩個復選框,它們用來選擇列聯表的輸出格式。來選擇列聯表的輸出格式。 顯示復式
42、條形圖:顯示各變量交叉分組下的頻數分布條形顯示復式條形圖:顯示各變量交叉分組下的頻數分布條形圖。圖。 取消表格:只輸出統計量,而不輸出列聯表。取消表格:只輸出統計量,而不輸出列聯表。Step 02Step 03Step 04. 在在【交叉表交叉表】對話框中單擊對話框中單擊【統計量統計量】按鈕,彈按鈕,彈出如圖出如圖3-26所示的所示的【交叉表:統計量交叉表:統計量】對話框。該對話框對話框。該對話框主主要是根據數據類型選擇不同的獨立性檢驗方法和相關度量,要是根據數據類型選擇不同的獨立性檢驗方法和相關度量,在對話框中選擇輸出統計量,完成后單擊在對話框中選擇輸出統計量,完成后單擊【繼續繼續】按鈕,返
43、按鈕,返回主對話框。回主對話框。Step 05圖圖3-26 3-26 【交叉表:統計量)交叉表:統計量)】. 在在【交叉表交叉表】對話框中單擊對話框中單擊【單元格單元格】按鈕,彈按鈕,彈出如圖出如圖3-27所示的所示的【交叉表:單元顯示交叉表:單元顯示】對話框,在該對對話框,在該對話話框中可以選擇顯示在列聯表單元格中的統計量,包括觀測數框中可以選擇顯示在列聯表單元格中的統計量,包括觀測數量、百分比和殘差,在對話框中選擇相應選項,完成后單擊量、百分比和殘差,在對話框中選擇相應選項,完成后單擊【繼續繼續】按鈕,返回主對話框。按鈕,返回主對話框。Step 06圖圖3-27 3-27 【交叉表:單元顯
44、示交叉表:單元顯示】對話框對話框. 在在【交叉表交叉表】對話框中單擊對話框中單擊【格式格式】按鈕,按鈕,彈出如圖彈出如圖3-28所示的所示的【交叉表:格式交叉表:格式】對話框,用于對話框,用于選擇各單元格的輸出排列順序。選擇各單元格的輸出排列順序。Step 07圖圖3-28 3-28 【交叉表:格式交叉表:格式】對話框對話框. 在在【交叉表交叉表】對話框中單擊對話框中單擊【Bootstrap】按鈕,按鈕,彈出彈出【Bootstrap】對話框,在該對話框中可以進行如下統對話框,在該對話框中可以進行如下統計量的計量的Bootstrap估計。估計。 單擊單擊【OK】按鈕結束操作,按鈕結束操作,SPS
45、S軟件自動輸出軟件自動輸出結果。結果。Step 08Step 09.1.1.實例內容實例內容 在一次上海大學生身體素質的實際調查中,選擇了部分在一次上海大學生身體素質的實際調查中,選擇了部分大專院校的學生進行實際問卷調查,收集的數據見大專院校的學生進行實際問卷調查,收集的數據見3-4.sav3-4.sav。調查內容主要包括:性別、出生日期、身高、體重、血型、調查內容主要包括:性別、出生日期、身高、體重、血型、教育背景、學科、男女身高級別和男女體重級別等內容。請教育背景、學科、男女身高級別和男女體重級別等內容。請根據調查數據分析下面問題:根據調查數據分析下面問題: (1)進行)進行“性別性別”和
46、和“體重級別體重級別”雙因素交叉作用下的列雙因素交叉作用下的列聯表分析,并研究聯表分析,并研究“性別性別”對對“體重級別體重級別”有無顯著性影響有無顯著性影響。 (2)進行)進行“教育背景教育背景”和和“身高級別身高級別”雙因素交叉作用下雙因素交叉作用下的列聯表分析,并研究的列聯表分析,并研究“教育背景教育背景”對對“身高級別身高級別”有無顯有無顯著性影響。著性影響。. 打開數據文件打開數據文件3-4.sav,選擇菜單欄中的,選擇菜單欄中的【分析分析】【描述統計描述統計】【交叉表交叉表】命令,彈出命令,彈出【交叉表交叉表】對話對話框,如圖框,如圖3-29所示。所示。Step 01圖圖3-29
47、3-29 【交叉表交叉表】對話框對話框. 在候選變量列表框中將變量在候選變量列表框中將變量“性別(性別(sex)”添加添加至至【行行】列表框中,表示它是交叉列聯表中的行變量;將變列表框中,表示它是交叉列聯表中的行變量;將變量量“體重級別(體重級別(wm)”添加至添加至【列列】列表框中,表示它是列表框中,表示它是交叉列聯表中的列變量,如圖交叉列聯表中的列變量,如圖3-30所示。所示。Step 02圖圖3-30 3-30 選擇行、列變量選擇行、列變量. 單擊單擊【統計量統計量】按鈕,彈出按鈕,彈出【交叉表:統計量交叉表:統計量】對話框,如圖對話框,如圖3-31所示;勾選所示;勾選【卡方卡方】復選框
48、,利用復選框,利用卡卡方檢驗來檢驗方檢驗來檢驗“性別性別”和和“體重級別體重級別”的獨立性;再單擊的獨立性;再單擊【繼續繼續】按鈕,返回按鈕,返回【交叉表交叉表】對話框。對話框。Step 03圖3-31 【交叉表:統計量)】對話框. 由于要進行由于要進行“性別性別”和和“體重級別體重級別”的頻數分析的頻數分析,因此在,因此在【交叉表交叉表】對話框中單擊對話框中單擊【Cells(單元)(單元)】選項選項,彈出,彈出【交叉表:單元顯示交叉表:單元顯示】對話框,如圖對話框,如圖3-32所示;所示;勾勾選選【百分比百分比】選項組中的選項組中的【行行】、【列列】和和【總數總數】復選復選框,再單擊框,再單
49、擊【繼續繼續】按鈕,返回按鈕,返回【交叉表交叉表】對話框。對話框。Step 04圖圖3-32 3-32 選擇列聯表輸出格式選擇列聯表輸出格式. 勾選勾選【顯示復式條形圖顯示復式條形圖】復選框,表示利用條復選框,表示利用條形圖來反映不同性別之間的體重級別差異,如圖形圖來反映不同性別之間的體重級別差異,如圖3-33所示。所示。Step 05圖圖3-33 3-33 勾選復選框勾選復選框. 單擊單擊【確定確定】按鈕完成操作。按鈕完成操作。Step 06. (1 1)基本統計信息匯總)基本統計信息匯總基本統計信息匯總基本統計信息匯總有效缺失合計N百分比N百分比N百分比性別 * 體重級別214 100.0
50、%00.0%214100.0%.(2 2)“性別性別”和和“體重級別體重級別”的列聯表的列聯表 表表3-11 “3-11 “性別性別”和和“體重級別體重級別”變量的列聯表變量的列聯表體重級別體重級別合計合計輕(輕(60-60-)中等中等(60607070)重重(70+70+)性別性別男男計數計數1717353517176969性別中的性別中的%24.6%24.6%50.7%50.7%24.6%24.6%100.0100.0%體重級別中體重級別中的的%11.1%11.1%85.4%85.4%85.0%85.0%32.2%32.2%總數的總數的% % 7.9%7.9%16.4%16.4%7.9%7
51、.9%32.2%32.2%女女計數計數1361366 63 3145145性別中的性別中的%93.8%93.8%4.1%4.1%2.1%2.1%100.0100.0%體重級別中體重級別中的的%88.9%88.9%14.6%14.6%15.0%15.0%67.8%67.8%總數的總數的% % 63.6%63.6%2.8%2.8%1.4%1.4%67.8%67.8%合計合計計數計數15315341412020214214性別中的性別中的%71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%體重級別中體重級別中的的%100.0%100.0%100.0%100.0%100.0
52、%100.0%100.0100.0%總數的總數的% % 71.5%71.5%19.2%19.2%9.3%9.3%100.0100.0%.(3 3)“性別性別”和和“體重級別體重級別”的獨立性檢驗的獨立性檢驗表表3-12 3-12 卡方檢驗結果卡方檢驗結果值值dfdf漸進漸進 Sig. Sig. (雙側)(雙側)Pearson Pearson 卡方卡方2 20.0000.000似然比似然比111.290111.2902 20.0000.000線性和線性組合線性和線性組合92.73992.7391 10.0000.000有效案例中的有效案例中的N N214214.(4 4)體重級別條形圖)體重級別
53、條形圖.3.5.1 3.5.1 比率分析的基本原理比率分析的基本原理 比率分析生成比率變量,并對該比率變量計算基本描比率分析生成比率變量,并對該比率變量計算基本描述性統計量(如均值、中位數、標準差、全距等),進述性統計量(如均值、中位數、標準差、全距等),進而刻畫出比率變量的集中趨勢和離散程度。除此之外,而刻畫出比率變量的集中趨勢和離散程度。除此之外,SPSS 21.0SPSS 21.0還提供了其他對比描述指標,大致也屬于集中還提供了其他對比描述指標,大致也屬于集中趨勢描述指標和離散程度描述指標的范疇。趨勢描述指標和離散程度描述指標的范疇。. 選擇菜單欄中的選擇菜單欄中的【分析分析】【描述統計
54、描述統計】【比率比率】命令,彈出命令,彈出【比值統計量)比值統計量)】對話框,如圖對話框,如圖3-35所示,這所示,這是是比率分析的主操作窗口。比率分析的主操作窗口。Step 01圖圖3-35 3-35 【比值統計量比值統計量】對話框對話框. 在對話框左側的候選變量列表框中選取一個分在對話框左側的候選變量列表框中選取一個分析變量作為比率分析的分子,將它移入右側的析變量作為比率分析的分子,將它移入右側的【分子分子】列表列表框中。框中。 在對話框左側的候選變量列表框中選取一個分析在對話框左側的候選變量列表框中選取一個分析變量作為比率分析的分母,將它移入右側的變量作為比率分析的分母,將它移入右側的【分母分母】列表框列表框中。中。 在對話框左側的候選變量列表框中選取一個變在對話框左側的候選變量列表框中選取一個變量作為分組變量,將它移入右側的量作為分組變量,將它移入右側的【組變量組變量】列表框中。列表框中。 在主對話框中,用戶可以選擇如下比率分析的結在主對話框中,用戶可以選擇如下比率分析的結果輸出類型。果輸出類型。 顯示結果:系統默認項,選擇是否顯示結果顯示結果:系統默認項,選擇是否
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 超市死者賠償協議書
- 營銷末位淘汰協議書
- 音樂教師合同協議書
- 非法轉移土地協議書
- 農家樂股份合同協議書
- 酒廠污泥處理協議書
- 銀行股份認購協議書
- 供應鏈管理合作協議書
- 公司注銷股東間協議書
- PSW品質提交協議書
- 老年醫學科臨床營養管理流程
- 初三上學期自我陳述報告范文800字
- 2023年中考物理專題復習:《電磁學》實驗題
- 腹部CT斷層解剖結構肝胰腺
- 建平磷鐵礦業有限公司磷(含磁鐵磷灰石)礦礦山地質環境保護與土地復墾方案
- DB22∕T 3181-2020 公路水路行業安全生產風險分級管控和隱患排查治理雙重預防機制建設通用規范
- GB/T 36713-2018能源管理體系能源基準和能源績效參數
- GB/T 25068.1-2020信息技術安全技術網絡安全第1部分:綜述和概念
- “二級甲等婦幼保健院”評審匯報材料
- 《狼王夢》讀書分享PPT
- 三年級美術下冊第10課《快樂的節日》優秀課件1人教版
評論
0/150
提交評論