SPSS期末大作業-完整版.doc_第1頁
SPSS期末大作業-完整版.doc_第2頁
SPSS期末大作業-完整版.doc_第3頁
SPSS期末大作業-完整版.doc_第4頁
SPSS期末大作業-完整版.doc_第5頁
已閱讀5頁,還剩40頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

.第1題:基本統計分析1分析:本題要求隨機選取80%的樣本,因而需要選用隨機抽樣的方法,在此選擇隨機抽樣中的近似抽樣方法進行抽樣。其基本操作步驟如下:數據選擇個案隨機個案樣本大約(A)80 所有個案的%。1、基本思路:(1)由于存款金額為定距型變量,直接采用頻數分析不利于對其分布形態的把握,因而采用數據分組,先對數據進行分組再編制頻數分布表。此處分為少于500元,5002000元,20003500元,35005000元,5000元以上五組。分組后進行頻數分析并繪制帶正態曲線的直方圖。(2)進行數據拆分,并分別計算不同年齡段儲戶的一次存取款金額的四分位數,并通過四分位數比較其分布上的差異。操作步驟:(1)數據分組:【轉換重新編碼為不同變量】,然后選擇存取款金額到【數字變量輸出變量(V)】框中。在【名稱(N)】中輸入“存取款金額1”,單擊【更改(H)】按鈕;單擊【舊值和新值】按鈕進行分組區間定義。存取款金額1頻率百分比有效百分比累積百分比有效1.008234.634.634.62.007632.132.166.73.00104.24.270.94.00229.39.380.25.004719.819.8100.0合計237100.0100.0(2)【分析描述統計頻率】;選擇“存款金額分組”變量到【變量(V)】框中;單擊【圖標(C)】按鈕,選擇【直方圖】和【在直方圖上顯示正態曲線】;選中【顯示頻率表格】,確定。(3)【數據拆分文件】,選擇“年齡”變量到【分組方式】框中,選中【比較組】和【按分組變量排序文件】,確定;【分析描述統計頻率】,選擇“存款金額”到【變量】框中,單擊【統計量】按鈕,選擇【四分位數】繼續確定。統計量存(取)款金額20歲以下N有效1缺失0百分位數2550.005050.007550.002035歲N有效131缺失0百分位數25500.00501000.00755000.003550歲N有效73缺失0百分位數25500.00501000.00754500.0050歲以上N有效32缺失0百分位數25525.00501000.00752000.00結果及結果描述:頻數分布表表明,有一半以上的人的一次存取款金額少于2000元,且有34.6%的人的存取款金額少于500元,19.8%的人的存取款金額多于5000元,下圖為相應的帶正態曲線的直方圖。統計量表格表明,年齡在20歲以下的人有1人,其存取款金額的四分位差是0(50-50)元,年齡在2035歲之間的人有131人,其存取款金額的四分位差是4500(5000-500)元,年齡在3550歲之間的人有73人,其存取款金額的四分位差是4000(4500-500)元,年齡在50歲以上的人有32人,其存取款金額的四分位差是1475(2000-525)元。可見,2035,3550兩個年齡段的離散程度比較大,其余兩個年齡段的離散程度較小。2、基本思路:本問題涉及到兩個變量戶口和物價趨勢,考慮兩者之間的聯系,因而需要用到交叉列聯表。該列聯表的行變量為戶口,列變量為物價趨勢,需要在列聯表中輸出各種百分比、期望頻數、剩余、標準剩余,顯示各交叉分組下頻數分布柱形圖,并利用卡方檢驗方法,對城鎮和農村儲戶對物價趨勢的態度是否一致進行分析。操作步驟:(1)【分析描述統計交叉表】,選擇“戶口”到【行】框中,選擇“物價趨勢”到【列】框中;并選中【顯示復式條形圖】(2)單擊【單元格】按鈕,選中【觀測值】、【期望值】、【行】、【列】、【總計】各框繼續;(3)單擊【統計量】,選中【卡方】框繼續;結果及其結果分析:戶口* 物價趨勢 交叉制表物價趨勢合計上升穩定下降戶口城鎮戶口計數2113118170期望的計數20.1122.727.3170.0戶口 中的 %12.4%77.1%10.6%100.0%物價趨勢 中的 %75.0%76.6%47.4%71.7%總數的 %8.9%55.3%7.6%71.7%農村戶口計數7402067期望的計數7.948.310.767.0戶口 中的 %10.4%59.7%29.9%100.0%物價趨勢 中的 %25.0%23.4%52.6%28.3%總數的 %3.0%16.9%8.4%28.3%合計計數2817138237期望的計數28.0171.038.0237.0戶口 中的 %11.8%72.2%16.0%100.0%物價趨勢 中的 %100.0%100.0%100.0%100.0%總數的 %11.8%72.2%16.0%100.0%卡方檢驗值df漸進 Sig. (雙側)Pearson 卡方13.276a2.001似然比12.1592.002線性和線性組合7.7501.005有效案例中的 N237a. 0 單元格(0.0%) 的期望計數少于 5。最小期望計數為 7.92。上面交叉列聯表表明,I 共有237名被訪者,其中170名有城鎮戶口,67名是農村戶口,占樣本總數的71.7%,28.3%;認為物價趨勢為上升、穩定、下降的人數分別為28、171、38,各占總數的11.8%,72.2%,16.0%。II 對不同戶口的人群進行分析:城鎮戶口的人數總共有170人,對物價穩定趨勢為上升、穩定、下降的比例分別為12.4%、77.1%、10.6%,認為物價趨勢穩定的人數多于總比例,認為物價趨勢下降的人數少于總比例;農村戶口的總人數為67人,對物價穩定趨勢為上升、穩定、下降的比例分別為10.4%、59.7%、29.9%,認為物價趨勢穩定的人數少于總比例,認為物價趨勢下降的人數多于總比例;III 對物價趨勢不同態度的人群分析:認為物價上升的人數總共有28人,其中城鎮戶口和農村戶口所占比例分別為75%,25%,有城鎮戶口的比例略高于總比例;認為物價穩定的人數總共有171人,其中城鎮戶口和農村戶口所占比例分別為76.6%,23.4%,有城鎮戶口的比例略高于總比例;認為物價下降的人數總共有28人,其中城鎮戶口和農村戶口所占比例分別為47.4%,52.6%,有城鎮戶口的比例明顯低于總比例; 總體來說,不同戶口的人群對物價趨勢的態度存在一定的一致性。從所得卡方檢驗結果來看,概率p值為0.001,小于顯著性水平,因此拒絕原假設,認為行列變量具有較強的相關性。3 、對居民一次存款金額分別按照收入水平進行分類,得到均值、中位數、方差和偏度。3、基本思路本題中的分類變量為收入水平,因而需按照收入水平對數據進行拆分,然后分別計算一次存款金額的均值、中位數、方差和偏度。操作步驟:【數據 拆分文件】,選擇“收入水平”變量到【分組方式】框中,選中【比較組】和【按分組變量排序文件】,確定;【分析描述統計頻率】,選擇“存款金額”到【變量】框中,單擊【統計量】按鈕,選中【均值】、【中位數】、【方差】、【偏度】繼續確定。結果及其分析:統計量存(取)款金額300元以下N有效41缺失0均值2043.17中值300.00方差30740437.195偏度4.066偏度的標準誤.369300800元N有效137缺失0均值4314.15中值1000.00方差134185788.508偏度6.490偏度的標準誤.2078001500元N有效46缺失0均值5687.67中值1750.00方差116385836.002偏度4.415偏度的標準誤.3501500元以上N有效13缺失0均值11026.92中值7000.00方差197942756.410偏度2.193偏度的標準誤.616第2題:基本統計分析2用隨機抽樣中的近似抽樣方法選取85%的樣本,數據選擇個案隨機樣本大約(A)85所有個案的%。第一問基本思路:由于存款金額是定距型變量,考慮先進行數據分組再編制頻數分布表。進行數據拆分,分別計算“300以下”、“300-800”、“800-1500”、“1500以上”收入的四分位數,并通過四分位數比較上述四者分布上的差異。操作步驟:【轉換重新編碼為不同變量(R)】;選擇“存款金額”到【數字變量輸出變量(V)】框中;在【名稱(N)】中輸入“存款金額分組”,單擊【更改(H)】按鈕;單擊【舊值和新值】按鈕進行分組區間定義。存款金額分組頻率百分比有效百分比累積百分比有效1.008534.334.334.32.007731.031.065.33.00166.56.571.84.002510.110.181.95.004518.118.1100.0合計248100.0100.0【分析描述統計頻率】;選擇“存款金額分組”變量到【變量(V)】框中;單擊【圖標(C)】按鈕,選擇【直方圖】和【在直方圖上顯示正態曲線】;選中【顯示頻率表格】,確定。【數據拆分文件】,選擇“收入水平”變量到【分組方式】框中,選中【比較組】和【按分組變量排序文件】,確定;【分析描述統計頻率】,選擇“存款金額”到【變量】框中,單擊【統計量】按鈕,選擇【四分位數】繼續確定。統計量存(取)款金額300元以下N有效43缺失0百分位數25200.0050300.00751000.00300800元N有效148缺失0百分位數25500.00501000.00754475.008001500元N有效41缺失0百分位數25710.00502000.00756000.001500元以上N有效16缺失0百分位數253000.00504450.00759750.00第二問基本思路:該問題中設計到兩個變量,應采用交叉分組下的頻數分析,行變量為“年齡”,列變量為“未來收入狀況的變化趨勢”,在列聯表中輸出觀測頻數、期望頻數、各種百分比,顯示各交叉分組下頻數分布柱形圖,并利用卡方檢驗,針對各年齡段對“未來收入狀況的變化趨勢”的態度是否一致進行分析。操作步驟:【分析描述統計交叉表】,選擇“年齡”到【行】框中,選擇“未來收入情況”到【列】框中;單擊【單元格】按鈕,選中【觀測值】、【期望值】、【行】、【列】、【總計】各框繼續;單擊【統計量】,選中【卡方】框繼續;選中【顯示復式條形圖】確定。年齡* 未來收入情況 交叉制表未來收入情況合計增加基本不變減少年齡20歲以下計數0213期望的計數.71.8.53.0年齡 中的 %0.0%66.7%33.3%100.0%未來收入情況 中的 %0.0%1.3%2.4%1.2%總數的 %0.0%0.8%0.4%1.2%2035歲計數356527127期望的計數28.277.321.5127.0年齡 中的 %27.6%51.2%21.3%100.0%未來收入情況 中的 %63.6%43.0%64.3%51.2%總數的 %14.1%26.2%10.9%51.2%3550歲計數16551081期望的計數18.049.313.781.0年齡 中的 %19.8%67.9%12.3%100.0%未來收入情況 中的 %29.1%36.4%23.8%32.7%總數的 %6.5%22.2%4.0%32.7%50歲以上計數429437期望的計數8.222.56.337.0年齡 中的 %10.8%78.4%10.8%100.0%未來收入情況 中的 %7.3%19.2%9.5%14.9%總數的 %1.6%11.7%1.6%14.9%合計計數5515142248期望的計數55.0151.042.0248.0年齡 中的 %22.2%60.9%16.9%100.0%未來收入情況 中的 %100.0%100.0%100.0%100.0%總數的 %22.2%60.9%16.9%100.0%卡方檢驗值df漸進 Sig. (雙側)Pearson 卡方12.895a6.045似然比13.9056.031線性和線性組合.0171.895有效案例中的 N248a. 3 單元格(25.0%) 的期望計數少于 5。最小期望計數為 .51。第三問基本思路:首先按照戶口對數據進行拆分,然后計算存款金額的統計量:均值、四分位數和標準差。操作步驟:【數據 拆分文件】,選擇“戶口”變量到【分組方式】框中,選中【比較組】和【按分組變量排序文件】,確定;【分析描述統計頻率】,選擇“存款金額”到【變量】框中,單擊【統計量】按鈕,選中【均值】、【四分位數】、【標準差】繼續確定。統計量存(取)款金額城鎮戶口N有效178缺失0均值4476.84標準差8813.369百分位數25500.00501000.00755000.00農村戶口N有效70缺失0均值2856.47標準差8317.295百分位數25300.0050775.00752000.00第3題:基本統計分析3利用居民儲蓄調查數據,從中隨機選取85%的樣本,進行頻數分析,實現以下分析目標:1. 分析儲戶一次存款金額的分布,基本描述統計量,并對城鎮儲戶和農村儲戶進行比較;2.分析不同年齡的儲戶對什么合算的認同是否一致。3.檢驗城鎮儲戶的一次存款金額的均值為5000元, 是否可信?利用居民儲蓄調查數據,從中隨機選取85%的樣本,進行頻數分析,實現以下分析目標: 基本思路:首先通過隨機抽樣中的近似抽樣方式,對居民儲蓄調查數據進行抽樣。操作步驟:選擇菜單數據選擇個案隨機個案樣本,樣本尺寸填大約所有個案85%分析儲戶一次存款金額的分布,基本描述統計量,并對城鎮儲戶和農村儲戶進行比較; 基本思路:(1)由于存(取)款金額數據為定距型變量,直接采用頻數分析不利于對其分布形態的把握,因此考慮依據第三章中的數據分組功能對數據分組后再編制頻數分布表。(2)進行數據拆分,并分別計算城鎮儲戶和農村儲戶的一次存(取)款金額的四分位數,并通過四分位數比較兩者分布上的差異。操作步驟:轉換重新編碼為不同變量選擇存(取)款金額,輸出變量名稱填存款金額分組,單擊舊值和新值,對數據進行分組,分為0-500、501-2000、2001-3500、3501-5000、5000以上五個組。最后點擊確定。再分析描述統計頻率變量:存款金額分組,圖表選擇直方圖,選擇顯示正態曲線。步驟:數據拆分文件分組方式:戶口確定。分析描述統計頻率統計量四分位數前打勾確定。存款金額分組頻率百分比有效百分比累積百分比有效1.008735.435.435.42.007630.930.966.33.00145.75.772.04.00208.18.180.15.004919.919.9100.0合計246100.0100.0統計量存款金額分組城鎮戶口N有效177缺失0百分位數252.0000503.0000755.0000農村戶口N有效69缺失0百分位數251.5000503.0000753.0000存款在500以下所占百分比最大,有35.4%,其次是500-1000的人數。而存款在5000以上的也有19.9%,說明存款數額懸殊較大。從輸出圖表中看出城鎮儲戶較農村儲戶有兩倍之多,可能是因為城鎮居民比較富裕而且存款意識比較強。農村戶口的居民可能更愿意把錢藏在家里而不是拿到銀行去存。分析不同年齡的儲戶對什么合算的認同是否一致。 基本思路:該問題列聯表的行變量為年齡,列變量為什么合算,在列聯表中輸出各種百分比、期望頻數、剩余、標準化剩余,顯示各交叉分組下頻數分布柱形圖,并利用卡方檢驗方法,對不同年齡的儲戶對什么合算的認同是否一致進行分析.操作步驟:分析描述統計交叉表,顯示復式條形圖前打勾,行選擇年齡,列選擇什么合算,統計量選擇卡方,點擊單元格,在觀察值、期望值、行、列、總計、四舍五入單元格計數前打勾,最后確認。 卡方檢驗值df漸進 Sig. (雙側)Pearson 卡方3.997a3.262似然比3.9863.263線性和線性組合3.3371.068有效案例中的 N246a. 2 單元格(25.0%) 的期望計數少于 5。最小期望計數為 .77。分析:因為卡方值小于0.05拒絕原假設,認為行列變量之間相關,年齡對什么合算的認同有影響,說明不同年齡的儲戶對什么合算的認同不一致.3.檢驗城鎮儲戶的一次存款金額的均值為5000元, 是否可信? 單個樣本統計量戶口N均值標準差均值的標準誤城鎮戶口存(取)款金額1774871.119643.647724.861農村戶口存(取)款金額694517.4514528.3401749.007單個樣本檢驗戶口檢驗值 = 5000tdfSig.(雙側)均值差值差分的 95% 置信區間下限上限城鎮戶口存(取)款金額-.178176.859-128.887-1559.421301.65農村戶口存(取)款金額-.27668.783-482.551-3972.643007.54由上表可知, 城鎮儲戶的一次存款金額的均值為5000元, 不可信.第4題:方差分析解題思路問題(2)是研究一個控制變量即濃度的不同水平是否對觀測變量收率產生了顯著影響,因而應用單因素方差分析。建立原假設為:不同濃度沒有對收率產生顯著影響,對原假設進行檢驗。問題(3)首先是研究兩個控制變量濃度及溫度的不同水平對觀測變量收率的獨立影響,然后分析兩個這控制變量的交互作用能否對收率產生顯著影響,因而應該采用多因素方差分析。建立原假設為:H01不同濃度沒有對收率產生顯著影響;H02不同溫度沒有對收率產生顯著影響;H03濃度和溫度對化工廠的收率沒有產生顯著性的交互影響。操作步驟問題(2):選擇菜單【分析比較均值單因素】,將收率選入到因變量列表中,將濃度選入到因子框中,則SPSS會將結果顯示到輸出窗口中。問題(3):選擇菜單【分析一般線性模型單變量】,把收率制定到因變量中,把濃度與溫度制定到固定因子框中,則SPSS會將結果顯示到輸出窗口。輸出結果解釋與結論問題(1):問題(2):單因素方差分析收率平方和df均方F顯著性組間39.083219.5425.074.016組內80.875213.851總數119.95823單因素方差分析結果解釋:可以看到觀測變量收率的總離差平方和為119.958,如果僅考慮濃度單個因素的影響,則收率總變差中,濃度可解釋的變差為39.083,抽樣誤差引起的變差為80.875,他們的方差分別為19.542和3.851,相除所得的F統計量的觀測值為5.074,對應的概率p值近似為0.016。由于顯著性水平=0.05,概率p值小于顯著性水平,則應拒絕原假設,認為不同濃度對收率產生了顯著影響。問題(3):主體間效應的檢驗因變量: 收率源III 型平方和df均方FSig.校正模型70.458a116.4051.553.230截距2667.04212667.042646.556.000濃度39.083219.5424.737.030溫度13.79234.5971.114.382濃度 * 溫度17.58362.931.710.648誤差49.500124.125總計2787.00024校正的總計119.95823a. R 方 = .587(調整 R 方 = .209)多因素方差分析結果解釋:輸出結果中,第一列是對觀測變量總變差分解的說明,第二列是觀測變量變差分解的結果,第三列是自由度,第四列是均方,第五列是F檢驗統計量的觀測值,第六列是檢驗統計量的概率p值。可以看到觀測變量收率的總變差為119.958,由濃度不同引起的變差是39.083,由溫度不同引起的變差為13.792,由濃度和溫度的交互作用引起的變差為17.583,由隨機因素引起的變差為49.500。濃度,溫度和濃度*溫度的概率p值分別為0.030,0.382和0.648。濃度的概率p值小于顯著性水平=0.05,則應拒絕原假設,認為不同濃度給收率帶來了顯著影響;同時溫度的概率p值和濃度*溫度的概率p值均大于顯著性水平,因此不應拒絕原假設,可以認為不同溫度沒有對收率產生顯著影響,不同濃度和溫度沒有對收率產生顯著的交互作用。第5題:方差分析2某電器公司想知道某產品銷售量與銷售方式及銷售地點是否有關,根據近2個月的情況得到下表的數據,以0.05的顯著性水平進行檢驗:(1)給出SPSS數據集的格式(列舉前4個樣本即可);(2)銷售方式對銷售量的影響;(3)銷售方式和銷售地點以及它們的交互作用對銷售量的影響。某電器公司想知道某產品銷售量與銷售方式及銷售地點是否有關,根據近2個月的情況得到下表的數據,以0.05的顯著性水平進行檢驗: (1)給出SPSS數據集的格式(列舉前4個樣本即可); (2)銷售方式對銷售量的影響;(3)銷售方式和銷售地點以及它們的交互作用對銷售量的影響。基本思路:本道題重點考察我們對于在SPSS 應用過程中對于方差分析的應用情況。先將這組數據輸入SPSS,然后進行兩個方面的計算:單因素方差分析和多因素方差分析。利用SPSS的非必須功能,從而得出它們的方差數據,進而進行分析和結果的得出。(1)操作步驟:分別定義分組變量A(方式)、X(銷售量)、B(地區),在變量視圖與數據視圖中輸入表格數據 (2)銷售方式對銷售量無顯著性影響操作步驟:分析-比較均值-單因素ANOVA-因變量列表:收率,因子列表單因素方差分析X平方和df均方F顯著性組間1221.3003407.10013.244.000組內 1106.6003630.739總數2327.90039結果分析:顯著性0.05,0.1190.05,0.3000.05,0.2470.05,故他們不能通過方程的顯著性檢驗。課題總數=0.571*投入人年數把回歸方程寫出來第6題:回歸分析1基本思路:(1)建立多元線性回歸模型,分析汽車特征與銷售量之間的關系,并利用回歸結果給出改進汽車設計方案的建議,以促進銷售量的提高。(2)做多重共線性、方差齊性和殘差的自相關檢驗。操作步驟&結果分析I(強制進入策略):(1)分析回歸線性,把“銷售量”選入【因變量(D)】框中,把“車型”、“價格”、“發動機規格”、“馬力”、“軸距”、“寬度”、“長度”、“凈重”、“燃料箱容量”和“燃料效率”這十個變量選進【自變量(I)】框中,采用進入篩選策略;(2)單擊【統計量(S)】,選中【估計(E)】、【模型擬合度(M)】、【共線性診斷(L)】和【Durbin-Watson(U)】框,繼續,確定;表6-1 模型匯總b模型RR 方調整 R 方標準 估計的誤差Durbin-Watson1.697a.486.449.989601.481a. 預測變量: (常量), 燃料效率, 長度, 價格, 車型, 寬度, 發動機規格, 燃料箱容量, 軸距, 凈重, 馬力。b. 因變量: 銷售量分析:依據該表可盡心回歸方程擬合優度檢驗,由于該方程中有多個解釋變量,因此應參考調整的判定系數,調整的判定系數為0.449,離1較遠,所以擬合優度較低,被解釋變量可以被模型解釋的部分較少,未能別解釋的部分較多。表6-2 Anovaa模型平方和df均方FSig.1回歸130.3001013.03013.305.000b殘差138.082141.979總計268.383151a. 因變量: 銷售量b. 預測變量: (常量), 燃料效率, 長度, 價格, 車型, 寬度, 發動機規格, 燃料箱容量, 軸距, 凈重, 馬力。分析:被解釋標量的總離差平方和為268.38,由回歸平方和130.30和剩余平方和138.082組成;回歸平方和的均方為13.030,剩余平方和的均方為0.979;F檢驗統計量的觀測值為13.305,對應的概率P值近似為0。依據該表可進行回歸方程的顯著性檢驗。若顯著性水平為0.05,由于概率P小于0.05,拒絕回歸方程顯著性檢驗的零假設,認為各回歸系數不同時為0,被解釋變量與解釋變量全體的線性關系是顯著的,可建立線性模型。表6-3 系數a模型非標準化系數標準系數tSig.共線性統計量B標準 誤差試用版容差VIF1(常量)-3.0172.741-1.101.273車型.883.331.2932.670.008.3043.293價格-.046.013-.502-3.596.000.1875.337發動機規格.356.190.2811.871.063.1626.159馬力-.002.004-.092-.509.611.1128.896軸距.042.023.2411.785.076.2004.997寬度-.028.042-.073-.676.500.3133.193長度.015.014.1481.032.304.1785.605凈重.156.350.075.447.655.1317.644燃料箱容量-.057.047-.167-1.203.231.1895.303燃料效率.081.040.2622.023.045.2174.604a. 因變量: 銷售量分析:由表6-3可進行回歸系數顯著性檢測,寫出回歸方程和檢測多重共線性。如果顯著性水平為0.05,除了車型、價格,燃料效率外,其他變量的回歸系數顯著性t檢驗的概率P值都大于顯著性水平,因此不應該拒絕零假設,認為這些偏回歸系數與0無顯著差異,它們與被解釋變量的線性關系是不顯著的,不應該保留在方程中。由于該模型保留了一些不應被保留的變量,因此該模型目前是不可用的,應該重新建模。從膨脹因子看,VIF都小于10,各解釋變量都不存在嚴重的多重共線性,從容忍度看,容忍度接近于0,但卻沒有小于0.1, 不存在嚴重的多重共線性。表6-4 共線性診斷a模型維數特征值條件索引方差比例(常量)車型價格發動機規格馬力軸距寬度長度凈重燃料箱容量燃料效率119.9201.000.00.00.00.00.00.00.00.00.00.00.002.7333.678.00.28.00.00.00.00.00.00.00.00.003.2596.193.00.00.07.01.00.00.00.00.00.00.014.05014.051.00.12.30.14.00.00.00.00.00.00.025.01922.589.00.27.01.10.07.00.00.00.03.18.056.00835.942.00.00.26.62.73.00.00.00.01.01.057.00544.275.00.00.00.05.00.01.00.01.29.78.138.00358.480.01.00.24.03.17.07.01.03.59.02.429.00276.175.18.07.03.00.01.11.11.07.00.00.2510.001130.747.06.10.03.00.01.67.08.80.02.01.0111.000148.267.75.16.07.05.00.15.80.08.05.00.08a. 因變量: 銷售量分析:由表6-4,從方差比例看,并沒有哪個特征值對應的解釋變量的方差比例有同時存在0.7以上的,由此認為,不存在嚴重的多重共線性。由表6-4,從條件指數看,第3,4,5,6,7,8條件指數都大于10,說明變量之間確實存在多重共線型,第9,10條件指數大于100,說明變量之間存在嚴重的多重共線性。綜合以上三個關于多重共線性的檢驗,認為變量間存在多重共線性。通過以上分析可知,上面的方程存在一些問題,應重新建立回歸方程,采用向前篩選策略讓SPSS自動完成解釋變量的選擇。操作步驟&結果分析II(向前篩選策略):(1)點擊繪制,Y:ZRESID,X:ZPRED,標準化殘差圖:正態概率圖、直方圖,點擊保存,預測值:標準化,殘差:標準化。最后點擊確定。(2)分析相關雙變量,變量選擇:Standardized Predicted Value,Standardized Residual,相關系數中,spearman打勾。確定。表6-5 模型匯總c模型RR 方調整 R 方標準 估計的誤差Durbin-Watson1.552a.304.3001.115532.655b.430.4221.013571.371a. 預測變量: (常量), 價格。b. 預測變量: (常量), 價格, 軸距。c. 因變量: 銷售量分析:由表6-5可知,最終保留的變量有價格和軸距,調整R方較接近于0,認為方程的擬合優度較低。由表6-5中的DW值,DW=1.371,表明殘差存在一定程度正自相關。表6-6 Anovaa模型平方和df均方FSig.1回歸81.720181.72065.670.000b殘差186.6621501.244總計268.3831512回歸115.311257.65656.122.000c殘差153.0721491.027總計268.383151a. 因變量: 銷售量b. 預測變量: (常量), 價格。c. 預測變量: (常量), 價格, 軸距。分析:由表6-6可進行回歸方程的顯著性檢驗,如果顯著性水平為0.05,概率P值小于0.05,認為被解釋變量與解釋變量的線性關系是顯著的,可建立線性回歸方程。表6-7 系數a模型非標準化系數標準系數tSig.共線性統計量B標準 誤差試用版容差VIF1(常量)4.684.19424.090.000價格-.051.006-.552-8.104.0001.0001.0002(常量)-1.8221.151-1.583.116價格-.055.006-.590-9.487.000.9881.012軸距.061.011.3565.718.000.9881.012a. 因變量: 銷售量分析:由表6-7得到最終的回歸方程,汽車銷售量=-1.822-0.55價格+0.61軸距,可通過提高軸距,降低價格提高汽車銷售量。表6-8 已排除的變量a模型Beta IntSig.偏相關共線性統計量容差VIF最小容差1車型.251b3.854.000.301.9981.002.998發動機規格.342b4.128.000.320.6111.636.611馬力.257b2.062.041.167.2933.417.293軸距.356b5.718.000.424.9881.012.988寬度.244b3.517.001.277.8921.121.892長度.308b4.790.000.365.9761.025.976凈重.346b4.600.000.353.7221.385.722燃料箱容量.266b3.687.000.289.8201.219.820燃料效率-.198b-2.584.011-.207.7581.319.7582車型.129c1.928.056.157.8351.197.827發動機規格.145c1.576.117.128.4452.246.445馬力.028c.229.819.019.2563.910.256寬度-.025c-.275.784-.023.4702.126.470長度.027c.237.813.020.2903.448.290凈重.105c1.028.306.084.3652.741.365燃料箱容量.002c.024.981.002.4432.259.443燃料效率.014c.164.870.014.5591.790.559a. 因變量: 銷售量b. 模型中的預測變量: (常量), 價格。c. 模型中的預測變量: (常量), 價格, 軸距。表6-9 共線性診斷a模型維數特征值條件索引方差比例(常量)價格軸距111.8851.000.06.062.1154.051.94.94212.8471.000.00.02.002.1504.351.01.97.013.00333.412.99.00.99a. 因變量: 銷售量圖6-1分析:由圖6-1可知殘差近似服從標準正態分布。圖6-2分析:由圖6-2,隨著標準化預測值的變化,殘差點在0線周圍隨機分布,大部分都落在(-3,3)范圍內,無異常點。表6-10 相關系數Standardized Predicted ValueStandardized ResidualSpearman 的 rhoStandardized Predicted Value相關系數1.000.071Sig.(雙側).382N155155Standardized Residual相關系數.0711.000Sig.(雙側).382.N155155分析:由表6-10相關系數,計算標準化殘差和標準化預測值的spearman等級相關系數為0.071,認為異方差現象不明顯。第9題:回歸分析4解題思路建立多元線性回歸模型,解釋變量采用向前篩選策略,根據輸出結果進行模型擬合優度,回歸方程顯著性檢驗,回歸系數顯著性檢驗,多重共線性,方差齊性和殘差的自相關等檢驗。操作步驟分析模型并作方差齊性和殘差的自相關性檢驗:選擇菜單【分析回歸線性】,選擇被解釋變量X5進入【因變量(D)】框,選擇解釋變量X2、X4、X7、X8進入【自變量(I)框】。在【方法(M)】框中選擇【向前】,單擊【統計量(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論