數據分析實驗報告_第1頁
數據分析實驗報告_第2頁
數據分析實驗報告_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第一次試驗報告習題 1.31 建立數據集,定義變量并輸入數據并保存。2 數據的描述,包括求均值、方差、中位數等統計量 分析描述統計頻率,選擇如下: 輸出:統計量全國居民農村居民城鎮居民N有效222222缺失000均值1116.82747.862336.41中值727.50530.501499.50方差1031026.918399673.8384536136.444百分位數25304.25239.75596.2550727.50530.501499.50751893.501197.004136.753 畫直方圖,莖葉圖, QQ圖。(全國居民) 分析描述統計探索,選擇如下: 輸出:全國居民 Ste

2、m-and-Leaf PlotFrequencyStem & Leaf5.000. 567882.001. 031.001. 71.002. 33.002. 6891.003. 1Stem width: 1000 Each leaf: 1 case(s)分析描述統計 QQ圖,選擇如下:輸出:習題1.14 數據正態性的檢驗: K S檢驗, W檢驗數據:取顯著性水平為 0.05分析描述統計探索,選擇如下:1) KS 檢驗單樣本 Kolmogorov-Smirnov 檢驗身高N60正態參數 a,b均值139.00標準差7.064最極端差別絕對值.089正.045負-.089Kolmogoro

3、v-Smirnov Z.686漸近顯著性 (雙側 ).735a. 檢驗分布為正態分布b. 根據數據計算得到。結果: p=0.735 大于0.05 接受原假設,即數據來自正太總體。(2) W檢驗正態性檢驗aKolmogorov-SmirnovShapiro-Wilk統計量dfSig.統計量dfSig.身高.08960.200 *.97260.174a. Lilliefors 顯著水平修正 *. 這是真實顯著水平的下限。結果:在 Shapiro-Wilk 檢驗結果 w0 0.972 ,p=0.174 大于 0.05 接受原假設, 即數據 來自正太總體。習題 1.55 多維正態數據的統計量數據:統計

4、量x1x2x3x4N有效21212121缺失0000均值18.21927.8674.50533.767均值向量為: X (18.219,27.836,4.505,33.767)項間協方差矩陣x1x2x3x4x13.5092.7071.0191.266x22.7073.5591.1391.289x31.0191.1391.9981.740x41.2661.2891.7404.032相關性x1x2x3x4x1 Pearson 相關1.766 *.385.336性顯著性 (雙側).000.085.136N21212121x2 Pearson 相關.766 *1.427.340性顯著性 (雙側).00

5、0.054.131N21212121x3 Pearson 相關.385.4271.613 *性顯著性 (雙側).085.054.003N21212121x4 Pearson 相關.336.340.613 *1性顯著性 (雙側).136.131.003N21212121*. 在 .01 水平(雙側)上顯著相關結果: x4與其他數據無相關性,其他三組數據線性相關相關系數x1x2x3x4Spearman 的 rho x1 相關系數1.000.790 *.434 *.431Sig. (雙側).000.049.051N21212121x2相關系數.790 *1.000.511 *.488 *Sig. (

6、雙側).000.018.025N21212121x3相關系數.434 *.511 *1.000.691 *Sig. (雙側).049.018.001N21212121x4相關系數.431.488 *.691 *1.000Sig. (雙側).051.025.001N21212121*. 在置信度(雙測)為 0.01 時,相關性是顯著的*. 在置信度(雙測)為 0.05 時,相關性是顯著的。結果:由Spearman相關矩陣的輸出結果看,取顯著性水平 0.1 ,p值皆小于 0.1, 所以數據相關性顯著習題 2.46 線性回歸線的擬合, 回歸系數的區間估計與假設檢驗, 回歸系數的選擇、 逐步 回歸。7

7、 殘差分析分析回歸線性,選擇如下:輸出:逐步回歸結果:兩變量的系數 p 值均小于 0.05 均有統計學意義。 結果: 由殘差統計量表看出,數據無偏離值,標準差比較小,認為模型健康。 概率論課本習題 7.58 一個正態總體獨立樣本均值的 t 檢驗與區間估計 分析比較均值獨立樣本 T 檢驗:輸出:One-Sample StatisticsNMeanStd. DeviationStd. Error Mean折斷力102833.5035.04411.082結果:樣本均值為 2833.50與總體均值 2820比較接近One-Sample TestTest Value = 2820tdfSig. (2-tailed)Mean Difference95% Confidence Interval of the DifferenceLowerUpper折斷力1.2189.25413.500-11.5738.57結果:t 值為1.218小于臨界值 2.26 ,且P值為0.254 大于顯著性水平 0.05 ,接受原假設,即認為 樣本均值與總體均值之差可能是抽樣誤差所導致概率論課本習題 7.79 兩個正態總體均值差異比較的 t 檢驗與配對檢驗 分析均值比較獨立樣本 T 檢驗,選擇如下: 輸出:結果: P值為 1大于顯著性水平 0.05 ,認為方差相等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論