




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SPSS統計軟件簡介東南大學公共衛生學醫療保險系張iaacenter@第1頁1.
SPSS介紹2.
數據輸入與保存——文獻建立與編輯——變量及變量操作3.
SPSS信息輸入、輸出4.
SPSS表格與圖形5.
圖形編輯功能6.
SPSS編程與自動化7.
SPSS統計功能之一:樣本描述與數據準備8.
SPSS統計功能之二:假設檢查、非參數統計9.
SPSS統計功能之三:有關與回歸分析10.
SPSS統計功能之四:多元統計分析(介紹)第2頁SPSS是軟件英文名稱首字母縮寫,原意為StatisticalPackagefortheSocialSciences,即“社會科學統計軟件包”。不過伴隨SPSS產品服務領域擴大和服務深度增加,SPSS公司已于2023年正式將英文全稱更改為StatisticalProductandServiceSolutions,意為“統計產品與服務處理方案”,標志著SPSS戰略方向正在做出重大調整。第3頁功能強大、實用與美觀統一
視窗格調——SPSS最突出特點就是操作界面極為友好,他使用Windows窗口方式展示多種管理和分析數據辦法功能,使用對話框展示出多種功能選擇項,只要掌握一定Windows操作技能,粗通統計分析原理,就能夠使用該軟件為特定科研工作服務。輸出成果十分美觀美麗(從國外角度看),存放時則是專用SPO格式,能夠轉存為HTML格式和文本格式。第4頁在眾多顧客對國際常用統計軟件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab總體印象分統計中,其諸項功能均取得最高分
。第5頁非專業統計人員首選統計軟件SPSS采取類似EXCEL表格方式輸入與管理數據,數據接口較為通用,能方便從其他數據庫中讀入數據。其統計過程包括了常用、較為成熟統計過程,完全能夠滿足非統計專業人士工作需要。第6頁非專業統計人員首選統計軟件對于熟悉老版本編程運行方式顧客,SPSS還尤其設計了語法生成窗口,顧客只需在菜單中選好各個選項,然后按“粘貼”按鈕就能夠自動生成標準SPSS程序,極大方便了中、高級顧客。第7頁SPSS基本特點數據自動處理強大統計功能完全Windows格調良好幫助系統合自學功能簡單編程完美圖形處理功能豐富數據對接功能支持DLE與Active技術內置VBA客戶語言強大函數功能Intenet功能
第8頁SPSS功能樣本數據描述和預處理;假設檢查(包括參數檢查、非參數檢查及其他檢查);方差分析列聯表有關分析回歸分析對數線性分析聚類分析鑒別分析因子分析對應分析時間序列分析生存分析可靠性分析第9頁SPSS由多種模塊組成(和SAS相同),SPSS11版一共由十個模塊組成,其中SPSSBase為基本模塊,其他九個模塊為AdvancedModels、RegressionModels、Tables、Trends、Categories、Conjoint、ExactTests、MissingValueAnalysis和Maps,分別用于完成某一方面統計分析功能,他們均需要掛接在Base上運行。除此之外,SPSS11完全版還包括SPSSSmartViewer和SPSSReportWriter兩個軟件,他們并未整合進來,但功能上完全是SPSS輔助軟件。最新推出SPSS12.0除了原有十個模塊外,又新增了復雜抽樣模塊,能從您調查數據中得到更多精確分析成果。第10頁歷史20世紀60年代1975年在芝加哥組建了SPSS總部。
1984年SPSS總部首先推出了世界上第一種統計分析軟件微機版本SPSS/PC+1994至1998年間,SPSS公司陸續購并了SYSTAT公司、BMDP軟件公司、Quantime公司、ISL公司等,并將各公司主打產品收納SPSS旗下,從而使SPSS公司由本來單一統計產品開發與銷售轉向公司、教育科研及政府機構提供全面信息統計決策支持服務,成為走在了最新流行“數據倉庫”和“數據挖掘”領域前沿一家綜合統計軟件公司。
第11頁應用廣泛應用于統計、應用數學、經濟、市場營銷、心理、衛生統計、生物、公司管理、氣象、社會學等領域。其分析過程包括:調查設計、數據搜集、數據存取和管理、數據分析、數據檢查、數據挖掘、數據展示等。尚有一系列附加模塊和獨立模塊產品以加強它分析功能。它圖形窗口界面使其非常簡單易用但卻具有滿足多種分析要求數據管理、統計分析功能及多種報表辦法。第12頁缺陷由于在SPSS公司產品線中,SPSS軟件屬于中、低級(SPSS公司共有二十余個產品),因此從戰略觀點來看,SPSS顯然是把相稱精力放在了顧客界面開發上。該軟件只吸取較為成熟統計辦法,而對于最新統計辦法,SPSS公司做法是為之發展某些專門軟件,如針對樹構造模型AnswerTree,針對神經網絡技術NeuralConnection、專門用于數據挖掘Clementine等,而不是直接納入SPSS,因此他們在SPSS中均難覓芳蹤。另外,其輸出成果雖然美麗,但不能為WORD等常用文字處理軟件直接打開,只能采取拷貝、粘貼方式加以交互。這些都能夠說是SPSS軟件致命傷。
第13頁數據輸入與保存SPSS界面定義變量輸入數據保存數據第14頁例某克山病區測得11例克山病患者與13名健康人血磷值(mmol/L)如下,問該地急性克山病患者與健康人血磷值是否不一樣(衛統第三版例4.8)?編號克山病患者編號健康人10.8410.5421.0520.6431.2030.6441.2040.7551.3950.7661.5360.8171.6771.1681.8081.2091.8791.34102.07101.35112.11111.48121.56131.87第15頁數據文獻管理建立與保存數據文獻(File菜單)新建數據文獻直接打開使用數據庫查詢打開使用文本導入向導讀入文本文獻打開其他格式數據文獻保存數據文獻File菜單中其他條目第16頁10個下拉式菜單主菜單漢字名稱備注File文獻操作介紹Edit數據編輯重點介紹View觀測(視圖)
Data建立數據與數據整頓重點介紹Transform變量轉換重點介紹Analyze統計分析重點介紹Graphs繪圖重點介紹Utilities實用程序重點介紹Windows視窗控制
Help在線幫助
第17頁數據預分析數據簡單描述繪制直方圖按題目要求進行統計分析保存和導出分析成果保存文獻導出分析成果第18頁數據文獻管理編輯數據文獻定義新變量直接定義新變量從原有變量計算新變量-Transform菜單數據錄入直接錄入數據錄入技巧深入整頓數據文獻-Data菜單第19頁程序編輯窗口使用方法詳解程序編輯窗口界面邂逅Paste按鈕用程序編輯窗口加快我們工作用程序編輯窗口完成對話框無法完成工作第20頁SPSS成果窗口使用方法詳解1成果窗口元素介紹成果瀏覽窗口(Viewer)成果初稿瀏覽窗口(DraftViewer)如何美化你輸出成果--SPSS選項設置2駕馭成果瀏覽窗口成果窗口一般操作成果導出如何在WORD等軟件中使用輸出成果3文本輸出成果編輯4表格編輯辦法詳解1基本操作特色菜單內容詳解5圖片編輯辦法詳解基本操作特色菜單內容詳解
第21頁SPSS統計繪圖功能詳解1常用統計圖操作界面介紹(條圖)1條圖通用界面2復式條圖與分段條圖界面其他常用統計圖1散點圖2線圖3餅圖4面積圖5直方圖6其他常用統計圖編輯辦法詳解2交互式統計圖3統計地圖第22頁條圖散點圖線圖直方圖餅圖面積圖箱式圖正態Q-Q圖正態P-P圖質量控制圖Pareto圖自回歸曲線圖高低圖
交互有關圖序列圖頻譜圖誤差線圖
第23頁樸素美削尖腦袋模樣墻上長滿了爬山虎太陽照在紅墻內外反客為主藍飄帶我沒有放倒!第24頁第25頁描述性統計分析-DescriptiveStatistics菜單詳解1Frequencies過程1界面說明2分析實例3成果解釋2Descriptives過程界面說明成果解釋3Explore過程界面說明成果解釋4Crosstables過程界面說明分析實例成果解釋
第26頁Frequencies過程
例某地101例健康男子血清總膽固醇值測定成果如下,請繪制頻數表、直方圖,計算均數、標準差、變異系數CV、中位數M、p2.5和p97.5(衛統第三版p2331.1題)。4.773.376.143.953.564.234.314.715.694.124.564.375.396.305.217.225.543.935.214.125.185.774.795.125.205.104.704.743.504.694.384.896.255.324.504.633.614.444.434.254.035.854.093.354.084.795.304.973.183.975.165.105.864.795.344.244.324.776.366.384.885.553.044.553.354.874.175.855.165.094.524.384.314.585.726.554.764.614.174.034.473.403.912.704.604.095.965.484.404.555.383.894.604.473.644.345.186.143.244.903.05
第27頁步驟Analyze==>DescriptiveStatistics==>FrequenciesVariables框:選入X單擊Statistics鈕:
選中Mean、Std.deviation、Median復選框
單擊Percentiles:輸入2.5:單擊Add:輸入97.5:單擊Add:
單擊Continue鈕
單擊Charts鈕:
選中Barcharts單擊Continue鈕
單擊OK第28頁Descriptives過程
【Statistics鈕】Descriptives復選框:輸出均數、中位數、眾數、5%修正均數、標準誤、方差、標準差、最小值、最大值、全距、四分位全距、峰度系數、峰度系數標準誤、偏度系數、偏度系數標準誤及指定均數可信區間。M-estimators復選框:作中心趨勢粗略最大似然確定,輸出四個不一樣權重最大似然確定數。Outliers復選框:輸出五個最大值與五個最小值。Percentiles復選框:輸出第5%、10%、25%、50%、75%、90%、95%位數。【Plot鈕】Boxplots單選框組:確定箱式圖繪制方式,能夠是按組別分組繪制(Factorlevelstogether),也能夠不分組一起繪制(Depentendstogether),或者不繪制(None)。Descriptive復選框組:能夠選擇繪制莖葉圖(Stem-and-leaf)和直方圖(Histogram)。Normalityplotswithtest復選框:繪制正態分布圖并進行變量是否符合正態分布檢查。Spreadvs.LevelwithLeveneTest單選框組:當選擇了分組變量時,繪制spread-versus-level圖(我還沒有找到他漢字名字該叫什么),設置繪圖時變量轉換方式,并進行組間方差齊性檢查。【Options鈕】用于選擇對缺失值處理方式,能夠是不分析有任一缺失值統計、不分析計算某統計量時有缺失值統計,或報告缺失值。第29頁Crosstabs過程
例6.2某醫生用國產呋喃硝胺治療十二指腸潰瘍,以甲氰咪胍作對照組,問兩種辦法治療效果有沒有差異(醫統第二版P37例3.10)?處理愈合未愈合合計呋喃硝胺54862甲氰咪胍442064合計9828126第30頁步驟Data==>WeightCasesWeightCasesby單選框:選中
FreqencyVariable:選入W單擊OK鈕
Analyze==>DescriptiveStatistics==>CrosstabsRows框:選入RColumns框:CStatistics鈕:Chi-square復選框:選中:單擊Continue鈕
單擊OK鈕第31頁均數間比較-CompareMeans菜單詳解1Means過程界面說明成果解釋2One-SamplesTTest過程界面說明成果解釋3Independent-SamplesTTest過程界面說明成果解釋4Paired-SamplesTTest過程1界面說明2分析實例3成果解釋5One-WayANOVA過程1界面說明2分析實例3成果解釋
第32頁Paired-SamplesTTest過程
例
某單位研究飲食中缺乏維生素E與肝中維生素A含量關系,將同種屬大白按性別相同,年紀、體重相近者配成對子,共8對,并將每對中兩頭動物隨機分到正常飼料組和維生素E缺乏組,過一定期期將大白鼠殺死,測得其肝中維生素A含量,問不一樣飼料大白鼠肝中維生素A含量有沒有差異(衛統第三版例4.5)?
大白鼠對號
正常飼料組
維生素E缺乏1
3550
24502
2023
24003
3000
18004
3950
32005
3800
32506
3750
27007
3450
25008
3050
1750第33頁一般線性模型――GeneralLinearModel菜單詳解1兩原因方差分析univarate對話框界面說明成果解釋2協方差分析分析步驟成果解釋3其他較簡單方差分析問題4多元方差分析分析步驟成果解釋5反復測量方差分析Repeatedmeasures對話框界面說明成果解釋
第34頁兩原因方差分析
例對小白鼠喂以A、B、C三種不一樣營養素,目標是理解不一樣營養素增重效果。采取隨機區組設計辦法,以窩別作為劃分區組特性,以消除遺傳原因對體重增加影響。現將同品系同體重24只小白鼠分為8個區組,每個區組3只小白鼠。三周后體重增量成果(克)列于下表,問小白鼠經三種不一樣營養素飼養后所增體重有沒有差異?區組號A營養素B營養素C營養素150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40761.9053.0051.20842.2039.8046.20第35頁步驟Analyze==>GeneralLinealmodel==>UnivariateDependentVariable框:選入weightFixedFactors框:選入group和foodModel鈕:單擊Custom單選鈕:選中Model框:選入group和food單擊OKPostHoc鈕:單擊PostHoctestfor框:選入foodSNK復選框:選中單擊OK單擊OK第36頁協方差分析
某醫生欲理解成年人體重正常者與超重者血清膽固醇是否不一樣。而膽固醇含量與年紀有關,資料見下表。
正常組超重組年紀(X1)膽固醇(Y1)年紀(X2)膽固醇(Y2)483.5587.3334.6414.7515.8718.4435.8768.8444.9495.1638.7334.9493.6546.7425.5656.4404.9396.0475.1527.5414.1456.4414.6586.8565.1679.2第37頁步驟Analyze==>GeneralLinealmodel==>UnivariateDependentVariable框:選入cholFixedFactors框:選入groupModel鈕:單擊Custom單選鈕:選中Model框:選入group、age和group*age(后者用interaction辦法就可選入)Sumofsquares列表框:改為ModelI單擊OK單擊OK第38頁有關分析――Correlate菜單詳解1Bivariate過程界面說明分析實例成果解釋2Partial過程界面說明成果解釋3Distances過程
第39頁多元線性回歸與曲線擬合――Regression菜單詳解1Linear過程1簡單操作入門界面詳解輸出成果解釋2復雜實例操作分析實例成果解釋2CurveEstimation過程1界面詳解2實例操作3BinaryLogistic過程1界面詳解與實例2成果解釋3模型深入優化與簡單診斷1模型深入優化2模型簡單診斷第40頁非參數檢查――NonparametricTests菜單詳解1
概論2
One-SampleKolmogorov-SmirnovTest3
Two-Independent-SamplesTests
第41頁生存分析--Survival菜單詳解1LifeTables過程界面說明成果解釋2Kaplan-Meier過程界面說明成果解釋3CoxRegression過程界面說明成果解釋4Coxw/Time-DepCov過程界面說明成果解釋第42頁第一講:SPSS介紹,界面入門、數據管理要求:理解SPSS系統組成,掌握數據管理界面一般操作,熟悉常用數據轉換命令使用方法。重點:能夠獨立完成在SPSS中建庫、錄入數據、計算新變量、篩選變量等操作,重點考查下列過程:compute、sort、split、weight、mergefiles。懂得如何使用粘貼命令自動生成SPSS程序。第43頁第二講:SPSS成果瀏覽窗口使用方法詳解、統計繪圖功能詳解要求:熟悉SPSS成果窗口常用操作辦法,掌握輸出成果在文字處理軟件中使用辦法。掌握常用統計圖(線圖、條圖、餅圖、散點、直方圖等)繪制辦法,熟悉其他統計圖繪制辦法,熟悉統計圖一般編輯辦法。重點:能對分析成果進行編輯、輸出。重點考查下列內容:成果表格編輯、在word中使用成果、成果導出。能夠獨立判斷遇到統計問題應當采取何種統計圖形,并用SPSS獨立完成多種常用統計圖繪制。能根據目標對統計圖進行一定編輯。重點考查下列內容:統計圖形正確選用,條圖繪制和編輯,散點圖繪制和編輯,其他多種統計圖特色編輯功能。第44頁第三講:統計基礎知識及其在SPSS中實現要求:熟悉和初步掌握基礎統計概念、過程和辦法:單變量統計、雙變量統計、多變量統計。SPSS中有關這些統計知識和過程幫助及實現:理解SPSS對統計概念和辦法系統詮釋、SPSS若干統計過程及基本功能介紹。第45頁第四講:統計描述,多項選擇題分析,均數間比較要求:掌握常用描述性指標計算辦法,熟悉分類數據兩種錄入格式,掌握多項選擇題常用指標和分析辦法。掌握成組、配伍t檢查、單原因方差分析操作辦法和成果閱讀。重點:能夠正確選用合適統計過程求出均數、標準差等多種常用描述指標。能獨立對多項選擇題進行正確描述。能夠用SPSS獨立進行成組、配伍t、u檢查、一元方差分析,能根據分析目標正確選擇兩兩比較辦法。第46頁第五講:卡方檢查,有關分析,回歸分析要求:熟悉分類數據多種常用檢查成果(成組卡方、配對卡方、分層卡方)計算辦法,掌握輸出成果中各部分正確含義并能正確選擇所需成果。掌握有關分析和回歸分析操作,掌握其成果閱讀。重點:能用正確數據格式完成成組、配對卡方檢查和分層卡方檢查,能從成果中選擇正確概率值。能用SPSS獨立完成簡單有關分析與回歸分析,能正確閱讀其分析成果。第47頁SPSS初中級培訓班課程大綱
SPSS北京辦事處第48頁第一講:SPSS介紹,界面入門、數據管理要求:
理解SPSS系統組成,掌握數據管理界面一般操作,熟悉常用數據轉換命令使用方法。
考查目標:
能夠獨立完成在SPSS中建庫、錄入數據、計算新變量、篩選變量等操作,重點考查下列過程:compute、sort、split、weight、mergefile。
懂得如何使用粘貼命令自動生成SPSS程序。第49頁第二講:SPSS成果瀏覽窗口使用方法詳解、統計繪圖功能詳解要求:
熟悉SPSS成果窗口常用操作辦法,掌握輸出成果在文字處理軟件中使用辦法。
掌握常用統計圖(線圖、條圖、餅圖、散點、直方圖等)繪制辦法,熟悉其他統計圖繪制辦法,熟悉統計圖一般編輯辦法。考查目標:
能對分析成果進行編輯、輸出。重點考查下列內容:成果表格編輯、在word中使用成果、成果導出。
能夠獨立判斷遇到統計問題應當采取何種統計圖形,并用SPSS獨立完成多種常用統計圖繪制。能根據目標對統計圖進行一定編輯。重點考查下列內容:統計圖形正確選用,條圖繪制和編輯,散點圖繪制和編輯,其他多種統計圖特色編輯功能。第50頁第三講:統計描述,多項選擇題分析要求:
掌握常用描述性指標計算辦法,熟悉分類數據兩種錄入格式,掌握多項選擇題常用指標和分析辦法。考查目標:
能夠正確選用合適統計過程求出均數、標準差等多種常用描述指標。能獨立對多項選擇題進行正確描述。第51頁第四講:卡方檢查,均數間比較,非參數檢查要求:
熟悉分類數據多種常用檢查成果(成組卡方、配對卡方、分層卡方)計算辦法,掌握輸出成果中各部分正確含義并能正確選擇所需成果。
熟悉SPSS提供用于測量變量間關聯度指標體系分類。
掌握成組、配伍t、u檢查操作辦法和成果閱讀。
熟悉用SPSS進行非參數統計分析做法,掌握成果閱讀。考查目標:
能用正確數據格式完成成組、配對卡方檢查和分層卡方檢查,能從成果中選擇正確概率值。
能夠用SPSS獨立進行成組、配伍t、u檢查、一元方差分析,能根據分析目標正確選擇兩兩比較辦法。
能正確判斷是否應使用非參數檢查,能正確閱讀多種非參數檢查統計分析成果。第52頁第五講:方差分析模型要求:
掌握單原因方差分析數據格式、操作辦法與成果閱讀,熟悉方差分析中多種兩兩比較辦法選擇、操作和成果閱讀。
掌握一元多原因方差分析模型原理、操作和分析成果閱讀,掌握對應圖形工具在分析中應用。
熟悉多元方差分析模型和反復測量方差分析模型原理和操作辦法,掌握這二者分析成果閱讀。考查目標:
能夠用SPSS獨立進行一元多原因方差分析模型統計分析,能獨立、正確閱讀多元方差分析模型和反復測量方差分析模型統計分析成果。
重點考查內容:一元多原因方差分析模型為考查重點,詳細有對話框操作、分析成果閱讀、均數圖、兩兩比較辦法選擇和成果閱讀。第53頁第六講:有關分析、多元線性回歸與Logistic回歸分析要求:
掌握有關分析、偏有關分析操作與成果閱讀。
掌握多元線性回歸模型原理、分析步驟、操作和成果閱讀,重點掌握逐漸、前進、后退三種篩選辦法含義與使用方法、分析成果閱讀,熟悉多種常用模型診斷工具(分類圖等)使用方法。
掌握二分類Logistic回歸模型原理、分析步驟、操作和成果閱讀。
理解其他回歸模型原理、分析步驟、操作和成果閱讀。考查目標:
能用SPSS獨立完成簡單有關分析、多元線性回歸與Logistic回歸模型分析,能正確閱讀其分析成果,能利用常用模型診斷工具對模型擬和情況進行初步診斷。重點考查:回歸分析時變量篩選、回歸分析成果和Logistic模型分析成果閱讀,變量是否滿足回歸分析要求判斷。第54頁第七講:聚類分析,鑒別分析要求:
掌握迅速聚類和系統聚類操作,理解多種距離,掌握其成果閱讀。
理解鑒別辦法分類,熟悉鑒別分析適用條件和成果驗證辦法,掌握鑒別分析操作,重點掌握成果閱讀。考查目標:
能按要求將樣本進行分類,重點考查對冰柱圖和樹狀圖成果解釋。
能獨立判斷數據是否符合鑒別分析適用條件,能求出對應鑒別式,并使用他對新紀錄進行分類。重點考查對成果閱讀(領域圖、未標化典型鑒別函數、Bayes鑒別函數)和使用分析成果對新紀錄進行分類。第55頁第八講:因子分析,生存分析要求:
熟悉因子分析(主成份分析)用途、目標,掌握如何判斷因子分析適用條件,能正確選擇合適因子。熟悉因子旋轉含義并能正確使用。掌握分析成果閱讀。
理解壽命表法、K-M曲線一般操作辦法,重點掌握成果閱讀。
掌握Cox模型原理、操作辦法和成果閱讀。考查目標:
能獨立使用SPSS進行因子分析處理實際問題,能夠正確閱讀分析成果。重點考查因子數目確實定和成果閱讀。
獨立完成簡單壽命表法、K-M法和復雜COX模型分析,能正確閱讀分析成果。重點考查COX模型操作,分析成果閱讀。第56頁
例11.1某研究人員在探討腎細胞癌轉移有關臨床病理原因研究中,搜集了一批行根治性腎切除術患者腎癌標本資料,現從中抽取26例資料作為示例進行logistic回歸分析(本例來自《衛生統計學》第四版第11章)。i:標本序號x1:確診時患者年紀(歲)x2:腎細胞癌血管內皮生長因子(VEGF),其陽性表述由低到高共3個等級x3:腎細胞癌組織內微血管數(MVC)x4:腎癌細胞核組織學分級,由低到高共4級x5:腎細胞癌分期,由低到高共4期y:腎細胞癌轉移情況(有轉移y=1;無轉移y=0)。第57頁標本序號i年紀x1VEGFx2MVCx3分級x4分期x5癌轉移y159243.4210236157.211036121902104583128431555380341661194.421073817611084212403209501741101058368.622011683132.84201225294.643113521561101431147.82101536331.63111642166.221017143138.6331183211142301935140.221020703177.24312165251.64412245212424023683127.233124312124.82302558112843026603149.8431第58頁Logistic回歸對話框如下:
第59頁第60頁第61頁上表為統計處理情況匯總,即有多少例統計被納入了下面分析,可見此處因不存在缺失值,26條統計均納入了分析。
第62頁此處已經開始了擬合,Block0擬合是只有常數無效模型,上表為分類預測表,可見在17例觀測值為0統計中,共有17例被預測為0,9例1也都被預測為0,總預測精確率為65.4%,這是不納入任何解釋變量時預測精確率,相稱于比較基線。
第63頁上表為Block0時變量系數,可見常數系數值為-0.636。
第64頁上表為在Block0處尚未納入分析方程侯選變量,所作檢查表達假如分別將他們納入方程,則方程變化是否會有顯著意義(根據所用統計量不一樣,也許是擬合優度,Deviance值等)。可見假如將X2系列啞變量納入方程,則方程變化是有顯著意義,X4和X5也是如此,由于Stepwise辦法是一種一種進入變量,下一步將會先納入P值最小變量X2,然后再重新計算該表,再做選擇。
第65頁此處開始了Block1擬合,根據我們設定,采取方法為Forward(我們只設定了一種Block,因此背面不會再有Block2了)。上表為全局檢查,對每一步都作了Step、Block和Model檢查,可見6個檢查都是故意義。此處為模型概況匯總,可見從STEP1到STEP2,DEVINCE從18降到11,兩種決定系數也都有上升。
第66頁此處為每一步預測情況匯總,可見精確率由Block065%上升到了84%,最后達成96%,效果不錯,最后只出現了一例錯判。
第67頁上表為方程中變量檢查情況列表,分別給出了Step1和Step2擬合情況。注意X4P值略大于0.05,但仍然是能夠接收,由于這里用到是排除標準(默以為0.1),該變量能夠留在方程中。以Step2中X2為例,可見其系數為2.413,OR值為11。
上表為假設將這些變量單獨移出方程,則方程變化有沒有統計學意義,可見都是有統計學意義,因此他們應當保存在方程中。
第68頁最后這個表格說明是在每一步中,尚未進入方程變量假如再進入現有方程,則方程變化有沒有統計學意義。可見在Step1時,X4還應當引入,而在Step2時,其他變量是否引入都無關了。
第69頁模型深入優化與簡單診斷
模型深入優化
前面我們將X1~X5直接引入了方程,事實上,其中X2、X4、X5這三個自變量為多分類變量,我們并無證據以為它們之間個各等級OR值是成倍上升,嚴格來說,這里應當采取啞變量來分析,即需要用Categorical鈕將他們定義為分類變量。但本次分析不能這樣做,原因是這里總例數只有26例,假如引入啞變量模型會使得每個等級統計數非常少,從而分析成果將極為奇怪,無法正常解釋,但為了說明啞變量模型使用方法,下面我將演示它是如何做,畢竟不是每個例子都只有26例。
第70頁上表為自變量中多分類變量啞變量取值情況代碼表。左側為原變量名及取值,右側為對應啞變量名及編碼情況:以X5為例,表中可見X5=4時,即取值最高情況被作為了基線水平,這是多分類變量生成啞變量默認情況。而X5(1)代表是X5=1情況(X5為1時取1,不然取0),X5(2)代表是X5=2情況,依此類推。同步注意到許多等級值有幾個統計,顯然背面分析成果不會太好。
第71頁上表出現了非常有趣現象:所有檢查P值均遠遠大于0.05,不過所有變量均沒有被移出方程,這是怎么回事?再看看下面這個表格吧。
第72頁這個表格為方程似然值變化情況檢查,可見在最后Step2生成方程中,無論移出X2還是X4都會引發方程顯著性變化。也就是說,似然比檢查成果和上面Walds檢查成果沖突,以誰為準?此處應以似然比檢查為準,由于它是全局性檢查,且Walds檢查本身就不太準,這一點大家記住就行了,實在要弄明白請去查閱有關文獻。
第73頁第74頁上表為Block1迭代統計,可見無論是似然值,還是三個系數值,均是從迭代開始就向著一種方向發展,最后達成收斂,這說明整個迭代過程是健康,問題不大;假如半途出現曲折,尤其是當引入新變量后變化方向變化了,則提醒要好好研究。
第75頁上表為方程中變量有關矩陣,可見X2和常數有關性較強,當引入X4后仍然如此,提醒要關注這一現象,以防因自變量間共線性造成方程系數不穩(此時迭代統計多半也會有波動)。當然,由于本例只有26條統計,這一問題是沒有措施深入研究。
第76頁上圖是Step1結束時,即只引入X2時預測圖,0和1代表實際取值,當預測概率值大于0.5時,則預測成果為1,反之為0,由上圖可見,該模型對0預測是比較好,多數概率都在0附近,但對1預測不準,雖然正確,計算出概率也在0.8左右,并且有好幾個都判錯了。
第77頁上圖為Step2結束后模型預測情況,可見此時預測成果有了較大改善,概率精度提升了許多,只有一例0被錯判為了1,并且從分布上看,這一例也許是極端情況,再引入其他變量也不見能將預測效果變化多少。
第78頁第79頁第80頁第81頁
第82頁第83頁第84頁SPSS高級培訓班課程大綱
SPSS北京辦事處第85頁第一講:方差分析模型掌握單原因方差分析數據格式、操作辦法與成果閱讀,熟悉方差分析中多種兩兩比較辦法選擇、操作和成果閱讀。掌握一元多原因方差分析模型原理、操作和分析成果閱讀,掌握對應圖形工具在分析中應用。熟悉多元方差分析模型和反復測量方差分析模型原理和操作辦法,掌握這二者分析成果閱讀。第86頁第二講:有關分析,回歸分析模型掌握有關分析、偏有關分析操作與成果閱讀。掌握多元線性回歸模型原理、分析步驟、操作和成果閱讀,重點掌握逐漸、前進、后退三種篩選辦法含義與使用方法、分析成果閱讀,熟悉多種常用模型診斷工具(分類圖等)使用方法。熟悉加權最小二乘法、兩階段最小二乘法原理、操作和成果閱讀,理解最優尺度回歸功能。第87頁第三講:Logistic模型、非線性回歸掌握二分類Logistic回歸模型原理、分析步驟、操作和成果閱讀,熟悉無序多分類、有序多分類Logistic回歸模型、Probit模型原理、分析步驟、操作和成果閱讀熟悉非線性回歸模型操作和成果閱讀。第
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 酒類產品營銷渠道拓展與創新考核試卷
- 金融行業保險產品設計與應用考核試卷
- 鉀肥生產過程中的環境保護設施運行考核試卷
- 數據庫日常維護要點試題及答案
- 設計項目管理中的風險管理考核試卷
- 企業網絡安全評估考題及答案
- 網絡安全管理與合規性試題及答案
- 平安守護服務管理制度
- 學校社工站點管理制度
- 學習嵌入式系統中的版本管理試題及答案
- 固定資產折舊年限表
- 臨床醫學基礎科目十門聯考習題冊(題庫一頁兩版)
- 《中國近現代史綱要》課后習題答案詳解
- 區域地理拉丁美洲-巴西
- 語文小學二年級《二年級下冊第三單元〈中國美食〉作業設計》
- 直臂車操作員安全技術交底-
- 蘇州市初一信息技術期末復習知識點整理-葵花寶典
- 大學生溝通與社交禮儀
- GB/T 42064-2022普通照明用設備閃爍特性光閃爍計測試法
- GB/T 8162-2008結構用無縫鋼管
- GB/T 32662-2016廢橡膠廢塑料裂解油化成套生產裝備
評論
0/150
提交評論