




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章SPSS的基本統計分析SPSS的基本統計分析頻數分析-對應圖表法計算描述統計量-對應數值法探索性描述分析-結合交叉分組下的頻數分析多選項分析統計圖-對應圖形法頻數分析目的 粗略把握變量的總體分布狀況。例:對某個問題的總體看法,如新業務的使用愿望、教學效果等對某事物的客觀描述,如通話的漫游類型、大客戶的行業分布采用的方法制作頻數分布表:包括計算
頻數、累計頻數、百分比、累計百分比繪制統計圖形:條形圖(品質數據)、餅圖、直方圖(數量數據)頻數分析基本操作步驟(1)菜單選項:Analyze->DescriptiveStatistics->Frequencies(2)選擇幾個待分析的變量到variables框.(3)chart選項,選擇所需要的圖形例:班級男女生頻數分布表、成績分布表頻數分析應用舉例移動通話的漫游類型分析特點:定類數據使用頻數、百分比、總數(不可缺少的)不使用頻數表中給出的累計頻數和累計百分比移動通話時間分析、移動客戶話費分析特點:定序數據、數量數據除使用頻數、百分比、總數外,還可以充分使用累計頻數和累計百分比頻數分析數據中存在缺失值使用有效百分比(分母為有效樣本數)例:學生成績得優率、得良率Frequencies->Format頻數分布表輸出按變量值、頻數升序、降序輸出頻數分析頻數分析中的其他分析計算中位數、分位數:適用于定序、定距數據數據按升序排序后,找到若干個分位點上的變量值quartiles:計算四分位數25%(QL)、50%(中位數)、75%(QU)
cutpointsfornequalgroups:n等份percentile:自定義百分位點計算眾數:適用于定類數據(但必須是數值型)頻數分析頻數分析中的其他分析分位數的應用從一個側面比較兩組樣本數據的集中趨勢例:(QL=50,QU=80)和(QL=70,QU=75)的比較在排除極端值影響的條件下,通過計算分位數差,比較兩組樣本數據的離散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比較分位數、中位數、眾數的應用舉例不同類型的移動客戶月話費比較(數據拆分)利用分位數(不顯示頻數分布表),比較男女生成績集中程度計算描述統計量目的精確把握變量的總體分布狀況,了解數據的集中趨勢、離散趨勢、對稱程度、陡峭程度。基本方法計算基本描述統計量計算描述統計量描述集中趨勢的統計量均值(mean):表示某變量所有變量值集中趨勢或平均水平的統計量。適用于定距定比數據。特點:利用了全部數據,易受極端值的影響。描述離散程度的統計量標準差(standarddeviation--StdDev):表示某變量的所有變量值離散趨勢的統計量。SPSS中計算的是樣本標準差。方差(variance):標準差的平方。SPSS中計算的是樣本方差。極差(range):最大值(minimum)-最小值(minimum)計算描述統計量描述對稱程度的統計量偏度(skewness):描述某變量所有變量值分布形態的偏斜程度和方向的統計量.偏度為0表示對稱;大于0表示正偏差大(右偏),眾數比均值小,極值大于均值;小于0表示負偏差大(左偏)。計算描述統計量描述陡峭程度的統計量峰度(kurtosis):描述某變量所有變量值分布形態陡緩程度的統計量。峭度為0表示與正態分布峭度相同。大于0表示比正態分布陡,尖峰。小于0表示比正態分布緩;平峰。計算描述統計量其他統計量均值標準誤差(S.Emeans)中心極限定理認為:樣本均值~N(u,
2/n)反映樣本均值與總體真值間的平均離散程度樣本數越大,樣本均值的離散程度越小,對真值的估計越準確計算描述統計量基本操作步驟(1)菜單選項:Analyze->DescriptiveStatistics->Descripive(2)選擇將參加計算的數值型變量名到Variables框。 ——僅適用于數值型變量分析比較男生和女生的學習成績比較集中趨勢比較離散趨勢比較偏斜程度比較陡峭程度實現方式:數據拆分其他功能數據標準化處理新變量的均值為0,標準差為1;小于0表示在平均水平下,大于0反之.正態分布的數據標準化后呈標準正態分布(68%,95%,99%)savestandardizedvaluesasvariables選項將變量作標準化后,結果存入名為“Z+原變量名”的新變量中.數據標準化處理應用舉例快速找到移動話費出眾的客戶網通集團企業效益評價計算描述統計量探索性描述分析目的:在未知數據分布特點情況下,通過計算詳盡描述統計量,輔助全面的統計圖,認識數據分布。基本操作步驟(1)菜單選項:analyze->descriptivestatistics->Explore(2)選擇將參加計算的數值型變量名到Dependentlist框(3)進行分組描述分析時,將分組變量選入Factlist框描述統計量:M統計量:集中趨勢的估計值,不受極端值影響。用于判斷有無異常值。探索性描述分析相關圖形箱線圖莖葉圖直方圖正態分布圖:檢驗變量是否符合正態分布方差齊性檢驗:各組離散程度是否相同H0:方差相等舉例:兩班學生成績分布情況,離散程度是否相同。購買數量已婚者單身者多31%52%少69%48%列總計100%100%個案數700300購買數量男性女性已婚者單身者已婚者單身者多35%40%25%60%少65%60%75%40%列總計100%100%100%100%個案數400120300180購買數量全部樣本多37.3%少62.7%列總計100%個案數1000購買流行服裝交叉分組下的頻數分析針對定類數據和定序數據的頻數分析(用于定類定序數據分析有customtable\logistic\loglinear)目的:通過了解不同變量在不同水平下的數據分布情況,判斷水平對變量是否有影響例:女生的學習成績比男生好嗎?(兩變量)不同專業的女生學習成績都比男生好嗎?(三變量)分析的主要步驟產生交叉列聯表分析列聯表中變量間的關系產生交叉列聯表什么是列聯表多個變量在不同取值下的數據分布頻數表列變量行變量工商管理控制變量頻數性別成績優良差男女產生交叉列聯表基本操作步驟(1)菜單選項:analyze->descriptivestatistics->
crosstabs(2)選擇一個變量作為行變量到row框.(3)選擇一個變量作為列變量到column框.(4)可選一個或多個變量作為控制變量到layer框.(5)是否顯示各分組的條圖(displayclusteredbarcharts)產生交叉列聯表scale數據可做適當分組后再產生列聯表僅利用頻數,信息利用不充分進一步計算
cells選項:選擇在頻數分析表中輸出各種百分比.row:行百分比(Rowpct);column:列百分比(Colpct);total:總百分比(Totpct);分析列聯表中變量間的關系目的:
通過列聯表分析,檢驗行列變量之間是否獨立。方法:
卡方檢驗:對品質數據的相關性進行度量(這里兩變量均為定類數據或定序數據)分析列聯表中變量間的關系卡方檢驗基本步驟(1)H0:行列變量之間無關聯或相互獨立(2)構造卡方統計量統計量服從(r-1)*(c-1)個自由度的卡方分布count:觀察(實際)頻數expectedcount:期望頻數(期望頻數反映的是H0成立情況下的數據分布特征)分析列聯表中變量間的關系卡方檢驗基本步驟(3)計算卡方統計量的值,并得到該統計量值的概率P值(4)決策。概率P與顯著性水平比較,小于等于則拒絕H0,否則不能拒絕實現步驟statistics選項PearsonChi-Square:常用于行列變量獨立性檢驗LikelihoodRatio:可用于對數線性模型檢驗Fisher‘sExactTest:N<40,或Fe<5Linear-by-LinearAssociation:線性相關卡方檢驗卡方檢驗的要求:一般要求列聯表中期望頻數小于5的格子數不超過20%,否則會夸大卡方值,容易得出拒絕結論,可以采用精確檢驗。N>=40,T>=5, Pearson卡方檢驗,若P≈α,改用確切概率法檢驗N<40,或T<5, 確切概率法檢驗分析列聯表中變量間的關系行列變量相關性的其他測度指標Nominal(定類變量):phi系數:在2×2列聯表中,通常[-1,1],負號無實際意義列聯C系數(contingencycoefficient),通常為[0,1)V系數[0,1]值越大表示行列變量的相關性越大分析列聯表中變量間的關系Ordinal(定序變量)反映定序變量一致性指標行變量等級越高,列變量等級也越高或越低——一致性高行變量等級越高,列變量等級不定——不一致指標絕對值越大越相關,越接近0越無關定序變量一致性檢驗年齡與工資收入交叉列聯表 低中高 青 40000 中 05000 老 00 600 低中高 青 00 500 中 0600 0老 4000 0一致一致應用舉例受教育程度越
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 咖啡門店店長管理制度
- 園區品牌運營管理制度
- 培訓學校課程管理制度
- 醫院安全用火管理制度
- 醫院感染中心管理制度
- 應用基礎研究和應用研究
- 云六一節活動方案
- 云南旅游團活動方案
- 云鯨智能公司活動方案
- 互助創新活動方案
- 第三單元第2課《盛情邀約》課件-七年級美術下冊(人教版2024)
- 醫學研究中期進展報告范文
- 塑料零件的快速換模技術考核試卷
- 律師事務所調查報告范文
- 基于SysML的空中分布式作戰體系建模研究
- 中國糖尿病防治指南(2024版)解讀2
- 《化工過程本質安全化評估技術指南》
- DB51T 1466-2012 馬尾松二元立木材積表、單木出材率表
- 《有機化學》課件-第九章 醛和酮
- 文獻管理與信息分析學習通超星期末考試答案章節答案2024年
- 創業管理實戰學習通超星期末考試答案章節答案2024年
評論
0/150
提交評論