




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
描述性統計分析第1頁,共23頁,2023年,2月20日,星期五描述性統計只對統計數據的結構和總體情況進行描述,并不能深入了解統計數據的內部規律。Spss的許多模塊都可完成描述性統計分析,但專門為該目的而設計的幾個模塊則集中在descriptivestatistics菜單中,他們就是計算各種統計量或繪制統計圖來實現描述功能。第2頁,共23頁,2023年,2月20日,星期五descriptivestatistics菜單主要內容(1)頻數分布表分析(Frequencies):其特色就是產生頻數表,對分類數據和定量資料都適用。(2)統計描述分析(Descriptive)進行一般性描述,適用于服從正態分布的定量資料。(3)Explore過程:用于對數據分布狀況不清楚時的探索性分析,它會雜七雜八給出一大堆可能用到的統計指標和統計圖,讓研究者參考。(4)Crosstabs
過程則完成計數資料和等級資料的統計描述和一般的統計檢驗我們常用的X2檢驗也在其中完成(5)Ratio過程;用于對兩個連續性變量計算相對比指標,它可以計算出一系列非常專業的相對比描述指標。第3頁,共23頁,2023年,2月20日,星期五常用的描述統計量集中趨勢指標(centraltendency):標準差(standarddeviation),均數(means)眾數(mode),中位數(median),總和(sum),標準誤(S.E.mean)等。其中標準差方差只適用正態分布。標準誤則反映了樣本均數的波動程度。
百分位數指標(percentile):包括四分位數,各個百分位數等,適用于任何分布類型資料。分布指標(distribution):偏度系數(Skewness)和峰度系數(Kurtosis),反映了數據偏離正態分布的程度其它:M統計量(M-estimators)、極端值(outlier)等,主要用于對存在異常值的數據進行描述。第4頁,共23頁,2023年,2月20日,星期五7.1frequencies過程頻數分布表是描述性統計中最常用的方法之一,Frequencies過程就是專門為產生頻數表而設計的,它不僅可以產生單變量詳細的頻數表,顯示文件中指定變量特定值發生的頻數,還可以獲得某些描述統計量或按要求給出某百分位點的數值以及常用的條圖、圓圖等統計圖。第5頁,共23頁,2023年,2月20日,星期五7.1.1對話框界面及各部分選項說明【Displayfrequencytables復選框】確定是否在結果中輸出頻數表。【Statistics鈕】單擊后彈出Statistics對話框,用于定義需要計算的其他描述統計量。第6頁,共23頁,2023年,2月20日,星期五
分布指標百分位數指標集中趨勢指標離散趨勢指標計算百分數時選此項第7頁,共23頁,2023年,2月20日,星期五【Charts鈕】彈出Charts對話框,用于設定所做的統計圖。Charttype單選鈕組定義統計圖類型,有四種選擇:無、條圖(Barchart)、圓圖(Piechart)、直方圖Histogram),其中直方圖還可以選擇是否加上正態曲線(Withnormalcurve)。ChartValues單選鈕組定義是按照頻數還是按百分比做圖(即影響縱坐標刻度)。【Format鈕】彈出Format對話框,用于定義輸出頻數表的格式,不過用處不大,一般不管。第8頁,共23頁,2023年,2月20日,星期五
7.1.2分析實例例6.1某地101例健康男子血清總膽固醇值測定結果存在文件danguchun.sav中,請繪制頻數表、直方圖,計算均數、標準差、變異系數CV、中位數M、p2.5和p97.5。第9頁,共23頁,2023年,2月20日,星期五操作過程如下:1.Analyze==>DescriptiveStatistics==>Frequencies2.Variables框:選入X3.單擊Statistics鈕:4.選中Mean、Std.deviation、Median復選框5.單擊Percentiles:輸入2.5:單擊Add:輸入97.5:單擊Add:6.單擊Continue鈕7.單擊Charts鈕:8.選中Barcharts9.單擊Continue鈕10.單擊OK第10頁,共23頁,2023年,2月20日,星期五結果解釋最上方為表格名稱,左上方為分析變量名,可見樣本量N為101例,缺失值0例,均數Mean=4.69,中位數Median=4.61,標準STD=0.8616,P2.5=3.04,P97.5=6.45。第11頁,共23頁,2023年,2月20日,星期五系統對變量x作頻數分布表(此處只列出了開頭部分)Vaild右側為原始值,Frequency為頻數,Percent為各組頻數占總例數的百分比(包括缺失記錄在內),Validpercent為各組頻數占總例數的有效百分比,CumPercent為各組頻數占總例數的累積百分比。第12頁,共23頁,2023年,2月20日,星期五7.2Descriptives過程Descriptives過程是連續資料統計描述應用最多的一個過程,他可對變量進行描述性統計分析,計算并列出一系列相應的統計指標。這和其他過程相比并無不同。但該過程還有個特殊功能就是可將原始數據轉換成標準正態評分值并以變量的形式存入數據庫供以后分析。第13頁,共23頁,2023年,2月20日,星期五確定是否將原始數據的標準正態變換結果存為新變量。選入需要描述的變量,可選入多個第14頁,共23頁,2023年,2月20日,星期五變量列表順序字母順序均數升序均數降序。
第15頁,共23頁,2023年,2月20日,星期五一個典型的Descriptives過程結果統計表最上方為表格名稱,左下方為分析變量名,可見樣本量N為101例;均數:Mean=4.6995,最大值:Maximum=7.22,標準差:STD=0.8616,最小值:Minimum=2.70。第16頁,共23頁,2023年,2月20日,星期五7.3Explore過程主要用于對資料數據的性質、分布狀況等完全不清楚時的進行分析,故稱探索性分析。在常用的描述性統計指標的基礎上,它又增加了有關數據詳細分布特征的文字與圖形描述,如莖葉圖、箱式圖等,顯得更加詳細全面。還可以為以方差齊性為目的的變量變換提供線索,有助于用戶制定繼續分析的方案。第17頁,共23頁,2023年,2月20日,星期五選入需要分析的變量選入分組變量選擇一個變量,他的取值將作為每條記錄的標簽
選擇所需要的描述統計量
選擇所需要的統計圖
選缺失值的處理方式第18頁,共23頁,2023年,2月20日,星期五Statistics對話框Descriptives復選框:輸出均數、中位數、眾數、5%修正均數、標準誤、方差、標準差、最小值、最大值、全距、四分位全距、峰度系數、峰度系數的標準誤、偏度系數、偏度系數的標準誤及指定的均數可信區間。M-estimators復選框:作中心趨勢的粗略最大似然確定,該統計量是用哪個迭代法計算出來的,輸出四個(Huber,Andrew,Hampel,Tukey)不同權重的最大似然確定數。其中huber法適用于數據接近正態分布的情況,另三種適合數據中有許多異常值時。Outliers復選框:輸出五個最大值與五個最小值。Percentiles復選框:輸出第5%、10%、25%、50%、75%、90%、95%位數。第19頁,共23頁,2023年,2月20日,星期五第20頁,共23頁,2023年,2月20日,星期五血清總膽固醇Stem-and-LeafPlotFrequencyStem&Leaf1.002.78.003.001233349.003.55668999924.004.00000111122233333334444425.004.555555666667777777778889917.005.011111112223333349.005.5567788896.006.1123331.006.51.00Extremes(>=7.2)Stemwidth:1.00Eachleaf:1case(s)第21頁,共23頁,2023年,2月20日,星期五莖葉圖,整數位為莖,小數位為葉。這樣可以非常直觀的看出數據的分布范圍及形態第22頁,共23頁,2023年,2月20日,星期五作業1、對給定數據文件exe
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國解剖刀行業市場前景預測及投資價值評估分析報告
- 青少年網絡安全教育片心得體會
- 信息技術領域領導干部能力素質提升培訓心得體會
- 電子產品供應商導入流程分析
- 牛奶行業發展前景及未來趨勢分析報告
- 2025年培訓調研總結報告
- 建材行業市場調查報告
- 初三畢業班班主任教學改革工作計劃
- 西南交通大學電力系統實驗報告1
- 自媒體商業項目計劃書
- 贛州城投招聘試題及答案
- 湖北省武漢市2025屆高中畢業生四月調研考試物理試題及答案(武漢四調)
- 人教版七年級地理下冊 第十章、第十一章 評估測試卷(含解析)
- 消化內科診療指南和技術操作規范
- 2025-2030方塊地毯行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 小兒推拿(大全)課件
- 全身麻醉和睡眠
- 管廊安全培訓課件圖片
- 科技與文化融合的傳播方式
- 基層武裝工作知識
- 生產異常處理方法及流程
評論
0/150
提交評論