




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
關于描述性統計分析本章學習目標:掌握數據分析項目的整個過程;掌握數據的分類方法;掌握對數據進行描述的圖形化方法和數值方法;學習分析數據分布的方法;掌握應用SPSS進行描述性數據分析的方法;掌握常用統計圖形的繪制方法和解釋技巧
第2頁,共59頁,2024年2月25日,星期天前言:描述性統計和推斷性統計統計學分為描述性統計分析和推斷性統計分析描述性統計應用分類、制表、圖形以及概括性數據指標來概括數據分布特征的方法。結論不能推及總體。
推斷性統計推斷性統計分析得到的結論適用于總體。第3頁,共59頁,2024年2月25日,星期天統計量統計分析往往是從了解數據的基本特征開始的。統計上,需要把樣本數據所含信息進行概括、融合和抽象,從而得到反映樣本數據的綜合指標,這些指標稱為統計量。第4頁,共59頁,2024年2月25日,星期天描述性統計分析指標統計量可分為兩類一類表示數據的中心位置,例如均值、中位數、眾數等一類表示數據的離散程度,例如方差、標準差、極差等用來衡量個體偏離中心的程度。
第5頁,共59頁,2024年2月25日,星期天3.1頻率分析功能:頻率分析主要通過頻率分布表、條形圖和直方圖,以及集中趨勢和離散趨勢的各種統計量來描述數據的分布特征第6頁,共59頁,2024年2月25日,星期天頻率分析意義意義:SPSS的頻數分析過程(Frequencies)是描述性分析中最基本也是最常用的方法之一。通過頻數分析,我們可以得到詳細的頻數表以及平均值、最大值、最小值、方差、標準差、極差、平均數標準誤、偏度系數和峰度系數等重要的描述統計量,還可以通過分析得到合適的統計圖。所以進行頻數分析不僅可以方便地對數據按組進行歸類整理,還可以對數據的分布特征形成初步的認識。第7頁,共59頁,2024年2月25日,星期天頻率分析術語頻率
對于定性觀測值時,把它們按照某種原則分成一些組,每個觀測值必須落入一個類并且只能夠落入一個類中。對于給定的類,落入這個類的個案數稱為頻率
落入該類中的個案數和個案總數的比例稱為相對頻率第8頁,共59頁,2024年2月25日,星期天案例數據文件EmployData.sav記錄了某公司職工的基本信息,例如性別、民族、出生日期、教育水平、工資水平、工作年限等。教育水平為分類變量,它有11個類別。
第9頁,共59頁,2024年2月25日,星期天SPSS頻率分析選擇【分析】→【描述統計】→【頻率】
第10頁,共59頁,2024年2月25日,星期天頻率分析選項-統計量第11頁,共59頁,2024年2月25日,星期天頻率分析選項-圖表第12頁,共59頁,2024年2月25日,星期天頻率分析的結果解釋頻率表格條形圖、直方圖第13頁,共59頁,2024年2月25日,星期天當堂練習-頻率分析實例案例3.1身高數據給出了河南省某學校50名高二學生的身高。試分析該50名學生的身高分布特征,計算平均值、最大值、最小值、標準差等統計量,并繪制頻數表、直方圖。第14頁,共59頁,2024年2月25日,星期天3.2中心趨勢的描述均值(尺度數據和定序數據)中位數(尺度數據和定序數據)眾數(定性數據和尺度數據)5%截尾均值(尺度數據和定序數據)
第15頁,共59頁,2024年2月25日,星期天均值均值即數據的算術平均數,是數據中心趨勢的主要度量指標,設變量有n個測量值,則算術均值為:第16頁,共59頁,2024年2月25日,星期天均值的特點最常用的中心位置度量受極端值影響例:1,3,5,7,9和
1,3,5,7,14第17頁,共59頁,2024年2月25日,星期天中位數重要的中心位置度量在遞增排序后的數據列中若數據個數為奇數,中位數是正中央的數若數據個數是偶數,中位數是正中央的兩數的平均值.不受極端值的影,例如:1,5,7,3,9第18頁,共59頁,2024年2月25日,星期天眾數發生頻數最高的數據值不受極端值的影響眾數可能不存在可能有多個眾數(單峰,雙峰,多峰)可用于定量或定性數據第19頁,共59頁,2024年2月25日,星期天5%截尾均值避免了極端值的影響
第20頁,共59頁,2024年2月25日,星期天3.3離散趨勢的描述僅僅根據數據的中心趨勢指標進行決策是不夠的。例如,如果一個國家的不同家庭收入差距很少;而另一個國家的家庭收入差距很大,既存在大量的貧困家庭,也存在許多十分富有的家庭,那么即使這兩個國家的中等收入家庭的收入完全一樣,其家庭收入情況仍然完全不同。第21頁,共59頁,2024年2月25日,星期天例子假設我們有以下的三組觀測值:觀測A:11,12,13,16,16,17,18,21觀測B:14,15,15,15,16,16,16,17觀測C:11,11,11,12,19,20,20,20這三組觀測值的均值都是15.5,那么這三組數據是否相似呢?第22頁,共59頁,2024年2月25日,星期天離散趨勢第23頁,共59頁,2024年2月25日,星期天離散趨勢的描述極差(range)方差(Variance)標準差(S.d.)分位數(Percentage)變異指標第24頁,共59頁,2024年2月25日,星期天極差極差=最大值-最小值受極端值影響較大第25頁,共59頁,2024年2月25日,星期天方差和標準差方差標準差第26頁,共59頁,2024年2月25日,星期天變異系數在比較兩組數據離散程度大小時,如果數據的測量尺度相差太大,直接比較二者的標準差并不合適。需要首先消除測量尺度和量綱的影響。變異系數可以剔除這些影響,其計算公式為:第27頁,共59頁,2024年2月25日,星期天分位數第p百分位數使得至少有p%的數據小于或等于這個值,且使得至少有(100-p)%的數據大于或等于這個值如何計算?將原數據從小到大排列計算i=(p/100)n若i是整數,則第p百分位數為第i與第i+1項的平均若i不是整數,則向上取整。第28頁,共59頁,2024年2月25日,星期天總結五數最小值、第一個四分位數、中位數、第三個四分位數、最大值從這五個值可以大致看出數據分布的中心和離散程度。而箱圖則是這五個數的圖形表現
第29頁,共59頁,2024年2月25日,星期天3.4分布的形狀偏度當偏度系數大于0時,分布為正偏或右偏,布圖形在右邊拖尾,分布圖有很長的右尾,尖峰偏左當偏度系數小于0,分布為負偏或左偏,即分布圖形在左邊拖尾,分布圖有很長的左尾,峰尖偏右當偏度系數為0,分布對稱第30頁,共59頁,2024年2月25日,星期天峰度峰度
>3,分布為高峰度,即比正態分布的峰要陡峭;<3,分布為低峰度,即比正態分布的峰要平坦些;=0,分布為正態峰。第31頁,共59頁,2024年2月25日,星期天3.5SPSS描述性統計許多菜單均可進行描述性分析,提供描述性統計指標的輸出。例如T檢驗、方差分析、因子分析等SPSS自定義表模塊也可以產生大部分的描述性統計指標第32頁,共59頁,2024年2月25日,星期天SPSS中的菜單專門的描述性統計菜單:頻率(F):該過程將產生頻數表,輸出頻數分布的條形圖、餅圖或者直方圖;描述(D):該過程則進行一般性的統計描述;探索(E):該過程用于對數據概況不清時的探索性分析;交叉表(C):該過程完成分類數據的統計描述和一般的統計檢驗,我們常用的檢驗也包含在該對話框中。第33頁,共59頁,2024年2月25日,星期天頻率:實例【分析】→【描述】→【頻率】
第34頁,共59頁,2024年2月25日,星期天頻率:統計量的選擇第35頁,共59頁,2024年2月25日,星期天頻率:結果的解釋第36頁,共59頁,2024年2月25日,星期天描述性子菜單第37頁,共59頁,2024年2月25日,星期天當堂練習-描述性分析實例案例3.2體重數據給出了河南省某高校50名大一入學新生的體重。試對該50名學生的體重進行描述性分析,從而了解這50名學生體重的基本特征。第38頁,共59頁,2024年2月25日,星期天探索子菜單【分析】→【描述統計】→【探索】該菜單可以對不同的組分別給出描述性統計量第39頁,共59頁,2024年2月25日,星期天探索:選擇統計量第40頁,共59頁,2024年2月25日,星期天探索:圖第41頁,共59頁,2024年2月25日,星期天探索:結果解釋(1)第42頁,共59頁,2024年2月25日,星期天探索:結果解釋(2)第43頁,共59頁,2024年2月25日,星期天當堂練習-探索分析實例實例3.3氣溫數據給出了鄭州、泰安兩城市2012年各月份的平均氣溫。試據此對兩城市平均氣溫進行探索性統計分析,研究其基本特征。第44頁,共59頁,2024年2月25日,星期天設定表格第45頁,共59頁,2024年2月25日,星期天表格:摘要統計量設置第46頁,共59頁,2024年2月25日,星期天當堂練習-列聯表分析實例數據文件EmployeeData給出了某公司職工的基本信息,據此對職工的教育水平進行列聯表分析,研究不同性別的職工教育水平之間有無明顯的差別。第47頁,共59頁,2024年2月25日,星期天3.6統計圖進行描述性統計分析定性數據條形圖餅圖帕累托圖定量數據直方圖莖葉圖箱圖第48頁,共59頁,2024年2月25日,星期天頻率描述-頻率->圖表條形圖餅圖直方圖示例:數據文件DisasterReason.sav條形圖餅圖直方圖帕累托圖第49頁,共59頁,2024年2月25日,星期天條形圖第50頁,共59頁,2024年2月25日,星期天餅圖第51頁,共59頁,2024年2月25日,星期天帕累托圖第52頁,共59頁,2024年2月25日,星期天直方圖-莖葉圖-箱圖描述性->探索直方圖莖葉圖箱圖示例:數據EmployeeData.sav直方圖莖葉圖箱圖第53頁,共59頁,2024年2月25日,星期天直方圖和莖葉圖第54頁,共59頁,2024年2月25日,星期天箱圖第55頁,共59頁,2024年2月25日,星期天從舊對話框作圖重新完成上面兩個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中式傳統美食連鎖店行業跨境出海項目商業計劃書
- 住宿業大數據分析平臺行業跨境出海項目商業計劃書
- 高精度照度計行業跨境出海項目商業計劃書
- 生物甲烷提純技術企業制定與實施新質生產力項目商業計劃書
- 主題公園酒店企業制定與實施新質生產力項目商業計劃書
- 高端仿真皮沙發系列企業制定與實施新質生產力項目商業計劃書
- 高級球桿保養秘籍企業制定與實施新質生產力項目商業計劃書
- 個性化營銷策略創新-洞察闡釋
- 數據驅動的品牌價值重塑與用戶行為分析-洞察闡釋
- 基于深度學習的儀器儀表故障預測模型-洞察闡釋
- 2023污水處理用復合碳源技術規范
- 4-6歲一盤粽子-超輕粘土課件
- 解讀《2023年中國血脂管理指南》
- 承插型盤扣式鋼管腳手架典型產品構配件種類及規格
- 馬鈴薯(土豆)深加工項目可行性研究報告
- 《眼底病圖譜》教學課件
- 公司聲譽風險管理辦法(2022年修訂)
- 新能源汽車故障診斷與排除課件:項目三 高壓互鎖故障診斷
- 負荷計算及負荷
- 《中國文化的根本精神 精裝 》讀書筆記思維導圖
- 2023年湖南高考英語聽力練習試題「含原文答案」
評論
0/150
提交評論