Excel數據整理與分析之描述統計介紹課件_第1頁
Excel數據整理與分析之描述統計介紹課件_第2頁
Excel數據整理與分析之描述統計介紹課件_第3頁
Excel數據整理與分析之描述統計介紹課件_第4頁
Excel數據整理與分析之描述統計介紹課件_第5頁
已閱讀5頁,還剩25頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Excel數據整理與分析之描述統計介紹課件匯報人:AA2024-01-252023AAREPORTING描述統計基本概念與意義數據收集與整理方法數值型數據描述統計指標類別型數據描述統計指標圖表展示技巧在描述統計中應用案例實戰:Excel在描述統計中應用目錄CATALOGUE2023PART01描述統計基本概念與意義2023REPORTING描述統計定義描述統計是研究數據搜集、整理和描述的統計學方法,其內容包括如何取得研究所需要的數據,如何用圖表形式對數據進行處理和展示,如何通過對數據的綜合、概括與分析,得出表示數據特征的統計指標。描述統計作用描述統計在數據分析中發揮著重要作用,它可以幫助我們了解數據的基本情況,發現數據中的規律和趨勢,為后續的推斷統計和決策分析提供基礎。描述統計定義及作用

數據類型與特點定量數據定量數據是數值型數據,如身高、體重等,具有可加性、可比性和可測量性。定量數據可以進行各種數學運算和統計分析。定性數據定性數據是描述性的、非數值型的數據,如性別、職業等。定性數據通常通過分類、編碼和匯總等方式進行處理和分析。時間序列數據時間序列數據是按時間順序排列的數據,如股票價格、氣溫變化等。時間序列數據具有趨勢性、周期性和隨機性等特點。了解數據分布01通過描述統計方法,可以了解數據的分布情況,如數據的集中趨勢、離散程度和偏態等。這有助于我們更好地把握數據的整體特征。發現數據規律02描述統計可以幫助我們發現數據中的規律和趨勢,如通過繪制折線圖或散點圖來觀察數據的變化趨勢。這有助于我們預測未來的數據走向。為推斷統計提供基礎03描述統計是推斷統計的基礎,通過描述統計方法可以對數據進行初步的處理和分析,為后續的假設檢驗、回歸分析等推斷統計方法提供必要的數據支持。描述統計在數據分析中重要性PART02數據收集與整理方法2023REPORTING通過調查問卷、實驗、觀察等方式直接獲取原始數據。原始數據收集二手數據收集網絡爬蟲技術從公開數據庫、研究報告、政府統計資料等獲取已有數據。運用網絡爬蟲工具自動抓取網頁上的結構化數據。030201數據來源及收集途徑對缺失數據進行填充、插值或刪除等操作。缺失值處理識別并處理數據中的異常值,如離群點、錯誤數據等。異常值處理將數據類型轉換為適合分析的形式,如文本轉數值、日期格式轉換等。數據類型轉換數據清洗與預處理技巧將數據按比例縮放,使之落入一個小的特定區間,如[0,1]或[-1,1]。數據歸一化將數據轉換為均值為0,標準差為1的標準正態分布。數據標準化將連續型數據轉換為離散型數據,如通過分箱、分段等方式。數據離散化數據轉換和標準化操作PART03數值型數據描述統計指標2023REPORTING中位數將數值型數據按大小順序排列,位于中間位置的數。適用于數值型數據,反映數據的中心趨勢。均值所有數值的和除以數值的個數。適用于數值型數據,反映數據的平均水平。眾數出現次數最多的數。適用于離散型數據,反映數據的集中趨勢。均值、中位數和眾數計算方法及應用場景應用場景均值常用于表示一組數據的“平均”水平,如平均工資、平均成績等。中位數用于表示一組數據的“中等”水平,特別適用于存在極端值的數據集。眾數用于表示一組數據中出現次數最多的數,常用于市場調研和統計分析中。01020304均值、中位數和眾數計算方法及應用場景01方差各數值與均值之差的平方的平均數。反映數據的離散程度。02標準差方差的算術平方根。反映數據的波動大小。03變異系數標準差與均值之比。消除單位和平均數不同對離散程度比較的影響。04方差S^2=∑(Xi-μ)^2/n,其中Xi為各數值,μ為均值,n為數值個數。05標準差S=√S^2,即方差的算術平方根。06變異系數CV=S/μ,即標準差與均值之比。方差、標準差和變異系數含義及計算方法偏態系數:描述數據分布形態的偏斜程度及方向。正偏態表示數據右偏,負偏態表示數據左偏。峰態系數:描述數據分布形態的尖峭程度。峰態系數大于0表示數據分布比正態分布更尖峭,小于0則表示更扁平。在數據分析中應用偏態系數可用于判斷數據是否服從正態分布,以及分布的偏斜程度和方向。對于非正態分布的數據,可根據偏態系數進行相應的變換處理,使其接近正態分布。峰態系數可用于判斷數據分布的尖峭程度,以及是否存在異常值或極端值。對于峰態系數較大的數據分布,應注意異常值或極端值對分析結果的影響。0102030405偏態和峰態系數在數據分析中應用PART04類別型數據描述統計指標2023REPORTING根據數據的分布規律,選擇合適的組數,以充分展示數據的分布情況。確定組數根據數據的波動范圍和組數,計算合適的組距,使得數據能夠均勻分布在各個組內。確定組距頻數分布表制作方法及注意事項根據組距確定各組上下限,注意上限不在內原則。統計各組內的數據個數,得到頻數分布表。頻數分布表制作方法及注意事項登記頻數劃分組限注意事項組距選擇應合適,過大可能導致信息損失,過小可能增加數據分布的波動性。組數選擇不宜過多或過少,以免損失信息或導致數據分布的偏態。組限劃分要合理,避免數據過于集中或過于分散。頻數分布表制作方法及注意事項交叉表在類別型數據間關系揭示中作用交叉表定義交叉表是一種用于展示兩個或多個類別變量之間關系的表格,通過計算不同類別組合下的頻數或頻率,揭示變量之間的關系。揭示類別變量間關系通過交叉表可以清晰地看出不同類別變量之間的組合情況,進而分析它們之間的關系。判斷變量獨立性通過比較實際觀測頻數與期望頻數的差異,可以判斷兩個類別變量是否獨立。輔助卡方檢驗交叉表可以為卡方檢驗提供必要的數據基礎,用于進一步分析類別變量間關系的顯著性。卡方檢驗定義卡方檢驗是一種用于檢驗兩個或多個類別變量間關系顯著性的統計方法,通過比較實際觀測頻數與期望頻數的差異,判斷變量間是否存在顯著差異。確定自由度根據交叉表的行列數確定自由度。建立假設提出原假設和備擇假設,原假設通常為兩個類別變量相互獨立。查找臨界值根據卡方分布表和顯著性水平查找臨界值。計算卡方值根據實際觀測頻數和期望頻數計算卡方值。比較并作出結論將計算得到的卡方值與臨界值進行比較,如果卡方值大于臨界值,則拒絕原假設,認為兩個類別變量間存在顯著差異。卡方檢驗在類別型數據差異顯著性判斷中應用PART05圖表展示技巧在描述統計中應用2023REPORTING柱狀圖折線圖餅圖散點圖常見圖表類型及其適用場景01020304適用于展示不同類別數據之間的數量對比,如銷售額、人口數量等。適用于展示時間序列數據,反映數據隨時間變化的趨勢,如股票價格、溫度變化等。適用于展示數據的占比關系,如市場份額、人口比例等。適用于展示兩個變量之間的關系,如身高與體重、廣告投入與銷售額等。簡潔明了、突出重點、避免誤導、注重色彩搭配和字體選擇。設計原則使用圖表樣式和主題、添加數據標簽和說明、調整圖表大小和布局、使用高質量的圖像和圖標。美觀性提升方法圖表設計原則與美觀性提升方法使用Excel的數據透視表功能,輕松創建交互式動態圖表。結合使用Excel的VBA宏編程,實現更復雜的動態圖表效果,如自動篩選、動態排序等。利用Excel的條件格式功能,實現數據變化時圖表自動更新顏色或形狀。將Excel圖表嵌入到PPT或Word中,實現數據與圖表的實時更新和交互。動態圖表制作技巧分享PART06案例實戰:Excel在描述統計中應用2023REPORTING案例背景某電商公司需要對其銷售數據進行描述性統計分析,以了解銷售情況、客戶行為和市場趨勢。數據準備從公司數據庫中導出所需數據,包括訂單數據、客戶數據、產品數據等,并進行清洗和整理,確保數據質量和準確性。案例背景介紹及數據準備工作03數據可視化呈現通過圖表、圖形等方式將數據可視化呈現,以便更直觀地了解數據分布和特征。01數據導入與整理將清洗后的數據導入Excel,創建數據透視表或使用其他功能進行數據整理,以便于后續分析。02描述性統計指標計算利用Excel內置函數或數據分析工具包,計算各項描述性統計指標,如均值、中位數、眾數、方差、標準差等。利用Excel進

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論