數據分析基礎(第2版)課件 第4.1 數據分組_第1頁
數據分析基礎(第2版)課件 第4.1 數據分組_第2頁
數據分析基礎(第2版)課件 第4.1 數據分組_第3頁
數據分析基礎(第2版)課件 第4.1 數據分組_第4頁
數據分析基礎(第2版)課件 第4.1 數據分組_第5頁
已閱讀5頁,還剩29頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

礎【復習引入】1.數據分析的六個步驟?1.確定目的2.收集數據3.處理數據4.分析數據5.展現數據6.撰寫報告4.分析數據第四章數據的分析4.3動態數列的分析與預測4.5綜合評價分析法4.1統計分組4.4相關分析與回歸分析4.2描述性統計4.6四象限分析法4.7練習數據分組4.1教學分析【教學內容】4.1數據分組【知識目標】1.理解單項式分組、組距式分組、等距分組、不等距分組、組中值等概念;2.熟練掌握Excel內置函數Frequency、Countif、Countifs的功能和參數要求。【技能目標】1.熟練運用透視表功能對數據分組。2.熟練運用函數和“直方圖”功能對數據分組。【素質目標】1.轉換思維方式,建立大數據思維,提高數據應用和創新能力。2.掌握數據分組的各種方法,培養持續學習、追求卓越的學習精神。4.1.1統計分組的概念第四章

數據的分析4.1數據分組

統計分組是根據統計研究的需要,按照一定的標準,將總體分為若干個性質不同而又有聯系的部分,并計算各組的頻數或比重的一種統計分析方法。這些組成部分稱為這一總體的“組”。

按照每組標志表現的多少,統計分組可以分成單項式分組和組距式分組。第四章

數據的分析4.1數據分組一個標志表現(即一個變量值)作為一組,稱為單項式分組。單項式分組一般適用于離散型變量且變量變動不大的場合。例如,如果考試成績以五分制計算,則全體學生的成績可以分為6組,即5分、4分、3分、2分、1分、0分,如表4-1-1所示。表4-1-1單項式分組1、單項式分組第四章

數據的分析4.1數據分組多個標志表現(通常為一個區間)作為一組,稱為組距式分組。組距式分組又可以分成等距分組和不等距分組。例如,如果學生的成績以百分制計算,則全體學生的成績可以采用等距分組(左圖所示);也可以采用不等距分組(右圖所示)。2、組距式分組當前后組的上下限相同時,統計學一般遵循“含下限、不含上限”的原則。第四章

數據的分析4.1數據分組

對于某一個組(a,b),我們稱a為該組的下限,b為該組的上限;上限與下限之差(b-a)叫組距,(a+b)/2叫組中值。組中值未必是該組數據的平均值,但由于其計算簡單,因此它常作為該組的代表值。組距、組中值

第四章

數據的分析4.1數據分組(1)確定組數。由于分組的目的之一是觀察數據分布的特征,因此組數應適中。組太少,數據的分布就會過于集中;組太多,數據的分布就會過于分散。這都不便于觀察數據分布的特征和規律。那么一組數據分多少組合適呢?一般是5~10組。具體操作時,還要根據數據本身的特點及數據的多少來決定。(2)確定各組的組距。組距可根據全部數據的最大值和最小值及所分的組數來確定,即(最大值-最小值)/組距≈組數。

例如,某組數據最大值為139,最小值為107,一共分成7組,則組距≈(139-107)/7=4.6。

為了便于計算,組距宜取5或10的倍數,而且第一組的下限應小于最小值,最后一組的上限應大于最大值,因此組距可取5,分成7組:105~110、110~115、115~120……135~140。(3)統計各組的指標值。

組距式分組的步驟第四章

數據的分析4.1數據分組

利用數據透視表可以對Excel數據進行分組,建立各種形式的交叉數據列表。單擊【插入】選項卡的【數據透視表】命令,可以打開下面對話框。4.1.2利用“數據透視表”分組要分析的數據操作技巧:單擊要分析的數據區域任意一個單元格,再單擊“插入”|“數據透視表”按鈕,系統會自動讀取要分析的數據。第四章

數據的分析4.1數據分組

將分組標志(Excel中叫“字段”)拖到“行”“列”“篩選”處(首選“行”,其次是“列”,盡量不要拖到“篩選”),將要統計的標志(字段)全部拖到“值”處。透視表布局第四章

數據的分析4.1數據分組打開“數據分組.xlsx”工作簿,利用數據透視表功能統計“一月銷售記錄”工作表中每種商品的銷售總額。(71-72頁)

案例1思考:按什么標志分組?統計什么標志?第四章

數據的分析4.1數據分組打開“數據分組.xlsx”工作簿,利用數據透視表功能統計“一月銷售記錄”工作表中每種商品的銷售總額。(71-72頁)

案例1第四章

數據的分析4.1數據分組案例2思考:按什么標志分組?統計什么標志?將“數據分組.xlsx”工作簿中的“2023年銷售記錄”工作表數據根據“日期”字段按季度分組,并統計每個季度的“成交商品總數”。(72-73頁)

第四章

數據的分析4.1數據分組將“數據分組.xlsx”工作簿中的“2023年銷售記錄”工作表數據根據“日期”字段按季度分組,并統計每個季度的“成交商品總數”。(72-73頁)

案例2第四章

數據的分析4.1數據分組將“數據分組.xlsx”工作簿中的“數學成績”工作表數據按“成績”進行等距分組(組距為10),并統計各組的“人數”。(73-74頁)案例3思考:按什么標志分組?統計什么標志?第四章

數據的分析4.1數據分組將“數據分組.xlsx”工作簿中的“數學成績”工作表數據按“成績”進行等距分組(組距為10),并統計各組的“人數”。(73-74頁)案例3第四章

數據的分析4.1數據分組

如果統計的是品質標志,統計方式默認為“計數”;如果統計的是數量標志,統計方式默認為“求和”。如需修改統計方式,雙擊透視表的統計方式,即可打開“值字段設置”對話框,對統計方式進行修改。雙擊注意:當前后組的上下限相同時,透視表遵循“含下限”原則。學生操作第四章

數據的分析4.1數據分組倒計時第四章

數據的分析4.1數據分組利用數據透視表可以完成對數據的單項式分組和等距分組。如果要對數據進行不等距分組,數據透視表就無能為力了,此時可以利用“數據分析”之“直方圖”工具進行分組。4.1.3利用“直方圖”工具分組第四章

數據的分析4.1數據分組“直方圖”對話框解讀是否輸出圖表輸入區域和接受區域都含標志,則勾選。顯示結果的起點單元格第四章

數據的分析4.1數據分組將“數據分組.xlsx”工作簿中的“數學成績”工作表數據按“40分以下”“40~60分”“60~70分”“70~80分”“80分以上”分成5組,并統計各組的人數。(74-75頁)案例4提前在F列輸入每一組的上限值,最后的100可以不輸(理解為80分以上這一組沒有上限)。第四章

數據的分析4.1數據分組打開“直方圖”分析對話框,設置各要素。第四章

數據的分析4.1數據分組結果思考:為什么有一項“其它”?“其它”就是“100以上”注意:因為需要給定上限值,所以直方圖遵循“含上限”原則。學生操作第四章

數據的分析4.1數據分組倒計時第四章

數據的分析4.1數據分組1.Frequency函數

Frequency

函數的功能就是統計各組的頻數,它有兩個參數,第1個參數是要分組的數據,第2個參數是每一組的上限值。組上限可以提前在單元格里輸好直接引用,也可以臨時輸入并用花括號括起來。frequency是一個數組函數,即它返回的結果不是一個數,而是一組數,所以輸入公式前需選中多個單元格,最后還必須用【Ctrl+Shift+Enter】組合鍵確認。4.1.4利用Excel函數分組注意:Frequency函數也遵循“含上限”原則。第四章

數據的分析4.1數據分組例5:用Frequency函數對“數學成績”工作表的數據按“40分以下”“40~60分”“60~70分”“70~80分”“80分以上”進行分組統計。第1步:在F列輸入每一組的上限值,最后100可以不輸。第2步:因為一共分成5組,所以選中5個單元格G2:G6。第3步:插入Frequency函數,輸入參數。第4步:用組合鍵【Ctrl+Shift+Enter】確認。學生操作第四章

數據的分析4.1數據分組倒計時第四章

數據的分析4.1數據分組2.Countif和Countifs函數

Countif

函數的功能是統計滿足某個條件的單元格個數,使用格式為Countif(單元格區域,條件)。

Countifs函數的功能是統計滿足多個條件的單元格個數,使用格式為Countifs(區域1,條件1,區域2,條件2,…),其參數個數為偶數個(條件數×2)。區域區域3區域1條件1區域2條件2條件第四章

數據的分析4.1數據分組

例如,可以使用左圖

所示公式對“數學成績”工作表的數據按“40分以下”“40~60分”“60~70分”“70~80分”“80分以上”進行分組統計。學生操作第四章

數據的分析4.1數據分組倒計時小結能完成不等距分組只能計數統計結果“含上限”Frequency是一個數組函數,所以插入函數之前要選擇準備放結果的單元格區域,最后要按【Ctrl+Shift+Enter】確認只能計數統計結果“含上限”數據分組1、透視表2、直方圖3、Frequency函數能完成單項式分組、等距分組能對各組的數據進行計數、求和、求平均等多種運算前后組上下限相同時,遵循“含下限”原則4、countif(s)函數可以靈活選擇是否含組上限、下限和組距只能計數第四章

數據的分析4.1數據分組(1)對“數據分析-課后練習.xlsx”工作簿中“雙肩包”工作表的數據進行分組統計。①

統計淘寶和天貓的店鋪數和30天銷售額總和,如圖4-7-1所示。②

統計每年的店鋪數,如圖4-7-2所示。③

統計價

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論