




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第第 3 章章 數據的圖表展示數據的圖表展示學習目標學習目標了解數據預處理的內容和目的了解數據預處理的內容和目的掌握分類和順序數據的整理與顯示方法掌握分類和順序數據的整理與顯示方法掌握數值型數據的整理與顯示方法掌握數值型數據的整理與顯示方法用用Excel作作頻數分布表和圖形頻數分布表和圖形合理使用圖表合理使用圖表數據的預處理數據的預處理數據審核數據審核完整性審核n應調查的單位或個體是否有遺漏所有的調查項目或變量是否填寫齊全準確性審核n數據是否真實反映實際情況,內容是否符合實際n數據是否有錯誤,計算是否正確等數據的審核數據的審核二手數據二手數據(second hand data)適用性審核n弄清
2、楚數據的來源、數據的口徑以及有關的背景材料n確定數據是否符合自己分析研究的需要時效性審核n盡可能使用最新的數據確認是否有必要做進一步的加工整理數據篩選與排序數據篩選與排序數據篩選數據篩選(data filter)當數據中的錯誤不能予以糾正,或者有些數據不符合調查的要求而又無法彌補時,需要對數據進行篩選數據篩選的內容將某些不符合要求的數據或有明顯錯誤的數據予以剔除將符合某種特定條件的數據篩選出來,而不符合特定條件的數據予以剔除用用Excel進行數據篩選進行數據篩選 數據篩選數據篩選(data filter)條件條件區域區域篩選篩選的結果的結果:下面通過一個實例說明用下面通過一個實例說明用Exce
3、lExcel進行數據的排序的過程。進行數據的排序的過程。 【例3-2】有一張6名學生的學習成績所構成的數據清單(單位:分)。試按總成績的遞增順序遞增順序按列排序按列排序。 分析:分析:所謂按列排序就是根據一列或幾列中的數據清單進行排序。排序時,Excel將按指定字段的值和指定的【升序升序】、【降序降序】排序,次序重新設定行行。操作步驟如下:操作步驟如下:單擊數據區域內的任何一個單元格。選取【數據數據】菜單中的【排序排序】命令,出現【排序排序】對話框,如圖所示。排序排序的結果的結果: 當對數據清單按列進行排序且只有一個排序關鍵字時,可以直接使用標準工具欄中的【升序升序】或【降序降序】工具按鈕來完
4、成排序。操作步驟如下:操作步驟如下:單擊排序字段中的任意一個單元格。單擊工具欄中的“升序”或“降序”工具按鈕。按行排序:按行排序: 通常情況下,Excel是按列排序的,但也可以按行排序。所謂按行排序就是根據一行或幾行中的數據清單進行排序。排序時,Excel將按指定行的值和指定的“升序”或“降序”排序,次序重新設定列。數據透視表數據透視表數據透視表數據透視表(pivot table )可以從復雜的數據中提取有用的信息可以對數據表的重要信息按使用者的習慣或分析要求進行匯總和作圖形成一個符合需要的交叉表(列聯表)在利用數據透視表時,數據源表中的首行必須有列標題數據透視表數據透視表(用用Excel創建
5、數據透視表創建數據透視表)第第1步:步:在Excel工作表中建立數據清單第第2步:步:選中數據清單中的任意單元格,并選擇【數據】菜單 中的【數據透視表和數據透視圖】第第3步:步:確定數據源區域第第4步:步:在【向導3步驟之3】中選擇數據透視表的輸出位置 。然后選擇【布局】第第5步:步:在【向導布局】對話框中,依次將”分類變量“拖至左邊的“行”區域,上邊的“列”區域,將需要匯總的“變量” 拖至“數據區域”第第6步:步:然后單擊【確定】,自動返回【向導3步驟之3】對 話框。然后單擊【完成】,即可輸出數據透視表 演示p40例3.2、例3.3下面介紹頻數分布表例如,例如,企業按經濟類型分組:企業按經濟
6、類型分組:國有企業國有企業 集體企業集體企業 個體企業個體企業 其它企業其它企業學生按考分分組:學生按考分分組:6060分以下分以下 (不及格)(不及格)60607070分分 (及格)(及格)70708080分分 (中等)(中等)80809090分分 (良好)(良好)9090100100分(優秀)分(優秀) 499及以下 500 999 1000 2999 3000及以上 600 700 700 800 800 1200 1200 1500 組限:組限:組距分組中,每一區間兩端的值為組限。組距分組中,每一區間兩端的值為組限。其中,每組最大變量值稱為上限上限, 每組最小變量值稱為下限下限。如:如
7、:工人按工資分組:企業按人數分組:上限上限下限下限上限上限下限下限 當某單位的變量值剛好等于相鄰兩組的上下限時,一般把此值歸到作為下限的那一組中,即遵循“上限不在其內上限不在其內”的原則。 600 700 700 800 800 1200 1200 1500 如:如:工人按工資分組: 此時,700是第一組上限,是第二組下限。根據“上限不在其內上限不在其內”的原則,700應屬于第二組。組數(組數(K K):):是指在組距分組中,將全體變量是指在組距分組中,將全體變量值劃分為多少組(分組的數目)。值劃分為多少組(分組的數目)。組距(組距(d d):):是指每組變量值的變動范圍。是指每組變量值的變動
8、范圍。 組距組距 = = 本組上限本組上限 前組上限前組上限 組距與組數的關系:組距與組數的關系:組組數數全全距距組組距距全距(全距(R R) = = 最大變量值最大變量值 最小變量值最小變量值 組距與組數一般是用組距與組數一般是用整數整數表示。表示。全距(全距(R R) = = 最大變量值最大變量值 最小變量值最小變量值 分類數據的整理與圖示分類數據的整理與圖示分類數據的整理分類數據的整理(基本過程基本過程)1. 列出各類別分類數據的整理分類數據的整理(可計算的統計量可計算的統計量)分類數據整理分類數據整理頻數分布表頻數分布表 (例題分析例題分析)分類數據的圖示分類數據的圖示條形圖條形圖 (
9、例題分析例題分析)分類數據的圖示分類數據的圖示對比條形圖對比條形圖(side-by-side bar chart )分類變量在不同時間或不同空間上有多個取值對比分類變量的取值在不同時間或不同空間上的差異或變化趨勢分類數據的圖示分類數據的圖示對比條形圖對比條形圖 (例題分析例題分析)按各類別數據出現的頻數多少排序后繪制的柱形圖 主要用于展示分類數據的分布分類數據的圖示分類數據的圖示餅圖餅圖 (例題分析例題分析)不同品牌飲料的構成不同品牌飲料的構成可口可樂30%旭日升冰茶22%匯源果汁12%百事可樂18%露露18%順序數據的整理與圖示順序數據的整理與圖示順序數據的整理順序數據的整理(可計算的統計量
10、可計算的統計量)順序數據的頻數分布表順序數據的頻數分布表(例題分析例題分析)順序數據的頻數分布表順序數據的頻數分布表 (例題分析例題分析)順序數據的圖示順序數據的圖示累計頻數分布圖累計頻數分布圖 (例題分析例題分析)243001322252700100200300400 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(戶)(a)向上累積向上累積27616830300750100200300400 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(戶)(b)向下累積向下累積環形圖環形圖(doughnut chart)環形圖中間有一個“空洞”,樣本或總體中的每一部分數據用環中的一段表示與餅圖類似
11、,但又有區別n餅圖只能顯示一個總體各部分所占的比例n環形圖則可以同時繪制多個樣本或總體的數據系列,每一個樣本或總體的數據系列為一個環用于結構比較研究 用于展示分類和順序數據環形圖環形圖 (例題分析例題分析)8%36%31%15%7%33%26%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 甲乙兩城市家庭對住房狀況的評價甲乙兩城市家庭對住房狀況的評價數據分組數據分組個變量值作為一組適合于離散型數據,且變量值較少的情況2、組距分組組距分組組距分組 (要點要點)組距分組組距分組(步驟步驟)組距分組組距分組(步驟步驟)組距分組組距分組(幾個概念幾個概念)頻數分布表的編制頻數分布表的編制
12、(例題分析例題分析)等距分組表等距分組表(上下組限重疊上下組限重疊)等距分組表等距分組表(上下組限間斷上下組限間斷)等距分組表等距分組表(使用開口組使用開口組)分組數據分組數據直方圖直方圖(histogram)分組數據的圖示分組數據的圖示(直方圖的繪制直方圖的繪制)分組數據分組數據直方圖直方圖(直方圖與條形圖的區別直方圖與條形圖的區別)分組數據分組數據直方圖直方圖(直方圖與條形圖的區別直方圖與條形圖的區別)未分組數據未分組數據莖葉圖莖葉圖(stem-and-leaf display)未分組數據未分組數據莖葉圖莖葉圖(stem-and-leaf display)未分組數據未分組數據莖葉圖莖葉圖(
13、例題分析例題分析)未分組數據未分組數據單批數據箱線圖單批數據箱線圖(箱線圖的構成箱線圖的構成)未分組數據未分組數據單批數據箱線圖單批數據箱線圖(例題分析例題分析)分布的形狀與箱線圖分布的形狀與箱線圖未分組數據未分組數據多批數據箱線圖多批數據箱線圖 (例題分析例題分析)未分組數據未分組數據多批數據箱線圖多批數據箱線圖(例題分析例題分析)Min-Max25%-75%Median value455565758595105英語經濟數學西方經濟學市場營銷學財務管理基礎會計學統計學計算機應用基礎min-max25%-75%median value455565758595105學生1學生2學生3學生4學生5
14、學生6學生7學生8學生9學生10學生11未分組數據未分組數據多批數據箱線圖多批數據箱線圖 (例題分析例題分析)時間序列數據時間序列數據線圖線圖 (例題分析例題分析) 時間序列數據時間序列數據線圖線圖 (例題分析例題分析)兩個變量間的關系兩個變量間的關系二維散點圖二維散點圖(2D Scatterplots)展示兩個變量之間的關系用橫軸代表變量x,縱軸代表變量y,每組數據(xi , yi)在坐標系中用一個點表示,n組數據在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數據圖兩個變量間的關系兩個變量間的關系二維散點圖二維散點圖(2D Scatterplots)顯 示 三個 變 量之 間 的關系圖 中 數據 點 的大 小 依賴 于 第三 個 變量也稱為蜘蛛圖(spider chart)顯示多個變量的圖示方法在顯示或對比各變量的數值總和時十分有用假定各變量的取值具有相同的正負號,總的絕對值與圖形所圍成的區域成正比可用于研究多個樣本之間的相似程度多變量數據多變量數據雷達圖雷達圖(雷達圖的制作雷達圖的制作)多變量數據多變量數據雷達圖雷達圖 (例題分析例題分析)多變量數據多變量數據雷達圖雷達圖 (例題分析例題分析)數據類型及圖示數據類型及圖示 (小結小結)數據類型數據類型品質數據品質數據數值型數
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025項目調解合同能源站
- 社區健康教育實驗報告
- 幼兒園大班科學《氣象標志》教案
- 膝關節半月板損傷與護理
- 健康幫扶課件教學
- 2024年新高考語文復習題型專練九 古代詩歌閱讀(全國適用)解析版
- 北京市第四中學2021-2022學年高二上學期期中地理 含解析
- 新生兒媽媽護理課程
- 褥瘡的新分期和護理措施
- 食管吻合口瘺的護理查房
- 食藥同源-PPT課件(PPT 55頁)
- 山東大學畢業論文答辯通用ppt模板
- 汽車零部件規范申報ppt課件
- 沙盤游戲治療(課堂PPT)
- 項目驗收單簡潔模板
- Q∕SHCG 67-2013 采油用清防蠟劑技術要求
- 榆林智能礦山項目招商引資方案【參考范文】
- 碘對比劑過敏性休克應急搶救演練記錄
- 餐飲商鋪工程條件一覽表
- 液壓的爬模檢查記錄簿表
- 申請支付工程款的函
評論
0/150
提交評論