




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、Nankai University1第三章第三章 數(shù)據(jù)的圖表展示數(shù)據(jù)的圖表展示示例:統(tǒng)計研究表明,多種原因會使壽命減少示例:統(tǒng)計研究表明,多種原因會使壽命減少v 文字描述文字描述 未結(jié)婚的男性會使壽命減少未結(jié)婚的男性會使壽命減少3500天,未結(jié)婚的女性天,未結(jié)婚的女性則減少則減少1600天;吸煙的男性會使壽命減少天;吸煙的男性會使壽命減少2250天,女天,女性則減少性則減少800天;飲酒會使壽命減少天;飲酒會使壽命減少130天;超重天;超重30%會使壽命減少會使壽命減少1300天,超重天,超重20%則減少則減少900天;濫用天;濫用藥物會使壽命減少藥物會使壽命減少90天天Nankai Univ
2、ersity2v 表格描述表格描述Nankai University3原因原因壽命減少的天數(shù)壽命減少的天數(shù)未結(jié)婚(男性)3500吸煙(男性)2250未結(jié)婚(女性)160030%超重130020%超重900吸煙(女性)800飲酒130濫用藥物90v 圖形描述圖形描述Nankai University405001000150020002500300035004000未結(jié)婚(男性) 吸煙(男性) 未結(jié)婚(女性) 30%超重 20%超重 吸煙(女性) 飲酒 濫用藥物 壽命減少的天數(shù)壽命減少的天數(shù) 壽命減少的天數(shù) Contents數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理1品質(zhì)數(shù)據(jù)的整理與描述品質(zhì)數(shù)據(jù)的整理與描述2數(shù)值型
3、數(shù)據(jù)的整理與描述數(shù)值型數(shù)據(jù)的整理與描述3Nankai University51.1.數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理Nankai University6v 數(shù)據(jù)審核數(shù)據(jù)審核v 數(shù)據(jù)篩選數(shù)據(jù)篩選v 數(shù)據(jù)排序數(shù)據(jù)排序v 數(shù)據(jù)透視表數(shù)據(jù)透視表數(shù)據(jù)審核數(shù)據(jù)審核v 間接來源數(shù)據(jù)的審核間接來源數(shù)據(jù)的審核 審核數(shù)據(jù)的適用性 審核數(shù)據(jù)的時效性v 直接來源數(shù)據(jù)的審核直接來源數(shù)據(jù)的審核 審核數(shù)據(jù)的完整性 審核數(shù)據(jù)的準確性Nankai University7數(shù)據(jù)篩選數(shù)據(jù)篩選v 數(shù)據(jù)篩選時根據(jù)需要找出符合特定條件的某類數(shù)據(jù)。v 用Excel進行數(shù)據(jù)篩選。 選擇【數(shù)據(jù)】菜單,【篩選】命令v 數(shù)據(jù)篩選示例:例3.1v 例3.1
4、表中是8名學(xué)生4門課程的考試成績數(shù)據(jù)(單位:分)。試分別找出統(tǒng)計學(xué)成績大于80分的學(xué)生;英語成績最高的前三名學(xué)生;四門課程成績都大于70分的學(xué)生。Nankai University8數(shù)據(jù)排序數(shù)據(jù)排序v 數(shù)據(jù)排序可幫助研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索。v 排序還有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供方便。v 排序后的數(shù)據(jù)也稱為順序統(tǒng)計量。v 無論是屬性型數(shù)據(jù)還是數(shù)值型數(shù)據(jù),排序均可借助于Excel很容易的完成。Nankai University9數(shù)據(jù)透視表數(shù)據(jù)透視表v 為了從復(fù)雜的數(shù)據(jù)中提取有用的信息,可以利用Excel提供的【數(shù)據(jù)透視表】工具。v 利用數(shù)
5、據(jù)透視表,可以對數(shù)據(jù)表的重要信息按使用者的習(xí)慣或分析要求進行匯總和作圖,形成一個符合需要的交叉表(列聯(lián)表)。v 列聯(lián)表列聯(lián)表(contingency table):由兩個或兩個以上變量交叉分類的頻數(shù)分布表稱為列聯(lián)表。二維的列聯(lián)表(兩個變量交叉分類)也稱為交叉表交叉表(cross table)。v 利用數(shù)據(jù)透視表時,原始數(shù)據(jù)表中的首行必須有列標題。v 示例3.2Nankai University10v 例3.2 在某大學(xué)隨機抽取30名學(xué)生,調(diào)查他們的性別、家庭所在地、平均每月生活費支出、平均每月購買衣物支出和購買衣物時所考慮的首要因素等,試建立一個數(shù)據(jù)透視表,在表的行變量中給出性別和買衣物首選因
6、素,在列變量中給出學(xué)生的家庭所在地,對平均月生活費和月平均衣物支出進行交叉匯總。Nankai University11Nankai University122.2.品質(zhì)品質(zhì)數(shù)據(jù)的整理與描述數(shù)據(jù)的整理與描述v 分類數(shù)據(jù)的整理與描述分類數(shù)據(jù)的整理與描述v 順序數(shù)據(jù)的整理與描述順序數(shù)據(jù)的整理與描述分類數(shù)據(jù)的整理與描述分類數(shù)據(jù)的整理與描述v 分類數(shù)據(jù)本身就是對事物的一種分類,因此,在整理時首先列出所分的類別,然后計算出每一類別的頻數(shù)、頻率或比例、比率等,即可形成一張頻數(shù)分布表,最后根據(jù)需要選擇適當?shù)膱D形進行展示,以便對數(shù)據(jù)及其特征有一個初步的了解。Nankai University13分類數(shù)據(jù)的整理與
7、描述分類數(shù)據(jù)的整理與描述v 分類數(shù)據(jù)的整理頻數(shù)與頻數(shù)分布 頻數(shù)頻數(shù)(frequency):是落在某一特定類別或組中的數(shù)據(jù)個數(shù)。 頻數(shù)分布頻數(shù)分布(frequency distribution):把各個類別及落在其中的相應(yīng)頻數(shù)全部列出,并用表格形式表現(xiàn)出來。 例3.3 為研究不同類型軟飲料的市場銷售情況,一家市場調(diào)查公司對隨機抽取的一家超市進行調(diào)查。表中給出調(diào)查員隨機觀察的50名顧客購買的飲料類型及購買者性別的記錄。生成頻數(shù)分布表,觀察飲料類型和顧客性別的分布狀況,并進行描述性分析。Nankai University14分類數(shù)據(jù)的整理與描述分類數(shù)據(jù)的整理與描述v 分類數(shù)據(jù)的圖示描述 1)條形圖條
8、形圖:是用寬度相同的條形的高度或長短來表示數(shù)據(jù)多少的圖形,可以橫置或縱置,縱置時也稱柱形圖。 2)帕累托圖帕累托圖(Pareto chart)是按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排序后繪制的條形圖。 3)餅圖餅圖:是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形,主要用于表示一個樣本(或總體)中各組成部分的數(shù)據(jù)占全部數(shù)據(jù)的比例,用于研究結(jié)構(gòu)性問題十分有用。局限性在于只能顯示一個樣本各部分所占的比例。 4)環(huán)形圖環(huán)形圖:把餅圖疊在一起,挖去中間的部分就是環(huán)形圖。每個樣本用一個環(huán)來表示,樣本中的每一部分數(shù)據(jù)用環(huán)中的一段表示。環(huán)形圖可顯示多個樣本各部分所占的相應(yīng)比例,從而有利于構(gòu)成的比較研究。Nankai Un
9、iversity15順序數(shù)據(jù)的整理與描述順序數(shù)據(jù)的整理與描述v 上面介紹的分類數(shù)據(jù)的頻數(shù)分布表和圖示方法,也都適用于對順序數(shù)據(jù)的整理與描述。但一些適用于順序數(shù)據(jù)的整理和顯示方法,并不適用于分類數(shù)據(jù)。v 對于順序數(shù)據(jù),還可以計算累積頻數(shù)和累積頻率。v 累積頻數(shù)累積頻數(shù):是將各有序類別或組的頻數(shù)逐級累加起來得到的頻數(shù)。通過累積頻數(shù),可以很容易的看出某一類別(或數(shù)值)以下或某一類別(或數(shù)值)以上的頻數(shù)之和。v 累積頻率累積頻率/累積百分比累積百分比:是將各有序類別或組的百分比逐級累加起來。Nankai University16v 例3.4 在一項有關(guān)城市住房問題的研究中,研究人員在甲乙兩個城市各抽樣
10、調(diào)查了300戶,其中一個問題是:“您對您家庭目前的住房狀況是否滿意?”要求回答的類別依次如下: 1.非常不滿意 2.不滿意 3.一般 4.滿意 5.非常滿意 v 根據(jù)累積頻數(shù)或累積概率,可以繪制累積頻數(shù)分布圖或累積頻率圖。Nankai University17Nankai University183.3.數(shù)值型數(shù)據(jù)的整理與描述數(shù)值型數(shù)據(jù)的整理與描述v 箱線圖箱線圖v 直方圖直方圖v 線圖線圖v 散點圖散點圖v 氣泡圖氣泡圖v 雷達圖雷達圖箱線圖箱線圖v 箱線圖箱線圖(box plot)是由一組數(shù)據(jù)的最大值、最小值、中位數(shù)、兩個四分位數(shù)這五個特征值繪制而成的,它主要用于反映原始數(shù)據(jù)分布的特征,還
11、可以進行多組數(shù)據(jù)分布特征的比較。v 箱線圖的繪制方法:先找出一組數(shù)據(jù)的最大值、最小值、中位數(shù)和兩個四分位數(shù);然后,連接兩個四分位數(shù)畫出箱子;再將最大值和最小值與箱子相連接,中位數(shù)在箱子中間。v 對于多組數(shù)據(jù),可以將各組數(shù)據(jù)的箱線圖并列起來,從而進行分布特征的比較。Nankai University19v 例3.5 從某大學(xué)經(jīng)濟管理專業(yè)二年級學(xué)生中隨機抽取11人,對8門主要課程的考試成績進行調(diào)查,試繪制各個學(xué)生成績的比較箱線圖,并分析各個同學(xué)考試成績的分布特征。Nankai University20直方圖直方圖v 直方圖直方圖(histogram)是用于展示分組數(shù)據(jù)分布的一種圖形,它是用矩形的寬
12、度和高度(即面積)來表示頻數(shù)分布的。v 數(shù)據(jù)分組是根據(jù)統(tǒng)計研究的需要,將原始數(shù)據(jù)按照某種標準化分成不同的組別,分組后的數(shù)據(jù)稱為分組數(shù)據(jù)分組數(shù)據(jù)(grouped data)。v 繪制該圖時,在平面直角坐標系中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,這樣,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖。Nankai University21v 直方圖與條形圖的區(qū)別: 條形圖是用條形的高度(豎置時)表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的;直方圖用矩形的高度表示每一組的頻數(shù)或頻率,寬度則表示各組的組距。 由于分組數(shù)據(jù)具有連續(xù)性,直方圖的各矩形通常是連續(xù)排列,而條形圖則是分開排列。 條形圖主要
13、用于展示屬性型數(shù)據(jù),而直方圖則主要用于展示數(shù)值型數(shù)據(jù)。Nankai University22v 例3.6 試根據(jù)某電腦公司2005年前4個月每天的銷售量數(shù)據(jù)(單位:臺),繪制直方圖并分析。Nankai University23線圖線圖v 如果數(shù)值型數(shù)據(jù)是在不同時間上取得的,即時間序列數(shù)據(jù),則可以繪制線圖。線圖線圖(line plot)主要用于反映現(xiàn)象隨時間變化的特征。v 繪制線圖時,時間一般繪制在橫軸,觀測值繪制在縱軸,一般應(yīng)繪制成橫軸略大于縱軸的長方形。圖形過扁或過于瘦高,不僅不美觀,而且會給人造成視覺上的錯覺,不便于對數(shù)據(jù)變化的理解。一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。如果
14、數(shù)據(jù)與“0”之間的間距過大,可以采取折斷的符號將縱軸折斷。Nankai University24v 例3.7 已知1991-2003年我國城鄉(xiāng)居民家庭的人均收入數(shù)據(jù),試繪制線圖。Nankai University250.01000.02000.03000.04000.05000.06000.07000.08000.09000.01991199219931994199519961997199819992000200120022003城鎮(zhèn)居民農(nóng)村居民散點圖散點圖v 上面介紹的一些圖形描述的都是單變量數(shù)據(jù)。當有兩個或兩個以上變量時,可以采用多變量的圖示方法,常見的有散點圖、氣泡圖、雷達圖等。v 散點
15、圖散點圖(scatter diagram)是用二維坐標展示兩個變量之間關(guān)系的一種圖形。v 散點圖是用坐標橫軸代表變量x,縱軸代表變量y,每組數(shù)據(jù)(xi,yi)在坐標系中用一個點表示,n組數(shù)據(jù)在坐標系中形成的n個點稱為散點,由坐標及其散點形成的二維數(shù)據(jù)圖稱為散點圖。Nankai University26v 例3.8 小麥的單位面積產(chǎn)量與降雨量和溫度有一定關(guān)系。為了了解它們之間的關(guān)系,收集到相關(guān)數(shù)據(jù)。試繪制小麥產(chǎn)量與降雨量的散點圖,并分析它們之間的關(guān)系。Nankai University27010002000300040005000600070008000900002040608010012014
16、0氣泡圖氣泡圖v 氣泡圖氣泡圖(bubble chart)可用于展示三個變量之間的關(guān)系。v 它與散點圖類似,繪制時將一個變量放在橫軸,另一個變量放在縱軸,而第三個變量則用氣泡的大小來表示。Nankai University280204060801001201400510152025雷達圖雷達圖v 雷達圖雷達圖(radar chart)是顯示多個變量的常用圖示方法,也稱為蜘蛛圖(spider chart)。v 設(shè)有n組樣本,每個樣本測得m個變量,要繪制這m個變量的雷達圖,其具體做法是:先畫一個圓,然后將圓m等分,得到m個點,令這m個點分別對應(yīng)m個變量,再將這m個點與圓心相連,得到m個輻射狀的半徑,這m個半徑分別作為m個變量的坐標軸,每個變量值的大小由半徑上的點到圓心的距離表示,再將同一樣本的值在m個坐標上的點連線。這樣,n個樣本形成的n個多邊形就是一張雷達圖。v 雷達
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年環(huán)境科學(xué)與生態(tài)保護高級職業(yè)資格考試試卷及答案
- 健康人體的呼吸
- 廢紙回收利用產(chǎn)品設(shè)計
- 營養(yǎng)與食品衛(wèi)生學(xué)第七單元
- 傳統(tǒng)美學(xué)廣告設(shè)計案例
- 奢侈品包圖案設(shè)計核心要素與創(chuàng)新策略
- 產(chǎn)婦常見疾病防治要點
- T/SXMA 001-2023單胃動物菌酶協(xié)同發(fā)酵飼料規(guī)范
- 護理畢業(yè)設(shè)計答辯
- 2025年馬拉松比賽項目立項申請報告模板
- 大學(xué)生專業(yè)技能培訓(xùn)課程
- 2024年重慶市中考化學(xué)試題(A卷)含答案
- 會計師事務(wù)所考勤和日常工作管理制度
- 置景合同模板
- 2024年醫(yī)學(xué)高級職稱-心血管內(nèi)科(醫(yī)學(xué)高級)考試近5年真題集錦(頻考類試題)帶答案
- 2024年山東省青島市中考語文試卷(附答案)
- 醫(yī)院培訓(xùn)課件:《肛腸科無痛病房建設(shè)》
- 食品公司品控部工作管理手冊
- 人教新目標八年級上冊英語Unit 10 If you go to the party,youll have a great time!Section B-說課稿2
- 2024新高考I卷全國統(tǒng)一考試高考生物試題(真題+答案)
- 河北省石家莊市新華區(qū)2023-2024學(xué)年七年級下學(xué)期期末數(shù)學(xué)試題
評論
0/150
提交評論