描述統計學:表格法和圖形法_第1頁
描述統計學:表格法和圖形法_第2頁
描述統計學:表格法和圖形法_第3頁
描述統計學:表格法和圖形法_第4頁
描述統計學:表格法和圖形法_第5頁
已閱讀5頁,還剩41頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第3章 描述統計學 表格法和圖形法 3.1 品質型數據匯總 3.2 數量型數據匯總 3.3 交叉分組表(選學) 3.4 散點圖表1 50次飲料購買的樣本數據可口可樂可口可樂可口可樂雪碧可口可樂加多寶涼茶康師傅冰紅茶 加多寶涼茶康師傅冰紅茶 加多寶涼茶百事可樂雪碧可口可樂百事可樂百事可樂加多寶涼茶可口可樂雪碧加多寶涼茶百事可樂可口可樂加多寶涼茶百事可樂百事可樂百事可樂可口可樂可口可樂可口可樂可口可樂百事可樂康師傅冰紅茶可口可樂可口可樂可口可樂可口可樂加多寶涼茶雪碧可口可樂可口可樂康師傅冰紅茶百事可樂可口可樂百事可樂百事可樂百事可樂百事可樂加多寶涼茶可口可樂康師傅冰紅茶 雪碧3.1 品質型數據匯總

2、3.1.1 頻數分布頻數分布頻數分布:頻數分布是一種數據的表格匯總,頻數分布:頻數分布是一種數據的表格匯總,表示在幾個互不重疊組別中的每一組項目的個數表示在幾個互不重疊組別中的每一組項目的個數(即頻數)。(即頻數)。軟件操作:軟件操作:EXCELEXCEL中的函數中的函數countif(range, criteria)的應用的應用表1 50次飲料購買的樣本數據可口可樂可口可樂可口可樂雪碧可口可樂加多寶涼茶康師傅冰紅茶 加多寶涼茶康師傅冰紅茶 加多寶涼茶百事可樂雪碧可口可樂百事可樂百事可樂加多寶涼茶可口可樂雪碧加多寶涼茶百事可樂可口可樂加多寶涼茶百事可樂百事可樂百事可樂可口可樂可口可樂可口可樂可

3、口可樂百事可樂康師傅冰紅茶可口可樂可口可樂可口可樂可口可樂加多寶涼茶雪碧可口可樂可口可樂康師傅冰紅茶百事可樂可口可樂百事可樂百事可樂百事可樂百事可樂加多寶涼茶可口可樂康師傅冰紅茶 雪碧表2 飲料購買次數的頻數分布飲料頻數可口可樂19加多寶涼茶8百事可樂13康師傅冰紅茶5雪碧5總計503.1.2 3.1.2 相對頻數分布和百分數頻數分布相對頻數相對頻數:一組的相對頻數是所屬組別的項目個數占總數的比例。對一個有n個觀測值的數據集, 每每一一組的相對頻數組的相對頻數= =每一組的頻數每一組的頻數/n/n百分數頻數百分數頻數:一組的百分數頻數是相對頻數乘以100相對頻數分布相對頻數分布是表示每一組的相

4、對頻數數據的表格匯總。百分數頻數分布百分數頻數分布是每一組的百分數頻數數據的表格匯總。表3 3 飲料購買次數的相對頻數和百分比頻數飲料頻數相對頻數百分數頻數可口可樂190.38 38加多寶涼茶80.16 16百事可樂130.26 26康師傅冰紅茶50.10 10雪碧50.10 10總計501.00 1003.1.3 3.1.3 條形圖和餅形圖條形圖條形圖:用來描繪已匯總的品質型數據的頻數分布、相對頻數分布或百分數頻數分布。畫法畫法:橫軸橫軸對數據分組的標記對數據分組的標記縱軸縱軸頻數、相對頻數或百分數頻數的刻度頻數、相對頻數或百分數頻數的刻度固定寬度繪制的長條放置在每一組的標記上,固定寬度繪制

5、的長條放置在每一組的標記上,長條的高度為該組的頻數、相對頻數或百分數長條的高度為該組的頻數、相對頻數或百分數頻數。頻數。對于品質型數據,應將這些長條分隔開,以強對于品質型數據,應將這些長條分隔開,以強調每一組是相互獨立這一事實。調每一組是相互獨立這一事實。0.002.004.006.008.0010.0012.0014.0016.0018.0020.00可口可樂加多寶涼茶百事可樂康師傅冰紅茶雪碧頻數頻數飲料飲料圖圖1 飲料購買次數的條形圖飲料購買次數的條形圖圖圖2 飲料購買次數的條形圖飲料購買次數的條形圖餅形圖:描繪品質型數據的相對頻數和百分數頻數分布的圖形方法。畫法:(1)一個圓形代表所有的

6、數據(2)圓形內包括若干扇形部分(3)扇形與每一組的相對頻數相對應可口可樂38%加多寶涼茶16%百事可樂26%康師傅冰紅茶10%雪碧10%圖圖3 3 飲料飲料購買次數的餅形圖購買次數的餅形圖可口可樂38%加多寶涼茶16%百事可樂26%康師傅冰紅茶10%雪碧10%圖圖3 3 飲料飲料購買次數的餅形圖購買次數的餅形圖練習:1.1.根據根據某某媒體調查,在某段時間內,收視率最媒體調查,在某段時間內,收視率最高的高的4 4個電視娛樂節目是中國好聲音、非你莫個電視娛樂節目是中國好聲音、非你莫屬、屬、非誠勿擾非誠勿擾和天天向上。一個有和天天向上。一個有5050名電視觀名電視觀眾的樣本數據參見電視節目眾的樣

7、本數據參見電視節目.xls.xls.請回答:請回答:(1 1)這些數據是品質型數據還是數量型數據?)這些數據是品質型數據還是數量型數據?(2 2)給出這些數據的頻數分布和百分數頻數)給出這些數據的頻數分布和百分數頻數分布分布(3 3)畫出這些數據的條形圖和餅形圖?)畫出這些數據的條形圖和餅形圖?(4 4)以樣本為基礎,哪個節目擁有最大的市)以樣本為基礎,哪個節目擁有最大的市場份額?那個位居第二?場份額?那個位居第二?2.20112.2011年某家商業銀行顧客滿意度調查,要求顧年某家商業銀行顧客滿意度調查,要求顧客說明對他們的理財顧問是否滿意。回答的等級客說明對他們的理財顧問是否滿意。回答的等級

8、從從1 1到到7 7,其中,其中1 1表示非常不滿意,表示非常不滿意,7 7表示極其滿意。表示極其滿意。假設對某個指定的理財顧問,由假設對某個指定的理財顧問,由6060個人回答結果個人回答結果參見數據集,銀行參見數據集,銀行.xls.xls。請回答:。請回答:(1 1)說明這些數據為什么是品質型數據)說明這些數據為什么是品質型數據(2 2)做出匯總數據的頻數分布和相對頻數分布)做出匯總數據的頻數分布和相對頻數分布(3 3)畫出匯總數據的條形圖和餅形圖。)畫出匯總數據的條形圖和餅形圖。(4 4)在你匯總的基礎上,說明顧客對理財顧問)在你匯總的基礎上,說明顧客對理財顧問的綜合評價。的綜合評價。3.

9、2 數量型數據匯總3.2.1 頻數分布頻數分布的定義與品質型數據一樣,關鍵在于對于頻數分布的互不重疊的組的確定。步驟:(1)確定互不重疊組的個數(分組)(2)確定每一組的組距(3)確定組限根據數量型變量是離散性的還是連續性的,可以分成兩種情況:(1)單項式分組:就是把每一個變量值作為一組。這種方法通常只適于離散變量且變量值較少的情況。例3.1 某車間50個工人看管機床臺數資料如下:3 6 2 4 3 2 6 4 3 2 4 2 5 2 6 2 3 5 4 3 2 3 6 5 4 2 4 3 2 2 3 5 4 5 6 2 2 6 4 3 2 6 3 4 5 4 5 2 3 52) 組距式分組組

10、距式分組就是將全部變量值依次劃分為若干區間,并將這一區間的變量值作為一組。適用于:連續變量離散變量且變量值較多組距:等距分組適用于變量值的變動比較均勻 不等距分組適用于變動很不均勻,且變動幅度大例:對學生成績的分組可以分為020分、2040分、4060分、6080分、80100 例:學生成績分組也可分為060(D) 6080(C) 8090(B) 90100(A)關鍵問題:分組數目的確定組距的確定表4 分組組數參考表N15242544458990179180359k56789以下主要介紹等距分組的基本步驟: 第一,數據排序; 第二,分組數目的確定;使每組所包含的數據個數,平均不少于4個或5個,

11、或采用斯特吉斯經驗公式,即 k = 1+3.322lgNk為組數;N為總體中的個體數。第三,組距的確定組距=(最大值-最小值)組數第四,組限的確定組限的選擇應做到第一組的下限應略低于最小變量值,最后一組的上限應高于最大變量值。離散型變量:相鄰組的上下限可以不重疊連續型變量:相鄰兩組的組限可以重疊,即上一組的上限同時也是下一組的下限。用“上限不在內”原則解決重復問題。當變量值變動范圍較大時,最小組為“以下”,最大組為“以上”的開口組。第五,組中值的確定 組中值=(上限+下限 )2 開口組的組中值: 組中值=下限+鄰組組距/2(缺上限) 組中值=上限鄰組組距/2(缺下限)3.2.2 3.2.2 相

12、對頻數分布和百分數頻數分布相對頻數:一個組的觀測值占總數的比例。對于n個觀測值,組的相對頻數=組頻數/n組的百分數頻數是相對頻數乘以100.例:一家會計師事務所,對其一個包含20個客戶的樣本,完成年終審計所需求的時間的數據集,通過對表中的審計時間數據構建頻數分布來演示步驟。 表5 年末審計時間(天數)頻數的求法:函數 countif ( range, criteria )1214191815151817202722232221332814181613表6 審計時間數據的頻數分布審計時間/天頻數相對頻數百分數頻數10-1440.20 2015-1980.40 4020-2450.25 2525-

13、2920.10 1030-3410.05 5總計201.00 1003.2.4 直方圖直方圖是一種常用的數量型數據的圖形描繪方式。由先前已匯總出的頻數分布、相對頻數分布或百分數頻數分布等資料可構建直方圖。畫法:(1)所關心的變量放置在橫軸上(2)頻數、相對頻數或百分數頻數放置在縱軸上(3)每組的頻數、相對頻數或百分數頻數用一個長方形繪制,長方形的底放置在橫軸上,以組距為底,以每組相應的頻數、相對頻數或百分數頻數為高。(4)與條形圖不同,直方圖相鄰組的長方形之間沒有自然的間隔。直方圖的一個最重要的應用是提供了關于分布形態的信息。圖圖5 四種不同分布的直方圖四種不同分布的直方圖3.2.5 累積分布

14、累積頻數分布表示的是小于或等于每一組上組限的數據項個數,是數值型數據的另一種表格匯總方式。審計時間/天頻數累積頻數10-14小于或等于1444 15-19小于或等于1984+8=12 20-24小于或等于2454+8+5=1712+5=17 25-29小于或等于2924+8+5+2=1917+2=19 30-34小于或等于3414+8+5+2+1=2019+1=20 累積相對頻數表示小于或等于每一組上組限的數據項的比例,可以對相對頻數分布中的相對頻數求和,也可以用累積頻數除以數據總數求得。審計時間(天)相對頻數累積頻數累積相對頻數累積百分數頻數10-14小于或等于140.20 44/20=0.

15、202015-19小于或等于190.40 1212/20=0.600.20+0.40=0.606020-24小于或等于240.25 1717/20=0.850.60+0.25=0.858525-29小于或等于290.10 1919/20=0.950.85+0.10=0.959530-34小于或等于340.05 2020/20=1.000.95+0.05=1.00100總計1.003.2.6 累積曲線累積曲線是顯示累積分布的一種圖形。它的橫軸顯示數值,它的縱軸顯示累積頻數、累積相對頻數或累積百分數頻數。審計時間(天)審計時間(天)頻數頻數縱軸縱軸累積頻數累積頻數0-90010-144415-19

16、81220-2451725-2921930-34120圖圖6 累積分布直方圖及累積分布曲線累積分布直方圖及累積分布曲線3.3 3.3 交叉分組表3.3.1 交叉分組表交叉分組表是一種匯總兩個變量數據的方法,用以理解兩個變量間的關系。例:表Restaurant.xls給出300家飯店組成的一個樣本,搜集了這300家飯店的質量等級和餐價數據。質量等級是一個品質變量,等級類別有良好、很好和極好;餐價是一個數量變量,其變化范圍是10-49美元。質量等級餐價 (元)總計10-1920-2930-3940-49良好42402084很好3464466150極好214282266總計781187628300表

17、表7 300家洛杉磯飯店的質量等價和餐價的交叉分組表家洛杉磯飯店的質量等價和餐價的交叉分組表3.3.2 辛普森悖論兩個或兩個以上的交叉分組表中的數據可以生成一個新的交叉分組表,以顯示兩個變量間的相關性,但有時會出現辛普森悖論。辛普森悖論:在有些情形中,依據從綜合的交叉分組表中得出的結論可能與依據未綜合數據得出的結論截然相反,這一現象就是著名的辛普森悖論。例:在過去的三年中,法官A和法官B在民事庭和市政庭主持審理案件,他們判決的部分案件要求上訴。上訴法庭對大多數上訴案件維持原來的判決,但也有部分判決被推翻。根據兩個變量裁決(維持或推翻)和法庭類型(民事庭或市政庭)可構建每位法官的交叉分組表,綜合

18、兩位法官后的交叉分組表包含兩個變量:裁決(維持或推翻)和法官(A或B)。裁決裁決法官法官總計總計AB維持129(86%)110(88%)239推翻21(14%)15(12%)36總計(%)150(100%)125(100%)275裁決裁決法官法官A A總計總計民事庭市政庭維持29(91%)100(85%)129推翻3(9%)18(15%)21總計(%)32(100%)118(100%)150裁決裁決法官法官B B總計總計民事庭市政庭維持90(90%)20(80%)110推翻10(10%)5(20%)15總計(%)100(100%)25(100%)1253.4 3.4 散點圖和趨勢線散點圖是對兩

19、個數量變量間的關系的圖形表述,趨勢線是顯示相關性近似程度的一條直線。例:某音像設備商店的廣告次數與銷售額的數據參見 stereo.xls,該商店在過去的3個月內有10次利用周末電視廣告進行促銷。管理人員想證實廣告播出次數和下一周商店銷售額之間是否由關系。圖圖7 廣告次數與銷售額的散點圖廣告次數與銷售額的散點圖習題:某期刊專門報道家用技術,它的個人用戶年齡在12歲及以上。下列數據是在一個50人的樣本中,調查一周時間內使用個人計算機的小時數,數據集見computer.xls,構建下列項目匯總數據。a. 頻數分布(以3小時為組寬)b.相對頻數分布c.直方圖d.累積曲線e.分析個人計算機在家的使用情況,上述數據顯示出了什么問題。全美橄欖球聯盟使用一種取值為5-9的測量制度來評估有希望的候選人的水平。有關評分的解釋如下:8-9表明第一年應該參加比賽;7-7.9表明

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論