離散趨勢度量理解變異性_第1頁
離散趨勢度量理解變異性_第2頁
離散趨勢度量理解變異性_第3頁
離散趨勢度量理解變異性_第4頁
離散趨勢度量理解變異性_第5頁
已閱讀5頁,還剩53頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

離散趨勢度量理解變異性第1頁,課件共58頁,創作于2023年2月第2頁,課件共58頁,創作于2023年2月第3頁,課件共58頁,創作于2023年2月第三章離散趨勢量數——理解變異性第一節什么是離散趨勢量數第二節離散系數種類:異眾比率、四分位差、極差、標準差和方差、離散系數第三節偏態與峰態第四節標準化第4頁,課件共58頁,創作于2023年2月第一節什么是離散趨勢量數據分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側面說明了集中趨勢測度值的代表程度反映社會經濟現象變動的均勻性和穩定性不同類型的數據有不同的離散程度測度值第一節什么是離散趨勢量第5頁,課件共58頁,創作于2023年2月第一節什么是離散趨勢量數二、種類

異眾比率Vr四分位差Q.D.極差 R平均差 A.D.標準差 S.D.(σ)離散系數 Vσ第6頁,課件共58頁,創作于2023年2月第二節離散系數種類第7頁,課件共58頁,創作于2023年2月異眾比率

(variationratio)1. 對分類數據離散程度的測度2. 非眾數組的頻數占總頻數的比例3. 計算公式為4.用于衡量眾數的代表性第8頁,課件共58頁,創作于2023年2月異眾比率

(例題分析)解:

在所調查的50人當中,購買其他品牌飲料的人數占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數分布

飲料品牌頻數比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100第9頁,課件共58頁,創作于2023年2月四分位差

(quartiledeviation)1、對順序數據離散程度的測度2、也稱為內距或四分間距3、上四分位數與下四分位數之差

Qd=QU

QL4、反映了中間50%數據的離散程度5、不受極端值的影響6、用于衡量中位數的代表性第10頁,課件共58頁,創作于2023年2月極差(range)1、一組數據的最大值與最小值之差2、離散程度的最簡單測度值,常用于數值型數據3、易受極端值影響4、未考慮數據的分布7891078910R

=max(xi)-min(xi)計算公式為第11頁,課件共58頁,創作于2023年2月許多時候,平均掩蓋了數據的真實深度。好的決策不僅要考慮集中趨勢度量,還要考慮散步大小。所有的東西只為平均水平設計,我們的社會將會崩潰(高速公路、大壩、房屋建筑、溫度)“一個人在通過平均深度為1米的河流時淹死了”第12頁,課件共58頁,創作于2023年2月平均差

(meandeviation)1、各變量值與其平均數離差絕對值的平均數2、能全面反映一組數據的離散程度,受極值影響3、數學性質較差,實際中應用較少計算公式為未分組數據組距分組數據第13頁,課件共58頁,創作于2023年2月平均差

(例題分析)某電腦公司銷售量數據平均差計算表按銷售量分組組中值(Mi)頻數(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040第14頁,課件共58頁,創作于2023年2月平均差

(例題分析)

含義:每一天的銷售量平均數相比,平均相差17臺第15頁,課件共58頁,創作于2023年2月思考比較下列兩組數據的極差:A組:2,10,5,5,5,5,5,5,5,5.B組:4,6,3,7,2,8,1,9,5,5.試問:A組與B組,哪個組的數據離散程度較大?A組與B組的極差相等.這說明極差雖能反映這兩組數據的波動情況,但能判斷其離散程度的大小嗎?第16頁,課件共58頁,創作于2023年2月標準差(standarddeviation)和方差標準差各變量與其平均值的差平方的平均數的平方根。標準差表示一個數據組中變異性的平均數量。實際的含義是與均值的平均距離。標準差越大,每個數據點與數據分布的均值的平均距離越大。4681012x=8.3第17頁,課件共58頁,創作于2023年2月案例姓名(A)財務管理姓名(B)財務管理史彬蓮71夏軍軍75史子俊84金夢雨81陳正輝47郁淼71劉洋68黃超62周曉晨97劉兆云78平均成績73.2平均成績73.2A組同學的得分散落在高點和低點B組同學的分數相當接近第18頁,課件共58頁,創作于2023年2月思考,你認為A組和B組的標準差哪一個比較大呢?SA=18.7SB=7.3標準差最小值為0,而數據的離散程度越大,標準差的值就越大第19頁,課件共58頁,創作于2023年2月樣本方差和標準差未分組數據:組距分組數據:未分組數據:組距分組數據:方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!第20頁,課件共58頁,創作于2023年2月樣本方差

自由度(degreeoffreedom)1、一組數據中可以自由取值的數據的個數2、當樣本數據的個數為

n

時,若樣本均值x

確定后,只有n-1個數據可以自由取值,其中必有一個數據則不能自由取值3、例如,樣本有3個數值,即x1=2,x2=4,x3=9,則x=5。當x=5

確定后,x1,x2和x3有兩個數據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值4、樣本方差用自由度去除,其原因可從多方面解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量第21頁,課件共58頁,創作于2023年2月樣本標準差

(例題分析)某電腦公司銷售量數據平均差計算表按銷售量分組組中值(Mi)頻數(fi)140-150150-160160-170170-180180-190190-200200-210210-220220-230230-24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—55400第22頁,課件共58頁,創作于2023年2月樣本標準差

(例題分析)

含義:每一天的銷售量與平均數相比,平均相差21.58臺第23頁,課件共58頁,創作于2023年2月甲、乙兩學生某次考試成績列表語文數學物理化學政治英語甲959065707585乙1107095508075甲、乙兩學生的平均成績為80分,集中趨勢一樣,但是他們偏離平均數的程度卻不一樣。乙組數據的離散程度大,數據分布越分散,平均數的代表性就越差;甲組數據的離散程度小,數據分布越集中,平均數的代表性越大。例第24頁,課件共58頁,創作于2023年2月甲、乙兩臺包裝機同時分裝質量為400g的奶粉,從它們各自分裝的奶粉中隨機抽取了10袋,測得它們的實際質量(單位:克)如下:甲:401400408406410409400393394394乙:403404396399402401405397402399試問:哪臺包裝機包裝的奶粉質量比較穩定?第25頁,課件共58頁,創作于2023年2月可用來反映社會生產和其他社會經濟活動過程的均衡性或協調性,以及產品質量的穩定程度。

供貨計劃完成百分比(%)季度總供貨計劃執行結果一月二月三月鋼廠甲100323434乙100203050第26頁,課件共58頁,創作于2023年2月案例:問該班男生是身高的變異性大還是體重變異性大?均值標準差身高(CM)1708體重(KG)657第27頁,課件共58頁,創作于2023年2月離散系數

(coefficientofvariation)1、 標準差與其相應的均值之比2、對數據相對離散程度的測度3、消除了數據水平高低和計量單位的影響4、 用于對不同組別數據離散程度的比較5、計算公式為第28頁,課件共58頁,創作于2023年2月案例:問該班男生是身高的變異性大還是體重變異性大?均值標準差離散系數身高(CM)17084.53體重(KG)65711.67第29頁,課件共58頁,創作于2023年2月離散系數

(例題分析)某管理局所屬8家企業的產品銷售數據企業編號產品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業,其產品銷售數據如表。試比較產品銷售額與銷售利潤的離散程度第30頁,課件共58頁,創作于2023年2月離散系數

(例題分析)結論:計算結果表明,v1<v2,說明產品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710第31頁,課件共58頁,創作于2023年2月數據類型與離散程度測度值數據類型和所適用的離散程度測度值數據類型分類數據順序數據數值型數據適用的測度值※異眾比率※四分位差※方差或標準差—異眾比率※離散系數(比較時用)——平均差——極差——四分位差——異眾比率第32頁,課件共58頁,創作于2023年2月第三節偏態和峰態及其度量第33頁,課件共58頁,創作于2023年2月偏態與峰態分布的形狀扁平分布尖峰分布偏態峰態左偏分布右偏分布與標準正態分布比較!第34頁,課件共58頁,創作于2023年2月偏態

(skewness)統計學家Pearson于1895年首次提出數據分布偏斜程度的測度1. 偏態系數=0為對稱分布2. 偏態系數>0為右偏分布3. 偏態系數<0為左偏分布第35頁,課件共58頁,創作于2023年2月偏態系數

(skewnesscoefficient)根據原始數據計算根據分組數據計算第36頁,課件共58頁,創作于2023年2月偏態系數

(例題分析)

某電腦公司銷售量偏態及峰度計算表按銷售量份組(臺)組中值(Mi)頻數

fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000

70100000

第37頁,課件共58頁,創作于2023年2月偏態系數

(例題分析)結論:偏態系數為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數占據多數,而銷售量較多的天數則占少數第38頁,課件共58頁,創作于2023年2月偏態與峰態

(從直方圖上觀察)按銷售量分組(臺)結論:1.為右偏分布2.峰態適中140150210某電腦公司銷售量分布的直方圖190200180160170頻數(天)25201510530220230240第39頁,課件共58頁,創作于2023年2月峰態

(kurtosis)統計學家Pearson于1905年首次提出數據分布扁平程度的測度峰態系數=0扁平峰度適中峰態系數<0為扁平分布峰態系數>0為尖峰分布第40頁,課件共58頁,創作于2023年2月峰態系數

(kurtosiscoefficient)根據原始數據計算根據分組數據計算第41頁,課件共58頁,創作于2023年2月峰態系數

(例題分析)結論:峰態系數為負值,但與0的差異不大,說明電腦銷售量為輕微扁平分布第42頁,課件共58頁,創作于2023年2月第四節標準化第43頁,課件共58頁,創作于2023年2月標準化值

(例題分析)9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996第44頁,課件共58頁,創作于2023年2月標準分的特征無論作為變量的滿分是幾分,其標準分的平均數勢必為0,其標準差勢必為1.無論作為變量的單位是什么,其標準的平均數勢必為0,而其標準差勢必為1.這樣滿分為100分的考試和滿分為200分考試都可以比較。第45頁,課件共58頁,創作于2023年2月標準值(性質)1、均值等于02. 方差等于1第46頁,課件共58頁,創作于2023年2月第47頁,課件共58頁,創作于2023年2月第48頁,課件共58頁,創作于2023年2月第49頁,課件共58頁,創作于2023年2月1、一組數據最大值與最小值之差稱為()A平均差b標準差c極差d四分位差2、各變量值與其均值離差平方的平均數稱為()A極差b平均差c方差d標準差3、如果一個數據的標準分數是-2,表面該數據()A比平均數高出2個標準差b比平均數低出2個標準差C等于2倍平均數D等于2倍標準差4、如果一個數據的標準分數是3,表明該數據()A比平均數高出3個標準差B比平均數高出3個標準差C等于3倍平均數D等于3倍標準差5、一組數據的標準分數,其()A均值為1,方差為0B均值為0,方差為1C均值為1,方差為1D均值為0,方差為06、比較兩組數據的離散程度最適合的統計量是()A極差B平均差C標準差D離散系數7、用極差度量離散程度的缺陷是()A基于均值計算離散程度B基于絕對值計算,不宜使用C易于計算D沒有使用所有數據的信息8、兩組數據的均值不等,但標準差相等,則()A均值小的,離散程度大B均值大的,離散程度大C均值小的,離散程度小D兩組數據的離散程度相同第50頁,課件共58頁,創作于2023年2月第51頁,課件共58頁,創作于2023年2月第52頁,課件共58頁,創作于2023年2月實例分析:比較兩省市的經濟水平城市蘇州南京無錫常州南通徐州泰州揚州鹽城鎮江淮安連云宿遷財政收入億元745434415215198164135128126101969063城市青島濟南煙臺淄博濰坊日照臨沂濟寧菏澤濱州東營威海萊蕪聊城泰安德州財政收入342210189129158439213561808110333559155第53頁,課件共58頁,創作于2023年2月第54頁,課件共58頁,創作于2023年2月1、一組數據中出現頻率最多的變量值稱為()A眾數b中位數c四分位數d均值2、下列關于眾數的敘述,不正確的是()A一組數據可能存在多個眾數B眾數主要適用于分類數據C一組數據的眾數是唯一的D眾數不受極端值的影響3、一組數據排序后處于中間位置上的變量值稱為()A眾數b中位數c四分位數d均值4、一組數據排序后處于25%和75%位置的值稱為()A眾數b中位數c四分位數d均值5、一組數據相加后除以數據的個數所得到的結果稱為()A眾數b中位數c四分位數d均值6、n個變量值乘積的n次方根稱為()A眾數b中位數c四分位數d幾何平均數7、某大學經濟管理學院有1200名學生,法學院有800名學生,醫學院有320名學生,理學院有200名學生,上述描述中,眾數是()A1200b經濟管理學院c200d理學院8、某大學經濟管理學院有1200名學生,法學院有800名學生,醫學院有320名學生,理學院有200名學生,描述改組數據的集中趨勢宜采用()A眾數b中位數c四分位數d均值第55頁,課件共58頁,創作于2023年2月9、某居民小區準備采取一項新的物業管理措施,為此,隨機抽取100名居民進行調查,其中表示贊成的有69戶,表示中立有22戶,表示反對的有9戶。描述該組數據的集中趨勢宜采用()

A眾數b中位數c四分位數d均值10、某居民小區準備采取一項新的物業管理措施,為此,隨機抽取100名居民進行調查,其中表示贊成的有69戶,表示中立有22戶,表示反對的有9戶。該組數據的中位數是()

A贊成b69c中立d2211、某班共有25名學生,期末統計學課程考試分數分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數的眾數是()

A72b70c68d5612、某班共有25名學生,期末統計學課程考試分數分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數的中位數是()

A72b70c68d5613、某班共有25名學生,期末統計學課程考試分數分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數的均值是()

A72b70c68d5614、某班共有25名學生,期末統計學課程考試分數分別為68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,該班考試分數的下四分位數和上四分位數是()

A64.5和78.5b67.5和71.5c64.5和71.5d64.5和67.5第56頁,課

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論