教育與心理統計課件第四章差異量數_第1頁
教育與心理統計課件第四章差異量數_第2頁
教育與心理統計課件第四章差異量數_第3頁
教育與心理統計課件第四章差異量數_第4頁
教育與心理統計課件第四章差異量數_第5頁
已閱讀5頁,還剩52頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

教育與心理統計課件第四章差異量數第一頁,共五十七頁,編輯于2023年,星期日第四章差異量數學習目標1、離散程度各測度值的計算方法2、離散程度各測度值的特點及應用場合3、偏態與峰態的測度方法第二頁,共五十七頁,編輯于2023年,星期日離中趨勢數據分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側面說明了集中趨勢測度值的代表程度不同類型的數據有不同的離散程度測度值第三頁,共五十七頁,編輯于2023年,星期日全距(極差)(range)一組數據的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數據的分布7891078910

R

=max(xi)-min(xi)**R越大,說明離散程度越大。計算公式為第四頁,共五十七頁,編輯于2023年,星期日百分位差(percentile)為了避免極端數據的影響,將數據的兩端各截去10%,即P10和P90之間的距離作為差異量數。第五頁,共五十七頁,編輯于2023年,星期日百分等級分數表示分數在整個分數分布中所處的百分位置。其中:

PR:百分等級X:對應的原始分數f:該分數所在組的次數Lb:該分數所在組的精確下限

Fb:小于L的各組次數之和N:總次數

i:組距**百分等級一般只用整數不用小數。第六頁,共五十七頁,編輯于2023年,星期日例:如下表示,求分數為77的百分等級分數。組別fF80—78—76—74—72—4719125474336175解:第七頁,共五十七頁,編輯于2023年,星期日百分位分數意義:

1、原始分數在次數分布中的特定地位分數。2、表示總體中有p%的分數小于PP。計算公式:第八頁,共五十七頁,編輯于2023年,星期日【例】:用下面的次數分布表計算該分布的百分位差P90-P10。組別f向上累加次數65-115760-415655-615250-814645-1613840-2412235-349830-216425-164320-112715-91610-77合計157注意:組位在第一次大于N*m/100的F所在組!第九頁,共五十七頁,編輯于2023年,星期日解:先計算P90和P10兩個百分位數。

(如何確定PP所在的組位?)第十頁,共五十七頁,編輯于2023年,星期日四分位數(quartile)1、排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數據,也可用于數值型數據,但不能用于分類數據Q1Q2Q325%25%25%25%第十一頁,共五十七頁,編輯于2023年,星期日四分位數

(位置的確定)原始數據:順序數據:第十二頁,共五十七頁,編輯于2023年,星期日順序數據的四分位數解:Q1位置=(300)/4=75

Q3位置=(3×300)/4

=225從累計頻數看,Q1在“不滿意”這一組別中;Q3在“一般”這一組別中四分位數為

Q1

=不滿意

Q3

=一般甲城市家庭對住房狀況評價的次數分布回答類別甲城市次數(戶)累計次數

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—第十三頁,共五十七頁,編輯于2023年,星期日數值型數據的四分位數

(9個數據的算例)【例】:9個家庭的人均月收入數據原始數據:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789第十四頁,共五十七頁,編輯于2023年,星期日數值型數據的四分位數

(10個數據的算例)【例】:10個家庭的人均月收入數據排序:

660

75078085096010801250150016302000位置:1234

5678910第十五頁,共五十七頁,編輯于2023年,星期日四分位差

(quartiledeviation)對順序數據離散程度的測度也稱為內距或四分間距上四分位數與下四分位數之差的一半。

Q

=(Q3

–Q1)/2反映了中間50%數據的離散程度不受極端值的影響用于衡量中位數的代表性第十六頁,共五十七頁,編輯于2023年,星期日四分位差解:設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5。已知

Q1=不滿意=2

Q3

=

一般=3四分位差:

Q=(Q3-

Q1)/2

=(3–2)/2

=0.5甲城市家庭對住房狀況評價的次數分布回答類別甲城市次數(戶)累計次數

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—第十七頁,共五十七頁,編輯于2023年,星期日平均差

(meandeviation)各變量值與其均值離差絕對值的平均數能全面反映一組數據的離散程度數學性質較差,實際中應用較少計算公式為未分組數據組距分組數據第十八頁,共五十七頁,編輯于2023年,星期日【例】:有5名被試的錯覺實驗數據如下,求其平均差。解:已知n=5x=18.6被試12345錯覺量1618202217第十九頁,共五十七頁,編輯于2023年,星期日平均差某電腦公司銷售量數據平均差計算表按銷售量分組組中值(xc)次數(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040求該電腦公司銷售量的平均差第二十頁,共五十七頁,編輯于2023年,星期日解:含義:每一天的銷售量平均數相比,平均相差17臺第二十一頁,共五十七頁,編輯于2023年,星期日方差和標準差

(varianceandstandarddeviation)為了避免負數出現,數據離散程度的最常用測度值反映了各變量值與均值的平均差異根據總體數據計算的,稱為總體方差或標準差;根據樣本數據計算的,稱為樣本方差或標準差第二十二頁,共五十七頁,編輯于2023年,星期日總體方差計算公式:總體標準差的計算公式:第二十三頁,共五十七頁,編輯于2023年,星期日樣本方差和標準差

(simplevarianceandstandarddeviation)未分組數據:組距分組數據:未分組數據:組距分組數據:方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!第二十四頁,共五十七頁,編輯于2023年,星期日

樣本方差

自由度(degreeoffreedom)一組數據中可以自由取值的數據的個數當樣本數據的個數為

n

時,若樣本均值x

確定后,只有n-1個數據可以自由取值,其中必有一個數據則不能自由取值例如,樣本有3個數值,即x1=2,x2=4,x3=9,則x

=5。當x

=5

確定后,x1,x2和x3有兩個數據可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量第二十五頁,共五十七頁,編輯于2023年,星期日方差、標準差的計算原始數據:【例】:計算6、5、7、4、6、8、這一組數據的方差和標準差。解:(1)公式法計算(2)計算器計算法第二十六頁,共五十七頁,編輯于2023年,星期日分組數據的樣本標準差計算某電腦公司銷售量數據平均差計算表按銷售量分組組中值(Xc)次數(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—55400第二十七頁,共五十七頁,編輯于2023年,星期日樣本標準差

含義:每一天的銷售量與平均數相比,平均相差21.58臺。

**計算器的算法?!第二十八頁,共五十七頁,編輯于2023年,星期日總標準差的合成:【例】:在三個班級進行某項能力研究,三個班測查結果的平均數和標準差如下,求三個班的總標準差。班級nxS14210316236110123509817第二十九頁,共五十七頁,編輯于2023年,星期日方差和標準差的性質和意義性質(1)每一個觀測值都加上一個相同常數C之后,計算得到的標準差等于原標準差。(2)每一個觀測值都乘以一個相同的常數C,則所得的標準差等原標準差乘以這個常數。(3)每一個觀測值都乘以同一個常數C(C≠0),再加一個常數d,所得的標準差等于原標準差乘以這個常數C。第三十頁,共五十七頁,編輯于2023年,星期日意義:(1)方差與標準差是表示一組數據離散程度的最好指標。其值越大,次數分布越分散,反之,其值越小,離散越小。(2)

標準差具備一個良好的差異量數應具備的條件:①反應靈敏,每個數據取值變化,方差與標準關都隨之變化;②計算公式嚴密確定;③容易計算;④適合代數運算;⑤受抽樣變動影響,即不同樣本的標準差或方差比較穩定;⑥簡單明了,這一點其他差異量數比較稍有不足,但其意義還是較明確的。(3)標準差與其他各種差異量數相比,具有數學上的優越性,特別是當已知一組數據的平均數與標準差后,就可以知道落在平均數上下各一個標準差、兩個標準差,或三個標準差范圍內的數據所占的百分比。

第三十一頁,共五十七頁,編輯于2023年,星期日標準差的應用

差異系數

標準分數第三十二頁,共五十七頁,編輯于2023年,星期日差異系數(coefficientofvariation)1.標準差與其相應的均值之比

2.對數據相對離散程度的測度

3.消除了數據水平高低和計量單位的影響4.用于對不同組別數據離散程度的比較5.計算公式為第三十三頁,共五十七頁,編輯于2023年,星期日差異系數某管理局所屬8家企業的產品銷售數據企業編號產品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業,其產品銷售數據如表。試比較產品銷售額與銷售利潤的離散程度第三十四頁,共五十七頁,編輯于2023年,星期日解:結論:計算結果表明,cv1<cv2,說明產品銷售額的離散程度小于銷售利潤的離散程度Cv1=536.25309.19=0.577cv2=32.521523.09=0.710第三十五頁,共五十七頁,編輯于2023年,星期日標準分數

(standardscore)1.也稱標準化值或Z分數2. 對某一個值在一組數據中相對位置的度量3. 可用于判斷一組數據是否有離群點4. 用于對變量的標準化處理5.計算公式為第三十六頁,共五十七頁,編輯于2023年,星期日標準分數的性質均值等于02. 方差等于1第三十七頁,共五十七頁,編輯于2023年,星期日標準分數的性質(圖示)z分數只是將原始數據進行了線性變換,它并沒有改變一個數據在改組數據中的位置,也沒有改變該組數分布的形狀,而只是將該組數據變為均值為0,標準差為1。第三十八頁,共五十七頁,編輯于2023年,星期日標準化值9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996第三十九頁,共五十七頁,編輯于2023年,星期日經驗法則經驗法則表明:當一組數據對稱分布時約有68%的數據在平均數加減1個標準差的范圍之內約有95%的數據在平均數加減2個標準差的范圍之內約有99%的數據在平均數加減3個標準差的范圍之內第四十頁,共五十七頁,編輯于2023年,星期日標準分數的優點1、

可比性2、

可加性3、

明確性4、

穩定性第四十一頁,共五十七頁,編輯于2023年,星期日標準分數的應用:1、

用于比較幾個分屬性質不同的觀測值在各自數據分布相對位置的高低2、

計算不同質的觀測值的總和或平均值,以表示在團體中的相對位置。3、表示標準測驗分數第四十二頁,共五十七頁,編輯于2023年,星期日偏態與峰態的度量第四十三頁,共五十七頁,編輯于2023年,星期日動差和中心動差(p86)FOLM=F.L0xi第四十四頁,共五十七頁,編輯于2023年,星期日一級動差二級動差三級動差(偏態指標)四級動差(峰態指標)第四十五頁,共五十七頁,編輯于2023年,星期日偏態與峰態分布的形狀扁平分布尖峰分布偏態峰態左偏分布右偏分布與標準正態分布比較!第四十六頁,共五十七頁,編輯于2023年,星期日偏態第四十七頁,共五十七頁,編輯于2023年,星期日偏態

(skewness)統計學家Pearson于1895年首次提出數據分布偏斜程度的測度2. 偏態系數=0為對稱分布3. 偏態系數>0為右偏分布4. 偏態系數<0為左偏分布第四十八頁,共五十七頁,編輯于2023年,星期日偏態系數(skewnesscoefficient)根據原始數據計算根據分組數據計算第四十九頁,共五十七頁,編輯于2023年,星期日偏態系數

某電腦公司銷售量偏態及峰度計算表按銷售量份組(臺)組中值(Mi)頻數fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-2700001700080000216000256000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論