第三章次數(shù)分布和平均數(shù)、變異數(shù)_第1頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第2頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第3頁
第三章次數(shù)分布和平均數(shù)、變異數(shù)_第4頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第三章第三章 次數(shù)分布和平均數(shù)、變異數(shù)次數(shù)分布和平均數(shù)、變異數(shù)第一節(jié)第一節(jié) 總體及其樣本總體及其樣本第二節(jié)第二節(jié) 次數(shù)分布次數(shù)分布第三節(jié)第三節(jié) 平均數(shù)平均數(shù)第四節(jié)第四節(jié) 變異數(shù)變異數(shù)第五節(jié)第五節(jié) 理論總體理論總體(群體群體)的平均數(shù)和標(biāo)準(zhǔn)差的平均數(shù)和標(biāo)準(zhǔn)差第一節(jié)第一節(jié) 總體及其樣本總體及其樣本l 總體總體( population )( population ) - 具有共同性質(zhì)的個體所組成的集團具有共同性質(zhì)的個體所組成的集團. 有限總體有限總體-總體所包含的個體數(shù)目有無窮多個總體所包含的個體數(shù)目有無窮多個 . 無限總體無限總體-由有限個個體構(gòu)成的總體由有限個個體構(gòu)成的總體.l 觀察值觀察值(

2、observation )( observation ) -每一個體的某一性狀、特性的測每一個體的某一性狀、特性的測定數(shù)值定數(shù)值.l 變數(shù)變數(shù)( variable )( variable ) -觀察值集合起來,稱為總體的變數(shù)。觀察值集合起來,稱為總體的變數(shù)。變數(shù)又稱為隨機變數(shù)變數(shù)又稱為隨機變數(shù)(random variable)。 l樣本樣本( sample )( sample ) -從總體中抽取若干個個體的集合稱為樣從總體中抽取若干個個體的集合稱為樣本本(sample)。l統(tǒng)計數(shù)統(tǒng)計數(shù)( statistic )( statistic ) -測定樣本中的各個體而得的樣本特征測定樣本中的各個體而得

3、的樣本特征數(shù),如平均數(shù)等,稱為統(tǒng)計數(shù)數(shù),如平均數(shù)等,稱為統(tǒng)計數(shù)(statistic)。l隨機樣本隨機樣本( random sample )( random sample ) -從總體中隨機抽取的樣本稱從總體中隨機抽取的樣本稱為隨機樣本為隨機樣本(random sample) l樣本容量樣本容量 ( sample size )( sample size ) -樣本中包含的個體數(shù)稱為樣本樣本中包含的個體數(shù)稱為樣本容量或樣本含量容量或樣本含量(sample size) 第二節(jié)第二節(jié) 次數(shù)分布次數(shù)分布一、試驗資料的性質(zhì)與分類一、試驗資料的性質(zhì)與分類二、次數(shù)分布表二、次數(shù)分布表三、次數(shù)分布圖三、次數(shù)分布

4、圖一、試驗資料的性質(zhì)與分類一、試驗資料的性質(zhì)與分類(一一) 數(shù)量性狀資料數(shù)量性狀資料(二二) 質(zhì)量性狀資料質(zhì)量性狀資料(一一) 數(shù)量性狀資料數(shù)量性狀資料 數(shù)量性狀數(shù)量性狀(quantitative trait)的度量有計數(shù)和量測兩種的度量有計數(shù)和量測兩種方式,其所得變數(shù)不同。方式,其所得變數(shù)不同。 1. 不連續(xù)性或間斷性變數(shù)不連續(xù)性或間斷性變數(shù)( discontinuous or discrete ( discontinuous or discrete variable )variable ) 指用計數(shù)方法獲得的數(shù)據(jù)指用計數(shù)方法獲得的數(shù)據(jù)。 2. 連續(xù)性變數(shù)連續(xù)性變數(shù)( continuous

5、variable )( continuous variable ) 指稱量、度量或測指稱量、度量或測量方法所得到的數(shù)據(jù),其各個觀察值并不限于整數(shù),在兩個量方法所得到的數(shù)據(jù),其各個觀察值并不限于整數(shù),在兩個數(shù)值之間可以有微量數(shù)值差異的第三個數(shù)值存在。數(shù)值之間可以有微量數(shù)值差異的第三個數(shù)值存在。 (二二) 質(zhì)量性狀資料質(zhì)量性狀資料 質(zhì)量性狀質(zhì)量性狀( qualitative trait )( qualitative trait )指能觀察而不能量測的狀指能觀察而不能量測的狀即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的即屬性性狀,如花藥、子粒、穎殼等器官的顏色、芒的有無、絨毛的有無等。要從這類性

6、狀獲得數(shù)量資料,可有無、絨毛的有無等。要從這類性狀獲得數(shù)量資料,可采用下列兩種方法:采用下列兩種方法:1. 統(tǒng)計次數(shù)法統(tǒng)計次數(shù)法 于一定總體或樣本內(nèi),統(tǒng)計其具有某個性于一定總體或樣本內(nèi),統(tǒng)計其具有某個性狀的個體數(shù)目及具有不同性狀的個體數(shù)目,按類別計其狀的個體數(shù)目及具有不同性狀的個體數(shù)目,按類別計其次數(shù)或相對次數(shù)。次數(shù)或相對次數(shù)。 2. 給分法給分法 給予每類性狀以相對數(shù)量的方法給予每類性狀以相對數(shù)量的方法二、次數(shù)分布表二、次數(shù)分布表(一一) 間斷性變數(shù)資料的整理間斷性變數(shù)資料的整理(二二) 連續(xù)性變數(shù)資料的整理連續(xù)性變數(shù)資料的整理(三三) 屬性變數(shù)資料的整理屬性變數(shù)資料的整理(一一) 間斷性變

7、數(shù)資料的整理間斷性變數(shù)資料的整理 現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機采取現(xiàn)以某小麥品種的每穗小穗數(shù)為例,隨機采取100個麥穗,計數(shù)每穗小穗數(shù),未加整理的資料列個麥穗,計數(shù)每穗小穗數(shù),未加整理的資料列成表成表3.1。 表3.1 100個麥穗的每穗小穗數(shù)181517191615201819171718171618201917161817161719181817171718181516181818172019181719151717171617181817191917191718161817171916161717171517161819181819192017161918171820191618

8、19171615161817181717161917每穗小穗數(shù)每穗小穗數(shù)( y )次數(shù)次數(shù)( f )1561615173218251917205總次數(shù)總次數(shù)( n )100表表3.2 100個麥穗每穗小個麥穗每穗小穗數(shù)的次數(shù)分布表穗數(shù)的次數(shù)分布表 從表從表3.2中看到,一堆雜亂的原中看到,一堆雜亂的原始資料表始資料表3.1,經(jīng)初步整理后,就,經(jīng)初步整理后,就可了解資料的大致情況,另外,經(jīng)可了解資料的大致情況,另外,經(jīng)過整理的資料也便于進一步的分析。過整理的資料也便于進一步的分析。 上述資料為間斷性變數(shù)資料,上述資料為間斷性變數(shù)資料,每穗小穗數(shù)在每穗小穗數(shù)在1520的范圍內(nèi)變動,的范圍內(nèi)變動,把

9、所有觀察值按每穗小穗數(shù)多少加把所有觀察值按每穗小穗數(shù)多少加以歸類,共分為以歸類,共分為6組,組與組間相差組,組與組間相差為為1小穗,稱為小穗,稱為組距組距。這樣可得表。這樣可得表3.2形式的次數(shù)分布表。形式的次數(shù)分布表。(二二) 連續(xù)性變數(shù)資料的整理連續(xù)性變數(shù)資料的整理茲以表茲以表3.4的的100行水稻試驗的產(chǎn)量為例,說明整理方法。行水稻試驗的產(chǎn)量為例,說明整理方法。177 215 197 97123 159 245 119119 131 149 152 167 104161 214 125 175 219 118 192 176 175 95136 199 116 165214 951588

10、3137 80138 151 187 126 196 134 206 137 98 97129 143 179 174 159 165 136 108 101 141 148 168163 176 102 194 145 173 75130 149 150 161 155111158131 189 91142 140 154 152 163 123 205 149 155 131 209183 97119 181 149 187 131 215111186 118 150 155 197116 254 239 160 172 179 151 198 124 179 135 184 168 16

11、9173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 159 177 147 194 227 141 169 124 159表表3.4 140行水稻產(chǎn)量行水稻產(chǎn)量(單位:克單位:克) 具體步驟:具體步驟: 1. 數(shù)據(jù)排序數(shù)據(jù)排序(sort)(sort) 首先對數(shù)據(jù)按從小到大排列首先對數(shù)據(jù)按從小到大排列(升序升序)或從大到小排列或從大到小排列(降序降序)。 2. 求極差求極差(range)(range) 所有數(shù)據(jù)中的最大觀察值和最小所有數(shù)據(jù)中的最大觀察值和最小觀察值的差數(shù),稱為觀察值的差數(shù),稱為極差

12、極差,亦即整個樣本的變異幅度。,亦即整個樣本的變異幅度。從表從表3.4中查到最大觀察值為中查到最大觀察值為254g,最小觀察值為,最小觀察值為75g,極差為極差為25475=179g。 3. 確定組數(shù)和組距確定組數(shù)和組距( class interval )( class interval ) 根據(jù)極差分為若根據(jù)極差分為若干組,每組的距離相等,稱為干組,每組的距離相等,稱為組距組距。 在確定組數(shù)和組距在確定組數(shù)和組距時應(yīng)考慮:時應(yīng)考慮: (1)觀察值個數(shù)的多少;觀察值個數(shù)的多少; (2)極差的大小;極差的大小; (3)便于計算;便于計算; (4)能反映出資料的真實面貌等方面。能反映出資料的真實面

13、貌等方面。 樣本大小樣本大小(即樣本內(nèi)包含觀察值的個數(shù)的多少即樣本內(nèi)包含觀察值的個數(shù)的多少)與組與組數(shù)多少的關(guān)系可參照數(shù)多少的關(guān)系可參照表表3.5來確定。來確定。表3.5樣本容量與組數(shù)多少的關(guān)系樣本內(nèi)觀察值的個數(shù)分組時的組數(shù)50 510100 81620010203001224500153010002040 組數(shù)確定后,還須組數(shù)確定后,還須確定組距。組距確定組距。組距=極差極差/組數(shù)。以表組數(shù)。以表3.4中中140行行水稻產(chǎn)量為例,樣本內(nèi)水稻產(chǎn)量為例,樣本內(nèi)觀察值的個數(shù)為觀察值的個數(shù)為140,查表查表3.5可分為可分為816組,組,假定分為假定分為12組,組,則組距為則組距為179/12=14

14、.9g,為分組方便起見,可以,為分組方便起見,可以15g作為組距。作為組距。 4. 選定組限選定組限( class limit )( class limit )和組中點值和組中點值( ( 組值,組值,class value )class value ) 以表以表3.4中中140行水稻產(chǎn)量為例,選定第一組的中點行水稻產(chǎn)量為例,選定第一組的中點值為值為75g,與最小觀察值,與最小觀察值75g相等;則第二組的中點值為相等;則第二組的中點值為75+15=90g,余類推。,余類推。 各組的中點值選定后,就可以求得各組組限。每組各組的中點值選定后,就可以求得各組組限。每組有兩個組限,數(shù)值小的稱為有兩個組限

15、,數(shù)值小的稱為下限下限( lower limit )( lower limit ),數(shù)值大的,數(shù)值大的稱為稱為上限上限( upper limit )( upper limit )。上述資料中,第一組的下限為該。上述資料中,第一組的下限為該組中點值減去組中點值減去1/2組距,即組距,即75(15/2)=67.5g,上限為中,上限為中點值加點值加1/2組距,即組距,即75+(15/2)=82.5g。故第一組的組限為。故第一組的組限為67.582.5g。按照此法計算其余各組的組限,就可寫出。按照此法計算其余各組的組限,就可寫出分組數(shù)列。分組數(shù)列。 5. 把原始資料的各個觀察值按分組數(shù)列的各組組限歸組

16、把原始資料的各個觀察值按分組數(shù)列的各組組限歸組 可按原始資料中各觀察值的次序,逐個把數(shù)值歸于各可按原始資料中各觀察值的次序,逐個把數(shù)值歸于各組。組。 待全部觀察值歸組后,即可求得各組的次數(shù),制成一待全部觀察值歸組后,即可求得各組的次數(shù),制成一個次數(shù)分布表。個次數(shù)分布表。 例如表例如表3.4中第一個觀察值中第一個觀察值177應(yīng)歸于表應(yīng)歸于表3.6中第中第8組,組,組限為組限為172.5187.5;第二個觀察值;第二個觀察值149應(yīng)歸于第應(yīng)歸于第6組,組組,組限為限為142.5157.5;。依次把。依次把140個觀察值都進行歸個觀察值都進行歸組,即可制成組,即可制成140行水稻產(chǎn)量的次數(shù)分布表行水

17、稻產(chǎn)量的次數(shù)分布表(表表3.6)。表3.6 140行水稻的次數(shù)分布組組 限限中點值中點值( y )次數(shù)次數(shù)( f ) 67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.513517142.5157.515020157.5172.516525172.5187.518021187.5202.519513202.5217.52109217.5232.52253232.5247.52402247.5262.52551合計合計( n )140 注注:前面提到分為前面提到分為12組,組,但由于第一組的中點值接近但由于第一組的中點值

18、接近于最小觀察值,故第一組的于最小觀察值,故第一組的下限小于最小觀察值,實際下限小于最小觀察值,實際上差不多增加了上差不多增加了1/2組;這樣組;這樣也使最后一組的中點值接近也使最后一組的中點值接近于最大值,又增加了于最大值,又增加了1/2組,組,故實際的組數(shù)比原來確定的故實際的組數(shù)比原來確定的要多一個組,為要多一個組,為13組。組。 (三三) 屬性變數(shù)資料的整理屬性變數(shù)資料的整理 屬性變數(shù)的資料,也可以用類屬性變數(shù)的資料,也可以用類似次數(shù)分布的方法來整理。似次數(shù)分布的方法來整理。在整理前,把資料按各種質(zhì)量性在整理前,把資料按各種質(zhì)量性狀進行分類,分類數(shù)等于組數(shù),狀進行分類,分類數(shù)等于組數(shù),然

19、后根據(jù)各個體在質(zhì)量屬性上的然后根據(jù)各個體在質(zhì)量屬性上的具體表現(xiàn),分別歸入相應(yīng)的組中,具體表現(xiàn),分別歸入相應(yīng)的組中,即可得到屬性分布的規(guī)律性認識。即可得到屬性分布的規(guī)律性認識。例如,某水稻雜種第二代植株例如,某水稻雜種第二代植株米粒性狀的分離情況,歸于表米粒性狀的分離情況,歸于表3.7。表3.7 水稻雜種二代植株 米粒性狀的分離情況屬性分組屬性分組( y )次數(shù)次數(shù)( f )紅米非糯紅米非糯96紅米糯稻紅米糯稻37白米非糯白米非糯31白米糯稻白米糯稻15合計合計( n )179三、次數(shù)分布圖三、次數(shù)分布圖(一一) 方柱形圖方柱形圖(二二) 多邊形圖多邊形圖(三三) 條形圖條形圖 (四四) 餅圖餅

20、圖 (一一) 方柱形圖方柱形圖方柱形圖方柱形圖( histogram )( histogram )適用于表示連續(xù)性變數(shù)的次數(shù)分布。適用于表示連續(xù)性變數(shù)的次數(shù)分布。607590105 120 135 150 165 180 195 210 225 240 255 270510152025y(產(chǎn)量 ,克 /行 ) 現(xiàn)以表現(xiàn)以表3.6的的140行水稻產(chǎn)量的次數(shù)行水稻產(chǎn)量的次數(shù)分布表為例加以說分布表為例加以說明。即成方柱形次明。即成方柱形次數(shù)分布圖數(shù)分布圖3.1。圖圖3.1 140行水稻產(chǎn)量次數(shù)分布方柱形圖行水稻產(chǎn)量次數(shù)分布方柱形圖(二二) 多邊形圖多邊形圖 多邊形圖多邊形圖( polygon )(

21、polygon )也是表示連續(xù)性變數(shù)資料的一種普也是表示連續(xù)性變數(shù)資料的一種普通的方法,且在同一圖上可比較兩組以上的資料。通的方法,且在同一圖上可比較兩組以上的資料。607590 105 120 135 150 165 180 195 210 225 240 255 270051015202530y(產(chǎn)量 ,克 /行 ) 仍以仍以140行水稻產(chǎn)量次行水稻產(chǎn)量次數(shù)分布為例,所成圖形即數(shù)分布為例,所成圖形即為次數(shù)多邊形圖為次數(shù)多邊形圖(圖圖3.2)。圖圖3.2 140行水稻產(chǎn)量次數(shù)分布多邊形圖行水稻產(chǎn)量次數(shù)分布多邊形圖(三三) 條形圖條形圖 條形圖條形圖(bar)(bar)適用于間斷性變數(shù)和屬性變

22、數(shù)資料,用以適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中表示這些變數(shù)的次數(shù)分布狀況。一般其橫軸標(biāo)出間斷的中點值或分類性狀,縱軸標(biāo)出次數(shù)。點值或分類性狀,縱軸標(biāo)出次數(shù)。020406080100120紅米非糯紅米糯稻白米非糯白米糯稻f 現(xiàn)以表現(xiàn)以表3.7水稻雜種第二水稻雜種第二代米粒性狀的分離情況為例,代米粒性狀的分離情況為例,可畫成水稻雜種第二代植株可畫成水稻雜種第二代植株4種米粒性狀分離情況條形圖種米粒性狀分離情況條形圖(3.3)。圖圖3.3 水稻水稻F2代米粒性狀分離條形圖代米粒性狀分離條形圖 (四四) 餅圖餅圖 餅圖餅圖( pie )( pie )

23、適用于間斷性變數(shù)和屬性變數(shù)資料,用以表適用于間斷性變數(shù)和屬性變數(shù)資料,用以表示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個示這些變數(shù)中各種屬性或各種間斷性數(shù)據(jù)觀察值在總觀察個數(shù)中的百分比。數(shù)中的百分比。 如圖如圖3.4中白米糯稻在中白米糯稻在F2群體中占群體中占8%,白米非糯、,白米非糯、紅米糯稻和紅米非糯分別紅米糯稻和紅米非糯分別占占17%、21%和和54%。紅米非糯54%紅米糯稻21%白米非糯17%白米糯稻8%圖3.4 水稻F2代米粒性狀分離的餅圖第三節(jié)第三節(jié) 平均數(shù)平均數(shù)一、平均數(shù)的意義和種類一、平均數(shù)的意義和種類二、算術(shù)平均數(shù)的計算方法二、算術(shù)平均數(shù)的計算方法三、算術(shù)平均數(shù)的重要

24、特性三、算術(shù)平均數(shù)的重要特性四、總體平均數(shù)四、總體平均數(shù)一、平均數(shù)的意義和種類一、平均數(shù)的意義和種類 平均數(shù)的意義平均數(shù)的意義: 平均數(shù)平均數(shù)( average )( average )是數(shù)據(jù)的代表值,表示資料中是數(shù)據(jù)的代表值,表示資料中觀察值的中心位置,并且可作為資料的代表而與另觀察值的中心位置,并且可作為資料的代表而與另一組資料相比較,借以明確二者之間相差的情況。一組資料相比較,借以明確二者之間相差的情況。 平均數(shù)的種類平均數(shù)的種類 : (1) 算術(shù)平均數(shù)算術(shù)平均數(shù) 一個數(shù)量資料中各個觀察值的總和一個數(shù)量資料中各個觀察值的總和除以觀察值個數(shù)所得的商數(shù),稱為除以觀察值個數(shù)所得的商數(shù),稱為算術(shù)

25、平均數(shù)算術(shù)平均數(shù)( arithmetic ( arithmetic mean )mean ),記作,記作 。因其應(yīng)用廣泛,常簡稱平均數(shù)或均數(shù)。因其應(yīng)用廣泛,常簡稱平均數(shù)或均數(shù)(mean)。均數(shù)的大小決定于樣本的各觀察值。均數(shù)的大小決定于樣本的各觀察值。 (2) 中數(shù)中數(shù) 將資料內(nèi)所有觀察值從大到小排序,居中間將資料內(nèi)所有觀察值從大到小排序,居中間位置的觀察值稱為位置的觀察值稱為中數(shù)中數(shù)( median )( median ),計作,計作Md。如觀察值個。如觀察值個數(shù)為偶數(shù),則以中間二個觀察值的算術(shù)平均數(shù)為中數(shù)。數(shù)為偶數(shù),則以中間二個觀察值的算術(shù)平均數(shù)為中數(shù)。y (3) 眾數(shù)眾數(shù) 資料中最常見的

26、一數(shù),或次數(shù)最多一組的中資料中最常見的一數(shù),或次數(shù)最多一組的中點值,稱為點值,稱為眾數(shù)眾數(shù)( mode )( mode ),計作,計作MO。如棉花纖維檢驗時所。如棉花纖維檢驗時所用的主體長度即為眾數(shù)。用的主體長度即為眾數(shù)。 (4) 幾何平均數(shù)幾何平均數(shù) 如有如有n個觀察值,其相乘積開個觀察值,其相乘積開n次方,次方,即為即為幾何平均數(shù)幾何平均數(shù)( geometric mean )( geometric mean ),用,用G代表。代表。nnnnyyyyyyyyG/1321321)( (31) 平均數(shù)的種類平均數(shù)的種類 :二、算術(shù)平均數(shù)的計算方法二、算術(shù)平均數(shù)的計算方法 若樣本較小,即資料包含的

27、觀察值個數(shù)不多,可直接若樣本較小,即資料包含的觀察值個數(shù)不多,可直接計算平均數(shù)。設(shè)一個含有計算平均數(shù)。設(shè)一個含有n個觀察值的樣本,其各個觀察個觀察值的樣本,其各個觀察值為值為y1、y2、y3、yn,則算術(shù)平均數(shù)由下式算得:,則算術(shù)平均數(shù)由下式算得:nynyyyyyniin1321(32) 若樣本較大,且已進行了分組若樣本較大,且已進行了分組(如表如表3.6),可采用加權(quán),可采用加權(quán)法計算算術(shù)平均數(shù),即用組中點值代表該組出現(xiàn)的觀測值法計算算術(shù)平均數(shù),即用組中點值代表該組出現(xiàn)的觀測值以計算平均數(shù),其公式為以計算平均數(shù),其公式為nfyfyfyiii(33) 其中其中yi 為第為第i 組中點值,組中點

28、值,fi 為第為第 i 組變數(shù)出現(xiàn)次數(shù)。組變數(shù)出現(xiàn)次數(shù)。 例例3.1 在水稻品種比較試驗中,湘矮早四號的在水稻品種比較試驗中,湘矮早四號的5個小區(qū)個小區(qū)產(chǎn)量分別為產(chǎn)量分別為20.0、19.0、21.0、17.5、18.5kg,求該品種的,求該品種的小區(qū)平均產(chǎn)量。小區(qū)平均產(chǎn)量。 例例3.2 利用表利用表3.6資料計算平均每行水稻產(chǎn)量。資料計算平均每行水稻產(chǎn)量。若采用直接法,若采用直接法, =157.47。因此,兩者的結(jié)果十分相近。因此,兩者的結(jié)果十分相近。)(2195518517021019020kg.nyy由由(32)有有)(93157140221101402551907752g.nfyyy三

29、、算術(shù)平均數(shù)的重要特性三、算術(shù)平均數(shù)的重要特性 (1) 樣本各觀察值與其平均數(shù)的差數(shù)樣本各觀察值與其平均數(shù)的差數(shù)(簡稱離均差,簡稱離均差,deviation from mean)的總和等于的總和等于0。即:。即: 0)()(1yyyyinii (2) 樣本各觀察值與其平均數(shù)的差數(shù)平方的總和,較各樣本各觀察值與其平均數(shù)的差數(shù)平方的總和,較各個觀察值與任意其他數(shù)值的差數(shù)平方的總和為小,亦即離均個觀察值與任意其他數(shù)值的差數(shù)平方的總和為小,亦即離均差平方的總和最小。這個問題可作這樣的說明,設(shè)差平方的總和最小。這個問題可作這樣的說明,設(shè)Q為各個為各個觀察值與任意數(shù)值觀察值與任意數(shù)值a的差數(shù)平方的總和,即

30、:的差數(shù)平方的總和,即:niiayQ12)(對此對此Q求最小值,可得使求最小值,可得使Q最小的最小的a 值為平均數(shù)。值為平均數(shù)。四、總體平均數(shù)四、總體平均數(shù) 總體平均數(shù)用總體平均數(shù)用 來代表,它同樣具有算術(shù)平均數(shù)所具有來代表,它同樣具有算術(shù)平均數(shù)所具有的特性。的特性。NyNii 1(34) 上式上式y(tǒng)i 代表各個觀察值,代表各個觀察值,N代表有限總體所包含的個體代表有限總體所包含的個體數(shù),數(shù), 表示總體內(nèi)各個觀察值的總和。表示總體內(nèi)各個觀察值的總和。Niiy1第四節(jié)第四節(jié) 變異數(shù)變異數(shù)一、極差一、極差二、方差二、方差三、標(biāo)準(zhǔn)差三、標(biāo)準(zhǔn)差四、變異系數(shù)四、變異系數(shù)一、極一、極 差差 極差極差( r

31、ange )( range ),又稱,又稱全距全距,記作,記作R,是資料中最大觀察,是資料中最大觀察值與最小觀察值的差數(shù)。例如調(diào)查兩個小麥品種的每穗小值與最小觀察值的差數(shù)。例如調(diào)查兩個小麥品種的每穗小穗數(shù),每品種計數(shù)穗數(shù),每品種計數(shù)10個麥穗,經(jīng)整理后的數(shù)字列于表個麥穗,經(jīng)整理后的數(shù)字列于表3.8。表表3.8 兩個小麥品種的每穗小穗數(shù)兩個小麥品種的每穗小穗數(shù)品種名稱品種名稱每穗小穗數(shù)每穗小穗數(shù)總和總和平均平均甲甲13 14 15 17 18 18 19 21 22 2318018乙乙16 16 17 18 18 18 18 19 20 2018018 表表3.8資料中,甲品種每穗小穗數(shù)最少為資

32、料中,甲品種每穗小穗數(shù)最少為13個,最多個,最多為為23個,個,R=2313=10個小穗;乙品種每穗小穗數(shù)最少個小穗;乙品種每穗小穗數(shù)最少為為16個,最多為個,最多為20個,個,R=2016=4個小穗。個小穗。 可以看出,兩品種的平均每穗小穗數(shù)雖同為可以看出,兩品種的平均每穗小穗數(shù)雖同為18個,但個,但甲品種的極差較大,其變異范圍較大,平均數(shù)的代表性較甲品種的極差較大,其變異范圍較大,平均數(shù)的代表性較差;乙品種的極差較小,其變異幅度較小,其平均數(shù)代表差;乙品種的極差較小,其變異幅度較小,其平均數(shù)代表性較好。性較好。二、方二、方 差差離均差平方和離均差平方和( (簡稱平方和簡稱平方和) )SS

33、-將各個離均差平方后相加將各個離均差平方后相加樣本樣本SS= 2)( yyi (35) 總體總體SS= 2)(iy(36)均方或方差均方或方差(variance)(variance) -用觀察值數(shù)目來除平方和用觀察值數(shù)目來除平方和 樣本均方樣本均方(mean square)(mean square)用用s2表示,定義為:表示,定義為: 總體方差總體方差用用 表示,定義為:表示,定義為: 2NyNi122)(樣本均方是總體方差的無偏估計值樣本均方是總體方差的無偏估計值 1122nyysni)(三、標(biāo)準(zhǔn)差三、標(biāo)準(zhǔn)差(一一) 標(biāo)準(zhǔn)差的定義標(biāo)準(zhǔn)差的定義 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差為方差的正平方根值,用以表示資料的變

34、異度為方差的正平方根值,用以表示資料的變異度,其單位與觀察值的度量單位相同。從樣本資料計算標(biāo)準(zhǔn)差的其單位與觀察值的度量單位相同。從樣本資料計算標(biāo)準(zhǔn)差的公式為:公式為:1)(2nyys(39)總體標(biāo)準(zhǔn)差用表示:總體標(biāo)準(zhǔn)差用表示:Ny2)(310)樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計值。樣本標(biāo)準(zhǔn)差是總體標(biāo)準(zhǔn)差的估計值。 (二二) 自由度的意義自由度的意義 自由度記作自由度記作DF,其具體數(shù)值則常用,其具體數(shù)值則常用 表示。表示。統(tǒng)計意義統(tǒng)計意義:是指樣本內(nèi)獨立而能自由變動的離均差個數(shù)。:是指樣本內(nèi)獨立而能自由變動的離均差個數(shù)。kn 例如一個有例如一個有5個觀察值的樣本,因為受統(tǒng)計數(shù)的約束,在個觀察值的樣本

35、,因為受統(tǒng)計數(shù)的約束,在5個離均差中,只有個離均差中,只有4個數(shù)值可以在一定范圍之內(nèi)自由變動取個數(shù)值可以在一定范圍之內(nèi)自由變動取值,而第五個離均差必須滿足。如一樣本為值,而第五個離均差必須滿足。如一樣本為(3,4,5,6,7),平均數(shù)為),平均數(shù)為5,前,前個離差為個離差為2 ,1,0和和1,則第,則第5個離個離均差為前均差為前4個離均差之和的變號數(shù),即個離均差之和的變號數(shù),即( 2)=2。一般地,。一般地,樣本自由度等于觀察值的個數(shù)樣本自由度等于觀察值的個數(shù)(n)減去約束條件的個數(shù)減去約束條件的個數(shù)(k),即即 。 注:注:比較比較(39)和和(310),樣本標(biāo)準(zhǔn)差不以樣本容量,樣本標(biāo)準(zhǔn)差不

36、以樣本容量n,而以自由度而以自由度n1作為除數(shù),這是因為通常所掌握的是樣本作為除數(shù),這是因為通常所掌握的是樣本資料,不知資料,不知 的數(shù)值,不得不用樣本平均數(shù)的數(shù)值,不得不用樣本平均數(shù) 代替代替 。 與與 有差異,由算術(shù)平均數(shù)的性質(zhì)有差異,由算術(shù)平均數(shù)的性質(zhì)(2)可知,可知, 比比 小。因此,由小。因此,由 算出的標(biāo)準(zhǔn)差將偏小。如分母算出的標(biāo)準(zhǔn)差將偏小。如分母用用n1代替,則可免除偏小的弊病。數(shù)理統(tǒng)計上可以證明代替,則可免除偏小的弊病。數(shù)理統(tǒng)計上可以證明用自由度作除數(shù)計算標(biāo)準(zhǔn)差的無偏性。用自由度作除數(shù)計算標(biāo)準(zhǔn)差的無偏性。yy2)( yy2)(ynyy/)(2(三三) 標(biāo)準(zhǔn)差的計算方法標(biāo)準(zhǔn)差的計

37、算方法 1. 直接法直接法 可按可按 計算,分四個步驟:計算,分四個步驟:yyy 2)(yy 2)(yy 1)(2nyys (1)先求出先求出 , (2)再求出各個再求出各個 和各個和各個 , (3)求和得求和得 , (4) 代入代入 算得標(biāo)準(zhǔn)差。算得標(biāo)準(zhǔn)差。1)(2nyys 例例3.3 設(shè)某一水稻單株粒重的樣本有設(shè)某一水稻單株粒重的樣本有5個觀察值,個觀察值,以克為單位,其數(shù)為以克為單位,其數(shù)為2、8、7、5、4(用用y代表代表),按照上,按照上述步驟,由表述步驟,由表3.9可算得平方和為可算得平方和為22.80,把它代入,把它代入 即可得到:即可得到:這就是該水稻單株粒重的標(biāo)準(zhǔn)差為這就是該

38、水稻單株粒重的標(biāo)準(zhǔn)差為2.39g。1)(2nyys)(3921580221)(2g.nyysyy 2)(yy 計算項目yy223.210.24482.87.846471.83.244950.20.042541.21.4416總和26022.80158平均5.2表表3.9 水稻粒重的平方和的計算水稻粒重的平方和的計算2 矯正數(shù)法矯正數(shù)法 經(jīng)過轉(zhuǎn)換可得經(jīng)過轉(zhuǎn)換可得 (311)其中其中 項稱為矯正數(shù),記作項稱為矯正數(shù),記作C。 ny2)( 在例在例3.3中,于表中,于表3.9第第5列寫出各觀察值的平方值,將列寫出各觀察值的平方值,將有關(guān)數(shù)字代入有關(guān)數(shù)字代入(311)即有:即有:其結(jié)果和直接法算得相同

39、。其結(jié)果和直接法算得相同。1)(2nyys122nnyys)()(392155)26(1581)(222g.nnyys3 加權(quán)法加權(quán)法 若樣本較大,并已獲得如表若樣本較大,并已獲得如表3.6的次數(shù)分布表,可采用加的次數(shù)分布表,可采用加權(quán)法計算標(biāo)準(zhǔn)差,其公式為:權(quán)法計算標(biāo)準(zhǔn)差,其公式為:1)(1)(nnyfyffyyfsiiiiiii222(312) 組組 限限中點值中點值( y )次數(shù)次數(shù)( f ) 67.5 82.5752 82.5 97.5907 97.5112.51057112.5127.512013127.5142.513517142.5157.515020157.5172.516525172.5187.518021187.5202.51

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論