第三章-次數分布和平均數、變異數省名師優質課賽課獲獎課件市賽課百校聯賽優質課一等獎課件_第1頁
第三章-次數分布和平均數、變異數省名師優質課賽課獲獎課件市賽課百校聯賽優質課一等獎課件_第2頁
第三章-次數分布和平均數、變異數省名師優質課賽課獲獎課件市賽課百校聯賽優質課一等獎課件_第3頁
第三章-次數分布和平均數、變異數省名師優質課賽課獲獎課件市賽課百校聯賽優質課一等獎課件_第4頁
第三章-次數分布和平均數、變異數省名師優質課賽課獲獎課件市賽課百校聯賽優質課一等獎課件_第5頁
已閱讀5頁,還剩26頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章次數分布和平均數、變異數第一節總體及其樣本第二節次數分布第三節平均數第四節變異數1/31第一節總體及其樣本

1、數據:指在生物學試驗或調查中,對研究對象一些特征或性狀進行觀察記載得到數字資料2、變數:指研究性狀

連續性變數(continuousvariable)變數

間斷性變數(discontinuousordiscretevariable)3、變量:指變數中每一個觀察值4、總體:指含有共同性質全部個體組成集團N:表示總體容量有限總體(finitepopulation)總體

無限總體

(infinitepopulation)2/315、樣本:從研究總體中抽出一部分有代表性個體所組成集團

n:表示樣本容量大樣本(n>30)樣本小樣本(n≤30)6、參數:由總體全部觀察值算得總體特征數用希臘字母表示如:總體平均數用

表示總體方差用

2表示總體標準差用

表示第一節總體及其樣本

3/31第一節總體及其樣本7、統計數:由樣本全部觀察值算得樣本特征數如:樣本平均數用

表示樣本方差用S2

表示樣本標準差用S表示8、觀察值:指目標性狀一次測定數值用拉丁字母表示4/31一、試驗資料性質與分類第二節次數分布試驗中觀察記載所得數據因其研究性狀、特征不一樣而含有不一樣性質,普通可分為數量性狀資料和質量性狀資料。1、數量性狀:指能夠經過計數和量測性狀。如小麥基本苗數、穗粒數、株高、粒重等。其所得變數分為間斷性變數和連續性變數。2、質量性狀:指能夠經過觀察而不能量測性狀,又稱屬性性狀。如花藥、子粒顏色、芒有沒有等。質量性狀資料能夠經過兩種方法得到:統計次數法和給分法。5/31第二節次數分布二、數據分組(一)單項式分組該分組方式主要應用于變異范圍不大間斷性變數和質量性狀資料1、間斷性變數資料分組1)若變數可取值個數不多時以自然單位進行分組100個麥穗每穗小穗數次數分布表(P37)每穗小穗數(y)次數(f)

1561615173218251917205總次數(n)1006/31第二節次數分布2)若變數可取值個數太多,則可按取值大小,從小到大相鄰若干個值合為一組方法進行整理(普通要求組距相等)200個稻穗每穗粒數次數分布表(P37)每穗粒數(y)次數(f)26-30131-35336-4010……………………76-80381-852累計2007/31第二節次數分布3)屬性變數資料以性狀屬性類別進行分組有幾類性狀就分幾組玉米F2代兩對性狀分離次數分布表性狀屬性次數(f)黃色非甜850黃色甜粒282白色非甜287白色甜粒96累計15158/31第二節次數分布(二)

組限式分組該分組方式主要適用連續性變數和變異范圍較大間斷性變數1、求極差:R=最大值-最小值R=254-75=1792、確定組數和組距組數=1+3.3lg(n)組距=R/組數=179/12=14.9≈153、選定組中值和組限第一組組中值以靠近最小觀察值為宜第二組組中值=第一組組中值+組距下限=組中點值-組距/2上限=組中點值+組距/24、數據歸組140行水稻產量次數布表組限組中點值(y)次數(f)67.5-82.582.5-97.597.5-112.5112.5-127.5127.5-142.5142.5-157.5157.5-172.5172.5-187.5187.5-202.5202.5-217.5217.5-232.5232.5-247.5247.5-262.5累計759010512013515016518019521022524022527713172025211393211409/31第二節次數分布三、次數分布圖(一)

方柱形適用連續性變數資料10/31第二節次數分布(二)多邊形圖適用連續性變數資料11/31第二節次數分布(三)

條形圖適合用于變異范圍較小間斷性變數或質量性狀資料變異范圍較小間斷性變數資料質量性狀變數資料12/31第二節次數分布(四)

餅形圖

適合用于變異范圍較小間斷性變數質量性狀資料質量性狀變數資料間斷性變數資料13/31四

慣用統計表與統計圖(一)

統計表

1、統計表結構和要求統計表由標題、橫標目、縱標目、線條、數字及累計組成,其基本格式以下表:14/31

表號標題編制統計表總標準:結構簡單,層次分明,內容安排合理,重點突出,數據準確,便于了解和比較分析。15/31

統計表編制詳細要求以下:

標題標題要簡明扼要、準確地說明表內容,有時須注明時間、地點。

②標目標目分橫標目和縱標目兩項。橫標目列在表左側,用以表示被說明事物主要標志;縱標目列在表上端,說明橫標目各統計指標內容,并注明計算單位,如%、kg、cm等等。③數字一律用阿拉伯數字,數字以小數點對齊,小數位數一致,無數字用“─”表示,數字是“0”,則填寫“0”。

④線條表上下兩條邊線略粗,縱、橫標目間及累計用細線分開,表左右邊線可省去,表左上角普通不用斜線。

16/312、

統計表種類

統計表可依據縱、橫標目是否有分組分為簡單表和復合表兩類。①

簡單表由一組橫標目和一組縱標目組成,縱橫標目都未分組。這類表適于簡單資料統計,如表2-6。17/31

②復合表由兩組或兩組以上橫標目與一組縱標目結合而成,或由一組橫標目與兩組或兩組以上縱標目結合而成,或由兩組或兩組以上橫、縱標目結合而成。這類表適合用于復雜資料統計,如表2-11。表2-11幾個動物性食品營養成份18/31(二)

統計圖慣用統計圖有長條圖

(barchart)、園餅圖(piechart)、線圖(linearchart)、直方圖(histogram)和折線圖(broken-linechart)等。普通情況下,計量資料采取直方圖和折線圖,計數資料、質量性狀資料、半定量(等級)資料慣用長條圖、線圖或園餅圖。19/31

統計圖繪制基本要求

1、標題簡明扼要,列于圖下方。

2、縱、橫兩軸應有刻度,注明單位。

3、橫軸由左至右、縱軸由下而上,數值由小到大;圖形長寬百分比約5:4或6:5。

4、圖中需用不一樣顏色或線條代表不一樣處理、樣品等時,應有圖例說明。20/31第三節平均數一、平均數意義和種類一)平均數作用1、度量數據資料趨中性,衡量一組數據綜合水平2、能夠作為一組數據代表值與其它數據相比較二)平均數種類1、算術平均數:全部觀察值總和除以觀察值個數所得商。2、中數:將資料內所觀察值從小到大排序,居于中間位置觀察值。記作:Md3、眾數:資料中出現次數最多觀察值。記作:Mo4、幾何平均數:n個觀察值乘積n次方根。記作:G21/31第三節平均數二、算術平均數計算方法一)總體算術平均數二)樣本平均數1、普通計算方法2、加權計算方法三、算術平均數主要特征一)離均差之和等于零二)離均差之和最小注:a為不等于任一實數22/31

平均數是度量數據趨中性,是一組數據經典代表,不一樣數據資料整體水平怎樣,經常是用平均數去比較。但不一樣數據資料,其平均數代表性否一樣呢?例以下面兩組人:24歲26歲25歲25歲49歲1歲所以單用平均數還不足以很好地描述一組數據主要特征兩組人平均年紀都是25歲,你能說這兩人都是青年人嗎?第四節變異數平均數不足23/31一)極差(range):R=Max(y)-Min(y)上例中:第一組數據極差為:R1=26-24=2第二組數據極差為:R2=49-1=48

用極差度量數據資料變異大小不足:極差只考慮了數據中兩個極端值,沒有充分利用資料提供全部信息,而且極端值往往是數據中最不可靠觀察值,所以用極差來表示數據資料變異含有顯著不足,普通只在觀察值較少情況下使用。第四節變異數一、變異數作用及其與平均數關系1、變異數作用:變異數主要用來度量數據資料離中性2、變異數與平均數關系:對同一組資料來說,變異程度越小,平均數代表性越好;變異程度越大,平均數代表性越好二、變異數種類24/31為了處理資料中全部觀察值離均差正負抵消問題,采取先平方后再相加方法。數據資料變異取決于觀察值離散程度,這自然會聯想到全部觀察值離均差大小,假如把這些差值加在一起,數值大就說明這組數據離散程度大,聽起來似乎比較合理,不過我們由平均數第一個性質知道:用什么特征數來表示數據資料變異大小比較合理呢?第四節變異數離均差平方和:上例中:第一組數據平方和為:SS1=(24-25)2+(25-25)2+(26-25)2=2第二組數據平方和為:SS2=(1-25)2+(25-25)2+(49-25)2=1152

當兩組資料中觀察值數目不等時,用平方和來表示數據資料變異性是否有不足呢?比如現在有2個班,I班有22位同學,II班有30位同學,以身高作為考查指標,用SS來比較哪班同學身高離散程度大,若哪班同學身高離散程度大就發給哪班同學每人一張電影票。試問,是I班同學有意見還是II班同學有意見?這不公平,因為II班人數多。I班所以必需消除樣本容量對離均差平方和影響,這就需要引入另外一個特征數-方差25/31計算公式:樣本方差(samplevariance):注意:樣本方差不用n

來除,而用n-1來除,n-1稱為樣本方差自由度(degreeoffreedom,dforDFor

)二)方差總體方差(populationvariance):第四節變異數因為大多數情況下依據平均數第二個主要特征:所以用來預計老是偏小。而樣本方差是用于無偏預計總體方差,所以在計算樣本方差時用樣本SS除以n-1,來進行矯正。這在統計學上也得到了證實。那么為何是除以n-1,而不是除以n-2或n-3等其它數?df=n-k比如有這么一組數據:3,7,5,8,2其平均數等于5,那么這5個數中只4個數值能夠自由變動,若3變成4,7變成9,5變成7,8變成1,那么最終一個數只能是4不然平均數就不等于5了,這里限制條件只有一個,就是平均數。所以df=n-1=5-1=426/311、總體標準差(PopulationSD):2、樣本標準差(SampleSD):方差限制性:在計算SS時因為對離均差進行了平方,所以它單位是原來數據單位平方,在實踐上難以解釋,有沒有其它方法來填補方差在度量數據資料變異大小時存不足呢?三)標準差第四節變異數27/314、方差和標準差功效(1)方差和標準差值均大于零(2)資料中各觀察值都加上或減去一個常數,方差和標準差不變(3)資料中各觀察值都乘以或除以一個常數a,方差增加或降低a2倍,標準差增加或降低a倍3、方差和標準

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論