高中數學第二章統計2.2用樣本估計總體_第1頁
高中數學第二章統計2.2用樣本估計總體_第2頁
高中數學第二章統計2.2用樣本估計總體_第3頁
高中數學第二章統計2.2用樣本估計總體_第4頁
高中數學第二章統計2.2用樣本估計總體_第5頁
已閱讀5頁,還剩40頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2.2用樣本預計總體(2)1/45畫頻率分布直方圖步驟:

第一步:求極差:(數據組中最大值與最小值差距)

第二步:決定組距與組數:(強調取整)

第三步:將數據分組

(給出組界限)

第四步:列頻率分布表.

(包含分組、頻數、頻率、頻率/組距)

第五步:畫頻率分布直方圖(在頻率分布表基礎上繪制,橫坐標為樣本數據尺寸,縱坐標為頻率/組距.)

組距:指每個小組兩個端點距離,組距組數:將數據分組,當數據在100個以內時,按數據多少常分5-12組。復習:繪制頻率分布直方圖有哪幾個步驟呢?

2/45在樣本頻率分布直方圖中,當樣本容量增加,作圖時所分組數增加,組距降低,對應頻率折線圖會越來越靠近于一條光滑曲線,統計中稱這條光滑曲線為總體密度曲線.它能夠準確地反應了總體在各個范圍內取值百分比,它能給我們提供愈加精細信息.總體密度曲線:月均用水量/t頻率組距0ab3/45莖葉圖作法:(1)將每個數據分為莖(高位)和葉(低位)兩部分,如本例中,用莖表示十位上數字,用葉表示個位上數字;(2)將最小莖和最大莖之間數按大小次序排成一列,寫在左(右)側;(3)將各個數據葉按大小次序寫在其莖右(左)側.甲 乙012345254511667949086438639831葉 莖葉4/45莖葉圖、頻率分布表與頻率分布直方圖比較(1)莖葉圖、頻率分布表與頻率分布直方圖都是用來描述樣本數據分布情況。(2)莖葉圖由全部樣本數據組成,沒有損失任何樣本信息;同時,莖葉圖中數據能夠隨時統計,隨時添加,方便統計與表示(這對于教練員發覺運動員現場狀態尤其有用).但當樣本數據較多時,枝葉就會很長,莖葉圖就顯得不太方便;(3)頻率分布表與頻率分布直方圖則損失了樣本一些信息,必須在完成抽樣后才能制作。5/45某校高一(1)班同學在老師布置下,用單擺進行測試,以檢驗重力加速度.全班同學兩人一組,在相同條件下進行測試,得到以下試驗數據(單位:m/s2):9.629.59.789.9410.019.669.889.6810.329.769.459.999.819.569.789.729.939.949.659.799.429.689.709.849.90怎樣用這些數據對重力加速度進行預計?問題引入:6/45知識新授:一、眾數、中位數、平均數概念普通地,n個數據按大小次序排列,處于最中間位置一個數據(或最中間兩個數據平均數)叫做這組數中位數(median).一組數據中出現次數最多那個數據叫做這組數眾數(mode).

算術平均數是指資料中各觀察值總和除以觀察值個數所得商,簡稱平均數或均數.

用這些特征數據對總體進行預計優缺點是什么?7/45平均數、中位數、眾數都是描述數據“集中趨勢”“特征數”,它們各自特點以下:用平均數作為一組數據代表,比較可靠和穩定,它與這組數據中每一個數都相關系.對這些數據所包含信息反應最為充分,因而應用最為廣泛,尤其是在進行統計推斷時有主要作用,但計算較繁瑣,而且易受極端數據影響.用眾數作為一組數據代表,可靠性較差,但眾數不受極端數據影響,而且求法簡便,當一組數據中個別數據變動較大時,適宜選擇眾數來表示這組數據“集中趨勢”.用中位數作為一組數據代表,可靠性也較差,但中位數也不受極端數據影響,也可選擇中位數來表示這組數據“集中趨勢”.8/45我們慣用算術平均數(其中ai(i=1,2,…,n)為n個試驗數據)作為重力加速度近似值,它依據是什么呢?任何一個樣本數據改變都會引發平均數改變.這是中位數、眾數都不具備性質,也正是這個原因,與眾數、中位數比較起來,平均數能夠反應出更多關于樣本數據全體信息.9/45

練習:在一次中學生田徑運動會上,參加男子跳高17名運動員成績以下表所表示:成績(單位:米)1.501.601.651.701.751.801.851.90人數23234111分別求這些運動員成績眾數,中位數與平均數10/45解:在17個數據中,1.75出現了4次,出現次數最多,即這組數據眾數是1.75.上面表里17個數據可看成是按從小到大次序排列,其中第9個數據1.70是最中間一個數據,即這組數據中位數是1.70;

這組數據平均數是

答:17名運動員成績眾數、中位數、平均數依次是1.75(米)、1.70(米)、1.69(米).用這些特征數據對總體進行預計優缺點是什么?11/45二、眾數、中位數、平均數與頻率分布直方圖關系

1、眾數在樣本數據頻率分布直方圖中,就是最高矩形中點橫坐標。比如,在上一節調查100位居民月均用水量問題中,從這些樣本數據頻率分布直方圖能夠看出,月均用水量眾數是2.25t.如圖所表示:12/453.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2100位居民月均用水量(單位:t)13/45頻率分布直方圖以下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.52.2514/45

2、在樣本中,有50%個體小于或等于中位數,也有50%個體大于或等于中位數.所以,在頻率分布直方圖中,中位數左邊和右邊直方圖面積應該相等,由此能夠預計中位數值。下列圖中虛線代表居民月均用水量中位數預計值,此數據值為2.03t.15/45頻率分布直方圖以下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.52.0316/45說明:2.03這個中位數預計值,與樣本中位數值2.0不一樣,這是因為樣本數據頻率分布直方圖,只是直觀地表明分布形狀,不過從直方圖本身得不出原始數據內容,所以由頻率分布直方圖得到中位數預計值往往與樣本實際中位數值不一致.17/45

3、平均數是頻率分布直方圖“重心”.是直方圖平衡點.n個樣本數據平均數公式:X=下列圖顯示了居民月均用水量平均數:x=1.97318/45頻率分布直方圖以下:月均用水量/t頻率組距0.100.200.300.400.500.511.522.533.544.51.97319/45三.

三種數字特征優缺點

1、眾數表達了樣本數據最大集中點,但它對其它數據信息忽略使得無法客觀地反應總體特征.如上例中眾數是2.25t,它告訴我們,月均用水量為2.25t居民數比月均用水量為其它數值居民數多,但它并沒有告訴我們多多少.20/45

2、中位數是樣本數據所占頻率等分線,它不受少數幾個極端值影響,這在一些情況下是優點,但它對極端值不敏感有時也會成為缺點。如上例中假設有某一用戶月均用水量為10t,那么它所占頻率為0.01,幾乎不影響中位數,但顯然這一極端值是不能忽略。21/45

3、因為平均數與每一個樣本數據相關,所以任何一個樣本數據改變都會引發平均數改變,這是眾數、中位數都不含有性質。也正因如此,與眾數、中位數比較起來,平均數能夠反應出更多關于樣本數據全體信息,但平均數受數據中極端值影響較大,使平均數在預計時可靠性降低。22/45四、眾數、中位數、平均數簡單應用例1某工廠人員及工資組成以下:人員經理管理人員高級技工工人學徒累計周工資2200250220200100人數16510123累計2200150011001006900(1)指出這個問題中周工資眾數、中位數、平均數(2)這個問題中,工資平均數能客觀地反應該廠工資水平嗎?為何?23/45(加權平均數)分析:眾數為200,中位數為220,平均數為300。因平均數為300,由表格中所列出數據可見,只有經理周工資在平均數以上,其余人都在平均數以下,故用平均數不能客觀真實地反應該工廠工資水平。24/45問題:有兩位射擊運動員在一次射擊測試中各射靶十次,每次命中環數以下:甲78795491074乙9578768677假如你是教練,你應該怎樣對這次射擊情況作出評價?假如這是一次選拔性考評,你應該怎樣作出選擇?

兩人射擊平均成績是一樣.那么兩個人水平就沒有什么差異嗎?25/4545678910環數頻率0.10.20.3(甲)456789100.10.20.30.4環數頻率(乙)發覺什么?為此,我們還需要從另外一個角度去考查這2組數據!26/45直觀上看,還是有差異.如:甲成績比較分散,乙成績相對集中(如圖示).所以,我們還需要從另外角度來考查這兩組數據.比如:在作統計圖表時提到過極差.甲環數極差=10-4=6乙環數極差=9-5=4.它們在一定程度上表明了樣本數據分散程度,與平均數一起,能夠給我們許多關于樣本數據信息.顯然,極差對極端值非常敏感,注意到這一點,我們能夠得到一個“去掉一個最高分,去掉一個最低分”統計策略.27/45四、標準差考查樣本數據分散程度大小,最慣用統計量是標準差.標準差是樣本平均數一個平均距離,普通用s表示.所謂“平均距離”,其含義可作以下了解:28/45方差、標準差是樣本數據到平均數一個平均距離。它用來描述樣本數據分散程度。在實際應用中,標準差常被了解為穩定性。1、方差(標準差平方)公式為:假設樣本數據是平均數是2、標準差公式為:在刻畫樣本數據分散程度上,二者是一致!29/45標準差方差、標準差是樣本數據到平均數一個平均距離。它用來描述樣本數據離散程度。在實際應用中,標準差常被了解為穩定性。規律:標準差越大,則a越大,數據離散程度越大;反之,數據離散程度越小。30/45例2.已知有一個樣本數據為1,2,3,4,5,求平均數,方差,標準差.31/45例3甲乙兩人同時生產內徑為25.40mm一個零件.為了對兩人生產質量進行評選,從他們生產零件中各抽出20件,量得其內徑尺寸以下(單位:mm)甲25.46,25.32,25.45,25.39,25.3625.34,25.42,25.45,25.38,25.4225.39,25.43,25.39,25.40,25.4425.40,25.42,25.35,25.41,25.39乙25.40,25.43,25.44,25.48,25.4825.47,25.49,25.49,25.36,25.3425.33,25.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論