統計學計算題復習課件_第1頁
統計學計算題復習課件_第2頁
統計學計算題復習課件_第3頁
統計學計算題復習課件_第4頁
統計學計算題復習課件_第5頁
已閱讀5頁,還剩159頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

眾數的確定(分組數據)眾數=25眾數的確定(分組數據)眾數=251眾數的確定(分組數據)組距頻數10–14515–19720–241225–291830–342235–391640–441045–498眾數為31.5Line1Line2Line3眾數的確定(分組數據)組距頻數10–14515–12眾數的確定(分組數據)L—眾數組的真實下限值d1—眾數組頻數-眾數組前一組頻數d2—眾數組頻數-眾數組后一組頻數i—每組數據的組距個數△眾數的確定(分組數據)△3中位數(位置的確定)奇數個數的數據:偶數個數的數據:中位數(位置的確定)奇數個數的數據:偶數個數的數據:4中位數的確定(分組數據)根據位置公式確定中位數所在的組采用下列近似公式計算:L–中位數組的真實組下限的值N–整組數據的總數量Sm-1–中位數組為止以上的累積頻數fm–中位數組的頻數i–組距的個數中位數的確定(分組數據)根據位置公式確定中位數所在的組5某車間50名工人月產量的資料如下:

月產量(件)工人人數(人)向上累計次數(人)200以下200~400400~600600以上373283104250合計50—某車間50名工人月產量的資料如下:

月產量(件)工人人數(人6簡單平均數(SimpleMean)設一組數據為:X1,X2,…,Xn

適用于總體資料未經分組整理、尚為原始資料的情況總體均值

樣本均值式中:,μ為均值;N(n)為總體(樣本)單位總數;Xi為第i個單位的變量值。簡單平均數(SimpleMean)設一組數據為:X1,7算術平均數的計算方法案例分析4.10某售貨小組5個人,某天的銷售額分別為520元、600元、480元、750元、440元,則平均每人日銷售額為:算術平均數的計算方法某售貨小組5個人,某天的銷售額分別為58加權平均數(WeightedMean)設一組數據為:

x1,x2,…,xn相應的頻數為:f1,f2,…,fk

適用于總體資料經過分組整理形成變量數列的情況總體均值

樣本均值(未分組)公式中:為均值;f為相應頻數;Xi為第i個單位的變量值。加權平均數(WeightedMean)設一組數據為:9加權平均數的計算方法

案例分析4.11某企業某日工人的日產量資料如下:日產量(件)工人人數(人)101112131470100380150100合計800

計算該企業該日全部工人的平均日產量。加權平均數的計算方法

案例分析4.11某企業某日工人的日產10加權平均數的計算方法

案例分析4.11若上述資料為分組數列,則應取各組的組中值作為該組的代表值用于計算;此時求得的算術平均數只是其真值的近似值。加權平均數的計算方法

案例分析4.1111簡單平均數與加權平均數

(SimpleMean/WeightedMean)設一組數據為:

x1,x2,…,xn各組的組中值為:M1,M2,…,Mk相應的頻數為:

f1,f2,…,fk簡單平均數加權平均數(分組數據)表示各組的變量值(分組數列的組中值);表示各組變量值出現的頻數(即權數)。簡單平均數與加權平均數

(SimpleMean/Wei12

例:根據某電腦公司在各市場上銷售量的分組數據,計算電腦銷售量的均值。

按銷售量分組(臺)組中值(Mi)市場個數(fi)Mifi

140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計—

∑fi=

120∑Mifi

=22200例:根據某電腦公司在各市場上銷售量的分組數據,計算電腦銷售13樣本方差和標準差

(SampleVarianceandStandardDeviation)未分組數據:組距分組數據:未分組數據:組距分組數據:方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差和標準差

(SampleVarianceand14樣本標準差

例題分析

4.18某電腦公司銷售量數據平均差計算表按銷售量分組組中值(Mi)頻數(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合計—120—55400樣本標準差例題分析4.18某電腦公司銷售量數據平均差計15樣本標準差例題分析

4.18

結論:每一天的銷售量與平均數相比,平均相差21.58臺樣本標準差例題分析4.1816練習題4.1某百貨公司6月份各天的銷售額數據如下(單位:萬元):(1)計算該百貨公司日銷售額的均值、中位數和四分位數;(2)計算日銷售額的標準差。

練習題4.1某百貨公司6月份各天的銷售額數據如下(單位:17解答4.1均值:中位數:位置為第15位和第16位四分位數:中位數位于第15個數靠上半位的位置上,所以前四分位數位于第1~第15個數據的中間位置(第8位)靠上四分之一的位置上后四分位數位于第16~第30個數據的中間位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273。標準差:21.17解答4.1均值:18練習題4.2在某地區抽取的120家企業按利潤額進行分組,結果如下:計算120家企業利潤額的均值和標準差。練習題4.2在某地區抽取的120家企業按利潤額進行分組,19解答4.2各組平均利潤為x,企業數為f,則組總利潤為xf,由于數據按組距式分組,須計算組中值作為各組平均利潤,列表計算得:均值:解答4.2各組平均利潤為x,企業數為f,則組總利潤為x20解答4.2標準差:解答4.221一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差22總體均值的區間估計

(大樣本n

30)假定條件總體服從正態分布,且方差(2)

已知如果不是正態分布,可由正態分布來近似(n

30)使用正態分布統計量z總體均值在1-置信水平下的置信區間為總體均值的區間估計

(大樣本n30)假定條件23總體均值的區間估計例題分析6.2一家食品生產企業以生產袋裝食品為主,為對食品質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10g。試估計該批產品平均重量的置信區間,置信水平為95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區間估計例題分析6.2一家食品生產企業以生產袋24總體均值的區間估計例題分析6.2解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:。由于是正態總體,且方差已知。總體均值在1-置信水平下的置信區間為因此:食品平均重量的置信區間為101.44g~109.28g總體均值的區間估計例題分析6.2解:已知X~N(,1025總體均值的區間估計例題分析6.3一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數據如下表。試建立投保人年齡90%的置信區間。36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區間估計例題分析6.3一家保險公司收集到由3626總體均值的區間估計例題分析6.3解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為因此:在置信水平為90%的情況下,投保人平均年齡的置信區間為37.37歲~41.63歲。總體均值的區間估計例題分析6.3解:已知n=36,1-27總體均值的區間估計(小樣本)假定條件總體服從正態分布,但方差(2)

未知小樣本(n<30)使用t分布統計量總體均值在1-置信水平下的置信區間為總體均值的區間估計(小樣本)假定條件28總體均值的區間估計例題分析6.4已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區間。16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470總體均值的區間估計例題分析6.4已知某種燈泡的壽命服從正29總體均值的區間估計例題分析6.4解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為:因此,該種燈泡平均使用壽命的置信區間為1476.8h~1503.2h總體均值的區間估計例題分析6.4解:已知X~N(,230總體比例的區間估計假定條件總體服從二項分布可以由正態分布來近似使用正態分布統計量z總體比例在1-置信水平下的置信區間為總體比例的區間估計假定條件31總體比例的區間估計例題分析6.5某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區間解:已知n=100,p=65%,1-=95%,z/2=1.96因此,該城市下崗職工中女性比例的置信區間為55.65%~74.35%

總體比例的區間估計例題分析6.5某城市想要估計下崗職工中32總體方差的區間估計估計一個總體的方差或標準差假設總體服從正態分布總體方差2的點估計量為s2,且總體方差在1-置信水平下的置信區間為4.總體方差的區間估計估計一個總體的方差或標準差4.33總體方差的區間估計例題分析6.6一家食品生產企業以生產袋裝食品為主,現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布。以95%的置信水平建立該種食品重量方差的置信區間。

25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體方差的區間估計例題分析6.6一家食品生產企業以生產袋34總體方差的區間估計例題分析6.6解:已知n=25,1-=95%,根據樣本數據計算得

s2=93.21

2置信度為95%的置信區間為因此,該企業生產的食品總體重量標準差的的置信區間為7.54g~13.43g總體方差的區間估計例題分析6.6解:已知n=25,1-35一個總體參數的區間估計(小結)待估參數均值比例方差大樣本小樣本大樣本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布一個總體參數的區間估計(小結)待估參數均值比例方差大樣本36練習題

6.1從一個標準差為5的總體中抽出一個容量為40的樣本,樣本均值為25。樣本均值的抽樣標準差等于多少?在95%的置信水平下,允許誤差是多少?練習題6.1從一個標準差為5的總體中抽出一個容量為40的樣37解答

6.1解答6.138練習題

6.2某快餐店想要估計每位顧客午餐的平均花費金額,在為期3周的時間里選取49名顧客組成了一個簡單隨機樣本。假定總體標準差為15元,求樣本均值的抽樣標準誤差;在95%的置信水平下,求允許誤差;如果樣本均值為120元,求總體均值95%的置信區間。練習題6.2某快餐店想要估計每位顧客午餐的平均花費金額,在39解答

6.2解答6.240練習題

6.3某居民小區為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣本,他們到單位的距離(公里)分別是:103148691211751015916132求職工上班從家里到單位平均距離95%的置信區間。練習題6.3某居民小區為研究職工上班從家里到單位的距離,抽41解答

6.3解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為:因此,職工上班從家里到單位平均距離的置信區間為7.153(公里)~11.597(公里).解答6.3解:已知X~N(,2),n=16,1-42練習題

6.4某居民小區共有居民500戶,小區管理者準備采取一項新的供水設施,想了解居民是否贊成。采取重復抽樣方法隨機抽取了50戶,其中有32戶贊成,18戶反對。(1)求總體中贊成該項改革的戶數比率的置信區間,置信水平為95%;(2)如果小區管理者預計贊成的比率能達到80%,應抽取多少戶進行調查?練習題6.4某居民小區共有居民500戶,小區管理者準備采取43解答

6.4解答6.444練習題

6.5根據以往的生產數據,某種產品的廢品率為2%。如果要求95%的置信區間,若要求允許誤差不超過4%,應抽取多大的樣本?練習題6.5根據以往的生產數據,某種產品的廢品率為2%。如45解答

6.5解答6.546檢驗2

已知均值的檢驗

例題分析7.1某機床廠加工一種零件,根據經驗知道,該廠加工零件的橢圓度近似服從正態分布,其總體均值為0=0.081mm,總體標準差為=0.025。今換一種新機床進行加工,抽取n=200個零件進行檢驗,得到的橢圓度為0.076mm。試問新機床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)雙側檢驗檢驗2已知均值的檢驗

例題分析7.1某機床廠加工一種472

已知均值的檢驗

(小樣本例題分析7.2)根據過去大量資料,某廠生產的燈泡的使用壽命服從正態分布N~(1020,1002)。現從最近生產的一批產品中隨機抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產品的使用壽命是否有顯著提高?(=0.05)單側檢驗2已知均值的檢驗

(小樣本例題分析7.2)根據過去大482

未知大樣本均值的檢驗

(例題分析7.3)某電子元件批量生產的質量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產的元件質量大大超過規定標準。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標準差300小時。能否說該廠生產的電子元件質量顯著地高于規定標準?(=0.05)單側檢驗2未知大樣本均值的檢驗

(例題分析7.3)某電子元件492

未知小樣本均值的檢驗

(例題分析7.4)某機器制造出的肥皂厚度為5cm,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標準差為0.3cm,試以0.05的顯著性水平檢驗機器性能良好的假設。雙側檢驗2未知小樣本均值的檢驗

(例題分析7.4)某機器制造502

未知小樣本均值的檢驗

(例題分析7.5)一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個由20個輪胎組成的隨機樣本作了試驗,測得平均值為41000公里,標準差為5000公里。已知輪胎壽命的公里數服從正態分布,我們能否根據這些數據作出結論,該制造商的產品同他所說的標準相符?(=0.05)單側檢驗!2未知小樣本均值的檢驗

(例題分析7.5)一個汽車51總體比例的檢驗

(例題分析7.6)一項統計結果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗該項統計是否可靠,隨機抽選了400名居民,發現其中有57人年齡在65歲以上。調查結果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側檢驗總體比例的檢驗

(例題分析7.6)一項統計結果聲稱,某市52方差的卡方(2)

檢驗

(例題分析7.7)某廠商生產出一種新型的飲料裝瓶機器,按設計要求,該機器裝一瓶一升(1000cm3)的飲料誤差上下不超過1cm3。如果達到設計要求,表明機器的穩定性非常好。現從該機器裝完的產品中隨機抽取25瓶,分別進行測定(用樣本減1000cm3),得到如下結果。檢驗該機器的性能是否達到設計要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1雙側檢驗方差的卡方(2)檢驗

(例題分析7.7)某廠商生產出53用置信區間進行檢驗

(例題分析7.8)

一種袋裝食品每包的標準重量應為1000克。現從生產的一批產品中隨機抽取16袋,測得其平均重量為991克。已知這種產品重量服從標準差為50克的正態分布。試確定這批產品的包裝重量是否合格?(=0.05)雙側檢驗!香脆蛋卷用置信區間進行檢驗

(例題分析7.8)一種袋542

已知均值的檢驗

例題分析7.1H0:=0.081H1:

0.081=0.05n=200臨界值(s):檢驗統計量:Z01.96-1.96.025拒絕H0拒絕H0.025決策:結論:

因為Z0.025=1.96,-2.83<-1.96在=0.05的水平上,拒絕H0有證據表明新機床加工的零件的橢圓度與以前有顯著差異。2已知均值的檢驗

例題分析7.1H0:=0.552

已知均值的檢驗

(小樣本例題分析7.2)H0:

1020H1:>1020=0.05n=16臨界值(s):檢驗統計量:

因為Z0.05=1.645,2.4>1.645在=0.05的水平上,拒絕H0有證據表明這批燈泡的使用壽命有顯著提高。決策:結論:Z0拒絕域0.051.6452已知均值的檢驗

(小樣本例題分析7.2)H0:562

未知大樣本均值的檢驗

(例題分析7.3)H0:1200H1:>1200=0.05n=100臨界值(s):檢驗統計量:因為Z0.05=1.645,1.5<1.645在=0.05的水平上,不拒絕H0不能認為該廠生產的元件壽命顯著地高于1200小時。決策:結論:Z0拒絕域0.051.6452未知大樣本均值的檢驗

(例題分析7.3)H0:572

未知小樣本均值的檢驗

(例題分析7.4)H0:=5H1:

5=0.05df=10-1=9臨界值(s):檢驗統計量:

因為t0.025=2.262,3.16>2.262在=0.05的水平上拒絕H0說明該機器的性能不好。

決策:結論:t02.262-2.262.025拒絕H0拒絕H0.0252未知小樣本均值的檢驗

(例題分析7.4)H0:58均值的單側t檢驗

(計算結果)

H0:

≤40000H1:

>40000=0.05df=20-1=19臨界值(s):檢驗統計量:因為t0.05=1.729,0.894<1.729在=0.05的水平上不拒絕H0不能認為制造商的產品同他所說的標準不相符。決策:

結論:

-1.7291t0拒絕域.05t0拒絕域0.051.729均值的單側t檢驗

(計算結果)H0:≤400059總體比例的檢驗

(例題分析7.6)H0:=14.7%H1:

14.7%=0.05n=400臨界值(s):檢驗統計量:因為Z0.025=1.96,-0.254>-1.96在=0.05的水平上不拒絕H0該市老年人口比重為14.7%.決策:結論:Z01.96-1.96.025拒絕H0拒絕H0.025總體比例的檢驗

(例題分析7.6)H0:=14.60方差的卡方(2)

檢驗

(例題分析7.7)H0:2=1H1:2

1=0.05df=25-1=24臨界值(s):統計量:

在=0.05的水平上不拒絕H0不能認為該機器的性能未達到設計要求

2039.3612.40/2=.05決策:結論:方差的卡方(2)檢驗

(例題分析7.7)H0:261用置信區間進行檢驗

(例題分析7.8)H0:

=1000H1:

1000=0.05n=16臨界值(s):置信區間為決策:結論:

假設的0=1000在置信區間內,不拒絕H0不能認為這批產品的包裝重量不合格。Z01.96-1.96.025拒絕H0拒絕H0.025用置信區間進行檢驗

(例題分析7.8)H0:=162練習題7.1液晶顯示屏批量生產的質量標準為平均使用壽命35000小時。某廠商宣稱其生產的液晶顯示屏的使用壽命遠遠超過規定標準。現從該廠商生產的一批液晶顯示屏中隨機抽取了100件樣本進行驗證,測得平均使用壽命為35250小時,標準差為1380小時,試在(=0.05)的顯著性水平下檢驗該廠商生產的液晶顯示屏是否顯著的高于規定標準?練習題7.1液晶顯示屏批量生產的質量標準為平均使用壽命363練習題7.2某制鹽企業用機器包裝食鹽,假設每袋食鹽的凈重量服從正態分布,每袋標準凈重量為500克。某天開工后,為檢驗機器工作是否正常,從包裝好的食鹽中隨機抽取了9袋,測得平均凈重量為499克,樣本標準差為16.03克,試在(=0.05)的顯著性水平下檢驗這天包裝機工作是否正常?練習題7.2某制鹽企業用機器包裝食鹽,假設每袋食鹽的凈重64練習題7.3

某公司計劃為每一位員工配股,董事會估計配股方案在全體員工內的支持率為80%。現隨機抽查100名員工,其中支持配股方案的有76人。試在(=0.05)的顯著性水平下檢驗董事會的估計是否可靠?練習題7.3某公司計劃為每一位員工配股,董事會估計配股65練習題7.4練習題7.466解答7.1解答7.167解答7.2解答7.268解答7.3解答7.369解答7.4解答7.470方差分析練習題8.1某企業準備用三種方法組裝一種新的產品,為確定哪種方法每小時生產的產品數量最多,隨機抽取了30名工人,并指定每個人使用其中的一種方法。通過對每個工人生產的產品數進行方差分析得到如下表:1)完成方差分析表2)若顯著性水平為=0.05,檢驗三種方法組裝的產品數量之間是否有顯著差異。方差分析練習題8.1某企業準備用三種方法組裝一種新的產品71練習題8.2從三個總體中各抽取容量不同的樣本數據,得到下表。檢驗3個總體的均值之間是否有顯著差異.(=0.01)練習題8.2從三個總體中各抽取容量不同的樣本數據,得到下72練習題8.3某家電制造公司準備購進一批5#電池,現有A,B,C三個電池生產企業愿意供貨,為此比較它們生產的電池質量,從每個企業各隨機抽取5只電池,經試驗得出其壽命(小時)數據如下表。試分析三個企業生產的電池的平均壽命之間有無差異。(=0.05)如果有差異,用LSD方法建議哪些企業之間有差異。練習題8.3某家電制造公司準備購進一批5#電池,現有A,73解答8.1F=1.478<F0.05(2,27)=3.354131所以不拒絕原假設,表明不認為三種方法組裝的產品之間有顯著差異。P值也可以直接用來進行統計決策,若P<,則拒絕原假設,P>,則不拒絕原假設。該題中P=0.245946>=0.05,因此不拒絕原假設H0。解答8.174解答8.2F=4.6574<F0.01(2,9)=8.0215所以不拒絕原假設,表明不認為三個總體均值之間有顯著差異。P值也可以直接用來進行統計決策,若P<,則拒絕原假設,P>,則不拒絕原假設。該題中P=0.040877>=0.01,因此不拒絕原假設H0。解答8.275解答8.3F=17.0684>F0.05(2,12)=3.88529所以拒絕原假設,表明三個三個企業生產電池的壽命之間有顯著差異。P值也可以直接用來進行統計決策,若P<,則拒絕原假設,P>,則不拒絕原假設。該題中P=0.00031<=0.05,因此不拒絕原假設H0。解答8.376解答8.3第1步:提出假設檢驗1:檢驗2:檢驗3:解答8.3第1步:提出假設77解答8.3第2步:計算檢驗統計量檢驗1:檢驗2:檢驗3:第3步:計算LSD檢驗1:檢驗2:檢驗3解答8.3第2步:計算檢驗統計量78解答8.3第4步:作出決策

A電池與B電池壽命有顯著差異

不認為A電池與C電池壽命有顯著差異B電池與C電池壽命有顯著差異解答8.3第4步:作出決策79回歸練習題9.1某汽車生產商欲了解廣告費用x對銷售量y的影響,收集了過去12年的有關數據。通過計算得到下面的有關結果:方差分析表變差來源dfSSMSFSignificanceF回歸2.17E-09殘差220158.07--------總計111642866.67------------回歸練習題9.1某汽車生產商欲了解廣告費用x對銷售量y的80解答9.1變差來源dfSSMSFSignificanceF回歸11422708.61422708.664.62212.17E-09殘差10220158.0722015.807總計111642866.67解:(2)

由此可知,銷售量與廣告費用之間的相關系數是0.93。解答9.1變差來源dfSSMSFSignificance81解答9.1(3)估計的回歸方程:

回歸系數表示廣告費用每增加一個單位,銷售量平均增加1.420211個單位。(4)F=64.6221>,所以這回歸方程是顯著的。解答9.1(3)估計的回歸方程:82眾數的確定(分組數據)眾數=25眾數的確定(分組數據)眾數=2583眾數的確定(分組數據)組距頻數10–14515–19720–241225–291830–342235–391640–441045–498眾數為31.5Line1Line2Line3眾數的確定(分組數據)組距頻數10–14515–184眾數的確定(分組數據)L—眾數組的真實下限值d1—眾數組頻數-眾數組前一組頻數d2—眾數組頻數-眾數組后一組頻數i—每組數據的組距個數△眾數的確定(分組數據)△85中位數(位置的確定)奇數個數的數據:偶數個數的數據:中位數(位置的確定)奇數個數的數據:偶數個數的數據:86中位數的確定(分組數據)根據位置公式確定中位數所在的組采用下列近似公式計算:L–中位數組的真實組下限的值N–整組數據的總數量Sm-1–中位數組為止以上的累積頻數fm–中位數組的頻數i–組距的個數中位數的確定(分組數據)根據位置公式確定中位數所在的組87某車間50名工人月產量的資料如下:

月產量(件)工人人數(人)向上累計次數(人)200以下200~400400~600600以上373283104250合計50—某車間50名工人月產量的資料如下:

月產量(件)工人人數(人88簡單平均數(SimpleMean)設一組數據為:X1,X2,…,Xn

適用于總體資料未經分組整理、尚為原始資料的情況總體均值

樣本均值式中:,μ為均值;N(n)為總體(樣本)單位總數;Xi為第i個單位的變量值。簡單平均數(SimpleMean)設一組數據為:X1,89算術平均數的計算方法案例分析4.10某售貨小組5個人,某天的銷售額分別為520元、600元、480元、750元、440元,則平均每人日銷售額為:算術平均數的計算方法某售貨小組5個人,某天的銷售額分別為590加權平均數(WeightedMean)設一組數據為:

x1,x2,…,xn相應的頻數為:f1,f2,…,fk

適用于總體資料經過分組整理形成變量數列的情況總體均值

樣本均值(未分組)公式中:為均值;f為相應頻數;Xi為第i個單位的變量值。加權平均數(WeightedMean)設一組數據為:91加權平均數的計算方法

案例分析4.11某企業某日工人的日產量資料如下:日產量(件)工人人數(人)101112131470100380150100合計800

計算該企業該日全部工人的平均日產量。加權平均數的計算方法

案例分析4.11某企業某日工人的日產92加權平均數的計算方法

案例分析4.11若上述資料為分組數列,則應取各組的組中值作為該組的代表值用于計算;此時求得的算術平均數只是其真值的近似值。加權平均數的計算方法

案例分析4.1193簡單平均數與加權平均數

(SimpleMean/WeightedMean)設一組數據為:

x1,x2,…,xn各組的組中值為:M1,M2,…,Mk相應的頻數為:

f1,f2,…,fk簡單平均數加權平均數(分組數據)表示各組的變量值(分組數列的組中值);表示各組變量值出現的頻數(即權數)。簡單平均數與加權平均數

(SimpleMean/Wei94

例:根據某電腦公司在各市場上銷售量的分組數據,計算電腦銷售量的均值。

按銷售量分組(臺)組中值(Mi)市場個數(fi)Mifi

140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計—

∑fi=

120∑Mifi

=22200例:根據某電腦公司在各市場上銷售量的分組數據,計算電腦銷售95樣本方差和標準差

(SampleVarianceandStandardDeviation)未分組數據:組距分組數據:未分組數據:組距分組數據:方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差和標準差

(SampleVarianceand96樣本標準差

例題分析

4.18某電腦公司銷售量數據平均差計算表按銷售量分組組中值(Mi)頻數(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845160090040010001004009001600250064008100640027000170040007200640012500合計—120—55400樣本標準差例題分析4.18某電腦公司銷售量數據平均差計97樣本標準差例題分析

4.18

結論:每一天的銷售量與平均數相比,平均相差21.58臺樣本標準差例題分析4.1898練習題4.1某百貨公司6月份各天的銷售額數據如下(單位:萬元):(1)計算該百貨公司日銷售額的均值、中位數和四分位數;(2)計算日銷售額的標準差。

練習題4.1某百貨公司6月份各天的銷售額數據如下(單位:99解答4.1均值:中位數:位置為第15位和第16位四分位數:中位數位于第15個數靠上半位的位置上,所以前四分位數位于第1~第15個數據的中間位置(第8位)靠上四分之一的位置上后四分位數位于第16~第30個數據的中間位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273。標準差:21.17解答4.1均值:100練習題4.2在某地區抽取的120家企業按利潤額進行分組,結果如下:計算120家企業利潤額的均值和標準差。練習題4.2在某地區抽取的120家企業按利潤額進行分組,101解答4.2各組平均利潤為x,企業數為f,則組總利潤為xf,由于數據按組距式分組,須計算組中值作為各組平均利潤,列表計算得:均值:解答4.2各組平均利潤為x,企業數為f,則組總利潤為x102解答4.2標準差:解答4.2103一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差一個總體參數的區間估計總體參數符號表示樣本統計量均值比例方差104總體均值的區間估計

(大樣本n

30)假定條件總體服從正態分布,且方差(2)

已知如果不是正態分布,可由正態分布來近似(n

30)使用正態分布統計量z總體均值在1-置信水平下的置信區間為總體均值的區間估計

(大樣本n30)假定條件105總體均值的區間估計例題分析6.2一家食品生產企業以生產袋裝食品為主,為對食品質量進行監測,企業質檢部門經常要進行抽檢,以分析每袋重量是否符合要求。現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布,且總體標準差為10g。試估計該批產品平均重量的置信區間,置信水平為95%。25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區間估計例題分析6.2一家食品生產企業以生產袋106總體均值的區間估計例題分析6.2解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據樣本數據計算得:。由于是正態總體,且方差已知。總體均值在1-置信水平下的置信區間為因此:食品平均重量的置信區間為101.44g~109.28g總體均值的區間估計例題分析6.2解:已知X~N(,10107總體均值的區間估計例題分析6.3一家保險公司收集到由36個投保人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數據如下表。試建立投保人年齡90%的置信區間。36個投保人年齡的數據233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區間估計例題分析6.3一家保險公司收集到由36108總體均值的區間估計例題分析6.3解:已知n=36,1-=90%,z/2=1.645。根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為因此:在置信水平為90%的情況下,投保人平均年齡的置信區間為37.37歲~41.63歲。總體均值的區間估計例題分析6.3解:已知n=36,1-109總體均值的區間估計(小樣本)假定條件總體服從正態分布,但方差(2)

未知小樣本(n<30)使用t分布統計量總體均值在1-置信水平下的置信區間為總體均值的區間估計(小樣本)假定條件110總體均值的區間估計例題分析6.4已知某種燈泡的壽命服從正態分布,現從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區間。16燈泡使用壽命的數據1510152014801500145014801510152014801490153015101460146014701470總體均值的區間估計例題分析6.4已知某種燈泡的壽命服從正111總體均值的區間估計例題分析6.4解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為:因此,該種燈泡平均使用壽命的置信區間為1476.8h~1503.2h總體均值的區間估計例題分析6.4解:已知X~N(,2112總體比例的區間估計假定條件總體服從二項分布可以由正態分布來近似使用正態分布統計量z總體比例在1-置信水平下的置信區間為總體比例的區間估計假定條件113總體比例的區間估計例題分析6.5某城市想要估計下崗職工中女性所占的比例,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區間解:已知n=100,p=65%,1-=95%,z/2=1.96因此,該城市下崗職工中女性比例的置信區間為55.65%~74.35%

總體比例的區間估計例題分析6.5某城市想要估計下崗職工中114總體方差的區間估計估計一個總體的方差或標準差假設總體服從正態分布總體方差2的點估計量為s2,且總體方差在1-置信水平下的置信區間為4.總體方差的區間估計估計一個總體的方差或標準差4.115總體方差的區間估計例題分析6.6一家食品生產企業以生產袋裝食品為主,現從某天生產的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產品重量的分布服從正態分布。以95%的置信水平建立該種食品重量方差的置信區間。

25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體方差的區間估計例題分析6.6一家食品生產企業以生產袋116總體方差的區間估計例題分析6.6解:已知n=25,1-=95%,根據樣本數據計算得

s2=93.21

2置信度為95%的置信區間為因此,該企業生產的食品總體重量標準差的的置信區間為7.54g~13.43g總體方差的區間估計例題分析6.6解:已知n=25,1-117一個總體參數的區間估計(小結)待估參數均值比例方差大樣本小樣本大樣本2分布2已知2已知Z分布2未知Z分布Z分布Z分布2未知t分布一個總體參數的區間估計(小結)待估參數均值比例方差大樣本118練習題

6.1從一個標準差為5的總體中抽出一個容量為40的樣本,樣本均值為25。樣本均值的抽樣標準差等于多少?在95%的置信水平下,允許誤差是多少?練習題6.1從一個標準差為5的總體中抽出一個容量為40的樣119解答

6.1解答6.1120練習題

6.2某快餐店想要估計每位顧客午餐的平均花費金額,在為期3周的時間里選取49名顧客組成了一個簡單隨機樣本。假定總體標準差為15元,求樣本均值的抽樣標準誤差;在95%的置信水平下,求允許誤差;如果樣本均值為120元,求總體均值95%的置信區間。練習題6.2某快餐店想要估計每位顧客午餐的平均花費金額,在121解答

6.2解答6.2122練習題

6.3某居民小區為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣本,他們到單位的距離(公里)分別是:103148691211751015916132求職工上班從家里到單位平均距離95%的置信區間。練習題6.3某居民小區為研究職工上班從家里到單位的距離,抽123解答

6.3解:已知X~N(,2),n=16,1-=95%,t/2=2.131根據樣本數據計算得:,

總體均值在1-置信水平下的置信區間為:因此,職工上班從家里到單位平均距離的置信區間為7.153(公里)~11.597(公里).解答6.3解:已知X~N(,2),n=16,1-124練習題

6.4某居民小區共有居民500戶,小區管理者準備采取一項新的供水設施,想了解居民是否贊成。采取重復抽樣方法隨機抽取了50戶,其中有32戶贊成,18戶反對。(1)求總體中贊成該項改革的戶數比率的置信區間,置信水平為95%;(2)如果小區管理者預計贊成的比率能達到80%,應抽取多少戶進行調查?練習題6.4某居民小區共有居民500戶,小區管理者準備采取125解答

6.4解答6.4126練習題

6.5根據以往的生產數據,某種產品的廢品率為2%。如果要求95%的置信區間,若要求允許誤差不超過4%,應抽取多大的樣本?練習題6.5根據以往的生產數據,某種產品的廢品率為2%。如127解答

6.5解答6.5128檢驗2

已知均值的檢驗

例題分析7.1某機床廠加工一種零件,根據經驗知道,該廠加工零件的橢圓度近似服從正態分布,其總體均值為0=0.081mm,總體標準差為=0.025。今換一種新機床進行加工,抽取n=200個零件進行檢驗,得到的橢圓度為0.076mm。試問新機床加工零件的橢圓度的均值與以前有無顯著差異?(=0.05)雙側檢驗檢驗2已知均值的檢驗

例題分析7.1某機床廠加工一種1292

已知均值的檢驗

(小樣本例題分析7.2)根據過去大量資料,某廠生產的燈泡的使用壽命服從正態分布N~(1020,1002)。現從最近生產的一批產品中隨機抽取16只,測得樣本平均壽命為1080小時。試在0.05的顯著性水平下判斷這批產品的使用壽命是否有顯著提高?(=0.05)單側檢驗2已知均值的檢驗

(小樣本例題分析7.2)根據過去大1302

未知大樣本均值的檢驗

(例題分析7.3)某電子元件批量生產的質量標準為平均使用壽命1200小時。某廠宣稱他們采用一種新工藝生產的元件質量大大超過規定標準。為了進行驗證,隨機抽取了100件作為樣本,測得平均使用壽命1245小時,標準差300小時。能否說該廠生產的電子元件質量顯著地高于規定標準?(=0.05)單側檢驗2未知大樣本均值的檢驗

(例題分析7.3)某電子元件1312

未知小樣本均值的檢驗

(例題分析7.4)某機器制造出的肥皂厚度為5cm,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標準差為0.3cm,試以0.05的顯著性水平檢驗機器性能良好的假設。雙側檢驗2未知小樣本均值的檢驗

(例題分析7.4)某機器制造1322

未知小樣本均值的檢驗

(例題分析7.5)一個汽車輪胎制造商聲稱,某一等級的輪胎的平均壽命在一定的汽車重量和正常行駛條件下大于40000公里,對一個由20個輪胎組成的隨機樣本作了試驗,測得平均值為41000公里,標準差為5000公里。已知輪胎壽命的公里數服從正態分布,我們能否根據這些數據作出結論,該制造商的產品同他所說的標準相符?(=0.05)單側檢驗!2未知小樣本均值的檢驗

(例題分析7.5)一個汽車133總體比例的檢驗

(例題分析7.6)一項統計結果聲稱,某市老年人口(年齡在65歲以上)的比重為14.7%,該市老年人口研究會為了檢驗該項統計是否可靠,隨機抽選了400名居民,發現其中有57人年齡在65歲以上。調查結果是否支持該市老年人口比重為14.7%的看法?(=0.05)雙側檢驗總體比例的檢驗

(例題分析7.6)一項統計結果聲稱,某市134方差的卡方(2)

檢驗

(例題分析7.7)某廠商生產出一種新型的飲料裝瓶機器,按設計要求,該機器裝一瓶一升(1000cm3)的飲料誤差上下不超過1cm3。如果達到設計要求,表明機器的穩定性非常好。現從該機器裝完的產品中隨機抽取25瓶,分別進行測定(用樣本減1000cm3),得到如下結果。檢驗該機器的性能是否達到設計要求(=0.05)0.3-0.4-0.71.4-0.6-0.3-1.50.6-0.91.3-1.30.71-0.50-0.60.7-1.5-0.2-1.9-0.51-0.2-0.61.1雙側檢驗方差的卡方(2)檢驗

(例題分析7.7)某廠商生產出135用置信區間進行檢驗

(例題分析7.8)

一種袋裝食品每包的標準重量應為1000克。現從生產的一批產品中隨機抽取16袋,測得其平均重量為991克。已知這種產品重量服從標準差為50克的正態分布。試確定這批產品的包裝重量是否合格?(=0.05)雙側檢驗!香脆蛋卷用置信區間進行檢驗

(例題分析7.8)一種袋1362

已知均值的檢驗

例題分析7.1H0:=0.081H1:

0.081=0.05n=200臨界值(s):檢驗統計量:Z01.96-1.96.025拒絕H0拒絕H0.025決策:結論:

因為Z0.025=1.96,-2.83<-1.96在=0.05的水平上,拒絕H0有證據表明新機床加工的零件的橢圓度與以前有顯著差異。2已知均值的檢驗

例題分析7.1H0:=0.1372

已知均值的檢驗

(小樣本例題分析7.2)H0:

1020H1:>1020=0.05n=16臨界值(s):檢驗統計量:

因為Z0.05=1.645,2.4>1.645在=0.05的水平上,拒絕H0有證據表明這批燈泡的使用壽命有顯著提高。決策:結論:Z0拒絕域0.051.6452已知均值的檢驗

(小樣本例題分析7.2)H0:1382

未知大樣本均值的檢驗

(例題分析7.3)H0:1200H1:>1200=0.05n=100臨界值(s):檢驗統計量:因為Z0.05=1.645,1.5<1.645在=0.05的水平上,不拒絕H0不能認為該廠生產的元件壽命顯著地高于1200小時。決策:結論:Z0拒絕域0.051.6452未知大樣本均值的檢驗

(例題分析7.3)H0:1392

未知小樣本均值的檢驗

(例題分析7.4)H0:=5H1:

5=0.05df=10-1=9臨界值(s):檢驗統計量:

因為t0.025=2.262,3.16>2.262在=0.05的水平上拒絕H0說明該機器的性能不好。

決策:結論:t02.262-2.262.025拒絕H0拒絕H0.0252未知小樣本均值的檢驗

(例題分析7.4)H0:140均值的單側t檢驗

(計算結果)

H0:

≤40000H1:

>40000=0.05df=20-1=19臨界值(s):檢驗統計量:因為t0.05=1.729,0.894<1.729在=0.05的水平上不拒絕H0不能認為制造商的產品同他所說的標準不相符。決策:

結論:

-1.7291t0拒絕域.05t0拒絕域0.051.729均值的單側t檢驗

(計算結果)H0:≤4000141總體比例的檢驗

(例題分析7.6)H0:=14.7%H1:

14.7%=0.05n=400臨界值(s):檢驗統計量:因為Z0.025=1.96,-0.254>-1.96在=0.05的水平上不拒絕H0該市老年人口比重為14.7%.決策:結論:Z01.96-1.96.025拒絕H0拒絕H0.025總體比例的檢驗

(例題分析7.6)H0:=14.142方差的卡方(2)

檢驗

(例題分析7.7)H0:2=1H1:2

1=0.05df=25-1=24臨界值(s):統計量:

在=0.05的水平上不拒絕H0不能認為該機器的性能未達到設計要求

2039.3612.40/2=.05決策:結論:方差的卡方(2)檢驗

(例題分析7.7)H0:2143用置信區間進行檢驗

(例題分析7.8)H0:

=1000H1:

1000=0.05n=16臨界值(s):置信區間為決策:結論:

假設的0=1000在置信區間內,不拒絕H0不能認為這批產品的包裝重量不合格。Z01.96-1.96.025拒絕H0拒絕H0.025用置信區間進行檢驗

(例題分析7.8)H0:=1144練習題7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論