統計學 賈俊平 第4版 課后答案_第1頁
統計學 賈俊平 第4版 課后答案_第2頁
統計學 賈俊平 第4版 課后答案_第3頁
統計學 賈俊平 第4版 課后答案_第4頁
統計學 賈俊平 第4版 課后答案_第5頁
已閱讀5頁,還剩46頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

本文格式為Word版,下載可任意編輯——統計學賈俊平第4版課后答案

3.1為評價家電行業售后服務的質量,隨機抽取了由100個家庭構成的一個樣本。服務質量的等級分別表示為:A.好;B.較好;C一般;D.較差;E.差。調查結果如下:BDABCDBBAC

EADABAEADB

CCBCCCCCBC

CBCDEBCECE

ACCEDCAECD

DDAABDDAAB

CEEBCECBEC

BCDDCCBDDC

AECDBEADCB

EEBCCBECBC

要求:

(1)指出上面的數據屬于什么類型。順序數據

(2)用Excel制作一張頻數分布表。用數據分析——直方圖制作:

接收頻率

E16

D17

C32B21

A14

(3)繪制一張條形圖,反映評價等級的分布。用數據分析——直方圖制作:

直方圖40頻率200EDC接收BA頻率

(4)繪制評價等級的帕累托圖。

逆序排序后,制作累計頻數分布表:

接收頻數頻率(%)累計頻率(%)CBDEA

3221171614

3221171614

32537086100

35302520231050CDBAE120230806040200頻數累計頻率(%)

3.2某行業管理局所屬40個企業2023年的產品銷售收入數據如下/p>

12411910888

129114105123

116115110115

10087107119

103103137138

92118120112

95142136146

127135117113

104125108126

要求:

(1)根據上面的數據進行適當的分組,編制頻數分布表,并計算出累積頻數和累積頻率。1、確定組數:

lg?4?0lgn()1.60206?1??1??6.32k=6K?1?,取

lg(2)lg20.301032、確定組距:

組距=(最大值-最小值)÷組數=(152-87)÷6=10.83,取103、分組頻數表銷售收入80.00-89.0090.00-99.00100.00-109.00110.00-119.00120.00-129.00130.00-139.00140.00-149.00150.00+總和頻數頻率%累計頻數239127421405.07.522.530.017.510.05.02.5100.025142633373940累計頻率%5.012.535.065.082.592.597.5100.0

(2)按規定,銷售收入在125萬元以上為先進企業,115~125萬元為良好企業,105~115萬元為一般企業,105萬元以下為落后企業,按先進企業、良好企業、一般企業、落后企業進行分組。

先進企業良好企業一般企業落后企業總和頻數10129940頻率%25.030.022.522.5100.0累計頻數10223140累計頻率%25.055.077.5100.03.3某百貨公司連續40天的商品銷售額如下:

單位:萬元

41463542

25362836

29454637

47373437

38373049

34363739

30454442

38432632

43333836

40444435

要求:根據上面的數據進行適當的分組,編制頻數分布表,并繪制直方圖。1、確定組數:K?1?lg?4?0lgn()1.60206?1??1??6.32k=6,取

lg(2)lg20.301032、確定組距:

組距=(最大值-最小值)÷組數=(49-25)÷6=4,取53、分組頻數表銷售收入(萬元)

組距3,小于3020Frequency10Mean=5.22Std.Dev.=1.508N=10000246810組距3,小于

組距4,上限為小于等于

有效

2894366優良中及格不及格91815(2)比較兩個班考試成績分布的特點。

甲班成績中的人數較多,高分和低分人數比乙班多,乙班學習成績較甲班好,高分較多,而低分較少。

(3)畫出雷達圖,比較兩個班考試成績的分布是否相像。

不及格優20231050良人數甲班人數乙班及格中

分布不相像。

3.14已知1995—2023年我國的國內生產總值數據如下(按當年價格計算):

單位:億元國內生產總值年份第一產業其次產業第三產業

199519961997199819992000202320232023202358478.167884.674462.678345.282067.589468.197314.8105172.3117390.2136875.91199313844.214211.214552.414471.9614628.215411.816117.316928.120768.072853833613372233861940558449354875052980612747238717947204282302925174270382990533153360753918843721

要求:

(1)用Excel繪制國內生產總值的線圖。

國內生產總值160000140000120000100000800006000040000200000國內生產總值1995199619971998199920002023202320232023

(2)繪制第一、二、三產業國內生產總值的線圖。

80000700006000050000400003000020000100000第一產業其次產業第三產業1995199619971998199920002023202320232023

(3)根據2023年的國內生產總值及其構成數據繪制餅圖。

國內生產總值20768.07,15C721,32%第一產業其次產業第三產業72387,53%

第四章統計數據的概括性描述

4.1一家汽車零售店的10名銷售人員5月份銷售的汽車數量(單位:臺)排序后如下:

24710101012121415要求:

(1)計算汽車銷售量的眾數、中位數和平均數。(2)根據定義公式計算四分位數。(3)計算銷售量的標準差。

(4)說明汽車銷售量分布的特征。解:

Statistics

汽車銷售數量N

ValidMissing

MeanMedianModeStd.DeviationPercentiles

255075

1009.6010.00104.1696.2510.0012.50

Histogram32Frequency1Mean=9.6Std.Dev.=4.169N=1002.557.51012.515汽車銷售數量4.2隨機抽取25個網絡用戶,得到他們的年齡數據如下:單位:周歲

1923302341

1521202720

2938192231

2522193417

2418162423

要求;

(1)計算眾數、中位數:

1、排序形成單變量分值的頻數分布和累計頻數分布:

網絡用戶的年齡151617Valid18192021Frequency1111321Percent4.04.04.04.012.08.04.0CumulativeFrequency12347910CumulativePercent4.08.012.016.028.036.040.0

2223242527293031343841Total23211111111258.012.08.04.04.04.04.04.04.04.04.0100.0121517181920212223242548.060.068.072.076.080.084.088.092.096.0100.0從頻數看出,眾數Mo有兩個:19、23;從累計頻數看,中位數Me=23。(2)根據定義公式計算四分位數。

Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一個,因此Q3也可等于25+0.75×2=26.5。

(3)計算平均數和標準差;

Mean=24.00;Std.Deviation=6.652(4)計算偏態系數和峰態系數:Skewness=1.080;Kurtosis=0.773

(5)對網民年齡的分布特征進行綜合分析:

分布,均值=24、標準差=6.652、呈右偏分布。如需看明白分布形態,需要進行分組。為分組狀況下的直方圖:

32Count10151617181920232223242527293031343841網絡用戶的年齡

為分組狀況下的概率密度曲線:

3.02.5Count2.01.51.0151617181920232223242527293031343841網絡用戶的年齡分組:

1、確定組數:K?1?lg?2?5lgn()1.398?1??1??5.64k=6,取

lg(2)lg20.301032、確定組距:組距=(最大值-最小值)÷組數=(41-15)÷6=4.3,取5

3、分組頻數表

網絡用戶的年齡(Binned)

Histogram5040Frequency302023Mean=426.67Std.Dev.=116.484N=120230.00300.00400.00500.00600.00700.000企業利潤組中值Mi(萬元)4.7為研究少年兒童的成長發育狀況,某研究所的一位調查人員在某城市抽取100名7~17歲的少年兒童作為樣本,另一位調查人員則抽取了1000名7~17歲的少年兒童作為樣本。請回復下面的問題,并解釋其原因。

(1)兩位調查人員所得到的樣本的平均身高是否一致?假使不同,哪組樣本的平均身高較大?

(2)兩位調查人員所得到的樣本的標準差是否一致?假使不同,哪組樣本的標準差較大?(3)兩位調查人員得到這l100名少年兒童身高的最高者或最低者的機遇是否一致?假使不同,哪位調查研究人員的機遇較大?解:(1)不一定一致,無法判斷哪一個更高,但可以判斷,樣本量大的更接近于總體平均身

高。

(2)不一定一致,樣本量少的標準差大的可能性大。

(3)機遇不一致,樣本量大的得到最高者和最低者的身高的機遇大。

4.8一項關于大學生體重狀況的研究發現.男生的平均體重為60kg,標準差為5kg;女生

的平均體重為50kg,標準差為5kg。請回復下面的問題:(1)是男生的體重差異大還是女生的體重差異大?為什么?

女生,由于標準差一樣,而均值男生大,所以,離散系數是男生的小,離散程度是男生的小。

(2)以磅為單位(1ks=2.2lb),求體重的平均數和標準差。都是各乘以2.21,男生的平均體重為60kg×2.21=132.6磅,標準差為5kg×2.21=11.05

Casesweightedby企業個數

磅;女生的平均體重為50kg×2.21=110.5磅,標準差為5kg×2.21=11.05磅。

(3)粗略地估計一下,男生中有百分之幾的人體重在55kg一65kg之間?計算標準分數:

Z1=

x?x55?60x?x65?60==-1;Z2===1,根據經驗規則,男生大約有68%s5s5的人體重在55kg一65kg之間。

(4)粗略地估計一下,女生中有百分之幾的人體重在40kg~60kg之間?計算標準分數:

Z1=

x?x40?50x?x60?50==-2;Z2===2,根據經驗規則,女生大約有95%s5s5的人體重在40kg一60kg之間。

4.9一家公司在招收職員時,首先要通過兩項能力測試。在A項測試中,其平均分數是

100分,標準差是15分;在B項測試中,其平均分數是400分,標準差是50分。一位應試者在A項測試中得了115分,在B項測試中得了425分。與平均分數相比,該應試者哪一項測試更為理想?

解:應用標準分數來考慮問題,該應試者標準分數高的測試理想。

ZA=

x?x115?100x?x425?400==1;ZB===0.5s15s50因此,A項測試結果理想。

4.10一條產品生產線平均每天的產量為3700件,標準差為50件。假使某一天的產量低

于或高于平均產量,并落人士2個標準差的范圍之外,就認為該生產線“失去控制〞。下面是一周各天的產量,該生產線哪幾天失去了控制?時間產量(件)時間產量(件)日平均產量日產量標準差標準分數Z標準分數界限3-0.6-0.2-22-22-22周一周二周三周四周五周六周日38503670369037203610359037003700500.4-1.8-2.2-22-22-220-22周一周二周三周四周五周六周日3850367036903720361035903700周六超出界限,失去控制。

4.11對10名成年人和10名幼兒的身高進行抽樣調查,結果如下:成年組166169l72177180170172174168173幼兒組686968707l7372737475要求:

(1)假使比較成年組和幼兒組的身高差異,你會采用什么樣的統計量?為什么?均值不相等,用離散系數衡量身高差異。(2)比較分析哪一組的身高差異大?

成年組平均標準差離散系數172.1平均4.202351標準差0.024415離散系數幼兒組71.32.4966640.035016幼兒組的身高差異大。

4.12一種產品需要人工組裝,現有三種可供選擇的組裝方法。為檢驗哪種方法更好,隨

機抽取15個工人,讓他們分別用三種方法組裝。下面是15個工人分別用三種方法在一致的時間內組裝的產品數量:單位:個方法A164167168165170165164168164162163166167166165方法B129130129130131]30129127128128127128128125132方法C125126126127126128127126127127125126116126125

要求:

(1)你準備采用什么方法來評價組裝方法的優劣?

(2)假使讓你選擇一種方法,你會作出怎樣的選擇?試說明理由。解:對比均值和離散系數的方法,選擇均值大,離散程度小的。

方法A

方法B

方法C

165.6平均平均128.7333333平均125.53333332.1313979321.7511900722.774029217標準差標準差標準差

離散系數:VA=0.01287076,VB=0.013603237,VC=0.022097949

均值A方法最大,同時A的離散系數也最小,因此選擇A方法。

4.13在金融證券領域,一項投資的預期收益率的變化尋常用該項投資的風險來衡量。預

期收益率的變化越小,投資風險越低;預期收益率的變化越大,投資風險就越高。下面的兩個直方圖,分別反映了200種商業類股票和200種高科技類股票的收益率分布。在股票市場上,高收益率往往伴隨著高風險。但投資于哪類股票,往往與投資者的類

型有一定關系。

(1)你認為該用什么樣的統計量來反映投資的風險?標準差或者離散系數。

(2)假使選擇風險小的股票進行投資,應選中擇商業類股票還是高科技類股票?選擇離散系數小的股票,則選擇商業股票。

(3)假使進行股票投資,你會選擇商業類股票還是高科技類股票?考慮高收益,則選擇高科技股票;考慮風險,則選擇商業股票。

6.1調理一個裝瓶機使其對每個瓶子的灌裝量均值為?盎司,通過觀測這臺裝瓶機對每個瓶子的灌裝量聽從標準差??1.0盎司的正態分布。隨機抽取由這臺機器灌裝的9個瓶子形成一個樣本,并測定每個瓶子的灌裝量。試確定樣本均值偏離總體均值不超過0.3盎司的概率。

解:總體方差知道的狀況下,均值的抽樣分布聽從N標準化得到標準正態分布:z=為:

??,?n的正態分布,由正態分布,

2?x??~N?0,1?,因此,樣本均值不超過總體均值的概率P

?n?x????0.3x??0.3?0.3????P?x???0.3?=P??=P??

??n?n??19?n19?=P??0.9?z?0.9?=2??0.9?-1,查標準正態分布表得??0.9?=0.8159因此,Px???0.3=0.6318

6.3Z1,Z2,??,Z6表示從標準正態總體中隨機抽取的容量,n=6的一個樣本,試確定常數b,使得?62?P??Zi?b??0.95?i?1???解:由于卡方分布是由標準正態分布的平方和構成的:設Z1,Z2,……,Zn是來自總體N(0,1)的樣本,則統計量

22?2?Z12?Z2???Zn

聽從自由度為n的χ2分布,記為χ2~χ2(n)

?62?因此,令???Z,則???Z???6?,那么由概率P??Zi?b??0.95,可知:

i?1i?1?i?1?22i22i266b=?12?0.95?6?,查概率表得:b=12.59

6.4在習題6.1中,假定裝瓶機對瓶子的灌裝量聽從方差?2?1的標準正態分布。假定我們計劃隨機抽取10個瓶子組成樣本,觀測每個瓶子的灌裝量,得到10個觀測值,用這

1n2210個觀測值我們可以求出樣本方差S(S?(Yi?Y)2),確定一個適合的范圍使得有?n?1i?1較大的概率保證S2落入其中是有用的,試求b1,b2,使得p(b1?S2?b2)?0.90

解:更加樣本方差的抽樣分布知識可知,樣本統計量:

(n?1s)2?2~?2(n?1)此處,n=10,?2?1,所以統計量

(n?1)s2?2(10?1)s2??9s2~?2(n?1)

1根據卡方分布的可知:

P?b1?S2?b2??P?9b1?9S2?9b2??0.90

又由于:

2P??12??2?n?1??9S2???2?n?1???1??

因此:

2P?9b1?9S2?9b2??P??12??2?n?1??9S2???2?n?1???1???0.902?P?9b1?9S2?9b2??P??12??2?n?1??9S2???2?n?1??22?P??0.95?9??9S2??0.05?9???0.90

則:?9b1??20.95?9?,9b2???9??b1?20.052?0.95?9?9,b2?2?0.05?9?9

22查概率表:?0.95?9?=3.325,?0.05?9?=19.919,則

b1?2?0.95?9?9=0.369,b2?2?0.05?9?9=1.88

第四章抽樣分布與參數估計

7.2某快餐店想要估計每位顧客午餐的平均花費金額。在為期3周的時間里選取49名顧客

組成了一個簡單隨機樣本。

(1)假定總體標準差為15元,求樣本均值的抽樣標準誤差。

?x??n?15=2.14349(2)在95%的置信水平下,求邊際誤差。

?x?t??x,由于是大樣本抽樣,因此樣本均值聽從正態分布,因此概率度t=z?2因此,?x?t??x?z?2??x?z0.025??x=1.96×2.143=4.2(3)假使樣本均值為120元,求總體均值的95%的置信區間。置信區間為:

?x??x,x??x?=?120?4.2,120?4.2?=(115.8,124.2)

7.4從總體中抽取一個n=100的簡單隨機樣本,得到x=81,s=12。

要求:

??2??s2?大樣本,樣本均值聽從正態分布:x?N??,?或x?N??,?

n???n?置信區間為:?x?z?2???ss?s12,x?z?2?,==1.2?nn?n100(1)構建?的90%的置信區間。

z?2=z0.05=1.645,置信區間為:?81?1.645?1.2,81?1.645?1.2?=(79.03,82.97)

(2)構建?的95%的置信區間。

z?2=z0.025=1.96,置信區間為:?81?1.96?1.2,81?1.96?1.2?=(78.65,83.35)

(3)構建?的99%的置信區間。

z?2=z0.005=2.576,置信區間為:?81?2.576?1.2,81?2.576?1.2?=(77.91,84.09)

7.7某大學為了解學生每天上網的時間,在全校7500名學生中采取重復抽樣方法隨機抽取

36人,調查他們每天上網的時間,得到下面的數據(單位:小時):3.34.42.14.73.12.01.91.46.25.41.21.25.82.65.12.92.36.44.33.54.11.84.22.45.43.53.60.54.55.70.83.63.22.31.52.5求該校大學生平均上網時間的置信區間,置信水平分別為90%,95%和99%。解:

(1)樣本均值x=3.32,樣本標準差s=1.61;(2)抽樣平均誤差:重復抽樣:?x=?n?s=1.61/6=0.268n?sN?n1.617500?36N?n???=N?17500?1N?1n36不重復抽樣:?x=?n=0.268×0.995=0.268×0.998=0.267

(3)置信水平下的概率度:1??=0.9,t=z?2=z0.05=1.6451??=0.95,t=z?2=z0.025=1.961??=0.99,t=z?2=z0.005=2.576(4)邊際誤差(極限誤差):?x?t??x?z?2??x

1??=0.9,?x?t??x?z?2??x=z0.05??x

重復抽樣:?x?z?2??x=z0.05??x=1.645×0.268=0.441不重復抽樣:?x?z?2??x=z0.05??x=1.645×0.267=0.439

1??=0.95,?x?t??x?z?2??x=z0.025??x

重復抽樣:?x?z?2??x=z0.025??x=1.96×0.268=0.525不重復抽樣:?x?z?2??x=z0.025??x=1.96×0.267=0.523

1??=0.99,?x?t??x?z?2??x=z0.005??x

重復抽樣:?x?z?2??x=z0.005??x=2.576×0.268=0.69不重復抽樣:?x?z?2??x=z0.005??x=2.576×0.267=0.688

(5)置信區間:

?x??x,x??x?

1??=0.9,

重復抽樣:?x??x,x??x?=?3.32?0.441,3.32?0.441?=(2.88,3.76)

不重復抽樣:?x??x,x??x?=?3.32?0.439,3.32?0.439?=(2.88,3.76)

1??=0.95,

重復抽樣:?x??x,x??x?=?3.32?0.525,3.32?0.525?=(2.79,3.85)不重復抽樣:?x??x,x??x?=?3.32?0.441,3.32?0.441?=(2.80,3.84)

1??=0.99,

重復抽樣:?x??x,x??x?=?3.32?0.69,3.32?0.69?=(2.63,4.01)不重復抽樣:?x??x,x??x?=?3.32?0.688,3.32?0.688?=(2.63,4.01)

7.9某居民小區為研究職工上班從家里到單位的距離,抽取了由16個人組成的一個隨機樣

本,他們到單位的距離(單位:km)分別是:

103148691211751015916132

假定總體聽從正態分布,求職工上班從家里到單位平均距離的95%的置信區間。解:小樣本,總體方差未知,用t統計量

t?x???t?n?1?sn均值=9.375,樣本標準差s=4.11置信區間:

ss??x?tn?1?,x?tn?1??????2?2??

nn??1??=0.95,n=16,t?2?n?1?=t0.025?15?=2.13ss??x?tn?1?,x?tn?1????2??2???

nn??=?9.375?2.13???4.114.11?,9.375?2.13??=(7.18,11.57)1616?

7.11某企業生產的袋裝食品采用自動打包機包裝,每袋標準重量為l00g。現從某天生產

的一批產品中按重復抽樣隨機抽取50包進行檢查,測得每包重量(單位:g)如下:每包重量(g)96~9898~100100~102102~104104~106合計

包數23347450

已知食品包重量聽從正態分布,要求:

(1)確定該種食品平均重量的95%的置信區間。解:大樣本,總體方差未知,用z統計量

z?x???N?0,1?sn樣本均值=101.4,樣本標準差s=1.829置信區間:

ss??x?z?,x?z??2?2??

nn??1??=0.95,z?2=z0.025=1.96ss??x?z?,x?z??2?2??

nn??=?101.4?1.96???1.8291.829?,101.4?1.96??=(100.89,101.91)5050?(2)假使規定食品重量低于l00g屬于不合格,確定該批食品合格率的95%的置信區間。

解:總體比率的估計

大樣本,總體方差未知,用z統計量

z?p??p?1?p?n?N?0,1?

樣本比率=(50-5)/50=0.9置信區間:

?p?1?p?p?1?p???p?z?2??,p?z?2???nn??1??=0.95,z?2=z0.025=1.96

?p?1?p?p?1?p???p?z?2??,p?z?2???nn???0.9?1?0.9?0.9?1?0.9???=(0.8168,0.9832)=?0.9?1.96?,0.9?1.96???5050??

7.13一家研究機設想估計在網絡公司工作的員工每周加班的平均時間,為此隨機抽取了

18個員工。得到他們每周加班的時間數據如下(單位:小時):63

218171220117902182516152916

假定員工每周加班的時間聽從正態分布。估計網絡公司員工平均每周加班時間的90%的置信區間。

解:小樣本,總體方差未知,用t統計量

t?x???t?n?1?sn均值=13.56,樣本標準差s=7.801置信區間:

ss??x?tn?1?,x?tn?1????2??2???

nn??1??=0.90,n=18,t?2?n?1?=t0.05?17?=1.7369ss??x?tn?1?,x?tn?1??????2?2??

nn??=?13.56?1.7369???7.8017.801?,13.56?1.7369??=(10.36,16.75)1818?

7.15在一項家電市場調查中.隨機抽取了200個居民戶,調查他們是否擁有某一品牌的

電視機。其中擁有該品牌電視機的家庭占23%。求總體比例的置信區間,置信水平分別為90%和95%。

解:總體比率的估計

大樣本,總體方差未知,用z統計量

z?p??p?1?p?n?N?0,1?

樣本比率=0.23置信區間:

?p?1?p?p?1?p???p?z?2??,p?z?2???nn??1??=0.90,z?2=z0.025=1.645

?p?1?p?p?1?p???p?z?2??,p?z?2???nn???0.23?1?0.23?0.23?1?0.23???=?0.23?1.645?,0.23?1.645???202300??=(0.1811,0.2789)

1??=0.95,z?2=z0.025=1.96

?p?1?p?p?1?p???p?z?2??,p?z?2???nn???0.23?1?0.23?0.23?1?0.23???=(0.1717,=?0.23?1.96?,0.23?1.96???202300??0.2883)

7.20顧客到銀行辦理業務時往往需要等待一段時間,而等待時間的長短與大量因素有關,

譬如,銀行業務員辦理業務的速度,顧客等待排隊的方式等。為此,某銀行準備采取兩種排隊方式進行試驗,第一種排隊方式是:所有顧客都進入一個等待隊列;其次種排隊方式是:顧客在三個業務窗口處列隊三排等待。為比較哪種排隊方式使顧客等待的時間更短,銀行各隨機抽取10名顧客,他們在辦理業務時所等待的時間(單位:分鐘)如下:

方式1方式26.56.66.76.87.17.37.47.77.77.74.25.45.86.26.77.77.78.59.310要求:(1)構建第一種排隊方式等待時間標準差的95%的置信區間。解:估計統計量

?n?1?S2~?2n?1

??2?經計算得樣本標準差s2=3.318置信區間:

2?n?1?S2??2??n?1?S222??n?1?n?1????21??222221??=0.95,n=10,??2?n?1?=?0.025?9?=19.02,?1??2?n?1?=?0.975?9?=2.7

??n?1?S2n?1?S2??9?0.22729?0.2272??,=?,2???=(0.1075,0.7574)2????2.7??2?n?1??1??2?n?1???19.02因此,標準差的置信區間為(0.3279,0.8703)

(2)構建其次種排隊方式等待時間標準差的95%的置信區間。解:估計統計量

?n?1?S2~?2n?1

??2?經計算得樣本標準差s1=0.2272置信區間:

2?n?1?S2??2??n?1?S222??n?1?n?1??2?1??2?

2222n?1?9?n?1?==19.02,=1??=0.95,n=10,????????20.0251??20.975?9?=2.7

??n?1?S2n?1?S2??9?3.3189?3.318??=?,,2???=(1.57,11.06)2????2.7??2?n?1??1??2?n?1???19.02因此,標準差的置信區間為(1.25,3.33)

(3)根據(1)和(2)的結果,你認為哪種排隊方式更好?第一種方式好,標準差小!

7.23下表是由4對觀測值組成的隨機樣本。配對號1234來自總體A的樣本25108來自總體B的樣本0765(1)計算A與B各對觀測值之差,再利用得出的差值計算d和sd。d=1.75,sd=2.62996

(2)設?1和?2分別為總體A和總體B的均值,構造?d??1??2的95%的置信區間。解:小樣本,配對樣本,總體方差未知,用t統計量

td?d??d?t?n?1?

sdn均值=1.75,樣本標準差s=2.62996置信區間:

sdsd??d?tn?1?,d?tn?1??????2?2??

nn??1??=0.95,n=4,t?2?n?1?=t0.025?3?=3.182

sdsd??d?tn?1?,d?tn?1??????2?2??

nn??=?1.75?3.182???2.629962.62996?,1.75?3.182??=(-2.43,5.93)44?

7.25從兩個總體中各抽取一個n1?n2=250的獨立隨機樣本,來自總體1的樣本比例為p1=40%,來自總體2的樣本比例為p2=30%。要求:

(1)構造?1??2的90%的置信區間。(2)構造?1??2的95%的置信區間。解:總體比率差的估計

大樣本,總體方差未知,用z統計量

z?p1?p2???1??2?p1?1?p1?p2?1?p2??n1n2?N?0,1?

樣本比率p1=0.4,p2=0.3

置信區間:

?p1?1?p1?p2?1?p2??p1?p2?z?2??,p1?p2?z?2??nn12?

p1?1?p1?n1p2?1?p2?????n2?1??=0.90,z?2=z0.025=1.645

?p?1?p1?p2?1?p2??p1?p2?z?2?1?,p1?p2?z?2??nn12?

=

p1?1?p1?n1p2?1?p2?????n2??0.4?1?0.4?0.3?1?0.3?0.4?1?0.4?0.3?1?0.3???0.1?1.645???,0.1?1.645????250250250250??=(3.02%,16.98%)

1??=0.95,z?2=z0.025=1.96

?p?1?p1?p2?1?p2??p1?p2?z?2?1?,p1?p2?z?2??n1n2?

=

p1?1?p1?n1p2?1?p2?????n2??0.4?1?0.4?0.3?1?0.3?0.4?1?0.4?0.3?1?0.3???0.1?1.96???,0.1?1.96????250250250250??=(1.68%,18.32%)

7.26生產工序的方差是工序質量的一個重要度量。當方差較大時,需要對序進行改進以減

小方差。下面是兩部機器生產的袋茶重量(單位:g)的數據:

機器13.453.2

機器23.93.73.223.383.283.193.353.33.222.98

3.223.52.953.163.23.753.383.453.483.183.283.353.23.123.253.33.33.343.283.33.23.293.353.163.343.053.333.273.283.252要求:構造兩個總體方差比?12/?2的95%的置信區間。

解:統計量:

s122s2?12?22?F?n1?1,n2?1?

置信區間:

??s12s1222??s2s2,??

Fn?1,n?1Fn?1,n?1?1??2?1????2?122????2s12=0.058,s2=0.006

n1=n2=21

1??=0.95,F?2?n1?1,n2?1?=F0.025?20,20?=2.4645,

F1??2?n1?1,n2?1?=

1

F?2?n2?1,n1?1?F1??2?n1?1,n2?1?=F0.975?20,20?=

1=0.4058

F0.025?20,20???s12s1222??s2s2,??=(4.05,24.6)

?F?2?n1?1,n2?1?F1??2?n1?1,n2?1??????7.27根據以往的生產數據,某種產品的廢品率為2%。假使要求95%的置信區間,若要求邊際誤差不超過4%,應抽取多大的樣本?解:z?2??pp?1?p?n

n?2z??1?p?2?p??2p

1??=0.95,z?2=z0.025=1.96

22z?2?p??1?p?1.96?0.02?0.98n?==47.06,取n=48或者50。22?p0.04

7.28某超市想要估計每個顧客平均每次購物花費的金額。根據過去的經驗,標準差大約

為120元,現要求以95%的置信水平估計每個顧客平均購物金額的置信區間,并要求邊際誤差不超過20元,應抽取多少個顧客作為樣本?解:n?22z?2???2x,1??=0.95,z?2=z0.025=1.96,

n?

22z?2???2x1.962?1202?=138.3,取n=139或者140,或者150。

2027.29假定兩個總體的標準差分別為:?1?12,?2?15,若要求誤差范圍不超過5,相應

的置信水平為95%,假定n1?n2,估計兩個總體均值之差?1??2時所需的樣本量為多大?解:n1=n2=n?222z?2???1??2??2x1?x2,1??=0.95,z?2=z0.025=1.96,

n1=n2=n?

222z?2???1??2??2x1?x2=

1.962??122?152?52=56.7,取n=58,或者60。

7.30假定n1?n2,邊際誤差E=0.05,相應的置信水平為95%,估計兩個總體比例之

差?1??2時所需的樣本量為多大?

2z?p1?1?p1??p2?1?p2??2????,1??=0.95,z=z解:n1=n2=n??20.025=1.96,取

?2p1?p2p1=p2=0.5,

22221.96?0.5?0.5z??p1?p?p1?p????????=768.3,取n=769,2?1122?n1=n2=n?=

?20.052p1?p2或者780或800。

8.2一種元件,要求其使用壽命不得低于700小時。現從一批這種元件中隨機抽取36件,

測得其平均壽命為680小時。已知該元件壽命聽從正態分布,?=60小時,試在顯著性水平0.05下確定這批元件是否合格。解:H0:μ≥700;H1:μ<700

已知:x=680?=60

由于n=36>30,大樣本,因此檢驗統計量:

z?x??0sn=680?700=-2

6036當α=0.05,查表得z?=1.645。由于z<-z?,故拒絕原假設,接受備擇假設,說明這批產

品不合格。

8.4糖廠用自動打包機打包,每包標準重量是100千克。每天開工后需要檢驗一次打包機

工作是否正常。某日開工后測得9包重量(單位:千克)如下:

99.398.7100.5101.298.399.799.5102.1100.5

已知包重聽從正態分布,試檢驗該日打包機工作是否正常(a=0.05)?解:H0:μ=100;H1:μ≠100

經計算得:x=99.9778S=1.21221檢驗統計量:

t?x??0sn=99.9778?100=-0.055

1.2122192當α=0.05,自由度n-1=9時,查表得t??9?=2.262。由于t<t?2,樣本統計量落

在接受區域,故接受原假設,拒絕備擇假設,說明打包機工作正常。

8.5某種大量生產的袋裝食品,按規定不得少于250克。今從一批該食品中任意抽取50

袋,發現有6袋低于250克。若規定不符合標準的比例超過5%就不得出廠,問該批食品能否出廠(a=0.05)?解:解:H0:π≤0.05;H1:π>0.05

已知:p=6/50=0.12檢驗統計量:

Z?p??0?0?1??0?n=0.12?0.050.05??1?0.05?50=2.271

當α=0.05,查表得z?=1.645。由于z>z?,樣本統計量落在拒絕區域,故拒絕原假設,

接受備擇假設,說明該批食品不能出廠。

8.7某種電子元件的壽命x(單位:小時)聽從正態分布。現測得16只元件的壽命如下:159280101212224379179264222362168250149260485170

問是否有理由認為元件的平均壽命顯著地大于225小時(a=0.05)?解:H0:μ≤225;H1:μ>225

經計算知:x=241.5s=98.726檢驗統計量:

t?x??0sn=241.5?225=0.669

98.72616當α=0.05,自由度n-1=15時,查表得t??15?=1.753。由于t<t?,樣本統計量落在接

受區域,故接受原假設,拒絕備擇假設,說明元件壽命沒有顯著大于225小時。

8.10裝配一個部件時可以采用不同的方法,所關心的問題是哪一個方法的效率更高。勞

動效率可以用平均裝配時間反映。現從不同的裝配方法中各抽取12件產品,記錄各自的裝配時間(單位:分鐘)如下:

甲方法:313429323538343029323126乙方法:262428293029322631293228

兩總體為正態總體,且方差一致。問兩種方法的裝配時間有無顯著不同(a=0.05)?解:建立假設

H0:μ1-μ2=0H1:μ1-μ2≠0

總體正態,小樣本抽樣,方差未知,方差相等,檢驗統計量

t??x1?x2?sp11?n1n2

根據樣本數據計算,得n1=12,n2=12,x1=31.75,s1=3.19446,x2=28.6667,

s2=2.46183。

s2p2n1?1?s12??n1?1?s2??n1?n2?2

12?1??0.922162??12?1??0.710672?==8.1326

12?12?2t??x1?x2?sp11?n1n2=2.648

α=0.05時,臨界點為t?2?n1?n2?2?=t0.025?22?=2.074,此題中t>t?2,故拒絕

原假設,認為兩種方法的裝配時間有顯著差異。

8.11調查了339名50歲以上的人,其中205名吸煙者中有43個患慢性氣管炎,在134

名不吸煙者中有13人患慢性氣管炎。調查數據能否支持“吸煙者簡單患慢性氣管炎〞

這種觀點(a=0.05)?解:建立假設

H0:π1≤π2;H1:π1>π2

p1=43/205=0.2097n1=205p2=13/134=0.097n2=134檢驗統計量

z??p1?p2??dp1?1?p1?p2?1?p2??n1n2=?0.2098?0.097??00.2098?1?0.2098?0.097?1?0.097??205134

=3

當α=0.05,查表得z?=1.645。由于z>z?,拒絕原假設,說明吸煙者簡單患慢性氣管炎。8.12為了控制貸款規模,某商業銀行有個內部要求,平均每項貸款數額不能超過60萬元。

隨著經濟的發展,貸款規模有增大的趨勢。銀行經理想了解在同樣項目條件下,貸款的平均規模是否明顯地超過60萬元,故一個n=144的隨機樣本被抽出,測得x=68.1萬元,s=45。用a=0.01的顯著性水平,采用p值進行檢驗。解:H0:μ≤60;H1:μ>60

已知:x=68.1s=45

由于n=144>30,大樣本,因此檢驗統計量:

z?x??0sn=68.1?60=2.16

45144由于x>μ,因此P值=P(z≥2.16)=1-??2.16?,查表的??2.16?=0.9846,P值=0.0154由于P>α=0.01,故不能拒絕原假設,說明貸款的平均規模沒有明顯地超過60萬元。

8.13有一種理論認為服用阿司匹林有助于減少心臟病的發生,為了進行驗證,研究人員

把自愿參與試驗的22000人隨機平均分成兩組,一組人員每星期服用三次阿司匹林(樣本1),另一組人員在一致的時間服用安慰劑(樣本2)持續3年之后進行檢測,樣本1中有104人患心臟病,樣本2中有189人患心臟病。以a=0.05的顯著性水平檢驗服用阿司匹林是否可以降低心臟病發生率。解:建立假設

H0:π1≥π2;H1:π1<π2

p1=104/11000=0.00945n1=11000p2=189/11000=0.01718n2=11000檢驗統計量

z??p1?p2??dp1?1?p1?p2?1?p2??n1n2

=?0.00945?0.01718??00.00945?1?0.00945?0.01718?1?0.01718??1100011000=-5

當α=0.05,查表得z?=1.645。由于z<-z?,拒絕原假設,說明用阿司匹林可以降低心臟

病發生率。

8.15有人說在大學中男生的學習成績比女生的學習成績好。現從一個學校中隨機抽取了

25名男生和16名女生,對他們進行了同樣題目的測試。測試結果說明,男生的平均成績為82分,方差為56分,女生的平均成績為78分,方差為49分。假設顯著性水平α=0.02,從上述數據中能得到什么結論?解:首先進行方差是否相等的檢驗:

建立假設

H0:?1=?2;H1:?1≠?2n1=25,s1=56,n2=16,s2=49

222222s1256F?2==1.143

s249當α=0.02時,F?<F?22?24,15?=3.294,F1??2?24,15?=0.346。由于F1??2?24,15?<F

?24,15?,檢驗統計量的值落在接受域中,所以接受原假設,說明總體方差無顯

著差異。

檢驗均值差:建立假設

H0:μ1-μ2≤0H1:μ1-μ2>0

總體正態,小樣本抽樣,方差未知,方差相等,檢驗統計量

t??x1?x2?sp11?n1n2

根據樣本數據計算,得n1=25,n2=16,x1=82,s1=56,x2=78,s2=49

22s2p2n1?1?s12??n1?1?s2??n1?n2?2=53.308

t??x1?x2?sp11?n1n2=1.711

α=0.02時,臨界點為t??n1?n2?2?=t0.02?39?=2.125,t<t?,故不能拒絕原假設,不能

認為大學中男生的學習成績比女生的學習成績好。

10.3一家牛奶公司有4臺機器裝填牛奶,每桶的容量為4L。下面是從4臺機器中抽取的樣本數據:

機器l4.054.014.024.044.004.00機器23.994.024.013.994.00機器33.973.983.973.95機器44.004.023.994.0l取顯著性水平a=0.01,檢驗4臺機器的裝填量是否一致?解:

ANOVA

每桶容量(L)組間組內總數

平方和

0.0070.0040.011

df

31518

均方

0.0020.000

F

8.721

顯著性

0.001

不一致。

10.7某企業準備用三種方法組裝一種新的產品,為確定哪種方法每小時生產的產品數量最多,隨機抽取了30名工人,并指定每個人使用其中的一種方法。通過對每個工人生產的產品數進行方差分析得到下面的結果;方差分析表差異源組間組內總計SS42038364256df22729MS210—F1.47810219—P-value——Fcrit——0.2459463.354131142.0740741—要求:

(1)完成上面的方差分析表。

(2)若顯著性水平a=0.05,檢驗三種方法組裝的產品數量之間是否有顯著差異?解:(2)P=0.025>a=0.05,沒有顯著差異。

10.9有5種不同品種的種子和4種不同的施肥方案,在20塊同樣面積的土地上,分別采用5種種子和4種施肥方案搭配進行試驗,取得的收獲量數據如下表:12345品種施肥方案112.013.714.314.213.029.511.512.314.014.0310.412.411.412.513.149.79.611.112.011.4檢驗種子的不同品種對收獲量的影響是否有顯著差異?不同的施肥方案對收獲量的影響

是否有顯著差異(a=0.05)?

解:這線圖:均值收獲量15.00施肥方法施肥方法1施肥方法2施肥方法3施肥方法4似乎交互作用不明顯:

(1)考慮無交互作用下的方差分析:

主體間效應的檢驗

因變量:收獲量源校正模型截距

Fertilization_MethodsVariety誤差總計校正的總計

a.R方=.825(調整R方=.723)

結果說明施肥方法和品種都對收獲量有顯著影響。(2)考慮有交互作用下的方差分析:

主體間效應的檢驗

因變量:收獲量源校正模型截距

Fertilization_MethodsVariety

Fertilization_Methods*Variety

III型平方和

45.150(a)2,930.62118.18219.0677.901

df

1913412

均方

2.376.2,930.621.

6.061.4.767.0.658.

F

.....

Sig.

14.0013.0012.0011.0010.009.00品種1品種2品種3品種4品種5品種__

III型平方和

37.249(a)2,930.62118.18219.0677.9012,975.77045.150

df

7134122019

均方

5.3212,930.621

6.0614.7670.658

F8.0824,451.012

9.2057.240

Sig.

0.0010.0000.0020.003

誤差總計校正的總計

a.R方=1.000(調整R方=.)

0.0002,975.77045.150

0.2019

由于觀測數太少,得不到結果!

10.11一家超市連鎖店進行一項研究,確定超市所在的位置和競爭者的數量對銷售額是否有顯著影響。下面是獲得的月銷售額數據(單位:萬元)。超市位置位于市內居民小區位于寫字樓競爭者數量041304525312218位于郊區2933138313929353072172525948514448502928263個以h474039434253242732取顯著性水平a=0.01,檢驗:

(1)競爭者的數量對銷售額是否有顯著影響?

(2)超市的位置對銷售額是否有顯著影響?

(3)競爭者的數量和超市的位置對銷售額是否有交互影響?解:畫折線圖:

均值月銷售額萬元55.00超市位置位于市內居民小區位于寫字樓位于郊區交互作用不十明顯顯。

(1)進行無交互方差分析:

主體間效應的檢驗

因變量:月銷售額(萬元)源III型平方和df均方FSig.校正模型2814.556(a)5562.91115.2050.000截距44,802.778144,802.7781,210.1590.000Location_SuperMaket1,736.2222868.11123.4480.000Amount_competitors1,078.3333359.4449.7090.000誤差1,110.6673037.022總計48,728.00036校正的總計3,925.22235a.R方=.717(調整R方=.670)

看到超市位置有顯著影響,而競爭者數量沒有顯著影響,且影響強度僅為0.327,因此考慮是否存在交互作用。

(2)有交互方差分析:

看到超市位置有顯著影響,而競爭者數量和交互作用均無顯著影響。

主體間效應的檢驗

因變量:月銷售額(萬元)源校正模型III型平方和3317.889(a)df11均方301.626FSig.11.9190.00050.00()45.0040.0035.0030.0025.000個競爭者1個競爭者2個競爭者3個以上競爭者競爭者數量

截距44,802.778Location_SuperMaket1,736.222Amount_competitors1,078.333Location_SuperMaket*503.333Amount_competitors誤差607.333總計48,728.000校正的總計3,925.222a.R方=.845(調整R方=.774)

144,802.7781,770.4720.0002868.11134.3050.0003359.44414.2040.000683.8893.3150.0162425.3063635

11.5一家物流公司的管理人員想研究貨物的運輸距離和運輸時間的關系,為此,他抽出了公司最近10個卡車運貨記錄的隨機樣本,得到運輸距離(單位:km)和運輸時間(單位:天)的數據如下:

運輸距離x運輸時間y8252151070550480920135032567012153.51.04.02.01.03.04.51.53.05.0

要求:

(1)繪制運輸距離和運輸時間的散點圖,判斷二者之間的關系形態:(2)計算線性相關系數,說明兩個變量之間的關系強度。

(3)利用最小二乘法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論