




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第8章參數(shù)估計PowerPoint統(tǒng)計學(xué)2/5/20231第8章參數(shù)估計一、參數(shù)估計概述二、參數(shù)估計的基本方法三、總體參數(shù)的區(qū)間估計四、樣本容量的確定五、Excel在參數(shù)估計中的應(yīng)用2/5/20232本章學(xué)習(xí)目標(biāo)1.了解參數(shù)估計的概念與特點。2.掌握參數(shù)估計的方法。3.重點掌握總體均值及總體比例的區(qū)間估計方法。4.掌握樣本容量的確定方法。2/5/20233一、參數(shù)估計概述(一)參數(shù)估計的意義(二)抽樣誤差的測定2/5/20234(一)參數(shù)估計的意義也叫抽樣估計,就是根據(jù)樣本統(tǒng)計量去估計總體參數(shù)。
參數(shù)估計估計量:用于估計總體參數(shù)的隨機變量。如樣本均值,樣本比例、樣本方差等例如:樣本均值就是總體均值的一個估計量估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體數(shù)值。即估計量的具體數(shù)值。如果樣本均值x
=80,則估計量樣本均值的估計值為80。2/5/20235總體樣本樣本均值統(tǒng)計量參數(shù)是唯一的,但估計量(統(tǒng)計量)是隨機變量,取值是不確定的。同一個參數(shù)可以有多個不同的估計值。
參數(shù)2/5/20236特點1、以隨機抽樣為前提2、以概率估計推斷總體參數(shù)3、存在抽樣誤差,但可以計算和控制2/5/20237作用1、用于不可能或不必要進行全面調(diào)查的總體數(shù)量特征的估計
2、用于全面調(diào)查資料的評價和驗證
3、用于生產(chǎn)過程的質(zhì)量控制2/5/20238(二)抽樣誤差的測定
是指樣本統(tǒng)計量與總體參數(shù)之差。主要包括樣本均值與總體均值之間的抽樣誤差,樣本比例與總體比例之間的抽樣誤差。抽樣誤差抽樣誤差實際抽樣誤差——無法一一計算抽樣平均誤差——可以計算
抽樣極限誤差——可以控制2/5/20239實際抽樣誤差樣本估計值與總體參數(shù)真實值之間的離差稱為實際抽樣誤差。由于在實踐中總體參數(shù)的真實值是未知的,因此實際抽樣誤差是不可知的。由于樣本估計值隨樣本而變化,因此實際抽樣誤差是一個隨機變量。2/5/202310抽樣平均誤差樣本均值的標(biāo)準(zhǔn)差,又稱抽樣標(biāo)準(zhǔn)誤差,簡稱標(biāo)準(zhǔn)誤。用來反映樣本均值(或比例)與總體均值(比例)的平均差異程度。
抽樣平均誤差可衡量樣本對總體的代表性大小根據(jù)定義公式無法計算抽樣平均誤差2/5/202311抽樣方法樣本均值的抽樣平均誤差樣本比例的抽樣平均誤差重置抽樣不重置抽樣數(shù)理統(tǒng)計證明,隨機抽樣的抽樣平均誤差可以使用以下公式計算。由上面的公式可知影響抽樣誤差的因素包括:總體標(biāo)志值的差異程度;樣本容量的大小;抽樣方法以及抽樣的組織形式。2/5/202312應(yīng)用上述公式,需要注意以下二點:1、當(dāng)N很大時,。若
一般可忽略有限總體的修正系數(shù)2、由于總體方差通常是未知的,一般可用樣本方差代替。如果樣本方差未知,可用用過去同類現(xiàn)象的全面調(diào)查或抽樣調(diào)查的歷史方差資料或?qū)嶒炐哉{(diào)查估計方差替代。若可用的方差資料有多個,應(yīng)選擇方差值最大的。2/5/202313【例】企業(yè)生產(chǎn)某產(chǎn)品1000袋,為檢驗其包裝重量情況,檢驗員甲按簡單隨機重復(fù)抽樣方法,抽取200袋,檢驗乙按不重復(fù)抽樣方法抽取100袋,樣本標(biāo)準(zhǔn)差均為2克,試求兩種不同抽樣方法下平均包裝重量的抽樣平均誤差。解:1)重復(fù)抽樣時抽樣平均誤差2)不重復(fù)抽樣時抽樣平均誤差2/5/202314【例】機械廠生產(chǎn)一批零件100000件,現(xiàn)抽取300件進行檢驗,發(fā)現(xiàn)有9件不合格,試求合格率的抽樣平均誤差。解:1)重復(fù)抽樣下合格率的抽樣平均誤差2)不重復(fù)抽樣下合格率的抽樣平均誤差2/5/202315抽樣極限誤差抽樣極限誤差,也稱抽樣允許誤差、抽樣邊際誤差。它是指在一定概率下,樣本統(tǒng)計量偏離總體參數(shù)的最大可能范圍。通常用“△”表示。最大允許誤差是人為確定的,是調(diào)查者在相應(yīng)的置信度下可以容忍的誤差水平。抽樣的極限誤差通常需要以抽樣的平均誤差為標(biāo)準(zhǔn)單位來衡量,并且把抽樣極限誤差除以抽樣平均誤差所得的數(shù)值叫做概率度,以測量估計的可靠程度。2/5/202316若以z表示概率度,則有:
或
常用的概率度與概率對照表概率度z11.651.9622.583置信概率φ(z)0.68270.90000.95000.95450.990.99732/5/202317二、參數(shù)估計的基本方法估計方法點估計區(qū)間估計2/5/202318點估計以樣本估計量的實際值直接作為相應(yīng)總體參數(shù)的估計值。簡單,具體明確優(yōu)點缺點無法控制誤差,僅適用于對推斷的準(zhǔn)確程度與可靠程度要求不高的情況(一)點估計2/5/202319的抽樣分布點估計的最大好處:給出確定的值點估計的最大問題:無法控制誤差2/5/202320點估計的評價標(biāo)準(zhǔn)點估計的評價標(biāo)準(zhǔn)無偏性有效性一致性2/5/202321無偏性:樣本估計量的數(shù)學(xué)期望應(yīng)等于被估計總體未知參數(shù)的真值。P(
)BA無偏有偏無偏性2/5/202322學(xué)生ABCD成績60708090均值=75方差2=125從中按重復(fù)抽樣方式抽取2人,計算樣本的均值及方差S2
。方差的抽樣分布A60B70C80D90A60606060006070652550608070100200609075225450B707060652550707070007080752550709080100200C808060701002008070752550808080008090852550D909060752254509070801002009080852550909090002/5/202323有偏無偏2/5/202324有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標(biāo)準(zhǔn)差的估計量更有效。AB的抽樣分布的抽樣分布P(
)有效性2/5/202325學(xué)生ABCDEFG成績30405060708090按隨機原則抽選出4名學(xué)生,并計算平均分?jǐn)?shù)和中位分?jǐn)?shù)。樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211樣本中位數(shù)45505560657075出現(xiàn)次數(shù)
43858342/5/202326中位數(shù)的抽樣分布平均數(shù)的抽樣分布2/5/202327一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(
)一致性2/5/202328為的無偏、有效、一致估計量;為的無偏、有效、一致估計量;為的無偏、有效、一致估計量。結(jié)論:2/5/202329根據(jù)樣本估計量以一定的可靠程度推斷總體參數(shù)所在的區(qū)間范圍。在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限(二)區(qū)間估計區(qū)間估計2/5/2023302/5/202331置信區(qū)間由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間。該區(qū)間的兩個端點,分別稱為置信區(qū)間的置信下限和置信上限。統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間。用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個2/5/202332置信區(qū)間(95%的置信區(qū)間)重復(fù)構(gòu)造出的20個置信區(qū)間點估計值2/5/202333將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比例常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平
2/5/202334區(qū)間估計優(yōu)良性評價的基本要求
均值的抽樣分布(1-)區(qū)間包含了
的區(qū)間未包含1-aa/2a/21.置信度高2.精確度高在保證置信度的前提下,盡可能提高精確度。
2/5/202335區(qū)間估計的一般步驟
抽取樣本,計算估計值計算抽樣平均誤差根據(jù)所要求的置信水平與樣本統(tǒng)計量的分布形式,計算極限誤差對總體參數(shù)作出區(qū)間推斷
2/5/202336三、總體參數(shù)的區(qū)間估計
(一)總體均值的區(qū)間估計(二)總體比例的區(qū)間估計2/5/202337(一)總體均值的區(qū)間估計
(以樣本均值服從正態(tài)分布為例)95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x2/5/202338總體方差已知時總體均值的估計1. 假定條件總體服從正態(tài)分布如果是非正態(tài)分布,但n
30樣本均值服從正態(tài)分布,如重復(fù)抽樣條件下,總體均值在1-置信水平下的置信區(qū)間為抽樣極限誤差樣本均值的標(biāo)準(zhǔn)誤差2/5/202339【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.32/5/202340解:已知X~N(,102),n=25,1-=95%,z/2=1.96。
即:該食品平均重量的置信區(qū)間在101.44—109.28克之間。2/5/202341【例】某企業(yè)生產(chǎn)的燈泡,根據(jù)其積累的歷史資料,燈泡使用壽命的方差為625小時2。該企業(yè)某一天生產(chǎn)燈泡18000只,從中以簡單隨機抽樣方式抽取60只檢測,其平均壽命為2000小時。試以95%的置信度估計該天生產(chǎn)的全部燈泡的平均壽命范圍。
分析:在總體方差已知的情況下,雖然不知道燈泡壽命是否服從正態(tài)分布,但由于抽取的樣本容量為60,是一個大樣本,根據(jù)中心極限定理,樣本均值近似服從正態(tài)分布,即
2/5/202342解:即可以用95%的概率保證該天生產(chǎn)燈泡的平均壽命介于1993.685~2006.315小時之間。2/5/202343總體方差未知時總體均值的估計1. 假定條件總體服從正態(tài)分布如果是非正態(tài)分布,但n
30樣本均值服從t分布,如:重復(fù)抽樣條件下,總體均值在1-置信水平下的置信區(qū)間為抽樣極限誤差樣本均值的標(biāo)準(zhǔn)誤差2/5/202344【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)15101520148015001450148015101520148014901530151014601460147014702/5/202345解:已知X服從N(,2),n=16,1-=95%,t/2=2.131。根據(jù)樣本數(shù)據(jù)計算得:
總體均值在1-置信水平下的置信區(qū)間為即:該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時2/5/202346【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間36個投保人年齡的數(shù)據(jù)2335392736443642464331334253455447243428393644403949383448503439454845322/5/202347解:已知n=36,1-=90%,t/2=1.69。根據(jù)樣本數(shù)據(jù)計算得:
總體均值在1-置信水平下的置信區(qū)間為即:投保人平均年齡的置信區(qū)間為37.31歲~41.69歲注意:當(dāng)樣本容量足夠大、總體方差未知而用樣本方差代替時,由樣本均值所構(gòu)造的t統(tǒng)計量非常接近標(biāo)準(zhǔn)正態(tài)分布的z統(tǒng)計量,即臨界值也可以通過查標(biāo)準(zhǔn)正態(tài)分布表得到其近似值。2/5/202348思考:某工廠有1500個工人,用重復(fù)抽樣的方法抽取50個工人作為樣本,調(diào)查其工資水平如下表:要求:(1)計算樣本的平均工資和標(biāo)準(zhǔn)差。(2)以95.45%的保證概率估計該工廠平均工資和工資總額的區(qū)間。工資水平(元)11241134114011501160118012001260工人數(shù)(人)4691086432/5/202349總體均值區(qū)間估計小結(jié)總體分布樣本容量正態(tài)總體大樣本小樣本非正態(tài)總體大樣本小樣本——2/5/202350(二)總體比例的區(qū)間估計假定條件總體服從二項分布是非標(biāo)志的總體方差已知樣本容量n>30,而且和都大于5
樣本比例可以由正態(tài)分布來近似總體比例在1-置信水平下的置信區(qū)間為2/5/202351但在實際工作中,往往是未知的,需要用樣本比例來代替。在置信度下,總體比例的置信區(qū)間為:2/5/202352【例】某高校有教職工1000人,按隨機原則以不重復(fù)抽樣方式抽取201名教職工進行調(diào)查,其中表示支持某候選人的有110人,試以95%的置信標(biāo)準(zhǔn)估計該候選人的全校支持率。解:已知N=1000,n=201,
p=110/201=54.73%,1-=95%查表得z/2=1.96即:以95%的置信度估計該候選人的全校支持率介于48.21%~60.53%之間。2/5/202353【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96即:該城市下崗職工中女性比例的置信區(qū)間為55.65%-74.35%2/5/2023541995.4.10《今日美國》對369名有工作的父母的一項調(diào)查表明,他們當(dāng)中有200名承認(rèn)由于工作有約而使得與其子女相處時間過少。A.求總體中由于工作有約而使得與其子女相處時間過少父母所占的比率的點估計。B.當(dāng)置信水平為95%時,邊際誤差為多大?C.求總體中由于工作有約而使得與其子女相處時間過少父母所占比率的95%置信區(qū)間估計。2/5/202355樣本容量調(diào)查誤差調(diào)查費用小樣本容量節(jié)省費用但調(diào)查誤差大大樣本容量調(diào)查精度高但費用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量找出在限定費用范圍內(nèi)的最大樣本容量確定樣本容量的必要性四、樣本容量的確定
2/5/202356總體方差;置信度(概率保證程度);估計的精度,即允許誤差(邊際誤差)的大小;抽樣方法;抽樣的組織方式。調(diào)查費用影響樣本容量的因素
2/5/202357確定方法1.重復(fù)抽樣條件下:通常的做法是先確定置信水平,查找相應(yīng)的臨界值z,然后限定邊際誤差。
①2未知時,一般采用過去的經(jīng)驗數(shù)據(jù);②如果經(jīng)驗數(shù)據(jù)未知,則應(yīng)考慮s2代替2來計算。但s2通常也是個未知數(shù),解決方法有:第一,利用歷史的樣本資料進行計算;第二,利用同類型的調(diào)查資料計算求得;第三,組織試驗性調(diào)查取得數(shù)據(jù);第四,若有多個不同的值,則取其最大值。計算結(jié)果通常向上進位估計總體均值時樣本容量的確定
2/5/2023582.不重復(fù)抽樣條件下:確定方法2/5/202359【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望邊際誤差為400元,應(yīng)抽取多大的樣本容量?2/5/202360解:
已知=2000,
=400,1-=95%,z/2=1.96即應(yīng)抽取97人作為樣本2/5/202361【例】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?2/5/202362【例】某藥廠為了檢查瓶裝藥品數(shù)量,從成品庫隨機抽檢100瓶,結(jié)果平均每瓶101.5片,標(biāo)準(zhǔn)差為3片。是以99.73%的把握程度推斷成品庫該種藥平均每瓶數(shù)量的置信區(qū)間,如果允許誤差減少到原來1/2,其他條件不變,問需要抽取多少瓶?2/5/202363確定方法1.重復(fù)抽樣條件下:通常的做法是先確定置信水平,然后限定邊際誤差(一般少于0.1)。計算結(jié)果通常向上進位通常未知。一般按以下方法確定其估計值:①過去的經(jīng)驗數(shù)據(jù);②試驗調(diào)查樣本的;③取方差的最大值0.25,即π=0.5估計總體比例時樣本容量的確定
2/5/2023642.不重復(fù)抽樣條件下:確定方法2/5/202365【例】根據(jù)以往的生產(chǎn)統(tǒng)計,某種產(chǎn)品的合格率約為90%,現(xiàn)要求邊際誤差為5%,在求95%的置信區(qū)間時,應(yīng)抽取多少個產(chǎn)品作為樣本?解:已知=90%,=0.05,Z/2=1.96,
=5%
應(yīng)抽取139個產(chǎn)品作為樣本2/5/202366【例】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應(yīng)抽查多少件產(chǎn)品?分析:因為共有三個過去的合格率的資料,為保證推斷的準(zhǔn)確程度,應(yīng)選其中方差最大者,即π=93﹪。2/5/202367解:2/5/202368四、EXCEL在參數(shù)估計中應(yīng)用(一)EXCEL中與參數(shù)估計有關(guān)的常用函數(shù)(二)案例分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年智能交通系統(tǒng)設(shè)計與應(yīng)用考試試題及答案
- 編程語言與算法專業(yè)考試題及答案2025年
- 2025年現(xiàn)代物流管理課程考試試題及答案
- 2025年網(wǎng)絡(luò)營銷課程綜合測試題及答案
- 2025年市場營銷理論知識試題及答案
- 2025年數(shù)字內(nèi)容與文化創(chuàng)意產(chǎn)業(yè)考試試題及答案
- 2025年媒體與傳播管理專業(yè)研究生入學(xué)考試試題及答案
- 2025年電氣工程基礎(chǔ)知識學(xué)習(xí)考試試題及答案
- 2025年能源管理與可再生能源應(yīng)用的考試試卷及答案
- 2025年漢語言文學(xué)專業(yè)考前模擬試題及答案
- 劉醒龍文集:生命是勞動與仁慈
- Unit2+Extended+Reading+Beethoven-+a+remarkable+life課件【核心素養(yǎng)提升+備課精講精研】 牛津譯林版(2020)選擇性必修第一冊
- GB/T 39936-2021深冷保冷用泡沫塑料
- GB/T 28730-2012固體生物質(zhì)燃料樣品制備方法
- 太陽能光伏儲能技術(shù)課件
- 威尼斯畫派課件
- 心肌病-PPT課件
- 施工安全常識教育-鋼筋工
- 五年級期中考試家長會課件39846
- 培養(yǎng)基模擬灌裝方案
- 集裝袋噸袋項目建議書范文
評論
0/150
提交評論