抽樣推斷培訓課程_第1頁
抽樣推斷培訓課程_第2頁
抽樣推斷培訓課程_第3頁
抽樣推斷培訓課程_第4頁
抽樣推斷培訓課程_第5頁
已閱讀5頁,還剩74頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第6章抽樣推斷抽樣推斷的基本概念抽樣誤差抽樣推斷的方法

抽樣的組織形式

12/12/202416.1抽樣推斷的基本概念抽樣推斷,從其內涵來說,包括抽樣調查和抽樣推斷兩部分,前者著重調查,后者著重推斷。抽樣推斷是在抽樣調查的基礎上利用樣本的實際資料計算出的樣本數據,并運用概率估計方法,推算總體相應的數量指標的一種統計分析方法。12/12/20242抽樣推斷具有如下幾個特點抽樣推斷是由部分推算整體的一種認識方法。

抽樣推斷是建立在隨機取樣的基礎上。抽樣推斷是運用概率估計的方法,利用樣本指標來估計總體參數。抽樣推斷的誤差是可以事先控制的,用樣本指標值推斷總體指標值是存在一定誤差的。

12/12/20243抽樣推斷的作用應用于某些不可能作全面調查或很難作全面調查的場合。在可以使用全面調查的場合,抽樣調查仍有其獨特的作用。用于假設檢驗。12/12/202446.1.1總體和樣本1.總體(population)也稱全及總體,是指所研究現象的整體,即包括所要調查的所有單位。例如,從1000名學生中,抽取50名學生進行抽樣調查,以計算學生的平均體重。這1000名學生是全及總體,一般用英文大寫字母N來表示總體的單位數,取N=1000人。全及總體按其各單位性質的不同,可以分為變量總體和屬性總體兩類。對于一個總體來說,若被研究的單位標志屬于品質標志,則該總體為屬性總體,若被研究的單位標志屬于數量標志,則該總體為變量總體。12/12/202452.樣本(sample)又稱子樣,它是從全及總體中隨機抽取出來,作為代表這一總體的那部分單位組成的集合體。樣本的單位數是有限的,相對來說,它的數目比較小,一般用英文小寫字字母n來表示樣本的單位數。如上例n=50人。作為推斷對象的總體是確定的,而且是唯一的。但作為觀察對象的樣本就不是這樣。從一個總體可以抽取很多個樣本,每次可能抽到哪個樣本不是確定的。也不是唯一的,而是可變的。

12/12/202466.1.2參數和統計量

1.參數(parameter)。根據總體各單位的標志值或標志屬性計算的,反映總體數量特征的綜合指標稱為全及指標。全及指標是總體變量的函數,其數值是由總體各單位的標志值決定的。由于總體是唯一確定的,因此,全及指標也是唯一確定的,所以也稱參數。常用的參數有總體平均數,總體成數、總體方差和總體標準差。

12/12/20247(1)總體平均數Populationmean

對于變量總體,由于各單位的標志可以用數量表示,因此可以計算總體平均數,通常用表示。

設X為總體的某一變量,其N項變量值為X1、X2、…Xn,則總體平均數為:12/12/20248(2)總體成數

Proportion對于屬性總體,由于各單位標志不能用數量表示,因此總體參數常以成數或比重來表示。通常以P表示總體中具有某種標志表現即“是”的單位數在總體單位數中所占的比重;以Q表示不具有某種標志表現即“非”的單位數所占的比重。設總體N個單位中,有N1個單位具有某種標志表現,N0個單位不具有某種標志表現,且N=N1+N0,則總體成數為:12/12/20249【實例6.1】紅光燈泡廠生產的10000只燈泡中,有9550只是合格品,有450只是不合格產品,則總體成數即燈泡的合格率和不合格率分別為:

需要指出,統計上把只表現為“是”與“非”的標志稱為是非標志,也稱交替標志,如性別標志等。

12/12/202410(3)總體方差和總體標準差Variance&standarddeviation就變量總體而言,其總體方差和標準差計算公式分別為:

在屬性總體條件下,則可以把“是”與“非”兩種標志表現進行量化處理,用“1”表示“是”,即具有某種標志表現,用“0”表示“非”,即不具有某種標志表現,那么“是”的成數就可視為是非標志的平均數,從而計算出屬性總體的方差和標準差,即

=(1-P)2P+(0-P)2Q=Q2P+P2Q=PQ(P+Q)=PQ=P(1-P)

12/12/2024112.統計量(statistic)

。根據樣本各單位標志值計算的反映樣本特征的指標稱為統計量,也稱作樣本指標samplestatistic。它是用來估計總體參數的。與總體參數相對應,統計量主要有樣本平均數表示樣本內各單位某一標志值的一般水平樣本方差,反映樣本中各單位標志值的離散程度,從而可說明樣本平均數的代表性大小,記作S2,稱S為樣本標準差或均方差樣本成數,指具有某種性質的單位在樣本中所占比重(如抽樣產品的合格率),記作p;樣本成數的方差是p(1-p)12/12/202412(1)樣本平均數

Samplemean(2)樣本成數(3)樣本方差和樣本標準差

Samplevariance12/12/202413樣本是非標志的方差S2和標準差S的計算公式分別為12/12/2024146.1.3樣本容量和樣本個數是兩個有聯系但又完全不同的概念。

樣本容量是指一個樣本所包含位數樣本個數又稱樣本可能數目。是指從一個總體上可能抽取的樣本個數。12/12/2024156.1.4重復抽樣和不重復抽樣

重復抽樣又叫重置samplingwithreplacement抽樣,也叫做有放回的抽樣或重置抽樣不重復抽樣又叫不重置samplingwithoutreplacement也叫做無放回抽樣或非重置抽樣樣本可能數目樣本可能數目12/12/2024166.2抽樣誤差6.2.1抽樣誤差的概念

抽樣誤差(samplingerror)是指由于隨機抽樣的偶然因素使各單位的結構不足以代表總體各單位的結構,而引起抽樣指標和全及指標之間的絕對離差。Samplingerroristhedifferencebetweenasamplestatisticanditscorrespondingpopulationparameterandisduepurelytochance.是一種由于隨機抽樣引起的偶然的代表性誤差,或隨機誤差randomerror\chanceerror。抽樣誤差不可消除,但可以計算和控制。12/12/202417抽樣調查中誤差有以下兩個來源

一個是登記性誤差。也叫調查誤差datarecordingerror,是指在調查登記過程中發生的誤差,這類誤差是可以避免的。二是代表性誤差representativeerror,在抽樣調查中,是指由于用抽樣指標去代替總體指標時所產生的誤差。代表性誤差的發生的兩種情況:第一,非隨機的代表性誤差;第二,隨機性誤差。12/12/202418DubiousSampling:TheLiteraryDigestCaseAclassiccaseofbothselectionbiasandnonresponsebiasoccurredin1936.TheLiteraryDigestmagazine,whichhadcorrectlypredictedthewinnerineveryU.S.presidentialelectionsince1916,predictedconfidentlyacomfortablevictoryforAlfredM.Landon,theRepublicancandidate,overFranklinD.Roosevelt,theDemocraticcandidate,byamarginof57to43.YetRooseveltwonbyalandslideneverbeforeseeninU.S.history,receiving62percentofthevotescast.Whathadgonewrong?12/12/202419First,therewasselectionbias.TheDigestmailedquestionnairesto10millionpeoplewhosenameshadbeentakenfromvariouslistssuchasitsownsubscribers,telephonedirectories,andautomobile-registrationrolls.DuringtheGreatDepression,higher-incomepeopletypicallyvotedRepublican,andthesepeoplewerewellrepresentedintheDigest’ssample.Ontheotherhand,lower-incomepeople,whoheavilyfavoredtheDemocrats,wereunderrepresentedbecausealowerpercentagecouldaffordmagazinesubscriptions,telephones,andautomobiles.12/12/202420Second,therewasnonresponsebias.Only2.4millionofthel0millionquestionnairesweremailedback.Althoughthismadethesurveythelargestsampleevertaken,moreeducatedpeoplearemorelikelytorespondtomailquestionnairesthanlesseducatedones.Theformer,again,tendedtofavorRepublicans;thelatter,theDemocrats.Thus,amuchlargerpercentageofthenonrespondentsthanoftherespondentswereforRoosevelt.Thisbiasreinforcedtheselectionbias.12/12/202421Note:TheDigestneversurvivedthedebacleandfoldedshortlythereafter.Atthesametime,GeorgeGallupwassettinguphissurveyorganization,andhecorrectlyforecasttheRooseveltVictoryfromameresampleof50,000people.Yetin1948,usinganotherdubiousprocedure(aformofjudgmentsampling,calledquotasampling),Gallup'sorganization(alongwithCrossley'sandRoper's)incorrectlypredictedthevictoryofThomasDeweyoverHarrySTruman.12/12/2024226.2.2抽樣平均誤差standarderror

是根據隨機原則抽樣時,所有可能出現的樣本平均數的標準差。它反映樣本平均數(樣本成數)與總體平均數(總體成數)的平均誤差程度,常用μ表示。Thestandarderrorofthesamplemeanisthestandarddeviationofthesamplingdistributionofsamplemeans.12/12/2024231.抽樣平均數的平均誤差(1)重復抽樣的抽樣平均誤差計算公式

但是,σ是全及總體標準差,這是不知道的。如果知道,就無需進行抽樣調查了。在這種情況下可用樣本的方差s2來代替。其計算公式如下12/12/202424(2)不重復抽樣的抽樣平均誤差計算公式當全及總體單位數N很大時,N-1接近于N,即可用N代替,則上列公式可簡化如下

12/12/202425【實例6.5】從某學院2011級的2000名學生中,按簡單隨機抽樣方式抽取40名學生,對公共理論課的考試成績進行檢查,得知其平均成績為78.75分,標準差為12.13分,試根據重復抽樣和不重復抽樣的方法分別計算抽樣平均誤差。(1)按重復抽樣計算抽樣平均誤差

(2)按不重復抽樣計算抽樣平均誤差12/12/2024262.抽樣成數的抽樣平均誤差

(1)重復抽樣的抽樣平均誤差計算公式(2)不重復抽樣的抽樣平均誤差計算公式以上兩個公式中的P,是總體成數,這是不知道的。而P(1-P)是總體方差,它等于,即也是不知道的。在這種情況下,可用樣本的成數P和樣本方差P(1-P)來代替,或者用過去類似調查的成數和成數方差來代替。成數方差的最大值為12/12/202427【實例6.6】從40000件產品中,隨機抽取200件進行檢驗,結果有10件不合格,求合格率的抽樣平均誤差。(1)按重復抽樣計算抽樣平均誤差

(2)按不重復抽樣計算抽樣平均誤差

12/12/2024286.2.3抽樣極限誤差1.抽樣極限誤差的概念抽樣極限誤差又稱抽樣允許誤差,是指樣本指標與總體指標之間產生抽樣誤差被允許的最大可能范圍,它是根據所研究對象的變異程度和分析任務的要求來確定的可允許的誤差范圍,凡是在這個范圍內的數字都算有效,統計上把這種可允許的誤差范圍稱為抽樣極限誤差。根據樣本指標估計總體指標必會產生誤差,但誤差不能太大,以免使抽樣估計失去意義;但誤差也不是愈小愈好,因為這樣就要增加樣本單位數,必然提高很多費用,所以要確定一個誤差范圍。

12/12/202429抽樣極限誤差通常用樣本指標可允許變動的上限或下限與總體指標的絕對離差表示。設和分別表示抽樣平均數和抽樣成數的抽樣極限誤差,則有上式可變換為下列不等式

上式表明總體平均數

是以抽樣平均數為中心,在的范圍內變動。總體成數P也是如此,這個變動范圍被稱為估計區間。12/12/2024302.抽樣誤差的概率度

基于概率估計的要求,抽樣極限誤差通常需要以抽樣平均誤差或為標準單位來衡量。把極限誤差或分別除以或,得相對數t,它表示誤差范圍為抽樣平均誤差的若干倍,t是測量估計可靠程度的一個參數,稱為抽樣平均誤差的概率度。12/12/2024316.3抽樣推斷的方法抽樣估計是指利用實際調查計算的樣本指標值來估計相應的總體指標的數值。由于總體指標是表明總體數量特征的參數,所以也稱為參數估計。總體參數估計有點估計和區間估計兩種1.點估計。點估計(pointestimation)的基本特點是,根據總體指標的結構形式設計樣本指標作為總體參數的估計量,并以樣本指標的實際值作為相應總體參數的估計值(例如以樣本平均數的實際值作為相應總體平均數的估計值,以樣本成數的實際值作為相應總體成數的估計值等)。12/12/202432Whentheestimationofapopulationisexpressedasasinglenumericalvalue,itisreferredtoasapointestimation.12/12/202433常用概率度與概率保證度表概率度t概率F(t)(%)1.002.003.001.641.962.5868.2795.4599.7390.0095.0099.0012/12/202434抽樣估計的優劣標準無偏性unbiasedness有效性efficiency一致性consistency12/12/202435無偏性unbiasedness抽樣指標的平均數等于全及指標。即:抽樣指標的估計,平均說來是沒有誤差的。12/12/202436有效性efficiency作為優良估計量的方差應比其它估計量的方差小。即:方差最小原則。12/12/202437一致性consistency當樣本容量充分大時,抽樣指標也充分地靠近全及指標。即:n→N時,△→012/12/2024382.區間估計區間估計(intervalestimation)是在一定的概率把握程度下,根據樣本指標和抽樣極限誤差去估計總體指標所在可能范圍的方法。在總體指標的區間估計公式中,有兩個要素,一個是置信區間,另一個是置信概率。12/12/202439置信區間(confidenceinterval)又稱為估計區間,是指由低限到高限兩個數值所構成的可能范圍,由樣本指標和極限誤差組成。

置信概率(confidenceprobability)是指區間估計的概率保證程度,也稱為置信度。它是表明樣本指標與總體指標的誤差不超過一定范圍的概率有多大

估計的準確性問題

估計的可靠性問題

12/12/202440置信區間12/12/202441總體平均數的估計就是用抽樣平均數來估計總體平均數

【實例】某學校進行一次英語測驗,為了解學生的考試情況,隨機抽選部分學生進行調查,所得資料如下:

考試成績(分)學生人數(人)60以下1060-702070-802280-904090以上8按重復抽樣方法以95.45%概率估計該校學生英語平均成績的范圍。

下限=

=74.32分上限==78.88分

所以,在95.45%的概率保證程度下,該校學生英語考試的平均成績的范圍在74.32-78.88分之間。12/12/202442總體成數的估計就是用抽樣成數來估計總體成數

仍按上例資料,以同樣的概率估計該校學生成績在80分以上的學生所占的比重的范圍。

解:樣本合格率為

抽樣平均誤差為:抽樣極限誤差為:所以,在95.45%的概率保證程度下,該校學生成績在80分以上的學生所占的比重的范圍在38.01%-57.99%之間。

12/12/2024436.3.2樣本容量的確定

1.確定必要樣本容量的意義樣本單位數越多,樣本的代表性越大,抽樣誤差越小,抽樣估計就越可靠。但樣本容量過多會增加不必要的人力、物力和費用開支,造成浪費。樣本容量減少,又會使抽樣誤差增大,達不到所需要的準確程度。

基本原則是,在保證預期的抽樣估計可靠程度的要求下,抽取的樣本單位數不宜過多。12/12/2024442.影響樣本容量的因素

(1)總體各單位標志變異程度。總體標志變異程度大,要求樣本容量大些;反之,總體標志變異程度小,樣本容量可以小些。(2)抽樣方法。在其他條件相同的情況下,重復抽樣要比不重復抽樣多抽取一些樣本單位。(3)抽樣組織形式。一般來說,類型抽樣和等距抽樣的樣本容量要小于簡單隨機抽樣的樣本容量。(4)極限誤差的大小。如果允許誤差大,樣本容量就小;反之,如果允許誤差小,樣本容量就大。(5)抽樣估計的可靠程度即概率F(t)的大小。如果估計的可靠程度要求越高即F(t)越大,樣本容量就越多;反之,如果估計的可靠程度要求越低,即F(t)越小,樣本容量就越少。

12/12/2024453.必要樣本容量的計算公式(1)平均數的必要樣本容量的計算公式在重復抽樣的條件下為:在不重復抽樣的條件下為:12/12/202446(2)成數的必要樣本容量的計算公式在重復抽樣的條件下為:在不重復抽樣的條件下為:

12/12/202447【實例】對某罐頭廠生產的罐頭質量進行抽樣調查,抽樣極限誤差為5%,概率為0.9545,并知過去進行同樣抽樣調查,其不合格率為10%,試求必要的樣本容量。根據題意可知:t=2、P=90%、=5%在重復抽樣的條件下:(盒)12/12/2024484.計算必要樣本容量應注意的問題第一,在實際中采用不重復抽樣。但常用重復抽樣下的公式近似代替。第二,若σ2,P未知,其處理方式是:①用過去(近期)的數據代替;②用樣本數據代替;③取P=0.5或最接近0.5的P值。第三,對同一總體,若求出的nx、np不等,這時取較大的一個作為必要抽樣數目,以同時滿足作兩種調查的需要。第四,在實際工作中,常使用重復抽樣下的簡單隨機抽樣公式。12/12/2024496.3.3抽樣的組織形式

抽樣的基本組織形式可分為簡單隨機抽樣(純隨機抽樣)、類型抽樣、機械抽樣、整群抽樣等幾種。12/12/2024501簡單隨機抽樣simplerandomsampling又稱純隨機抽樣。它是按隨機原則直接從總體N個單位中抽取n個單位作為樣本。不論是重復抽樣或不重復抽樣,都要保證每個單位在抽選中都有相等的中選機會。是一種最簡單而又最基本的抽樣組織形式,它往往帶有盲目性,因此多用于對總體的初期研究。12/12/202451簡單隨機抽樣中抽選樣本的常用方法有三種

第一種是直接抽取法第二種是抽簽摸球法第三種是利用隨機數表法12/12/202452The1970DraftLotteryFiascoDuringbothWorldWarsIandII,itbecamenecessarytoestablishanorderinwhichmenweretobedraftedintotheU.S.military,In1917,accordingly,10,500blackcapsules,containingnumberspreviouslyassignedtoeligiblemen,weredrawnfromaglassfish-bowl.Inl940,asimilarprocedurewasadoptedtodraw9,000numbers,buttherewerecriticisms:Thesmall,woodenpaddle(WhichwasmadefromapieceofraftertraceabletoIndependenceHallinPhiladelphia)usedtostirthecapsulesinthebowlwouldnotreachdeepenoughintothebow.12/12/202453Italsobrokeopensomeofthecapsules,impedingthemixingprocessfurther.Intheend,thenumbersdrawnlookedlikeanythingbutrandomones;theywereconcentratedincertainclustersofhundreds,apparentlyreflectingthefactthatthenumbershadbeenpouredintothebowlinlotsof100each.Thelessonwasclear:thoroughphysicalmixingofcapsulesinabowlisdifficult.12/12/202454Apparentlythelessonhadbeenforgottenwhenthel970draftlotterywasinstituted.Some366capsules,containingallthepossiblebirthdatesinayear,werepouredintoabowlbutnotstirred.(Therehadbeensomemixingduringtheprocessofinsertingdatedslipsofpaperintothecapsules).Thencapsulesweredrawnout,theorderoftheirwithdrawaldeterminingtheprioritiesforthedraft.12/12/202455Theobservedsequencestronglyreflectedtheorderinwhichthecapsuleswerecreated(onemonthatatime),withlate-in-the-yearbirthdays(thatwereencapsulatedlast)beingdrawnfirstandearly-in-the-yearbirthdays(thatwereencapsulatedfirst)beingdrawnlastand,therefore,lesssubjecttothedraft.Severalyoungmenfiledsuitinfederalcourtseekingtohavethe1970lotteryvoidedonthebasisoftheapparentlackofrandomization.Note:A1971draftlottery,inresponsetowidespreadcriticismofthe1970lottery,madeuseofrandom-numberstables.12/12/2024562分層抽樣

又稱類型抽樣。它是先對總體各單位按主要標志加以分組,然后再從各組中按隨機原則抽選一定單位構成樣本。stratifiedrandomsampling類型抽樣的方法又分兩種:等比例抽樣和不等比例抽樣。12/12/202457如果按比例分配樣本單位,可以得到類型抽樣誤差公式

1.

在重復抽樣條件下變量總體:其中是各組方差的加權平均數,習慣上稱為平均組內方差。屬性總體其中是各組比率的方差加權平均數,是屬性總體的平均組內方差。12/12/2024582.在不重復抽樣條件下

以上總體參數、是未知的,習慣用樣本值、代替12/12/2024593等距抽樣systematicsampling也稱機械抽樣或系統抽樣。它先按某一標志對總體各單位進行排隊,然后依一定順序和間隔來抽取樣本單位的一種抽樣組織可分為按無關標志排隊和按有關標志排隊兩種按無關標志排隊指采用的排隊標志與所研究的問題沒有直接關系或聯系較少按有關標志排隊指采用的排隊標志與所研究的問題有直接關系。12/12/2024604整群抽樣clustersampling又稱聚點抽樣或群體抽樣,它是先將總體劃分為若干群(R群),再從中任意抽取幾群(r群),然后對抽中的群作全面調查,并據此結論對總體加以推斷。整群抽樣尤其適用于存在自然群的場合因為整群抽樣是成群地抽選樣本,故整群抽樣的誤差較大。由于整群抽樣是成群地抽樣,從而使樣本對總體的代表性會降低。

12/12/202461由于對抽中的群作全面調查,因此整群抽樣的誤差主要受各群間的差異即群間方差的影響,而群內卻不存在抽樣誤差問題。整群抽樣下的平均誤差公式如下:其中,稱為群間方差12/12/202462必要抽樣群數r的確定公式類同簡單隨機抽樣中有關公式。只不過現在確定的是r,并用組內方差取代。【實例】某產品合計生產3000批,每批產量大致相同,抽樣檢查產品合格品率。要求其允許誤差不超過2%,若根據過去該產品質量資料,其各批群間方差為3%,問在95.45%(t=2)可靠程度下需抽多少批產品為宜?即要在全部產品中抽273批產品檢查

12/12/2024635多階段抽樣multi-stagesampling

是在組織抽樣時,不是從總體中一次直接抽取樣本單位,而是把抽樣過程分成幾個過渡階段進行。到最后才具體抽取樣本單位。它是先抽大單位,再在大單位中抽小單位,在小單位中抽更小單位,直到抽出最終能取得推斷總體的基本單位為止。一般在總體很大,單位分布面積廣時,如從總體中采取一次直接抽取足夠多的樣本很困難時,可采用多階段抽樣。12/12/2024646.4參數假設檢驗6.4.1假設檢驗的基本概念假設檢驗(Hypothesistesting)是利用樣本的實際資料來檢驗事先對總體某些數量特征所作的假設是否可信的一種統計分析方法。12/12/202465它和參數估計一樣,都是利用樣本資料對總體特征進行某種推斷。但二者推斷角度不同。參數估計是根據樣本指標以一定的把握程度估計總體參數取值范圍,更準確地說,是對總體參數進行了區間估計;假設檢驗則先對總體參數值提出一個假設,然后利用樣本信息,以一定的概率水平去判斷這個假設是否成立。12/12/2024666.4.2假設檢驗的步驟一個完整的假設檢驗過程,通常包括以下四步驟:第一,提出原假設和備擇假設;第二,選取和計算檢驗統計量;第三,根據顯著性水平查臨界值;第四,進行比較并做出決策。

12/12/2024676.4.3假設檢驗中的兩類錯誤假設檢驗可能犯兩種類型的錯誤。第一類錯誤(TypeIerror)指的是H0客觀上真實但被檢驗所拒絕,這種錯誤也稱為棄真錯誤。犯這種錯誤的概率就是顯著水平α;第二類錯誤(TypeIIerror)指的是H0客觀上不真實但被檢驗所接受,這種錯誤也稱為納偽錯誤。犯這種錯誤的概率我們用β(讀作“貝塔”)來表示。

12/12/2024686.4.4總體均值和總體成數檢驗1.大樣本情況下總體均值檢驗在大樣本(n≥30)情況下,總體均值的假設檢驗可以應用正態分布檢驗法。2.小樣本情況下總體均值檢驗在小樣本(n<30)情況下,總體均值的假設檢驗可以應用t分布檢驗法。此時,檢驗統計量為t統計量,它服從自由度為n-1的t分布。12/12/202469【實例6.13】某食品公司生產一種罐頭,按標準每罐凈重為227克,根據以往生產經驗罐頭重量的標準差為5克。現隨機抽查該公司產品100罐,測得平均凈重為228克,判斷這批罐頭是否符合標準?解:第一步提出原假設和備擇假設。H0:=227H1:≠227

第二步選取和計算檢驗統計量。,代入數值,計算得Z=3.33

第三步根據顯著性水平查臨界值。由α=0.05,得臨界值-Z0.025=-1.96,Z0.025=1.96

第四步進行比較并做出決策。∵Z=3.33>Z0.025=1.96∴拒絕H0即這批罐頭不符合標準。12/12/202470【實例6.14】某輪胎制造商在廣告中聲稱,該公司生產的汽車輪胎在正常行使條件下平均壽命高于28000公里。檢測部門隨機挑選了40個輪胎進行測試,結果顯示平均行使里程28200公里,樣本標準差為1000公里,問該制造商廣告是否屬實?解:第一步提出假設。這需要確定檢驗的方向。題中制造商稱輪胎壽命高于28000公里,表述為>28000,其余集為≤28000,由于等號在原假設上,故≤28000為原假設H0,>28000為備擇假設H1,此為右單側檢驗。第二步計算統計量。由于總體標準差s未知,用樣本標準差S替代。Z統計量為代入數值,得Z=1.26第三步查臨界值。因為是右單側檢驗,α=0.05時其臨界值Z0.05=1.645第四步比較做決策。∵Z=1.26<Z0.05=1.645∴接受H0∴輪胎平均使用壽命不高于28000公里∴制造商廣告不屬實。12/12/202471【實例6.15】某批發商欲從廠家購進一批燈泡,根據合同規定,燈泡的平均使用壽命不能低于1000小時。從產品中隨機抽取100只燈泡,測得平均壽命為960小時,標準差為200小時,請問批發商是否應該購買這批燈泡?解:第一步提假設。H0:≥1000H1:<1000

第二步計算檢驗統計量。采用Z統計量,代入數值,計算得Z=-2

第三步查臨界值。由α=0.05,左單側檢驗得臨界值-Z0.05=-1.645

第四步比較做決策。∵Z=-2<-Z0.05=-1.645∴拒絕H0即批發商不應當購買這批燈泡。12/12/202472【實例6.16】某食品公司生產袋裝食品,采用自動打包機打包。每包標準凈重應為1000克,每天開工后需要檢驗一次打包機工作是否正常。現從產品中隨機抽取9包,實測每包凈重如下:987,993,1012,1005,997,983,1021,995,1005,給定顯著性水平α=0.05,問該日打包機工作是否正常?解:由于本題關心的是每包凈重是否為1000克,因此是雙側檢驗問題。又因為是小樣本資料,故采用t分布檢驗法。第一步提假設。H0:=1000H1:≠1000第二步計算檢驗統計量。,樣本平均數=999.8樣本標準差S=1.212代入數值,計算得t=-0.495第三步查臨界值。α=0.05,由于是雙側檢驗,自由度=n-1=8,查t分布表,得臨界值-t0.025(8)=-2.306,t0.025(8)=2.306第四步比較做決策。∵-2.306<t=-0.495<2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論