




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、-作者xxxx-日期xxxx假設(shè)檢驗(yàn)二項(xiàng)分布與正態(tài)分布【精品文檔】第七章 假設(shè)檢驗(yàn)有了概率和概率分布的知識(shí),接下來我們要逐步掌握統(tǒng)計(jì)檢驗(yàn)的一般步驟。既然按照數(shù)學(xué)規(guī)則得到的概率都不能用經(jīng)驗(yàn)方法準(zhǔn)確求得,于是,理論概率和經(jīng)驗(yàn)得到的頻率之間肯定存在某種差別,這就引出了實(shí)踐檢驗(yàn)理論的問題。第一節(jié) 二項(xiàng)分布二項(xiàng)分布是從著名的貝努里試驗(yàn)中推導(dǎo)而來。所謂貝努里試驗(yàn),是指只有兩種可能結(jié)果的隨機(jī)試驗(yàn)。每當(dāng)情況如同貝努里試驗(yàn),是在相同的條件下重復(fù)n次,考慮的是“成功”的概率,且各次試驗(yàn)相互獨(dú)立,就可利用與二項(xiàng)分布有關(guān)的統(tǒng)計(jì)檢驗(yàn)。雖然許多分布較之二項(xiàng)分布更實(shí)用,但二項(xiàng)分布簡單明了,況且其他概率分布的使用和計(jì)算邏輯與
2、之相同。所以要理解統(tǒng)計(jì)檢驗(yàn)以及它所涉及的許多新概念,人們幾乎都樂意從二項(xiàng)分布的討論入手。二項(xiàng)試驗(yàn)中隨機(jī)變量X的概率分布,即P(X=x)pxqn-x 。 (73) 2二項(xiàng)分布的討論(1)二項(xiàng)分布為離散型隨機(jī)變量的分布。 (2)二項(xiàng)分布的圖形當(dāng)p05時(shí)是對稱的,當(dāng)p 05時(shí)是非對稱的,而當(dāng)n愈大時(shí)非對稱性愈不明顯。 (3)二項(xiàng)分布的數(shù)學(xué)期望E(X)np,變異數(shù)D(X)2npq。 (4)二項(xiàng)分布受成功事件概率p和試驗(yàn)次數(shù)n兩個(gè)參數(shù)變化的影響,只要確定了p和n,成功次數(shù)x的概率分布也隨之確定。因而,二項(xiàng)分布還可簡寫作B(x;n,p)。 (5)二項(xiàng)分布的概率值除了根據(jù)公式直接進(jìn)行計(jì)算外,還可查表求得。
3、第二節(jié) 統(tǒng)計(jì)檢驗(yàn)的基本步驟 概率分布不是一種研究者從資料中看到的分布,我們討論它,不是出于對數(shù)學(xué)的愛好,而是因?yàn)榻y(tǒng)計(jì)推論的有關(guān)工作需要它。所有的統(tǒng)計(jì)檢驗(yàn)都包含某些特定的步驟:(1)建立假設(shè);(2)求抽樣分布(所謂抽樣分布,就是把具體概率數(shù)值賦予樣本每個(gè)或每組結(jié)果的概率分布);(3)選擇顯著性水平和否定域;(4)計(jì)算檢驗(yàn)統(tǒng)計(jì)量;(5)判定。 1建立假設(shè)統(tǒng)計(jì)檢驗(yàn)是將抽樣結(jié)果和抽樣分布相對照而作出判斷的工作。取得抽樣結(jié)果,依據(jù)描述性統(tǒng)計(jì)的方法就足夠了。抽樣分布則不然,它無法從資料中得到,非利用概率論不可。而不對待概括的總體和使用的抽樣程序做某種必要的假設(shè),這項(xiàng)工作將無法進(jìn)行。2求抽樣分布在做了必要的
4、假設(shè)之后,我們就能用數(shù)學(xué)推理過程來求抽樣分布了。由于數(shù)學(xué)上已經(jīng)取得的成果,實(shí)際上統(tǒng)計(jì)工作者要做的這項(xiàng)工作往往并不是真的去求抽樣分布的數(shù)學(xué)形式,而是根據(jù)具體需要,確定特定問題的統(tǒng)計(jì)檢驗(yàn)應(yīng)該采用哪種分布的數(shù)學(xué)用表。 3選擇顯著性水平和否定域 有了與問題相關(guān)的抽樣分布,我們便可以把所有可能的結(jié)果分成兩類:一類是不大可能的結(jié)果;另一類人們預(yù)料這些結(jié)果很可能發(fā)生。既然如此,如果我們在一次實(shí)際抽樣中得到的結(jié)果恰好屬于第一類,我們就有理由對概率分布的前提假設(shè)產(chǎn)生懷疑。在統(tǒng)計(jì)檢驗(yàn)中,這些不大可能的結(jié)果稱為否定域。如果這類結(jié)果真的發(fā)生了,我們將否定假設(shè);反之就不否定假設(shè)。概率分布的具體形式是由假設(shè)決定的,假設(shè)肯
5、定不止一個(gè)。在統(tǒng)計(jì)檢驗(yàn)中,通常把被檢驗(yàn)的那個(gè)假設(shè)稱為零假設(shè)(或稱原假設(shè),用符號(hào)H0表示),并用它和其他備擇假設(shè)(用符號(hào)H1表示)相對比。值得注意的是,假設(shè)只能被檢驗(yàn),從來不能加以證明。統(tǒng)計(jì)檢驗(yàn)可以幫助我們否定一個(gè)假設(shè),卻不能幫助我們肯定一個(gè)假設(shè)。為了使檢驗(yàn)更嚴(yán)格、更科學(xué),還需要更多的東西。首先,我們必須確定甘冒犯第一類和第二類錯(cuò)誤的風(fēng)險(xiǎn)的程度;其次,要確定否定域是否要包含抽樣分布的兩端。第一類錯(cuò)誤是,零假設(shè)H0實(shí)際上是正確的,卻被否定了。第二類錯(cuò)誤則是,H0實(shí)際上是錯(cuò)的,卻沒有被否定。第二類錯(cuò)誤是,零假設(shè)H0實(shí)際上是錯(cuò)誤的,卻沒有被否定。遺憾的是,不管我們?nèi)绾芜x擇否定域,都不可能完全避免第一類
6、錯(cuò)誤和第二類錯(cuò)誤,也不可能同時(shí)把犯兩類錯(cuò)誤的危險(xiǎn)壓縮到最小。對任何一個(gè)給定的檢驗(yàn)而言,第一類錯(cuò)誤的危險(xiǎn)越小,第二類錯(cuò)誤的概率就越大;反之亦然。一般來講,不可能具體估計(jì)出第二類錯(cuò)誤的概率值。第一類錯(cuò)誤則不然,犯第一類錯(cuò)誤的概率是否定域內(nèi)各種結(jié)果的概率之和。由于犯第一類錯(cuò)誤的危險(xiǎn)和犯第二類錯(cuò)誤的危險(xiǎn)呈相背趨向,所以統(tǒng)計(jì)檢驗(yàn)時(shí),我們必須事先在甘冒多大第一類錯(cuò)誤的風(fēng)險(xiǎn)和多大第二類錯(cuò)誤的風(fēng)險(xiǎn)之間作出權(quán)衡。被我們事先選定的可以犯第一類錯(cuò)誤的概率,叫做檢驗(yàn)的顯著性水平(用表示),它決定了否定域的大小。如果抽樣分布是連續(xù)的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來(后面
7、的正態(tài)檢驗(yàn)就如此)。如果抽樣分布是非連續(xù)的,就要用累計(jì)概率的方法找出一組構(gòu)成否定域的結(jié)果。即在已知概率分布表上,從兩端可能性最小的概率開始向中心累計(jì),直至概率之和略小于選定的顯著性水平為止。在許多場合,我們能預(yù)測偏差的方向,或只對一個(gè)方向的偏差感興趣。每當(dāng)方向能被預(yù)測的時(shí)候,在同樣顯著性水平的條件下,單側(cè)檢驗(yàn)比雙側(cè)檢驗(yàn)更合適。因?yàn)榉穸ㄓ虮患械匠闃臃植几线m的一側(cè),可以得到一個(gè)比較大的尾端。這樣做,可以在犯第一類錯(cuò)誤的危險(xiǎn)不變的情況下,減少了犯第二類錯(cuò)誤的危險(xiǎn)。4計(jì)算檢驗(yàn)統(tǒng)計(jì)量 完成了上述工作之后,接下來就是做一次與理想試驗(yàn)盡量相同的實(shí)際抽樣(比如實(shí)際做一次重復(fù)拋擲硬幣的試驗(yàn)),并從獲取的樣本
8、資料算出檢驗(yàn)統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量是關(guān)于樣本的一個(gè)綜合指標(biāo),但與第九章參數(shù)估計(jì)中將要討論的統(tǒng)計(jì)量有所不同,它不用作估測,而只用作檢驗(yàn)。 5判定 假設(shè)檢驗(yàn)系指拒絕或保留零假設(shè)的判斷,又稱顯著性檢定。在選擇否定域并計(jì)算檢驗(yàn)統(tǒng)計(jì)量之后,我們完成最后一道手續(xù),即根據(jù)試驗(yàn)或樣本結(jié)果決定假設(shè)的取與舍。如果結(jié)果落在否定域內(nèi),我們將在已知犯第一類錯(cuò)誤概率的條件下,否定零假設(shè)。反之,如果結(jié)果落在否定域外,則不否定零假設(shè),與此同時(shí),我們就有了犯第二類錯(cuò)誤的危險(xiǎn)。第三節(jié) 正態(tài)分布 如果說二項(xiàng)分布是離散型隨機(jī)變量最具典型意義的概率分布,那么連續(xù)型隨機(jī)變量最具典型意義的概率分布就是正態(tài)分布了。這是因?yàn)椋涸S多自然現(xiàn)象與社會(huì)現(xiàn)
9、象,都可用正態(tài)分布加以敘述;不少離散型隨機(jī)變量與連續(xù)型隨機(jī)變量的概率分布都以正態(tài)分布為其極限(即當(dāng)樣本相當(dāng)大時(shí),可用正態(tài)近似法解決這些概率分布的問題);許多統(tǒng)計(jì)量的抽樣分布呈正態(tài)分布,故在參數(shù)估計(jì)與假設(shè)檢驗(yàn)上經(jīng)常以正態(tài)分布為理論基礎(chǔ)。 1正態(tài)分布的數(shù)學(xué)形式正態(tài)分布的概率密度表達(dá)為:(Xx)。 正態(tài)曲線具有下列性質(zhì): (1)正態(tài)曲線以X呈鐘形對稱,其均值、中位數(shù)和眾數(shù)三者必定相等。(2) (Xx)在X處取極大值。X離越遠(yuǎn),(Xx)值越小。(3)對于固定的值,不同均值的正態(tài)曲線的外形完全相同,差別只在于曲線在橫軸方向上整體平移了一個(gè)位置(參見圖73)。 (4)對于固定的值,改變值,值越小,正態(tài)曲線
10、越陡峭;值越大,正態(tài)曲線越低平(參見圖74)。 (5)正態(tài)分布的數(shù)學(xué)期望E(X),變異數(shù)D(X)2。 2標(biāo)準(zhǔn)正態(tài)分布引入新的隨機(jī)變量Z,我們便得到了用Z分?jǐn)?shù)表達(dá)的標(biāo)準(zhǔn)正態(tài)分布,其概率密度為(Z)。標(biāo)準(zhǔn)正態(tài)變量的數(shù)學(xué)期望E(Z)0,變異數(shù)(即方差)D(Z)1。實(shí)際上,標(biāo)準(zhǔn)正態(tài)分布(Z)只是正態(tài)分布的一個(gè)特例,即0,21的正態(tài)分布,簡記作N(0,1)。對于一般正態(tài)分布則簡記為N(,2)。 3正態(tài)曲線下的面積有了正態(tài)分布的概率密度(75)式,隨機(jī)變量X的取值在某區(qū)間x1Xx2上的概率便可用下式求得 P(x1Xx2 )但積分畢竟太麻煩了,更何況許多人對積分運(yùn)算不熟悉,為此須計(jì)算出現(xiàn)成的數(shù)值表供使用者查
11、找。由于正態(tài)曲線的優(yōu)良性質(zhì),這項(xiàng)工作可以卓有成效地完成:經(jīng)過X的標(biāo)準(zhǔn)分Z,可以將任何正態(tài)分布N(,2)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)分布N(0,1);運(yùn)用分布函數(shù)的定義,并利用正態(tài)曲線的對稱性,通過下式(分布函數(shù))可以計(jì)算編制出正態(tài)分布表(見附表4)。 F(Z)P(0ZZ) 4二項(xiàng)分布的正態(tài)近似法 二項(xiàng)分布是以正態(tài)分布為極限的。所以當(dāng)n很大時(shí),只要p或q不近于零,我們就可以用正態(tài)近似來解決二項(xiàng)分布的計(jì)算問題,即 P(Z1ZZ2)d z 又 Z 第四節(jié) 中心極限定理 1抽樣分布統(tǒng)計(jì)的學(xué)習(xí)進(jìn)入到推論統(tǒng)計(jì)階段,我們就必須同時(shí)與三種不同的分布概念打交道,即總體分布、樣本分布、抽樣分布。已知一總體分布,可求得它的特征值
12、。根據(jù)總體分布計(jì)算的特征值,即根據(jù)總體各個(gè)單位標(biāo)志值計(jì)算的統(tǒng)計(jì)指標(biāo),在推論統(tǒng)計(jì)中稱為總體參數(shù)。總體均值和總體標(biāo)準(zhǔn)差(或方差)是反映總體分布特征最重要的兩個(gè)總體參數(shù),習(xí)慣上分別記作和(或2)。 同理,已知一樣本分布可求得它的特征值。根據(jù)樣本分布計(jì)算特征值,即根據(jù)樣本各個(gè)單位標(biāo)志值計(jì)算的統(tǒng)計(jì)指標(biāo),在推論統(tǒng)計(jì)中稱為統(tǒng)計(jì)量。樣本均值和樣本標(biāo)準(zhǔn)差(或方差)是反映樣本分布特征最重要的兩個(gè)統(tǒng)計(jì)量,習(xí)慣上分別記作和S(或S 2)。 將總體均值、總體標(biāo)準(zhǔn)差與樣本均值、樣本標(biāo)準(zhǔn)差加以區(qū)別是很必要的。因?yàn)榭傮w參數(shù)和統(tǒng)計(jì)量之間存在著重要差別。參數(shù)是有關(guān)總體的固定值,一般都是未知的。 由于統(tǒng)計(jì)量是隨機(jī)變量,并且在一個(gè)統(tǒng)
13、計(jì)總體中可以重復(fù)抽取的樣本在理論上是無數(shù)的,所以可以用概率分布來進(jìn)行描述。本書在引出總體分布、樣本分布的概念之后,又引出了抽樣分布的概念。需要再次強(qiáng)調(diào),抽樣分布是運(yùn)用數(shù)理統(tǒng)計(jì)的方法,把具體概率賦予樣本的所有可能結(jié)果的一種理論分布。但有了抽樣分布對概率分布的具體化,研究者便找到了一種理論與實(shí)際相聯(lián)系的有效途徑。2中心極限定理 概率論中用來闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的定理,是著名的大數(shù)定理。其具體內(nèi)容是:頻率穩(wěn)定于概率,平均值穩(wěn)定于期望值。但是,大量隨機(jī)現(xiàn)象的穩(wěn)定性不僅表現(xiàn)在平均結(jié)果上,同時(shí)也表現(xiàn)在分布上,這就是中心極限定理所要闡明的內(nèi)容。仔細(xì)考慮統(tǒng)計(jì)量和與之相對應(yīng)的未知參數(shù)的接近程度,引出
14、了研究和應(yīng)用抽樣分布的課題。顯然,推論統(tǒng)計(jì)需要有一座能夠架通抽樣調(diào)查和抽樣分布的橋梁。中心極限定理告訴我們:如果從任何一個(gè)具有均值和方差2的總體(可以具有任何形式)中重復(fù)抽取容量為n的隨機(jī)樣本,那么當(dāng)n變得很大時(shí),樣本均值的抽樣分布接近正態(tài),并具有均值和方差。統(tǒng)計(jì)檢驗(yàn)應(yīng)用正態(tài)分布和二項(xiàng)分布有兩點(diǎn)區(qū)別:抽樣分布在這里是連續(xù)的而非離散的,否定域的大小可以和顯著性水平的要求精確地一致起來。計(jì)算檢驗(yàn)統(tǒng)計(jì)量不再像在應(yīng)用二項(xiàng)分布時(shí)那樣,可以不勞而獲了。很顯然,為了能使用現(xiàn)成的正態(tài)分布表,關(guān)鍵是要從樣本資料中計(jì)算出在N(0,1)形式下的統(tǒng)計(jì)量Z,再根據(jù)Z是否落在否定城內(nèi)而對被檢驗(yàn)假設(shè)的取舍作出決定。注意:在正態(tài)檢驗(yàn)對于的抽樣分布中,隨機(jī)變量的取值是每個(gè),均值是,標(biāo)準(zhǔn)差是。因此,Z如果作為檢驗(yàn)統(tǒng)計(jì)量,要用替換X,用替換,不動(dòng),即 Z。 第五節(jié) 總體均值和成數(shù)的單樣本檢驗(yàn)1 已知,對總體均值的檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量是Z。 2學(xué)生t分布(小樣本總體均值的檢驗(yàn))當(dāng)n較小時(shí),檢驗(yàn)統(tǒng)計(jì)量是t 。 3關(guān)于總體成數(shù)的檢驗(yàn) 成數(shù)的檢驗(yàn)統(tǒng)計(jì)量是Z。成數(shù)檢驗(yàn)與二項(xiàng)檢驗(yàn)的聯(lián)系是不言而愈的。因?yàn)樵诙?xiàng)檢驗(yàn)中,隨機(jī)變量是樣本的“成功”次數(shù)x,而在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保設(shè)備制作培訓(xùn)課件
- 航空航天復(fù)合材料 課件 第6章 燒蝕防熱復(fù)合材料朱和國
- 早產(chǎn)兒的治療及護(hù)理
- 餐飲行業(yè)知名品牌收購與經(jīng)營權(quán)協(xié)議
- 企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)管理與內(nèi)部控制體系建設(shè)合同
- 餐飲企業(yè)大堂經(jīng)理職位競聘與培養(yǎng)協(xié)議
- 拆遷補(bǔ)償與二手房買賣合同風(fēng)險(xiǎn)評估與解決方案合同
- 幼兒園考勤制度崗前培訓(xùn)
- 水稻專用肥采購合同及技術(shù)指導(dǎo)服務(wù)協(xié)議
- 高新區(qū)股權(quán)交易糾紛解決及股權(quán)轉(zhuǎn)讓合同
- 保溫材料安全管理制度
- 餐飲廢棄物管理制度
- 2025年甘肅高考物理試卷真題及答案詳解(精校打印版)
- 玉溪市2025年事業(yè)單位公開招聘工作人員筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 2025至2030中國工業(yè)電機(jī)行業(yè)市場發(fā)展現(xiàn)狀及商業(yè)模式與投資發(fā)展報(bào)告
- 部編人教版小學(xué)語文1-6年級詞語表
- 工地切割樁頭合同協(xié)議書
- 手術(shù)室環(huán)境衛(wèi)生管理要求
- 2025-2030中國激光噴碼機(jī)行業(yè)市場發(fā)展分析及發(fā)展趨勢與投資前景研究報(bào)告
- 《鐵路旅客運(yùn)輸組織(活頁式)》課件 7.3 旅客傷害應(yīng)急處置
- 通信光纜割接施工方案
評論
0/150
提交評論