




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第八章假設檢驗§8.1假設檢驗根據樣本的信息檢驗關于總體的某個假設是否正確。參數假設檢驗非參數假設檢驗讓我們先看一個例子:參數假設檢驗罐裝可樂的容量按標準為355毫升。生產流水線上罐裝可樂不斷地封裝,然后裝箱外運。怎么知道這批罐裝可樂的容量是否合格呢?通常的辦法是進行抽樣檢查:如每隔1小時,抽查5罐,得到一個容量為5的子樣(x1,…,x5)。每隔一定時間,抽查若干罐。如何根據這些值來判斷生產是否正常?在正常生產條件下,由于種種隨機因素的影響,每罐可樂的容量應在355毫升上下波動。這些因素中沒有哪一個占有特殊重要的地位。因此,根據中心極限定理,假定每罐容量服從正態分布是合理的。要檢驗的假設:H0:(=355)對立假設:H1:稱
H0為原假設(零假設);稱H1為備擇假設(對立假設)。在實際工作中,往往把不輕易否定的命題作為原假設。如何判斷原假設H0
是否成立?對差異作定量的分析,以確定其性質:
差異可能是由抽樣的隨機性引起的,稱為“抽樣誤差”或隨機誤差合理的界限在何處?應由什么原則來確定?必須認為這個差異反映了事物的本質差別,即反映了生產已不正常。這種差異稱作“系統誤差”
帶概率性質的反證法小概率事件在一次試驗中基本上不會發生。方法:原則:例這里有兩個盒子,各裝有100個球。另一盒中的白球和紅球數99個白球一個紅球…99個一盒中的白球和紅球數99個紅球一個白球…99個現從兩盒中隨機取出一個盒子,問這個盒子里是白球99個還是紅球99個?假設:這個盒子里有99個白球。從中隨機摸出一個:p=1/100
是小概率事件小概率事件在一次試驗中基本上不會發生。我們有很大的把握說:原假設:“這個盒子里有99個白球。”
不成立一般的反證法要求在原假設成立的條件下導出的結論是絕對成立的,如果事實與之矛盾,則完全絕對地否定原假設。概率反證法的邏輯是:如果小概率事件在一次試驗中居然發生,我們就以很大的把握否定原假設。“小概率”該多小?在假設檢驗中,我們稱這個小概率為顯著性水平,用表示。的選擇要根據實際情況而定。常取現在回到我們前面罐裝可樂的例中:H0:(=355)H1:對給定的顯著性水平
,可以在N(0,1)表中查到分位點的值,使0也就是說,“”是一個小概率事件。W:為拒絕域如果由樣本值算得該統計量的實測值落入區域W,則拒絕H0
;否則,不能拒絕H0。這里所依據的邏輯是:如果H0
是對的,那么衡量差異大小的某個統計量落入區域W(拒絕域)是個小概率事件。如果該統計量的實測值落入W,也就是說,H0成立下的小概率事件發生了,那么就認為H0不可信而否定它。否則我們就不能否定H0
(只好接受它)。不否定H0并不是肯定H0
一定對,而只是說差異還不夠顯著,還沒有達到足以否定H0的程度。所以,假設檢驗又叫“顯著性檢驗”。如果在很小的情況下H0仍被拒絕了,則說明實際情況很可能與之有顯著差異。基于這個理由,人們常把時拒絕H0稱為是顯著的,而把在時拒絕H0稱為是高度顯著的。假設檢驗的一般步驟:
1.提出原假設和備擇假設;
2.取一檢驗統計量,在H0成立下求出它的分布;3.對給定的顯著性水平α,查表確定臨界值,從而得否定域
;
4.將樣本值代入算出統計量的實測值,并以此作出結論。
例1
某工廠生產的一種螺釘,標準要求長度是32.5毫米.實際生產的產品,其長度X假定服從正態分布未知,現從該廠生產的一批產品中抽取6件,得尺寸數據如下:32.56,29.66,31.64,30.00,31.87,31.03問這批產品是否合格?統計解:已知X~未知。
得拒絕域:W:|t|>4.0322對給定的顯著性水平=0.01,查表計算
<4.0322沒有落入拒絕域結論:不能拒絕H0,這批產品合格。假設檢驗會不會犯錯誤呢?小概率事件在一次試驗中基本上不會發生。不是一定不發生我們使用的原則是:兩類錯誤第一類錯誤如果H0成立,但統計量的實測值落入拒絕域,從而作出拒絕H0的結論,那就犯了“以真為假”的錯誤。第二類錯誤如果H0不成立,但統計量的實測值未落入拒絕域,從而作出接受H0的結論,那就犯了“以假為真”的錯誤。請看下表P{拒絕H0|H0為真}=
,
H0為真實際情況決定
拒絕H0接受H0
H0不真第一類錯誤正確正確第二類錯誤P{接受H0|H0不真}=.受控未受控
兩類錯誤是互相關聯的,當樣本容量固定時,一類錯誤概率的減少導致另一類錯誤概率的增加。
要同時降低兩類錯誤的概率,或者要在不變的條件下降低,需要增加樣本容量。例2
某織物強力指標X的均值=21公斤.改進工藝后生產一批織物,今從中取30件,測得=21.55公斤。假設強力指標服從正態分布且已知=1.2公斤,問在顯著性水平=0.01下,新生產織物比過去的織物強力是否有提高?解:提出假設:右邊檢驗拒絕域為:代入=1.2,n=30,并由樣本值計算得統計量Z的實測值:>2.33故拒絕原假設H0,認為:新生產織物比過去的織物強力有顯著提高。=2.33計算單邊檢驗:{雙邊檢驗:右邊檢驗:左邊檢驗:§8.2正態總體均值的假設檢驗(一)單個正態總體均值的檢驗雙邊檢驗:檢驗統計量:拒絕域為:
右邊檢驗:拒絕域為:左邊檢驗:拒絕域為:
檢驗統計量:雙邊檢驗:拒絕域為:右邊檢驗:拒絕域為:左邊檢驗:拒絕域為:例3
某種元件的壽命X(以小時計)服從正態分布N(,
2),,2均未知。現測得16只元件的壽命如下:
159280101212224379179264222362168250149260485170
問是否有理由認為元件的平均壽命大于225(小時)?統計解:按題意需檢驗:H0:≤0=225H1:>225檢驗統計量:拒絕域為現在n=16取
=0.05=1.7531<1.7531計算沒有落在拒絕域中,故接受H0,即認為元件的平均壽命不大于225小時。(二)兩個正態總體均值差的檢驗
檢驗統計量?檢驗統計量:雙邊檢驗:右邊檢驗:拒絕域為:左邊檢驗:拒絕域為:拒絕域為:
檢驗統計量:雙邊檢驗:右邊檢驗:拒絕域為:左邊檢驗:拒絕域為:拒絕域為:例4
在平爐上進行一項試驗以確定改變操作方法的建議是否會增加鋼的得率,試驗是在同一只平爐上進行的。每煉一爐鋼時除操作方法外,其它條件都盡可能做到相同。先用標準方法煉一爐,然后用建議的新方法煉一爐,以后交替進行,各煉了10爐,其得率分別為
(1)標準方法
78.172.476.274.377.478.476.075.576.777.3
(2)新方法
79.181.077.379.180.079.179.177.380.282.1
設這兩個樣本相互獨立,且分別來自正態總體N(1,2)和N(2,2)
,1,2,2均未知。問建議的新操作方法能否提高得率?(取=0.05.)返回計算解:需要檢驗假設檢驗統計量:分別求出標準方法和新方法下的樣本均值和樣本方差:拒絕域為:又樣本觀察值t=-4.295<-1.7341,落入拒絕域,所以拒絕H0,即認為建議的新操作方法較原來的方法為優。§8.3正態總體方差的假設檢驗(一)單個正態總體方差的檢驗檢驗統計量:雙邊檢驗:拒絕域為:右邊檢驗:拒絕域為:左邊檢驗:拒絕域為:例5
某廠生產的某種型號的電池,其壽命(以小時計)長期以來服從方差2=5000的正態分布,現有一批這種電池,從它的生產情況來看,壽命的波動性有所改變。現隨機取26只電池,測出其壽命的樣本方差s2=9200。問根據這一數據能否推斷這批電池的壽命的波動性較以往的有顯著變化(取=0.02)?解:本題要求在水平=0.02下檢驗假設拒絕域為:檢驗統計量:=46=44.314=11.524拒絕H0,認為這批電池壽命的波動性較以往的有顯著的變化。計算(二)兩個正態總體方差比的檢驗檢驗統計量:雙邊檢驗:拒絕域為:右邊檢驗:拒絕域為:右邊檢驗:拒絕域為:解:
此處n1=n2=10,=0.01,例6
試對例4中的數據檢驗假設:
H0:12=22,H1:12
22(取=0.01)=6.54檢驗統計量:拒絕域為:例4計算現在s12=3.325
s22=2.225
故接受H0
,認為兩總體方差相等。F=s12/s22=1.49,即有0.153<F
<6.54有人推測,矮個子的人比高個子的人長壽這個結論對嗎?我們來做一個檢驗。GeorgeWashington1stPresident
Stature:6’2”(188cm)
Born:February22,1732Died:December14,1799(67)美國歷屆總統資料
JohnAdams
2ndPresidentStature:5’6”(168cm)Born:October30,1735Died:July4,1826(90)
美國歷屆總統資料ThomasJefferson3ndPresidentStature:6’2.5”(189cm)Born:April13,1743Died:July4,1826(64)美國歷屆總統資料JamesMadison4thPresident
Stature:5‘4“(163cm)Born:March16,1751Died:June28,1836(85)美國歷屆總統資料美國歷屆總統資料JamesMonroe
5thPresident
Stature:6‘(183cm)Born:April28th,1758Died:July4,1831(73)美國歷屆總統資料JohnQuincyAdams6thPresident
Stature:5‘7“(171cm)Born:July11,1767
Died:February23,1848(80)美國歷屆總統資料AndrewJackson
7thPresident
Stature:6‘1“(171cm)Born:March15,1767Died:June8,1845
(78)美國歷屆總統資料MartinVanBuren
8thPresident
Stature:5‘6“(168cm)Born:December5,1782Died:July24,186(79)美國歷屆總統資料
WilliamHenryHarrison
9thPresident
Stature:5‘8“(173cm)Born:February9,1773Died:April4,1841(68)美國歷屆總統資料JohnTyler
10thPresident
Stature:6‘(183cm)Born:March29,1790Died:January18,1862
(71)美國歷屆總統資料JamesK.Polk
11thPresident
Stature:5‘8“(173cm)Born:November2,1795Died:June15,1849(53)美國歷屆總統資料ZacharyTaylor12thPresident
Stature:5‘8“(173cm)Born:November24,1784Died:July9,1850(65)美國歷屆總統資料MillardFillmore13rdPresident
Stature:5‘9“(175cm)Born:January7,1800Died:March8,1874(74)美國歷屆總統資料
FranklinPierce
14thPresident
Stature:5‘10“(178cm)Born:November23,1804Died:October8,1869(64)美國歷屆總統資料UlyssesS.Grant18thPresident
Stature:5‘8.5“(174cm)Born:April27,1822Died:July23,1885
(63)美國歷屆總統資料RutherfordB.Hayes
19thPresident
Stature:5‘8.5“(174cm)Born:October4,1822Died:October4,1822(70)
美國歷屆總統資料BenjaminHarrison
23thPresident
Stature:5‘6“(168cm)Born:August20,1833Died:March13,1901(67)美國歷屆總統資料HarrySTruman
33rdPresident
Stature:5‘9“(175cm)Born:May8,1884Died:December26,1972(88)矮個子總統高個子總統總統壽命總統壽命總統壽命Madison85W.Harrison68Wilson67VanBuren79Polk53Hoover90B.Harrison67Taylor65Monroe73J.Adams90Grant63Tyler71J.Q.Adams80Hayes70Buchanan77Truman88Taft72Fillmore74Harding57Pierce64Jackson78A.Johnson66Washington67T.Roosevelt60Arthur56Coolidge60F.Roosevelt63Eisenhower78L.Johnson64Cleveland71Jefferson83SPSS§8.4分布擬合檢驗可能遇到這樣的情形,總體服從何種理論分布并不知道,要求我們直接對總體分布提出一個假設。例如,從1500到1931年的432年間,每年爆發戰爭的次數可以看作一個隨機變量,椐統計,這432年間共爆發了299次戰爭,具體數據如下:戰爭次數X01234
22314248154
發生X次戰爭的年數上面的數據能否證實X
服從Poisson分布的假設是正確的?返回又如,某工廠制造一批骰子,聲稱它是均勻的。也就是說,在投擲中,出現1點,2點,…,6點的概率都應是1/6。為檢驗骰子是否均勻,把骰子實地投擲6000次,統計各點出現的次數。得到的數據能否說明“骰子均勻”的假設是可信的?點數123456次數910111010301050960940再如,某鐘表廠對生產的鐘進行精確性檢查,抽取100個鐘作試驗,撥準后隔24小時以后進行檢查,將每個鐘的誤差(快或慢)按秒記錄下來。該廠生產的鐘的誤差是否服從正態分布?解決這類問題的工具是英國統計學家K.皮爾遜在1900年發表的一篇文章中引進的所謂
檢驗法。這是一項很重要的工作,不少人把它視為近代統計學的開端。
K.皮爾遜
檢驗法是在總體X的分布未知時,根據來自總體的樣本,檢驗關于總體分布的假設的一種檢驗方法。是一種非參數檢驗。
我們先提出原假設:
H0:總體X的分布函數為F(x)然后根據樣本的經驗分布和所假設的理論分布之間的吻合程度來決定是否接受原假設.這種檢驗通常稱作擬合優度檢驗。分布擬合的檢驗法的基本原理和步驟如下:1.
將總體X的取值范圍分成k個互不重迭的小區間,記作A1,A2,…,Ak
.2.
把落入第i個小區間Ai的樣本值的個數記作fi
,稱為實測頻數。所有實測頻數之和f1+f2+…+fk等于樣本容量n。3.
根據所假設的理論分布,可以算出總體X的值落入每個Ai的概率
pi
,于是
npi
就是落入Ai的樣本值的理論頻數。樣本與理論分布之間的差異的大小。
皮爾遜引進如下統計量表示經驗分布與理論分布之間的差異:皮爾遜證明了如下定理:若原假設中的理論分布F(x)已經完全給定,那么當
時,統計量:漸近服從自由度為
k-1
的分布。如果F(x)中有r
個未知參數需用相應的估計量來代替,那么當時,統計量漸近服從自由度為
k-r-1
的分布。查分布表可得臨界值,使得根據這個定理,對給定的顯著性水平,得拒絕域:(不需估計參數)(估計r個參數)如果根據所給的樣本值X1,X2,…,Xn
算得統計量的實測值落入拒絕域,則拒絕原假設,否則就認為差異不顯著而接受原假設。
皮爾遜定理是在n無限增大時推導出來的,因而在使用時要注意n足夠大,以及npi不太小這兩個條件。
根據計算實踐,要求
n不小于50,以及npi
都不小于5。否則應適當合并區間,使npi滿足這個要求。例1:檢驗骰子是否均勻我們先提出原假設:
H0:總體X為均勻分布
點數123456次數9101110103010509609403.610001/694062.510001/61050412.110001/6111021.610001/696050.910001/6103038.1010001/69101npipifiAi11.071拒絕H0骰子不均勻!例2:檢驗每年爆發戰爭次數分布是否服從Poisson分布。H0:
X服從參數為的Poisson分布的極大似然估計為:=0.69戰爭次數X01234發生X次戰爭的年數22314248154例2pi的估計是:i=0,1,2,3,4計算結果列表如下:X01234Σfi223142481540.580.310.180.010.02216.7149.551.612.02.160.1830.3760.25114.161.6232.43自由度為:4-1-1=2=5.991=2.43<5.991,認為每年發生戰爭的次數X服從參數為0.69的Poisson分布。不能拒絕H0計算在此,我們以遺傳學上的一項偉大發現為例,說明統計方法在研究自然界和人類社會的規律性時,是起著積極的、主動的作用。奧地利生物學家孟德爾進行了長達八年之久的豌豆雜交試驗,并根據試驗結果,運用他的數理知識,發現了遺傳的基本規律。孟德爾子二代子一代…黃色純系…綠色純系根據他的理論,子二代中,黃、綠之比近似為3:1,他的一組觀察
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國超級汽車防凍液行業市場發展前景及發展趨勢與投資戰略研究報告(2024-2030)
- 2018-2024年中國羅漢果茶市場行情動態分析及發展前景趨勢預測報告
- 氣候變化應對下的農業韌性研究-洞察闡釋
- 新興產業投資風險規避策略-洞察闡釋
- 專用工裝夾具行業深度研究報告
- 專科疾病防治信息化平臺構建與應用-洞察闡釋
- 高等物理實驗教學中問題驅動式學習的研究-洞察闡釋
- 機械緞造項目投資可行性研究分析報告(2024-2030版)
- 液壓啟閉機項目投資可行性研究分析報告(2024-2030版)
- 2025年中國水下機器人設備行業市場全景調研及投資規劃建議報告
- 腦干損傷護理常規
- MOOC 數值天氣預報-南京信息工程大學 中國大學慕課答案
- 跨座式單軌交通工程接觸網系統技術標準
- 教師口語智慧樹知到期末考試答案2024年
- 從乙醇的結構看其發生化學反應時鍵的斷裂位置和方式
- 2024年江西贛州旅游投資集團限公司招聘13人高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 小學信息技術所有知識點大匯總(最全)
- 好老師是民族的希望
- 項目建設審批流程課件
- 2024高海拔地區模塊化增壓式建筑技術標準
- 零碳建筑評價標準
評論
0/150
提交評論