第三章統計推斷_第1頁
第三章統計推斷_第2頁
第三章統計推斷_第3頁
第三章統計推斷_第4頁
第三章統計推斷_第5頁
已閱讀5頁,還剩43頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第三章統計推斷 第三章 統計推斷 第三章統計推斷 3.1 統計學的基本概念 數據不確定性來源: (1) 測量過程引入的隨機誤差; (2) 取樣隨機性所帶來的變化; (3) 我們所關心的性質確實發生了某種變化。 統計學的基本任務:從包含有隨機誤差,又 并不完全的信息中得出科學的、盡可能正確 的結論。 統計結論并不是絕對可靠。 第三章統計推斷 統計推斷的兩種途徑統計推斷的兩種途徑 假設檢驗 : (1) 根據目標建立統計假設; (2) 根據統計假設建立理論分布; (3) 根據分布計算實驗結果出現的可能性; (4) 若可能性小于給定標準,則拒絕假設; 否則接受假設。 假設檢驗包括參數檢驗和非參數檢驗。

2、 第三章統計推斷 參數估計 l點估計:結果出現的條件下該參數可能性最 大的取值。 l區間估計:給出一個區間,并給出指定參數 落入這一區間的概率。 參數估計與假設檢驗所依據的統計學理 論其實是一樣的,它們的區別只是以不 同形式給出結果而已。 第三章統計推斷 統計學常用術語統計學常用術語 個體個體:可以單獨觀測和研究的一個物體,一 定量的材料或服務。也指表示上述物體,材 料或服務的一個定量或定性的特性值。 總體總體:一個統計問題中所涉及的個體的全體。 特性特性:所考查的定性或定量的性質或指標。 總體分布總體分布:當個體理解為定量特性值時,總 體中的每一個個體可看成是某一確定的隨機 變量的一個觀測值

3、,稱這個隨機變量的分布 為總體分布。 第三章統計推斷 樣本樣本:按一定程序從總體中抽取的一組 (一個或多個)個體。 樣本量樣本量:樣本中所包含的個體數目。 觀測值觀測值:作為一次觀測結果而確定的特 性值。 統計量統計量:樣本觀測值的函數,它不依賴 于未知參數。例如: l樣本均值樣本均值: l樣本方差: n i i x n x 1 1 n i i xx n S 1 22 )( 1 1 第三章統計推斷 抽樣分布 樣本線性函數的分布樣本線性函數的分布 若X1,X2,Xn為一簡單隨機樣本,其總體 分布為N(,2), 統計量u為: u=a1X1+a2X2+anXn , 其中a1,a2,an 為常數,則u

4、也為正態隨 機變量,且 n i i n i i auD auE 1 2 2 1 )( )( 第三章統計推斷 若取ai=1/n, i=1,2,n,則u= 為樣本 均值。此時 2分布分布: 設X1,X2 Xn相互獨立,且同服從 N(0, 1),則稱隨機變量 所服從的分布為2分布,記為Y2(n), n 稱為它的自由度。 X 2 1 )(,)( n XDXE n i i XY 1 2 第三章統計推斷 t分布分布:設XN(0,1),Y2(n),且 X,Y互相獨立,則稱隨機變量 所服從的分布為t分布,記為Tt(n)。n稱 為它的自由度。 F分布:分布:設X2(m),Y2(n),且 互相獨立,則稱隨機變量

5、所服從的分布為F分布,記為FF(m,n), (m,n)稱為它的自由度。 nY X T / nY mX F / / 第三章統計推斷 正態總體正態總體 樣本均值與方差的分布樣本均值與方差的分布 定理:若X1,X2Xn為抽自總體N(,2)的 簡單隨機樣本,定義樣本均值為: 樣本方差為: 則有: (1) 與S2相互獨立; (2) (3)(n-1)S2/22 (n-1)。 n i i X n X 1 1 2 1 2 )( 1 1 n i i XX n S X ) 1 ,( 2 第三章統計推斷 推論1:統計量 推論2:若X 1 ,X 2 ,X m 為取自總體 N(1,12)的樣本,Y1,Y2Yn為取自總體

6、 N(2,22)的樣本,且它們互相獨立,則: 其中S12, S22 分別為X1,Xm,Y1,Yn的 樣本方差。 ) 1( / nt nS X T ) 1, 1( 2 1 2 2 2 2 2 1 nmF S S F 第三章統計推斷 推論3:在推論2的條件下,若1=2,則: )2( ) 11 ( ) 1() 1( ) 1() 1( )()( 2 2 2 1 21 nmt nmnm SnSm YX T 第三章統計推斷 假設檢驗的基本方法假設檢驗的基本方法 與兩種類型的錯誤與兩種類型的錯誤 例3.1 某地區10年前普查時,13歲男孩 子平均身高為1.51m,現抽查200個12.5 歲到13.5歲男孩,

7、身高平均值為1.53m, 標準差0.073m,問10年來該地區男孩身 高是否有明顯增長? 第三章統計推斷 假設的建立 l零假設:記為H0,針對要考查的內容提出。原 則為: l通過統計檢驗決定接受或拒絕H0后,可對問題作出 明確回答; l要能根據H0建立統計量的理論分布。 l備擇假設:記為HA,是除H0外的一切可能值的 集合。原則為: l應包括除H0外的一切可能值; l如有可能,應縮小備擇假設范圍以提高檢驗精度。 第三章統計推斷 小概率原理:小概率事件在一次觀察中 不應出現。 兩種類型的錯誤及其關系: l第一類錯誤:H0正確,卻被拒絕。又稱棄真。 犯這種錯誤的概率記為。 l第二類錯誤:H0錯誤,

8、卻被接受。又稱存偽。 犯這種錯誤的概率記為。 單側與雙側檢驗:在相同時,單側檢驗 的值小于雙側檢驗。 顯著性水平的選擇 :主要依據是犯了兩 類錯誤后的危害性大小。 的常用值為:0.05, 0.01。 第三章統計推斷 3.3 正態總體的假設檢驗正態總體的假設檢驗 檢驗針對正態分布的兩個參數:和。 單樣本檢驗 :全部樣品都抽自一個總體, 檢驗的目的通常是或是否等于某一數 值 。 雙樣本檢驗:有分別抽自不同總體的兩 個樣本,檢驗的目的是看這兩個總體的 或是否相等。 第三章統計推斷 單樣本檢驗步驟 建立假設,包括H0與HA lH0 :表達式中應包含等號。數值來源: 經驗、理論、實際要求 lHA :應包

9、括除H0外的一切可能值。應優先 選取單側檢驗 。 選擇顯著性水平 最常用的數值是0.05 和0.01。 第三章統計推斷 選擇統計量及其分布 l統計量:均值: ;方差:S2 。 l檢驗均值: l總體方差2已知: l總體方差2未知: l檢驗方差: X ) 1 , 0( / 0 N n X u 1)-t(n / 0 ) 1( ) 1( 2 2 0 2 2 n Sn 第三章統計推斷 建立拒絕域 l確定是單側檢驗還是雙側檢驗 ; l根據統計量的分布和值查出分位數取值, 從而建立拒絕域 。 計算統計量,并對結果作出解釋 l把樣本觀測值代入統計量公式,求得統計量 取值 ; l檢查是否落入拒絕域 ,作出統計結

10、論; l對原問題作出明確回答。 第三章統計推斷 雙樣本檢驗步驟 目標:檢驗兩個總體參數是否相等。 步驟與單樣本基本相同 ,統計量和分布 都有所變化。 檢驗兩個方差是否相等檢驗兩個方差是否相等: F檢驗。 ) 1, 1( 2 2 2 1 nmF S S F 第三章統計推斷 檢驗兩個均值是否相等:檢驗兩個均值是否相等: l兩總體方差已知:u檢驗 若H0成立,則有: ) 1 , 0( 2 2 2 1 2121 N nm XX u ) 1 , 0( 2 2 1 21 N nm XX u 第三章統計推斷 兩總體方差未知,但它們相等(相當于第 一步F檢驗已通過的情況):t檢驗。 在H0:1=2成立的條件下

11、,有: n = m時,可簡化為: ) 2( ) 11 ( 2 ) 1() 1( 2 2 2 1 21 nmt nmnm SnSm XX t )22( )( 1 2 2 2 1 21 nT SS n XX t 第三章統計推斷 兩總體方差未知,且不等(相當于第一 步F檢驗未通過的情況):近似t檢驗。 近似服從t分布,其自由度為: 其中 n S m S XX t 2 2 2 1 21 1 22 ) 1 )(1 1 (df )( 2 2 2 1 2 1 n S m S m S k 第三章統計推斷 配對數據檢驗步驟 配對數據:每對材料各種條件盡可能一 致,然后分別作不同處理。 檢驗方法:取每對材料測量值

12、的差為統 計對象,進行單樣本檢驗。H0 : d = 0 配對法與成組法的比較: iii iiii i ii i iid xxxxxxxx xxxx xxxxSn )()(2)()( )()( )()() 1( 2211 2 22 2 11 2 2211 2 2121 2 第三章統計推斷 由于 所以有 i i xx n S 2 11 2 1 )( 1 12 22 2 2 )( 1 1 i i xx n S 2 2 2 1 221112 )( )( 1 1 SSr xxxx n S i i i 2 2 2 1 2 2 2 1 2 2SSrSSS d 第三章統計推斷 百分數的檢驗 用途:檢驗大樣本、

13、兩點分布總體中概率p 是否相同 模型: ,欲檢驗H0: p1 = p2 方法:由中心極限定理,若H0成立, 應有: 故有: 近似服從N(0,1) 2 2 2 1 1 1 , n x p n x p pq nn xx p nn qpNpp1,), 11 ( , 0( 21 21 21 21 且近似服從 ) 11 ( 21 21 nn qp pp u 第三章統計推斷 3.4 3.4 參量估計參量估計 點估計:利用樣本構造一個統計量,用 它來作為總體參數的估計值。 l無偏性:即要求估計量的數學期望應等于所 求的總體參數。 l有效性:當樣本含量n相同時,方差小的估 計量稱為更有效。 l一致性。設Tn(

14、x1, x2, xn)為參數的估計量, 若對任意 0, 有 則稱Tn為的一致估計量。 0)(lim n n TP 第三章統計推斷 .點估計常用方法: l矩估計:總體分布的各階原點矩可視為參數1, 2,r的函數。用樣本的前r 階原點矩作為總 體分布的前r階原點矩的估計值,則可得到r個方 程,從而可解出各參數。 l極大似然估計 :定義樣本似然函數為: L(x1, x2, xn ;)= f (x1,) f (x2,) f (xn,)對于 一組固定的樣本觀測值x1 , x2 , xn來說,L是參 數的函數。使L達到極大的的取值就稱為該參 數的極大似然估計。它應滿足以下的似然方程: 0 )(ln d L

15、d 第三章統計推斷 區間估計 目標:確定未知參數以給定概率落入其 中的區間的邊界。 參數落入置信區間的概率稱為置信水平, 等于1。 正態總體與2的置信區間:根據接受域 對未知參量解不等式,即得到所求的置 信區間。 第三章統計推斷 二項分布中P的置信區間 : ln30, 且0.1 x/n 30, 且x/n=0.9時,可采 用泊松近似。近似公式為: 式中 , 為 分布的分位數,依單側或雙側區間a 可取值或 /2. 1, 0, 12 2 接近當 接近當 n x xn xn n x xn P L 2)(2 2 1 ),2( 2 1 2 1 2 xnx aa 2 1 2 aa 和 2 第三章統計推斷 正

16、態總體區間估計 與顯著性檢驗的關系 來自于同一不等式,結果是一致的。 直觀上有一定差異。顯著性檢驗是把 H0:=0視為固定常數,依據它建立理論 分布,再來判斷實際觀察值是否小概率 事件;區間估計則是把觀察值視為最可 能的的取值(點估計),再以它為中心建 立一個區間,并給出母體參數落入這一 區間的概率(置信水平)。 第三章統計推斷 3.5 非參數檢驗 : 2 2檢驗檢驗 Pearson定理:當(P1,P2,Pr)是總 體的真實概率分布時,統計量 隨n的增加漸近于自由度為r-1的2分布。 r i i ii np npn 1 2 2 )( 第三章統計推斷 Pearson統計量的另一種形式: 顯然,上

17、述數據應滿足: 使用條件: l各理論值均大于5。 l若自由度為1,則應作連續性矯正: r i i ii T TO 1 2 2 )( r i i r i i pnO 11 1, r i i ii T TO 1 2 2 )5 . 0( 第三章統計推斷 Pearson統計量只用上單側檢驗。 Pearson統計量的應用 : l吻合度檢驗:用于檢驗總體是否服從 某個指定分布。 l列聯表的獨立性檢驗 :用于檢驗兩個 事件是否獨立 。 注意當理論分布中用到估計量時, Pearson統計量的自由度應相應變化 第三章統計推斷 吻合度檢驗 方法為: l把x的值域分為r個不相重合的區間,再 計算在指定的分布下,x落

18、入每一區間 的概率pi l統計樣本含量為n的抽樣中,觀察值落 入各區間的次數Oi l用Pearson統計量進行檢驗 第三章統計推斷 列聯表的獨立性檢驗 例3.22 下表是對某種藥的試驗結果: 問給藥方式對藥效果是否有影響? 給藥方式有效無效 口服5840 注射6431 第三章統計推斷 算法:理論值Ti = (行總數列總數)/總數, 然后可用Pearson統計量對H0: OT = 0 (或行與列獨立)進行檢驗。 自由度:(總行數1)(總列數1)。 特殊單側檢驗:用2 分位數。 第三章統計推斷 離散分布的統計檢驗 離散分布尾區建立原則離散分布尾區建立原則:從實際觀察值 開始,把對H0成立不利的方向

19、上的概率 全加起來,作為尾區的概率。 第三章統計推斷 22列聯表的精確檢驗 22列聯表概率的計算方法列聯表概率的計算方法:設4個格的 取值分別為:a,b,c,d。令N=a+b+c+d, 事件E為保持各行,列總數不變,事件F 為各格取值為a,b,c,d,則有: ! )!()!()!()!( )( )( )( )( )( dcbaN dbcadcba CC CCC EP FP EP EFP EFP ca N ba N c dc b dcb a N 第三章統計推斷 尾區建立方法: l若a,b,c,d中任何一個為0,則可用上式算出 的P值與或/2比較。 l若各格取值均不為0,按離散分布建立尾區, 進行

20、統計檢驗。 第三章統計推斷 3.6 3.6 非參數檢驗非參數檢驗 共同特點: l不要求總體服從正態分布。 l常可用于定性數據。 秩和檢驗秩和檢驗 符號檢驗符號檢驗 游程檢驗游程檢驗 秩相關檢驗秩相關檢驗 第三章統計推斷 秩和檢驗秩和檢驗 用途:檢驗兩組或多組數據平均數是否 相等。 與t檢驗的不同點:不要求正態母體,只 要求樣本互相獨立。 方法:把全部數據放在一起,從小到大 排列,每個數據的位置編號就稱為秩。 然后再把數據按處理的不同分開,分別 計算各處理的秩和,并以它為統計量。 第三章統計推斷 兩總體秩和檢驗:H0:各處理效應相同。 P(n個秩的和為某值)= 當n時,T漸近正態分布 多總體秩和檢驗 l要求:每個總體的樣本含量ni5, 總樣本含量N15

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論