六西格瑪之分析階段 S8 43 中心極限定理 課件_第1頁
六西格瑪之分析階段 S8 43 中心極限定理 課件_第2頁
六西格瑪之分析階段 S8 43 中心極限定理 課件_第3頁
六西格瑪之分析階段 S8 43 中心極限定理 課件_第4頁
六西格瑪之分析階段 S8 43 中心極限定理 課件_第5頁
已閱讀5頁,還剩51頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

中心極限定理

(CentralLimitTheorem

)

中心極限定理

(CentralLimitTheoreDefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的選定

多變量研究

中心極限定理

假設檢驗

置信區間

方差分析,均值檢驗

卡方檢驗

相關/回歸分析Step7-Data收集路徑位置理論課DefineMeasureAnalyzeImproveCon

定義

中心極限定理的應用1.正態分布的例子2.Chi-Square分布的例子

標準誤差與樣本大小的關系目錄定義目錄定義中心極限定理是闡述大量隨機變量之和的極限分布是正態分布的一系列定理的總稱。最常用的有:獨立同分布中心極限定理:

“隨機變量x1,x2,…獨立,且服從同一分布,若存在有限的數學期望E(xi)=u和方差D(xi)=σ2,當n→∞時,隨機變量的總和Σxi趨于均值為nu,方差為nσ2的正態分布。(即算術平均數1/nΣxi=xbar趨于均值為u,方差為σ2/n的正態分布)”不論總體服從何種分布,只要它的數學期望和方差存在,從中抽取容量為n的樣本,則這個樣本的總和或平均數是隨機變量,當n充分大時,Σxi或xbar趨于正態分布。定義中心極限定理是闡述大量隨機變量之和的極限分布是正態分布的定義德莫佛-拉普拉斯中心極限定理:“如果用X表示n次獨立試驗中事件A發生(“成功”)的次數,P是事件A在每次試驗中發生的概率,則X服從二項分布,B(n,p),當n→∞時,X趨于均值為np,方差為npq的正態分布。”正態分布和泊松分布都是二項分布的極限分布當n足夠大時,可用正態分布近似計算;當n足夠大且p小時,可用泊松分布近似計算。中心極限定理是一種十分重要的現象,它是統計學中應用的許多方法的理論基礎的組成部分(如:計算樣本均值的置信區間)

定義德莫佛-拉普拉斯中心極限定理:利用同樣的數據畫出兩種不同的控制圖,并仔細比較它們的差異:

打開文件[CENLIMIT.MTW

].

分別用下面的兩個路徑畫出個體圖和子群大小為5的均值圖個體圖路徑均值圖路徑應用應用圖形輸出個體數據樣本平均

仔細比較兩個圖上的控制上下線(UCL和LCL),有什么不同?應用圖形輸出個體數據樣本平均仔細比較兩個圖上的控制上下線(UC個體控制圖和

Xbar控制圖的差異μ15100102030405060應用個體控制圖和Xbar控制圖的差異均值分布的標準偏差叫做

均值標準誤差,因而其定義為:這個公式表明平均值比個體數據更穩定,穩定因子是樣本數的平方根。σsx==均值標準誤差個體值的標準差n=平均值的樣本數x均值的標準誤差(StandardErroroftheMean)其中平均值分布的標準偏差叫做均值標準誤差,因而其定義為:σs 我們經常依靠從測量系統中得到的一個數值來估計輸入或輸出變量的值。減小測量系統誤差的簡易方法就是把兩個或更多的讀數平均。我們的測量系統的精密度自動增加,增加因子是平均值樣本數的平方根,如果我們要想使測量系統的誤差減小一半,我們就需要把4次的測量值平均才可以。實際應用測量系統的改善 我們經常依靠從測量系統中得到的一個數值來估計輸入或當總體數據具備正態分布時中心極限定理理解例題模擬-1假設你面前有一個大桶,桶里面裝有相當多數量的白色紙條,每張紙條上都寫有數字,且假定這些數字都來自一個具有特定平均值和標準偏差的正態分布.

1)從中隨機抽出9張白色紙條,并把其上面的9個數字求平均,

2)然后把這個平均值寫在一張綠色紙條上,

3)把這9張白色紙條放回原來的桶里,

4)把這張綠色紙條放入另外一個桶里,如此重復上面的步驟,直到盛有綠色紙條的桶放滿為止。白色紙條代表總體的數據;綠色紙條代表平均值的樣本;我們用MINITAB來模擬做這個練習。當總體數據具備正態分布時中心極限定理理解例題模擬-1假設你讓我們用MINITAB產生一些模擬的數據來驗證我們的理論。首先用MINITAB產生9列各250個數據,假設這些數據來自一個平均值=70、標準偏差=9的正態分布:則列C1-C9代表白色紙條然后求出各行9個數據的平均值,其結果放在列C10,則C10代表綠色紙條。我們用描述統計的方法求出各列數據的平均和標準偏差。仔細比較C1-C9列與C10列有什么差別?

[例題1]中心極限定理應用模擬[例題1]中心極限定理應用模擬1、用MINITAB隨機產生樣本數據分別輸入下列信息1、用MINITAB隨機產生樣本數據分別輸入下列信息2、樣本平均數計算2、樣本平均數計算3、輸出:產生10列數據[注意:每次每個人操作產生的數據都不一樣]3、輸出:產生10列數據[注意:每次每個人操作產生的數據都不4、描述統計路徑4、描述統計路徑5、描述統計結果比較描述性統計:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10

平均值變量NN*平均值標準誤標準差最小值下四分位數中位數上四分位數C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.1805、描述統計結果比較描述性統計:C1,C2,C3,C5、描述統計結果比較(續)描述性統計:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10

平均值變量NN*平均值標準誤標準差最小值下四分位數中位數上四分位數C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.180現在開始比較。5、描述統計結果比較(續)描述性統計:C1,C2,C3樣本的散布(C9)和樣本平均的散布(C10)進行比較。散布減少了很多.σ=

8.988σ=2.9306、直方圖結果比較樣本的散布(C9)和樣本平均的散布(C10)進行比較。散布σ用點圖比較頻度數則能夠更明確的了解散布。7、點圖結果比較用點圖比較頻度數則能夠更明確的了解散布。7、點圖結果比較樣本平均值分布的平均值和總體的平均值十分接近;樣本平均值分布的標準偏差等于總體的標準偏差除以樣本數的平方根;樣本平均值的分布十分接近正態分布。8、結論8、結論

當總體數據是非正態分布時,若從中隨機抽樣n個并計算其平均,同樣如此反復若干次,然后比較這些平均的散布與這些個體值的散布,你會發現,當n→∞時,x-bar的散布也具有正態分布。為了驗證,我們在非正態分布中隨機選擇一個偏移較大的分布-“Chi-Square分布”,求其x-bar來體會一下中心極限定理。

當總體數據不具備正態分布時中心極限定理理解例題模擬-2當總體數據是非正態分布時,若從中隨機抽樣n個并計算其平均,1、用卡方分布隨機產生9列,每列各有250個數據1、用卡方分布隨機產生9列,每列各有250個數據2、用產生的數據進行點圖描繪和正態檢驗

在這里看到,這是一個很偏移的分布,我們用它來驗證中心極限定理2、用產生的數據進行點圖描繪和正態檢驗在這里看到,這是一個C10項是對

C1~C9的平均值的數據統計,同樣樣本大小為9,其散布明顯變得小多了。描述性統計:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10

平均值變量NN*平均值標準誤標準差最小值下四分位數中位數上四分位數C125001.9170.1221.9320.0020.5431.2522.602C225002.0380.1121.7680.0030.6021.4533.068C325002.0720.1302.0500.0090.5581.4022.853C425002.0050.1392.2040.0020.5511.3272.875C525001.8540.1091.7260.0090.5341.2832.595C625001.9540.1292.0390.0030.4771.3472.743C725001.9650.1221.9350.0110.5161.4122.759C825002.0740.1382.1780.0110.5971.3792.755C925002.0080.1362.1490.0220.5991.2832.680C1025001.98750.04360.68940.47331.52531.92902.42143、用產生的數據進行描述統計比較

sssxxxn====2092030.67..C10項是對C1~C9的平均值的數據統計,描述性統計:個體值的分布樣本平均的分布

4、點圖描繪比較,驗證中心極限定理個體值的分布樣本平均的分布4、點圖描繪比較,驗證中心極限定個體值的概率圖

樣本平均的分布5、正態概率圖描繪比較,驗證中心極限定理個體值的概率圖樣本平均的分布5、正態概率圖描繪比較,驗證中30201001098765432Sample

nStan

Err標準誤差和樣本大小關系

標準誤差與樣本大小的關系30201001098765432SamplenStan中心極限定理

(CentralLimitTheorem

)

中心極限定理

(CentralLimitTheoreDefineMeasureAnalyzeImproveControlStep8-Data分析Step9-VitalFewX’的選定

多變量研究

中心極限定理

假設檢驗

置信區間

方差分析,均值檢驗

卡方檢驗

相關/回歸分析Step7-Data收集路徑位置理論課DefineMeasureAnalyzeImproveCon

定義

中心極限定理的應用1.正態分布的例子2.Chi-Square分布的例子

標準誤差與樣本大小的關系目錄定義目錄定義中心極限定理是闡述大量隨機變量之和的極限分布是正態分布的一系列定理的總稱。最常用的有:獨立同分布中心極限定理:

“隨機變量x1,x2,…獨立,且服從同一分布,若存在有限的數學期望E(xi)=u和方差D(xi)=σ2,當n→∞時,隨機變量的總和Σxi趨于均值為nu,方差為nσ2的正態分布。(即算術平均數1/nΣxi=xbar趨于均值為u,方差為σ2/n的正態分布)”不論總體服從何種分布,只要它的數學期望和方差存在,從中抽取容量為n的樣本,則這個樣本的總和或平均數是隨機變量,當n充分大時,Σxi或xbar趨于正態分布。定義中心極限定理是闡述大量隨機變量之和的極限分布是正態分布的定義德莫佛-拉普拉斯中心極限定理:“如果用X表示n次獨立試驗中事件A發生(“成功”)的次數,P是事件A在每次試驗中發生的概率,則X服從二項分布,B(n,p),當n→∞時,X趨于均值為np,方差為npq的正態分布。”正態分布和泊松分布都是二項分布的極限分布當n足夠大時,可用正態分布近似計算;當n足夠大且p小時,可用泊松分布近似計算。中心極限定理是一種十分重要的現象,它是統計學中應用的許多方法的理論基礎的組成部分(如:計算樣本均值的置信區間)

定義德莫佛-拉普拉斯中心極限定理:利用同樣的數據畫出兩種不同的控制圖,并仔細比較它們的差異:

打開文件[CENLIMIT.MTW

].

分別用下面的兩個路徑畫出個體圖和子群大小為5的均值圖個體圖路徑均值圖路徑應用應用圖形輸出個體數據樣本平均

仔細比較兩個圖上的控制上下線(UCL和LCL),有什么不同?應用圖形輸出個體數據樣本平均仔細比較兩個圖上的控制上下線(UC個體控制圖和

Xbar控制圖的差異μ15100102030405060應用個體控制圖和Xbar控制圖的差異均值分布的標準偏差叫做

均值標準誤差,因而其定義為:這個公式表明平均值比個體數據更穩定,穩定因子是樣本數的平方根。σsx==均值標準誤差個體值的標準差n=平均值的樣本數x均值的標準誤差(StandardErroroftheMean)其中平均值分布的標準偏差叫做均值標準誤差,因而其定義為:σs 我們經常依靠從測量系統中得到的一個數值來估計輸入或輸出變量的值。減小測量系統誤差的簡易方法就是把兩個或更多的讀數平均。我們的測量系統的精密度自動增加,增加因子是平均值樣本數的平方根,如果我們要想使測量系統的誤差減小一半,我們就需要把4次的測量值平均才可以。實際應用測量系統的改善 我們經常依靠從測量系統中得到的一個數值來估計輸入或當總體數據具備正態分布時中心極限定理理解例題模擬-1假設你面前有一個大桶,桶里面裝有相當多數量的白色紙條,每張紙條上都寫有數字,且假定這些數字都來自一個具有特定平均值和標準偏差的正態分布.

1)從中隨機抽出9張白色紙條,并把其上面的9個數字求平均,

2)然后把這個平均值寫在一張綠色紙條上,

3)把這9張白色紙條放回原來的桶里,

4)把這張綠色紙條放入另外一個桶里,如此重復上面的步驟,直到盛有綠色紙條的桶放滿為止。白色紙條代表總體的數據;綠色紙條代表平均值的樣本;我們用MINITAB來模擬做這個練習。當總體數據具備正態分布時中心極限定理理解例題模擬-1假設你讓我們用MINITAB產生一些模擬的數據來驗證我們的理論。首先用MINITAB產生9列各250個數據,假設這些數據來自一個平均值=70、標準偏差=9的正態分布:則列C1-C9代表白色紙條然后求出各行9個數據的平均值,其結果放在列C10,則C10代表綠色紙條。我們用描述統計的方法求出各列數據的平均和標準偏差。仔細比較C1-C9列與C10列有什么差別?

[例題1]中心極限定理應用模擬[例題1]中心極限定理應用模擬1、用MINITAB隨機產生樣本數據分別輸入下列信息1、用MINITAB隨機產生樣本數據分別輸入下列信息2、樣本平均數計算2、樣本平均數計算3、輸出:產生10列數據[注意:每次每個人操作產生的數據都不一樣]3、輸出:產生10列數據[注意:每次每個人操作產生的數據都不4、描述統計路徑4、描述統計路徑5、描述統計結果比較描述性統計:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10

平均值變量NN*平均值標準誤標準差最小值下四分位數中位數上四分位數C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.1805、描述統計結果比較描述性統計:C1,C2,C3,C5、描述統計結果比較(續)描述性統計:C1,C2,C3,C4,C5,C6,C7,C8,C9,C10

平均值變量NN*平均值標準誤標準差最小值下四分位數中位數上四分位數C1250070.6050.5348.43943.53764.92470.89576.690C2250069.6330.6239.84743.52163.09470.17476.382C3250069.6430.5919.34147.78562.61769.06376.286C4250070.2930.5598.84649.31364.74569.70275.834C5250070.7050.6039.54245.84964.11870.67377.782C6250069.3850.5879.28841.39863.23769.28576.174C7250070.2280.5438.58548.88864.44470.58775.767C8250069.8520.5929.35741.97763.09669.82677.060C9250070.1260.5688.98848.10064.02369.87175.867C10250070.0520.1852.93061.50168.16770.47972.180現在開始比較。5、描述統計結果比較(續)描述性統計:C1,C2,C3樣本的散布(C9)和樣本平均的散布(C10)進行比較。散布減少了很多.σ=

8.988σ=2.9306、直方圖結果比較樣本的散布(C9)和樣本平均的散布(C10)進行比較。散布σ用點圖比較頻度數則能夠更明確的了解散布。7、點圖結果比較用點圖比較頻度數則能夠更明確的了解散布。7、點圖結果比較樣本平均值分布的平均值和總體的平均值十分接近;樣本平均值分布的標準偏差等于總體的標準偏差除以樣本數的平方根;樣本平均值的分布十分接近正態分布。8、結論8、結論

當總體數據是非正態分布時,若從中隨機抽樣n個并計算其平均,同樣如此反復若干次,然后比較這些平均的散布與這些個體值的散布,你會發現,當n→∞時,x-bar的散布也具有正態分布。為了驗證,我們在非正態分布中隨機選擇一個偏移較大的分布-“Chi-Square分布”,求其x-bar來體會一下中心極限定理。

當總體數據不具備正態分布時中心極限定理理解例題模擬-2當總體數據是非正態分布時,若從中隨機抽樣n個并計算其平均,1、用卡方分布隨機產生9列,每列各有250個數據1、用卡方分布隨機產生9列,每列各有250個數據2、用產生的數據進行點圖描繪和正態檢驗

在這里看到,這是一個很偏移的分布,我們用它來驗證中心極限定理2、用產生的數據進行點圖描繪和正態檢驗在這里看到,這是一個C10項是對

C1~C9的平均值的數據統計,同樣樣本大小為9,其散

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論