六西格瑪綠帶教程相關與回歸PPT課件.ppt_第1頁
六西格瑪綠帶教程相關與回歸PPT課件.ppt_第2頁
六西格瑪綠帶教程相關與回歸PPT課件.ppt_第3頁
六西格瑪綠帶教程相關與回歸PPT課件.ppt_第4頁
六西格瑪綠帶教程相關與回歸PPT課件.ppt_第5頁
已閱讀5頁,還剩66頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 DMAIC階段 Define 界定Measure 測量Analyze 分析Improve 改進Control 控制項目啟動尋找Y=f(x)建立基準測量Y=f(x)確定要因分析Y=f(x)消 除要因 優化Y=f(x)貫徹執行更新Y=f(x)Breakthrough!DMAIC六西格瑪改進程序SIPOC過程圖C&E矩陣和FMEA多變量研究假設檢驗試驗設計篩選優化的過程30 50個X10 - 15 個X8 10個 X4-8 關鍵的X 3-6個關鍵的X 漏斗效應控制計劃MAI CD相關分析和回歸分析因果矩陣分析多變量分析相關與回歸分析相關分析和回歸分析因果矩陣分析多變量分析相關與回歸分析因果矩陣分析

2、法 因果矩陣分析法是尋找影響主要過程輸出變量的主要輸入變量的一種方法。 因果矩陣分析法步驟:(1)確定主要過程輸出變量;(2)確定主要過程輸出變量的重要度;(從重要到不重要101級)(3)列出過程步驟(工序);(4)針對每個主要過程輸出變量,確認對該輸出有影響的輸入變量;(5)確定輸入變量和輸出變量之間相關程度(從相關到不相關100級)(6)計算每個工序輸入變量的總分;(7)根據總分確定輸入變量的優先級別(得分最高的幾個輸入變量可能為關鍵輸入變量)(8)對關鍵輸入變量影響的真實性加以驗證。案例: 某公司加工X產品,為了確認對輸出存在主要影響的過程輸入變量,該公司決定對生產過程進行因果分析。因為

3、缺陷有幾種,所以用因果圖分析效率較低,該公司六西格瑪團隊決定最終用因果矩陣分析法來幫助分析。1. 確定過程主要輸出變量 通過頭腦風暴法,結合目前的過程缺陷,得出X產品加工過程主要輸出如下:X產品加工過程ABCDEF主要輸出2. 確定過程主要輸出變量的重要度如下表:3. 列出過程步驟,并與過程主要輸出聯立成關 系矩陣,如表所示:4. 針對每個主要輸出變量,在每個工序列出對 該輸出有影響的輸入變量,如表。5. 確定輸入變量與輸出變量之間的相關程度, 如表。6. 計算每個工序輸入變量的總分 從表中可知,“i”的總分為410,“0”的總分為220,“e”的總分為186,占前三位,因此,認為以上幾個輸入

4、變量為影響過程輸出的關鍵輸入變量,需重點給予改進。7. 根據總分確定輸入變量的優先級別8. 對關鍵輸入變量影響的真實性加以驗證相關分析和回歸分析因果矩陣分析多變量分析相關分析與回歸分析多變量分析多變量圖(Multi-Vari Chart):適用于連續型數據,描述變量間的關系多變量圖:直觀地提供過程各影響因素之間的關系以及它們對過程輸出影響的坐標圖。六西格瑪團隊在研究多個變量時,可用多變量圖形象地描述變量間的關系。這些圖在方差分析等數據分析之前做,可以對數據有一些初步的形象了解。多變量圖例:項目團隊研究三種材料在某種條件下的時間效應。數據收集過程是在三個通電時間0.5,1.0,1.5分鐘里分別測

5、量每種材料(材料1,材料2和材料3)的5個樣品,在進行數據分析前,了解是否有明顯的趨勢成交互作用。 A通電時間B材料 C超導強度0.50.50.50.50.50.50.50.50.51.01.01.01.01.01.01.01.01.01.51.51.51.51.51.51.51.51.5111222333111222333111222333232021221920191821222019242522201922181816212320202224多變量圖在輸出的多變量圖中,每一材料類型上都有連接三個點的連線,這三個點表示在對應的材料類型下,各個時間段里材料的超導強度的平均值,反映了各個材料類

6、型組內的信息,圖中虛線連線上的各個點分別代表三種材料的超導強度的平均值,反映了各個材料類型組間的信息,它們雖有差別,但并不嚴重。同種材料內分別對應的通電時間(通電時間分別為:0.5,1.0,2.0分鐘)的超導強度差異較大,而且不同材料對應同樣的通電時間的圖象樣子差別很大, 說明材料的種類與通電時間的長度有交互作用?;貧w分析( Regression Analysis)二類關系相關系數相關系數的檢驗一元線性回歸模型回歸方程的顯著性檢驗利用回歸方程作預測利用回歸方程作控制可化為線性回歸的例子兩變量間關系確定關系: 例:圓面積S與半徑R相關關系: 例:(1)兒子的身高與父親的身高 (2)教育投資與家庭

7、收入 (3)體重與身高 (4)合金鋼強度與合金鋼中的碳含量因果關系:例:發炎與發燒例1 由專業知識知道,合金的強度y(107Pa)與合金中碳的含量x(%)有關。為了生產強度滿足用戶需要的合金,在冶煉時如何控制碳的含量?如果在冶煉過程中通過化驗得12組數據,列于下表中:為解決這類問題就需要研究兩個變量間的關系。畫散點圖。為了研究兩個量間存在什么關系,可以畫一張散點圖,具體見下圖: 回歸分析是研究一個隨機變量y與另一些變量x1,x2,xk(普通變量或隨機變量)之間關系的統計方法。在某些問題中,諸x帶有“原因”的性質,故稱之為自變量。而y帶有“結果”的性質,故稱之為因變量。有時x與y之間并無明顯的因

8、果關系,但仍沿用自變量與因變量的名稱。有時也稱x為“因子”或“因素”,稱y為“指標”或“響應”。 相 關 系 數(correlation coefficients)散點圖呈現上圖的形狀,即n個點基本在一條直線附近,但又不完全在一條直線上,我們希望用一個量來表示他們的密切程度,這個量稱為相關系數,記為r,它被定義為:可以證明有-1r1。在合金鋼的例子中可算得:相關系數r 示意圖與說明相關系數r大小是表示兩個變量x與y之間線性相關的程度。當r=1時,n個點在一條直線上,這時兩個變量間完全線性相關。 xy r=1,完全線性正相關xyr=-1,完全線性負相關當r0時,稱兩個變量間具有正相關,這時當x的

9、值增加時,y的值也有增大的趨勢。0yx強正相關變量之間有很強的正相關性,暗示變量之間可能存在顯著的因果關系。在此模式下,一般能夠建立起有效的回歸方程。yx0弱正相關變量之間有一定的正相關性,暗示變量之間可能存在較弱的因果關系,或者變量(其中之一或全部)受其他變量的顯著影響。當r0.576,如今r=0.9705,可以顯著性水平=0.05認為,合金強度y與其碳含量x間存在線性關系。一元線性回歸模型假定有兩個變量:x是自變量,其值是可以控制或精確測量的,認為它的非隨機變量。y是因變量,對給定的x值,y的取值事先不確定,故y是隨機變量。假設(x,y)的散點圖顯示有直線關系,則我們可以認為觀測值y由兩部

10、分迭加而成:一是隨x的變化而呈線性變化的趨勢,用0+1x表示;二是其它隨機因素影響的總和,用表示,常設N(0,2)。故有如下的數據結構式:yi=0+1x+i,i=1,2,n回歸系數的最小二乘估計。按最小二乘法:記若 與 滿足如下等式:則稱 , 為0 ,1的最小二乘估計。0 與1的最小二乘估計可以驗證: , 使Q(0,1)達到最小,故其為最小二乘估計?;貧w方程:此回歸方程總經過 和 二點 計算步驟5. 寫出回歸方程例一的計算表回歸方程的顯著性檢驗我們建立回歸方程的目的是去表達兩個具有線性相關的變量間的定量關系,因此,只有當兩個變量具有線性相關關系時所建立的回歸方程才是有意義的。兩個變量間是否存在

11、線性相關關系的。檢驗有兩種方法方法之一,便是上一小段所敘述的求兩個變量間的相關系數,對于給定的顯著性水平,當相關系數r的絕對值大于臨界值 時,便認為兩個變量間存在線性相關關系,所求得的回歸方程是有意義的。方法之二,是用方差分析的方法。這個方法具有一般性。平方和分解式n個觀察值y1,y2,yn的總的波動可用總偏差平方和ST表示:其中 為n個觀察值的平均。引起這種波動的原因有二: 1. 由于自變量x取不同值引起y的變化; 2. 其它因素(除x以外)引起y的變化,統歸結為隨機誤差。這二個原因可從總平方和分解式看出,即:其中方差分析表其中各平方和的計算:例續 下面我們對用方差分析的方法作回歸方程的顯著

12、性檢驗。 (1)計算各類偏差平方和由前面的計算知: (2)列方差分析在=0.05時,F1-(1,10)=4.96,現在F4.96,這表明在=0.05水平上方程有意義的。利用回歸方程作預測當求得了回歸方程 ,并經檢驗確認回歸方程是顯著的,則可以將回歸方程用來做預測。所謂預測是指當x=x0時對相應的y的取值y0所作的推斷。由于y是隨機變量,其實際取值是無法預測的,我們只能對其平均取值作出估計,這便稱為y的預測值。顯然,如果x=x0,那么y的預測值為另外,我們還可以給出y0的預測區間:在x=x0時,隨機變量y0的取值與其預測值 總會有一定的偏離。人們要求這種絕對偏差 不超過某個的概率為1-,其中是事

13、先給定的一個比較小的數(030),t分布可以用正態分布近似,進一步,若x0與 相差不大時,可以近似取為:其中u1-/2是標準正態分布的1-/2分位數。xy(*)例續:1如果取x0=0.16,則得預測值為:2求概率為1-的預測區間:(1)先求的估計 ;(2)由給定的,查t分布表的分位數t1-/2,比如取=0.05,則t0.975(10)=2.228;(3)按(*)計算的值。本例中 ,lxx=0.0186,故(4)寫出預測區間 ,本例中為(4632,52.54)。3如果求近似區間,由于u0.975=1.96,故有則近似區間為(49.43-2.63,49.43+2.63)=(46.80,52.06)

14、,此處兩個區間相差較大,這是因為n較小的原因。利用回歸方程作控制控制問題是予報(測)的反問題。若要求觀察值y在一定范圍y1yy2內取值,那么應把自變量x控制在什么范圍內?即要尋找這樣兩個值x1和x2,使得:y-(x1)=y1y+(x2)=y2xy y2y1x1 x2由于(x)的計算較為復雜,實際中常用近似分布: ,由此可得:如果要控制y在y1yy2內,也只要通過方程分別解出x1和x2,從而確定x值的控制范圍xy y2y1x1 x2 可化為線性回歸的例子在實際中,兩個變量之間的相關關系大多呈非線性的,這時選用恰當類型的曲線比直接配直線更符合實際情況。在不少情況下,通過簡單的變量變換,可把非線性回

15、歸問題轉化為線性回歸問題來解。例 煉鋼廠出鋼時盛鋼水用鋼包。在使用中由于鋼液及爐渣對包襯耐火材料的浸蝕,鋼包容積不斷增大。這里鋼包容積用盛滿鋼水時的重量y表示,相應使用次數用x表示。如此共測13組數據如下:1. 確定曲線回歸方程形式 常見的思路有二條: 這里由散布圖(右圖)可確形式有多種 根據專業知道 根據數據的散布圖0 10 201111101091081071062. 曲線回歸方程中參數的估計 先線性化,以(1)為例,令v=1/y,u=1/x(1)轉化為 v=a+bu 利用最小二乘法可得a與b的最小二乘估計 可得回歸方程改寫為y關于x的回歸方程 變換后的數據類似可得(2),(3),(4)的

16、回歸方程在上述四個回歸方程中選用哪一個是合適的?比較準則: 相關指數R愈大愈好(R2又稱為決定系數),其中 剩余標準差s愈小愈好結論:選方程(1)為好可化為線性回歸的函數雙曲函數的一般形式為 或 。指數函數的一般形式為y=aebx。冪函數的一般形式為y=axb。對數函數的一般形式為y=a+blnx?!癝-型”函數的一般形式為“反S-型”函數的一般形式為數據分析: 證實原因驗證引起缺陷的原因,可以通過三種途徑:邏輯分析統計推斷試驗驗證先從邏輯分析開始。(1)邏輯分析因果邏輯假定團隊認為許多弄錯的訂單是由于銷售人員在訂單的管理過程中出了差錯而引起的,這也許能解釋部分出錯訂單,但它不能解釋不熟悉的顧

17、客(小商人和計算機新用戶)會出現更多差錯這一現象。如果訂單管理系統出了問題,你應該想到所帶來的影響對于所有顧客都是差不多的。 (1)邏輯分析要使假定的原因真的成立,它必須通過合乎邏輯的測試解釋從數據反應出的可見問題和潛在問題,當然這些潛在問題現在還沒有出現。(2)原因的統計檢驗有這樣兩種簡單的統計方法可以用來分析并確定因果關系:相關分析:利用散布圖分析潛在的因果關系數據整理、分層來驗證原因相關分析:利用散布圖分析潛在的因果關系判斷原因X和結果Y之間的相關程度,從散布圖可以有一個大概的印象,精確的計算也可以借助回歸分析和相關分析得到對數據進行整理或分層圖得到數據的模型,或者數據沒有任何模型。相關分析:利用散布圖分析潛在的因果關系散布圖提供了驗證因果假設的一種途徑,從成對數據去驗證自變量X與因變量Y之間的相關關系。成對數據顧名思義是指X、Y是來自同一個觀測個體,“成對”本身就反映了一種潛在的原因和結果:正如構建一個體系,體系的復雜度(X變量或是潛在的原因)與構建該體系所花時間(Y輸出或結果)之間潛在著一種因果關系。成對數據沿著X、Y軸分布,再分析其相關性, 相關分析:利用散布圖分析潛在的因果關系散

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論