西格瑪回歸分析演示文稿_第1頁
西格瑪回歸分析演示文稿_第2頁
西格瑪回歸分析演示文稿_第3頁
西格瑪回歸分析演示文稿_第4頁
西格瑪回歸分析演示文稿_第5頁
已閱讀5頁,還剩69頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

西格瑪回歸分析演示文稿目前一頁\總數七十四頁\編于點優選西格瑪回歸分析目前二頁\總數七十四頁\編于點目的Objectives介紹相關性及回歸的基本概念IntroduceTheBasicConceptsofCorrelationandRegression把回歸與六西格瑪路線圖結合起來LinkRegressionToTheSixSigmaRoadmap學習多元回歸的使用ReviewtheuseofMultipleRegression介紹相關性及回歸的基本概念IntroduceTheBasicConceptsofCorrelationandRegression把回歸與六西格瑪路線圖結合起來LinkRegressionToTheSixSigmaRoadmap學習多元回歸的使用ReviewtheuseofMultipleRegression介紹相關性及回歸的基本概念IntroduceTheBasicConceptsofCorrelationandRegression把回歸與六西格瑪路線圖結合起來LinkRegressionToTheSixSigmaRoadmap學習多元回歸的使用ReviewtheuseofMultipleRegression目前三頁\總數七十四頁\編于點項目跟蹤圖

第五版項目開始日期21/01/2004項目類別“Y”變量數據采集計劃制定項目日程啟動項目書DMAIC改善定義確定”Y”變量和起草項目書項目書得以批準流程圖C&E矩陣或故障樹分析FTA第三十天MBB審閱FMEA或故障樹分析FTA測量系統分析MSA關鍵”X”變量數據采集計劃MBB審閱測量21/01/200404/02/200411/02/200425/02/200409/03/200409/03/200409/03/2004初始能力研究多元變量流程分析MBB審閱合同批準分析22/03/200415/04/200415/04/200415/04/200415/04/2004單因子或多因子測試實驗設計(DOE)MBB審閱改善31/05/200431/05/200431/05/2004控制計劃最終能力研究控制階段FMEA回顧重新修訂RPNMBB審閱項目最終匯報及報告項目審核及項目收尾控制21/06/200429/06/200429/06/200405/07/200409/07/200409/07/200419/07/2004(根據需要使用)客戶心聲/業務之聲調查VOC/VOB需求分析流程再造解決方案設計流程再造在這里輸入開始日期

確定改善方案由項目發起人在備選項目數據庫中完成在6西格瑪數據庫查找相似項目實施改善移交培訓/流程所有人簽準再造路線圖的日程是獨立計算的與以上DMAIC的日期不相關實際完成日期計劃完成日期圖例2/1/020022/3/02完成畫鉤目前四頁\總數七十四頁\編于點分析路線圖

AnalyzeRoadmap

單一因子X-單一因子Y

SingleX-SingleY輸入變量

X

XData離散Discrete

連續Continuous

輸出變量Y

YData離散Discrete

連續Continuous

卡方相關性分析Chi-Square邏輯回歸LogisticRegression方差分析,均值/中位數測試ANOVAMeans/MediansTests回歸Regression目前五頁\總數七十四頁\編于點什么是Y?_____________數據類型?______________什么是X?_____________數據類型?______________應該使用何種工具?________________________案例

#1Scenario#1管理者想知道接線員的經驗(以月為單位衡量)是否會對接聽顧客熱線電話需要的時間有影響目前六頁\總數七十四頁\編于點相關性

Correlation什么是相關性

?

Whatiscorrelation?你是否有過如此經驗:測量某些產品并送至顧客處,但他們回來告訴你的產品不符規格?

Haveyouevermeasuredsomethingandthenshippedtoyourcustomeronlyforthemtotellyouitdoesn’tmeetspec?在奧林匹克溜冰比賽上,你認為兩個裁判成績之相關性有多高?

HowwellcorrelateddoyouthinktwoiceskatingjudgesareattheOlympics?目前七頁\總數七十四頁\編于點相關性Correlation路線分析圖AnalyzeRoadmap

畫出點陣圖ProduceScatterPlot計算相關性CalculateCorrelation評估r和P值

Evaluater

andPvalue目前八頁\總數七十四頁\編于點相關系數

CorrelationCoefficients什么是相關系數?

SowhatistheCorrelationCoefficientsupposedtobeanyway?相關系數(r)介于-1和1之間

TheCorrelationCoefficient(r)liesbetween-1and1一般規則:GeneralRules相關系數(r)>.80或<-0.8為顯著CorrelationCoefficient(r)>.80or<-.80isSignificant相關系數(r)介于-.80與0.8之間為不顯著CorrelationCoefficient(r)between-.80and.80isNotSignificant目前九頁\總數七十四頁\編于點“+”相關性的強度及趨向

StrengthandDirectionof“+”Correlation目前十頁\總數七十四頁\編于點“-”相關性的強度及趨向

StrengthandDirectionof“-”Correlation目前十一頁\總數七十四頁\編于點r應該多大?

HowBigShouldrBe?依你的樣本大小,若所得的相關性比表中的值大,則可視為“重要”或統計顯著。BygoingtotheSampleSizeofyoursample,anycorrelationthatisgreaterthanthetablevalueisconsideredtobe“important”orstatisticallysignificant.目前十二頁\總數七十四頁\編于點r應該多大?

HowBigShouldrBe?勿需擔心此表,Minitab可以幫助我們!

Butdon’tworryaboutthetables,Minitabcanhelpusout!在相關性程序中選取“Displayp-values”選項,Minitab將會顯示出是否顯著

Ifyouidentifythe‘Displayp-values’optionintheCorrelationprocedure,Min\itabwillgiveyoutheindicationifitissignificant找尋比0.05小的p-值

Lookforap-valuelessthan0.05目前十三頁\總數七十四頁\編于點

回歸的定義

RegressionDefinition回歸分析是一種用以分析變量間相關性的統計工具。統計課程中通常稱其為“最佳擬合線”

Regressionanalysisisastatisticaltechniqueusedtoanalyzethecorrelationbetweenvariables.Thisissometimestaughtinstatisticalcoursesascomputingthe“lineofbestfit”.本周課程將討論一元回歸分析,其探討對象為一連續Y與一連續X之關系,之后,我們還將討論多元回歸分析-對象為單一Y與多個連續X之間的關系.

Inthis

modulewewilllookatbothSimpleRegressionwhichcomparesonecontinuousYtoonecontinuousXandMultipleRegression-thecomparisonofonecontinuousYwithmorethanonecontinuousX目前十四頁\總數七十四頁\編于點01245

X=發動機重量Y=MPG15105例子:X=發動機重量Y=每加侖公里數回歸案例RegressionExample你認為兩變量間是什么關系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?目前十五頁\總數七十四頁\編于點01245

X=司機的經驗Y=MPG15105例子:X=司機的經驗Y=每加侖公里數回歸案例RegressionExample你認為兩變量間是什么關系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?目前十六頁\總數七十四頁\編于點01245

X=燃料添加劑量Y=MPG15105例子:X=燃料添加劑量Y=每加侖公里數回歸案例RegressionExample你認為兩變量間是什么關系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?目前十七頁\總數七十四頁\編于點回歸的定義RegressionDefinitions

01245

X=燃料添加劑量Y=MPG1510501245

X=司機的經驗Y=MPG1510501245

X=發動機重量Y=MPG15105正相關性PositiveCorrelation負相關性NegativeCorrelation無相關性

NoCorrelation目前十八頁\總數七十四頁\編于點回歸Regression路線分析圖AnalyzeRoadmap規劃分析內容收集數據在Minitab里繪制擬合線圖評估R^2及P值的顯著性評估殘差制定決策目前十九頁\總數七十四頁\編于點路線分析圖AnalyzeRoadmap

需要評估的案例:

Project:032REGRESSION011404.mpj,worksheet:Brake.mtw

336 325418 375355 367445 385365 375455 395395 395... ...速度剎車距離進行了對21種速度的測試.

你認為數據表明了什么?目前二十頁\總數七十四頁\編于點Minitab–回歸Regression目前二十一頁\總數七十四頁\編于點Minitab–輸出你會做何決策?目前二十二頁\總數七十四頁\編于點擬合線從何而來WhereDoesThisFittedLineComeFrom?Minitab找到一條線,使各點至線段之距離為最小…

Minitabfindsalinewhichwillminimizethedistancesfromtheplottedpointstotheline.... * * * * * * * * ** * 擬合線FittedLine實際數據點ActualDataPoint實際數據點與擬合線間的距離DistanceBetweenActualPointandLineInputVariable(X)OutputVariable(Y)目前二十三頁\總數七十四頁\編于點任何擬合線的一般等式如下…Thegeneralequationofanylineisasfollows...YinterceptSlopeoftheline()YmXb=+高中代數

所提之方程式在回歸中,等式以b0andb1目前二十四頁\總數七十四頁\編于點輸入變量InputVariable(X)響應變量ResponseVariable(Y)

}b0Y-截距b0是當X=0時,Y的高.換句話說,是擬合線與Y軸的交點.X=0目前二十五頁\總數七十四頁\編于點輸入變量InputVariable(X)響應變量ResponseVariable(Y)

斜率是指:Slopeofthelinemeans

“Y的變化”“changeinY”

b1

=

“X里1個單位的變化”

“1unitchangeinX”

b1目前二十六頁\總數七十四頁\編于點Minitab–輸出Y=182.8+.4763速度這個等式給我們一個對流程行為的估計Thisequationgivesusanestimationofprocessbehavior.注意R2=69.5%,我們一會兒回將講到.目前二十七頁\總數七十四頁\編于點Minitab–輸出Y=182.8+.4763xEx: 如果速度為400,剎車大概需要多大的距離?Ifthespeedmeasures400,whatapproximatevalueshouldweexpectindistance?Ex: 如果速度為1000,剎車大概需要多大的距離?

Ifthespeedmeasures1000,whatapproximatevalueshouldweexpectindistance?目前二十八頁\總數七十四頁\編于點回歸的等式為Theregressionequationis剎車距離BrakingDistance

=182.8+0.4763速度SpeedS=13.5571R-Sq=69.5%R-Sq(adj)=67.9%方差分析AnalysisofVarianceSource DFSSMS FPRegression 17955.97955.9143.290.000Error 193492.1183.79Total 2011448.0Minitab–更多輸出R2

(Sameoneasbefore)目前二十九頁\總數七十四頁\編于點R2-有何意義?R2與P值,有助我們以統計做決策。R2被稱為判斷系數R2andP,helpusputsomestatisticalbackingbehindourdecisions.TheR2iscalledthecoefficientofdeterminationR2

值代表“多少”輸出變異總量可由回歸模式所解釋,其值介于0到1(0%到100%)。此值越高代表對該模式的可信度越高.R2isameasureoftheamountofvariationintheoutputthatisexplainedbytheregressionmodel.Itwillalwaysbeavaluebetween0and1(0%to100%).Thehigherthisamount,thegreaterconfidencewehaveinthemodelitself.

R2100%0%目前三十頁\總數七十四頁\編于點R2-有何意義?TheR2=69.5%這表明有69.5%的Y(剎車距離)的變差可以由X(速度)來解釋.Thismeans69.5%ofthevariationinY(BrakingDistance)canbeexplainedbytheX(Speed).30.5%是由其他因素引起的.30.5%isduetosomethingelse.你的決策是什么?目前三十一頁\總數七十四頁\編于點R2-該為多大值?

HowBigShouldItBe?視分析對象而定…如對安全系統或回紋針

Thatanswer“depends”onwhatyouarestudying,e.g.safetysystemsorpaperclips.如果你在實驗一個新的安全保障系統,你的數據將由交通部審查.你的數值該需要有多“好”?

Ifyouareexperimentingwithanewsafetyrestraintsystem,yournumberswillprobablybereviewedbytheDepartmentofTransportation.How“good”shouldyoube?不同的課題會有不同的決策標準(通常為+80%)。重要的是我們必須認識到

R2越高,統計模式越好。

Differenttextssuggestdifferentdecisioncriteria(usually+80%).TheimportantthingtorealizeisthatthehighertheR2thebetterthemodel.目前三十二頁\總數七十四頁\編于點回歸分析:剎車距離v.速度RegressionAnalysis:BrakingDistversusSpeed回歸的等式為Theregressionequationis剎車距離BrakingDistance=182.8+0.4763速度SpeedS=13.5571R-Sq=69.5%R-Sq(adj)=67.9%方差分析AnalysisofVarianceSource DF SS MS F PRegression 1 7955.9 7955.9143.29 0.000Error 19 3492.1 183.79Total 20 11448.0P值–里怎么了?

WhatIsGoingOnHere?AnotherPValue!目前三十三頁\總數七十四頁\編于點零假設:線段斜率=0 (無相關性)Ho: SlopeofTheLine=0 (Nocorrelation)備擇假設:線段斜率=0 (有相關性)Ha: SlopeofTheLine10 (Thereiscorrelation)

記住…P要小,Ho要倒WhenPislow,Homustgo!P

值–另一個假設檢定

AnotherHypothesisTest目前三十四頁\總數七十四頁\編于點Minitab–回歸-殘差&擬合數Regression-Residuals&Fits目前三十五頁\總數七十四頁\編于點Speed Distance RESI1 FITS1336 325 -17.8392 342.839418 375 -6.8948 381.895355 367 15.1113 351.889445 385 -9.7546 394.755365 375 18.3484 356.652455 395 -4.5175 399.517395 395 24.0598 370.940405 365 -10.7031 375.703346 355 7.3979 347.60... ... ... ...Minitab–更多輸出MoreOutput目前三十六頁\總數七十四頁\編于點速度Speed

距離Distance

殘差1RESI1

擬合數1FITS1336 325 -17.8392 342.839殘差&擬合數-它們是什么?

Residual&Fit-WhatAreThey?擬和線FittedLine336325實際點ActualPoint]殘差距離ResidualDistance

(-17.8392)理論擬合點TheoreticalFit

342目前三十七頁\總數七十四頁\編于點速度Speed

距離Distance

殘差1

RESI1

擬合數1

FITS1336 325 -17.8392 342.839殘差-點到擬合線的垂直距離

在線下方為負,在線上方為正.Residual-TheverticaldistancetothefittedlineNegativeisbelow,positiveisabove擬合數-Y值在擬合線上的理論值Fits-Thetheoreticalyvalueonthefittedline殘差&擬合數-它們是什么?

Residual&Fit-WhatAreThey?目前三十八頁\總數七十四頁\編于點回歸-殘差&擬合數-圖表總結Regression-Residuals&Fits–GraphicalSummary目前三十九頁\總數七十四頁\編于點數據應該通過“胖鉛筆測試”“FatPencilTest”殘差分析ResidualAnalysis數據應該像鐘型分布DataShouldFitABellShapedCurve比較P值與殘差正態分布測試的結果CheckPvaluewithNormalitytestonResiduals目前四十頁\總數七十四頁\編于點數據應在控制線內,調查異常點DataShouldBeInControlInvestigateOutliers殘差分析ResidualAnalysis數據應無任何規律DataShouldExhibitNoPatterns目前四十一頁\總數七十四頁\編于點其他案例OtherExamples使用MinitabProject:032regression011404.mpj練習#1: AnalyzeworksheetPaint.mtwY=油漆厚度PaintThicknessX1=氣壓AirPressureX2=黏度Viscosity練習#2:AnalyzeworksheetCust.mtwY=客戶回應時間CustomerResponseTimeX1=代理人有經驗程度ExperienceLevelofAgentX2=與客戶的距離DistanceFromCustomerSite練習#3:AnalyzeMysteryData.mtw目前四十二頁\總數七十四頁\編于點注意陳述中的因果關系

BewareofStatingCausality

即使我們建立了Y與X之相關性,但并不能確定X之變異將一定導致Y之變異。

IfweestablishacorrelationbetweenYandaX,thatdoesn’tnecessarilymeanvariationinXcausedvariationinY.

其它潛藏的變量,可能造成X與Y之改變。

Othervariablesmaybe‘lurking’thatcausebothXandYtovary.目前四十三頁\總數七十四頁\編于點研究指出當醫院規模增加,病人死亡率亦顯著提升。

這么說來,我們應該避免去大型醫院就診嗎?Researchhasconsistentlyshownthatasthehospitalsizeincreases,thedeathrateofpatientsdramaticallyincreases.So,shouldweavoidlargehospitals?回歸問題探討:Xs缺失RegressionIssues-MissingXs01245

X=醫院規模Y=死亡率15105目前四十四頁\總數七十四頁\編于點有關一個城市的數據顯示,當城市里鸛的數量增加時,城市人口也增加.鸛真的影響城市人口嗎?Dataonacityshowedthataspopulationdensityofstorksincreased,sodidthetown’spopulation.Didstorksinfluencethepopulation?01245

X=鸛的數量Y=城市人口15105回歸問題探討:Xs缺失RegressionIssues-MissingXs目前四十五頁\總數七十四頁\編于點回歸問題探討RegressionIssues

研究范圍太狹窄RangeOfStudyTooSmall01245

X=車齡AgeofCarY=車值SalesValue15105目前四十六頁\總數七十四頁\編于點$車值ValueofCar車齡AgeofCar現在的數據看來如何?WhatWouldThisLookLikeNow?01 5101520253035404550回歸問題探討RegressionIssues

研究范圍太狹窄RangeOfStudyTooSmall目前四十七頁\總數七十四頁\編于點分析路線圖AnalyzeRoadmap

輸入變量XXData單一因子XSingleX多因子

XsMultipleXs輸出變量YYData單一輸出Y

SingleY

多元輸出

Y

MultipleYs

多變量分析MultivariateAnalysis(注意:這與多元變量分析不同)(Note:ThisIsNotTheSameAsMulti-VariAnalysis)輸入變量X

XData離散

Discrete

連續Continuous

輸出變量Y

YData卡方相關性分析Chi-Square邏輯回歸LogisticRegressionT測試,方差分析,均值/中位數測試T-test,ANOVAMeans/MediansTests回歸Regression多元回歸MultipleRegressionMediansTests2,3,4way...ANOVAMultipleLogisticRegression多元邏輯回歸離散

Discrete連續Continuous離散Discrete連續Continuous

離散Discrete

連續Continuous

2,3,4因子方差分析中位數測試多元邏輯回歸MultipleLogisticRegression輸入變量

X

XData輸出變量Y

YData目前四十八頁\總數七十四頁\編于點多元回歸分析

MultipleRegressionAnalysis兩個或多個流程變量(X’s)可能對流程表現產生影響(Y).

Twoormoreprocessvariables(X’s)mayhaveaninfluenceuponprocessperformance(Y).多元回歸應用于有兩個或多個可能的預測變量的情況Multipleregressionisusedwhenevertherearetwoormorepossiblepredictorvariables.多元回歸的一般等式為ThegeneralformofthemultipleregressionequationisnnXbXbXbbY++++=...22110目前四十九頁\總數七十四頁\編于點案例:剎車板銷售量

Example:BrakeSales例中對剎車板銷售量進行20次的觀察.已知有五個流程變量和一個表現變量,Y:TwentyobservationsregardingBrakeSalesaregiven.ThereareFiveknownprocessvariablesandoneperformancevariable,Y:X1=

年度YearX2=市場營銷費用$Mktg$X3=今年銷售人員數SalesRepX4=去年(銷售人員)數LY(SalesRep)X5=產品ProductY=銷售Sales利用數據找出可能影響”銷售量”的”重要的幾個”流程變量.Usethedatatomineforthe“vitalfew”processvariablesthatmayinfluence“Sales”.目前五十頁\總數七十四頁\編于點剎車板銷售量數據Year Mktg$ SalesRepLY(SalesRep) Product Sales1 9.6 30 20 18 1302 10.3 20 30 17 1573 10.2 15 20 19 1294 10.4 25 15 22 1295 10.6 30 25 24 1626 10.7 15 30 18 1547 10.5 25 15 17 1328 10.9 35 25 16 1729 11.0 40 35 14 20710 11.1 20 40 18 20411 11.2 25 20 22 14412 11.2 35 25 25 17513 11.4 5 35 27 16714 11.2 12 5 28 9715 11.6 16 12 18 12216 11.7 21 16 16 13917 11.8 22 21 15 15318 11.8 24 22 16 15619 11.8 26 24 10 17220 12.1 28 26 18 178032regression011404.mpjWorksheet“Sales.MTW”目前五十一頁\總數七十四頁\編于點剎車板銷售量我們的目的是找到適用于下列形式的多元回歸:Ourgoalistofitamultipleregressionofthefollowingform這個問題便于闡明下列多元回歸的其他方面:Thisproblemwillillustratethefollowingadditionalaspectsofmultipleregression去掉沒有解釋能力的變量X

eliminationofX-variablesthathavenoexplanatorypower;殘差分析

residualanalysis留在模式里的變量是能控制的.在6西格瑪里,我們的目標就是要控制少數變量.Whatstaysinthemodelmusthavecontrols.InSixSigma,goalistocontrolafew.目前五十二頁\總數七十四頁\編于點多元回歸MultipleRegression路線分析圖規劃分析內容收集數據利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines目前五十三頁\總數七十四頁\編于點相關的預測變量(多元共線性)CorrelatedPredictorVariables(Multicollinearity)nnXbXbXbbY++++=...22110流程結果(Y)與預測變量(X’s)間的相關性是有用的—它可以幫助我們找出可能的因果關系.

Correlationbetweentheprocessoutput(Y)andthepredictorvariables(X’s)isgood--helpsusidentifypossiblecauseandeffectrelationships.相反,預測變量間的相關性卻是一個問題.

Correlationbetweenpredictors,incontrast,isaproblem.計算里的正負符號和預測變量間的相關性大小可能有錯誤.Calculatedsignsandmagnitudesofcorrelatedpredictorsmaybewrong.計算出的P值可能偏大.CalculatedP-valuesmaybelarge.預測變量間的高相關性被稱為”共線性”Highcorrelationbetweenpredictorvariablesiscalled“collinearity”目前五十四頁\總數七十四頁\編于點多元共線性:剎車板銷售量

Multicollinearity:BrakeSales左側是前20剎車板銷售量預測變量:PredictorVariables:

(1)年度Year;(2)市場營銷費用Marketing$;(3)今年銷售人員數量HowmanySalesRepsthisyear;(4)去年銷售人員數量HowmanySalesRepslastyear.(5)產品Product

032regression011404.mpjWorksheet“Sales.MTW”Year Mktg$ SalesRep LY(SalesRep) Product Sales1 9.6 30 20 18 1302 10.3 20 30 17 1573 10.2 15 20 19 1294 10.4 25 15 22 1295 10.6 30 25 24 1626 10.7 15 30 18 1547 10.5 25 15 17 1328 10.9 35 25 16 1729 11.0 40 35 14 20710 11.1 20 40 18 20411 11.2 25 20 22 14412 11.2 35 25 25 17513 11.4 5 35 27 16714 11.2 12 5 28 9715 11.6 16 12 18 12216 11.7 21 16 16 13917 11.8 22 21 15 15318 11.8 24 22 16 15619 11.8 26 24 10 17220 12.1 28 26 18 178目前五十五頁\總數七十四頁\編于點多元共線性:剎車板銷售量選擇所有五個預測變量和響應變量.Selectallfivepredictorvariablesandtheresponsevariable.使用Minitab菜單,

STAT>BASICSTATS>CORRELATION.不選擇p值選項Uncheckpvalue目前五十六頁\總數七十四頁\編于點年度和市場營銷費用有著很高的相關性!我們必須只能選擇一個作為預測變量在回歸擬合中使用.市場營銷費用可能受年度影響,因此我們保留市場營銷費用,而去掉年度變量.TheYearandMarketing$Variablesarehighlycorrelated!Wewillhavetochooseoneortheotherofthecorrelatedpredictorvariables(butnotboth)touseinaregressionfit.Possiblethatmarketing$isafunctionoftheyear-sokeepthemarketing$andeliminate

year.基本原則,如果相關性

>0.8or

<-0.8時則去掉變量相關性:年度,市場營銷費用,銷售人員數,去年銷售人員數,產品Correlations:Year,Mktg$,SalesRep,LY(SalesRep),ProductYearMktg$ SalesRep LY(SalesMktg$0.973SalesRe-0.095-0.097LY(Sales-0.1110.0020.143Product-0.172-0.164-0.353 -0.181CellContents:Pearsoncorrelation多元共線性:剎車板銷售量目前五十七頁\總數七十四頁\編于點多元回歸MultipleRegression路線分析圖規劃分析內容收集數據利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines目前五十八頁\總數七十四頁\編于點最佳子集回歸BestSubsetsRegression

“最好的模式是盡可能簡單的模式,沒有比此模式更簡單的”“Thebestmodelistheonethatisassimpleaspossible,butnosimpler.”

-AlbertEinstein目前五十九頁\總數七十四頁\編于點最佳子集回歸:剎車板銷售BestSubsets:BrakeSales

選擇所剩四個預測變量和響應變量.(去掉”年度”)Selectthefourremainingpredictorvariablesandtheresponsevariable.(Exclude“year”)使用Minitab

菜單,

STAT>Regression>BestSubsets.目前六十頁\總數七十四頁\編于點最佳子集回歸:剎車板銷售

注意”年度”從模式中去掉了.BestSubsetsRegression:SalesversusMktg$,SalesRep,...ResponseisSalesSLaYPl(rMeSoksadtlugRecVarsR-SqR-Sq(adj)C-pS$est179.077.8156.012.841X120.916.6631.324.910X290.189.066.89.0570XX285.283.5107.011.084XX398.297.83.04.0222XXX390.588.765.89.1570XXX498.297.75.04.1540XXXX目前六十一頁\總數七十四頁\編于點多元回歸MultipleRegression路線分析圖規劃分析內容收集數據利用回歸或最佳子集分析AnalyzeUsingRegressionorBestSubsets評估殘差制定決策評估R2

及P值的顯著性多元共線性‘X’分析(相關性)Multicollinearity“X”Check(correlation)使用多元回歸簡化模式RunMultipleRegressionReducedModel因為有多條線,就不再使用擬合線圖,Nolongerfittedlineplotduetomultiplelines目前六十二頁\總數七十四頁\編于點回歸:剎車板銷售Regression:BrakeSales

選擇所有四個預測變量和響應變量.Selectallfourpredictorvariablesandtheresponsevariable.使用

Minitab菜單,

STAT>Regression>Regression目前六十三頁\總數七十四頁\編于點回歸分析:剎車板銷售RegressionAnalysis:BrakeSales

零假設=變量間沒有任何關系備擇假設=變量間有一些關系Ho=NorelationshipbetweenvariablesHa=SomerelationshipexistsbetweenvariablesRegressionAnalysis:SalesversusMktg$,SalesRep,...TheregressionequationisSales=-66.6+11.8Mktg$+1.18SalesRep+2.70LY(SalesRep)-0.007ProductPredictorCoefSECoefTPConstant-66.6419.17-3.480.003Mktg$11.8381.4947.920.000 HaSalesRe1.17510.12249.600.000 Ha LY(Sales2.70230.115423.420.000 HaProduct-0.00680.2337-0.030.977 HoS=4.154R-Sq=98.2%R-Sq(adj)=97.7%目前六十四頁\總數七十四頁\編于點回歸/簡化模式:剎車板銷售Regression/ReducedModel:BrakeSales

選擇所剩三個預測變量和響應變量.Selectthethreeremainingpredictorvariablesandtheresponsevariable.UsingMinitabMenu,

STAT>Regression>Regression記住檢查殘差圖Remembertocheckyourresidualplots目前六十五頁\總數七十四頁\編于點回歸分析:剎車板銷售RegressionAnalysis:BrakeSales

零假設=變量間沒有任何關系備擇假設=變量間有一些關系Ho=NorelationshipbetweenvariablesHa=Somerelationshipexistsbetweenvariables回歸分析:銷售量v.市場營銷費用,銷售人員數,去年銷售人員數RegressionAnalysis:SalesversusMktg$,SalesRep,LY(SalesRep)TheregressionequationisSales=-66.9+11.8Mktg$+1.18SalesRep+2.70LY(SalesRep)PredictorCoefSECoefTPConstant-66.9116.22-4.120.001Mktg$11.8471.4148.380.000 HaSalesRe1.17640.110610.640.000 HaLY(Sales2.70270.110624.440.000 HaS=4.022R-Sq=98.2%R-Sq(adj)=97.8%目前六十六頁\總數七十四頁\編于點剎車板銷售案例的其他MiniTab輸出TheRestofMiniTabOutputBrakeSales

AnalysisofVarianceSourceDFSSMSFPRegression313870.14623.4285.780.000ResidualError16258.816.2Total1914128.9SourceDFSeqSSMktg$1893.9SalesRe13313.2LY(Sales19663.0UnusualObservationsObsMktg$SalesFitSEFitResidualStResid1011.1204.000196.2362.1617.7642.29RRdenotesanobservationwithalargestandardizedresidual目前六十七頁\總數七十四頁\編于點剎車板銷售R-Sq

(修正后)BrakeSalesR-Sq(Adjusted)R-Sq(Adj)=97.8%Y的變差可由回歸里的三個元素解釋.R-Sq(Adj)=97.8%ofthevariationinYisexplainedbytheThreefactorsincludedintheregression.盡管結果不錯,但仍有2.2%剎車板銷售的變差不能解釋(Whilegood,thisstillmeansthatabout2.2%ofthevariationinBrakeSalesisstillunexplained.)S=4.022R-Sq=98.2%R-Sq(adj)=97.8%目前六十八頁\總數七十四頁\編于點多元回歸MultipleRegression路線分析圖Ana

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論