西格玛回归分析演示文稿_第1页
西格玛回归分析演示文稿_第2页
西格玛回归分析演示文稿_第3页
西格玛回归分析演示文稿_第4页
西格玛回归分析演示文稿_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西格玛回归分析演示文稿目前一页\总数七十四页\编于点优选西格玛回归分析目前二页\总数七十四页\编于点目的Objectives介绍相关性及回归的基本概念IntroduceTheBasicConceptsofCorrelationandRegression把回归与六西格玛路线图结合起来LinkRegressionToTheSixSigmaRoadmap学习多元回归的使用ReviewtheuseofMultipleRegression介绍相关性及回归的基本概念IntroduceTheBasicConceptsofCorrelationandRegression把回归与六西格玛路线图结合起来LinkRegressionToTheSixSigmaRoadmap学习多元回归的使用ReviewtheuseofMultipleRegression介绍相关性及回归的基本概念IntroduceTheBasicConceptsofCorrelationandRegression把回归与六西格玛路线图结合起来LinkRegressionToTheSixSigmaRoadmap学习多元回归的使用ReviewtheuseofMultipleRegression目前三页\总数七十四页\编于点项目跟踪图

第五版项目开始日期21/01/2004项目类别“Y”变量数据采集计划制定项目日程启动项目书DMAIC改善定义确定”Y”变量和起草项目书项目书得以批准流程图C&E矩阵或故障树分析FTA第三十天MBB审阅FMEA或故障树分析FTA测量系统分析MSA关键”X”变量数据采集计划MBB审阅测量21/01/200404/02/200411/02/200425/02/200409/03/200409/03/200409/03/2004初始能力研究多元变量流程分析MBB审阅合同批准分析22/03/200415/04/200415/04/200415/04/200415/04/2004单因子或多因子测试实验设计(DOE)MBB审阅改善31/05/200431/05/200431/05/2004控制计划最终能力研究控制阶段FMEA回顾重新修订RPNMBB审阅项目最终汇报及报告项目审核及项目收尾控制21/06/200429/06/200429/06/200405/07/200409/07/200409/07/200419/07/2004(根据需要使用)客户心声/业务之声调查VOC/VOB需求分析流程再造解决方案设计流程再造在这里输入开始日期

确定改善方案由项目发起人在备选项目数据库中完成在6西格玛数据库查找相似项目实施改善移交培训/流程所有人签准再造路线图的日程是独立计算的与以上DMAIC的日期不相关实际完成日期计划完成日期图例2/1/020022/3/02完成画钩目前四页\总数七十四页\编于点分析路线图

AnalyzeRoadmap

单一因子X-单一因子Y

SingleX-SingleY输入变量

X

XData离散Discrete

连续Continuous

输出变量Y

YData离散Discrete

连续Continuous

卡方相关性分析Chi-Square逻辑回归LogisticRegression方差分析,均值/中位数测试ANOVAMeans/MediansTests回归Regression目前五页\总数七十四页\编于点什么是Y?_____________数据类型?______________什么是X?_____________数据类型?______________应该使用何种工具?________________________案例

#1Scenario#1管理者想知道接线员的经验(以月为单位衡量)是否会对接听顾客热线电话需要的时间有影响目前六页\总数七十四页\编于点相关性

Correlation什么是相关性

?

Whatiscorrelation?你是否有过如此经验:测量某些产品并送至顾客处,但他们回来告诉你的产品不符规格?

Haveyouevermeasuredsomethingandthenshippedtoyourcustomeronlyforthemtotellyouitdoesn’tmeetspec?在奥林匹克溜冰比赛上,你认为两个裁判成绩之相关性有多高?

HowwellcorrelateddoyouthinktwoiceskatingjudgesareattheOlympics?目前七页\总数七十四页\编于点相关性Correlation路线分析图AnalyzeRoadmap

画出点阵图ProduceScatterPlot计算相关性CalculateCorrelation评估r和P值

Evaluater

andPvalue目前八页\总数七十四页\编于点相关系数

CorrelationCoefficients什么是相关系数?

SowhatistheCorrelationCoefficientsupposedtobeanyway?相关系数(r)介于-1和1之间

TheCorrelationCoefficient(r)liesbetween-1and1一般规则:GeneralRules相关系数(r)>.80或<-0.8为显著CorrelationCoefficient(r)>.80or<-.80isSignificant相关系数(r)介于-.80与0.8之间为不显著CorrelationCoefficient(r)between-.80and.80isNotSignificant目前九页\总数七十四页\编于点“+”相关性的强度及趋向

StrengthandDirectionof“+”Correlation目前十页\总数七十四页\编于点“-”相关性的强度及趋向

StrengthandDirectionof“-”Correlation目前十一页\总数七十四页\编于点r应该多大?

HowBigShouldrBe?依你的样本大小,若所得的相关性比表中的值大,则可视为“重要”或统计显著。BygoingtotheSampleSizeofyoursample,anycorrelationthatisgreaterthanthetablevalueisconsideredtobe“important”orstatisticallysignificant.目前十二页\总数七十四页\编于点r应该多大?

HowBigShouldrBe?勿需担心此表,Minitab可以帮助我们!

Butdon’tworryaboutthetables,Minitabcanhelpusout!在相关性程序中选取“Displayp-values”选项,Minitab将会显示出是否显著

Ifyouidentifythe‘Displayp-values’optionintheCorrelationprocedure,Min\itabwillgiveyoutheindicationifitissignificant找寻比0.05小的p-值

Lookforap-valuelessthan0.05目前十三页\总数七十四页\编于点

回归的定义

RegressionDefinition回归分析是一种用以分析变量间相关性的统计工具。统计课程中通常称其为“最佳拟合线”

Regressionanalysisisastatisticaltechniqueusedtoanalyzethecorrelationbetweenvariables.Thisissometimestaughtinstatisticalcoursesascomputingthe“lineofbestfit”.本周课程将讨论一元回归分析,其探讨对象为一连续Y与一连续X之关系,之后,我们还将讨论多元回归分析-对象为单一Y与多个连续X之间的关系.

Inthis

modulewewilllookatbothSimpleRegressionwhichcomparesonecontinuousYtoonecontinuousXandMultipleRegression-thecomparisonofonecontinuousYwithmorethanonecontinuousX目前十四页\总数七十四页\编于点01245

X=发动机重量Y=MPG15105例子:X=发动机重量Y=每加仑公里数回归案例RegressionExample你认为两变量间是什么关系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?目前十五页\总数七十四页\编于点01245

X=司机的经验Y=MPG15105例子:X=司机的经验Y=每加仑公里数回归案例RegressionExample你认为两变量间是什么关系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?目前十六页\总数七十四页\编于点01245

X=燃料添加剂量Y=MPG15105例子:X=燃料添加剂量Y=每加仑公里数回归案例RegressionExample你认为两变量间是什么关系?WhatCanYouSayAboutTheRelationshipBetweenThe2Variables?目前十七页\总数七十四页\编于点回归的定义RegressionDefinitions

01245

X=燃料添加剂量Y=MPG1510501245

X=司机的经验Y=MPG1510501245

X=发动机重量Y=MPG15105正相关性PositiveCorrelation负相关性NegativeCorrelation无相关性

NoCorrelation目前十八页\总数七十四页\编于点回归Regression路线分析图AnalyzeRoadmap规划分析内容收集数据在Minitab里绘制拟合线图评估R^2及P值的显著性评估残差制定决策目前十九页\总数七十四页\编于点路线分析图AnalyzeRoadmap

需要评估的案例:

Project:032REGRESSION011404.mpj,worksheet:Brake.mtw

336 325418 375355 367445 385365 375455 395395 395... ...速度刹车距离进行了对21种速度的测试.

你认为数据表明了什么?目前二十页\总数七十四页\编于点Minitab–回归Regression目前二十一页\总数七十四页\编于点Minitab–输出你会做何决策?目前二十二页\总数七十四页\编于点拟合线从何而来WhereDoesThisFittedLineComeFrom?Minitab找到一条线,使各点至线段之距离为最小…

Minitabfindsalinewhichwillminimizethedistancesfromtheplottedpointstotheline.... * * * * * * * * ** * 拟合线FittedLine实际数据点ActualDataPoint实际数据点与拟合线间的距离DistanceBetweenActualPointandLineInputVariable(X)OutputVariable(Y)目前二十三页\总数七十四页\编于点任何拟合线的一般等式如下…Thegeneralequationofanylineisasfollows...YinterceptSlopeoftheline()YmXb=+高中代数

所提之方程式在回归中,等式以b0andb1目前二十四页\总数七十四页\编于点输入变量InputVariable(X)响应变量ResponseVariable(Y)

}b0Y-截距b0是当X=0时,Y的高.换句话说,是拟合线与Y轴的交点.X=0目前二十五页\总数七十四页\编于点输入变量InputVariable(X)响应变量ResponseVariable(Y)

斜率是指:Slopeofthelinemeans

“Y的变化”“changeinY”

b1

=

“X里1个单位的变化”

“1unitchangeinX”

b1目前二十六页\总数七十四页\编于点Minitab–输出Y=182.8+.4763速度这个等式給我们一个对流程行为的估计Thisequationgivesusanestimationofprocessbehavior.注意R2=69.5%,我们一会儿回将讲到.目前二十七页\总数七十四页\编于点Minitab–输出Y=182.8+.4763xEx: 如果速度为400,刹车大概需要多大的距离?Ifthespeedmeasures400,whatapproximatevalueshouldweexpectindistance?Ex: 如果速度为1000,刹车大概需要多大的距离?

Ifthespeedmeasures1000,whatapproximatevalueshouldweexpectindistance?目前二十八页\总数七十四页\编于点回归的等式为Theregressionequationis刹车距离BrakingDistance

=182.8+0.4763速度SpeedS=13.5571R-Sq=69.5%R-Sq(adj)=67.9%方差分析AnalysisofVarianceSource DFSSMS FPRegression 17955.97955.9143.290.000Error 193492.1183.79Total 2011448.0Minitab–更多输出R2

(Sameoneasbefore)目前二十九页\总数七十四页\编于点R2-有何意义?R2与P值,有助我们以统计做决策。R2被称为判断系数R2andP,helpusputsomestatisticalbackingbehindourdecisions.TheR2iscalledthecoefficientofdeterminationR2

值代表“多少”输出变异总量可由回归模式所解释,其值介于0到1(0%到100%)。此值越高代表对该模式的可信度越高.R2isameasureoftheamountofvariationintheoutputthatisexplainedbytheregressionmodel.Itwillalwaysbeavaluebetween0and1(0%to100%).Thehigherthisamount,thegreaterconfidencewehaveinthemodelitself.

R2100%0%目前三十页\总数七十四页\编于点R2-有何意义?TheR2=69.5%这表明有69.5%的Y(刹车距离)的变差可以由X(速度)来解释.Thismeans69.5%ofthevariationinY(BrakingDistance)canbeexplainedbytheX(Speed).30.5%是由其他因素引起的.30.5%isduetosomethingelse.你的决策是什么?目前三十一页\总数七十四页\编于点R2-该为多大值?

HowBigShouldItBe?视分析对象而定…如对安全系统或回纹针

Thatanswer“depends”onwhatyouarestudying,e.g.safetysystemsorpaperclips.如果你在实验一个新的安全保障系统,你的数据将由交通部审查.你的数值该需要有多“好”?

Ifyouareexperimentingwithanewsafetyrestraintsystem,yournumberswillprobablybereviewedbytheDepartmentofTransportation.How“good”shouldyoube?不同的课题会有不同的决策标准(通常为+80%)。重要的是我们必须认识到

R2越高,统计模式越好。

Differenttextssuggestdifferentdecisioncriteria(usually+80%).TheimportantthingtorealizeisthatthehighertheR2thebetterthemodel.目前三十二页\总数七十四页\编于点回归分析:刹车距离v.速度RegressionAnalysis:BrakingDistversusSpeed回归的等式为Theregressionequationis刹车距离BrakingDistance=182.8+0.4763速度SpeedS=13.5571R-Sq=69.5%R-Sq(adj)=67.9%方差分析AnalysisofVarianceSource DF SS MS F PRegression 1 7955.9 7955.9143.29 0.000Error 19 3492.1 183.79Total 20 11448.0P值–里怎么了?

WhatIsGoingOnHere?AnotherPValue!目前三十三页\总数七十四页\编于点零假设:线段斜率=0 (无相关性)Ho: SlopeofTheLine=0 (Nocorrelation)备择假设:线段斜率=0 (有相关性)Ha: SlopeofTheLine¹0 (Thereiscorrelation)

记住…P要小,Ho要倒WhenPislow,Homustgo!P

值–另一个假设检定

AnotherHypothesisTest目前三十四页\总数七十四页\编于点Minitab–回归-残差&拟合数Regression-Residuals&Fits目前三十五页\总数七十四页\编于点Speed Distance RESI1 FITS1336 325 -17.8392 342.839418 375 -6.8948 381.895355 367 15.1113 351.889445 385 -9.7546 394.755365 375 18.3484 356.652455 395 -4.5175 399.517395 395 24.0598 370.940405 365 -10.7031 375.703346 355 7.3979 347.60... ... ... ...Minitab–更多输出MoreOutput目前三十六页\总数七十四页\编于点速度Speed

距离Distance

残差1RESI1

拟合数1FITS1336 325 -17.8392 342.839残差&拟合数-它们是什么?

Residual&Fit-WhatAreThey?拟和线FittedLine336325实际点ActualPoint]残差距离ResidualDistance

(-17.8392)理论拟合点TheoreticalFit

342目前三十七页\总数七十四页\编于点速度Speed

距离Distance

残差1

RESI1

拟合数1

FITS1336 325 -17.8392 342.839残差-点到拟合线的垂直距离

在线下方为负,在线上方为正.Residual-TheverticaldistancetothefittedlineNegativeisbelow,positiveisabove拟合数-Y值在拟合线上的理论值Fits-Thetheoreticalyvalueonthefittedline残差&拟合数-它们是什么?

Residual&Fit-WhatAreThey?目前三十八页\总数七十四页\编于点回归-残差&拟合数-图表总结Regression-Residuals&Fits–GraphicalSummary目前三十九页\总数七十四页\编于点数据应该通过“胖铅笔测试”“FatPencilTest”残差分析ResidualAnalysis数据应该像钟型分布DataShouldFitABellShapedCurve比较P值与残差正态分布测试的结果CheckPvaluewithNormalitytestonResiduals目前四十页\总数七十四页\编于点数据应在控制线内,调查异常点DataShouldBeInControlInvestigateOutliers残差分析ResidualAnalysis数据应无任何规律DataShouldExhibitNoPatterns目前四十一页\总数七十四页\编于点其他案例OtherExamples使用MinitabProject:032regression011404.mpj练习#1: AnalyzeworksheetPaint.mtwY=油漆厚度PaintThicknessX1=气压AirPressureX2=黏度Viscosity练习#2:AnalyzeworksheetCust.mtwY=客户回应时间CustomerResponseTimeX1=代理人有经验程度ExperienceLevelofAgentX2=与客户的距离DistanceFromCustomerSite练习#3:AnalyzeMysteryData.mtw目前四十二页\总数七十四页\编于点注意陈述中的因果关系

BewareofStatingCausality

即使我们建立了Y与X之相关性,但并不能确定X之变异将一定导致Y之变异。

IfweestablishacorrelationbetweenYandaX,thatdoesn’tnecessarilymeanvariationinXcausedvariationinY.

其它潜藏的变量,可能造成X与Y之改变。

Othervariablesmaybe‘lurking’thatcausebothXandYtovary.目前四十三页\总数七十四页\编于点研究指出当医院规模增加,病人死亡率亦显著提升。

这么说来,我们应该避免去大型医院就诊吗?Researchhasconsistentlyshownthatasthehospitalsizeincreases,thedeathrateofpatientsdramaticallyincreases.So,shouldweavoidlargehospitals?回归问题探讨:Xs缺失RegressionIssues-MissingXs01245

X=医院规模Y=死亡率15105目前四十四页\总数七十四页\编于点有关一个城市的数据显示,当城市里鹳的数量增加时,城市人口也增加.鹳真的影响城市人口吗?Dataonacityshowedthataspopulationdensityofstorksincreased,sodidthetown’spopulation.Didstorksinfluencethepopulation?01245

X=鹳的数量Y=城市人口15105回归问题探讨:Xs缺失RegressionIssues-MissingXs目前四十五页\总数七十四页\编于点回归问题探讨RegressionIssues

研究范围太狭窄RangeOfStudyTooSmall01245

X=车龄AgeofCarY=车值SalesValue15105目前四十六页\总数七十四页\编于点$车值ValueofCar车龄AgeofCar现在的数据看来如何?WhatWouldThisLookLikeNow?01 5101520253035404550回归问题探讨RegressionIssues

研究范围太狭窄RangeOfStudyTooSmall目前四十七页\总数七十四页\编于点分析路线图AnalyzeRoadmap

输入变量XXData单一因子XSingleX多因子

XsMultipleXs输出变量YYData单一输出Y

SingleY

多元输出

Y

MultipleYs

多变量分析MultivariateAnalysis(注意:这与多元变量分析不同)(Note:ThisIsNotTheSameAsMulti-VariAnalysis)输入变量X

XData离散

Discrete

连续Continuous

输出变量Y

YData卡方相关性分析Chi-Square逻辑回归LogisticRegressionT测试,方差分析,均值/中位数测试T-test,ANOVAMeans/MediansTests回归Regression多元回归MultipleRegressionMediansTests2,3,4way...ANOVAMultipleLogisticRegression多元逻辑回归离散

Discrete连续Continuous离散Discrete连续Continuous

离散Discrete

连续Continuous

2,3,4因子方差分析中位数测试多元逻辑回归MultipleLogisticRegression输入变量

X

XData输出变量Y

YData目前四十八页\总数七十四页\编于点多元回归分析

MultipleRegressionAnalysis两个或多个流程变量(X’s)可能对流程表现产生影响(Y).

Twoormoreprocessvariables(X’s)mayhaveaninfluenceuponprocessperformance(Y).多元回归应用于有两个或多个可能的预测变量的情况Multipleregressionisusedwhenevertherearetwoormorepossiblepredictorvariables.多元回归的一般等式为ThegeneralformofthemultipleregressionequationisnnXbXbXbbY++++=...22110目前四十九页\总数七十四页\编于点案例:刹车板销售量

Example:BrakeSales例中对刹车板销售量进行20次的观察.已知有五个流程变量和一个表现变量,Y:TwentyobservationsregardingBrakeSalesaregiven.ThereareFiveknownprocessvariablesandoneperformancevariable,Y:X1=

年度YearX2=市场营销费用$Mktg$X3=今年销售人员数SalesRepX4=去年(销售人员)数LY(SalesRep)X5=产品ProductY=销售Sales利用数据找出可能影响”销售量”的”重要的几个”流程变量.Usethedatatomineforthe“vitalfew”processvariablesthatmayinfluence“Sales”.目前五十页\总数七十四页\编于点刹车板销售量数据Year Mktg$ SalesRepLY(SalesRep) Product Sales1 9.6 30 20 18 1302 10.3 20 30 17 1573 10.2 15 20 19 1294 10.4 25 15 22 1295 10.6 30 25 24 1626 10.7 15 30 18 1547 10.5 25 15 17 1328 10.9 35 25 16 1729 11.0 40 35 14 20710 11.1 20 40 18 20411 11.2 25 20 22 14412 11.2 35 25 25 17513 11.4 5 35 27 16714 11.2 12 5 28 9715 11.6 16 12 18 12216 11.7 21 16 16 13917 11.8 22 21 15 15318 11.8 24 22 16 15619 11.8 26 24 10 17220 12.1 28 26 18 178032regression011404.mpjWorksheet“Sales.MTW”目前五十一页\总数七十四页\编于点刹车板销售量我们的目的是找到适用于下列形式的多元回归:Ourgoalistofitamultipleregressionofthefollowingform这个问题便于阐明下列多元回归的其他方面:Thisproblemwillillustratethefollowingadditionalaspectsofmultipleregression去掉没有解释能力的变量X

eliminationofX-variablesthathavenoexplanatorypower;残差分析

residualanalysis留在模式里的变量是能控制的.在6西格玛里,我们的目标就是要控制少数变量.Whatstaysinthemodelmusthavecontrols.InSixSigma,goalistocontrolafew.目前五十二页\总数七十四页\编于点多元回归MultipleRegression路线分析图规划分析内容收集数据利用回归或最佳子集分析AnalyzeUsingRegressionorBestSubsets评估残差制定决策评估R2

及P值的显著性多元共线性‘X’分析(相关性)Multicollinearity“X”Check(correlation)使用多元回归简化模式RunMultipleRegressionReducedModel因为有多条线,就不再使用拟合线图,Nolongerfittedlineplotduetomultiplelines目前五十三页\总数七十四页\编于点相关的预测变量(多元共线性)CorrelatedPredictorVariables(Multicollinearity)nnXbXbXbbY++++=...22110流程结果(Y)与预测变量(X’s)间的相关性是有用的—它可以帮助我们找出可能的因果关系.

Correlationbetweentheprocessoutput(Y)andthepredictorvariables(X’s)isgood--helpsusidentifypossiblecauseandeffectrelationships.相反,预测变量间的相关性却是一个问题.

Correlationbetweenpredictors,incontrast,isaproblem.计算里的正负符号和预测变量间的相关性大小可能有错误.Calculatedsignsandmagnitudesofcorrelatedpredictorsmaybewrong.计算出的P值可能偏大.CalculatedP-valuesmaybelarge.预测变量间的高相关性被称为”共线性”Highcorrelationbetweenpredictorvariablesiscalled“collinearity”目前五十四页\总数七十四页\编于点多元共线性:刹车板销售量

Multicollinearity:BrakeSales左侧是前20刹车板销售量预测变量:PredictorVariables:

(1)年度Year;(2)市场营销费用Marketing$;(3)今年销售人员数量HowmanySalesRepsthisyear;(4)去年销售人员数量HowmanySalesRepslastyear.(5)产品Product

032regression011404.mpjWorksheet“Sales.MTW”Year Mktg$ SalesRep LY(SalesRep) Product Sales1 9.6 30 20 18 1302 10.3 20 30 17 1573 10.2 15 20 19 1294 10.4 25 15 22 1295 10.6 30 25 24 1626 10.7 15 30 18 1547 10.5 25 15 17 1328 10.9 35 25 16 1729 11.0 40 35 14 20710 11.1 20 40 18 20411 11.2 25 20 22 14412 11.2 35 25 25 17513 11.4 5 35 27 16714 11.2 12 5 28 9715 11.6 16 12 18 12216 11.7 21 16 16 13917 11.8 22 21 15 15318 11.8 24 22 16 15619 11.8 26 24 10 17220 12.1 28 26 18 178目前五十五页\总数七十四页\编于点多元共线性:刹车板销售量选择所有五个预测变量和响应变量.Selectallfivepredictorvariablesandtheresponsevariable.使用Minitab菜单,

STAT>BASICSTATS>CORRELATION.不选择p值选项Uncheckpvalue目前五十六页\总数七十四页\编于点年度和市场营销费用有着很高的相关性!我们必须只能选择一个作为预测变量在回归拟合中使用.市场营销费用可能受年度影响,因此我们保留市场营销费用,而去掉年度变量.TheYearandMarketing$Variablesarehighlycorrelated!Wewillhavetochooseoneortheotherofthecorrelatedpredictorvariables(butnotboth)touseinaregressionfit.Possiblethatmarketing$isafunctionoftheyear-sokeepthemarketing$andeliminate

year.基本原则,如果相关性

>0.8or

<-0.8时则去掉变量相关性:年度,市场营销费用,销售人员数,去年销售人员数,产品Correlations:Year,Mktg$,SalesRep,LY(SalesRep),ProductYearMktg$ SalesRep LY(SalesMktg$0.973SalesRe-0.095-0.097LY(Sales-0.1110.0020.143Product-0.172-0.164-0.353 -0.181CellContents:Pearsoncorrelation多元共线性:刹车板销售量目前五十七页\总数七十四页\编于点多元回归MultipleRegression路线分析图规划分析内容收集数据利用回归或最佳子集分析AnalyzeUsingRegressionorBestSubsets评估残差制定决策评估R2

及P值的显著性多元共线性‘X’分析(相关性)Multicollinearity“X”Check(correlation)使用多元回归简化模式RunMultipleRegressionReducedModel因为有多条线,就不再使用拟合线图,Nolongerfittedlineplotduetomultiplelines目前五十八页\总数七十四页\编于点最佳子集回归BestSubsetsRegression

“最好的模式是尽可能简单的模式,没有比此模式更简单的”“Thebestmodelistheonethatisassimpleaspossible,butnosimpler.”

-AlbertEinstein目前五十九页\总数七十四页\编于点最佳子集回归:刹车板销售BestSubsets:BrakeSales

选择所剩四个预测变量和响应变量.(去掉”年度”)Selectthefourremainingpredictorvariablesandtheresponsevariable.(Exclude“year”)使用Minitab

菜单,

STAT>Regression>BestSubsets.目前六十页\总数七十四页\编于点最佳子集回归:刹车板销售

注意”年度”从模式中去掉了.BestSubsetsRegression:SalesversusMktg$,SalesRep,...ResponseisSalesSLaYPl(rMeSoksadtlugRecVarsR-SqR-Sq(adj)C-pS$est179.077.8156.012.841X120.916.6631.324.910X290.189.066.89.0570XX285.283.5107.011.084XX398.297.83.04.0222XXX390.588.765.89.1570XXX498.297.75.04.1540XXXX目前六十一页\总数七十四页\编于点多元回归MultipleRegression路线分析图规划分析内容收集数据利用回归或最佳子集分析AnalyzeUsingRegressionorBestSubsets评估残差制定决策评估R2

及P值的显著性多元共线性‘X’分析(相关性)Multicollinearity“X”Check(correlation)使用多元回归简化模式RunMultipleRegressionReducedModel因为有多条线,就不再使用拟合线图,Nolongerfittedlineplotduetomultiplelines目前六十二页\总数七十四页\编于点回归:刹车板销售Regression:BrakeSales

选择所有四个预测变量和响应变量.Selectallfourpredictorvariablesandtheresponsevariable.使用

Minitab菜单,

STAT>Regression>Regression目前六十三页\总数七十四页\编于点回归分析:刹车板销售RegressionAnalysis:BrakeSales

零假设=变量间没有任何关系备择假设=变量间有一些关系Ho=NorelationshipbetweenvariablesHa=SomerelationshipexistsbetweenvariablesRegressionAnalysis:SalesversusMktg$,SalesRep,...TheregressionequationisSales=-66.6+11.8Mktg$+1.18SalesRep+2.70LY(SalesRep)-0.007ProductPredictorCoefSECoefTPConstant-66.6419.17-3.480.003Mktg$11.8381.4947.920.000 HaSalesRe1.17510.12249.600.000 Ha LY(Sales2.70230.115423.420.000 HaProduct-0.00680.2337-0.030.977 HoS=4.154R-Sq=98.2%R-Sq(adj)=97.7%目前六十四页\总数七十四页\编于点回归/简化模式:刹车板销售Regression/ReducedModel:BrakeSales

选择所剩三个预测变量和响应变量.Selectthethreeremainingpredictorvariablesandtheresponsevariable.UsingMinitabMenu,

STAT>Regression>Regression记住检查残差图Remembertocheckyourresidualplots目前六十五页\总数七十四页\编于点回归分析:刹车板销售RegressionAnalysis:BrakeSales

零假设=变量间没有任何关系备择假设=变量间有一些关系Ho=NorelationshipbetweenvariablesHa=Somerelationshipexistsbetweenvariables回归分析:销售量v.市场营销费用,销售人员数,去年销售人员数RegressionAnalysis:SalesversusMktg$,SalesRep,LY(SalesRep)TheregressionequationisSales=-66.9+11.8Mktg$+1.18SalesRep+2.70LY(SalesRep)PredictorCoefSECoefTPConstant-66.9116.22-4.120.001Mktg$11.8471.4148.380.000 HaSalesRe1.17640.110610.640.000 HaLY(Sales2.70270.110624.440.000 HaS=4.022R-Sq=98.2%R-Sq(adj)=97.8%目前六十六页\总数七十四页\编于点刹车板销售案例的其他MiniTab输出TheRestofMiniTabOutputBrakeSales

AnalysisofVarianceSourceDFSSMSFPRegression313870.14623.4285.780.000ResidualError16258.816.2Total1914128.9SourceDFSeqSSMktg$1893.9SalesRe13313.2LY(Sales19663.0UnusualObservationsObsMktg$SalesFitSEFitResidualStResid1011.1204.000196.2362.1617.7642.29RRdenotesanobservationwithalargestandardizedresidual目前六十七页\总数七十四页\编于点刹车板销售R-Sq

(修正后)BrakeSalesR-Sq(Adjusted)R-Sq(Adj)=97.8%Y的变差可由回归里的三个元素解释.R-Sq(Adj)=97.8%ofthevariationinYisexplainedbytheThreefactorsincludedintheregression.尽管结果不错,但仍有2.2%刹车板销售的变差不能解释(Whilegood,thisstillmeansthatabout2.2%ofthevariationinBrakeSalesisstillunexplained.)S=4.022R-Sq=98.2%R-Sq(adj)=97.8%目前六十八页\总数七十四页\编于点多元回归MultipleRegression路线分析图Ana

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论