




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、相关及回归分析相关及回归分析Analyze 相关及回归分析 - 2MeasureMeasureDefineDefineAnalyzeAnalyzeImproveImproveControlControl方法论方法论q Analyze Analyze 概要概要q DATA DATA 收集计划收集计划 q Graph Graph 分析分析 q 假设检定概要假设检定概要q 平均的检定平均的检定 q 分散的检定分散的检定q 比率的检定比率的检定q 相关及回归分析相关及回归分析Analyze 相关及回归分析 - 3相关及回归分析相关及回归分析Analyze 相关及回归分析 - 4定义定义q 相关分析相关
2、分析(Correlation Analysis) : (Correlation Analysis) : q是把计量型输出变量和计量型输入变量之间相关程度,是把计量型输出变量和计量型输入变量之间相关程度,q利用相关常数利用相关常数(r)“(r)“数量化的技法。数量化的技法。q 回归分析回归分析(Regression Analysis) : (Regression Analysis) : q导出输入变量导出输入变量X X和输出变量和输出变量Y Y的函数关系,预测输出变量的的函数关系,预测输出变量的q统计性分析技法。统计性分析技法。q 回归式回归式(Regression Equation) : (R
3、egression Equation) : q为预测对应的输出值,利用输入值的预测方程式。为预测对应的输出值,利用输入值的预测方程式。Analyze 相关及回归分析 - 58765432106050403020100- 10- 20K N O B -1O U T-195% PI95% CIRegres s ionR-Squared = 0 .941Y = -10 .3333 + 7. 75XR e g re s s i o n P lo t为什么使用这样的工具为什么使用这样的工具? ?所有可能的所有可能的XsXsq 不防碍工程进行,对工程有意义的 DATA收集可能。q 进行DOE时跟加人为的变
4、化比较q 相关关系是提供Graph分析,输入变量和输出变量的相关性计量化而确认。q 回归分析使用于为了管理输入变量的预测式导出。q 回归分析能显示输入变量和输出变量之间的因果关系,所以能决定潜在Xs是否为Vital Few Xs. Analyze 相关及回归分析 - 6 散点图散点图 (Scatter Diagram) (Scatter Diagram) qq 相关分析相关分析 (Correlation Analysis)(Correlation Analysis)在统计学中最有兴趣的问题中的一个变量间相关性分析的方法 ,通过散点图和相关常数能分析。例例) ) 智能指数和学业成绩、吸咽量和肺癌
5、的发生率、身高和体重、工程温度和智能指数和学业成绩、吸咽量和肺癌的发生率、身高和体重、工程温度和 制品强度、运动量和肺活量间的关系、所得和消费支出。制品强度、运动量和肺活量间的关系、所得和消费支出。相关分析的第一阶段,把相互对应的资料 用作表平面上的点来表示的Graph,能大概确认两个变量之间的关系。 相关分析相关分析制品强度 (Y)工程温度 (X)Analyze 相关及回归分析 - 7 相相关关常常数数 (Correlation Coefficient) 定量表示两个变量之间线形关系的指标,并不表示函数关系。 一般用 表示,其范围是 1 1. 一般不可知道的正确值,因此使用从Sample中推
6、定的值 r 。22)()()(yyxxyyxxriiii 相相关关常常数数 (Correlation Coefficient)的性的性质质 r 值值(+) 时 阳的相关关系() 时 阴的相关关系接近于0时,没有相关关系。接近于-1 或1时有强的相关关系。相关分析相关分析Analyze 相关及回归分析 - 8 散点图和相关关系散点图和相关关系 强的阳的相关关系强的阳的相关关系 弱的阳的相关关系弱的阳的相关关系 中间程度的阳的相关关系中间程度的阳的相关关系 强的阴的相关关系强的阴的相关关系 弱的阴的相关关系弱的阴的相关关系 中间程度的阴的相关关系中间程度的阴的相关关系 相关分析相关分析 Analy
7、ze 相关及回归分析 - 9相关常数的乱用和误用q 检定两个变量之间存在相关关系,并不是一个变量成为q 另一个变量的原因。q 可能会藏在对两个变量都有影响的第三变量。q 即,两个变量之间存在相关关系的结论,并不是一个变量q 成为另一个变量的原因。Analyze 相关及回归分析 - 10通过下例观察散点图和相关分析。通过下例观察散点图和相关分析。 广告费 (10万) 销售额 (100万) 广告费 (10万) 销售额 (100万)4 9 12 238 20 6 189 22 10 258 15 6 107 17 9 20下面是表示某公司的广告费用和销售额之间关系的资料。 求这公司的广告费和销售额的
8、相关常数。例题例题1 1相关分析相关分析Analyze 相关及回归分析 - 11Step 1Work sheet 里里输输入入DATA(Correlation.mtw)Step 2Graph Plot 通过Plot 作成散点图的结果,预测是阳的相关关系。( Y 栏里C2, X栏里 输入C1) 相关分析相关分析Analyze 相关及回归分析 - 12Step 3Stat Basic Statistics CorrelationStep 4Session 结结果确果确认认 选择两个选择两个变变量列量列相关常数是相关常数是 0.853有阳的相关关系,有阳的相关关系, p 值为值为 0.002小于小于
9、 留意水准留意水准 0.05,所以广告费和销售额的相关关系是有影响的。,所以广告费和销售额的相关关系是有影响的。 相相关关常常数数p p 值值相关分析相关分析Analyze 相关及回归分析 - 13qq 回归分析回归分析 (Regression Analysis)(Regression Analysis) 为了查明变量之间函数的相关性而假定某数学Model,从已测定变量的Data中 推定其Model的统计性分析方法。根据这样的函数Model,从一个变量的变化 能预测另一个变量的变化例例) ) 父亲和儿子的身高关系父亲和儿子的身高关系 工程温度影响的制品强度工程温度影响的制品强度输出变量 : 欲
10、预测的变量,受输入变量影响的变量。输入变量 : 影响输出变量的变量。 输入变量和输出变量(反应变量)父亲的身高和工程温度是独立变量,父亲的身高和工程温度是独立变量,儿子的身高和制品的强度是从属变量儿子的身高和制品的强度是从属变量! !回归分析回归分析Analyze 相关及回归分析 - 14 R-Sq值叫决定系数用 R2表示。 在0 R2 1范围,总变动中被回归线说明的变动所占的比率。 R2 值越接近1时,回归线越高,判断有意义。合理的值是多少? 根据情况不同。化学者要求的是 0.99程度的R2 值, 但根据工程和产业不同。一般值为0.7以上是可以认为输出变量和 输入变量的关系大。如果R2是0.
11、679(67.9%) ,用回归方程式能说明散布的67.9%, 剩下的 32.1%是别的原因造成的。q 决定系数决定系数(Coefficient of Determination )(Coefficient of Determination )回归分析回归分析Analyze 相关及回归分析 - 15通过下例观察回归分析和决定系数。通过下例观察回归分析和决定系数。例题例题2 2为了知道机械的使用年度和 整备费用之间有什么关系,得到了有关对相同机械整备记录的如下DATA。 3 1 5 8 1 4 2 6 9 3 5 7 2 639 24 115 105 50 86 67 90 140 112 70
12、186 43 126使用年度(年)整备费用(千元)1) 对这个DATA求说明 x与 y之间关系的单纯回归方程式。2) 使用年度为10年时,整备费用是多少?回归分析回归分析Analyze 相关及回归分析 - 16Step 1Work sheet里里 DATA 输输入入Step 2Stat Regression Regression 选择输选择输出出变变量列量列 选择输选择输入入变变量列量列(Regression.mtw)回归分析回归分析Analyze 相关及回归分析 - 17选择显示在残差选择显示在残差GraphGraph的的残差形态残差形态Histogram of residuals : 残差
13、Histogram 作成Normal plot of residuals : 为残差的正规性检定而作成GraphResiduals versus fits : 作成残差和被适合值的图Residuals versus order : 作成残差对观测顺序的图Residuals versus the variables : 作成残差对指定变量的图回归分析回归分析Residual PlotsAnalyze 相关及回归分析 - 18输入所需的输入所需的x x 值,通过得出的回归式值,通过得出的回归式可以求可以求 值和信赖区间。值和信赖区间。输入输入1010,能计算出,能计算出1010年后的整备年后的整备
14、费用费用( (预测值预测值) )。y 回归分析回归分析Analyze 相关及回归分析 - 19回归分析回归分析Analyze 相关及回归分析 - 20Step 3Step 3SessionSession结果确认结果确认 关于整备费用和使用年度的回归式是关于整备费用和使用年度的回归式是决定系数决定系数R-Sq R-Sq 值为值为61%61%,在全体变动中按回归直线,在全体变动中按回归直线说明的变动是说明的变动是61%.61%.使用年度使用年度1010年的机械的整备费用年的机械的整备费用期待值是期待值是165.48165.48,对其的,对其的95% 95% 信赖区间是信赖区间是(123.66, 2
15、07.29).(123.66, 207.29).回归分析回归分析xy6 .131 .29p p 值为值为0.0010.001小于留意水准小于留意水准0.050.05, 所以认为上面的回归式有意。所以认为上面的回归式有意。 R-Sq(adj)R-Sq(adj)是在回归式上每追加变量是在回归式上每追加变量R-Sq R-Sq 值就增加的调整值。值就增加的调整值。 输入变量两个以上时,此值有意义,输入变量两个以上时,此值有意义,所以一般分析所以一般分析 R-Sq(adj).R-Sq(adj).Analyze 相关及回归分析 - 21Step 1Stat Regression Fitted Line P
16、lot 选择输选择输出出变变量列量列 选择输选择输入入变变量列量列 回归模型的类型决定回归模型的类型决定(1(1次次, 2, 2次次, 3, 3次次) )回归分析回归分析 Fitted Line Plot : 欲用欲用Graph分析分析时时活用。活用。Analyze 相关及回归分析 - 22Step 2Graph 结结果确果确认认回归分析回归分析Analyze 相关及回归分析 - 23qq 残差分析残差分析从实际值中减掉被回归模型适合的值叫残差,通过残差分析我们要确认模型的适合性。 残差分析残差分析-残差越小,推定的回归式越准确- 说明实际观测结果。-残差是误差最好的推定值。-残差按独立变量的
17、大小顺序或者 - 资料的输入顺序排列时,确认他- 们对0对称 ,不显示特别的倾向。 残差iiyyxy10),(iiyx 实际值回归模型 iiiyye残差残差 : :Analyze 相关及回归分析 - 24例题例题3 3为了知道机械的使用年度和整备费用之间有什么关系,得到了对相同机械的整备记录有关的如下 Data。得出适合值和残差后执行残差分析。 3 1 5 8 1 4 2 6 9 3 5 7 2 639 24 115 105 50 86 67 90 140 112 70 186 43 126使用年度(年)整备费用(千元)残差分析残差分析Step 1Work sheet 里里输输入入DATA(R
18、esiduals.mtw)Analyze 相关及回归分析 - 25Step 2Stat Regression Regression 选择从属变选择从属变量列量列 选择独选择独立立变变量列量列残差分析残差分析 Fits( Fits(适合值适合值) )CheckCheck Residuals( Residuals(残差残差) )CheckCheckAnalyze 相关及回归分析 - 26Step 3Work sheet 结结果确果确认认 残残差和差和适合适合值值被被储储存。存。Step 4Stat Regression Residual Plots 选择选择适合适合值值列列 选择残选择残差列差列残差分析残差分析Analyze 相关及回归分析 - 27Step 5确认确认Graph 残差分析残差分析Analyze 相关及回归分析 - 28 通过Normal Plot of Residuals 数据分布接近于对角线,所以可以说残差的分布 接近于正态分布。 ( 通过Stat Basic Statistics Normality Test 更仔细地做到正规性检定。) 在I Chart of Residuals中不离开管理限界线,因不具有任何Perform, 所以可以说残差的分布是稳定的。 Histogram of Residual
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 有机肥料在提升土壤微生物对作物生长调节物质产生中的作用考核试卷
- 简易呼吸器的使用 2
- 静脉血液标本采集指南
- 辽宁轻工职业学院《大学生创新创业与就业指导》2023-2024学年第一学期期末试卷
- 洛阳职业技术学院《计算机网络管理与安全》2023-2024学年第二学期期末试卷
- 江苏省启东市2024-2025学年高三下学期第二次模拟考试(期中)数学试题含解析
- 江苏电子信息职业学院《大学生职业生涯规划与就业指导(二)》2023-2024学年第二学期期末试卷
- 期贵州省毕节市重点中学2025届初三第一次质量检测试题物理试题含解析
- 辽宁省丹东33中学2024-2025学年初三下学期模拟(二)测试英语试题含答案
- XX学校课程改革与校本课程开发实施汇报范文
- 抗滑桩施工危险源辨识与评价及应对措施
- 语文园地五(识字加油站、我的发现)
- 身体红绿灯课件
- Pentacam白内障应用(第二版)
- 建设单位业主方工程项目管理流程图
- 发展心理学第四节-智力发展
- 压力管道检验计算案例
- 碎石挤密桩复合地基施工工法解读
- 包装厂质量管理体系
- 初中花城版八年级下册音乐4.狂欢之歌(15张)ppt课件
- 常用标准波导和法兰尺寸
评论
0/150
提交评论