版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、MinitabMinitab中级应用班中级应用班(绿带工具)(绿带工具) 目录目录1.Minitab基本操作基本操作 2.Minitab基本图形(基本图形(Graph)3.现状分析现状分析-原因查找原因查找4.基本统计(基本统计(Basic Statistics)5.方差分析(方差分析(ANOVA)6.回归分析(回归分析(Regression)7.DOE与控制图(与控制图(Control Charts)1.Minitab1.Minitab基本操作基本操作 -什么是Minitab?-Minitab画面构成-Minitab菜单构成-数据编辑什么是什么是Minitab ?Minitab ?MINIT
2、AB = Mini + Tabulator = =小型小型 + + 计算机计算机介绍 于1972年,美国宾夕法尼亚大学用来作统计分析、教育用而开发,目前已出版 Windows用版本Vesion 15.1,并且已在工学、社会学等所有领域被广泛使用。MINITAB 是为质量改善、教育和研究应用领域提供统计软件和服务的先导,是一个很好的质量管理和质量设计的工具软件,更是持续质量改进的良好工具软件,MINITAB 统计软件为质量改善和概率应用提供准确和易用的工具,MINITAB 被许多世界一流的公司所采用,包括通用电器、福特汽车、通用汽车、3M、霍尼韦尔、LG、东芝、诺基亚、以及 Six Sigma
3、顾问公司。特别是与Six-sigma关联,在GE、AlliedSignal等公司已作为基本的程序而使用,作为统计学入门教育方面技术领先的软件包,MINITAB 也被 4,000 多所高等院校所采用。 优点 以菜单的方式构成,所以无需学习高难的命令文,只需拥有基本的统计知识便可使用。图表支持良好,特别是与Six-sigma有关联的部分陆续地在完善之中。MinitabMinitab画面构成画面构成MinitabMinitab菜单构成菜单构成文件 : 有关文件管理所需的副菜单的构成编辑 : 编辑工作表数据, 外部数据的链接及命令编辑器数据 : 对于工作表的操作及数据类型的转化 计算 : 利用内部函数
4、的数据计算及利用分布函数的数据生成统计 : 是分析统计资料的副菜单,由基础统计、回归分析、分散分析、品质管理、时针序列 分析、离散资料分析、非母数统计分析等构成 图表 : 编辑图形的输出, 图表副菜单及文字图形构成编辑器 : 不使用菜单,使用命令直接作业及剪切板设置等副菜单工具:有关资源管理器、工具栏、选项栏、安全性设定等构成窗口 : 由控制 Window 画面构成的副菜单及管理 图形 画面的副菜单构成 帮助 : 提供输入、输出、路径及Minitab产品等的相关帮助 Minitab Minitab 菜单菜单( (文件文件) ) 打开打开新建 : 文件 - 新建(工作表, 项目)打开保存的项目
5、: 文件 - 打开项目打开保存的工作表: 文件 - 打开工作表 保存保存保存项目为当前文件名 : 文件 - 保存项目另存为 : 文件 - 将项目另存为保存工作表为当前文件名 : 文件 - 保存当前工作表另存为 : 文件 - 将当前工作表另存为 打印打印打印当前工作表 : 文件 - 打印工作表Minitab Minitab 菜单菜单( (数据数据) )从总工作表中分离出1个小工作表拆分工作表合并工作表复制一列分多列多列并一列行、列互换排序删除行删除变量Minitab Minitab 菜单菜单( (计算计算) )计算器列统计行统计标准化产生序列数据产生网号产生指示变量设定基准随机数据概率分布矩阵运
6、算Minitab Minitab 菜单菜单( (统计统计) )基本统计回归方差分析试验设计控制图质量工具可靠性与生存分析多元分析时间序列分析一维与二维数据的整理非参数统计分析探索性数据分析功效和样本大小分析Minitab Minitab 菜单菜单( (图形图形) )散点图矩阵图边际图直方图点图茎叶图概率图箱线图条形图饼图时间序列图在窗口工作表中可以输入数据,一个变量为一列。列用“C”开头,后面紧跟数字,譬如C1,C2,等。既可以用C1表示变量名,也可以在C1下面输入字母X,用“X”表示变量名。一行表示对一个个体进行观察所得到的观察结果。数据是全屏幕进行编辑的,光标在哪一个单元格,就可以在该单元
7、格中输入数据并进行修改;插入单元格、行或列在右键点击“插入单元格”、“插入行”、“插入列”进行;删除行、列在“数据”中分别点击“删除行”、“删除变量”进行;删除单元格在“编辑”中点击“删除单元格”进行,或点击右键进行;数据编辑数据编辑2.Minitab基本图基本图形形(Graph) -散点图(Scatterplot)-矩阵图(Matrix Plots)-边际图(Marginal Plots)-直方图(Histogram)-箱线图(BoxPlot)-条形图(Bar Chart)-饼图(Pie Chart)-时间序列图(Time Series Plot)散点图散点图:想知道变数间的关联性的时候想知
8、道变数间的关联性的时候图形 散点图公司生产的相机电池是否能够很好地满足顾客的需要。市场调查显示,如果两次放电之间等待的时间超过 5.25 秒,顾客就会变得很不耐烦。收集了分别使用过不同时间的电池的一个样本,并在每个电池放电后立即测量了其剩余电压(放电后电压),还测量了各电池再次放电之前必须等待的时间(放电恢复时间)。(文件文件:Graph-1.MTW)散点图散点图:想知道变数间的关联性的时候想知道变数间的关联性的时候图形 散点图矩阵图矩阵图 : 想知道多种变数间的联系性时想知道多种变数间的联系性时 图形 矩阵图文件文件:Graph-1.MTW边际图边际图 : 同时确认两个变量之间的关系和分布同
9、时确认两个变量之间的关系和分布图形 边际图文件文件:Graph-1.MTW直方图直方图 : 确认数据的散布情况确认数据的散布情况A AB B44434544443537454544403641414447453746434035414340344350454642424042474244454043图形 直方图文件文件:Graph-3.MTW46444240386543210A A频频率率A A 的的直直方方图图箱线图箱线图: 确认数据的散布及平均确认数据的散布及平均图形 箱线图BA50.047.545.042.540.037.535.0数数据据A A, , B B 的的箱箱线线图图文件文件:
10、Graph-3.MTW12345Data:1,2,3,4,5箱线图箱线图: 确认数据的散布及平均确认数据的散布及平均条形图条形图: 用于分析对比用于分析对比汽车装配厂的车门喷漆环节存在较大的问题,现对一天的喷漆缺陷进行了记录,请用图形对各项缺陷类型的频次进行直观的比较。共有25条记录:划痕、划痕、桔纹、桔纹、色差、划痕、Other、Other、桔纹、桔纹、桔纹、桔纹、划痕、划痕、桔纹、划痕、色差、划痕、桔纹、桔纹、桔纹、桔纹、Other、Other、划痕、划痕、桔纹图形 条形图文件文件:Graph-4.MTW色差桔纹划痕Other121086420缺缺陷陷计计数数缺缺陷陷 的的图图表表饼图饼图
11、: 用于分析对比用于分析对比某移动通信服务商对计费差错原因进行分析,收集了1个月的话单错误的类型,具体数据如下,请用图形直观地显示各种错误类型的构成比例:图形 饼图计费类型错 112612无主话单 26950字段解析错 18861长途话单解析错 11250电话号码错 5278文件文件:Graph-5.MTW计费类型错无主话单字段解析错长途话单解析错电话号码错类别电话号码错5278, 3.0%长途话单解析错11250, 6.4%字段解析错18861, 10.8%无主话单26950, 15.4%计费类型错112612, 64.4%错错误误类类型型 的的饼饼图图时间序列图时间序列图:反映数据随着时间
12、变化的趋势与走向反映数据随着时间变化的趋势与走向季度年销售量120001002200012032000180420001831200114322001151320011994200121112002165220021933200220542002235销售部新来的经理需要了解一下公司历年来的销售情况,他收集了2000年度到2002年度每个季度的销售数据,具体如下,请用图形直观地反映销售的趋势和走向:图形 时间序列图文件文件:Graph-6.MTW年季度200220012000Q4Q3Q2Q1Q4Q3Q2Q1Q4Q3Q2Q1240220200180160140120100销销售售量量销销售售量量
13、 的的时时间间序序列列图图3128153862412132962556112712128622456291529147527492320221823421048194335735115Practice 1某银行对其所属的某营业网点进行某银行对其所属的某营业网点进行抽样调查,其中测量了该网点在抽样调查,其中测量了该网点在2月月8日从上午日从上午10点至下午点至下午3点间所有顾点间所有顾客(共客(共40人)的等候时间,试绘制人)的等候时间,试绘制直方图分析?。直方图分析?。供应商供应商使用寿命使用寿命甲甲17801780甲甲930930甲甲14001400甲甲16301630甲甲11601160甲
14、甲11501150甲甲17701770甲甲11901190甲甲10301030甲甲15701570乙乙10901090乙乙10001000乙乙880880乙乙15901590乙乙910910乙乙15201520乙乙12701270乙乙14701470乙乙11101110乙乙12901290Practice某公司从两家供应商各采购了一批某公司从两家供应商各采购了一批灯泡,分别统计各组样品的使用寿灯泡,分别统计各组样品的使用寿命,试绘制箱线图分析。命,试绘制箱线图分析。3.3.现状分析现状分析- -原因查找原因查找-柏拉图(Pareto Chart)-因果图(Cause and Effect)-能
15、力分析(正态 Normal)-能力分析(二项 Binomial)柏拉图柏拉图 : 确认数据的比重确认数据的比重, ,找出找出CTQCTQ的一种方法的一种方法 掌握对于地域别显示器需要的比重 统计 质量工具 Pareto图北 美22.9E U17.9韩 国1.8日 本5.7中 国2印 度0.9亚 洲4.6中南美3.1CIS/东欧2.2其他1.9比重1.80.922.917.95.74.63.12.22.01.9百分比2.91.436.328.49.07.34.93.53.23.0累积 %98.6100.036.364.873.881.186.089.592.795.7客户群印 度韩 国其他中 国
16、CIS/东欧中南美亚 洲日 本E U北 美706050403020100100806040200比比重重百百分分比比客客户户群群 的的 P Pa ar re et to o 图图文件文件:Tools-1.MTW通过使用 Pareto 图,您发现部件通常是因为表面瑕疵而遭到拒收。今天下午,您与各个部门的成员召开会议,集体讨论这些瑕疵的潜在原因。因果图因果图: :了解潜在原因之间的关系了解潜在原因之间的关系统计 质量工具 因果文件文件:Tools-2.MTW环环境境测测量量方方法法材材料料机机器器人人员员OperatorsTrainingSupervisorsShiftsSpeedLathesBi
17、tsSocketsSuppliersLubricantsAlloysBrakeEngagerAngleInspectopesMicrosctersMicromenCondensatioMoisture%TestingMentorsErraticslowTooConditionAccuracy因因果果图图 某公司前台接线员接到客户电话,询问清楚之后,需要在规定时间(某公司前台接线员接到客户电话,询问清楚之后,需要在规定时间(24s12s) 将电话转将电话转接给相关人员,收集了某一天接线员在不同时间段处理电话时间,进行过程能力分析。接给相关人员,收集了某一天接线员在不同时间段处理电话时间,进行过程
18、能力分析。Torque24221437183627211716321731222734212027192416211624182630312134162814321524141614Minitab Menu : 统计统计 质量工具质量工具 能力分析能力分析 正态正态计量型数据的过程能力分析计量型数据的过程能力分析文件文件:Tools-3.MTW353025201510LSLUSLLSL12目标*USL36样本均值22.9样本 N40标准差(组内)5.99221标准差(整体)6.84929过程数据Cp0.67CPL0.61CPU0.73Cpk0.61Pp0.58PPL0.53PPU0.64Ppk
19、0.53Cpm*整体能力潜在(组内)能力PPM USL25000.00PPM 合计25000.00实测性能PPM USL14401.53PPM 合计48855.10预期组内性能PPM USL27899.25PPM 合计83658.48预期整体性能组内整体时时间间 的的过过程程能能力力 某公司要求客服人员在收到客户邮件后,一个工作日之内必须回复,抽查统计了某公司要求客服人员在收到客户邮件后,一个工作日之内必须回复,抽查统计了6月月1号至号至24号的邮件发送状况号的邮件发送状况。Minitab Menu : 统计统计 质量工具质量工具 能力分析能力分析 二项二项计数型数据的过程能力分析计数型数据的
20、过程能力分析日期日期抽查邮抽查邮件数量件数量延迟发延迟发送数量送数量06-01150306-02150406-03150606-04150806-05150606-06150606-07150306-08150406-09150806-10150706-11150906-12150606-131501206-14150306-15150706-161501006-171506日期日期抽查邮抽查邮件数量件数量延迟发延迟发送数量送数量06-18150306-19150706-20150406-21150506-22150406-231501206-2415011文件文件:Tools-4.MTW28
21、2522191613107410.0750.0500.0250.000样样本本比比率率_P=0.0436UCL=0.0936LCL=0302520151055432样样本本% %缺缺陷陷置信区间上限:1.7771%缺陷:4.36置信区间下限:3.78置信区间上限:4.99目标:0.00PPM 缺陷:43556置信区间下限:37779置信区间上限:49933过程 Z:1.7108置信区间下限:1.6455(95.0% 置信)摘要统计128412963观观测测缺缺陷陷期期望望缺缺陷陷8.06.44.83.21.60.086420% %缺缺陷陷频频率率Tar延延迟迟发发送送数数量量 的的二二项项过过
22、程程能能力力分分析析P P 控控制制图图累累积积 % %缺缺陷陷二二项项图图直直方方图图 Practice不良项目个数不良率累计不良率短路8341.5%41.5%空焊5427.0%68.5%撞件2512.5%81.0%破损126.0%87.0%反向84.0%91.0%其他189.0%100.0%Total200100.0%-1.收集10月份SMT制程不良数据如下,请做柏拉图分析主要不良项目。Practice2.某工厂制造一批紫铜管,应用X bar-R管制图来控制其内径,尺寸单位为m/m,利用数据表之数据(USL=55;SL=50;LSL=45)求得其管制界限并绘图;请判定过程是否稳定?分析制程
23、能力状况 ?制程是否可用控制用控制图?樣組測定值樣組測定值X1X2X3X4X5X1X2X3X4X515050495251145348475251247535345501553484951523464549484916465053515345048494952175052494949546485054501850495049516504952515419524952535074749504852205047505352848504649512152495153509505049515322555451515010495151464823505452504911515049465024475151
24、52521250504952512553515150511349494950554.基本统计基本统计(Basic Statistics) -显示描述统计(Display Descriptive Statistic)-单样本Z(1 Sample Z)-单样本T(1 Sample T)-双样本T(1 Sample Z)-单比率 (1 Proportion)-双比率 (1 Proportion)-相关分析 (Correlation)-正态性检验 (Normality Test)显示描述性统计显示描述性统计开发新的饮食方法的公司为了知道它的效果,把7名主妇为对象做了实验。实验结果他们的体重变化如右侧的
25、值。用什么样的方法了解她们的体重变化。Before After58.560.060.354.961.758.169.062.164.058.562.659.956.754.4统计统计基本统计量基本统计量 显示描述性统计显示描述性统计文件文件:BS-1.MTW标准差为15的正态分布总体中取出25个样本得到了如下资料. 总体的历史平均值是70, 但是调查者根据推出的样本材料的结果认为总体平均小于70.利用统计工具检验一下(显著性水平=0.05).统计 基本统计量 单样本 Z对单个总体平均的假设检验对单个总体平均的假设检验- -总体标准差已知总体标准差已知单样本 Z: C1 mu = 70 与 50
26、000 的检验 平均值变量 N 平均值 标准差 标准误 95% 下限 T P寿命时间 9 52000 1500 500 51070 4.00 0.002500005100054000520005400050000530005200052000对单个总体平均的假设检验对单个总体平均的假设检验- -总体标准差未知总体标准差未知文件文件:BS-2.MTW C3栏栏测量了A公司和B公司生产的同一部品的尺寸.(假设总体方差相同).两公司的部品参数总体平均是否有差异,用显著性水平=0.05来检验 统计 基本统计量 双样本 t两个总体平均的假设检验两个总体平均的假设检验A 与与 B 的双样本的双样本 T 平
27、均值平均值 N 平均值平均值 标准差标准差 标准误标准误A 12 83.00 4.00 1.2B 10 81.00 4.99 1.6差值差值 = mu (A) - mu (B)差值估计差值估计: 2.00差值的差值的 95% 置信区间置信区间: (-1.99, 5.99)差值差值 = 0 (与与 ) 的的 T 检验检验: T 值值 = 1.04 P 值值 = 0.309 自由度自由度 = 20两者都使用合并标准差两者都使用合并标准差 = 4.4721AB 82768181809189828676838080777487867786838683文件文件:BS-3.MTW现有的保单填写正确率为60
28、%,为此公司专门设立专职填单人员,然后随机地抽取100份保单,其中66份保单填写正确. 用显著性水平=0.05来检验一下,能不能说设立专职填写人员之后,保单填写正确率显著提升了.统计 基本统计量 单比率单个总体比率的检验单个总体比率的检验单比率检验和置信区间单比率检验和置信区间 p = 0.6 与 p 0.6 的检验样本 X N 样本 p 95% 下限 Z 值 P 值1 66 100 0.660000 0.582082 1.22 0.110在美国总统选举中, 对A候选人想要推定旧金山地区和纽约地区的支持率的差异.在旧金山地区调查5000名, 在纽约地区中调查2000名的结果,得到各2400名,
29、 1200名的支持. 求A候选人的两个地区的支持率是否相同.用显著性水平=0.05来检验.统计 基本统计量 双比率双比率检验和置信区间双比率检验和置信区间 样本 X N 样本 p1 2400 5000 0.4800002 1200 2000 0.600000差值 = p (1) - p (2)差值估计: -0.12差值的 95% 置信区间: (-0.145549, -0.0944512)差值 = 0(与 0) 的检验: Z = -9.07 P 值 = 0.000两个总体比率的检验两个总体比率的检验为了解投保人年收入和年投保金额的关系,调查了20个投保人. 在显著性水平=0.05检验一下相关关系
30、.图形 散点图统计 基本统计量 相关相关分析相关分析年收入年收入年投年投保金额保金额10000020000500002000086000150002000003000016000025050300006000400006660800005000110000100006000020000900002780020000230050000500060000450066500100001500002000012000100012000018000240002000文件文件:BS-4.MTW200000150000100000500000300002500020000150001000050000年年收
31、收入入年年投投保保金金额额年年投投保保金金额额 与与 年年收收入入 的的散散点点图图相关相关: 年收入年收入, 年投保金额年投保金额 年收入 和 年投保金额 的 Pearson 相关系数 = 0.779P 值 = 0.000检验一组数据是否服从正态分布统计 基本统计量 正态性检验正态性检验正态性检验P=0.5050.05, 所以数据是正态的所以数据是正态的7672686460999590807060504030201051C C1 1百百分分比比均值66.5标准差3.635N22AD0.325P 值0.505C C1 1 的的概概率率图图正态 文件文件:BS-5.MTW为了解育才中学学生的身体
32、素质状况,对该校的学生进行了随机抽样,并测量为了解育才中学学生的身体素质状况,对该校的学生进行了随机抽样,并测量了其身高与体重,试对学生的身高做描述性统计分析,并分析了其身高与体重,试对学生的身高做描述性统计分析,并分析身高与体重的相身高与体重的相关关系关关系?Practice 1No.No.身高身高体重体重No.No.身高身高体重体重No.No.身高身高体重体重116556111615521175622172681217662221626231595213166482315848418274141757624162525158631516867251787461625816178752615
33、952717672171595027152458175661815962281596291655619176782915859101636820158543018277 某公司两位保险推销人员某公司两位保险推销人员BobBob和和JaneJane,从去年一年统计数,从去年一年统计数据来看,据来看,BobBob共约见了共约见了305305个客户,其中达成订单的为个客户,其中达成订单的为4040个个;JaneJane共约见了共约见了500500个客户,达成订单的为个客户,达成订单的为5050个。个。 在显著性水平在显著性水平=0.05=0.05检验一下检验一下BobBob和和JaneJane的约见
34、成功率的约见成功率是否存在差异?是否存在差异? Practice 2 某保险公司对某保险公司对A A地区和地区和B B地区分别调查了投地区分别调查了投保人的死亡年龄,保人的死亡年龄, A A地区和地区和B B地区分别各自抽地区分别各自抽取取1010个投保人,统计数据如下,个投保人,统计数据如下, 假设假设A A、B B地区投保人死亡年龄的方差相等地区投保人死亡年龄的方差相等,在显著性水平,在显著性水平=0.05=0.05检验一下检验一下A A、B B地区投地区投保人的寿命是否存在差异?保人的寿命是否存在差异?Practice 3文件文件:BS-6.MTW5 5. .方差分析(方差分析(ANOV
35、AANOVA) -单因子方差分析(One Way ANOVA)& 制造车间研讨制造车间研讨3种材料种材料. 目前使用的是目前使用的是A公司的材料公司的材料,现在要把现在要把B,C公司的材料追加研讨公司的材料追加研讨. 通过对各个材料的强度分析找出最佳的材料通过对各个材料的强度分析找出最佳的材料.ABC91821121519141421131716181523先要对数据进行处理,进行堆叠先要对数据进行处理,进行堆叠数据数据 堆叠堆叠 列列单因子方差分析单因子方差分析文件文件:ANOVA.MTW22.520.017.515.012.510.07.55.0999590807060504030
36、201051A A百百分分比比均值13.2标准差3.271N5AD0.204P 值0.734A A 的的概概率率图图正态 20191817161514131211999590807060504030201051B B百百分分比比均值15.8标准差1.643N5AD0.319P 值0.372B B 的的概概率率图图正态 27.525.022.520.017.515.0999590807060504030201051C C百百分分比比均值20标准差2.646N5AD0.271P 值0.506C C 的的概概率率图图正态 1 正态性检验正态性检验统计统计 基本统计量基本统计量 正态性检验正态性检验单
37、因子方差分析单因子方差分析三组数据三组数据P均大于均大于0.05, 所以三组数所以三组数据都服从正态分布据都服从正态分布2 等方差检验等方差检验统计统计 方差分析方差分析 等方差检验等方差检验单因子方差分析单因子方差分析P大于大于0.05, 所以材料所以材料A A、B B、C C的强的强度的方差相等度的方差相等等方差检验等方差检验: 强度强度 与与 材料代号材料代号 95% 标准差 Bonferroni 置信区间材料代号 N 下限 标准差 上限 A 5 1.76780 3.27109 12.5901 B 5 0.88802 1.64317 6.3244 C 5 1.42985 2.64575
38、10.1832Bartlett 检验(正态分布)检验统计量 = 1.59, p 值 = 0.452Levene 检验(任何连续分布)检验统计量 = 0.36, p 值 = 0.7063 单因子方差分析(单因子方差分析(ANOVA)统计统计 方差分析方差分析 单因子单因子单因子方差分析单因子方差分析 比较四个车工ABCD所加工丝杠的直径是否相等。将20根坯料用随机序编号顺序号,再采用随机抽取方法,让每个车工选取5根,按顺序号在同台车床上加工.A AB BC CD D50.049.850.750.650.450.250.551.049.849.950.950.850.350.050.851.250
39、.750.450.350.5直径数据表直径数据表 单位单位:mmPractice6 6. .回归分析(回归分析(RegressionRegression) -一元线性回归分析(Regression)什么是回归分析什么是回归分析1. 什么是回归分析什么是回归分析 改善问题时有很多情况是需要掌握相关变量之间的相互关联性改善问题时有很多情况是需要掌握相关变量之间的相互关联性. (有有/无相互关联性可能会成为解决问题的无相互关联性可能会成为解决问题的Point) 这种关联性用数学方程式来表示并且分析它的关联性时我们称它为回归分析这种关联性用数学方程式来表示并且分析它的关联性时我们称它为回归分析. 问题
40、问题Y(从属变量从属变量)与因子与因子X(独立变量独立变量)之间的关系用下面的数学方程式来表示之间的关系用下面的数学方程式来表示. Y = a + b + error where, a = 常量常量 , b = 斜率斜率2. 回归方程式的种类回归方程式的种类 一元线性回归分析一元线性回归分析 : Y因子和因子和X因子各因子各1个的情况个的情况 多元线性回归分析多元线性回归分析 : 有有2个以上个以上X的情况的情况 曲线回归分析曲线回归分析 : 由独立变量由独立变量(X)1个个,从属变量从属变量(Y)1个构成的个构成的2次以上的高次函数次以上的高次函数3. Data收集是收集是 ? 为了推定变动
41、最小时的倾斜度为了推定变动最小时的倾斜度, 取取X因子的最低界限值到最高界限值为止的因子的最低界限值到最高界限值为止的 广范围的广范围的Data. 为了减少收集数据时因时间经过而可能会产生的潜在变量要随机地确定为了减少收集数据时因时间经过而可能会产生的潜在变量要随机地确定X因子的水平之后再做实验因子的水平之后再做实验. 一元线性回归分析一元线性回归分析1. 散点图散点图 Minitab Menu : 图形 散点图文件文件:Regression-1.MTW8070605040302010012010080604020X XY YY Y 与与 X X 的的散散点点图图一元线性回归分析一元线性回归分
42、析2. 相关分析相关分析 Minitab Menu : 统计 基本统计量相关文件文件:Regression-1.MTW相关相关: X, Y X 和 Y 的 Pearson 相关系数 = 0.993P 值 = 0.000P0.05,拒绝原假设(原假设为线性不相关),拒绝原假设(原假设为线性不相关),说明线性相关性很好说明线性相关性很好 回归分析回归分析: Y 与与 X 回归方程为 Y = 4.71 + 1.48 X自变量 系数 系数标准误 T P常量 4.712 3.242 1.45 0.184X 1.48018 0.06408 23.10 0.000S = 4.26989 R-Sq = 98.
43、5% R-Sq(调整) = 98.3%方差分析来源 自由度 SS MS F P回归 1 9727.7 9727.7 533.55 0.000残差误差 8 145.9 18.2合计 9 9873.6利用拟合的回归方程式来推定Y值. Y = 4.71 + 1.48X一元线性回归分析一元线性回归分析3. 回归分析回归分析 3.1 回归回归方程方程 Minitab Menu : 统计 回归 回归一元线性回归分析一元线性回归分析Residual(残差残差) 表示表示 实际观测值减去回归方程拟合值实际观测值减去回归方程拟合值1) 残差的平均应始终为残差的平均应始终为 0 2) 残差应该呈正态分布残差应该呈
44、正态分布3) 残差要随机分布残差要随机分布 (不能有任何倾向性不能有任何倾向性)3. 回归分析回归分析 3.2 残差诊断残差诊断 Minitab Menu : 统计 回归 回归1050-5-10999050101残残差差百百分分比比1209060305.02.50.0-2.5-5.0拟拟合合值值残残差差7.55.02.50.0-2.5-5.03210残残差差频频率率109876543215.02.50.0-2.5-5.0观观测测值值顺顺序序残残差差正正态态概概率率图图与与拟拟合合值值直直方方图图与与顺顺序序Y Y 残残差差图图807060504030201007.55.02.50.0-2.5-
45、5.0X X残残差差残残差差与与 X X(响应为 Y)120100806040207.55.02.50.0-2.5-5.0Y Y残残差差残残差差与与 Y Y(响应为 Y)残差诊断,无异常!残差诊断,无异常!3.3. 画拟合线图画拟合线图 Minitab Menu : 统计统计 回归回归 拟合线图拟合线图 得出结论 X的大小是影响Y的因子 因R-Sq = 98.5 %,可以认为做了相当的贡献 (通常推荐是R-Sq 的值为65 % 以上) CI置信区间置信区间: 平均值的预测区间平均值的预测区间 PI预测区间预测区间: 个别观察值的预测区间个别观察值的预测区间一元线性回归分析一元线性回归分析807
46、06050403020100140120100806040200X XY YS4.26989R-Sq98.5%R-Sq(调整)98.3%回归95% 置信区间95% 预测区间拟拟合合线线图图Y = 4.712 + 1.480 X一元线性回归分析一元线性回归分析新新观测值观测值的的预测值预测值新新观观 拟拟合合值值测值测值 拟拟合合值值 标标准准误误 95% 置信置信区间区间 95% 预测区预测区间间 1 75.02 1.35 (71.90, 78.14) (64.69, 85.35)3.4 最佳化及预测最佳化及预测 Minitab Menu : 统计 回归 回归 假如我们希望Y越接近75越好,
47、通过回归方程,当Y=75时,求得X=47.5 为了解某地区投保人年收入和年投保金额的关系,针对该地区,调查了20个投保人. 对该地区投保人年收入和年投保金额,进行回归分析。 假如该地区有一名投保人,其年收入大约为36,000元,请预测其年投保金额的大致范围。年收入年收入年投年投保金额保金额10000020000500002000086000150002000003000016000025050300006000400006660800005000110000100006000020000900002780020000230050000500060000450066500100001500002
48、000012000100012000018000240002000文件文件:Regression-2.MTWPractice7 7. .实验设计(实验设计(DOEDOE) -全因子实验设计全因子实验设计-部分因子实验设计部分因子实验设计 在一定的预算条件(费用, 时间, )下,为了得出最大情报, 计划实验方法和分析方法. 给输出变量(Y)有意影响的输入变量(X)是哪些? 有多大影响? 无意的输入变量影响程度是多少? 测定误差是多少? 产生有意影响的输入变量在何种条件下, 可以得到最理想的输出呢?DOEDOE的定义的定义q DOE (Design of Experiments)DOEDOE的目的
49、的目的 q 确认被选定的 Vital Few Xs 之间的交互作用 q 利用X的Y预测MODEL树立 q 决定使Y最佳化的X条件 Y = f (X1, X2, X3, Xn) 输出变量输出变量 Y输入变量输入变量 X用语用语输入因子输入因子(因子因子) Xsn称为因子称为因子(Factor)n潜在解决案或研究中的变量潜在解决案或研究中的变量n因子按水准别分类。因子按水准别分类。 例例) 在半导体在半导体Process中输入变量为中输入变量为 : 压力,温度压力,温度 输出变量输出变量 YX3X2X1X5.X4 输出变量输出变量 Yn称为反应称为反应(Response)n输入变量输入变量(因子因
50、子)对对Y的影响效果的影响效果例)半导体例)半导体Process效率效率7 7. .控制图(控制图(Control Charts) -控制图控制图P(P(不良率控制图不良率控制图) )-控制图控制图NP(NP(不良品数控制图不良品数控制图) )控制图控制图NP(不良率控制图不良率控制图)Minitab Menu : 统计统计控制图控制图属性控制图属性控制图P文件文件:SPC-1.MTW1917151311975310.350.300.250.200.150.100.050.00样样本本比比率率_P=0.1685UCL=0.3324LCL=0.00471不不良良数数 的的 P P 控控制制图图使
51、用不相等样本量进行的检验控制图控制图NP(不良率控制图不良率控制图)Minitab Menu : 统计统计控制图控制图属性控制图属性控制图NP151311975315040302010样样本本样样本本计计数数_NP=30.81UCL=47.38LCL=14.25111不不良良数数 的的 N NP P 控控制制图图文件文件:SPC-2.MTW 某公司要求客服人员在某公司要求客服人员在收到客户邮件后,一个工收到客户邮件后,一个工作日之内必须回复,抽查作日之内必须回复,抽查统计了统计了6月月1号至号至24号的邮号的邮件发送状况。件发送状况。 每天抽检每天抽检150个邮件,统个邮件,统计延迟发送的邮件
52、数量,计延迟发送的邮件数量,用控制图对其进行监控。用控制图对其进行监控。日期日期抽查邮抽查邮件数量件数量延迟发延迟发送数量送数量06-01150306-02150406-03150606-04150806-05150606-06150606-07150306-08150406-09150806-10150706-11150906-121506日期日期抽查邮抽查邮件数量件数量延迟发延迟发送数量送数量06-131501206-14150306-15150706-161501006-17150606-18150306-19150706-20150406-21150506-22150406-23150
53、1206-2415011文件文件:SPC-3 练习练习.MTWPractice& 什么是假设检验什么是假设检验(Hypothesis Test)?对总体对总体(Population)设定某种假设设定某种假设,根据样本根据样本(Sample)的情报来判断假设的真假与否的情报来判断假设的真假与否.假设假设 :特定某总体是特定某总体是 , , ,. ex) 制造制造TEAM男员工的平均男员工的平均 身高是身高是172 cm. 原假设原假设(Ho, Null Hypothesis) : 作为检验对象的假设作为检验对象的假设 备择假设备择假设(H1 or Ha, Alternative Hypo
54、thesis) : Not Ho某总体某总体(N)样本样本根据样本的情报来根据样本的情报来 检验已设定的该总体的假设检验已设定的该总体的假设 接受原假设接受原假设(Ho) : 当初设定的假设正确的情况当初设定的假设正确的情况 接受备择假设接受备择假设(H1 or Ha) : Not Ho补充:假设检验补充:假设检验& 什么是假设检验什么是假设检验(Hypothesis Test) ?某总体某总体(N)样本样本 样本的平均值样本的平均值 : * 某总体的平均值某总体的平均值 : (.*.) 95% 置信区间置信区间 (.*.) 90% 置信区间置信区间 从样本中得到的平均值从样本中得到的
55、平均值(X bar)和实际某总体的平均值和实际某总体的平均值()是否会完全一致是否会完全一致 ? 或许由于或许由于Data数量的不足可能会导致不能完全一致数量的不足可能会导致不能完全一致.所以以样本的情报所以以样本的情报 (X bar, s)来推定总体时来推定总体时 通常都表现为通常都表现为“某总体的平均值可能会在这个区间内某总体的平均值可能会在这个区间内”, 并且把这个区间称谓置信区间并且把这个区间称谓置信区间(C.I. : Confidence Level). 某总体的实际平均值超出置信区间时称它为风险率(显著性水平)某总体的实际平均值超出置信区间时称它为风险率(显著性水平), 通常我们把显著性水平设定为通常我们把显著性水平设定为() = 5%.172 cm补充:假设检验补充:假设检验& 什么是假设检验什么是假设检验(Hypothesis Test) ? 两类错误两类错误 风险风险消费者危险消费者危险(被告者危险被告者危险) 风险风险生产者危险生产者危险(判者的危险判者的危险)总体总体(现实现实)无罪无罪(良品良品)有罪有罪(不良不良)无罪无罪(良品良品)有罪有罪(不良不良)标本标本(判决判决) 1 - : 可信度可信度(置信水平置信水平) 要检验的原假设要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 体育馆空调管道系统工程合同
- 湿地公园保洁员招聘合同
- 出发行租赁合同范本
- 犯罪悬疑剧剧组人员合同
- 智能决策技术文件管理
- 2024年山东专用:解除婚姻关系协议3篇
- 建筑施工劳务合同:学校建设协议
- 绿猴病的临床护理
- 电力工程采购施工合同
- 城市建筑改造合同协议书内容
- 五年级上册语文说课稿《25.古人谈读书》人教(部编版)
- (初级)管工职业鉴定考试题库(含答案)
- 《环境规划与管理》测试题题集
- GA/T 2133.2-2024便携式微型计算机移动警务终端第2部分:安全监控组件技术规范
- 《陆上风力发电建设工程质量监督检查大纲》
- 委托家里人办房产证的委托书范本
- 中央2024年中国民航大学博士专职辅导员及心理健康教育人员招聘笔试历年典型考题及考点剖析附带答案详解
- 2024年冶金工业技能鉴定考试-氧化铝制取工笔试考试历年高频考点试题摘选含答案
- 初中生学生心理健康教育(3篇模板)
- 2024年社区工作者考试必背1000题题库带答案(基础题)
- 国内外供应链管理研究现状分析
评论
0/150
提交评论