均值检验(T检验)规范_第1页
均值检验(T检验)规范_第2页
均值检验(T检验)规范_第3页
均值检验(T检验)规范_第4页
均值检验(T检验)规范_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

均值检验(T检验)规范目标:了解T检验及其应用主要内容:•单个正态总体均值的Z或T检验•两个正态总体均值的T检验•成对数据T检验T检验用于在已知变量为正态总体但未知总标准差的情况下,对总体均值进行区间估计或假设检验,是在现实问题中非常常用的一种检验T检验T检验用于均值检验。用来检验标准试样测定结果的平均值与标准值之间是否有显著差异。也就是将样本的平均值与目标值或与其它样本的平均值相比较。当影响因子为计数型,响应变量为计量型时,可采用T检验。T检验有单侧检验和双侧检验之分。通过查看P值确定样本之间均值是否存在显著差异。T检验1、连续数据呈现正态分布(如果数据为非正态分布,则需要进行数据转换,将非正态数据转换成正态数据)2、数据来自稳定的数据源3、数据之间彼此独立4、数据具有代表性

T检验的前提条件数据类型比较内容工具连续数据一组数据的平均值与目标值相比较1-样本t/Z两组数据的平均值相比较2-样本t两组成对数据的平均值相比较(或当数据匹配时,比较两组平均值)成对tT检验的类型单样本Z检验单样本Z检验使用条件检验整体均值是否与目标数值相等样本量大,n>=30总体标准差已知或者用样本标准差S代替单样本Z检验从历史记录上得知,快递公司投送发往美国的邮件,平均投递时间为80小时,标准差为14小时。现随机抽取了40份邮件的投递时间记录,试分析发往美国的邮件的平均投递时间是否低于80小时?取显著水平α=0.05.。数据BS-投递时间单样本Z检验例:单样本Z检验1、建立假设:H0:μ=80H1:μ≠802、样本容量的确定统计>功效和样本数量>1Z单样本功效和样本数量单样本Z检验检验平均值=零(与≠零)计算功效的平均值=零+差值Alpha=0.05假定标准差=14

样本差值数量目标功效实际功效

7.4470.950.9519187.4380.900.9029207.4290.800.812321

单样本Z检验单样本Z检验3、正态性检验统计>正态性检验单样本Z检验4、进行检验单样本Z检验单样本Z:投递时间mu=80与<80的检验假定标准差=14平均值变量N平均值标准差标准误95%上限ZP投递时间4072.6011.442.2176.24-3.340.000P=0.035<0.05统计结论:拒绝原假设,接受备择假设业务结论:发往美国的国际邮件的平均投递时间确实低于80小时。单样本T检验单个T检验的含义设正态总体X:X~N(μ,σ²),在实际问题中,μ,σ²通常是很难知道的。现从总体X中抽取样本x1,x2,…,xn,从样本均值和样本标准差S出发来检验总体分布的均值μ是否等于(或大于、小于)定值μ0,这就是单个正态总体均值的T检验。单样本T检验单个正态总体均值的T检验步骤步骤1:建立原假设H0和备择假设Ha通常有三类假设H0:μ=μ0,Ha:μ≠μ0----双边假设检验H0:μ≤μ0,Ha:μ>μ0----单边假设检验H0:μ≥μ0,Ha:μ<μ0----单边假设检验单样本T检验骤步骤2:选择检验统计量

这里μ0是定值,n为样本容量,X与S是两个随机变量,表示样本x1,x2,…xn的均值与标准差,t(n-1)是自由度为n-1的t分布。单样本T检验步骤3:给出检验中的显著性水平α常取α=0.05,根据问题的具体情况,也可取α=0.01或0.10步骤4:给出临界值、确定拒绝域根据选择的检验统计量的分布,以及给定的显著性水平α,可确定临界值和拒绝域,但在不同的三类假设下,拒绝域是不同的单样本T检验步骤5:根据样本观察值,计算检验统计量的值,并作判断判断方法:(1)若检验统计量的值落在拒绝域中,则拒绝原假设。(2)由检验统计量计算P值,当P<α时拒绝原假设。(3)若原假设的参数值μ0未落入总体均值的置信区间内,则拒绝原假设单样本T检验单样本T检验抽查精细面粉的装包重量,其每包重量在正常生产下均值为20kg,在生产的产品中抽查30包,其检测数据见BS-面粉重量。发现平均重量稍有变化,试问生产是否正常?取α=0.05例:1、建立假设H0:μ=20H1:μ≠202、样本容量的确定统计>功效和样本数量>1t单样本单样本T检验单样本t检验检验平均值=零(与>零)计算功效的平均值=零+差值Alpha=0.05假定标准差=0.137样本差值数量目标功效实际功效0.087290.950.9545390.087230.900.9040480.087170.800.805185单样本T检验3、正态性检验单样本T检验进行T检验单样本T检验单样本T:面粉重量平均值变量N平均值标准差标准误95%置信区间面粉重量3020.08700.13710.0250(20.0358,20.1382)单样本T:面粉重量mu=20与≠20的检验平均值变量N平均值标准差标准误95%置信区间TP面粉重量3020.08700.13710.0250(20.0358,20.1382)3.470.002统计结论:P=0.002<0.05则拒绝H0业务结论:面粉平均重量已有显著变化,生产不正常单样本T检验MINITAB还给出非常直观的图形帮助判断,当H0所对应的均值未落入均值的置信区间时,拒绝原假设。本例H0未落入置信区间,即面粉重量与20kg有显著差别,生产不正常。某车间所加工的轴棒要求平均长度为500mm,检验员对生产轴棒随机抽取了25根,测量结果得样本均值501mm样本标准差为1mm。问:在显著性水平α=0.05下,这批轴棒长度均值能认为是500mm吗?单样本T检验建立假设H0:μ=500H1:μ≠500由于是小样本,并且σ未知,选用单样本T检验单样本T检验单样本Tmu=500与≠500的检验平均值

N平均值标准差标准误95%置信区间TP25501.0001.0000.200(500.587,501.413)5.000.000P=0.000<0.05,结论是:拒绝原假设,即在显著性水平α=0.05下,不能认为这批轴棒长度均值500mm。单样本T检验某轧钢厂为提高某管坯的屈服强度,改变轧制工艺的某些参数作试验,从取得的35个数据分析知:均值为=39.32,标准差为S=0.75,屈服强度服从正态分布,且目标值为40,检验分析其改变工艺是否有效,练习2:某炼铁厂5号高炉的铁水含碳量X~N(μ,σ²),在正常情况下,铁水含碳量μ0=4.55%,今抽查5炉铁水的含碳量(%)试判断铁水含碳量μ是否正常?(练习1双样本T检验例子:某炼铁厂烧结为了提高烧结矿质量(烧结矿强度),新进一种富矿粉,在烧结生产进行配加试验,采用了两种配料方案A和B,在生产试验时,除配料方案不同外,其他条件尽可能做到相同,各生产6天得到烧结矿强度数据。且认为两组数据来自相互独立的正态总体。问A和B方案烧结矿质量好?双样本T检验两个T检验的含义设两个独立的正态总体X、Y:X~N(μ1,σ²1),Y~N(μ2,σ²2)同样μ1,μ2,σ²1,σ²2通常是很难知道的。现从总体X中抽取样本x1,x2,…,xn,样本均值为,样本标准差为Sx,从总体Y中抽取样本y1,y2,…ym,样本均值为,样本标准差为Sy,从样本均值,和样本标准差Sx,Sy出来检验总体y的均值μ1是否等于(或大于、小于)总体Y的均值μ2,这就是两个正态总体均值的T检验双样本T检验使用双样本t检验的条件是1、两组样本内相互独立,两组间也相互独立2、两组数据皆来自正态分布总体3、两个总体方差相等双样本T检验步骤1:建立原假设H0和备择假设H1通常也有三类假设H0:μ1=μ2,H1:μ1≠μ2----双边假设检验H0:μ1≤μ2,H1:μ1>μ2-单边假设检验

H0:μ1≥μ2,H1:μ1<μ2----单边假设检验双样本T检验步骤步骤步骤2:检验两个正态总体的方差是否相等,即方差齐性检验可用?步骤步骤3:选择检验统计量若且未知时,其中若且未知时,与S的表述(略)双样本T检验步骤步骤4:给出检验中的显著性水平α步骤5:给出临界值,确定拒绝域步骤6:根据样本观察值作统计判断上述三个步骤与单个正态总体均值的T检验对应的步骤基本相同双样本T检验步骤双样本T检验一家冶金公司需要减少其排放到废水中的生物氧需求量BOD含量。用于废水处理的活性泥供应商建议,用纯氧取代吹入活化泥以改善BOD(此数值越小越好),从两种处理的废水中各取了20个样品,数据见BS-生物氧需求量。问责显著水平α=0.05下,该公司是否应改用纯氧来减少BOD含量?

1、建立假设H0:μ1=μ2H1:μ1>μ2μ1、μ2分别代表空气和纯氧条件下的BOD含量双样本T检验2、计算样本量统计>功效和样本数量>2t单样本双样本t检验检验平均值1=平均值2(与≠)计算平均值1的功效=平均值2+差值Alpha=0.05假定标准差=12.94

样本差值数量目标功效实际功效17.1160.950.95110217.1140.900.91992317.1110.800.838288样本数量是指每个组的。双样本T检验3、正态性检验统计>基本统计量>正态性检验或“图形>概率图”双样本T检验4、方差齐性检验HO:H1:双样本T检验等方差检验:空气,氧气

N下限标准差上限空气2011.217815.311823.7225氧气208.478811.573117.9302F检验(正态分布)检验统计量=1.75,p值=0.231Levene

检验(任何连续分布)检验统计量=0.99,p值=0.327

结论:两正态总体的方差在显著性水平α=0.05下无显著差异5、检验双样本T检验双样本T检验双样本T检验和置信区间:空气,氧气空气与氧气的双样本T平均值N平均值标准差标准误空气20188.815.33.4氧气20171.611.62.6差值=mu(空气)-mu(氧气)差值估计:17.25差值的95%置信下限:10.01差值=0(与>)的T检验:T值=4.02P值=0.000自由度=38两者都使用合并标准差=13.5718统计结论:P=0.000<0.05拒绝原假设,接受备择假设业务结论:使用纯氧能显著减少废水中的BOD含量。假定A,B两名工人都生产相同规格的轴棒,关键尺寸是轴棒的直径。由于A使用的是老式车床,B使用的是新式车床,二者精度可能有差异。现他们各测定了21个轴棒的直径(BS-轴棒直径)。试分析A、B两名工人生产的轴棒3直径的均值相等吗?假设建立H0:μ1=μ2H1:μ1≠μ2μ1、μ2分别代表工人A、B生产的轴棒直径。双样本T检验双样本T检验2、计算样本量统计>功效和样本数量>2t单样本检验平均值1=平均值2(与≠)计算平均值1的功效=平均值2+差值Alpha=0.05假定标准差=2.245

样本差值数量目标功效实际功效2.702120.800.8043872.702160.900.9087982.702190.950.950427双样本T检验3、正态性检验统计>基本统计量>正态性检验或“图形>概率图”双样本T检验4、方差齐性检验HO:H1:等方差检验:A,B95%标准差Bonferroni

置信区间

N下限标准差上限A211.656142.245293.43277B210.736980.999161.52759F检验(正态分布)检验统计量=5.05,p值=0.001Levene

检验(任何连续分布)检验统计量=17.32,p值=0.000P=0.001<0.05接受备择假设,方差并不相等双样本T检验5、检验双样本T检验双样本T检验和置信区间:A,BA与B的双样本T

平均值

N平均值标准差标准误A2115.202.250.49B2112.4930.9990.22差值=mu(A)-mu(B)差值估计:2.711差值的95%置信区间:(1.611,3.812)差值=0(与≠)的T检验:T值=5.06P值=0.000自由度=27二者轴棒直径间有显著性差异。值得注意到是:原来各自有21个观测值,双样本t检验自由度应该40个,但现在由于方差不相等,对于方差特大者缩小其权重,加权平均得到了方差的估计量,最终只剩下27个自由度。练习在改进工艺前后,各测量若干烧结矿强度(数据见两个总体T检验),问可以认为工艺改进后烧结矿平均强度有提高吗?双样本T检验成对T检验实例:某团队对测量矿石中二氧化锰的两种分析方法进行对比,随机从过程的产品中抽样,将同一个样品用两种实验分析分别测量二氧化锰含量各一次,数据记录见文件(成对数据T检验1),问两种分析方法的结果有无显著差异?(取显著性水平α=0.05)成对T检验成对T检验配对检验站实际工作中时常遇到。比如,考察某种减肥药品的药效,如果我们用完全不同的两批人,一批未吃药,一批吃药,将此问题当作两总体的均值检验问题,则很容易得到“疗效不显著”结论,这是因为不同人士间的体重本身有很大差异,而这种误差并不是由于药物疗效引起的,减肥药的疗效就被淹没在误差之中了。解决此问题最好的办法是收集成对数据的方式:对同一批人,先记录原始体重,再记录吃药后的体重,这样将每个人服用药物前后体重进行比较,这就可以较准确地度量出药效在每个人身上产生的作用。为比较两种产品,或两种仪器,两种方法等的差异,在相同条件下作对比实验,得到成对的观察值,根据观察值作统计推断时,可运用成对数据T检验成对数据T检验原理:设有两个不独立的正态总体X,Y,X~N(µ1,σ1²),Y~N(µ1,σ2²),令d=X-Y~N(µ,σ²),作原假设H0:△µ=0,备择假设H1:△µ≠0,>0,<0成对T检验很显然,这些都是单个正态总体均值是否为0的检验问题成对t-检验比较数据成对时两个总体的平均值差异成对T检验为了降低变异性(部件间的差异)并作出更精确的估测(更小的置信区间)。为何使用?成对T检验1、每个取样单位均采用两种计量方式。例如:交易、打电话、员工、处理等。2、第二组的计量方式不独立于第一组的计量方式它们是匹配的或成对的对同一件试验单元或在相似条件下进行两次测量成对T检验※两个相关的样本必需是随机抽取的※每个抽样整体都应该大致呈正态分布成对T检验1、建立假设Ho:μ1-μ2=0H1:μ1-μ2=0H1:μ1-μ2<0H1:μ1-μ2>0或H0:△μ=0H1:△μ≠0H1:△μ>0H1:△μ<02、正态检验3、统计>基本统计量>成对t检验分别输入数据变量名按options,输入置信水平95.0,检验均值0.0备择假设:notequalOK成对T检验成对T检验想要比较某种减肥药物的疗效,选定了21人进行实验,收集了每个人服用减肥药前后的体重数据(BS-配对t检验)。在α=0.05水平上,服用药物后体重是否有显著的降低?1、建立假设:H0:△μ=0H1:△μ≠02、正态性检验统计>基本统计量>正态性检验或“图形>概率图”成对T检验3、进行检验配对T检验和置信区间:x(服药前),y(服药后)x(服药前)-y(服药后)的配对T平均值N平均值标准差标准误x(服药前)2191.438.321.82y(服药后)2186.388.071.76差分215.055.211.14平均差的95%置信区间:(2.68,7.42)平均差=0(与≠0)的T检验:T值=4.44P值=0.000统计结论:P=0.000<0.05,拒绝原假设业务结论:服用减肥药后体重有明显的降低。成对T检验配对T检验和置信区间:x(服药前),y(服药后)x(服药前)-y(服药后)的配对T平均值N平均值标准差标准误x(服药前)2191.438.321.82y(服药后)2186.388.071.76差分215.055.211.14平均差的95%置信区间:(2.68,7.42)平均差=0(与≠0)的T检验:T值=4.44P值=0.000统计结论:P=0.000<

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论