假设检验与样本数量分析④——单比率检验、双比率检验_第1页
假设检验与样本数量分析④——单比率检验、双比率检验_第2页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、假设检验及功效和样本数量分析假设检验及功效和样本数量分析 功效和样本数量功效和样本数量 ( Analysis)单比率检验 双比率检验预备知识预备知识总体研究的一类对象的全体组成的集合。个体总体中的每一个考察的对象。样本从总体中抽出的一部分个体的集合。样本数量样本中包含的个体的数量。总体与样本总体与样本噢!这么多健身球,应该全是合格的吧从中抽出几个,测量一下。看看废品率。?我们通过样本来了解总体由样本信息作为总体信息估计值统计推断是由样本的信息来推测总体性能的一种方法。在通过样本获得一批数据后,要对总体的某一参数进行估计和检验。建立检验假设建立检验假设(如双侧检验)单样本例如,我们想了解一种健身

2、球生产过程的不合格品率p p是否为p02%,通过对样本的测量获得一批数据,然后对健身球不合格品率p p进行推断,这是单样本检验的问题。H H :p p p0H H1 1: p p p0H H :p p 0.02H H1 1: p p 0.02不合格品率为2%不合格品率不不是2%单比率检验 双比率检验预备知识预备知识总体与样本总体与样本2种健身球生产过程的不合格品率应该一样吧,?我们通过2个样本来了解2个总体由样本信息推断2个总体相比是否有差异统计推断是由2个样本的信息来推测2个总体性能,推断特征相比是否有显著差异。建立检验假设建立检验假设(如双侧检验)双样本例如,直径为65cm的健身球,新研制

3、出健身球2#生产成本较低,如果生产过程的不合格品率与原来的1#产品一致,则用2#产品替代1#产品。 通过对2个样本的测量获得两部分数据,然后对两种健身球(1#产品和2#产品)的不合格品率进行是否存在差异进行推断(或推断1#产品的不合格品率是否大或小于2#产品的不合格品率),这是双样本比率检验的问题。健身球1#健身球2#样本间的差异是由抽样误差引起的样本与样本所代表的总体间存在显著差异不合格品率无差异 不合格品率有差异 H H :p p 1p p 2H H1 1: p p 1p p 2单比率检验 双比率检验预备知识预备知识P二项分布的概念 二项分布(binominal distribution)

4、 是一种重要的离散型分布。 数据属于只有两个可能结果的独立实验的结果,一个表示希望的“事件”,另一个表示“非事件”(每一观察只具有相互独立的一种结果),如,通过与失败、合格与报废、有效或无效、是或否、0 或 1等。 通常,1代表抽到不合格品,0代表抽到合格品。 总体不合格品比率记作 p,样本不合格品比率记作 其中n总体中随机抽取样本个数X出现不合格品数(X =0,1,2,3,n)nXP单比率检验 双比率检验二项二项分布 p=0.1,n=5 概率分布图 n=30n=50 n=100p=0.1p=0.1, n=30、50、100 二项分布的概率分布图形预备知识预备知识质量部门对一批 产品进行了检验

5、,长期以来生产过程的不合格品率10%,检验员检测了5件产品(有放回抽样),求检验到的不合格品数。n = 总体中随机抽取样本个数X = 出现不合格品数xnpxpxCxXPnn)1 ()(二项分布的概率不合格品数是0的概率050055)1.01(1.0)0(CXP=0.59049 不合格品数是1的概率151155)1.01(1.0)1(CXP=0.32805 !) 1() 1(xxnnnCxn 同理计算不合格品数为2、3、4、5的概率X=012345p=0.59049 0.32805 0.07290.07290.00810.00810.000450.000450.000010.0000110nC0

6、.590490.328050.07290.00810.000450.00001单比率检验 双比率检验预备知识预备知识比率比率检验检验比率比率检验检验单比率检验单比率检验1 Proportion-test一个总体双双比率检验比率检验2 Proportion-test精确检验 超几何分布两个总体 Z检验检验 正态近似检验精确检验二项分布Z检验检验正态近似检验 总体服从二项分布两个总体服从二项分布Z检验的适用条件:样本含量n足够大, 与 均大于5,此时样本率的分布近似正态分布,可利用正态分布的原理作Z检验。当两样本含量n1及n2足够大, 及 均大于5可根据正态分布原理,进行Z检验。 Z检验的适用条件

7、:Pn)P1n()P-(1、Pn1111n)P-(1、Pn2222n单比率检验 双比率检验单比率检验单比率检验统计量统计量式中:式中:单比率检验单比率检验1 Proportion-test双侧检验左侧检验右侧检验检验假设H H :p p0H H1 1:p p0H H :p p0H H1 1:pp0拒绝域| Z Z | Z1- a/2 Z Z Z a Z Z Z1- aP P值 决策P P值 拒绝H HnppppZ)1(000样本含量n足够大n :样本数 :样本的比率p0:比率参考值Z检验检验正态近似检验 样本比率 = xn其中x是观察到的”成功”数单比率用于根据样本数据对总体比率进行推断5Pn

8、5)P1n(PP单比率检验 双比率检验 确定临界值H H1 1:p p0H H1 1:pp0双侧检验左侧检验右侧检验单比率检验单比率检验显著性水平 与拒绝域 2=0.0252=0.025临界值临界值1-=95%拒绝零假设拒绝零假设不拒绝H0范围 Z1- a/2 Z a/2 = 0.05临界值1-=95%拒绝零假设不拒绝零假设 = 0.05 Z检验检验 正态近似检验 Z a = 0.05临界值1-=95% Z1- a 不拒绝零假设拒绝零假设Z 0.975 =1.96Z 0.025= -1.96Z 0.05= -1.645Z 0.95= 1.645 = 0.05 = 0.05 单比率检验 双比率检

9、验假设检验的例子(假设检验的例子(16) 我们长园集团有个公司的一台注塑机加工某种电缆附件产品,长期以来生产过程的不合格品率p02%,估计当前生产过程的不合格品率仍为2%。 随机抽取500个产品,测量得到不合格品数为9。建立检验假设给定显著水平 = 0.05计算统计量双侧检验双侧检验H H :p 0.02H H1 1:p 0.02n=500n=500 x x =9=9单比率检验单比率检验本例样本比率提供了总体比率的估计值样本比率 =xn =95000.018比率参考值p00.02(2%)1- p =0.982,500)02.01(02.002.0018.0= = -0.3194-0.3194n

10、ppppZ)1(000P单比率检验 双比率检验接上页如果| Z Z | =0.319 Z1- a/2 用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验单比率检验反查正态分布表(右尾概率)Z临界值为: Z 0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.90.0290.0280.0270.

11、0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018 Z 0.025=1.96用算得的统计量与相应的临界值作比较 | Z Z | = 0.319 Z 0.025=1.96作出不拒绝零假设的统计结论即:当前生产过程的不合格品率仍为2%。 u 计算检验计算检验 P- 值值 Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.

12、3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018P(Z-0.31 或Z 0.31)= 0.378 2 = 0.756 P = P(Z -0.31 及 Z 0.31) = 0.378 2 = 0.756 P P= 0.748 = 0.05 按=0.05的水平无法拒绝零假设H0 H0 查正态分布表查不到| Z Z | =0.3194 P =

13、P(Z -0.32 及 Z 0.32) = 0.374 2 = 0.748 P(Z -0.32 及 Z 0.32) = 0.374 2 = 0.748 | Z Z | 临界值、未落入拒绝域及P0.05是对应的见下页图示单比率检验 双比率检验接上页单比率检验单比率检验Z检验检验 正态近似检验 Z =1.96Z = -1.962=0.0252=0.025不拒绝零假设拒绝零假设拒绝零假设临界值临界值双侧检验示意图(显著性水平与拒绝域 )1 = 0.95 Z= 0.319Z= - 0.3192P= 0.3747 Z = - 0.319 Z = 0.3192P= 0.3747 P = P = 0.749

14、4 | Z Z | 临界值则未落入拒绝域此处Z的绝对值=0.319小于临界值1.96样本观测值落在“不拒绝零假设”范围内 | Z Z | 临界值则P0.05(直观易见)此处Z的绝对值=0.319小于临界值1.96假设检验的P P值 = 0.7494 直观易见0.050.7494| Z Z | = 0.319P = 0.7494 单比率检验 双比率检验功效和样本数量分析功效和样本数量分析 评价检验功效假设检验的例子16,Z的绝对值=0.319小于临界值Z 0.025=1.96( P P值值= P = 0.7494 = 0.05 )出了不拒绝零假设的统计结论。 当H0 为假时正确否定它的概率 (p

15、 = 1 )双侧检验双侧检验Power = 1 ( 0.02-0.018+1.96 0.0063 ) /0.0059 +( 0.02-0.018-1.96 0.0063 ) /0.0059 = 1 ( 2.4319 )+( -1.7539) = 0.0075 +0.03972 = 0.0472功效功效 Power Power = = 0.04720.0472双侧检验双侧检验单比率检验单比率检验500)02.01 (02.0)1 (00npppPower = 1 ( ) + ( )PPSZpp2/0 PPSZpp2/0 500)018.01 (018.0)1 (nppSp参考比率标准误样本比率标

16、准误P将 P0 =0.02 、 =0.018 、Z /2 = 1.961.96(右尾概率分位数、当 = 0.05 ) = 0.0063= 0.0059 及 p= 0.0063、Sp= 0.0059 代入上式 。 : 标准正态分布的累积分布函数z/2=upper /2 point of the standard normal distribution单比率检验 双比率检验 样本数量样本数量假设检验的例子16中,如果总体比率实际为 0.02 但在样本比率=0.018时,则检测到差异的可能性为 4 .72%如果我们仍然规定可以检测到的最小差值 =0.002,并希望功效 Power =0.9需要抽取产

17、品样本多少个?将 Z /2 = Z 0.05/2 =1.96 、 Z = Z 0.1 =1.28及 P0 =0.02 、 =0.018 代入上式双侧检验双侧检验容许差值越小,需要样本量越大。(为使差值符合选择,容许差值越小,需要样本量越大。(为使差值符合选择, 有时需主观规定)有时需主观规定)功效和样本数量分析功效和样本数量分析双侧检验双侧检验单比率检验单比率检验接上页210122/)sin2sin2()(PPZZnsin-1:反正弦P三角函数采用弧度计算公式中2112)018.0sin202.0sin2()28.196.1 (n2)13457.02141897.02(4976.10= 488

18、82.71733需要抽取产品样本48883个单比率检验 双比率检验假设检验的例子(假设检验的例子(17) 我们有一个公司生产继电保护装置,所在的主板生产中一次通过率只在97%。为了提高主板的一次通过率,六西格玛项目组对流程进行了改进。 为确定改进后主板的一次通过率是否97%。随机抽取800个产品,测量得到不合格品数为16。建立检验假设单侧检验单侧检验(左)H H :p 0.03 H H1 1:p 0.03(希望被证明)单比率检验单比率检验n=800n=800 x x =16=16样本比率 =xn =168000.02比率参考值p00.03(3%)P本例用不合格品率计算5Pn5)P1n(可用正态

19、近似检验 给定显著水平 = 0.05计算统计量800)03.01(03.003.002.0= = -1.66-1.66nppppZ)1(000用通过率计算结果是一样的,不合格率是小数值,一般会将小数值定义为p。单比率检验 双比率检验接上页如果| Z Z | =1.66 Z1- a 用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验单比率检验反查正态分布表(右尾概率)Z临界值为:Z = Z 0.05 =1.64Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.363

20、0.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.50.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056 1.60.055 0.054 0.053 0.052 0.051 0.049 0.048 0.047 0.046 0.046 Z 0.05=1.64用算得的统计量与相应的临界值作比较 | Z Z | = 1.66 Z 0.05=1.64作出拒绝零假设的统计结论:不合格品率 0.03即:改进后改进后主板的一次通过率主板的一次通过

21、率97%97% u 计算检验计算检验 P- 值值 Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.50.067 0.066 0.064 0.063 0.062 0.061 0.059 0.058 0.057 0.056 1.60.055 0.054 0.053 0.052 0.051 0.049 0.048 0.047 0.046 0.

22、046 P(Z -1.66 ) = 0.048 P = P(Z -1.66 ) = 0.048P P= 0. 048 = 0.05 按=0.05的水平拒绝零假设H0 H0 查正态分布表查到| Z Z | =1.66| Z Z | 临界值、落入拒绝域及P0.05是对应的见下页图示单比率检验 双比率检验接上页单比率检验单比率检验Z检验检验 正态近似检验 =0.05拒绝零假设不不拒绝零假设左侧检验示意图(显著性水平与拒绝域 )1 = 0.95 P = 0.048 Z = - 0.319 Z = 0.3192P= 0.3747左侧检验 Z Z = -1.66 Z-1.64则落入拒绝域左侧检验 Z Z

23、= -1.66 Z-1.64则P= 0.0480.05(直观易见)直观易见0.050.048Z= -1.66P(Z -1.66 ) = 0.048临界值 Z = -1.64单比率检验 双比率检验功效和样本数量分析功效和样本数量分析 评价检验功效假设检验的例子17中,检验功效有多大? 当H0 为假时正确否定它的概率 (p = 1 )左侧检验左侧检验Power = ( 0.03-0.02-1.64 0.00603 ) /0.00495 = 0.022384 = =0.5089功效功效 Power Power = = 0.50890.5089(50. 89%)左侧检验左侧检验单比率检验单比率检验80

24、0)03.01 (03.0)1 (00npppPower = ( )PPSZpp 0800)02.01 (02.0)1 (nppSp参考比率标准误样本比率标准误P将 P0 =0.03 、 =0.02 、Z = 1.641.64(右尾概率分位数、当 = 0.05 ) = = 0.00603= = 0.00495 及 p= 0.00603、Sp= 0.00495 代入上式 。z =one-sided critical value (upper point of the standard normal distribution)单比率检验 双比率检验 样本数量样本数量上页的例子中,检验功效 Powe

25、r = 0.5089(50. 89%),如果我们仍然规定 =0.01差异可以检测到,并希望检测功效 Power =0.9需要抽取产品样本多少个?(Power =1- =0.9 即 = 0.1)将 Z = 1.641.64 、 Z Z = = Z Z 0.1 =1.28=1.28 及 P0 =0.03 、 =0.02 代入上式功效和样本数量分析功效和样本数量分析单比率检验单比率检验接上页21012)sin2sin2()(PPZZnsin-1:反正弦P三角函数采用弧度计算公式中2112)02.0sin203.0sin2()28.164.1 (n20.141897)20.174083(210.497

26、6= 2057.656537需要抽取产品样本2058个:犯第II类错误 (当H 为伪时我们接受H )的概率 左侧检验左侧检验或右侧检验单比率检验 双比率检验单比率检验单比率检验式中:式中:单比率检验单比率检验1 Proportion-test双侧检验左侧检验右侧检验检验假设H H :p p0H H1 1:p p0H H :p p0H H1 1:pp0P P值 拒绝H Hp值 = P X n - y| p = poy = min x, n - x.p值 = P X x | p = po单比率用于根据样本数据对总体比率进行推断5Pn5)P1n(精确检验二项分布不可以做正态近似检验 n = 总体中随

27、机抽取样本个数x = 出现不合格品数xnpxpxCxXPnn)1 ()(10nC二项分布概率大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检精确检验验进行手动计算的理解.精确检验补充阅读!) 1() 1()!( !xxnnnxnxnCxn 单比率检验 双比率检验假设检验的例子(假设检验的例子(18) 我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。 为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下。建立检验假设单侧检验单侧检验(左)H H

28、 :p 0.92H H1 1:p 0.92单比率检验单比率检验样本比率 =xn =48500.96比率参考值p00.92(92%)P给定显著水平 = 0.05计算概率值 合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格5)96.01(50)P1n(不可以做正态近似检验 事件 = 合格先计算大于48的单侧概率495049495050)92.01(92.0)49(CXP505050505050)92.01(92.0)50(CXPxnpxpxCx

29、XPnn)1 ()(根据二项分布= 0.067250.06725= 0.015470.01547精确检验单比率检验 双比率检验接上页由于计算小于等于48的单侧累积概率累积概率计算量较大结论:P0.917280.91728 = 0.05显著性水平,不拒绝H H 。即:不能拒绝改进后的培训通过率 0.92单侧检验单侧检验单比率检验单比率检验0.067250.067250.015470.01547计算p值 p值 = P X x | p = pox0XnP(x)x)(XPx=0、1、2、48我们利用总概率等于1 计算小于等于48的单侧累积概率)50(XP)49(XP1)48(XP505050=1- 0

30、.06725 - 0.01547=0.91728=0.91728)50(XP)49(XP1)48(XP505050见前页计算大于48的(49、50)单侧概率 单比率检验 双比率检验假设检验的例子(假设检验的例子(18) 我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。 为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下。建立检验假设单侧检验单侧检验(右(右)单比率检验单比率检验样本比率 =xn =2500.04比率参考值p00.08(8 %)P给定显

31、著水平 = 0.05计算概率值 合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格504.050Pn不可以做正态近似检验 事件 = 不及格050005050)08.01 (08.0)0(CXP先计算小于2的单侧概率xnpxpxCxXPnn)1 ()(根据二项分布= 0.067250.06725= 0.015470.01547例子(例子(18)用不及格率计算一般会将小数量值定义为pH H :p 0.08H H1 1:p0.08150115050

32、)08.01(08.0)1(CXP精确检验单比率检验 双比率检验接上页结论:P0.917280.91728 = 0.05显著性水平下不拒绝H H即:不能拒绝改进后的培训不及格率 0.08单侧检验单侧检验(右(右)单比率检验单比率检验0.067250.067250.015470.01547计算p值 与前两页(不能拒绝改进后的培训通过率 0.92)意义相同p值 =P X x | p = po由于计算大于等于2的单侧累积概率累积概率计算量较大nxXnP(x)x)(XPx=2、3、50利用总概率等于1 ) 1(XP)0(XP1)2(XP505050=1- 0.01547 -0.06725 =0.917

33、28=0.91728) 1(XP) 0(XP1) 2(XP505050见前页计算小于2的(0、1)单侧概率 单比率检验 双比率检验功效和样本数量分析功效和样本数量分析单比率检验单比率检验精确检验补充阅读精确检验对于所有样本数量都是准确精确检验对于所有样本数量都是准确有效有效的的单比率检验 双比率检验双双比率检验比率检验双双比率检验比率检验2 Proportion-testZ检验检验 正态近似检验两个总体服从二项分布当两样本含量n1及n2足够大 Z检验的适用条件)P-(1、Pn1111n)P-(1、Pn2222n可进行Z检验大于5大于5统计量统计量式中:式中:双侧检验左侧检验右侧检验检验假设H

34、H :p 1-p2=dH H1 1:p 1-p2 dH H :p 1-p2 dH H1 1:p 1-p2 d拒绝域| Z Z | Z1- a/2 Z Z Z a Z Z Z1- aP P值 决策P P值 拒绝H H22211121n)p (1p n)p (1p d)p p (Zn1 :样本1个数n2 :样本2个数样本公共比率 其中X1和 X2 是样本1和样本2中的”成功”数1P21210nnxxPd : 两总体比率差值:样本1的比率:样本2的比率2P当检验两总体比率差值d=0时210021n1n1)p (1p p p Z式中:式中:双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值

35、进行推断。单比率检验 双比率检验双双比率检验比率检验1P2000160036032021210nnxxP2000116001)189.0(1189.018.02.0n1n1)p (1p p p Z210021检验两总体比率差值 d =p1 p2 = 0假设检验的例子(假设检验的例子(19)双侧检验双侧检验 有两台波峰焊设备,1号设备生产的板件中随机抽取1600个产品,得到优等品的件数为320;2号设备生产的板件中随机抽取2000个产品,得到优等品的件数为360。 为确定两台波峰焊设备产出优等品率是否一致,采用双比率检验。用显著性水平=0.05 进行检验可用正态近似检验 )P-(1、Pn1111

36、n)P-(1、Pn2222n大于5大于5=x1n1 =32016000.2=x2n2 =36020000.182P两总体”成功”比率合并估计值:样本1的比率样本2的比率= =0.189H H :p 1-p2 =0H H1 1:p 1-p2 0给定显著水平 = 0.05计算统计量建立检验假设 (两个总体比率相等) (两个总体比率存在差异)=1.523 单比率检验 双比率检验接上页查临界值反查正态分布表(右尾概率)Z临界值为: Z 0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.36

37、70.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018 Z 0.025=1.96用算得的统计量与相应的临界值作比较 | Z Z |=1.523 Z 0.025=1.96作出不拒绝零假设的统计结论两台波峰焊设产出优等品率是一致的u 计算检验计算检验 P- 值值 Z-Value0.000

38、.010.020.030.040.050.060.070.080.090.30.3820.378 0.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.3121.40.081 0.081 0.081 0.081 0.081 0.081 0.081 0.081 0.081 0.081 1.50.067 0.067 0.067 0.067 0.067 0.067 0.067 0.067 0.067 0.067 P = P(Z1.52 ) = 0.067 P = P(Z -1

39、.52 及 Z1.52 ) = 0.067 2 = 0.134 P P值= 0.134 = 0.05 按=0.05 的水平无法拒绝零假设H0 H0 查正态分布表 | Z Z | =1.52双双比率检验比率检验双侧检验双侧检验 /2=0 .025双侧检验双侧检验临界值临界值= 1.96显著性水平 =0 .05、 /2=0 .025(右尾概率)两台波峰焊设产出优等品率是一致的单比率检验 双比率检验双双比率检验比率检验1P假设检验的例子(假设检验的例子(20)右单侧检验右单侧检验 有两台相同设备,1号设备和2号设备生产相同产品且质量无差异,工程师在2号设备换上新设计的刀具,由于新刀具使用价格较贵的合

40、金材料;希望使用新刀具能使废品率有所下降,预计废品率至少会降低0.5%。 使用原来刀具的1号设备生产的零件中和换上新刀具的2号设备生产的零件中各分别随机抽取3000个;经测量得出:1号设备生产的零件中废品数是75个,2号设备生产的零件中废品数是21个。 检验使用新刀具使废品率至少会降低0.5%可用正态近似检验 )P-(1、Pn1111n)P-(1、Pn2222n大于5大于5= x1n1 =7530000.025= x2n2 =2130000.0072P样本1的比率样本2的比率给定显著水平 = 0.05计算统计量建立检验假设(想要证明)Z = 4.023 样本 n1 = n2= n =3000H

41、 H :p 1-p2 0.005H H1 1:p 1-p2 0.005 我们将预期效果(想要证明的假设)作为备择假设H1,因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,拒绝是有说服力的,减少结论错误。(两总体比率差值d不为时)22211121n)p (1p n)p (1p d)p p (Z3000)007.0(1007.03000)025.0(1025.0005.0)007.0025.0(单比率检验 双比率检验接上页查临界值反查正态分布表(右尾概率)Z临界值为: Z 0.05=1.645用算得的统计量与相应的临界值作比较 Z Z = 4.023 Z 0.025=1.645

42、使用原来刀具比换上新刀具生产的零件废品率多0.5%以上或者说:“使用新刀具使废品率至少会降低0.5%”双双比率检验比率检验 =0 .05单侧检验单侧检验临界值临界值= 1.645显著性水平 =0 .05Z Z0.000.010.020.030.040.050.060.070.080.091.6 0.055 0.054 0.053 0.052 0.051 0.051 0.049 0.049 0.048 0.047 0.046 1.600 1.90.029 0.028 0.027 0.027 0.026 0.026 0.025 0.024 0.024 0.0232.00.023 0.022 0.0

43、22 0.021 0.021 0.020 0.020 0.019 0.019 0.018 Z 0.051=1.64 Z 0.049=1.65结论:拒绝零假设右单侧检验右单侧检验(=0.05)=0.05临界值拒绝 H01-=95%H0Z (=0.05)= 1.6451.645 Z = 4.0234.023u 计算检验计算检验 P- 值值 Z0.000.010.020.030.040.050.060.070.080.094.00.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002 P = P(Z

44、=4.02 ) = 0.00003 查正态分布表 Z = 4.02P P值= 0.00003 = 0.05 按=0.05 的水平拒绝零假设H0 H0 单比率检验 双比率检验功效和样本数量分析功效和样本数量分析 评价检验功效计算在假设检验的例子20中的功效,先计算“使用原来刀具比换上新刀具生产的零件废品率多”的功效功效 当H0 为假时正确否定它的概率 (p = 1 )Power =n)p (1p n)p (1p n)p (1p 2Zp p 12211cc122p p p 21c3000)016.01(016.0)1(2nppcc=0.00229=0.00323 双双比率检验比率检验样本 n1 =

45、 n2 = n = 3000 H H1 1:p 1 p2右单侧检验右单侧检验右单侧检验右单侧检验z= one-sided critical value (upper point of the standard normal distribution)016.02007.0025.02p p p 21cn)p (1p n)p (1p 22113000)007. 0(1007. 03000)025. 0(1025. 0将 、Z = 1.645 及 右面计算值代入上式0.007p 、0.025p 21 Power =1- ( 0.007-0.025+1.645 0.00229 ) 0.00323 =

46、1- -4.40649 = =0.99999单比率检验 双比率检验功效和样本数量分析功效和样本数量分析 评价检验功效计算在假设检验的例子20中的功效,计算“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的功效功效 当H0 为假时正确否定它的概率 (p = 1 )Power =n)p (1p n)p (1p n)p (1p 2Zp )p (12211cc12d2p p p 21c3000)016.01(016.0)1(2nppcc=0.00229=0.00323 双双比率检验比率检验样本 n1 = n2 = n = 3000 右单侧检验右单侧检验右单侧检验右单侧检验z= one-sid

47、ed critical value (upper point of the standard normal distribution)016.02007.0025.02p p p 21cn)p (1p n)p (1p 22113000)007. 0(1007. 03000)025. 0(1025. 0将 、Z = 1.645 及 右面计算值代入上式0.007p 、0.025p 21 Power =1- ( 0.007+0.05+0.05-0.025+1.645 0.00229 ) 0.00323 =1- -2.85864 = =0.9977H H1 1:p 1-p2 0.05单比率检验 双比率

48、检验功效和样本数量分析功效和样本数量分析 评价检验功效双侧检验双侧检验Power =n)p (1p n)p (1p n)p (1p 2Zp p n)p (1p n)p (1p n)p (1p 2Zp p 12211cc2/122211cc2/122p p p 21cz/2= upper /2 point of the standard normal distribution双双比率检验比率检验左单侧检验左单侧检验n)p (1p n)p (1p n)p (1p 2Zp p 2211cc12Power =z= one-sided critical value (upper point of the

49、 standard normal distribution)2p p p 21cH H1 1:p 1 p2H H1 1:p 1 p2 样本 数量 n 是指每个组的单比率检验 双比率检验 样本数量样本数量将 Z = 1.6451.645 、 Z Z = = Z Z 0.1 =1.28=1.28 及 代入上式功效和样本数量分析功效和样本数量分析221112)Psin2Psin(2)Z2(Znsin-1:反正弦三角函数采用弧度计算公式中2112)0.012sin20.025sin(21.28)2(1.64n20.109765)20.15878(210.49762= 2184.713656需要抽取产品

50、样本数量 n =2185个单侧检验单侧检验左或右侧检验双双比率检验比率检验计算在假设检验的例子20中的“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的 使用原来刀具生产的零件废品率0.012p 、 0.025p 21 0.025p 1如果使用新刀具生产的零件废品率比原来低0.013时,差异可以检测到,我们规定基线 比率若希望检测功效 Power =0.9,需要抽取产品样本多少个?210.0p 2样本 数量 n 是指每个组的单比率检验 双比率检验 样本数量样本数量将 Z = 1.6451.645 、 Z Z = = Z Z 0.1 =1.28=1.28 及 代入上式功效和样本数量分析

51、功效和样本数量分析221112)Psin2Psin(2)Z2(Znsin-1:反正弦三角函数采用弧度计算公式中2112)0.02sin20.025sin(21.28)2(1.64n20.141897)20.15878(210.49762= 18414.18704需要抽取产品样本数量 n = 18415个单侧检验单侧检验左或右侧检验双双比率检验比率检验计算在假设检验的例子20中的“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的 使用原来刀具生产的零件废品率0.02p 、 0.025p 21 0.025p 1如果使用新刀具生产的零件废品率比原来低0.005(0.5%)时,差异可以检测到

52、,我们规定基线 比率若希望检测功效 Power =0.9,需要抽取产品样本多少个?0.02p 2样本 数量 n 是指每个组的单比率检验 双比率检验双双比率检验比率检验样本样本数量的估计公式(的估计公式(2)将 Z = 1.6451.645 、 Z Z = = Z Z 0.1 =1.28=1.28 及 代入上式)p (1p )p (1p p p ZZn22112210.012p 、 0.025p 21 )012.0(1012.0)025.0(1025.0012.0025.028.1645.1n2= 1834.194需要抽取产品样本数量 n = 1835个32页上计算的样本 数量n = 2185用

53、另一个公式计算一下32页计算n = 2185双双比率检验比率检验 样本数量样本数量单比率检验 双比率检验式中:式中:双双比率检验比率检验1 Proportion-test双侧检验左侧检验右侧检验检验假设H H :p 1=p2H H1 1:p 1p2H H :p 1=p2H H1 1:p 1p2 P P值 拒绝H Hp值 = 分3种情形p值 = F(x1) p值 = 1- F(x1 1)5Pn5)P1n(精确检验Fisher 精确检验不可以做正态近似检验 大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检验精确检验进行手动计算的理解.精确检验补充阅读双双比率检验比率检验双比率检验用于根据

54、两个随机样本中的数据对两个总体比率之间的差值进行推断。Fisher 精确检验基于超几何分布nNxnMNxMxXPCCC)(N=批量事件数M=批量中成功事件数n= 观测数(不放回抽样)x = 观测出现成功事件数超几何分布概率单比率检验 双比率检验补充阅读超几何分布超几何分布超几何分布(Hypergeometric distribution) 是一种重要的离散概率分布。例如:有N件产品,其中M件为次品,抽检n件时所得次品数X=x的概率。 它描述的是由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(这里是指不放回抽不放回抽样样,如果是有放回抽样,概率分布属于二项分布)。 )!( !xnxnC

55、xnnNxnMNxMxXPCCC)()!( !)!()!()!()!( !nNnNxnMNxnMNxMxM!)!()!()!( !)!( !)!( !NxnMNxnxMxnNnMNM单比率检验 双比率检验一批 产品20件,其中5件为优等品,检验员检测了4件产品(不放回抽样),求检验到优等品的概率分布。超几何分布的概率 优等品数是0的概率= 0.28173同理计算优等品数为1、2、3、4的概率X =01234P =超几何分布超几何分布nNxnMNxMxXPCCC)((X=0,1,2,3,4)42031515CCCX=01234p=0.28173 0.28173 0.46956 0.46956 0

56、.21672 0.21672 0.03096 0.03096 0.00103 0.00103 !20)!04520()!04()!05( !0)!420( !4)!520( !5CCC42041505)0(XP42021525CCC42011535CCC42001545CCC事件 = 优等品42041505CCC N=20,M=5,n=4,X=0,1,2,3,4超几何分布的 概率分布图!)!()!()!( !)!( !)!( !NxnMNxnxMxnNnMNM单比率检验 双比率检验双双比率检验比率检验补充阅读Fisher 精确检验Fisher 精确检验基于超几何分布Fisher 精确检验中原假

57、设假定两个总体比率是相等的H H :p 1= p2假设检验的例子(假设检验的例子(21) 有两台相同注橡设备,生产相同老产品时,1号设备和2号设备生产产品质量无差异,投入新产品,工程师分别在1号、2号设备换上新设计的模具,2号设备新模具新模具B B使用可降低材料浪费(流道、飞边等);希望使用新模具B B能与使用传统方法设计的新模具新模具A A 生产的部件在外观质量(关键质量)上相同。 由于每个部件的生产周期较长,不能收集大量数据,1号设备生产的部件16件,2号设备生产的部件15件。 判断标准:优优外观质量评分值大于等于90分非优优优模具模具A A610模具模具B B411单比率检验 双比率检验

58、双双比率检验比率检验Fisher 精确检验Fisher 精确检验中原假设假定两个总体比率是相等的H H :p 1= p2非优优优合计模具模具A A61016模具模具B B41115合计102131接上页 回顾,假设检验的基本思想是找到一个在原假设成立时的概率分布的检验统计量,再根据统计量的值是否为小概率事件来判定原假设成立是否成立。* 每个事件(非优优)出现的可能性相等u 列出事件(非优)的所有取值u 求出事件(非优)的每一个取值的概率总样本量N= n1 + n2= 16 + 15=31事件(非优)的所有取值M= x1 + x2= 6 + 4=10Sample size = n1补充阅读单比率

59、检验 双比率检验双双比率检验比率检验Fisher 精确检验非优优优合计模具模具A A61016模具模具B B41115合计102131接上页u 列出事件发生的所有取值事件发生事件不发生合计A Ain1-in1B BM-i n2+i-M n2合计MN-MN在四格表周边和(即边际分布)计数固定不变固定不变的条件下,可得到多种不同组合的四格表。为方便起见,选定行合计与列合计(n1 、n2、M、N-M)均最小所对应的格子为基础。本例以i所在格子为基础,其取值的变动范围从0到对应的最小周边合计数。本例i格可变范围为010,可得到11个四格表。 016105115962148731378412695115

60、10610411793128821397114106015Fisher 精确检验基于超几何分布(0)(1)(2)(4)(3)(5)(7)(6)(8)(9)(10)单比率检验 双比率检验双双比率检验比率检验Fisher 精确检验非优优优合计模具模具A A61016模具模具B B41115合计102131接上页事件发生事件不发生合计A Ain1-in1B BM-i n2+i-M n2合计MN-MN注:Fisher 精确检验基于超几何分布!)!()!()!( !)!( !)!( !2111NiMniniMinNnMNM11CCC)(1nNinMNiMiXPu 求出事件(非优)的每一个取值的概率 总样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论