假设检验与样本数量分析④单比率检验、双比率检验_第1页
假设检验与样本数量分析④单比率检验、双比率检验_第2页
假设检验与样本数量分析④单比率检验、双比率检验_第3页
假设检验与样本数量分析④单比率检验、双比率检验_第4页
假设检验与样本数量分析④单比率检验、双比率检验_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验及功效和样本数量分析④

单比率检验双比率检验功效和样本数量

(PowerandSampleSizeAnalysis)第一页,共八十页。预备知识总体——研究的一类对象的全体组成的集合。个体——总体中的每一个考察的对象。样本——从总体中抽出的一部分个体的集合。样本数量——样本中包含的个体的数量。总体与样本噢!这么多健身球,应该全是合格的吧从中抽出几个,测量一下。看看废品率。?我们通过样本来了解总体由样本信息作为总体信息估计值统计推断是由样本的信息来推测总体性能的一种方法。在通过样本获得一批数据后,要对总体的某一参数进行估计和检验。建立检验假设(如双侧检验)单样本例如,我们想了解一种健身球生产过程的不合格品率p是否为p0=2%,通过对样本的测量获得一批数据,然后对健身球不合格品率p进行推断,这是单样本检验的问题。H0:p

=p0H1:

p

p0H0:p

=0.02H1:

p

0.02不合格品率为2%不合格品率不是2%第二页,共八十页。预备知识总体与样本2种健身球生产过程的不合格品率应该一样吧,?我们通过2个样本来了解2个总体由样本信息推断2个总体相比是否有差异统计推断是由2个样本的信息来推测2个总体性能,推断特征相比是否有显著差异。建立检验假设(如双侧检验)双样本例如,直径为65cm的健身球,新研制出健身球2#生产成本较低,如果生产过程的不合格品率与原来的1#产品一致,则用2#产品替代1#产品。通过对2个样本的测量获得两部分数据,然后对两种健身球(1#产品和2#产品)的不合格品率进行是否存在差异进行推断(或推断1#产品的不合格品率是否大或小于2#产品的不合格品率),这是双样本比率检验的问题。健身球1#健身球2#样本间的差异是由抽样误差引起的样本与样本所代表的总体间存在显著差异不合格品率无差异

不合格品率有差异

H0:p

1=p

2H1:

p

1≠p

2第三页,共八十页。预备知识二项分布的概念

二项分布(binominaldistribution)是一种重要的离散型分布。

数据属于只有两个可能结果的独立实验的结果,一个表示希望的“事件”,另一个表示“非事件”(每一观察只具有相互独立的一种结果),如,通过与失败、合格与报废、有效或无效、是或否、0或1等。通常,1代表抽到不合格品,0代表抽到合格品。总体不合格品比率记作p,样本不合格品比率记作其中n——总体中随机抽取样本个数X——出现不合格品数(X

=0,1,2,3,…,n)第四页,共八十页。二项分布p=0.1,n=5

概率分布图n=30n=50n=100p=0.1,n=30、50、100

二项分布的概率分布图形预备知识质量部门对一批

产品进行了检验,长期以来生产过程的不合格品率=10%,检验员检测了5件产品(有放回抽样),求检验到的不合格品数。n=总体中随机抽取样本个数X=出现不合格品数二项分布的概率不合格品数是0的概率=0.59049

不合格品数是1的概率=0.32805

同理计算不合格品数为2、3、4、5的概率X=012345p=0.59049

0.32805

0.07290.00810.000450.000010.590490.328050.07290.00810.000450.00001

n足够大,分布近似正态分布.第五页,共八十页。预备知识比率检验比率检验单比率检验1Proportion-test一个总体双比率检验2Proportion-test精确检验

超几何分布两个总体

Z检验

正态近似检验精确检验二项分布Z检验正态近似检验

总体服从二项分布两个总体服从二项分布Z检验的适用条件:样本含量n足够大,与均大于5,此时样本率的分布近似正态分布,可利用正态分布的原理作Z检验。

当两样本含量n1及n2足够大,及均大于5可根据正态分布原理,进行Z检验。

Z检验的适用条件:第六页,共八十页。单比率检验单比率检验统计量式中:单比率检验1Proportion-test双侧检验左侧检验右侧检验检验假设H0:p=p0H1:p≠

p0H0:p

p0H1:p<

p0H0:p

p0H1:p>p0拒绝域|Z|Z1-a/2

Z

Za

Z

Z1-aP值决策P值<α

拒绝H0样本含量n足够大n:样本数:样本的比率p0:比率参考值Z检验正态近似检验

样本比率

=

x÷n其中x是观察到的”成功”数单比率检验用于根据样本数据对总体比率进行推断第七页,共八十页。

确定临界值H1:p≠

p0H1:p<

p0H1:p>p0双侧检验左侧检验右侧检验单比率检验单比率检验显著性水平α与拒绝域=0.025=0.025临界值临界值1-α=95%拒绝零假设拒绝零假设不拒绝H0范围

Z1-a/2

Za/2

α

=0.05临界值1-α=95%拒绝零假设不拒绝零假设α

=

0.05

Z检验正态近似检验

Za

α

=0.05临界值1-α=95%

Z1-a

不拒绝零假设拒绝零假设Z0.975

=1.96Z0.025=-1.96Z0.05=-1.645Z0.95=1.645α

=

0.05

α

=

0.05

第八页,共八十页。假设检验的例子(16)我们长园集团有个公司的一台注塑机加工某种电缆附件产品,长期以来生产过程的不合格品率p0=2%,估计当前生产过程的不合格品率仍为2%。

随机抽取500个产品,测量得到不合格品数为9。建立检验假设给定显著水平

α

=

0.0512计算统计量3——双侧检验H0:p=0.02H1:p≠

0.02n=500x

=9单比率检验单比率检验本例样本比率提供了总体比率的估计值样本比率

=x÷n=9÷500=0.018比率参考值p0=0.02(2%)1-p

=0.982,=

-0.3194第九页,共八十页。接上页如果|Z|=0.319

Z1-a/2

4用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验反查正态分布表(右尾概率)Z临界值为:

Z0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018

Z0.025=1.96用算得的统计量与相应的临界值作比较

|Z|

=0.319<

Z0.025=1.965作出不拒绝零假设的统计结论即:当前生产过程的不合格品率仍为2%。

计算检验P-值

Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018P(Z﹤-0.31或Z>0.31)=0.378

×2

=0.756

P=P(Z<

-0.31及Z>0.31)

=0.378

×2

=0.756

P=0.748>

α=0.05

按α=0.05的水平无法拒绝零假设H0

查正态分布表查不到|Z|=0.3194

P=P(Z<

-0.32及Z>0.32)

=0.374

×2

=0.748

P(Z<

-0.32及Z>0.32)

=0.374

×2

=0.748

|Z|

<临界值、未落入拒绝域及P>0.05是对应的见下页图示第十页,共八十页。接上页单比率检验单比率检验Z检验正态近似检验

Z=1.96Z=-1.96=0.025=0.025不拒绝零假设拒绝零假设拒绝零假设临界值临界值双侧检验示意图(显著性水平α与拒绝域)H01–

α

=

0.95

Z=0.319Z=

-0.319=0.3747

Z=

-

0.319

Z=0.319=0.3747

P=0.7494|Z|

<临界值则未落入拒绝域此处Z的绝对值=0.319小于临界值1.96样本观测值落在“不拒绝零假设”范围内

|Z|

<临界值则P>0.05(直观易见)此处Z的绝对值=0.319小于临界值1.96假设检验的P值

=

0.7494

直观易见0.050.7494|Z|

=0.319P=

0.7494

第十一页,共八十页。检验功效和样本数量分析评价检验功效假设检验的例子16,Z的绝对值=0.319小于临界值Z0.025=1.96(

P值=P=

0.7494

α=0.05)出了不拒绝零假设的统计结论。

——当H0为假时正确否定它的概率(p=1–β)双侧检验Power=1–Φ[(

0.02-0.018+1.96

×0.0063

)/0.0059]

+Φ[(

×0.0063

)/0.0059]

=1–Φ(

2.4319

)+Φ(-1.7539)

=0.0075

+0.03972

=

0.0472检验功效Power

=

0.0472——双侧检验单比率检验Power=1–Φ(

)+Φ

(

)参考比率标准误样本比率标准误将

P0

=0.02、=0.018、Z

α/2

=

1.96(右尾概率分位数、当α=0.05)

=0.0063=0.0059

及σp=0.0063、Sp=0.0059

代入上式。Φ:

标准正态分布的累积分布函数za/2=uppera/2pointofthestandardnormaldistribution第十二页,共八十页。样本数量假设检验的例子16中,如果总体比率实际为0.02但在样本比率=0.018时,则检测到差异的可能性为4

.72%如果我们仍然规定可以检测到的最小差值

δ

=0.002,并希望功效Power=0.9需要抽取产品样本多少个?将

Z

α/2

=

Z

0.05/2

=1.96、

Zβ=

Z

0.1

=1.28及

P0

=0.02、=0.018

代入上式双侧检验容许差值越小,需要样本量越大。(为使差值符合选择,δ有时需主观规定)检验功效和样本数量分析——双侧检验单比率检验接上页sin-1θ:反正弦三角函数采用弧度计算公式中=

48882.71733需要抽取产品样本48883个第十三页,共八十页。假设检验的例子(17)我们有一个公司生产继电保护装置,所在的主板生产中一次通过率只在97%。为了提高主板的一次通过率,六西格玛项目组对流程进行了改进。为确定改进后主板的一次通过率是否>97%。随机抽取800个产品,测量得到不合格品数为16。建立检验假设1——单侧检验(左)H0:p

0.03

H1:p

<

0.03(希望被证明)单比率检验n=800x

=16样本比率

=x÷n=16÷800=0.02比率参考值p0=0.03(3%)本例用不合格品率计算可用正态近似检验

给定显著水平

α

=

0.052计算统计量3=

-1.66用通过率计算结果是一样的,不合格率是小数值,一般会将小数值定义为p。第十四页,共八十页。接上页如果|Z|=1.66

Z1-a

4用算得的统计量与相应的临界值作比较则拒绝原假设;否则无法拒绝原假设。单比率检验反查正态分布表(右尾概率)Z临界值为:Zα=Z0.05

=1.64Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.50.0670.0660.0640.0630.0620.0610.0590.0580.0570.0561.60.0550.0540.0530.0520.051

0.0490.0480.0470.0460.046

Z0.05=1.64用算得的统计量与相应的临界值作比较

|Z|

=1.66>

Z0.05=1.645作出拒绝零假设的统计结论:不合格品率<

0.03即:改进后主板的一次通过率>97%

计算检验P-值

Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.50.0670.0660.0640.0630.0620.0610.0590.0580.0570.0561.60.0550.0540.0530.0520.0510.0490.0480.0470.0460.046P(Z<

-1.66)

=0.048

P=P(Z<

-1.66)

=0.048P=0.048

α=0.05

按α=0.05的水平拒绝零假设H0

查正态分布表查到|Z|=1.66|Z|

临界值、落入拒绝域及P<0.05是对应的见下页图示第十五页,共八十页。接上页单比率检验单比率检验Z检验正态近似检验

α

=0.05拒绝零假设不拒绝零假设左侧检验示意图(显著性水平α与拒绝域)H01–

α

=

0.95

P

=0.048

Z=

-

0.319

Z=0.319=0.3747左侧检验Z=

-1.66

Zα-1.64则落入拒绝域左侧检验Z=

-1.66

Zα-1.64则P=0.048<0.05(直观易见)直观易见0.050.048Z=

-1.66P(Z<

-1.66)

=0.048临界值Zα

=-1.64第十六页,共八十页。检验功效和样本数量分析评价检验功效假设检验的例子17中,检验功效有多大?

——当H0为假时正确否定它的概率(p=1–β)左侧检验Power=Φ[(

×0.00603

)/0.00495]

=Φ[0.022384

]

=0.5089检验功效Power

=

0.5089(50.89%)——左侧检验单比率检验Power=Φ

(

)参考比率标准误样本比率标准误将

P0

=0.03、=0.02、Z

α

=

1.64(右尾概率分位数、当α=0.05)

=0.00603=0.00495

及σp=0.00603、Sp=0.00495

代入上式。za

=one-sidedcriticalvalue(upperapointofthestandardnormaldistribution)第十七页,共八十页。样本数量上页的例子中,检验功效Power=0.5089(50.89%),如果我们仍然规定

δ

=0.01差异可以检测到,并希望检测功效Power=0.9需要抽取产品样本多少个?(Power=1-β=0.9即β=

0.1)将

Z

α

=

1.64、Zβ=

Z

0.1

=1.28

P0

=0.03、=0.02

代入上式检验功效和样本数量分析单比率检验接上页sin-1θ:反正弦三角函数采用弧度计算公式中=

2057.656537需要抽取产品样本2058个β:犯第II类错误(当H0为伪时我们接受H0)的概率

左侧检验或右侧检验第十八页,共八十页。单比率检验式中:单比率检验1Proportion-test双侧检验左侧检验右侧检验检验假设H0:p=p0H1:p≠

p0H0:p

p0H1:p<

p0H0:p

p0H1:p>p0P值<α

拒绝H0p值=P{X<yorX>n-y|p=po}y=min{x,n-x}.p值=P{X<x|p=po}p值=P{X>x|p=po}单比率检验用于根据样本数据对总体比率进行推断精确检验二项分布不可以做正态近似检验

n=总体中随机抽取样本个数x

=出现不合格品数二项分布概率大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检验进行手动计算的理解.精确检验补充阅读第十九页,共八十页。假设检验的例子(18)我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下。建立检验假设1——单侧检验(左)H0:p

0.92H1:p

<

0.92单比率检验样本比率

=x÷n=48÷50=0.96比率参考值p0=0.92(92%)给定显著水平

α

=

0.052计算概率值

3合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不可以做正态近似检验

事件=合格先计算大于48的单侧概率根据二项分布=

0.06725=

0.01547精确检验第二十页,共八十页。接上页由于计算小于等于48的单侧累积概率计算量较大结论:P=0.91728

>α

=

0.05显著性水平,不拒绝H0。即:不能拒绝改进后的培训通过率

0.924——单侧检验单比率检验0.067250.01547计算p值

p值=P{X<x|p=po}x=0、1、2、…、48我们利用总概率等于1计算小于等于48的单侧累积概率=1-

0.06725

-

0.01547=0.91728见前页计算大于48的(49、50)单侧概率

第二十一页,共八十页。假设检验的例子(18)我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下。建立检验假设1——单侧检验(右)单比率检验样本比率

=x÷n=2÷50=0.04比率参考值p0=0.08(8

%)给定显著水平

α

=

0.052计算概率值

3合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格不及格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格合格不可以做正态近似检验

事件=不及格先计算小于2的单侧概率根据二项分布=

0.06725=

0.01547例子(18)用不及格率计算一般会将小数量值定义为pH0:p

0.08H1:p>0.08精确检验第二十二页,共八十页。接上页结论:P=0.91728>α

=

0.05显著性水平下不拒绝H0即:不能拒绝改进后的培训不及格率

0.084——单侧检验(右)单比率检验0.067250.01547计算p值

与前两页(不能拒绝改进后的培训通过率

0.92)意义相同p值=P{X>x|p=po}由于计算大于等于2的单侧累积概率计算量较大x=2、3、…、50利用总概率等于1=1-

0.01547

-0.06725

=0.91728见前页计算小于2的(0、1)单侧概率

第二十三页,共八十页。检验功效和样本数量分析单比率检验精确检验补充阅读精确检验对于所有样本数量都是准确有效的第二十四页,共八十页。双比率检验双比率检验2Proportion-testZ检验

正态近似检验两个总体服从二项分布当两样本含量n1及n2足够大

Z检验的适用条件可进行Z检验大于5大于5统计量式中:双侧检验左侧检验右侧检验检验假设H0:p1-p2=dH1:p1-p2≠

dH0:p1-p2

dH1:p1-p2

<dH0:p1-p2

dH1:p1-p2

>

d拒绝域|Z|Z1-a/2

Z

Za

Z

Z1-aP值决策P值<α

拒绝H0n1

:样本1个数n2

:样本2个数样本公共比率

其中X1和X2

是样本1和样本2中的”成功”数d:两总体比率差值:样本1的比率:样本2的比率当检验两总体比率差值d=0时式中:双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值进行推断。第二十五页,共八十页。双比率检验检验两总体比率差值

d

=p1–p2=

0假设检验的例子(19)——双侧检验有两台波峰焊设备,1号设备生产的板件中随机抽取1600个产品,得到优等品的件数为320;2号设备生产的板件中随机抽取2000个产品,得到优等品的件数为360。为确定两台波峰焊设备产出优等品率是否一致,采用双比率检验。用显著性水平α=0.05进行检验可用正态近似检验

大于5大于5=x1÷n1=320÷1600=0.2=x2÷n2=360÷2000=0.18两总体”成功”比率合并估计值:样本1的比率样本2的比率=0.189H0:p1-p2

=0H1:p1-p2

≠01给定显著水平

α

=

0.052计算统计量3建立检验假设(两个总体比率相等)(两个总体比率存在差异)=1.523

第二十六页,共八十页。接上页4查临界值反查正态分布表(右尾概率)Z临界值为:

Z0.025=1.96Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018

Z0.025=1.96用算得的统计量与相应的临界值作比较∵

|Z|=1.523<

Z0.025=1.965作出不拒绝零假设的统计结论两台波峰焊设产出优等品率是一致的计算检验P-值

Z-Value0.000.010.020.030.040.050.060.070.080.090.30.3820.3780.3740.3710.3670.3630.3590.3560.3520.3480.40.3450.3410.3370.3340.3300.3260.3230.3190.3160.312……………………………1.40.0810.0810.0810.0810.0810.0810.0810.0810.0810.0811.50.0670.0670.0670.0670.0670.0670.0670.0670.0670.067P=P(Z>1.52)

=0.067

P=P(Z<

-1.52及Z>1.52)

=0.067

×2

=

0.134

∵P值=

0.134

α=0.05

按α=0.05的水平无法拒绝零假设H0

查正态分布表

|Z|

=1.52双比率检验——双侧检验

/2=0.025双侧检验临界值=±1.96显著性水平=0.05、

/2=0.025(右尾概率)|Z|

临界值与P值>0.05是对应的两台波峰焊设产出优等品率是一致的第二十七页,共八十页。双比率检验假设检验的例子(20)——右单侧检验有两台相同设备,1号设备和2号设备生产相同产品且质量无差异,工程师在2号设备换上新设计的刀具,由于新刀具使用价格较贵的合金材料;希望使用新刀具能使废品率有所下降,预计废品率至少会降低0.5%。使用原来刀具的1号设备生产的零件中和换上新刀具的2号设备生产的零件中各分别随机抽取3000个;经测量得出:1号设备生产的零件中废品数是75个,2号设备生产的零件中废品数是21个。检验使用新刀具使废品率至少会降低0.5%可用正态近似检验

大于5大于5=

x1÷n1=75÷3000=0.025=

x2÷n2=21÷3000=0.007样本1的比率样本2的比率1给定显著水平

α

=

0.052计算统计量3建立检验假设(想要证明)Z=4.023样本n1

=

n2=

n

=3000H0:p1-p2

0.005H1:p1-p2

>

0.005我们将预期效果(想要证明的假设)作为备择假设H1,因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,拒绝是有说服力的,减少结论错误。(两总体比率差值d不为时)第二十八页,共八十页。接上页4查临界值反查正态分布表(右尾概率)Z临界值为:

Z0.05=1.645用算得的统计量与相应的临界值作比较∵

Z=4.023>

Z0.025=1.6455使用原来刀具比换上新刀具生产的零件废品率多0.5%以上或者说:“使用新刀具使废品率至少会降低0.5%”双比率检验

=0.05单侧检验临界值=±1.645显著性水平=0.05Z0.000.010.020.030.040.050.060.070.080.09……………………………1.60.0550.0540.0530.0520.0510.0490.0480.0470.0461.600……………………………1.90.0290.0280.0270.0270.0260.0260.0250.0240.0240.0232.00.0230.0220.0220.0210.0210.0200.0200.0190.0190.018

Z0.051=1.64

Z0.049=1.65结论:拒绝零假设——右单侧检验(α=0.05)α=0.05临界值拒绝H01-α=95%H0Zα(α=0.05)=1.6451.645

Z=4.0234.023计算检验P-值

Z0.000.010.020.030.040.050.060.070.080.09……………………………4.00.000030.000030.00003

0.000030.000030.000030.000020.000020.000020.00002P=P(Z=4.02)

=0.00003

查正态分布表

Z=4.02∵P值=

0.00003

α=0.05

按α=0.05的水平拒绝零假设H0

Z

临界值与P<0.05是对应的第二十九页,共八十页。检验功效和样本数量分析评价检验功效①计算在假设检验的例子20中的检验功效,先计算“使用原来刀具比换上新刀具生产的零件废品率多”的检验功效

——当H0为假时正确否定它的概率(p=1–β)Power==0.00229=0.00323

双比率检验样本n1

=

n2

=

n

=3000H1:p1

>

p2——右单侧检验——右单侧检验zα=

one-sidedcriticalvalue(upperpointofthestandardnormaldistribution)将、Z

α

=

1.645及右面计算值代入上式Power=1-Φ

[(

0.007-0.025+1.645

×0.00229

0.00323]

=1-Φ

[-4.40649

]

=0.99999第三十页,共八十页。检验功效和样本数量分析评价检验功效②计算在假设检验的例子20中的检验功效,计算“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验功效

——当H0为假时正确否定它的概率(p=1–β)Power==0.00229=0.00323

双比率检验样本n1

=

n2

=

n

=3000——右单侧检验——右单侧检验zα=

one-sidedcriticalvalue(upperpointofthestandardnormaldistribution)将、Z

α

=

1.645及右面计算值代入上式Power=1-Φ

[(

0.007+0.05-0.025+1.645

×0.00229

0.00323]

=1-Φ

[

-2.85864

]

=0.9977H1:p1-p2

>

0.05第三十一页,共八十页。检验功效和样本数量分析评价检验功效双侧检验Power=za/2=uppera/2pointofthestandardnormaldistribution双比率检验左单侧检验Power=zα=

one-sidedcriticalvalue(upperpointofthestandardnormaldistribution)H1:p1

<p2H1:p1≠

p2

样本数量n

是指每个组的第三十二页,共八十页。样本数量①将

Z

α

=

1.645、Zβ=

Z

0.1

=1.28

代入上式检验功效和样本数量分析sin-1θ:反正弦三角函数采用弧度计算公式中=

2184.713656需要抽取产品样本数量

n

=2185个单侧检验左或右侧检验双比率检验计算在假设检验的例子20中的检验是“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验使用原来刀具生产的零件废品率如果使用新刀具生产的零件废品率比原来低0.013时,差异可以检测到,我们规定基线比率若希望检测功效Power=0.9,需要抽取产品样本多少个?样本数量n

是指每个组的第三十三页,共八十页。样本数量②将

Z

α

=

1.645、Zβ=

Z

0.1

=1.28

代入上式检验功效和样本数量分析sin-1θ:反正弦三角函数采用弧度计算公式中=

18414.18704需要抽取产品样本数量

n

=

18415个单侧检验左或右侧检验双比率检验计算在假设检验的例子20中的检验是“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验使用原来刀具生产的零件废品率如果使用新刀具生产的零件废品率比原来低0.005(0.5%)时,差异可以检测到,我们规定基线比率若希望检测功效Power=0.9,需要抽取产品样本多少个?样本数量n

是指每个组的第三十四页,共八十页。双比率检验样本数量的估计公式(2)将

Z

α

=

1.645、Zβ=

Z

0.1

=1.28

代入上式=

1834.194需要抽取产品样本数量

n

=

1835个32页上计算的样本数量n

=

2185用另一个公式计算一下32页计算n

=

2185用不同的的估计公式计算的样本数量会有差异双比率检验样本数量第三十五页,共八十页。式中:双比率检验1Proportion-test双侧检验左侧检验右侧检验检验假设H0:p1=p2H1:p1≠p2H0:p1=p2H1:p1<p2H0:p1=p2

H1:p1>p2

P值<α

拒绝H0p值=分3种情形p值=F(x1)

p值=1-F(x1–1)精确检验Fisher精确检验不可以做正态近似检验

大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检验进行手动计算的理解.精确检验补充阅读双比率检验双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值进行推断。Fisher精确检验基于超几何分布N=批量事件数M=批量中成功事件数n=观测数(不放回抽样)x=观测出现成功事件数超几何分布概率第三十六页,共八十页。补充阅读超几何分布超几何分布(Hypergeometricdistribution)是一种重要的离散概率分布。例如:有N件产品,其中M件为次品,抽检n件时所得次品数X=x的概率。

它描述的是由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(这里是指不放回抽样,如果是有放回抽样,概率分布属于二项分布)。

第三十七页,共八十页。一批

产品20件,其中5件为优等品,检验员检测了4件产品(不放回抽样),求检验到优等品的概率分布。超几何分布的概率

优等品数是0的概率=

0.28173同理计算优等品数为1、2、3、4的概率X

=01234P

=超几何分布(X=0,1,2,3,4)X=01234p=0.281730.469560.216720.030960.00103事件=

优等品N=20,M=5,n=4,X=0,1,2,3,4超几何分布的

概率分布图第三十八页,共八十页。双比率检验补充阅读Fisher精确检验Fisher精确检验基于超几何分布Fisher精确检验中原假设假定两个总体比率是相等的H0:p1=

p2假设检验的例子(21)有两台相同注橡设备,生产相同老产品时,1号设备和2号设备生产产品质量无差异,投入新产品,工程师分别在1号、2号设备换上新设计的模具,2号设备新模具B使用可降低材料浪费(流道、飞边等);希望使用新模具B能与使用传统方法设计的新模具A

生产的部件在外观质量(关键质量)上相同。由于每个部件的生产周期较长,不能收集大量数据,1号设备生产的部件16件,2号设备生产的部件15件。

判断标准:优——外观质量评分值大于等于90分非优优模具A610模具B411第三十九页,共八十页。双比率检验Fisher精确检验Fisher精确检验中原假设假定两个总体比率是相等的H0:p1=

p2非优优合计模具A61016模具B41115合计102131接上页回顾,假设检验的基本思想是找到一个在原假设成立时的概率分布的检验统计量,再根据统计量的值是否为小概率事件来判定原假设成立是否成立。*每个事件(非优)出现的可能性相等列出事件(非优)的所有取值求出事件(非优)的每一个取值的概率总样本量N=n1+n2=16+15=31事件(非优)的所有取值M=x1+x2=6+4=10Samplesize=n1补充阅读第四十页,共八十页。双比率检验Fisher精确检验非优优合计模具A61016模具B41115合计102131接上页列出事件发生的所有取值事件发生事件不发生合计Ain1-in1BM-in2+i-Mn2合计MN-MN在四格表周边和(即边际分布)计数固定不变的条件下,可得到多种不同组合的四格表。为方便起见,选定行合计与列合计(n1

、n2、M、N-M)均最小所对应的格子为基础。本例以i所在格子为基础,其取值的变动范围从0到对应的最小周边合计数。本例i格可变范围为0—10,可得到11个四格表。01610511596214873137841269511510610411793128821397114106015Fisher精确检验基于超几何分布(0)(1)(2)(4)(3)(5)(7)(6)(8)(9)(10)第四十一页,共八十页。双比率检验Fisher精确检验非优优合计模具A61016模具B41115合计102131接上页事件发生事件不发生合计Ain1-in1BM-in2+i-Mn2合计MN-MN注:Fisher精确检验基于超几何分布求出事件(非优)的每一个取值的概率总样本量N=n1+n2=16+15=31事件(非优)的值M=x1+x2=6+4=10Samplesize=n1四格表周边和(即边际分布)计数固定不变,本例中:(i

=0,1,2,3,……,M)我们用更一般的表达式见下页第四十二页,共八十页。双比率检验Fisher精确检验非优优合计模具A61016模具B41115合计102131接上页事件发生事件不发生合计Aaba+bBcdc+d合计a+cb+dN一般的表达求出事件发生的每一个取值的概率(a

=0,1,2,3,……,a+c)见41页,11个四格表第一个:(0)号

本例中:=0.000068016105a

是0的概率见41页,11个四格表第二个;(1)号=

0.001806a

是1的概率(0)11596(1)第四十三页,共八十页。双比率检验Fisher精确检验接上页求出事件发生的每一个取值的概率同理运用上页公式计算a

数值为2、3、……、10的概率并整理成表格如下:列出事件发生的取值(见41页11个四格表)概率

paabcd0161050.000068115960.001806214870.017411313780.081250412690.2053815115100.2957496104110.246457793120.117361882130.030469971140.0038691060150.000181概率表a、b、c、d组合见41页,11个四格表(0)——(10)号第四十四页,共八十页。双比率检验Fisher精确检验接上页事件发生的取值paabcd01610500.6667-0.6670.000068115960.06250.6-0.5380.001806214870.1250.5333-0.4080.017411313780.18750.4667-0.2790.081250412690.250.4-0.150.2053815115100.31250.3333-0.0210.2957496104110.3750.26670.10830.246457793120.43750.20.23750.117361882130.50.13330.36670.030469971140.56250.06670.49580.0038691060150.62500.6250.000181模具A生产的非优品比率为设:模具B生产的非优品比率为1给定显著水平

α

=

0.052计算P值3建立检验假设H0:p1=p2

H1:p1>p2

模具A

与B生产的部件在外观质量上相同模具A

生产的非优品比率比B

要大在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值≥0.1083。非优优合计非优品比率模具A610160.375模具B411150.2667合计102131上表中两组非优品比率差值=0.375-0.2667=0.1083所有比上面样本表更极端的情况都应考虑进去,因为这些极端情况都可能发生,右单侧p值=F(a)

=

p6+p7+p8+p9+p10计算累计概率≥0.1083的有a=

6,7,8、9、100.246457+0.117361+0.030469+0.003869+0.000181=0.398337

∵P值=

0.398337

α=0.05

按α=0.05的水平无法拒绝H0

右单侧检验P值:在H0成立时,出现目前状况或对原假设更不利状况的概率

第四十五页,共八十页。双比率检验Fisher精确检验事件发生的取值paabcd01610500.66670.6670.000068115960.06250.60.5380.001806214870.1250.53330.4080.017411313780.18750.46670.2790.081250412690.250.40.150.2053815115100.31250.33330.0210.2957496104110.3750.26670.10830.246457793120.43750.20.23750.117361882130.50.13330.36670.030469971140.56250.06670.49580.0038691060150.62500.6250.0001811给定显著水平

α

=

0.052计算P值3建立检验假设H0:p1=p2

H1:p1≠p2模具A

与B生产的部件在外观质量上相同在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值绝对值≥0.1083。非优优合计非优品比率模具A610160.375模具B411150.2667合计102131上表中两组非优品比率差值的绝对值=|0.375-0.2667|=0.1083双侧p值=F(a)

=

1-

p5=

1-0.295749计算累计概率差值绝对值≥0.1083的有10组(发生的取值11种)=0.704251

∵P值>

0.05

按α=0.05的水平无法拒绝H0

双侧检验模具A

与B生产的部件在外观质量不同上页的右单侧检验例子中,检验P值>0.05无法拒绝H0

;为了增多了解我们再来计算双侧检验P值

第四十六页,共八十页。双比率检验Fisher精确检验事件发生的取值paabcd01610500.6667-0.6670.000068115960.06250.6-0.5380.001806214870.1250.5333-0.4080.017411313780.18750.4667-0.2790.081250412690.250.4-0.150.2053815115100.31250.3333-0.0210.2957496104110.3750.26670.10830.246457793120.43750.20.23750.117361882130.50.13330.36670.030469971140.56250.06670.49580.0038691060150.62500.6250.000181

α

=

0.05计算P值在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值0.1083。上表中两组非优品比率差值=0.375-0.2667=0.1083左单侧p值=F(x1)=F(a)

=

p0+p1+p2+p3+p4+p5+p6计算累计概率

0.1083的有:当a=

0,1,2、3、4、5、60.000068

+……+

0.246457=0.848122

∵P值=

0.848122>

α=0.05

按α=0.05的水平无法拒绝H0

非优优合计非优品比率模具A610160.375模具B411150.2667合计102131左单侧检验我们再来计算左单侧检验P值H0:p1=p2H1:p1<p2即先算出左侧与样本四格表情况及更极端情况的分表的概率累计第四十七页,共八十页。双比率检验Fisher精确检验批量事件数N=n1+n2=31批量中成功事件数M=x1+x2=10观测数=n1=16观测出现成功事件数x1=

6(x1=0,1,2,…、10)超几何分布的

概率分布图x1012345678910当前x1=

6的概率0.246457

当前左单侧概率(不包括当前)

当前右单侧概率

(不包括当前)第四十八页,共八十页。双比率检验补充阅读Fisher精确检验事件发生的取值paxi00.00006810.00180620.01741130.08125040.20538150.29574960.24645770.11736180.03046990.003869100.000181发生的取值i

种(本例11种)中位数记作xM(本例xM=5)回顾假设检验的例子(21)H1:p1<p2p值=F(x1)

=

p0+p1+p2+p3+p4+p5+p6x1=6事件发生的取值paxi00.00006810.00180620.01741130.08125040.20538150.29574960.24645770.11736180.03046990.003869100.000181x1=6H1:p1>p2p值=1-F(x1-1)

=1-(p0+p1+p2+p3+p4+p5)(=

p6+p7+p8+p9+p10)H1:p1≠p2情形1:x1<xM

p值=F(x1)+

1-F(y-1)y是小于xM最大整数,当p(y)

p(x1)。情形2:x1

xM

p值=F(y)+

1-F(x1-1)y是大于xM最小整数,当p(y)

p(x1)。情形3:x1=xM

p值=1p值=F(y)+

1-F(x1-1)=

p0+p1+p2+p3+p4+1-(p0+p1+p2+p3+p4+p5)(本例x1=6>

xM=5)事件发生的取值paxi00.00006810.00180620.01741130.08125040.20538150.29574960.24645770.11736180.03046990.003869100.000181F(y)F(x1-1)1-F(x1-1)

xM

xM

xMx1=6第四十九页,共八十页。双比率检验补充阅读Fisher精确检验假设检验的例子(22)

判断标准:不合格合格A114B69某产品断裂强度执行新标准,工程师分别开发了两种材料配方,

为了解两种材料配方生产的产品在断裂强方面是否不同,A材料配方和B材料配方各生产了产品15件。(新标准:≥12MPa)合格:大于等于13MPa不合格合格合计A11415B6915合计72330列出事件发生的所有取值本例以x1

为基础,可变范围为0-7,可得到8个四格表。x1=1abcdabcd015781146921351031241141131251021369114780158个四格表的组合第五十页,共八十页。双比率检验补充阅读Fisher精确检验abcd01578114692135103124114113125102136911478015(a

=0,1,2,…,7)

本例中:=0.003161是0的概率是1的概率1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论