版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Chap 10-1学习目标学习目标在本章,你将学到:在本章,你将学到: 如何对以下差异进行假设检验 两个独立总体的均值差异 两个相关总体的均值差异 两个独立总体的比例差异 两个独立总体的方差差异 如何使用单向方差分析对多总体的均值差异进行假设检验 如何在单向方差分析中进行多重比较第1页/共75页Chap 10-2两个样本检验两个样本检验两个样本检验总体均值,独立样本总体均值,相关样本总体方差均值1与均值2对比同组样本处理前后对比方差1与方差2对比例:总体比例比例1与比例2对比第2页/共75页Chap 10-3两个均值之间的差异两个均值之间的差异总体均值,独立样本目标:两个总体均值差异的假设检验
2、或构造置信区间,1 2 差异的点估计:X1 X2*1 和2 未知, 假设相同 1 和 2 未知,假设不相同 第3页/共75页Chap 10-4两个均值之间的差异:独立样本两个均值之间的差异:独立样本总体均值,独立样本*用Sp估计未知的。 使用混合方差混合方差t检验。检验。1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 用S1 和 S2 估计 1 和 2。使用 不同方差不同方差t检验。检验。 不同的数据来源 不相关 独立 样本的选择不受总体变化的影响第4页/共75页Chap 10-5两个总体均值的假设检验两个总体均值的假设检验左尾检验:H0: 1 2H1: 1 2即,H0: 1 2
3、0H1: 1 2 2即,H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 = 2H1: 1 2即,H0: 1 2 = 0H1: 1 2 0两个总体均值,独立样本第5页/共75页Chap 10-6两个总体均值,独立样本左尾检验:H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 2 = 0H1: 1 2 0a aa a/2a a/2a a-ta-ta/2tata/2拒绝 H0如果 tSTAT ta拒绝H0如果tSTAT ta/2 1 2 假设检验假设检验第6页/共75页Chap 10-71 - 2假设检验,假设检验,1和和2 未知且相未知且相同同假设: 样本是随机的独立的 总体是正
4、态分布或者两个样本容量都超过30 总体方差未知,但是假设是相同的*总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 第7页/共75页Chap 10-8 混合方差是: 检验统计量是: 其中 tSTAT 有 自由度= (n1 + n2 2)(续)1)n(nS1nS1nS212222112p() 1*212p2121STATn1n1SXXt1 - 2假设检验,1和2 未知且相同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 第8页/共75页Chap 10-9212p/221n1n1SXXt 1 2 的置信区间是:其中 t/2 有自由度= n1
5、 + n2 2*1 - 2置信区间,1和2 未知且相同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 第9页/共75页Chap 10-10混合方差混合方差t检验例子检验例子你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同? 你收集到如下数据: NYSE NASDAQ数据数据 21 25样本均值样本均值 3.27 2.53样本标准差样本标准差 1.30 1.16假设总体接近正态分布且具有等方差,均值是否不同 (a = 0.05)?第10页/共75页Chap 10-11混合方差混合方差t检验例子:计算检验统计量检验例子:计算检验统计量1.5
6、0211)25(1)-(211.161251.301211)n() 1(nS1nS1nS22212222112p2.0402512115021. 102.533.27n1n1SXXt212p2121检验统计量是:(续)H0: 1 - 2 = 0 i.e. (1 = 2)H1: 1 - 2 0 i.e. (1 2)第11页/共75页Chap 10-12混合方差混合方差t检验例子:确定假设检验检验例子:确定假设检验H0: 1 - 2 = 0 即即 (1 = 2)H1: 1 - 2 0 即即 (1 2)a a = 0.05df = 21 + 25 - 2 = 44临界值临界值: t = 2.0154
7、检验统计量:检验统计量:决策决策:结论结论:拒绝 H0 , a a = 0.05有证据表明均值不同t0 2.0154-2.0154.025拒绝 H0拒绝 H0.0252.0402.0402512115021.12.533.27t第12页/共75页Chap 10-13混合方差混合方差t检验例子:检验例子:1 - 2的置的置信区间信区间因为我们拒绝H0,我们能有95%的把握确定NYSE NASDAQ?NYSE - NASDAQ ,95% 置信区间 因为0不在区间里,我们有95%的把握确定NYSE NASDAQ)471. 1 ,09. 0(3628. 00154. 274. 0n1n1StXX212
8、p/221a第13页/共75页Chap 10-14*1 - 2假设检验,1和2 未知且不同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 假设: 样本是随机的独立的 总体是正态分布或者两个样本容量都超过30 总体方差未知,但是假设是不相同的第14页/共75页Chap 10-15(续)*Excel或Minitab可以用来进行适当的运算1 - 2假设检验,1和2 未知且不同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 第15页/共75页Chap 10-16相关总体的差异匹对检验相关总体的差异匹对检验 两个相关总体的均值检验 样本匹对或组
9、队 重复度量(前/后) 使用匹对值间的差异: 消除对象间的方差 假设: 两个总体都是正态分布 或者,如果不是正态,则使用大样本相关样本Di = X1i - X2i第16页/共75页Chap 10-17相关总体的差异匹对检验相关总体的差异匹对检验第i个差异值表示为Di, 其中相关总体Di = X1i - X2i总体均值差异匹对的点估计是D :nDDn1iin 是匹对样本中的对数1n)D(DSn1i2iD样本标准差是SD(续)第17页/共75页Chap 10-18 D检验统计量是:匹对样本nSDtDSTATDn其中 tSTAT 自由度是 n - 1差异匹对检验:确定差异匹对检验:确定tSTAT第1
10、8页/共75页Chap 10-19左尾检验:H0: D 0H1: D 0双侧检验:H0: D = 0H1: D 0匹对样本差异匹对检验:可能假设差异匹对检验:可能假设a aa a/2a a/2a a-ta-ta/2tata/2拒绝 H0 如果tSTAT ta拒绝 H0如果tSTAT ta/2 其中 tSTAT 自由度是n - 1第19页/共75页Chap 10-20D 置信区间是匹对样本1n)D(DSn1i2iDnSD2/atD 其中差异匹对的置信区间差异匹对的置信区间第20页/共75页Chap 10-21 假设你让你的销售人员去“售后服务”训练车间。此训练前后抱怨数会有差异吗?你收集了如下数
11、据:差异匹对检验例子 抱怨数抱怨数: (2) - (1) 售货员售货员 前前 (1) 后后 (2) 差异差异, Di C.B. 6 4 - 2 T.F. 20 6 -14 M.H. 3 2 - 1 R.K. 0 0 0 M.O. 4 0 - 4 -21D =Din5.671n)D(DS2iD = -4.2第21页/共75页Chap 10-22 训练前后抱怨数是否有差异? (a a = 0.01)? - 4.2D =1.6655.67/04.2n/StDSTATDDH0: D = 0H1: D 0检验统计量:检验统计量:t0.005 = 4.604 d.f. = n - 1 = 4拒绝拒绝a a
12、/2 - 4.604 4.604决策:决策:不拒绝不拒绝 H0(tstat 不在拒绝域不在拒绝域)结论:结论: 抱怨数没有大的变化抱怨数没有大的变化差异匹对检验:求解拒绝拒绝a a/2 - 1.66a a = .01第22页/共75页Chap 10-23两个总体比例两个总体比例目标: 检验某一假设或构造两个总体比例的差异的置信区间, 1 2 差异的点估计总体比例假设: n1 1 5 , n1(1- 1) 5n2 2 5 , n2(1- 2) 5 21pp 第23页/共75页Chap 10-24两个总体比例两个总体比例总体比例2121nnXXp总体比例的混合估计是:其中 X1 和 X2 是样本1
13、和2的观测值在零假设下,我们假设零假设是真的,所以我们假设1 = 2 以及将两个样本估计量混合在一起第24页/共75页Chap 10-25两个总体比例两个总体比例总体比例 212121STATn1n1)p(1pppZ1 2 的检验统计量是Z统计量:(续)2221112121nXp , nXp , nnXXp其中第25页/共75页Chap 10-26两个总体比例的假设检验两个总体比例的假设检验总体比例左尾检验:H0: 1 2H1: 1 2即,H0: 1 2 0H1: 1 2 2即,H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 = 2H1: 1 2即,H0: 1 2 = 0H1: 1
14、2 0第26页/共75页Chap 10-27两个总体比例的假设检验两个总体比例的假设检验总体比例左尾检验:H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 2 = 0H1: 1 2 0a aa a/2a a/2a a-za-za/2zaza/2拒绝 H0如果ZSTAT Za拒绝 H0如果ZSTAT Za/2 (续)第27页/共75页Chap 10-28两个总体比例的假设检验例子两个总体比例的假设检验例子 在选举A的时候,男性与女性投赞成票的比例有没有显著性的差异? 在一个随机样本中,72个男候选人有36个投赞成票,50个女候选人中有31个投赞成票 在显著性水平是0.05下进行检验第28
15、页/共75页Chap 10-29 假设检验是:H0: 1 2 = 0 (两个比例一样)H1: 1 2 0 (两个比例有显著性的差异)n样本比例是:n男: p1 = 36/72 = .50n女: p2 = 31/50 = .62.5491226750723136nnXXp2121 总体比例的混合估计是:两个总体比例的假设检验例子(续)第29页/共75页Chap 10-301 2 检验统计量是:两个总体比例的假设检验例子两个总体比例的假设检验例子(续).025-1.961.96.025-1.31结论:结论:在投票选举时,男性与女性投赞在投票选举时,男性与女性投赞成票的比例没有显著性的差异成票的比例
16、没有显著性的差异 1.31501721.549)(1.5490.62.50n1n1)p(1pppz212121STAT拒绝 H0拒绝 H0临界值临界值 = 1.96For a a = .05决策决策: 不拒绝不拒绝 H0第30页/共75页Chap 10-31两个总体比例的置信区间两个总体比例的置信区间总体比例222111/221n)p(1pn)p(1pZppa1 2 置信区间是:第31页/共75页Chap 10-32方差的假设检验方差的假设检验两个总体方差的检验F 检验统计量H0: 12 = 22H1: 12 22H0: 12 22H1: 12 22*假设假设 FSTATS12 / S22S1
17、2 = 样本1的方差 (较大样本方差)n1 = 来自总体1样本的容量S22 = 样本2的方差 (较小样本方差)n2 = 来自总体2样本的容量n1 1 = 分子自由度n2 1 = 分母自由度其中:第32页/共75页Chap 10-33 F临界值来自F表 有两个自由度:分子和分母 其中 在F表中, 分子自由度确定列 分母自由度确定行F分布分布df1 = n1 1 ; df2 = n2 12221SSFSTAT第33页/共75页Chap 10-34确定拒绝域确定拒绝域H0: 12 = 22H1: 12 22H0: 12 22H1: 12 22F 0 aF 拒绝 H0不拒绝H0拒绝 H0 如果 FST
18、AT FF 0 a/2拒绝 H0不拒绝H0F/2 拒绝H0 如果 FSTAT F/2第34页/共75页Chap 10-35F检验例子检验例子你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同? 你收集到如下数据: NYSE NASDAQ个数个数 2125均值均值3.272.53标准差标准差1.301.16NYSE和NASDAQ 的方差在a a = 0.05 水平下有没有差异?第35页/共75页Chap 10-36F检验例子求解检验例子求解 确定假设检验:H0: 21 = 22 (方差没有差异)H1: 21 22 (方差有差异)n确定F临界值, a a = 0.05:n
19、分子 d.f. = n1 1 = 21 1 =20n分母 d.f. = n2 1 = 25 1 = 24nF/2 = F.025, 20, 24 = 2.33第36页/共75页Chap 10-37 检验统计量是:0 256. 116. 130. 1222221SSFSTATa/2 = .025F0.025=2.33拒绝 H0不拒绝H0H0: 12 = 22H1: 12 22F检验例子求解检验例子求解nFSTAT = 1.256 不在拒绝域,所以不拒绝H0(续)n结论: 没有足够的证明方差存在差异,在 a = .05下F 第37页/共75页Chap 10-38一般方差分析一般方差分析 研究者控制
20、一个或多个观察因素 每个因素包含两个或多个水平 水平可以是数值的或绝对的 不同的水平生成不同的组 把每一个组作为来自不同总体的样本 观察相关样本间的影响 每组是一样的吗? 实验设计:收集数据第38页/共75页Chap 10-39完全随机设计完全随机设计 实验对象指定随机的组 假设对象是齐次的 仅仅一个因素或独立变量 有两个或多个水平 单因素的方差分析 (ANOVA)第39页/共75页Chap 10-40单向方差分析单向方差分析 计算三个或更多组的均值差异例: 五个品牌的轮胎在发生事故时预期移动距离的第一第二第三 假设 总体是正态分布 总体有相同方差 样本是随机独立的第40页/共75页Chap
21、10-41单向方差分析假设单向方差分析假设 所有的总体均值是相同的 即, 不受因素影响 (每组间的均值没有变化) 至少一个总体均值是不一样的 即,有一个因素影响 不意味着所有的总体均值是不同的 (有些可能是一样的) c3210:H1:H不是所有的总体均值都是一样的第41页/共75页Chap 10-42单向方差分析单向方差分析零假设是真的所有的均值是一样的:(没有因素影响)c3210:H1jH : 不是所有的是一样的321第42页/共75页Chap 10-43单向方差分析单向方差分析零假设不是真的至少一个均值是不一样的(影响因素存在)c3210:H1jH : 不是所有的是一样的321321or(
22、续)第43页/共75页Chap 10-44方差分离方差分离 总离差可以分为两部分:SST = Total Sum of Squares (总离差)SSA = Sum of Squares Among Groups (组间离差)SSW = Sum of Squares Within Groups (组内离差)SST = SSA + SSW第44页/共75页Chap 10-45方差分离方差分离总离差 = 多因素下独立数据值的总差异 (SST)组内离差 在某一因素下数据间的差异 (SSW)组间离差 = 样本均值间的差异 (SSA)SST = SSA + SSW(续)第45页/共75页Chap 10-
23、46总离差分离总离差分离因素产生的差异因素产生的差异 (SSA)随机误差产生的差异随机误差产生的差异 (SSW)总离差总离差 (SST)=+第46页/共75页Chap 10-47总均方总均方c1jn1i2ijj)XX(SST其中:SST = 总均方c = 组别的数量nj = 组j的观测值数量Xij = 组j的第i个观测值 X = 全局均值 (所有数据的均值)SST = SSA + SSW第47页/共75页Chap 10-48总离差总离差Group 1Group 2Group 3Response, XX2212211)()()(XXXXXXSSTjcn (续)第48页/共75页Chap 10-4
24、9组间离差组间离差其中:SSA = 组内离差平方和c = 组别数nj = 组j的样本容量 Xj = 组j的样本均值 X = 全局均值 (所有数据的均值)2jc1jj)XX(nSSASST = SSA + SSW第49页/共75页Chap 10-50组间离差组间离差不同组间的差异ij2jc1jj)XX(nSSA1cSSAMSA间均方 = SSA/自由度(续)第50页/共75页Chap 10-51组间离差组间离差Group 1Group 2Group 3Response, XX1X2X2cc222211)XX(n)XX(n)XX(nSSA (续)3X第51页/共75页Chap 10-52组内离差组
25、内离差其中:SSW = 组内平方和c = 组别数nj = 组j的样本容量 Xj = 组j的样本均值Xij = 组j的第i个观察值2jijn1ic1j)XX(SSWjSST = SSA + SSW第52页/共75页Chap 10-53组内离差组内离差每组间离差相加知道所有的组cnSSWMSW内均方 = SSW/自由度2jijn1ic1j)XX(SSWj(续)j第53页/共75页Chap 10-54组内离差组内离差Group 1Group 2Group 3Response, X1X2X3X222122111)()()(ccnXXXXXXSSWj (续)第54页/共75页Chap 10-55求均值平
26、方求均值平方cnSSWMSW1cSSAMSA1nSSTMST均值平方通过相关的自由度划分多方面的均值平方和得到间均方(d.f. = c-1)内均方(d.f. = n-c)总均方(d.f. = n-1)第55页/共75页Chap 10-56单向方差分析表离差来源离差来源平方和平方和自由度自由度均方均方(方差方差)组间组间c - 1MSA =组内组内SSWn - cMSW =总离差总离差SSTn 1SSAMSAMSWFc = 组别数n = 所有组的样本容量和df = 自由度SSAc - 1SSWn - cFSTAT =第56页/共75页Chap 10-57单向方差分析单向方差分析F检验统计量检验统
27、计量 检验统计量 MSA 是间均方MSW 是内均方 自由度 df1 = c 1 (c = 组别数) df2 = n c (n = 所有组的样本容量和)MSWMSAFSTATH0: 1= 2 = = cH1: 至少两个总体均值是不一样的第57页/共75页Chap 10-58单向方差分析单向方差分析F统计量的解释统计量的解释 F统计量是组间离差估计与组内离差估计的比率 比率必须是正的 df1 = c -1 代表小的 df2 = n - c 代表大的决策:n拒绝 H0如果FSTAT F, 否则不拒绝H00 a拒绝 H0不拒绝H0F第58页/共75页Chap 10-59单向方差分析单向方差分析F检验例
28、子检验例子你想要知道3个不同高尔夫俱乐部的距离是否不同。在每一个俱乐部使用自动化设备随机的测量了5个距离值。在0.05的显著性水平下,距离均值是否不同?Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 204第59页/共75页Chap 10-60单向方差分析单向方差分析F检验例子:散点图检验例子:散点图270260250240230220210200190距离距离1X2X3XX227.0 x205.8 x 226.0 x 249.2x321Club 1 Club 2 Club 3254 234 200
29、263 218 222241 235 197237 227 206251 216 204俱乐部俱乐部1 2 3第60页/共75页Chap 10-61单向方差分析单向方差分析F检验例子计算检验例子计算Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 204X1 = 249.2X2 = 226.0X3 = 205.8X = 227.0n1 = 5n2 = 5n3 = 5n = 15c = 3SSA = 5 (249.2 227)2 + 5 (226 227)2 + 5 (205.8 227)2 = 471
30、6.4SSW = (254 249.2)2 + (263 249.2)2 + (204 205.8)2 = 1119.6MSA = 4716.4 / (3-1) = 2358.2MSW = 1119.6 / (15-3) = 93.325.27593.32358.2FSTAT第61页/共75页Chap 10-62FSTAT = 25.275单向方差分析单向方差分析F检验例子计算检验例子计算H0: 1 = 2 = 3H1: j 不相同a = 0.05df1= 2 df2 = 12 检验统计量:检验统计量:决策决策:结论结论:拒绝 H0 ,在a a = 0.05有证据表明至少一个j 与其它值不同0
31、 a = .05F = 3.89拒绝 H0不拒绝H025.27593.32358.2FSTATMSWMSA临界值临界值: F = 3.89第62页/共75页Chap 10-63SUMMARYGroupsCountSumAverageVarianceClub 151246249.2108.2Club 25113022677.5Club 351029205.894.2ANOVASource of VariationSSdfMSFP-valueF critBetween Groups4716.422358.225.2754.99E-053.89Within Groups1119.61293.3Tot
32、al5836.014 单向方差分析Excel 输出第63页/共75页单向方差分析单向方差分析Minitab 输出输出Chap 10-64One-way ANOVA: Distance versus Club Source DF SS MS F PClub 2 4716.4 2358.2 25.28 0.000Error 12 1119.6 93.3Total 14 5836.0S = 9.659 R-Sq = 80.82% R-Sq(adj) = 77.62% Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev
33、 -+-+-+-+-1 5 249.20 10.40 (-*-)2 5 226.00 8.80 (-*-)3 5 205.80 9.71 (-*-) -+-+-+-+- 208 224 240 256Pooled StDev = 9.66第64页/共75页Chap 10-65Tukey-Kramer过程过程 说出哪个总体均值是显著不同的 例: 1 = 2 3 在单向方差分析中拒绝同等均值 可以成对比较 绝对均值差异与临界极差的对比x1 = 23第65页/共75页Chap 10-66Tukey-Kramer 临界极差临界极差其中:Q =分子自由度为c,分母自由度为n-c的学生极差分布的右侧临界值
34、 (参见附录 E.8 表) MSW =内均值 nj 和 nj =组j 和组 j的样本容量jjMSW11Q2nna临界极差第66页/共75页Chap 10-67Tukey-Kramer 过程例子过程例子1. 计算绝对均值差:Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 20420.2205.8226.0 xx43.4205.8249.2xx23.2226.0249.2xx3231212. 在附录E.8表中找到c = 3 和 (n c) = (15 3) = 12下Q的值 :3.77Q第67页/共75页Chap 10-68Tukey-Kramer 过程例子过程例子5. 所有的绝对均值差异比临界极差大。因此在5%的显著性水平下每一对的均值有显著性差异。因此,我们有95%的把握宣传俱乐部1的距离均值比俱乐部2,3大,俱乐部2比俱乐部3大。jMSW1193.3 11Q3.7716.2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 治疗计划的设计与实施过程
- 艾滋病培训课程
- 乳房再造课件教学课件
- 幼儿园成长档案
- 狂犬病健康教案
- 氟哌啶醇药物治疗护理
- 脱稿蝴蝶课件教学课件
- 3.1.1 盐类的水解 课件 高二上学期化学人教版(2019)选择性必修1
- 医院感染流行病学
- 致心律失常型右室心肌病
- 新生儿窒息复苏抢救流程演练
- 项目管理 项目管理
- GB/T 5668.1-1995旋耕机械
- GB/T 3634.2-2011氢气第2部分:纯氢、高纯氢和超纯氢
- 心理疏导与调节方法课件
- 冷轧硅钢生产工艺流程与设备轧钢部技术讲座
- 维生素D教学讲解课件
- 《寒号鸟》-教学讲解课件
- 全国中小学美术优质课一等奖《制作树叶贴画》课件
- 灯具简介课件
- 洁净厂房监理实施细则
评论
0/150
提交评论