版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第第10章章两个样本数值数据假设检验和单向方差分析商务统计学(第5版)Chap 10-1;.学习目标在本章,你将学到:在本章,你将学到:n如何对以下差异进行假设检验n两个独立总体的均值差异n两个相关总体的均值差异n两个独立总体的比例差异n两个独立总体的方差差异n如何使用单向方差分析对多总体的均值差异进行假设检验n如何在单向方差分析中进行多重比较Chap 10-2;.两个样本检验两个样本检验总体均值,独立样本总体均值,相关样本总体方差均值1与均值2对比同组样本处理前后对比方差1与方差2对比例:总体比例比例1与比例2对比Chap 10-3;.两个均值之间的差异总体均值,独立样本目标:两个总体均值差
2、异的假设检验或构造置信区间,1 2 差异的点估计:X1 X2*1 和2 未知, 假设相同 1 和 2 未知,假设不相同 Chap 10-4;.两个均值之间的差异:独立样本总体均值,独立样本*用Sp估计未知的。 使用混合方差混合方差t检验。检验。1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 用S1 和 S2 估计 1 和 2。使用 不同方差不同方差t检验。检验。n不同的数据来源n不相关n独立n样本的选择不受总体变化的影响Chap 10-5;.两个总体均值的假设检验左尾检验:H0: 1 2H1: 1 2即,H0: 1 2 0H1: 1 2 2即,H0: 1 2 0H1: 1 2 0双
3、侧检验:H0: 1 = 2H1: 1 2即,H0: 1 2 = 0H1: 1 2 0两个总体均值,独立样本Chap 10-6;.两个总体均值,独立样本左尾检验:H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 2 = 0H1: 1 2 0a aa a/2a a/2a a-ta-ta/2tata/2拒绝 H0如果 tSTAT ta拒绝H0如果tSTAT ta/2 1 2 假设检验Chap 10-7;.1 - 2假设检验,1和2 未知且相同假设: 样本是随机的独立的 总体是正态分布或者两个样本容量都超过30 总体方差未知,但是假设是相同的*总体均值,独立样本1 和 2 未知, 假设相同 1
4、 和 2 未知,假设不相同 Chap 10-8;. 混合方差是: 检验统计量是: 其中 tSTAT 有 自由度= (n1 + n2 2)(续)1)n(nS1nS1nS212222112p() 1*212p2121STATn1n1SXXt1 - 2假设检验,1和2 未知且相同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 Chap 10-9;.212p/221n1n1SXXt 1 2 的置信区间是:其中 t/2 有自由度= n1 + n2 2*1 - 2置信区间,1和2 未知且相同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 Chap
5、 10-10;.混合方差t检验例子你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同? 你收集到如下数据: NYSE NASDAQ数据数据 21 25样本均值样本均值 3.27 2.53样本标准差样本标准差 1.30 1.16假设总体接近正态分布且具有等方差,均值是否不同 (a = 0.05)?Chap 10-11;.混合方差t检验例子:计算检验统计量1.50211)25(1)-(211.161251.301211)n() 1(nS1nS1nS22212222112p2.0402512115021. 102.533.27n1n1SXXt212p2121检验统计量是:(
6、续)H0: 1 - 2 = 0 i.e. (1 = 2)H1: 1 - 2 0 i.e. (1 2)Chap 10-12;.混合方差t检验例子:确定假设检验H0: 1 - 2 = 0 即即 (1 = 2)H1: 1 - 2 0 即即 (1 2)a a = 0.05df = 21 + 25 - 2 = 44临界值临界值: t = 2.0154检验统计量:检验统计量:决策决策:结论结论:拒绝 H0 , a a = 0.05有证据表明均值不同t0 2.0154-2.0154.025拒绝 H0拒绝 H0.0252.0402.0402512115021.12.533.27tChap 10-13;.混合方
7、差t检验例子:1 - 2的置信区间因为我们拒绝H0,我们能有95%的把握确定NYSE NASDAQ?NYSE - NASDAQ ,95% 置信区间 因为0不在区间里,我们有95%的把握确定NYSE NASDAQ)471. 1 ,09. 0(3628. 00154. 274. 0n1n1StXX212p/221aChap 10-14;.*1 - 2假设检验,1和2 未知且不同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 假设: 样本是随机的独立的 总体是正态分布或者两个样本容量都超过30 总体方差未知,但是假设是不相同的Chap 10-15;.(续)*Excel或
8、Minitab可以用来进行适当的运算1 - 2假设检验,1和2 未知且不同总体均值,独立样本1 和 2 未知, 假设相同 1 和 2 未知,假设不相同 Chap 10-16;.相关总体的差异匹对检验 两个相关总体的均值检验n 样本匹对或组队n 重复度量(前/后)n 使用匹对值间的差异:n消除对象间的方差n假设:n两个总体都是正态分布n或者,如果不是正态,则使用大样本相关样本Di = X1i - X2iChap 10-17;.相关总体的差异匹对检验第i个差异值表示为Di, 其中相关总体Di = X1i - X2i总体均值差异匹对的点估计是D :nDDn1iin 是匹对样本中的对数1n)D(DSn
9、1i2iD样本标准差是SD(续)Chap 10-18;.nD检验统计量是:匹对样本nSDtDSTATDn其中 tSTAT 自由度是 n - 1差异匹对检验:确定tSTATChap 10-19;.左尾检验:H0: D 0H1: D 0双侧检验:H0: D = 0H1: D 0匹对样本差异匹对检验:可能假设a aa a/2a a/2a a-ta-ta/2tata/2拒绝 H0 如果tSTAT ta拒绝 H0如果tSTAT ta/2 其中 tSTAT 自由度是n - 1Chap 10-20;.D 置信区间是匹对样本1n)D(DSn1i2iDnSD2/atD 其中差异匹对的置信区间Chap 10-21
10、;.n 假设你让你的销售人员去“售后服务”训练车间。此训练前后抱怨数会有差异吗?你收集了如下数据:差异匹对检验例子 抱怨数抱怨数: (2) - (1) 售货员售货员 前前 (1) 后后 (2) 差异差异, Di C.B. 6 4 - 2 T.F. 20 6 -14 M.H. 3 2 - 1 R.K. 0 0 0 M.O. 4 0 - 4 -21D =Din5.671n)D(DS2iD = -4.2Chap 10-22;.n 训练前后抱怨数是否有差异? (a a = 0.01)? - 4.2D =1.6655.67/04.2n/StDSTATDDH0: D = 0H1: D 0检验统计量:检验统
11、计量:t0.005 = 4.604 d.f. = n - 1 = 4拒绝拒绝a a/2 - 4.604 4.604决策:不拒绝决策:不拒绝 H0(tstat 不在拒绝域不在拒绝域)结论:结论: 抱怨数没有大的变化抱怨数没有大的变化差异匹对检验:求解拒绝拒绝a a/2 - 1.66a a = .01Chap 10-23;.两个总体比例目标: 检验某一假设或构造两个总体比例的差异的置信区间, 1 2 差异的点估计总体比例假设: n1 1 5 , n1(1- 1) 5n2 2 5 , n2(1- 2) 5 21pp Chap 10-24;.两个总体比例总体比例2121nnXXp总体比例的混合估计是:
12、其中 X1 和 X2 是样本1和2的观测值在零假设下,我们假设零假设是真的,所以我们假设1 = 2 以及将两个样本估计量混合在一起Chap 10-25;.两个总体比例总体比例 212121STATn1n1)p(1pppZ1 2 的检验统计量是Z统计量:(续)2221112121nXp , nXp , nnXXp其中Chap 10-26;.两个总体比例的假设检验总体比例左尾检验:H0: 1 2H1: 1 2即,H0: 1 2 0H1: 1 2 2即,H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 = 2H1: 1 2即,H0: 1 2 = 0H1: 1 2 0Chap 10-27;.两
13、个总体比例的假设检验总体比例左尾检验:H0: 1 2 0H1: 1 2 0双侧检验:H0: 1 2 = 0H1: 1 2 0a aa a/2a a/2a a-za-za/2zaza/2拒绝 H0如果ZSTAT Za拒绝 H0如果ZSTAT Za/2 (续)Chap 10-28;.两个总体比例的假设检验例子 在选举A的时候,男性与女性投赞成票的比例有没有显著性的差异?n在一个随机样本中,72个男候选人有36个投赞成票,50个女候选人中有31个投赞成票n在显著性水平是0.05下进行检验Chap 10-29;.n假设检验是:H0: 1 2 = 0 (两个比例一样)H1: 1 2 0 (两个比例有显著
14、性的差异)n样本比例是:n男: p1 = 36/72 = .50n女: p2 = 31/50 = .62.5491226750723136nnXXp2121 总体比例的混合估计是:两个总体比例的假设检验例子(续)Chap 10-30;.1 2 检验统计量是:两个总体比例的假设检验例子(续).025-1.961.96.025-1.31结论:在投票选举时,男性与女性投赞成票结论:在投票选举时,男性与女性投赞成票的比例没有显著性的差异的比例没有显著性的差异 1.31501721.549)(1.5490.62.50n1n1)p(1pppz212121STAT拒绝 H0拒绝 H0临界值临界值 = 1.9
15、6For a a = .05决策决策: 不拒绝不拒绝 H0Chap 10-31;.两个总体比例的置信区间总体比例222111/221n)p(1pn)p(1pZppa1 2 置信区间是:Chap 10-32;.方差的假设检验两个总体方差的检验F 检验统计量H0: 12 = 22H1: 12 22H0: 12 22H1: 12 22*假设假设 FSTATS12 / S22S12 = 样本1的方差 (较大样本方差)n1 = 来自总体1样本的容量S22 = 样本2的方差 (较小样本方差)n2 = 来自总体2样本的容量n1 1 = 分子自由度n2 1 = 分母自由度其中:Chap 10-33;.nF临界
16、值来自F表n有两个自由度:分子和分母n其中n在F表中,n分子自由度确定列n分母自由度确定行F分布df1 = n1 1 ; df2 = n2 12221SSFSTATChap 10-34;.确定拒绝域H0: 12 = 22H1: 12 22H0: 12 22H1: 12 22F 0 aF 拒绝 H0不拒绝H0拒绝 H0 如果 FSTAT FF 0 a/2拒绝 H0不拒绝H0F/2 拒绝H0 如果 FSTAT F/2Chap 10-35;.F检验例子你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同? 你收集到如下数据: NYSE NASDAQ个数个数 2125均值均值3
17、.272.53标准差标准差1.301.16NYSE和NASDAQ 的方差在a a = 0.05 水平下有没有差异?Chap 10-36;.F检验例子求解n确定假设检验:H0: 21 = 22 (方差没有差异)H1: 21 22 (方差有差异)n确定F临界值, a a = 0.05:n分子 d.f. = n1 1 = 21 1 =20n分母 d.f. = n2 1 = 25 1 = 24nF/2 = F.025, 20, 24 = 2.33Chap 10-37;.n检验统计量是:0 256. 116. 130. 1222221SSFSTATa/2 = .025F0.025=2.33拒绝 H0不拒
18、绝H0H0: 12 = 22H1: 12 22F检验例子求解nFSTAT = 1.256 不在拒绝域,所以不拒绝H0(续)n结论: 没有足够的证明方差存在差异,在 a = .05下F Chap 10-38;.一般方差分析n研究者控制一个或多个观察因素n每个因素包含两个或多个水平n水平可以是数值的或绝对的n不同的水平生成不同的组n把每一个组作为来自不同总体的样本n观察相关样本间的影响n每组是一样的吗?n实验设计:收集数据Chap 10-39;.完全随机设计n实验对象指定随机的组n假设对象是齐次的n仅仅一个因素或独立变量n有两个或多个水平n单因素的方差分析 (ANOVA)Chap 10-40;.单
19、向方差分析n计算三个或更多组的均值差异例: 五个品牌的轮胎在发生事故时预期移动距离的第一第二第三n假设n总体是正态分布n总体有相同方差n样本是随机独立的Chap 10-41;.单向方差分析假设n n所有的总体均值是相同的n即, 不受因素影响 (每组间的均值没有变化)n n至少一个总体均值是不一样的n即,有一个因素影响 n不意味着所有的总体均值是不同的 (有些可能是一样的) c3210:H1:H不是所有的总体均值都是一样的Chap 10-42;.单向方差分析零假设是真的所有的均值是一样的:(没有因素影响)c3210:H1jH : 不是所有的是一样的321Chap 10-43;.单向方差分析零假设
20、不是真的至少一个均值是不一样的(影响因素存在)c3210:H1jH : 不是所有的是一样的321321or(续)Chap 10-44;.方差分离n总离差可以分为两部分:SST = Total Sum of Squares (总离差)SSA = Sum of Squares Among Groups (组间离差)SSW = Sum of Squares Within Groups (组内离差)SST = SSA + SSWChap 10-45;.方差分离总离差 = 多因素下独立数据值的总差异 (SST)组内离差 在某一因素下数据间的差异 (SSW)组间离差 = 样本均值间的差异 (SSA)SST
21、 = SSA + SSW(续)Chap 10-46;.总离差分离因素产生的差异因素产生的差异 (SSA)随机误差产生的差异随机误差产生的差异 (SSW)总离差总离差 (SST)=+Chap 10-47;.总均方c1jn1i2ijj)XX(SST其中:SST = 总均方c = 组别的数量nj = 组j的观测值数量Xij = 组j的第i个观测值 X = 全局均值 (所有数据的均值)SST = SSA + SSWChap 10-48;.总离差Group 1Group 2Group 3Response, XX2212211)()()(XXXXXXSSTjcn (续)Chap 10-49;.组间离差其中
22、:SSA = 组内离差平方和c = 组别数nj = 组j的样本容量 Xj = 组j的样本均值 X = 全局均值 (所有数据的均值)2jc1jj)XX(nSSASST = SSA + SSWChap 10-50;.组间离差不同组间的差异ij2jc1jj)XX(nSSA1cSSAMSA间均方 = SSA/自由度(续)Chap 10-51;.组间离差Group 1Group 2Group 3Response, XX1X2X2cc222211)XX(n)XX(n)XX(nSSA (续)3XChap 10-52;.组内离差其中:SSW = 组内平方和c = 组别数nj = 组j的样本容量 Xj = 组j
23、的样本均值Xij = 组j的第i个观察值2jijn1ic1j)XX(SSWjSST = SSA + SSWChap 10-53;.组内离差每组间离差相加知道所有的组cnSSWMSW内均方 = SSW/自由度2jijn1ic1j)XX(SSWj(续)jChap 10-54;.组内离差Group 1Group 2Group 3Response, X1X2X3X222122111)()()(ccnXXXXXXSSWj (续)Chap 10-55;.求均值平方cnSSWMSW1cSSAMSA1nSSTMST均值平方通过相关的自由度划分多方面的均值平方和得到间均方(d.f. = c-1)内均方(d.f.
24、 = n-c)总均方(d.f. = n-1)Chap 10-56;.单向方差分析表离差来源离差来源平方和平方和自由度自由度均方均方(方差方差)组间组间c - 1MSA =组内组内SSWn - cMSW =总离差总离差SSTn 1SSAMSAMSWFc = 组别数n = 所有组的样本容量和df = 自由度SSAc - 1SSWn - cFSTAT =Chap 10-57;.单向方差分析F检验统计量n检验统计量 MSA 是间均方MSW 是内均方n自由度ndf1 = c 1 (c = 组别数)ndf2 = n c (n = 所有组的样本容量和)MSWMSAFSTATH0: 1= 2 = = cH1:
25、 至少两个总体均值是不一样的Chap 10-58;.单向方差分析F统计量的解释nF统计量是组间离差估计与组内离差估计的比率n比率必须是正的n df1 = c -1 代表小的n df2 = n - c 代表大的决策:n拒绝 H0如果FSTAT F, 否则不拒绝H00 a拒绝 H0不拒绝H0FChap 10-59;.单向方差分析F检验例子你想要知道3个不同高尔夫俱乐部的距离是否不同。在每一个俱乐部使用自动化设备随机的测量了5个距离值。在0.05的显著性水平下,距离均值是否不同?Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227
26、206251 216 204Chap 10-60;.单向方差分析F检验例子:散点图270260250240230220210200190距离距离1X2X3XX227.0 x205.8 x 226.0 x 249.2x321Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 204俱乐部俱乐部1 2 3Chap 10-61;.单向方差分析F检验例子计算Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 204X1
27、= 249.2X2 = 226.0X3 = 205.8X = 227.0n1 = 5n2 = 5n3 = 5n = 15c = 3SSA = 5 (249.2 227)2 + 5 (226 227)2 + 5 (205.8 227)2 = 4716.4SSW = (254 249.2)2 + (263 249.2)2 + (204 205.8)2 = 1119.6MSA = 4716.4 / (3-1) = 2358.2MSW = 1119.6 / (15-3) = 93.325.27593.32358.2FSTATChap 10-62;.FSTAT = 25.275单向方差分析F检验例子计算
28、H0: 1 = 2 = 3H1: j 不相同a = 0.05df1= 2 df2 = 12 检验统计量:检验统计量:决策决策:结论结论:拒绝 H0 ,在a a = 0.05有证据表明至少一个j 与其它值不同0 a = .05F = 3.89拒绝 H0不拒绝H025.27593.32358.2FSTATMSWMSA临界值临界值: F = 3.89Chap 10-63;.SUMMARYGroupsCountSumAverageVarianceClub 151246249.2108.2Club 25113022677.5Club 351029205.894.2ANOVASource of Varia
29、tionSSdfMSFP-valueF critBetween Groups4716.422358.225.2754.99E-053.89Within Groups1119.61293.3Total5836.014 单向方差分析Excel 输出Chap 10-64;.单向方差分析Minitab 输出One-way ANOVA: Distance versus Club Source DF SS MS F PClub 2 4716.4 2358.2 25.28 0.000Error 12 1119.6 93.3Total 14 5836.0S = 9.659 R-Sq = 80.82% R-Sq
30、(adj) = 77.62% Individual 95% CIs For Mean Based on Pooled StDevLevel N Mean StDev -+-+-+-+-1 5 249.20 10.40 (-*-)2 5 226.00 8.80 (-*-)3 5 205.80 9.71 (-*-) -+-+-+-+- 208 224 240 256Pooled StDev = 9.66Chap 10-65;.Tukey-Kramer过程n说出哪个总体均值是显著不同的n例: 1 = 2 3n在单向方差分析中拒绝同等均值n可以成对比较n绝对均值差异与临界极差的对比x1 = 23Cha
31、p 10-66;.Tukey-Kramer 临界极差其中:Q =分子自由度为c,分母自由度为n-c的学生极差分布的右侧临界值 (参见附录 E.8 表) MSW =内均值 nj 和 nj =组j 和组 j的样本容量jjMSW11Q2nna临界极差Chap 10-67;.Tukey-Kramer 过程例子1. 计算绝对均值差:Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 20420.2205.8226.0 xx43.4205.8249.2xx23.2226.0249.2xx3231212. 在附录E.8表中找到c = 3 和 (n c) = (15 3) = 12下Q的值 :3.77QChap 10-68;.Tukey-Kramer 过程例子5. 所有的绝对均值差异比临界极差大。因此在5%的显著性水平下每一对的均值有显著性差异。因此,我们有95%的把握
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 方式服务合同中的用户权益3篇
- 旅游服务行业联合投资合同
- 安徽物业行业劳动合同样本3篇
- 工业煤气供应与环保责任合同3篇
- 数据库培训与信息服务合同3篇
- 政府采购合同中的合同变更3篇
- 教育援助实施协议3篇
- 教育扶贫协议3篇
- 教育资源租赁协议3篇
- 文化墙建设招标文件范本3篇
- DB41T2781-2024公路大厚度水泥稳定碎石基层施工技术规程
- 2025年妇产科工作计划
- 报关税费代缴服务合同
- 小学体育新课标培训
- 2024年应急预案知识考试题库及答案(共60题)
- 2024湖南株洲攸县城关国家粮食储备库员工招聘2人历年高频难、易错点500题模拟试题附带答案详解
- Python试题库(附参考答案)
- 有关于企业的调研报告范文(10篇)
- 重庆市康德卷2025届高一上数学期末检测模拟试题含解析
- 君乐宝在线测评题答案
- 2024版《安全生产法》考试题库附答案(共100题)
评论
0/150
提交评论