版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第10章两个样本数值数据假设检验和单向方差分析商务统计学(第5版)1学习目标在本章,你将学到:如何对以下差异进行假设检验两个独立总体的均值差异两个相关总体的均值差异两个独立总体的比例差异两个独立总体的方差差异如何使用单向方差分析对多总体的均值差异进行假设检验如何在单向方差分析中进行多重比较2两个样本检验两个样本检验总体均值,独立样本总体均值,相关样本总体方差均值1与均值2对比同组样本处理前后对比方差1与方差2对比例:总体比例比例1与比例2对比3两个均值之间的差异总体均值,独立样本目标:两个总体均值差异的假设检验或构造置信区间,μ1–μ2
差异的点估计:X1–X2*σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同4两个均值之间的差异:独立样本总体均值,独立样本*用Sp估计未知的σ。
使用混合方差t检验。σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同
用S1
和S2
估计σ1
和σ2。使用不同方差t检验。不同的数据来源不相关独立样本的选择不受总体变化的影响5两个总体均值的假设检验左尾检验:H0:μ1
μ2H1:μ1<μ2即,H0:μ1–μ2
0H1:μ1–μ2
<0右尾检验:H0:μ1≤μ2H1:μ1
>
μ2即,H0:μ1–μ2
≤0H1:μ1–μ2
>0双侧检验:H0:μ1=μ2H1:μ1
≠
μ2即,H0:μ1–μ2
=0H1:μ1–μ2
≠0两个总体均值,独立样本6两个总体均值,独立样本左尾检验:H0:μ1–μ2
0H1:μ1–μ2
<0右尾检验:H0:μ1–μ2
≤0H1:μ1–μ2
>0双侧检验:H0:μ1–μ2
=0H1:μ1–μ2
≠0aa/2a/2a-ta-ta/2tata/2拒绝H0如果tSTAT<-ta拒绝H0如果tSTAT>ta拒绝H0如果tSTAT<-ta/2
或tSTAT>ta/2
μ1–μ2
假设检验7µ1-µ2假设检验,σ1和σ2
未知且相同假设:
样本是随机的独立的
总体是正态分布或者两个样本容量都超过30
总体方差未知,但是假设是相同的*总体均值,独立样本σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同
8混合方差是:检验统计量是:
其中tSTAT
有自由度=(n1+n2–2)(续)*µ1-µ2假设检验,σ1和σ2
未知且相同总体均值,独立样本σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同
9
μ1–μ2的置信区间是:其中tα/2
有自由度=n1+n2–2*µ1-µ2置信区间,σ1和σ2
未知且相同总体均值,独立样本σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同
10混合方差t检验例子你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同?你收集到如下数据:
NYSE
NASDAQ
数据2125样本均值 3.272.53样本标准差1.301.16假设总体接近正态分布且具有等方差,均值是否不同(=0.05)?11混合方差t检验例子:计算检验统计量检验统计量是:(续)H0:μ1-μ2=0i.e.(μ1=μ2)H1:μ1-μ2≠0i.e.(μ1≠μ2)12混合方差t检验例子:确定假设检验H0:μ1-μ2=0即(μ1=μ2)H1:μ1-μ2≠0即(μ1≠μ2)=0.05df=21+25-2=44临界值:t=±2.0154检验统计量:决策:结论:拒绝H0
,a=0.05有证据表明均值不同t0
2.0154-2.0154.025拒绝H0拒绝H0.0252.04013混合方差t检验例子:µ1-µ2的置信区间因为我们拒绝H0,我们能有95%的把握确定µNYSE>µNASDAQ?µNYSE-µNASDAQ,95%置信区间因为0不在区间里,我们有95%的把握确定µNYSE>µNASDAQ14*µ1-µ2假设检验,σ1和σ2
未知且不同总体均值,独立样本σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同
假设:
样本是随机的独立的
总体是正态分布或者两个样本容量都超过30
总体方差未知,但是假设是不相同的15(续)*Excel或Minitab可以用来进行适当的运算µ1-µ2假设检验,σ1和σ2
未知且不同总体均值,独立样本σ1
和σ2
未知,假设相同σ1
和σ2
未知,假设不相同
16相关总体的差异匹对检验
两个相关总体的均值检验样本匹对或组队重复度量(前/后)
使用匹对值间的差异:消除对象间的方差假设:两个总体都是正态分布或者,如果不是正态,则使用大样本相关样本Di=X1i-X2i17相关总体的差异匹对检验第i个差异值表示为Di,
其中相关总体Di=X1i-X2i总体均值差异匹对的点估计是D:n是匹对样本中的对数样本标准差是SD(续)18μD检验统计量是:匹对样本其中tSTAT
自由度是n-1差异匹对检验:确定tSTAT19左尾检验:H0:μD
0H1:μD<0右尾检验:H0:μD≤0H1:μD
>0双侧检验:H0:μD=0H1:μD
≠0匹对样本差异匹对检验:可能假设aa/2a/2a-ta-ta/2tata/2拒绝H0
如果tSTAT<-ta拒绝H0
如果tSTAT>ta拒绝H0如果tSTAT<-ta/2
或tSTAT>ta/2
其中tSTAT
自由度是n-120μD
置信区间是匹对样本其中差异匹对的置信区间21假设你让你的销售人员去“售后服务”训练车间。此训练前后抱怨数会有差异吗?你收集了如下数据:差异匹对检验例子
抱怨数:
(2)-(1)售货员
前(1)
后(2)
差异,
DiC.B. 6
4-2T.F. 20
6-14M.H. 3
2-1R.K. 0
00M.O. 4
0
-4 -21D=Din
=-4.222训练前后抱怨数是否有差异?(
=0.01)?
-4.2D=H0:μD=0H1:μD
0检验统计量:t0.005=±4.604
d.f.=n-1=4拒绝/2
-4.6044.604决策:不拒绝H0(tstat
不在拒绝域)结论:
抱怨数没有大的变化差异匹对检验:求解拒绝/2
-1.66
=.0123两个总体比例目标:
检验某一假设或构造两个总体比例的差异的置信区间,
π1–π2
差异的点估计总体比例假设:
n1π1
5,n1(1-π1)5n2π2
5,n2(1-π2)5
24两个总体比例总体比例总体比例的混合估计是:其中X1
和X2
是样本1和2的观测值在零假设下,我们假设零假设是真的,所以我们假设π1=π2
以及将两个样本估计量混合在一起25两个总体比例总体比例π1–π2
的检验统计量是Z统计量:(续)其中26两个总体比例的假设检验总体比例左尾检验:H0:π1
π2H1:π1<π2即,H0:π1–π2
0H1:π1–π2
<0右尾检验:H0:π1≤π2H1:π1
>
π2即,H0:π1–π2
≤0H1:π1–π2
>0双侧检验:H0:π1=π2H1:π1
≠
π2即,H0:π1–π2
=0H1:π1–π2
≠027两个总体比例的假设检验总体比例左尾检验:H0:π1–π2
0H1:π1–π2
<0右尾检验:H0:π1–π2
≤0H1:π1–π2
>0双侧检验:H0:π1–π2
=0H1:π1–π2
≠0aa/2a/2a-za-za/2zaza/2拒绝H0如果ZSTAT<-Za拒绝H0如果ZSTAT>Za拒绝H0如果ZSTAT<-Za/2
或ZSTAT>Za/2
(续)28两个总体比例的假设检验例子在选举A的时候,男性与女性投赞成票的比例有没有显著性的差异?在一个随机样本中,72个男候选人有36个投赞成票,50个女候选人中有31个投赞成票在显著性水平是0.05下进行检验29假设检验是:H0:π1–π2
=0(两个比例一样)H1:π1–π2
≠0(两个比例有显著性的差异)样本比例是:男: p1=36/72=.50女: p2=31/50=.62总体比例的混合估计是:两个总体比例的假设检验例子(续)30π1–π2
检验统计量是:两个总体比例的假设检验例子(续).025-1.961.96.025-1.31结论:在投票选举时,男性与女性投赞成票的比例没有显著性的差异拒绝H0拒绝H0临界值=±1.96For=.05决策:
不拒绝H031两个总体比例的置信区间总体比例π1–π2
置信区间是:32方差的假设检验两个总体方差的检验F检验统计量H0:σ12=σ22H1:σ12≠σ22H0:σ12≤σ22H1:σ12>σ22*假设 FSTATS12/S22S12=样本1的方差(较大样本方差)n1=来自总体1样本的容量S22=样本2的方差(较小样本方差)n2=来自总体2样本的容量n1–1=分子自由度n2–1=分母自由度其中:33F临界值来自F表有两个自由度:分子和分母其中在F表中,分子自由度确定列分母自由度确定行F分布df1=n1–1;df2=n2–134确定拒绝域H0:σ12=σ22H1:σ12≠σ22H0:σ12≤σ22H1:σ12>σ22F
0
Fα
拒绝H0不拒绝H0拒绝H0
如果FSTAT>FαF
0
/2拒绝H0不拒绝H0Fα/2
拒绝H0
如果FSTAT>Fα/235F检验例子你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同?你收集到如下数据:
NYSE
NASDAQ
个数 21 25均值 3.27 2.53标准差 1.30 1.16NYSE和NASDAQ的方差在
=
0.05水平下有没有差异?36F检验例子求解确定假设检验:H0:σ21=σ22(方差没有差异)H1:σ21≠σ22(方差有差异)确定F临界值,
=0.05:分子d.f.=n1–1=21–1=20分母d.f.=n2–1=25–1=24Fα/2=F.025,20,24=2.3337检验统计量是:0
/2=.025F0.025=2.33拒绝H0不拒绝H0H0:σ12=σ22H1:σ12
≠
σ22F检验例子求解FSTAT=1.256不在拒绝域,所以不拒绝H0(续)结论:
没有足够的证明方差存在差异,在=.05下F
38一般方差分析研究者控制一个或多个观察因素每个因素包含两个或多个水平水平可以是数值的或绝对的不同的水平生成不同的组把每一个组作为来自不同总体的样本观察相关样本间的影响每组是一样的吗?实验设计:收集数据39完全随机设计实验对象指定随机的组假设对象是齐次的仅仅一个因素或独立变量有两个或多个水平单因素的方差分析(ANOVA)40单向方差分析计算三个或更多组的均值差异例:
五个品牌的轮胎在发生事故时预期移动距离的第一第二第三假设总体是正态分布总体有相同方差样本是随机独立的41单向方差分析假设
所有的总体均值是相同的即,不受因素影响(每组间的均值没有变化)
至少一个总体均值是不一样的即,有一个因素影响不意味着所有的总体均值是不同的(有些可能是一样的)42单向方差分析零假设是真的所有的均值是一样的:(没有因素影响)43单向方差分析零假设不是真的至少一个均值是不一样的(影响因素存在)or(续)44方差分离总离差可以分为两部分:SST=TotalSumofSquares
(总离差)SSA=SumofSquaresAmongGroups
(组间离差)SSW=SumofSquaresWithinGroups
(组内离差)SST=SSA+SSW45方差分离总离差
=多因素下独立数据值的总差异(SST)组内离差在某一因素下数据间的差异(SSW)组间离差
=样本均值间的差异(SSA)SST=SSA+SSW(续)46总离差分离因素产生的差异(SSA)随机误差产生的差异(SSW)总离差(SST)=+47总均方其中:
SST=总均方 c=组别的数量 nj=组j的观测值数量 Xij=组j的第i个观测值
X=全局均值(所有数据的均值)SST=SSA+SSW48总离差(续)49组间离差其中:
SSA=组内离差平方和 c=组别数 nj=组j的样本容量
Xj=组j的样本均值
X=全局均值(所有数据的均值)SST=SSA+SSW50组间离差不同组间的差异间均方=SSA/自由度(续)51组间离差(续)52组内离差其中:
SSW=组内平方和 c=组别数 nj=组j的样本容量
Xj=组j的样本均值 Xij=组j的第i个观察值SST=SSA+SSW53组内离差每组间离差相加知道所有的组内均方=SSW/自由度(续)54组内离差(续)55求均值平方均值平方通过相关的自由度划分多方面的均值平方和得到间均方(d.f.=c-1)内均方(d.f.=n-c)总均方(d.f.=n-1)56单向方差分析表离差来源平方和自由度均方(方差)组间c-1MSA=组内SSWn-cMSW=总离差SSTn–1SSAMSAMSWFc=组别数n=所有组的样本容量和df=自由度SSAc-1SSWn-cFSTAT=57单向方差分析F检验统计量检验统计量
MSA
是间均方 MSW
是内均方自由度df1=c–1(c=组别数)df2=n–c(n=所有组的样本容量和)H0:μ1=μ2=…
=μcH1:至少两个总体均值是不一样的58单向方差分析F统计量的解释F统计量是组间离差估计与组内离差估计的比率比率必须是正的df1=c-1代表小的
df2=n-c
代表大的决策:拒绝H0如果FSTAT>Fα,否则不拒绝H00
拒绝H0不拒绝H0Fα59单向方差分析F检验例子你想要知道3个不同高尔夫俱乐部的距离是否不同。在每一个俱乐部使用自动化设备随机的测量了5个距离值。在0.05的显著性水平下,距离均值是否不同?
Club1
Club2
Club3
254 234 200
263 218 222
241 235 197
237 227 206
251 216 20460•••••单向方差分析F检验例子:散点图270260250240230220210200190••••••••••距离
Club1
Club2
Club3
254 234 200
263 218 222
241 235 197
237 227 206
251 216 204俱乐部12361单向方差分析F检验例子计算
Club1
Club2
Club3
254 234 200
263 218 222
241 235 197
237 227 206
251 216 204X1=249.2X2=226.0X3=205.8X=227.0n1=5n2=5n3=5n=15c=3SSA=5(249.2–227)2+5(226–227)2+5(205.8–227)2=4716.4SSW=(254–249.2)2+(263–249.2)2+…+(204–205.8)2=1119.6MSA=4716.4/(3-1)=2358.2MSW=1119.6/(15-3)=93.362FSTAT
=25.275单向方差分析F检验例子计算H0:μ1=μ2=μ3H1:μj
不相同=0.05df1=2df2=12检验统计量:决策:结论:拒绝H0
,在
=0.05有证据表明至少一个μj
与其它值不同0
=.05Fα
=3.89拒绝H0不拒绝H0临界值:Fα
=3.8963SUMMARYGroupsCountSumAverageVarianceClub151246249.2108.2Club25113022677.5Club351029205.894.2ANOVASourceofVariationSSdfMSFP-valueFcritBetweenGroups4716.422358.225.2754.99E-053.89WithinGroups1119.61293.3Total5836.014
单向方差分析Excel输出64
单向方差分析Minitab输出One-wayANOVA:DistanceversusClubSourceDFSSMSFPClub24716.42358.225.280.000Error121119.693.3Total145836.0S=9.659R-Sq=80.82%R-Sq(adj)=77.62%Individual95%CIsForMeanBasedonPooledStDevLevelNMeanStDev-------+---------+---------+---------+--15249.2010.40(-----*-----)25226.008.80(-----*-----)35205.809.71(-----*-----)-------+---------+---------+---------+--208224240256PooledStDev=9.6665Tukey-Kramer过程说出哪个总体均值是显著不同的例:μ1=μ2
μ3在单向方差分析中拒绝同等均值可以成对比较绝对均值差异与临界极差的对比xμ1
=μ2μ366Tukey-Kramer临界极差其中: Qα=分子自由度为c,分母自由度为n-c的学生极差分布的右侧临界值(参见附录E.8表) MSW=内均值 nj
和nj’=组j和组j’的样本容量67Tukey-Kramer过程例子1.计算绝对均值差:
Club1
Club2
Club3
254 234 200
263 218 222
241 235 197
237
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 砼结构施工中的工程量清单编制考核试卷
- 笔的制造业产品创新与研发管理考核试卷
- 陶瓷砖电磁兼容性能评价考核试卷
- 增材制造技术在医疗器械领域的应用考核试卷
- 人教版四年级语文上册《语文园地四》精美课件
- 草地节水灌溉技术考核试卷
- 中国石油华北油田分公司招聘笔试题库2024
- 中国联通内蒙古各分公司招聘笔试题库2024
- 中石油昆仑能源有限公司招聘笔试题库2024
- 紧固件行业数字化设计与仿真分析考核试卷
- 院内按病种分值付费(DIP)专题培训
- 外出参加学术会议及短期进修学习的管理规定
- 河北省医疗保险诊疗项目目录
- 房屋建筑与装饰工程消耗量定额Y
- GB/T 4337-2015金属材料疲劳试验旋转弯曲方法
- GB/T 29407-2012阻燃木材及阻燃人造板生产技术规范
- GB/T 12723-2013单位产品能源消耗限额编制通则
- GB/T 11572-1989船用齿轮箱台架试验方法
- 文博探索节目国家宝藏动态PPT模板
- 自我同一性量表
- 基于PLC电梯控制系统的设计
评论
0/150
提交评论