版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验四 假设检验实验目的:通过此实验熟练掌握如何利用假设检验工具根据不同条件选择相应检验工具进行检验,有助于学习者理解假设检验的过程及结果实验要求:能够运用Excel对总体均值进行假设检验,学会针对实际背景提出原假设和备择假设来检验实际问题,并根据检验结果作出符合统计学原理和实际情况的判断和结论,加深对统计学方法的广泛应用背景的理解假设检验与区间估计两者之间存在密切的关系,二者用的是同一个样本、同一个统计量、同一种分布,所以也可以用区间估计进行假设检验,两者结论是一致的。在Excel中进行假设检验,除可按区间估计过程用公式和逆函数计算外,还备有专用的假设检验工具,包括Z检验工具、T检验工具和F
2、检验工具。使用这些工具,可以直接根据样本数据进行计算,一次给出检验统计量、单尾和双尾临界值以及小于或等于临界值的概率等所需要的数值。实验四主要介绍假设检验工具的使用。一、假设检验的一般过程假设检验主要是根据计算出的检验统计量与相应临界值比较,作出拒绝或接受原假设的决定。根据全国汽车经销商协会报道,旧车的平均销售价格是10192美元。堪萨斯城某旧车经销处的一名经理检查了近期在该经销处销售的100辆旧车。结果样本平均价格是9300美元,样本标准差是4500美元。在0.05的显著性水平下,检验H0: H1:。问:假设检验的结论是什么?这名经理接下来可能会采取什么行动?本例由于样本容量比较大,其均值近
3、似服从正态分布,总体方差未知,需要用样本标准差来代替,选择T统计量进行检验。T统计量的计算公式如下:单击任一空单元格,输入“=(9300-10192)/(4500/SQRT(100)”,回车确认,得出t统计量为-1.982。单击另一空单元格,输入“=TINV(0.025,99)”,回车确认,得出t分布的右临界值为2.276。因为,所以不拒绝原假设,认为此旧车经销处旧汽车平均销售价格不小于10192美元。那么接下来这名经理会采取什么相应行动?(请读者思考)。本例主要介绍了假设检验的一般过程,利用Excel的公式和函数求出相应的统计量值和临界值,最后作出结论。二、假设检验工具的使用接下来介绍如何使
4、用Excel的假设检验工具。使用这一工具应该注意二点:第一,由于现实世界和生活中大量的数据服从正态分布,Excel的假设检验工具是按正态总体设计的(以下各例未特殊说明,认为其服从或近似服从正态分布);第二,Excel的假设检验工具主要用于检验两总体之间有无显著差异。具体来讲,Z检验工具是对方差或标准差已知的两总体均值进行差异性检验;T检验工具是对方差和标准差未知的两总体均值进行差异性检验,其中包括等方差假设检验、异方差假设检验和成对双样本检验;F检验工具是对总体的标准差进行检验。(一)Z检验工具的使用国际航空运输协会对商务旅行者进行调查以确定大西洋两岸过关机场的等级分数。假定:要求50名商务旅
5、行者组成的随机样本给迈阿密机场打分,另50名商务旅行者组成的随机样本给洛杉机机场打分,最高等级为10分。两个样本数据如下:迈阿密机场得分数据:6468776338104878759584385544484562599848995978310896洛杉机机场得分数据:10967879810765735687108478699531896854610983279531035108假定两总体的等级标准差已知(这里用样本标准差代替总体标准差),分别为2.16和2.37。问:在5%的显著性水平下,迈阿密机场和洛杉机机场的平均等级有无差异?将数据分别输入到Excel表中(A2:A51;B2:B51),在“
6、工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“Z检验:双样本平均差检验”,回车进入该工具对话框,如图4-1所示。图4-1 Z检验工具对话框 在“变量1和变量2”的区域框中,分别输入“A1:A51”和“B1:B51”(数据区域)。 “假设平均差(P)框”中,输入“0”。 “变量1的方差和变量2的方差”框中,分别输入“4.68”和“5.63”(总体方差)。 单击“标志(L)”复选框(因为数据区域有列标题);“(A)”框中要求输入显著性水,本例按默认设置0.05即可。 本例选择“输出区域”设置框,在其中输入“C1”。完成以上操作后,回车确认,在指定的区域给出计算结果,见表4-1。表4
7、-1 Z检验计算结果结果解释与分析:1、“平均”为样本均值;“已知协方差”指总体方差;“观察值”为样本个数。2、表中给出的Z统计量为:3、将Z统计量与临界值相比,本例采用双尾比较,所以只能不拒绝原假设,认为两机场等级评分没有差异。当然,也可以将显著性水平与P值比较,如果P值大于显著性水平则不拒绝原假设。(二)T检验工具的使用1、假定两总体的方差相同大学人员安排委员会公布了大学毕业生首次任职薪水数据下表列出了会计专业和财政专业样本每年薪水数据:(单位:千美元)会计 财政28.826.325.3 23.626.225.027.923.027.027.926.224.528.129.024.727.
8、425.223.529.226.929.726.229.324.0采用0.05的显著性水平,检验会计专业和财政专业毕业生首次任职平均年薪是否存在差异?将数据分别输入到Excel表中(A2:A13;B1:B13),在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“t检验:双样本等方差假设”,回车进入该工具对话框,如图4-2所示。图4-2 “t检验:双样本等方差假设”对话框将各子对话框进行相应设置后(具体可参照Z检验),回车确认,在指定的区域给出计算结果,见表4-2。表4-2 “t检验:双样本等方差假设”结果结果解释与分析:(1)合并方差是两样本方差的加权平均数,其计算公式为:(2
9、)df为“自由度”。本例t检验统计量的自由度为12+12-2=22。(3)t Stat是t检验统计量,其计算公式为:(4)将t统计量与临界值比较,本例采用双尾检验,2.23>2.07(0.04<0.05),所以拒绝原假设,认为会计专业和财政专业毕业生首次任职的平均年薪存在显著差异。2、假定两总体的方差不相同现有两种新旧软件包,为了评价新软件包的优点,随机抽取了24个系统分析人员作为样本。其中,12个分析人员用旧软件包来开发指定信息系统,另外12个人用新软件包来开发,得到其开发使用时间(数据如下表)。在5%的显著性水平下,问:新软件包是否可以缩短完成项目的平均时间。旧软件包 新软件包
10、299 315360 200276 214310 263340 334388 344277 282365 307281 290315 288378 318310301这是一个两总体均值的假设检验问题,用表示“使用旧软件包开发指定系统所需的平均时间”,表示“使用新软件包开发指定系统所需的平均时间”。则此问题转变为:H0: H1:假设两总体的方差不相同,则应从“分析工具”列表中选择“t检验:双样本异方差假设”,回车进入该工具对话框,如图4-3所示。图4-3“t检验:双样本异方差假设”对话框将各子对话框进行相应设置后,回车确认,在指定的区域将给出计算结果,如表4-3所示。结果解释与分析:(1)自由度
11、df计算公式为: df=表4-3 “t检验:双样本异方差假设”结果(2)t统计量的公式计算为:t=(3)将t统计量与临界值相比,本例为单尾检验2.16>1.72(0.02<0.05),所以拒绝原假设,认为新软件包开发指定系统的时间要少于旧软件包。3、基于成对数据的t检验在使用T检验工具的介绍中,上面两个例子其样本都是独立样本。然而在可能情况下采用相关样本,可以进一步提高效率。当然其检验方式也有所不同。每月读书俱乐部成员进行了一项调查以确信是否其成员用于看电视的时间比读书时间多(辛辛那提问询报,1991年11月21日)。假定:从这次调查对象中抽取了一个小样本,得到了每周收看电视小时数
12、和每周读书小时数的数据,数据如下表。应答者看电视读书d1106421416-2316884181085151056148671014-481214-2947-310880111651112510-5138351419109151165 *d列为应答者看电视与读书的时间差问:在0.05的显著性水平下,能否得出每月读书俱乐部成员每周用于收看电视比用于读书的时间平均来说要多的结论?对于成对数据的检验,“分析工具”列表中也提供了相应检验工具,选择“t检验:成对二样本均值分析”,打开其对话框,如图4-4所示。将各子对话框进行相应设置后,回车确认,在指定的区域将给出计算结果,如表4-4所示。图4-4 “t
13、检验:成对二样本均值分析”对话框结果解释与分析:(1)此分析方法的原理实际上是对d列数据进行t检验,问题转化为: H0: H1:(2)df自由度=15-1=14,t Stat为检验统计量,其计算公式为: t= 其中,分别为的样本均值和样本方差。(3)泊松相关系数应为“皮尔逊相关系数”,反映两组数据线性相关程度。(4)将t Stat统计量与临界值相比,本例为单尾检验2.23>1.76(0.02<0.05),所以拒绝原假设,认为每月读书俱乐部成员每周用于收看电视比用于读书的时间平均来说要多。表4-4 “t检验:成对二样本均值分析”结果(三)F检验工具在上例中,假设两个总体,即旧软件包和
14、新软件包开发指定系统所需时间的方差不同,接下来,在0.05的显著性水平下检验这一结论是否正确,需要用到F检验工具。从“分析工具”列表中选择“F检验:双样本方差”,回车进入该工具对话框,如图4-5所示。图4-5 “F检验:双样本方差”对话框将各子对话框进行相应设置后,回车确认,在指定的区域将给出计算结果,如表4-5所示。表4-5 “F检验:双样本方差”结果结果解释与分析:1、“F检验工具”的原假设和备择假设分别为: H0: H1:2、因为两个样本容量相同,所以F检验的第一自由度和第二自由度相同,都为11。3、F统计量的计算公式为: F=4、如果原假设H0:,则F统计量的计算公式变为: F=,其值
15、为表4-5中F统计量的倒数,当然临界值也要改变。5、将F统计量与临界值相比,0.83>0.35,所以拒绝原假设,认为新软件包开发指定系统所需时间的方差不小于旧软件包。实验五 方差分析实验目的:熟练使用“方差分析”工具在假设检验的基础上,对影响均值的各个因素进行分析。实验要求:对房产分析的结果能够作出正确合理的解释,包括对“SUMMAY”部分,方差分析部分从而判断该因素各水平是否对观测变量有显著影响,并作出相应的决策。实验四介绍了假设检验,其中用了较多的篇幅介绍了两个总体之间均值的显著性检验,实际中还会遇到多个总体均值的检验问题。如果按实验四的方法两两进行检验,将十分麻烦,并且部分总体有差
16、别能否表明有总的差别,仍有待解决。方差分析(Analysis of variance,简称ANOVA)能够解决多个均值是否相等的检验问题,其由于在分析时将所有的样本资料结合在一起,从而使检验的稳定性增强,并且可以节省大量的时间。方差分析作为一种实用、有效的分析方法在实践中被广泛的应用。本部分主要介绍如何使用Excel中的数据分析工具进行方差分析。一、单因素方差分析单因素方差分析是在事物变化的若干因素中,只就某一特定因素分析,其它因素尽可能不变。对从事营销的人员进行一项调查,以研究他们的职业道德标准观念。假定下表是从研究中所获得的数据(高分表示道德标准高),如表5-1所示。在0.05的显著性水平
17、下,检验三组人员的观念是否存在显著差异。表5-1 研究数据将数据输入表单后,在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“方差分析:单因素方差分析”,回车进入该工具对话框,如图5-1所示。图5-1 “方差分析:单因素方差分析”对话框 在“输入区域(I)”框中,输入数据所在的区域,本例为A1:C7。 “分组方式”按默认的列;因有列标题,所以选择“标志位于第一行(L)”的复选框。 要求输入显著性水平,本例按默认设置即可。 输出选项本例选择“新工作表(P)”(因输出内容比较多)。完成以上设置后,回车确认,结果见表5-2。表5-2 “方差分析:单因素方差分析”输出结果结果解释与分析
18、:1、SS表示平方和。组间SS(用SSA表示),计算公式为: ;组内SS(用SSE表示),计算公式为:2、df为自由度。SSA的自由度为k-1,其中k为因素水平的个数,SSE的自由度为n-k。 3、MS为平均平方。组间MS(用MSA表示),计算公式为:;组内MS(用MSE表示),计算公式为:。4、F统计量为:5、将F统计量的值与给定显著性水平的临界值相比,本例7>3.68,所以拒绝原假设,认为三种营销人员观念有差异。也可以将给出的P检验值与显著性水平比较,结论相同。二、无重复(无交互作用)双因素的方差分析双因素方差分析的内容是在影响事物变化的各种因素中选定两个因素,就其不同水平进行交叉的
19、全面检测,分析究竟是一个因素在起作用,还是两个因素都起作用,或是两个因素的影响都不起作用。进行双因素分析时,其各因素的不同水平可以重复测试(有交互作用),也可以不重复测试(无交互作用)。本部分介绍无重复(交互作用)双因素分析。有四个品牌的彩电在五个地区销售,为分析彩电的品牌(因素A)和销售地区(因素B)对销售量是否有影响,对每个品牌在各地区的销售量取得以下数据,见表5-3。表5-3 不同品牌的彩电在各地区的销售量数据试分析品牌和销售地区对彩电的销售量是否有显著影响(显著性水平为0.05)?从“分析工具”列表中选择“方差分析:无重复双因素分析”,回车进入该工具对话框,如图5-2所示。图5-2 “
20、方差分析:无重复双因素分析”对话框在“输入区域(I)”框中输入数据所在的区域,本例为A2:F6,并选定“标志(L)”复选框。 取默认值0.05。 在输出选项中,选择“新工作表”。 完成以上设置后,回车确认,结果见表5-4。结果解释与分析: 1、行为因素A,列为因素B。各因素和误差项的(离差)平方和计算公式分别为:;2、三个平方和的自由度(df)分别是:因素A的离差平方和SSA的自由度为 k-1因素B的离差平方和SSB的自由度为 r-1随机误差平方和SSE的自由度为 (k-1)×(r-1) 3、因素A、B以及误差项的均方(MS),计算公式分别为:;4、因素A和因素B的检验统计量(F统计
21、量),计算公式分别为:;5、将各因素检验统计量与给定显著性水平下的临界值相比(或P值与显著性水平相比):FA=18.11>3.49(0.00<0.05);FB=2.10<3.26(0.14>0.05)。说明彩电的品牌对销售量有显著的影响作用,销售地区对彩电的销售量没有显著影响。表5-4 “方差分析:无重复双因素分析”结果三、可重复(有交互作用)双因素的方差分析在有些情况下,需要对因素间的交互效应做检验,这时需要进行“可重复双因素方差分析”,即每个因素必须重复取样至少2次以上。在0.05的显著性水平,检验不同燃料(因素A)、不同推进器(因素B)下的火箭射程是否有显著差异?
22、交互作用是否显著?实验数据见表5-5。表5-5 实验数据从“分析工具”列表中选择“方差分析:可重复双因素分析”,回车进入该工具对话框,如图5-3所示。 在“输入区域(I)”要求输入数据所在的区域,本例为“A2:D10”。 “每一样本的行数(R)”,即重复实验的次数,本例为“2”。 取默认值0.05。 在输出选项中,选择“新工作表”。完成以上设置后,回车确认,结果见表5-5,5-6。图5-3“方差分析:可重复双因素分析”对话框表5-5 基本统计数据SUMMARYB1B2B3总计A1计数2226求和110.80 97.40 126.10 334.30 平均55.40 48.70 63.05 55.
23、72 方差15.68 112.50 10.13 68.91 A2计数2226求和91.90 104.60 100.00 296.50 平均45.95 52.30 50.00 49.42 方差19.84 6.48 5.12 14.56 A3计数2226求和118.40 144.10 79.90 342.40 平均59.20 72.05 39.95 57.07 方差1.62 2.64 1.13 209.89 A4计数2226求和147.30 109.20 90.10 346.60 平均73.65 54.60 45.05 57.77 方差9.24 25.92 26.65 181.97 表5-6 基本统计数据(续表)总计计数888求和468.40 455.30 396.10 平均58.55 56.91 49.51 方差120.09 113.42 90.39 表5-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 货物储存保管合同范例
- 《基质金属蛋白酶9基因多态性与COPD易感性的关系研究》
- 2024年农村土地承包权抵押担保贷款合同3篇
- 2024年新能源汽车租赁调车与充电服务合同3篇
- 2024版地下车库租赁与城市地下空间开发合同3篇
- 2024年0号柴油居间代理合同违约责任约定3篇
- 2024年标准股权转让合同书模板版
- 2024年度绿色节能型商品房预售合同标准文本3篇
- 2024年土地流转与农业废弃物资源化利用合同示范文本9篇
- 2024年版的医疗器械销售协议2篇
- 厨房排油烟不锈钢风管施工方案
- 南京大学在校学生校史知识认知情况调查问卷
- 道德与法治中考备考建议课件
- 财产保险退保申请范文推荐6篇
- 食品工程原理课程设计
- YYT 0325-2022 一次性使用无菌导尿管
- 羊膜在眼科临床中应用课件
- (71)第十五章15.2.3整数指数幂1-负整数指数幂-导学案
- 初步设计方案询价表
- 2022年江苏省环保集团有限公司招聘笔试题库及答案解析
- 《汽车焊接技术》试卷期末理论考试含参考答案一套
评论
0/150
提交评论