统计学第五章假设检验_第1页
统计学第五章假设检验_第2页
统计学第五章假设检验_第3页
统计学第五章假设检验_第4页
统计学第五章假设检验_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 假设检验教学目的:本章阐述假设检验的理论与方法,通过学习使学生能运用两种方法对总体参数估计进行假设检验。教学重点及难点:教学重点:假设检验基本原理和方法。教学难点:原假设与备择假设的设定与理解。主要教学内容及要求:1、理解原假设与备择假设的含义与设定方法;2、理解显著性水平及假设检验的判断标准;3、掌握均值与比例假设检验的方法。章节安排第一节 假设检验原理第二节 一个总体参数的假设检验第三节 两总体参数的假设检验第四节 正性检验第五节 两样本均值的等效检验第一节 假设检验原理一、假设检验的基本思想和步骤(一)假设检验的基本思想 所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集

2、样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。某厂生产一批产品,必须检验合格才能出厂,规定合格率为95%,现从中抽取100件进行质量检查,发现合格率为93%,假设检验就是利用样本指标p=93%的合格率,来判断原来假设P=95%合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品便不能出厂。例1某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是否意味着职工生活水平下降呢

3、?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。例2假设检验也可分为参数检验(Parametric Test)和非参数检验(Nonparametric Test)。当总体分布形式已知,只对某些参数做出假设,进而做出的检验为参数检验;对其他假设做出的检验为非参数检验。(二)假设检验的步骤 1.提出原假设和备择假设原假设(又称零假设)是接受检验的假设,记作H0;备选假设 (又称替代假设)是当原假设被否定时的另一种可成立的假设,记作H1;H0与H1两者是对立的,如H0真实,则H1不真实;如H0不真实,则H1为真

4、实。 H0和H1在统计学中称为统计假设。关于总体平均数的假设有三种情况: (1) H0: =0; H1: 0 (2) H0: 0; H1: 0 以上三种类型,对第一种类型的检验,称双边检验,因为0,包含0和0。而对第二、三种类型的检验,称单边检验。例2.选定检验统计量及其分布例3.选择显著性水平 当原假设H0为真时,却因为样本指标的差异而被拒绝,这种否定真实的原假设的概率就是显著性水平。用表示。例=0.05(即5%)或=0.01(即1%) 假设检验应用小概率事件实际极少发生的原理,这里的小概率就是指。给定了显著性水平,就可由有关的概率分布表查得临界值,从而确定 的接受区域和拒绝区域。临界值就是

5、接受区域和拒绝区域的分界点。4.计算检验统计量 在计算检验统计量时,要注意是双边检验还是单边检验。要根据显著性水平的值确定统计量的拒绝域、接受域及临界值。5.根据样本指标计算的检验统计量的数值作出决策 如果检验统计量的数值落在拒绝域内(包括临界值),就说明原假设H0与样本描述的情况有显著差异,应该否定原假设;如果该数值落在接受域内,就说明原假设H0 与样本描述的情况无显著差异,则应接受原假设。二、单侧检验与双侧检验用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备择假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。 二、

6、单侧检验与双侧检验双侧检验左侧检验右侧检验说明 用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备择假设中的不等式形式与方向。与“不相等”对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验。2022/9/516三、原假设和备择假设的选择 原假设?(null hypothesis)待检验的假设,又称“0假设”研究者想收集证据予以反对的假设3.总是有等号 , 或4.表示为 H0H0: 某一数值 指定为 = 号,即 或 例如, H0:1- 2 0零假设中有“不是”或“没有”这样的字眼2022/9/517 备择假设?(alternative hypothesis)与原

7、假设对立的假设,也称“研究假设”研究者想收集证据予以支持的假设总是有不等号: , 或 表示为 H1H1: 某一数值,或 某一数值例如, H1: 提出假设双侧检验左边检验右边检验说明提出原假设应本着“保守”或“不轻易拒绝原假设”的原则;等号总是出现在原假设的一方。2022/9/519原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)建 议2022/9/520【例】一种零件的生产标准是直径应为10cm,为对生产过程

8、进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设例题分析解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm 2022/9/521【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设例题分析解:研究者抽检的意图是倾向于证实这种洗涤

9、剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0得出拒绝或不拒绝原假设的结论2022/9/545P 值决策(P-value)1、在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和2、反映实际观测到的数据与原假设H0之间不一致的程度3、被称为观察到的(或实测的)显著性水平决策规则:若p值1200 = 0.05n = 100临界值(s):检验统计量: 在 = 0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:Z0拒绝域0.

10、051.6452022/9/561总体均值的检验 (大样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量 已知: 未知:拒绝域P值决策拒绝H02022/9/562总体均值的检验 (小样本)1.假定条件总体服从正态分布小样本(n 30)检验统计量 2 已知: 2 未知:2022/9/563总体均值的检验( 2 未知)(例题分析)【例】某保险公司理赔部称处理每个理赔的平均费用为60元。在与同业比较时发现,该费用高于其他保险公司的水平。因此,该公司采取了成本削减措施。为评估措施的效果,随机选择了26宗理赔个案,得到

11、平均费用为57元,标准差是10元。是否可以说费用削减措施已经奏效?(=0.01) 左侧检验2022/9/564分析 H0: 60H1: =0.01,故不拒绝H0 2022/9/566某加盟连锁店的主管想知道每家连锁店的日平均销售额是否大于400元,显著性水平为0.05。随机察看了172家连锁店,结果平均销售额是407元,标准差为38元。是否可下结论认为总体均值超过400元,或是二者之差7元(407-400=7)归结于随机因素?2022/9/567分析H0: =400H1: 400 = 0.05n = 100临界值(s):检验统计量: 在 = 0.05的水平拒绝H0决策:z01.6451.645

12、0.005拒绝 H0拒绝 H00.0052022/9/568总体均值的检验 (小样本检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0统计量 已知: 未知:拒绝域P值决策拒绝H0注: 已知的拒绝域同大样本2022/9/569二、总体比例假设检验假定条件有两类结果总体服从二项分布可用正态分布来近似比例检验的 Z 统计量P0为假设的总体比例2022/9/570总体比率的检验 (例题分析)【例】2008年某国州长选举中,有位候选人几个月前的支持率是60%。近期的一项调查访问了500人,发现他的支持率变成了55%。显著性水平取

13、0.05,试用p-值方法,检验他的支持率是否下降了?2022/9/571总体比率的检验 (例题分析)H0 :P 60%H1 :P60% = 0.05n = 500临界值(c):检验统计量:不拒绝H0 决策:-2.485t0拒绝域.05第三节 两个总体参数的假设检验两个成组样本总体均值的假设检验两个匹配样本总体均值的假设检验方差不齐时两小样本均值比较2022/9/573两个总体均值之差的检验 (独立大样本)1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和 n230)检验统计量 12 , 22 已知: 12 , 22 未知:2022/9/574两个总体均值之差的检验独立小

14、样本 ( 12, 22 已知)假定条件两个独立的小样本两个总体都是正态分布 12, 22已知检验统计量2022/9/575两个总体均值之差的检验 (独立的小样本12,22 未知但12=22)假定条件两个独立的小样本两个总体都是正态分布12、 22未知但相等,即12=22检验统计量其中:自由度:2022/9/576两个总体均值之差的检验 (12, 22 未知且不相等1222)假定条件两个总体都是正态分布12, 22未知且不相等,即1222样本容量相等,即n1=n2=n检验统计量自由度:2022/9/577两个总体均值之差的检验 (12, 22 未知且不相等1222)假定条件两个总体都是正态分布1

15、2,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量2022/9/5782022/9/579我们假定两个记录均来自独立正态分布总体。由于两个样本的均值分别为 和 ,可以实施下面的检验:序号企业1企业2企业2(改革后)序号企业1企业2企业2(改革后)1341514112515152143134129693352623133327354115914241520530192415142936619332916111217721242817212825813915183122219361220191810141017192420192331例题分析2022/9/580两个总体均值之差的

16、检验 (用Excel进行检验)第1步:将原始数据输入到Excel工作表格中 第2步:选择“工具”下拉菜单并选择“数据分析”选项 第3步:在“数据分析”对话框中选择 “t-检验:双样本等方差 假设”第4步:当对话框出现后 在“变量1的区域”方框中输入第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在“”方框中输入给定的显著性水平(本例为0.05) 在“输出选项”选择计算结果的输出位置,然后“确定” 2022/9/581t-检验: 双样本等方差假设2022/9/582总体均值差的假设检验:独立样本方差方程的 Levene 检验均

17、值方程的 t 检验FSig.tdfSig.均值标准差分的95%置信区间(双侧)差值误差值下限上限假设方差相等.021.8851.00538.3212.7502.736-2.7888.288假设方差不相等1.00537.960.3212.7502.736-2.7888.288方差是否相等均值是否相等因此我们无法拒绝零假设,即不能得出企业1和企业2的产量有本质差异。SPSS两样本均值比较检验是利用t统计量进行假设检验。当样本量很小时,这种方法是合适的。当样本量很大时,t值将近似等于大样本下的z-值并且样本检验结果将依然有效。2022/9/583序号企业1企业2企业2(改革后)序号企业1企业2企业2

18、(改革后)1341514112515152143134129693352623133327354115914241520530192415142936619332916111217721242817212825813915183122219361220191810141017192420192331完全类似于单样本的检验总体均值差的假设检验:配对样本2022/9/584我们(通过软件)按照下面的步骤进行检验。在SPSS中打开数据,选择Analyze-Compare Means-Paried Samples T Test,把“企业2”和“企业2(改革后)”放入Paried Variables,再

19、选OK即可。设置配对变量拒绝t检验的H0 ,认为企业2改革前后平均日产量有显著差异,改革后的日产量更高总体均值差的假设检验:配对样本2022/9/585两个总体均值之差的检验 (用Excel进行检验)第1步:选择“工具”下拉菜单,并选择“数据分析”选项第2步:在分析工具中选择“t检验:平均值的成对二样本分析”第3步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入假设的差值(这里为0) 在“”框内键入给定的显著性水平 2022/9/5862022/9/587两个总体均值之差的检验 (独立大样本)1.假定条件两个样本是独立的随

20、机样本正态总体或非正态总体大样本(n130和 n230)检验统计量 12 , 22 已知: 12 , 22 未知:2022/9/588两个总体均值之差的检验独立小样本 ( 12, 22 已知)假定条件两个独立的小样本两个总体都是正态分布 12, 22已知检验统计量2022/9/589两个总体均值之差的检验 (独立的小样本12,22 未知但12=22)假定条件两个独立的小样本两个总体都是正态分布12、 22未知但相等,即12=22检验统计量其中:自由度:2022/9/590两个总体均值之差的检验 (12, 22 未知且不相等1222)假定条件两个总体都是正态分布12, 22未知且不相等,即122

21、2样本容量相等,即n1=n2=n检验统计量自由度:2022/9/591两个总体均值之差的检验 (12, 22 未知且不相等1222)假定条件两个总体都是正态分布12,22未知且不相等,即1222样本容量不相等,即n1n2检验统计量2022/9/5922022/9/593我们假定两个记录均来自独立正态分布总体。由于两个样本的均值分别为 和 ,可以实施下面的检验:序号企业1企业2企业2(改革后)序号企业1企业2企业2(改革后)134151411251515214313412969335262313332735411591424152053019241514293661933291611121772

22、1242817212825813915183122219361220191810141017192420192331例题分析2022/9/594两个总体均值之差的检验 (用Excel进行检验)第1步:将原始数据输入到Excel工作表格中 第2步:选择“工具”下拉菜单并选择“数据分析”选项 第3步:在“数据分析”对话框中选择 “t-检验:双样本等方差 假设”第4步:当对话框出现后 在“变量1的区域”方框中输入第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在“”方框中输入给定的显著性水平(本例为0.05) 在“输出选项”选择计

23、算结果的输出位置,然后“确定” 2022/9/595t-检验: 双样本等方差假设2022/9/596总体均值差的假设检验:独立样本方差方程的 Levene 检验均值方程的 t 检验FSig.tdfSig.均值标准差分的95%置信区间(双侧)差值误差值下限上限假设方差相等.021.8851.00538.3212.7502.736-2.7888.288假设方差不相等1.00537.960.3212.7502.736-2.7888.288方差是否相等均值是否相等因此我们无法拒绝零假设,即不能得出企业1和企业2的产量有本质差异。SPSS两样本均值比较检验是利用t统计量进行假设检验。当样本量很小时,这种方法是合适的。当样本量很大时,t值将近似等于大样本下的z-值并且样本检验结果将依然有效。2022/9/597序号企业1企业2企业2(改

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论