管理统计学-第4章--假设检验_第1页
管理统计学-第4章--假设检验_第2页
管理统计学-第4章--假设检验_第3页
管理统计学-第4章--假设检验_第4页
管理统计学-第4章--假设检验_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第4章 假设检验,4.1 假设检验的基本原理 4.2 参数假设检验 4.3 非参数假设检验,例: 某种大量生产的袋装食品,按规定每袋重量不得少于250g。 今从一批该种食品中任意抽取50袋,发现有6袋低于250g 。若规定不符合标准的比例达到5,食品就不得出厂,问该批食品能否出厂。 从2000年的新生儿中随机抽取30个,测得其平均体重为3210g,而根据1999年的统计资料,新生儿的平均体重为3190g,问2000年的新生儿与1999年相比,体重有无显著差异。,某健身俱乐部欲根据往年的会员情况,制定2006年的会员发展营销策略。主管经理估计俱乐部会员的平均年龄是35岁,其中2535岁的会员占总

2、人数的70%。研究人员从2005年入会的新会员中随机抽取40人,调查得知他们的平均年龄是32岁,其中2535岁的会员占74%。根据这份调查结果,问主管经理的对会员年龄的估计是否准确?,4.1 假设检验的基本原理,4.1.1 假设检验的定义 4.1.2 假设检验的分类 4.1.3 假设检验的思想方法 4.1.4 原假设和备择假设 4.1.5 假设的两类错误分析 4.1.6 总体参数检验的步骤和方法,4.1.1 假设检验的定义,统计假设:关于总体的分布以及分布中所含参数的各种论断. 假设检验:施加于一个或多个总体的概率分布或参数的假设 假设总体分布的形式或总体的参数有某种特征 判断原先的假设是否合

3、理 合理:承认假设的正确性 不合理:否定原先的假设 对问题作出分析或推断,假设检验的过程和思路 概率意义下的反证法,总体,假设总体的 平均年龄是35岁,样本均值是32岁,样本,样本均值,= 35,基本原理,抽样分布,这是样本均值,如果这是总体均值,判断:拒绝or不拒绝零假设 = 35?,32,H0,4.1.2 假设检验的分类,假设检验包括:参数假设检验和非参数假设检验 参数假设检验:X1,X2,Xn是来自分布形式已知、参数未知总体的样本,由其观测值检验假设H0:=0; H1: 0, 为已知实数 非参数假设检验: X1,X2,Xn是来自分布形式未知总体的样本,由其观测值检验假设H0:F(x)=F

4、0(x, ); H1: F(x) F0(x, ), F0(x, )为已知分布函数,4.1.3 假设检验的基本原理,假设检验的基本思想 提出统计假设,根据小概率原理对其进行检验 实际推断原理/小概率原理 小概率事件 :在某次试验或观测中,出现的概率很小的事件 小概率事件在一次试验中几乎不会发生 小概率事件发生,否定原来的假设,假设检验基本原理,假设检验的基本思想,前提: 承认 原假设,小概率 事件发生,大概率 事件发生,拒绝 原假设,接受 原假设,进行一次实验,4.1.4 原假设和备择假设,假设检验的三种形式 左尾检验、右尾检验和双尾检验 H0为原假设,H1为备择假设,原假设与备择假设的确定,若

5、想支持某种假设,把它作为备择假设,把该陈述的否定假设作为原假设 两种假设互斥且完备,接受H0 ,必须拒绝H1 一个特定形式的H1不只与唯一的H0相对,4.1.5 假设的两类错误分析,4.1.5 假设的两类错误分析,4.1.5 假设的两类错误分析,两类错误的对比情况表 为拒真概率, 为存伪概率,1 为检验功效 控制第一类型错误较为实际,即只分析原假设H0,这样的假设为显著性检验,为显著性水平,两类错误对比情况表,对于一定的样本容量n ,不能同时做到两类错误的概率都很小。如果减小错误,就会增大犯错误的机会;若减小错误,也会增大犯错误的机会。,使、 同时变小的办法就是增大样本容量。,一般地说,哪一类

6、错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。但在假设检验中,一般均首先控制犯错误概率。,两类 错误 关系,4.1.6 总体参数检验的步骤,(1)提出假设 根据检验目标,对待推断的总体参数或分布提出一个基本假设 (2)决定检验的显著性水平 由被检验的统计量分布求出相应的临界值 该临界值为零假设的拒绝域和接受域的分界线 (3)构造检验统计量,依据样本信息计算检验统计量的实际值 (4)将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受零假设的决策 p,不应拒绝零假设,举例1,某健身俱乐部主管经理估计会员的平均年龄是35岁,研究人员从2005年入会的新会

7、员中随机抽取40人,调查得到他们的年龄数据如下。,试根据调查结果判断主管经理的估计是否准确?,提出原假设和备选假设,原假设(Null hypothesis)又称零假设,是需要通过样本推断其正确与否的命题,用H0表示。 本例中可以提出: H0 : m=35;这里m表示总体会员的平均年龄,意味着总体会员的平均年龄与主管经理估计的35岁没有差异。 与原假设对立的假设是备选假设,用H1表示。 在本例中,备选假设意味着“总体会员的平均年龄与主管经理估计的会员平均年龄35岁有显著差异”,可以表示为H1 : m35。 原假设与备选假设互斥,检验结果二者必取其一。,原假设,1. 陈述需要检验的假设 例如: H

8、0: = 35 2. 零假设用 H0 表示 3. 代表“正常”的情形 4. 总是包含等号“=” 5. 检验以“假定原假设为真”开始,备择假设,1. 为原假设的对立情况 例如: H1: 35 2. 备择假设用H1表示 3. 代表“不能轻易肯定的情况” 4. 很少包含等号,确定适当的检验统计量,假设检验需要借助样本统计量进行统计推断,称为检验统计量。不同的假设检验问题需要选择不同的检验统计量。 在具体问题中,选择什么统计量,需要考虑的因素有:总体方差已知还是未知,用于进行检验的样本是大样本还是小样本,等等。 在本例中,由于n=4030是大样本,所以 近似服从正态分布,以样本标准差代替总体标准差,所

9、用的统计量是:,选取显著性水平,确定接受域和拒绝域,显著性水平(Significant Level):事先给定的形成拒绝域的小概率,用a表示。 通常取a=0.01, a=0.05或a=0.10;这表明,当作出接受原假设的决定时,其正确的概率为99%,95%或90%。 拒绝域:原假设 H0 成立条件下,统计量落入的小概率区域。 接受域:统计量能够取值的非拒绝域。 本例为双侧检验,有 接受域:1.96z1.96 拒绝域:z1.96,在实际应用中,一般是先给定了显著性水平,这样就可以由有关的概率分布表查到临界值(critical value) ,从而确定H0的接受域和拒绝域。对于不同形式的假设, H

10、0的接受域和拒绝域也有所不同。,如图所示,双侧检验的拒绝域位于统计量分布曲线的两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,右单侧检验的拒绝域位于统计量分布曲线的右侧。,计算检验统计量的值,在提出原假设H0和备选假设H1,确定了检验统计量,给定了显著性水平a以后,接下来就要根据样本数据计算检验统计量的值。其计算的基本公式为: 上式不是计算检验统计量的唯一公式 在本例中,,作出统计决策,根据样本信息计算出统计量z的具体值,将它与临界值 相比较,就可以作出接受原假设或拒绝原假设的统计决策。 在本例中,由于z=3.1841.96,落在拒绝域内,所以拒绝原假设H0。可以得出结论:在a=0.05的显

11、著性水平下,抽样结果的平均年龄显著低于主管经理的估计值,有理由认为经理的估计不准确。,4.2 参数假设检验,4.2.1 一个正态总体参数假设检验 4.2.2 一个正态总体参数假设检验的SPSS应用 4.2.3 两个正态总体参数假设检验 4.2.4 两个正态总体参数假设检验的SPSS应用,假设检验的内容,假设检验,一个总体均值的 假设检验,s未知,s已知,两个总体均值差 的假设检验,4.2.1 一个正态总体参数假设检验,已知的Z检验,已知的Z检验,1.将样本统计量(如 )转换为标准正态分布Z变量 2.与Z的临界值比较 如Z检验统计量的值落在临界域内则拒绝H0 否则,不能拒绝H0,Z,X,X,x,

12、x,/,已知,均值的双侧Z检验,1.假设 总体服从正态分布; 当(n 30)时,不服从正态分布的总体可以用正态分布来近似。 2.零假设只有“=”号 3.使用Z检验统计量,H0,临界值,临界值,1/2,1/2,样本统计量,拒绝域,拒绝域,非拒绝域,拒绝域,抽样分布,1 ,置信度,举例,2005年北京市职工平均工资为32808元,标准差为3820元。现在随机抽取200人进行调查,测定2006年样本平均工资为34400元。按照5%的显著性水平判断该市2006年的职工平均工资与2005有无显著差异?,解答,在本例题中,我们关心的是前后两年职工的平均工资有没有显著的差异,不涉及差异的方向,因此,本题属于

13、双侧检验。检验过程如下: (1)提出假设: H0:m=32808;H1:m32808; (2)总体标准差s已知,大样本抽样,故选用Z统计量; (3)显著性水平a=0.05,由双侧检验,查表可以得出临界值: 。判断规则为:若z1.96或z-1.96,则拒绝H0;若-1.96z 1.96,则不能拒绝H0。,(4)计算统计量Z的值 (5)检验判断:由于 ,落在拒绝域,故拒绝原假设H0。 结论:以5%的显著性水平可以认为该市2006年的职工平均工资比2005年有明显的差异。,已知,均值的单侧Z检验,1.假设 总数服从正态分布; 当(n 30)时,不服从正态分布的总体可以用正态分布来逼近。 2.零假设只

14、有 或者 号 3.使用Z检验统计量,Z,0,Z,0,拒绝域,拒绝域,H0:0 H1: 0,H0:0 H1: 0,较小的m值与H0不矛盾.,拒绝域,1 - ,1,举例,已知某电子产品的使用寿命服从正态分布,根据历史数据,其平均使用寿命为8000小时,标准差为370小时。现采用新的机器设备进行生产,随机抽取了100个产品进行检测,得到样本均值为7910小时。试问在5%的显著性水平下,新的机器是否合格?,解答,这是一个左单侧检验问题。抽样的目的是为了检测新机器生产的产品的使用寿命是否达到标准,我们比较关心的是使用寿命的下限,如果新产品的使用寿命与过去相比没有明显降低,则说明所使用的新机器合格;反之,

15、则说明新机器不合格。检验过程如下: (1)提出假设: H0:m8000;H1:m8000; (2)总体标准差s已知,大样本抽样,故选用Z统计量; (3)显著性水平a=0.05,由单侧检验,查表可以得出临界值,(4)计算统计量Z的值: (5)检验判断:由于 ,落在拒绝域;故拒绝原假设H0。即认为产品的使用寿命有明显降低,新机器不合格。,未知的大样本检验,1. 假设 总体服从正态分布; 当(n 30)时,不服从正态分布的总体可以用正态分布来近似。 2. 使用Z检验统计量 3. 将样本统计量转换为标准正态分布Z变量 4. 与Z的临界值比较 如Z检验统计量的值落在临界域内则拒绝H0 否则,不能拒绝H0

16、,举例,某乳制品厂生产的一种盒装鲜奶的标准重量是495克。为了检测产品合格率,随机抽取100盒鲜奶,测得产品的平均重量为494克,标准差为6克,试以5%的显著性水平判断这批产品的质量是否合格。,解答,产品的标准重量是495克,过轻或者过重都不符合产品质量标准。检验过程如下: (1)提出假设: H0:m=495;H1:m495; (2)总体标准差s未知,但是由于大样本抽样,故仍选用Z统计量 (3)显著性水平a=0.05,由双侧检验,查表可以得出临界值 (4)计算统计量Z的值,式中用s代替s: (5)检验判断:由于 ,落在接受域;故不能拒绝原假设H0,即不能说明这批产品的不符合质量标准。,未知的小

17、样本检验,1. 假设 总体服从正态分布; 2. 使用t检验统计量 4. t检验的决策规则: 若采用双侧检验,临界值为-ta/2和ta/2 。当-ta/2 t ta/2时,落入接受域,不能拒绝原假设;反之,则拒绝原假设。 若采用左单侧检验,临界值为-ta。当t -ta时,落入拒绝域,拒绝原假设;反之,则不能拒绝原假设。,举例5,沿用例4,对鲜奶产品进行抽样检查,随机抽取10盒产品,测得每盒重量数据如下(单位:克):496、499、481、499、489、492、491、495、494、502。试以5%的显著性水平判断这批产品的质量是否合格。,解答,根据前面的分析,本例题为双侧检验问题。检验过程如

18、下: (1)提出假设: H0:m=495;H1:m495; (2)总体标准差s未知,小样本抽样,故仍选用t统计量; (3)当a=0.05,自由度n-1=9时,由双侧检验,查表可以得出临界值: 计算得: (4)计算统计量t的值: (5)检验判断:由于 ,落在接受域;故不能拒绝原假设H0,即不能说明这批产品不符合质量标准。,未知方差2,检验假设0,提出零假设H0 确定统计量T 已知其分布和参数 统计量的值可以计算 计算统计量T值 给出显著性水平 ,做出决策 TT /2,拒绝H0,未知方差2,检验假设0,为未知方差 2,检验假设: 0的特殊情况 可由题意及统计量T的构成,确定T 0,仅考虑T T/2

19、的情况,例4.1 样品直径均值检验,测得一批零件的20个样品的直径(单位:cm) 假设直径服从正态分布,样本的均值与总体均值显著差别 总体均值为5.20 对样本的数据进行均值检验,One-Sample T Test对话框,AnalyzeCompare meansOne-Samples T test:One-Sample T Test 在Test Value框中输入检验值,Test 列表框,用于输入总体均值,One-Sample T Test: Options对话框,置信度:50,99,默认值95,缺失值的处理方式,剔除计算时涉及变量含有缺失值的case,剔除在任意变量上含有缺失值的case,O

20、ne-Sample T Test输出结果,单样本数据的统计表,数据个数,均值,标准差,均值的标准误差,总体均值,T统计量值,自由度,双尾显著性概率,均值差:样本均值与总体均值之间的差值,均值差的95%置信区间,4.2.3 两个正态总体下的参数假设检验,未知两个总体的均值1、2,检验假设H0:总体方差 未知两个总体的均值1、2,检验假设H0:总体方差 未知两个总体的方差 , 已知 ,检验假设H0:1=2 未知两个总体的方差 , 已知 ,检验假设H0:1=2,未知总体均值1和2 ,检验H0:,统计量 服从F(n-1,m-1)分布 计算统计量F值,与F/2和F1- /2比较,做出决策,未知总体均值1

21、和2 ,检验H0:,统计量 服从F(n-1,m-1)分布 计算统计量F值,与F比较,做出决策,未知总体方差 ,已知 检验H0:1=2,统计量 服从t(m+n-2), n为来自总体X的样本数,m为来自总体Y的样本数 计算统计量F值, tt /2,拒绝H0 tt /2 ,接受H0,未知总体方差 ,已知 检验H0:1=2,统计量 检验过程同未知两个总体的方差 , 已知 ,检验假设H0:1=2 的检验,例4.2 独立样本的t检验,某企业统计了两种不同的膨化食品A和B分别在八家不同超市的日销量(箱) 检验两种膨化食品的日销量是否有显著差异,Independent-Sample T Test对话框,Ana

22、lyzeCompare MeansIndependent-Samples T Test.,Test 列表框,分类变量,Define Groups对话框,不同变量值对应的数据将被用作检验对象,分别将大于等于与小于窗口中数值的数据作为两组进行t检验,One-Sample T Test: Options对话框,置信度:50,99,默认值95,缺失值的处理方式,剔除计算时涉及变量含有缺失值的case,剔除在任意变量上含有缺失值的case,Group Statistics输出表,分组统计表,数据个数,均值,标准离差,均值的标准误差,Independent Samples T Test输出表,方差齐性,方

23、差非齐性,方差非齐性检验,等均值t检验,均值差异标准误差,例4.3 环境对液态产品的影响检验,不同压力环境A和B下的某液态产品的浓度数据 检验不同环境对该液态产品的浓度是否有显著影响(零假设为没有显著影响),Paired-Samples T Test对话框,AnalyzeCompare MeansPaired-Samples T Test,Test 列表框,配对变量,Paired-Samples T Test输出结果,配对样本统计表,配对样本t检验,4.3 非参数假设检验,4.3.1 符号检验法:通过两个相关样本的每对数据之差的符号进行检验,比较两个样本的显著性 配对资料的符号检验 样本中位数

24、与总体中位数比较的符号检验 4.3.2 秩和检验法:一种用样本秩来代替样本值的检验法,可用于检验两个总体的分布函数是否相等的问题 配对试验资料符号秩和检验 非配对试验资料符号秩和检验 4.3.3 非参数假设检验的SPSS应用 卡方检验 柯尔莫哥洛夫-斯米诺夫检验,配对资料的符号检验,提出无效假设与备择假设 H0:甲、乙两个处理差值d总体中位数 0 H1:甲、乙两个处理差值d总体中位数0 进行单尾检验,把“”换成“”或者“” 计算差值并赋予符号 d0,记为“”, “”个数记为n d0,记为“”, “”个数记为n d0,记为“0”, “0”个数记为n0 统计量K min n , n 统计推断 令n

25、 nn KK0.05(n),P0.05,不能否定H0,两个处理差异不显著 K0.01(n)KK0.05(n),0.01P0.05,否定H0,接受H1,两个处理差异显著 KK0.01(n),P0.01,否定H0,接受H1,两个处理差异极显著,提出无效假设与备择假设 H0:样本所在的中位数 已知总体的中位数 H1:样本所在的中位数已知总体的中位数 进行单尾检验,把“”换成“”或者“” 计算差值,确定符号及其个数 样本各观测值中大于已知总体中位数的,记为“”, “”个数记为n 样本各观测值中小于已知总体中位数的,记为“”, “”个数记为n 样本各观测值中等于已知总体中位数的,记为“0”, “0”个数

26、记为n0 统计量K min n ,n 统计推断 令n nn KK0.05(n),P0.05,不能否定H0,样本中位数与已知总体中位数差异不显著 K0.01(n)KK0.05(n),0.01P0.05,否定H0,接受H1,样本中位数与已知总体中位数差异差异显著 KK0.01(n),P0.01,否定H0,接受H1,样本中位数与已知总体中位数差异差异极显著,样本与总体中位数比较的符号检验,配对试验资料符号秩和检验,提出无效假设与备择假设 H0:差值d总体中位数 0 H1:差值d总体中位数0 进行单尾检验,把“”换成“”或者“” 编秩次,定符号 求配对数据的差值d 按d的绝对值从小到大编秩次 根据原差

27、值正负,在各秩次前标正负号 d=0,舍去不记 d的绝对值相等,取其平均秩次 确定统计量T T为正秩次及负秩次和中绝对值较小者 统计推断 令正负差值的总个数为n TT0.05(n),P0.05,不能否定H0,两个处理差异不显著 T0.01(n)TT0.05(n),0.01P0.05,否定H0,接受H1,两个处理差异显著 TT0.01(n),P0.01,否定H0,接受H1,两个处理差异极显著,非配对试验资料符号秩和检验,提出无效假设与备择假设 H0:甲样本所在的总体中位数乙样本所在的总体中位数 H1:甲样本所在的总体中位数乙样本所在的总体中位数 进行单尾检验,把“”换成“”或者“” 求两个样本合并

28、数据的秩次 两个样本的含量为n1和n2,合并后为n1 n2 合并后的数据按从小到大的顺序排列,序号即为数据的秩次 不同样本的观测值相同,取原秩次的平均秩次 同一样本的观测值相同,不必改动 确定统计量T 秩和较小的样本含量记为n1,秩和为T统计量 统计推断 T在T0.05(n1) - T0.05(n2n1)之内 ,P0.05,不能否定H0,两个处理差异不显著 T在T0.05(n1) - T0.05(n2n1)之内外,在T0.01(n1) - T0.01(n2n1) 之内,0.01P0.05,否定H0,接受H1,两个处理差异差异显著 T在T0.01(n1) - T0.01(n2n1) 之外,P0.01,否定H0,接受H1,两个处理差异差异极显著,非参数假设检验方法,AnalyzeNonparametric Tests,非参数假设检验,卡方检验,二项检验,游程检验,K-S检验,两个独立样本的检验,多个独立样本的检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论