版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计假设检验统计假设检验假设检验假设检验第一节、假设检验概述第一节、假设检验概述第二节、总体平均数的假设检验(第二节、总体平均数的假设检验(Z 、 T)第三节、总体比率的假设检验(第三节、总体比率的假设检验(P)第四节、总体方差的假设检验(卡方、第四节、总体方差的假设检验(卡方、F)第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则 Ronald Ronald Aylmer Fisher, Aylmer Fisher,英英国著名的统计学家,遗传学家,国著名的统计学家,遗传学家,
2、现代数理统计的奠基人之一。现代数理统计的奠基人之一。 他在抽样分布理论、相关回他在抽样分布理论、相关回归分析、多元统计分析、最大归分析、多元统计分析、最大似然估计理论,方差分析和假似然估计理论,方差分析和假设检验有很多的建树。设检验有很多的建树。女士品茶女士品茶20世纪世纪20年代后期在年代后期在英国剑桥英国剑桥一个夏日的下午,一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。坐在户外的桌旁享用下午的奶茶。奶茶奶茶一般是由牛奶和茶混合而成的,调制时候可一般是由牛奶和茶混合而成的,调制时候可以先倒茶后倒牛奶,也可以先
3、倒牛奶后倒茶。这以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。制出来的奶茶。那么如何检验这位女士的说法?为此那么如何检验这位女士的说法?为此Fisher进行进行了研究,从而提出了假设检验的思想。了研究,从而提出了假设检验的思想。1、推广素质教育以后,教学效果是不是有所提高?推广素质教育以后,教学效果是不是有所提高?(教育统计教育统计)2、某种新胃药是否比以前更有效?(某种新胃药是否比以前更有效?(卫生统计卫生统计)3、醉酒驾车认定为刑事犯罪后是否交通事故会减少?、醉酒驾车认定为刑事犯罪后是否交通事故会
4、减少?(司法统计司法统计)4、如何检测某批种子的发芽率?(、如何检测某批种子的发芽率?(农业统计农业统计)5、海关工作人员如何判定某批产品能够通关?(、海关工作人员如何判定某批产品能够通关?(海海关统计关统计)6、红楼梦红楼梦后后40回作者的鉴定(回作者的鉴定(文学统计文学统计)。)。7、民间借贷的利率为多少?(、民间借贷的利率为多少?(金融统计金融统计)8、兴奋剂检测(、兴奋剂检测(体育统计体育统计) 1 1、假设检验的基本思想、假设检验的基本思想 为研究某山区的成年男子的脉搏均数是否高于一般为研究某山区的成年男子的脉搏均数是否高于一般成年男子脉搏均数,某医生在一山区随机抽查了成年男子脉搏均
5、数,某医生在一山区随机抽查了25名名健康成年男子,得其脉搏均数健康成年男子,得其脉搏均数x为为74.2次次/分,标准差分,标准差为为6.0次次/分。根据大量调查已知一般健康成年男子脉分。根据大量调查已知一般健康成年男子脉搏均数为搏均数为72次次/分,能否据此认为该山区成年的脉搏分,能否据此认为该山区成年的脉搏均数均数高于一般成年男子的脉搏均数高于一般成年男子的脉搏均数0? 问题问题1:造成这造成这25名男子脉搏均数高于一般男子的原因名男子脉搏均数高于一般男子的原因是什么?是什么? 问题问题2 2、怎样判断以上哪个原因是成立的?、怎样判断以上哪个原因是成立的? 若若x x与与0 0接近,其差别可
6、用抽样误差解释,接近,其差别可用抽样误差解释,x x来自于来自于0 0 ; 若若x x与与0 0相差甚远,其差别不宜用抽样误差解释,则怀疑相差甚远,其差别不宜用抽样误差解释,则怀疑x x不不属于属于0 0 。由资料已知样本均数与总体均数不等,原因有二:由资料已知样本均数与总体均数不等,原因有二: (1 1)两者非同一总体,即两者差异由地理气候等因素造成)两者非同一总体,即两者差异由地理气候等因素造成,也就是可以说高山成年人的脉搏比一般人的要高;,也就是可以说高山成年人的脉搏比一般人的要高; (2 2)两者为同一总体,即两者差异由抽样误差造成)两者为同一总体,即两者差异由抽样误差造成。检验如下假
7、设:检验如下假设:原假设原假设: :高山成年人脉搏与一般人的脉搏没有差异:高山成年人脉搏与一般人的脉搏没有差异:= = 0 0备择假设备择假设: :高山成年人脉搏与一般人的脉搏有差异:高山成年人脉搏与一般人的脉搏有差异: 0 0假设检验的基本概念假设检验的基本概念概念概念事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设然后利用然后利用样本样本信息来以一定的信息来以一定的概率概率判断原假设是否成判断原假设是否成立立参数检验和非参数检验(第参数检验和非参数检验(第8章的内容)章的内容)作用作用一般是对有差异的数据进行检验,判断差异是否显著一般是对有差异的数据进行检验,判断差
8、异是否显著(概率)(概率)如果通过了检验如果通过了检验, ,不能拒绝原假设不能拒绝原假设, ,说明没有显著差异,说明没有显著差异,那么这种差异是由抽样造成的那么这种差异是由抽样造成的如果不能通过检验如果不能通过检验, ,则拒绝原假设则拒绝原假设, ,说明有显著差异,说明有显著差异,这种差异是由系统误差造成的这种差异是由系统误差造成的. .证伪不能存真证伪不能存真. .第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则二、假设检验的步骤二、假设检验的步骤 1、根据具体的问题,建立
9、原假设和备择假设根据具体的问题,建立原假设和备择假设 2、构造一个合适的统计量,计算其抽样分布、构造一个合适的统计量,计算其抽样分布 (均值检验)(均值检验) 3、给定显著水平、给定显著水平 和确定临界值和确定临界值 。 显著水平显著水平 通常取通常取0.1、0.05或或0.01。在确定了显著水平在确定了显著水平后,根据统计量的分布就可以确定找出接受区域和拒绝后,根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值。区域的临界值。 4、根据样本的值计算统计量的数值并作出决策。、根据样本的值计算统计量的数值并作出决策。 如果如果统计量的值落在拒绝域中统计量的值落在拒绝域中,那么就没有通过检验
10、,那么就没有通过检验,说明有显著差异,拒绝原假设。说明有显著差异,拒绝原假设。 如果如果统计量的值落在接受域中统计量的值落在接受域中,通过了假设检验,说明,通过了假设检验,说明这种差异是由于抽样造成,这个样本不能拒绝原假设。这种差异是由于抽样造成,这个样本不能拒绝原假设。/xZn 1()/nxtsn 1、原假设与备择假设、原假设与备择假设原假设原假设(null hypothesis) :一般研究者想收集证据予以反对一般研究者想收集证据予以反对的假设。表示为的假设。表示为H H0 0备择假设备择假设(alternative hypothesis):一般研究者想收集证据一般研究者想收集证据予以支持
11、的假设。表示为予以支持的假设。表示为H H1 1由于假设检验中只有在小概率事件发生的情况下才拒绝原由于假设检验中只有在小概率事件发生的情况下才拒绝原假设,因此在假设检验过程中是保护原假设的。假设,因此在假设检验过程中是保护原假设的。有三种形式:有三种形式:(1)双侧检验双侧检验 H0: 0,H1: 0(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0: 0 , H1 : 0 (提高,增加)(提高,增加)采用哪种形式要根据实际问题。采用哪种形式要根据实际问题。某种饮料的易拉罐瓶的标准容量为某种饮料的易拉罐瓶的标准容量为335335毫升,为对生毫升,为对生产过程进行控制,质量监测人员
12、定期对某个分厂进产过程进行控制,质量监测人员定期对某个分厂进行检查,确定这个分厂生产的易拉罐是否符合标准行检查,确定这个分厂生产的易拉罐是否符合标准要求。如果易拉罐的平均容量大于或小于要求。如果易拉罐的平均容量大于或小于335335毫升,毫升,则表明生产过程不正常。试陈述用来检验生产过程则表明生产过程不正常。试陈述用来检验生产过程是否正常的原假设和备择假设是否正常的原假设和备择假设研究者想收集证据予以证明的假设应该是研究者想收集证据予以证明的假设应该是“生产过程不正常生产过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为 H0 : 335ml H1 : 335ml 消费者协会接到
13、消费者投诉,指控品牌纸包装消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为上标明的容量为250毫升。消费者协会从市场上毫升。消费者协会从市场上随机抽取随机抽取50盒该品牌纸包装饮品进行假设检验。盒该品牌纸包装饮品进行假设检验。试陈述此假设检验中的原假设和备择假设。试陈述此假设检验中的原假设和备择假设。解:消费者协会的意图是倾向于证实饮料厂包装解:消费者协会的意图是倾向于证实饮料厂包装饮料小于饮料小于250ml 。建立的原假设和备择假设为。建立的原假设和备择假设为 H0 : 250ml H1 : H H1 1成
14、立成立 小概率事件发生小概率事件发生 拒绝拒绝H H0 0成成立立没有发现矛盾没有发现矛盾 证明失败证明失败小概率事件没有发生小概率事件没有发生 不能不能拒绝拒绝H H0 0成立成立 小概率事件小概率事件在一次实验中不可能发生的事件,如果发生在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。了,那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人泰力布:等待黑天鹅的人显著性水平和拒绝域显著性水平和拒绝域( (单侧检验单侧检验 ) )拒绝域拒绝域接受域接受域显著性水平和拒绝域显著性水平和拒绝域( (左侧检验左侧检验 ) )显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验 )【
15、例2】一种罐装饮料采用自动生产线生产,每罐的容量一种罐装饮料采用自动生产线生产,每罐的容量是是255ml,标准差为,标准差为5ml,服从正态分布。换了一批工人后,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了质检人员在某天生产的饮料中随机抽取了16罐进行检验,罐进行检验,测得每罐平均容量为测得每罐平均容量为257.2ml。取显著性水平。取显著性水平 =0.05 ,检,检验该天生产的饮料容量是否增加了?验该天生产的饮料容量是否增加了?H0 : 255 H1 : 2550257 22551 76516xzn. 决策:拒绝决策:拒绝H0结论:样本提供的证据表明:该天结论:样本提供
16、的证据表明:该天生产的饮料与标准有显著差异,可生产的饮料与标准有显著差异,可以认为换工人后容量增加了。以认为换工人后容量增加了。显著性水平和拒绝域显著性水平和拒绝域( (右侧检验右侧检验 ) )显著性水平和拒绝域显著性水平和拒绝域( (右侧检验右侧检验 ) )第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则三、两类错误和假设检验的规则三、两类错误和假设检验的规则1. 第第类错误类错误(弃真错误弃真错误) 原假设为真时拒绝原假设原假设为真时拒绝原假设 第第类错误的概率记为类错误
17、的概率记为 被称为显著性水平被称为显著性水平2. 第第类错误类错误(取伪错误取伪错误) 原假设为假时未拒绝原假设原假设为假时未拒绝原假设 第第类错误的概率记为类错误的概率记为(Beta)(Beta)陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪有罪有罪错误错误正确正确无罪无罪正确正确错误错误H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假拒绝拒绝H0第第类错类错误误( ( ) )正确决策正确决策(1-(1-b b ) )未拒绝未拒绝H0正确决策正确决策(1 ) )第第类错类错误误(b b ) )假设检验就假设检验就好像一场审判过程好像一场审判过程真药真药假药假药拒绝
18、拒绝拒绝域大拒绝域大 大大弃真弃真正确正确不拒绝不拒绝 正确正确接受域小接受域小b b小小取伪取伪宁可错杀三千,不可放过一个。宁可错杀三千,不可放过一个。好机会好机会不好的机不好的机会会拒绝拒绝( (不去不去) )拒绝域小拒绝域小 小小正确正确不拒绝不拒绝( (去去) )正确正确接受域大接受域大 b b大大 错误和错误和 b b 错误的关系错误的关系你不能同时减少你不能同时减少两类错误两类错误!只能只能增加样本容量。增加样本容量。 和和b b 的关系就像的关系就像翘翘板,翘翘板, 小小b b 就就大,大, 大大b b 就小就小 四、置信区间与假设检验之间的关系四、置信区间与假设检验之间的关系1
19、 1、根据置信度、根据置信度1- 1- 构造置信区间,如果统计量落在构造置信区间,如果统计量落在置信区间中,那么接受原假设,如果不在置信区间中置信区间中,那么接受原假设,如果不在置信区间中,那么拒绝原假设。,那么拒绝原假设。2 2、根据显著水平、根据显著水平 ,可以构建置信度为,可以构建置信度为1- 1- 的置的置信区间。信区间。一个总体的检验一个总体的检验Z 检验检验(单侧和双侧)(单侧和双侧) t 检验检验(单侧和双侧)(单侧和双侧)Z 检验检验(单侧和双侧)(单侧和双侧) 2 2检验检验(单侧和双侧)(单侧和双侧)均值均值一个总体一个总体比例比例方差方差第二节第二节 总体均值的检验总体均
20、值的检验一、单个总体均值的检验一、单个总体均值的检验(Z TZ T)二、二、两个总体均值检验(等方差、异方差)(等方差、异方差)三、两个非正态总体均值之差的检验(成对检验)一、单个正态总体均值的检验一、单个正态总体均值的检验确定检验统计量的因素:确定检验统计量的因素: 1 1、样本容量的大小、样本容量的大小 2 2、总体分布形状、总体分布形状 3 3、总体方差是否已知、总体方差是否已知主要情形(主要情形(6 6种)种)正态总体(方差未知,且为小样本,正态总体(方差未知,且为小样本,1 1种种)正态总体(方差已知,小样本,正态总体(方差已知,小样本,1 1种种)大样本(不论总体是否正态,不论方差
21、是否已大样本(不论总体是否正态,不论方差是否已知,知,4 4种种)三种假设检验的形式三种假设检验的形式(双侧,左侧和右侧)(双侧,左侧和右侧)(一)总体平均数的检验(小样本,正态,方差已(一)总体平均数的检验(小样本,正态,方差已知知)1. 假定条件假定条件总体服从正态分布总体服从正态分布小样本小样本( (n n 30)30),但是总体方差已知,但是总体方差已知2. 检验统计量检验统计量) 1 , 0 (0Nnxz某机床厂加工一种零件,根据经验知道,该厂加工零件的某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为椭圆度近似服从正态分布,其总体均值为 0 0=
22、0.081=0.081mmmm,总,总体标准差为体标准差为= 0.025 = 0.025 。今换一种新机床进行加工,抽取。今换一种新机床进行加工,抽取n n=200=200个零件进行检验,得到的椭圆度为个零件进行检验,得到的椭圆度为0.0760.076mmmm。试问新。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(机床加工零件的椭圆度的均值与以前有无显著差异?( 0.050.05)H0: = 0.081,H1: 0.081, = 0.05,n = 200临界值临界值(s)(双侧检验双侧检验)83. 2200025. 0081. 0076. 00nxz均值的单侧均值的单侧 Z Z 检验检
23、验根据过去大量资料,某厂生产的灯泡的使用寿命根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布服从正态分布NN(1020(1020,1001002 2) )。现从最近生产的。现从最近生产的一批产品中随机抽取一批产品中随机抽取1616只,测得样本平均寿命为只,测得样本平均寿命为10801080小时。试在小时。试在0.050.05的显著性水平下判断这批产的显著性水平下判断这批产品的使用寿命是否有显著提高?品的使用寿命是否有显著提高?( ( 0.05)0.05)H0 : 1020 H1 : 10200108010202 410016.xzn 决策:决策:拒绝拒绝H0结论:样本提供的证据表明:该天
24、结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可生产的饮料与标准有显著差异,可以认为试用寿命提高了。以认为试用寿命提高了。总体均值的检验总体均值的检验(z检验检验) (P 值的计算与应用值的计算与应用)第1步:进入进入Excel表格界面,直接点击表格界面,直接点击“f(x)”(粘粘贴贴 函数函数)第2步:在函数分类中点击在函数分类中点击“统计统计”,并在函数名,并在函数名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值2.4录入,得到的函数值为录入,得到的函数值为 0.9918 P值值= 1-0.9918= 0.0082 P值小
25、于值小于 ,故拒绝,故拒绝H0总体均值的检验总体均值的检验(z检验检验) (P 值的图示值的图示)0.0082【例3】一种罐装饮料采用自动生产线生产,每罐的容量一种罐装饮料采用自动生产线生产,每罐的容量是是255ml,标准差为,标准差为5ml,服从正态分布。换了一批工人后,服从正态分布。换了一批工人后,质检人员在某天生产的饮料中随机抽取了质检人员在某天生产的饮料中随机抽取了16罐进行检验,罐进行检验,测得每罐平均容量为测得每罐平均容量为252.8ml。取显著性水平。取显著性水平 =0.05 ,检验,检验该天生产的饮料容量是否减少了?该天生产的饮料容量是否减少了?H0 : 255 H1 : 25
26、50252 82551 76516xzn. 决策:在决策:在0.05水平上拒绝水平上拒绝H0结论:样本提供的证据表明:该天结论:样本提供的证据表明:该天生产的饮料与标准有显著差异,可生产的饮料与标准有显著差异,可以认为换工人后容量减少了。以认为换工人后容量减少了。总体均值的检验总体均值的检验(z检验检验) (P 值的计算与应用值的计算与应用)第1步:进入进入Excel表格界面,直接点击表格界面,直接点击“f(x)”(粘粘贴贴 函数函数)第2步:在函数分类中点击在函数分类中点击“统计统计”,并在函数名,并在函数名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z
27、 的绝对值的绝对值-1.76录入,得到的函数值为录入,得到的函数值为 0.039204 P值值= 0.039204 P值小于值小于 ,故拒绝,故拒绝H0总体均值的检验总体均值的检验(z检验检验) (P 值的图示值的图示).039204总体均值的检验规则总体均值的检验规则 (正态,正态,小小样本,方差已知样本,方差已知)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : = 0 0H1 : 0 0H0 : = 0 0H1 : 0 0统计量统计量 已知已知拒绝域拒绝域P值决策值决策拒绝拒绝H0nxz0P2/zz zzzz 练习一练习一(二)总体平均数检验(小样本,正态
28、,方差未知(二)总体平均数检验(小样本,正态,方差未知* * *)1. 假定条件假定条件总体服从正态分布总体服从正态分布小样本小样本( (n n 30)30),但总体方差未知,但总体方差未知2.检验统计量检验统计量01xtt nsn () 总体均值的检验总体均值的检验规则规则 ( (正态,方差未知,小样本情形正态,方差未知,小样本情形) )假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : = 0 0H1 : 0 0H0 : 0 0H1 : 0 0统计量统计量总体总体 未知未知拒绝域拒绝域P P值决策值决策拒绝拒绝H0nsxt0) 1(2/ntt) 1( ntt)
29、 1( nttP【例1】某机器制造的肥皂厚度规定为某机器制造的肥皂厚度规定为5cm,假设肥皂厚,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取度服从正态分布。今欲了解机器性能是否良好,取16块肥块肥皂为样本,测得平均厚度为皂为样本,测得平均厚度为5.2cm,标准差为,标准差为0.4cm。问在。问在显著水平为显著水平为0.05的水平下,机器是否为良好?的水平下,机器是否为良好?H0 : = 5 H1 : 505 2520 416xtsn. 决策决策:不能拒绝不能拒绝H0结论:认为该机器还是良好的,没结论:认为该机器还是良好的,没有充分的理由拒绝原假设。有充分的理由拒绝原假设。【例2】某机
30、器制造的肥皂厚度规定为某机器制造的肥皂厚度规定为5cm,假设肥皂厚度,假设肥皂厚度服从正态分布。今欲了解机器性能是否良好,取服从正态分布。今欲了解机器性能是否良好,取16块肥皂为块肥皂为样本,测得平均厚度为样本,测得平均厚度为5.2cm,标准差为,标准差为0.4cm。问在显著水。问在显著水平为平为0.05的水平下,肥皂的平均厚度是否偏高?的水平下,肥皂的平均厚度是否偏高?H0 : 5 H1 : 505 2520 416xtsn. 决策决策:拒绝拒绝H0结论:认为肥皂的平均厚度偏高。结论:认为肥皂的平均厚度偏高。P值值=0.031972 =0.05,故不拒绝,故不拒绝H0 (三)总体均值的检验(
31、大样本(三)总体均值的检验(大样本) )1. 假定条件假定条件正态总体或非正态总体大样本正态总体或非正态总体大样本(n 30)使用使用 z检验统计量检验统计量 2 已知:已知:2. 2. 2 未知:未知:) 1 , 0(0Nnxz) 1 , 0(0Nnsxz总体均值的检验规则总体均值的检验规则 ( (大样本情形大样本情形) )假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : = 0 0H1 : 0 0H0 : 0 0H1 : 0 0统计量统计量 已知:已知: 未知:未知:拒绝域拒绝域P P值决策值决策拒绝拒绝H0nxz0nsxz02/zz zzzz P某大学规定
32、学生每天参加体育锻炼的时间为某大学规定学生每天参加体育锻炼的时间为25分钟。现学校分钟。现学校为了调查学生是否达到锻炼标准,从该校学生中随机抽取为了调查学生是否达到锻炼标准,从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为人,调查到他们平均每天参加体育锻炼的时间为24分钟分钟,标准为,标准为5分钟。试以分钟。试以5的显著水平检验该校学生平均每天的显著水平检验该校学生平均每天的锻炼时间是否达到规定。的锻炼时间是否达到规定。右侧检验右侧检验.H0 : 25 ,H1 : 25, = 0.05,n =100决策:拒绝决策:拒绝H0结论:样本提供的证据表明:学结论:样本提供的证据表明
33、:学生的锻炼时间没有达到规定。生的锻炼时间没有达到规定。0242525100 xzsn 总体均值的检验总体均值的检验(z检验检验) (P 值的计算与应用值的计算与应用)第1步:进入进入Excel表格界面,直接点击表格界面,直接点击“f(x)”(粘粘贴贴 函数函数)第2步:在函数分类中点击在函数分类中点击“统计统计”,并在函数名,并在函数名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值2录入,得到的函数值为录入,得到的函数值为 0.9925 P值值= (1-0.9925)=0.0075 P值远远小于值远远小于 ,故拒绝,故拒绝H0【例】一种
34、罐装饮料采用自动生产线生产,每罐的容量是一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为,标准差为5ml。为检验每罐容量是否符合要求,质。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了检人员在某天生产的饮料中随机抽取了40罐进行检验,测罐进行检验,测得每罐平均容量为得每罐平均容量为255.8ml。取显著性水平。取显著性水平 =0.05 ,检验,检验该天生产的饮料容量是否符合标准要求?该天生产的饮料容量是否符合标准要求?双侧检验双侧检验.H0 : = 255 ,H1 : 255, = 0.05,n = 40决策:不拒绝决策:不拒绝H0结论:样本提供的证据表明:结
35、论:样本提供的证据表明:该天生产的饮料符合标准要求该天生产的饮料符合标准要求01. 14052558 .2550nxz总体均值的检验总体均值的检验(z检验检验) (P 值的计算与应用值的计算与应用)第1步:进入进入Excel表格界面,直接点击表格界面,直接点击“f(x)”(粘粘贴贴 函数函数)第2步:在函数分类中点击在函数分类中点击“统计统计”,并在函数名,并在函数名的的 菜单下选择菜单下选择“NORMSDIST”,然后确定,然后确定第3步:将将 z 的绝对值的绝对值1.01录入,得到的函数值为录入,得到的函数值为 0.8437 P值值= 2*0.8437-1=0.6874 P值远远大于值远远
36、大于 ,故不能拒绝,故不能拒绝H0总体均值的检验总体均值的检验( (大样本大样本) )【例】一种机床加工的零件一种机床加工的零件尺寸绝对平均误差为尺寸绝对平均误差为1.35mm1.35mm。生产厂家现采用一种新的机床生产厂家现采用一种新的机床进行加工以期进一步降低误差。进行加工以期进一步降低误差。为检验新机床加工的零件平均为检验新机床加工的零件平均误差与旧机床相比是否有显著误差与旧机床相比是否有显著降低,从某天生产的零件中随降低,从某天生产的零件中随机抽取机抽取5050个进行检验。利用这个进行检验。利用这些样本数据,检验新机床加工些样本数据,检验新机床加工的零件尺寸的平均误差与旧机的零件尺寸的
37、平均误差与旧机床 相 比 是 否 有 显 著 降 低 ?床 相 比 是 否 有 显 著 降 低 ? ( ( =0.01) =0.01) 左侧检验左侧检验50个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验
38、总体均值的检验(大样本大样本)(例题分析例题分析)H0 : 1.35H1 : 1.35 = 0.01n = 50临界值(c):决策:拒绝决策:拒绝H0结论:新机床加工的零件尺寸的平结论:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低均误差与旧机床相比有显著降低6061. 250365749. 035. 13152. 1z总体均值的检验总体均值的检验(z检验检验) (P 值的计算与应用值的计算与应用)第1步:进入进入Excel表格界面,直接点击表格界面,直接点击“f(x)”第2步:在函数分类中点击在函数分类中点击“统计统计”,并在函数名的菜单下,并在函数名的菜单下选择选择“ZTEST”,然
39、后确定,然后确定第3步:在所出现的对话框在所出现的对话框Array框中,输入原始数据所在区框中,输入原始数据所在区 域域 ;在;在X后输入参数的某一假定值后输入参数的某一假定值(这里为这里为1.35);在;在 Sigma后输入已知的总体标准差后输入已知的总体标准差(若未总体标准差未若未总体标准差未 知则可忽略不填,系统将自动使用样本标准差代替知则可忽略不填,系统将自动使用样本标准差代替) 第4步:用用1减去得到的函数值减去得到的函数值0.995421023 即为即为P值值 P值值=1-0.995421023=0.004579 P值值 5200 = 0.05n = 36临界值临界值(c):75.
40、 33612052005275z总体均值的检验总体均值的检验(z检验检验) (P 值的图示值的图示)二、二、 两个总体均值平均数之差的检验两个总体均值平均数之差的检验检验的类型:检验的类型:(1)双侧检验双侧检验 H0:1- 2=D,H1: 1- 2 D ;(2)左侧检验左侧检验 H0: 1- 2=D, H1 : 1- 2 D如果如果D=0,那么检验类型简化为:,那么检验类型简化为:(1)双侧检验双侧检验 H0:1 2,H1: 1 2(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0: 1 2, H1 : 1 2(高)(高).两个总体均值之差的假设检验两个总体均值之差的假设检验假
41、定条件,两个总体之间是独立的,假定条件,两个总体之间是独立的,情形情形( (一一) )两个两个总体都服从正态分布总体都服从正态分布, , 1 1, , 2 2已知已知情形情形( (三三) )若不是正态分布若不是正态分布, , 两者都是大样本(两者都是大样本(n n1 1 3030和和n n2 2 30)30)可以用正态分布来近似。可以用正态分布来近似。2 2、使用正态分布统计量、使用正态分布统计量 z z1212221212()()xxnn 方差已知方差已知 方差未知用样本方差替代方差未知用样本方差替代1212221212()()xxorssnn 两个总体均值之差的检验规则两个总体均值之差的检
42、验规则 (正态总体方差已知或者正态总体方差已知或者大大样本情形样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : 1 1- 2 200H1 : 1 1- 2 2 0 0 H0 : 1 1- 2 2 0 0H1 : 1 1- 2 20 0统计量统计量 1 12 , 2 22 已知已知 1 12 , 2 22 未知未知拒绝域拒绝域P值决策值决策拒绝拒绝H02/zz zzzz P1212221212()()xxznn 1212221212()()xxzssnn 【例例】某公司对男女职员的平均某公司对男女职员的平均小时工资进行了调查,独立抽取小时工资进行了调查,
43、独立抽取了具有同类工作经验的男女职员了具有同类工作经验的男女职员的两个随机样本,并记录下两个的两个随机样本,并记录下两个样本的均值、方差等资料如右表样本的均值、方差等资料如右表。在显著性水平为。在显著性水平为0.05的条件下的条件下,能否认为男性职员与女性职员,能否认为男性职员与女性职员的平均小时工资存在显著差异?的平均小时工资存在显著差异? 两个样本的有关数据两个样本的有关数据 男性职员男性职员女性职员女性职员n1=44n2=32 x1=75 x2=70S12=64S22=42.25H0 : 1 1- 2 2 = 0 H1 : 1 1- 2 2 0结论:拒绝结论:拒绝H0,该公司男女职员的平
44、均该公司男女职员的平均小时工资之间存在显著差异小时工资之间存在显著差异2275703 0026442 254432z. z1.96-1.96拒绝拒绝 H0拒绝拒绝 H0二、二、正态总体方差正态总体方差 未知但未知但 12= 22*p假定假定条件条件n两个独立的小样本两个独立的小样本n两个两个总体都是正态分布总体都是正态分布n 12、 22未知但相等,即未知但相等,即 12= 22p检验检验统计量统计量12121211pxxtsnn()() 其中:其中:222112212112pnsnssnn()() 221 nn自由度自由度两个总体均值之差的检验两个总体均值之差的检验规则规则 (正态,方差未知
45、,正态,方差未知,小小样本情形样本情形)假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : 1 1- 2 200H1 : 1 1- 2 2 0 0 H0 : 1 1- 2 2 0 0H1 : 1 1- 2 20 0统计量统计量总体总体 未知未知拒绝域拒绝域P值决策值决策拒绝拒绝H02122ttnn/() tt tt P12121211()()pxxtsnn 甲、乙两台机床同时加工某种同类型的零件,已知两台机床甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径加工的零件直径( (单位:单位:cm)cm)分别服从正态分布,分别服从正态分布,并且有并且有
46、 12= 22 。为比为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8 8个零件和乙机床加工的个零件和乙机床加工的7 7个零件,通过测量得到如下数据个零件,通过测量得到如下数据 。在。在 =0.05的显著性水平下,样本数据是否提供证据支持的显著性水平下,样本数据是否提供证据支持 “两台机床加工的零件两台机床加工的零件直径不一致直径不一致”的看法?的看法?两台机床加工零件的样本数据两台机床加工零件的样本数据 (cm)(cm)甲甲20.519.819.720.420.120.019.019.9乙乙20.719.819.5
47、20.820.419.620.2H0 : 1 1- 2 20 0 H1 : 1 1- 2 2 0 0 121200 85511pxxtsnn()./ 两个总体均值之差的检验两个总体均值之差的检验 (用用Excel进行检验进行检验)第1步:将原始数据输入到将原始数据输入到Excel工作表格中工作表格中 第2步:选择选择“工具工具”下拉菜单并选择下拉菜单并选择“数据分析”选项选项 第3步:在在“数据分析数据分析”对话框中选择对话框中选择 “t-检验:双样本等方差 假设”第4步:当对话框出现后当对话框出现后 在在“变量变量1的区域的区域”方框中输入第方框中输入第1个样本的数据区域个样本的数据区域 在
48、在“变量变量2的区域的区域”方框中输入第方框中输入第2个样本的数据区域个样本的数据区域 在在“假设平均差假设平均差”方框中输入假定的总体均值之差方框中输入假定的总体均值之差 在在“ ”方框中输入给定的显著性水平方框中输入给定的显著性水平(本例为本例为0.05) 在在“输出选项输出选项”选择计算结果的输出位置,然后选择计算结果的输出位置,然后“确确定定” t-检验检验: 双样本等方差假设双样本等方差假设*变量变量 1变量变量 2平均平均19.92520.1428571方差方差0.2164285710.27285714观测值观测值87合并方差合并方差0.242472527假设平均差假设平均差0df
49、13t Stat-0.854848035P(T=t) 单尾单尾0.204056849t 单尾临界单尾临界1.770933383P(T=t) 双尾双尾0.408113698t 双尾临界双尾临界2.160368652 为检验两种方法组装产品所需时间的差异,分别对两为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排种不同的组装方法各随机安排12个工人,每个工人组装一件个工人,每个工人组装一件产品所需的时间产品所需的时间(分钟分钟)下如表。假定两种方法组装产品的时间下如表。假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平服从正态分布,但方差未知且不相等。取
50、显著性水平0.05,能,能否认为方法否认为方法1组装产品的平均数量明显地高于方法组装产品的平均数量明显地高于方法2?两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5t-检验检验: 双样本等方差假设双样本等方差假设变量变量 1变量变量 2平均平均32.528.8方差方差15.9963636419.3581818观测值观测值1212合并方差合并方差17.67727273假设平均差假设
51、平均差0df22t Stat2.155607659P(T=t) 单尾单尾0.021158417t 单尾临界单尾临界1.717144335P(T=t) 双尾双尾0.042316835t 双尾临界双尾临界2.073873058四、四、 12, 22 未知且不相等未知且不相等 12 22假定条件假定条件 两个两个总体都是正态分布总体都是正态分布 12, 22未知且不相等,即未知且不相等,即 12 22样本容量不相等,即样本容量不相等,即n1 n2检验统计量检验统计量2221212121)()(nsnsxxt)1122222121212222121nnsnnsnsnsv参见:李勇参见:李勇 统计学导论
52、统计学导论为检验两种方法组装产品所需时间的差异,分别对两为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排种不同的组装方法各随机安排12个工人,每个工人组装一件个工人,每个工人组装一件产品所需的时间产品所需的时间(分钟分钟)下如表。假定两种方法组装产品的时间下如表。假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平服从正态分布,但方差未知且不相等。取显著性水平0.05,能,能否认为方法否认为方法1组装产品的平均数量明显地高于方法组装产品的平均数量明显地高于方法2?两个方法组装产品所需的时间两个方法组装产品所需的时间 方法方法1方法方法228.336.
53、027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.5t-检验检验: 双样本异方差假设双样本异方差假设*变量变量 1变量变量 2平均平均32.528.8方差方差15.9963619.35818182观测值观测值1212假设平均差假设平均差0df22t Stat2.155608P(T=t) 单尾单尾0.021158t 单尾临界单尾临界1.717144P(T=t) 双尾双尾0.042317t 双尾临界双尾临界2.073873为比较甲乙两台机床的加工精度是否相等,分别独立抽取了
54、为比较甲乙两台机床的加工精度是否相等,分别独立抽取了甲机床加工的甲机床加工的10个零件和乙机床加工的个零件和乙机床加工的12个零件的直径。测个零件的直径。测得加工零件的直径数据后,利用得加工零件的直径数据后,利用EXCEL数据工具输出的结数据工具输出的结果如下:果如下:(假设总体方差相等,显著水平为假设总体方差相等,显著水平为0.05。) 1、请建立原假设和备择假设。是否有证据说明甲乙两机、请建立原假设和备择假设。是否有证据说明甲乙两机床是否存在差异?请说明理由床是否存在差异?请说明理由2、如果显著水平为、如果显著水平为0.01,那么(,那么(1)中的结论是否有变化)中的结论是否有变化?为什么
55、?为什么?3、在以上的检验中,还需要什么假设?、在以上的检验中,还需要什么假设?练习练习t-检验检验: 双样本异方差假设双样本异方差假设变量变量 1变量变量 2平均平均33.230.06666667方差方差16.062226.913333333观测值观测值1012假设平均差假设平均差0df15t Stat2.121026P(T=t) 单尾单尾0.025497t 单尾临界单尾临界1.75305P(T5,nq5,样本比率可用正态分布来近似样本比率可用正态分布来近似(大样本大样本)检验的检验的 z 统计量统计量) 1 , 0()1 (000Nnpz总体比率的检验规则总体比率的检验规则假设假设双侧检验
56、双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0: = 0 0H1: 0 0H0 : 0 0H1 : 0 0统计量统计量拒绝域拒绝域P P值决策值决策拒绝拒绝H0P2/zz npz)1(000zz = 0.01)该杂志的说法属实该杂志的说法属实1. 假定条件假定条件两个两个总体都服从二项分布总体都服从二项分布可以用正态分布来近似可以用正态分布来近似检验统计量检验统计量检验检验H0: 1- 2=0检验检验H0: 1- 2=d0二、两个总体比率之差的检验二、两个总体比率之差的检验212111)1 (nnppppz1201211()()()ppdzppppnn 1121 122122xx
57、pnp npnnnn两个总体比率之差的检验规则两个总体比率之差的检验规则假设假设双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验假设形式假设形式H0 : 1- 2=0H1 : 1- 2 0H0 : 1- 2 0 H1 : 1- 20 统计量统计量拒绝域拒绝域P值决策值决策拒绝拒绝H02/zz zzzz P212111)1 (nnppppz222111021)1 ()1 ()(nppnppdppz两个总体比率之差的检验两个总体比率之差的检验 (例题分析例题分析)一所大学准备采取一项学生一所大学准备采取一项学生在宿舍上网收费的措施,为了解男在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存
58、在女学生对这一措施的看法是否存在差异,分别抽取了差异,分别抽取了200名男学生和名男学生和200名女学生进行调查,其中的一个名女学生进行调查,其中的一个问题是:问题是:“你是否赞成采取上网收你是否赞成采取上网收费的措施?费的措施?”其中男学生表示赞成其中男学生表示赞成的比率为的比率为27%,女学生表示赞成的,女学生表示赞成的比率为比率为35%。调查者认为,男学生。调查者认为,男学生中表示赞成的比率显著低于女学生中表示赞成的比率显著低于女学生。取显著性水平。取显著性水平 =0.05,样本提供,样本提供的证据是否支持调查者的看法?的证据是否支持调查者的看法?netnet两个总体比率之差的检验两个总
59、体比率之差的检验 (例题分析例题分析)H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1=200 , n2=200临界值(c):72976. 120012001)31. 01 (31. 035. 027. 0z两个总体比率之差的检验两个总体比率之差的检验 (例题分析例题分析)有两种方法生产同一种产品,方法有两种方法生产同一种产品,方法1的生产成本较高而次品率较低,方法的生产成本较高而次品率较低,方法2的的生产成本较低而次品率则较高。管理人员生产成本较低而次品率则较高。管理人员在选择生产方法时,决定对两种方法的次在选择生产方法时,决定对两种方法的次品率进行比较,如方法品率进行比较,如
60、方法1比方法比方法2的次品率的次品率低低8%以上,则决定采用方法以上,则决定采用方法1,否则就采,否则就采用方法用方法2。管理人员从方法。管理人员从方法1生产的产品中生产的产品中随机抽取随机抽取300个,发现有个,发现有33个次品,从方个次品,从方法法2生产的产品中也随机抽取生产的产品中也随机抽取300个,发现个,发现有有84个次品。用显著性水平个次品。用显著性水平 =0.01进行检进行检验,说明管理人员应决定采用哪种方法进验,说明管理人员应决定采用哪种方法进行生产?行生产?两个总体比率之差的检验两个总体比率之差的检验 (例题分析例题分析)H0 : 1- 28%H1 : 1- 28% = 0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 店长年度感悟总结
- 建议书范文(共2篇)
- 模板施工专项方案范例
- 租房合同简易版
- (一模)长春市2025届高三质量监测(一)物理试卷
- 五四制六年级英语单词表
- 山东省聊城市(2024年-2025年小学五年级语文)人教版随堂测试(上学期)试卷及答案
- 2024年福特小型车项目资金筹措计划书代可行性研究报告
- 2024年盘碟托盘项目资金需求报告代可行性研究报告
- 2024-2025学年天津市南开中学高三上学期10月月考化学试题及答案
- 年产15万吨发酵豆粕项目可行性研究报告
- 多格列艾汀片-药品临床应用解读
- 《法律与自由》课件
- VSD护理完整版本
- 中小学劳动教育在跨学科融合中的作用探究
- 幼儿园小朋友可爱卡通恐龙风格餐前播报餐前分享
- 如何提高中小学生的数学学习成绩
- 2023年教师招聘考试考前必背简答题条
- 非计划性拔管的预防措施
- 管理英语4Unit-7-学前热身-会话演练-边学边练-写作训练等参考答案
- 陕西省西安三中2023-2024学年八年级上学期期中物理试卷
评论
0/150
提交评论