第6章 假设检验_第1页
第6章 假设检验_第2页
第6章 假设检验_第3页
第6章 假设检验_第4页
第6章 假设检验_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第 六六 章章 假设检验假设检验第一节第一节 假设检验的基本问题假设检验的基本问题 第二节第二节 均值的检验均值的检验第三节第三节 比例的检验比例的检验第四节第四节 方差的检验方差的检验假设检验思想举例假设检验思想举例l她是大学生?l为什么不是?l大学生如此着装的概率很低l基于概率判断的“排除法”0:41l理论的最初探索l1710年,阿布兹诺特在英国皇家学会宣读论文从两性出生数观察的规律性所得关於神的意旨存在的一个论据。他研究了1629-1710年伦敦出生的男女数,全是男多於女,推理:有两種可能:生男或生女纯属偶然;由於“神的意旨”,生男的机会大於生女。如果成立,则一年内生男的机会大於生女机

2、会的概率不大於0.5,连续82年出现这情况的概率不应超过(1/2)8210-24。一亿亿亿分之一,这不合情理。他首先提出用统计数据去验证一種说法的问题。来自女士品茶的灵感来自女士品茶的灵感l20世纪的R.A. Fisher:一女士说她能分辨奶茶中先倒进杯子的是奶还是茶。设计试验:8杯奶茶,先倒奶的4杯,请她品尝。设她挑出了这4杯。假设她无分辨能力,则8中选4共有70種方法( )。全选对的概率仅为1/70,有假设l1.无鉴别能力,纯属偶然l2.有鉴别能力 0:41)!48( ! 4! 8假设假设1 1与假设与假设2 2相矛盾。如果承认相矛盾。如果承认1,1,概率只有概率只有1/70,1/70,如

3、果不願意接受这么低的概率,就必须放弃此如果不願意接受这么低的概率,就必须放弃此假设。一个理智的选择是假设假设。一个理智的选择是假设2 2:她居然真的有:她居然真的有能力区分出来。能力区分出来。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l.1假设检验的基本思想假设检验的基本思想l运用“证明某个事物的正确性不如否定其对立面容易”的简单逻辑,通过数学过程来实现的一个方法;它通过数据和模型的矛盾来否定旧的模型。l假设如此,如果“如此”的概率比较小,就说明实际上“不如此”l概率一般是0.1,0.05,0.010:41检验菜单的作用检验菜单的作用l问题:某餐厅以前营业额8000元/天

4、,标准差640元,改了菜单,观察了9天,平均营业额8300/天,标准差640元。这300元的差异是改菜单所导致吗?l猜测:营业额的提高有可能真的是“改了菜单”所带来的,也可能因为最近这9天“恰好”是偏高的l分析过程见概率分佈.doc0:41假设检验的特点假设检验的特点l既类似於数学中的反证法,又不同於数学中的反证法。因为它所依据的小概率原理,不是百分之百的正确,所以假设检验也可能犯错误。l假设检验的主要目的是为了拒绝而不是接受l“小概率事件原理”:如果發生概率很小,在一次试验中视为不發生l很难避免二类错误:弃真,纳伪l零假设(稻草人假设,台湾称“虚无假设”)优先l同时降低二类错误的方法一般只能

5、是增加样本容量0:41什么是假设什么是假设?(hypothesis)l 对对总体参数总体参数的的数值的的数值所作的一种陈述所作的一种陈述l总体参数包括总体均总体参数包括总体均值、比例、方差等值、比例、方差等l分析之前必需陈述分析之前必需陈述什么是假设检验什么是假设检验? (hypothesis testing)1.事先对总体参数或分布形式作出某种假事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是设,然后利用样本信息来判断原假设是否成立否成立2.有参数假设检验和有参数假设检验和非非参数假设检验参数假设检验3. 采用逻辑上的反证法,依据统计上的小概采用逻辑上的反证法,依据统计上

6、的小概率原理率原理提出原假设和备择假设提出原假设和备择假设l 什么是原假设?什么是原假设?(null hypothesis)待检验的假设,又称待检验的假设,又称“0假设假设”反对反对研研究者想收集证据予以的假设究者想收集证据予以的假设参数没有变化或变量之间没有关系参数没有变化或变量之间没有关系 总是有等号总是有等号 , 或或 表示为表示为 H0lH0: 某一数值某一数值 l指定为指定为 = 号,即号,即 或或 l例如例如, H0: 3190(克)(克)l 什么是备择假设?什么是备择假设?(alternative hypothesis)与原假设对立的假设,也称“研究假设”研究者想收集证据予以支持

7、的假设总是有不等号: , 或 表示为 H1lH1: 某一数值,或 某一数值l例如, H1: ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)l备择假设的方向为“”,称为右侧检验右侧检验 单侧检验时零假设和备择假设的选择单侧检验时零假设和备择假设的选择l通常把研究者要证明的假设作为备择假设;l将所作出的声明作为原假设;l把现状(Status Quo)作为原假设;l把不能轻易否定的假设作为原假设;6.1.2假设检验中的两类错误假设检验中的两类错误(决策风险决策风险)假设检验中的两类错误假设检验中的两类错误l1.第一类错误(弃真错误)第一类错误(弃真错误)l原假设为真时拒

8、绝原假设原假设为真时拒绝原假设l会产生一系列后果会产生一系列后果l第一类错误的概率为第一类错误的概率为 l被称为显著性水平被称为显著性水平l2.第二类错误(取伪错误)第二类错误(取伪错误)l原假设为假时接受原假设原假设为假时接受原假设l第二类错误的概率为第二类错误的概率为 (Beta)第一类错误和第二类错误第一类错误和第二类错误0:41零假设是正确的零假设是错误的决策决定拒绝零假设第类错误(拒绝一个正确的零假设)概率:正确决策不拒绝零假设正确决策第类错误(未拒绝一个错误的零假设)概率:第二第二类类错误错误 (Type Error)0:41原假设实际上不正确,这时我们做出了接受原假设的决策,因而

9、犯了错误.这类错误称为第类错误,也简称为伪错误. 实际上有差异,但我们认为“没有差异”,犯这种错误出现的概率.风险一般不能通过统计检验直接求得.第一种错误第二种误差真条件真条件无差异有差异无差异不同统计的条件统计的条件第一种错误第二种误差真条件真条件无差异有差异无差异不同统计的条件统计的条件P接受H0| H0 不真第一第一类类错误错误 (Type Error)0:41原假设实际上正确,这时我们做出了拒绝原假设的决策,因而犯了错误.这类错误称为第类错误,也简称为弃真错误.我们无法排除犯这类错误的可能性,因此自然希望将犯这种错误的概率控制在一定的限度内。事实上,允许犯这类错误的概率最大为,即1-置

10、信度, 称为显著水平。关于有无显著性差异的判断是在显著水平之下做出的。P拒绝H0| H0 为真 第第类错误示意类错误示意l灰色面積就是犯第类錯誤的機率0:41第第类错误举例类错误举例l他很像大学生,但他是菜贩子l形象越接近“大学生”,就越容易犯“纳伪”错误,因此,这种错误的發生概率无法估量l实际上他真是大学生http:/ 错误和错误和 错误的关系错误的关系你不能同时减少两类错误!假阴性假阴性&假阳性假阳性l某特征(常指病征),检验之,有or无?l有则阳性,无则阴性l但可能错l其实是“有”,但未检测出来,即显示为阴性,此为假阴性,弃真,第一类l其实是“无”,但检测出来了,即显示为阳性,此

11、为假阳性,纳伪,第二类0:41两类错误的理解两类错误的理解lA本来属于本群体,但由于显得比较怪,就被否认了,此为“弃真”。由于“怪”可以基于已知的分布进行度量,“怪”的程度是可以计算的lB本来不属于本群体,但由于看起来很像,就不敢否认,这是“纳伪”。不属于该群体的东西不可胜数,出错的概率无法计算0:41客套客套&诽谤诽谤l虚伪的赞扬,客气话l虚伪的批评,诽谤0:41第一种错误第二种错误目的为指谬目的为指谬对方坏对方好说他坏说他好第二种错误第一种错误目的为扬善目的为扬善对方坏对方好说他坏说他好关於关於“ “显著性水平显著性水平” ”或或“ “差异有统计意义差异有统计意义” ”l如果一个样

12、本只有5的机会属於本总体,就说它不属於本总体,显然,这裏存在“风险”:毕竟还有5的可能是它真的就是本总体的一个样本。l字面理解:level是5,5的排除概率是有意义的0:41Significance,重要性,显著性,意义,重要性,显著性,意义Level of Significance, the maximum allowable probabilityof making a Type I error. 允许犯第一类错误的最大概率允许犯第一类错误的最大概率statistical significance统计显著性统计显著性testing significance of difference显著差

13、检验显著差检验significance of difference差异显著性差异显著性显著性的显著性的(Significant)差异差异0:41上图两个总体的平均推断值有“显著性差异”吗?对从总体采取一些样本,得到的此结论,我们有多少的自信呢?显著性差异(Significant Difference):用于描述统计假设检验结果的术语,即:差异大得不能合理地归因于偶然因素。 P-value0:41 P-value是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称P值。如果此值小,就下原假设为不真实的结论。统计学上称为小概率事件,即样本不是从原假设的分布中抽出的。一般P值大于,则无法拒

14、绝原假设,相反,P值小于,则拒绝原假设。 P-value为多少是好呢? - 一般 P-value0.05,就拒绝原假设H0总得适用 5%的规则吗? - 不,根据情况可用 1%或 10% - 适用 1%: 第一种错误引起的损失大时 - 适用 10%: 损失不深刻时, 第二种错误引起的损失大时与与的性质的性质l1. 調整決策條件,可以使得第I型錯誤降低。l2. 降低會增加 。 l3. 參數值與零假設越接近,越大。l4. 降低s2/n可以降低 。提高n比降低s2容易。l5. 當固定時,降低s2/n可降低 。只要H1為真,增加樣本數,必然可以成功拒絕零假設。0:41不能说不能说“接受接受”零假设零假设

15、l经常出现 “在零假设下拒绝零假设的概率为的情况下接受零假设”的结论。如果你负责的话,接受零假设时应该给出犯错误的概率(所谓犯第二类错误的概率) ,而不是,否则就不要说“接受”二字。实际上通常数理统计学教科书的假设检验部分(除了实践中少见的两点检验之外) 对单边和双边检验无法算出。因此在不能拒绝时祇能够说没有足够证据拒绝零假设,而不能说“接受”二字。l吴喜之.逆向思维与统计.统计与信息论坛. 2003 年1 月0:41“ “没有足够证据拒绝零假设没有足够证据拒绝零假设”l在理论上,这并不意味着“接受”零假设l因为零假设并未包括另一类“纳伪”错误0:416.1.3假设检验的流程假设检验的流程提出

16、假设提出假设确定适当的检验统计量确定适当的检验统计量规定显著性水平规定显著性水平 计算检验统计量的值计算检验统计量的值作出统计决策作出统计决策l 什么是检验统计量?什么是检验统计量?l1.用于假设检验决策的统计量用于假设检验决策的统计量l2.选择统计量的方法与参数估计相同,选择统计量的方法与参数估计相同,需考虑需考虑l是大样本还是小样本是大样本还是小样本l总体方差已知还是未知总体方差已知还是未知3.检验统计量的基本形式为检验统计量的基本形式为规定显著性水平规定显著性水平 (significant level)l 什么是显著性水平?什么是显著性水平?l1. 是一个概率值是一个概率值l2. 原假设

17、为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率l被称为抽样分布的拒绝域被称为抽样分布的拒绝域l3. 表示为表示为 l常用的常用的 值有值有0.01, 0.05, 0.10l4. 由研究者事先确定由研究者事先确定作出统计决策作出统计决策1.计算检验的统计量计算检验的统计量2.根据给定的显著性水平根据给定的显著性水平 ,查表得出相,查表得出相应的临界值应的临界值z 或或z /2 /2, t 或或t /2 /23.将检验统计量的值与将检验统计量的值与 水平的临界值进水平的临界值进行比较行比较4.得出拒绝或不拒绝原假设的结论得出拒绝或不拒绝原假设的结论 检验统计量和拒绝域检验统计量和拒绝域l检

18、验统计量:我们用来决策(拒绝或不能拒绝零假设)时依据的样本统计量。不同的总体参数适用的检验统计量不同。 拒绝域拒绝域:检验统计量取值的集合,当根据样本:检验统计量取值的集合,当根据样本得到的检验统计量的值属于该集合时,拒绝零得到的检验统计量的值属于该集合时,拒绝零假设。假设。不能拒绝不能拒绝 零假设的检验统计量取值的集合称零假设的检验统计量取值的集合称为为接受域接受域;划分拒绝域和接受域的数值称为划分拒绝域和接受域的数值称为临界值临界值。两类错误的概率两类错误的概率l两类错误不可避免;要减小其中的一种错误,通常只能通过增加另一种错误的方法做到。l假设检验中通常首先控制控制第一类错误的概率不超过

19、某个小概率水平,在满足该条件的要求下使犯第二类错误的概率尽量小。l允许犯第一类错误的概率称为显著性水平。l通常取为0.01,0.05,0.1。l根据可以确定检验统计量的临界值,并根据统计量的样本观测值和临界值得出检验结论。双侧检验和单侧检验双侧检验和单侧检验双侧检验与单侧检验双侧检验与单侧检验 (假设的形式假设的形式)假设假设研究的问题研究的问题双侧检验双侧检验左侧检验左侧检验右侧检验右侧检验H0 = 0 0 0 0 0 0H1 0 0 0 0双侧检验双侧检验(原假设与备择假设的确定原假设与备择假设的确定)1.属于属于决策中的假设检验决策中的假设检验2.不论是拒绝不论是拒绝H0还是不拒绝还是不

20、拒绝H0,都必需采取相,都必需采取相应的行动措施应的行动措施3.例如,某种零件的尺寸,要求其平均长度为例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于,大于或小于10cm均属于不合格均属于不合格l我们想要证明我们想要证明(检验检验)大于或小于这两种可能性中的大于或小于这两种可能性中的任何一种是否成立任何一种是否成立4.建立的原假设与备择假设应为建立的原假设与备择假设应为l H0: 10 H1: 10双侧检验双侧检验(显著性水平与拒绝域显著性水平与拒绝域 ) /2 单侧检验单侧检验(显著性水平与拒绝域显著性水平与拒绝域)6.2 均值的检验均值的检验l6.2.1 单样本时,总体均值检验l

21、方差已知,总体均值的双侧检验(U检验)l方差未知,总体均值的双侧检验(t检验)l方差已知,总体均值的右侧检验(U检验)0:41均值检验中均值检验中检验统计量检验统计量的选择的选择总体正态?总体正态?n30?2 2已已知知?否否是是是是否否否否是是实际中总体方差总是未知的,因实际中总体方差总是未知的,因而这是应用最多的公式。大样本而这是应用最多的公式。大样本时时t值可以用值可以用z值来近似。值来近似。根据中心极限定理得根据中心极限定理得到的近似结果。到的近似结果。 未知时用未知时用s来估计。来估计。增大增大n; 数学数学变换等。变换等。单个正态总体参数的检验单个正态总体参数的检验10:41单侧和

22、双侧检验单侧和双侧检验0:41拒绝范围拒绝范围 无法拒绝无法拒绝HO(临界值临界值) (临界值临界值)(临界值临界值)(临界值临界值)拒绝范围拒绝范围 无法拒绝无法拒绝HO拒绝范围拒绝范围拒绝范围拒绝范围 / 2 / 2无法拒绝无法拒绝HO双侧检验双侧检验单侧右检验单侧右检验单侧左检验单侧左检验H1: =(不等于不等于)H1: (大于大于)H1: Z Z /2 /2时拒绝零假设,时拒绝零假设,否则不能拒绝零假设。否则不能拒绝零假设。l本例中统计量的观测值等于本例中统计量的观测值等于1.976,因此结论,因此结论是拒绝零假设,认为平均抗拉力有显著变化。是拒绝零假设,认为平均抗拉力有显著变化。统计

23、量的观测统计量的观测值等于值等于1.976H0 = 0 0H1 0 0(2)根据)根据p值进行假设检验:双侧检验值进行假设检验:双侧检验p p值值也称为也称为观测到的显著性水平观测到的显著性水平, , 是能拒绝是能拒绝H H0 0 的的 的的最小值最小值, /2拒绝拒绝拒绝拒绝01.96-1.96Z1/2 p-值值1/2 p-值值1.976-1.976)|(|bs0oHZZPp值双侧检验中 决策规则:决策规则: p值值 1020l = 0.05ln = 16l临界值临界值(s):s s2 未知大样本均值的检验未知大样本均值的检验l【例例 】某电子元件批量生产的质某电子元件批量生产的质量标准为平

24、均使用寿命量标准为平均使用寿命1200小时,小时,标准差标准差300小时。某厂宣称他们小时。某厂宣称他们采用一种新工艺生产的元件质量采用一种新工艺生产的元件质量大大超过规定标准。为了进行验大大超过规定标准。为了进行验证,随机抽取了证,随机抽取了100件作为样本,件作为样本,测得平均使用寿命测得平均使用寿命1245小时。能小时。能否说该厂生产的电子元件质量显否说该厂生产的电子元件质量显著地高于规定标准?著地高于规定标准? ( 0.05)s s2 未知大样本均值的检验未知大样本均值的检验lH0: 1200lH1: 1200l = 0.05ln = 100l临界值临界值(s):总体均值的检验总体均值

25、的检验 (s s2未知小样本未知小样本)l1. 假定条件假定条件l总体为正态分布总体为正态分布ls s2未知,且小样本未知,且小样本l2. 使用使用t 统计量统计量s s2 未知小样本均值的检验未知小样本均值的检验l某机器制造出的肥皂厚度某机器制造出的肥皂厚度为为5cm,今欲了解机器性,今欲了解机器性能是否良好,随机抽取能是否良好,随机抽取10块肥皂为样本,测得平均块肥皂为样本,测得平均厚度为厚度为5.3cm,标准差为,标准差为0.3cm,试以,试以0.05的显著的显著性水平检验机器性能良好性水平检验机器性能良好的假设。的假设。 s s2 未知小样本均值的检验未知小样本均值的检验 (例题分析例

26、题分析)lH0: = 5lH1: 5l = 0.05ldf = 10 - 1 = 9l临界值临界值(s):s s2 未知小样本均值的检验未知小样本均值的检验l一个汽车轮胎制造商声称,某一等一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于重量和正常行驶条件下大于40000公公里,对一个由里,对一个由20个轮胎组成的随机个轮胎组成的随机样本作了试验,测得平均值为样本作了试验,测得平均值为41000公里,标准差为公里,标准差为5000公里。已知轮公里。已知轮胎寿命的公里数服从正态分布,我胎寿命的公里数服从正态分布,我们能否根据这些数据

27、作出结论,该们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?制造商的产品同他所说的标准相符?( = 0.05)均值的单尾均值的单尾 t 检验检验 (计算结果计算结果) lH0: 40000lH1: 40000l = 0.05ldf = 20 - 1 = 19l临界值临界值(s):案例案例l美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?l澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司

28、在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗? 2011年年总体均值的检验总体均值的检验(s s 2 已知已知)(例题分析例题分析大样本大样本)l【课堂习题课堂习题1】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?健康饮品健康饮品2011年年总体均值的检验总体均值的检验(s s 2 已知已知)(例题分析大样本例题分析大

29、样本)lH0 : = 255lH1 : 255l = 0.05ln = 40l临界值临界值(c):决策决策:结论结论用用Excel中的中的【NORMSDIST】函数得到的双尾检验函数得到的双尾检验P=0.312945不拒绝不拒绝H0没有证据表明该天生产的饮料没有证据表明该天生产的饮料不符合标准要求不符合标准要求 z01.96-1.960.005拒绝拒绝 H0拒绝拒绝 H00.00501. 14052558 .2550nxzs2011年年总体均值的检验总体均值的检验(s s 2 未知未知) (例题分析例题分析大样本大样本)l【课堂习题课堂习题2】一种机床加工的零件尺寸绝对平均误差为1.35mm。

30、生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01) (均值=1.3152 ,标准差=0.365749) 1.261.191.310.971.811.130.961.061.000.940.920.951.041.500.500.590.991.451.241.012.031.981.970.911.221.061.111.54

31、1.081.101.641.702.371.381.601.230.820.862011年年总体均值的检验总体均值的检验(例题分析例题分析大样本大样本)lH0 : 1.35lH1 : 5200l = 0.05ln = 36l临界值临界值(c):z0拒绝拒绝H00.051.6452011年年总体均值的检验总体均值的检验 (例题分析例题分析小样本小样本)l【课堂习题课堂习题4】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的1

32、0个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 12.210.812.011.811.912.411.312.212.012.32011年年总体均值的检验总体均值的检验 (例题分析例题分析小样本小样本)lH0 : =12lH1 : 12l = 0.05ldf = 10 - 1= 9l临界值临界值(c):没有证据表明该供货商提供的没有证据表明该供货商提供的零件不符合要求零件不符合要求 t02.262-2.2620.025拒绝拒绝 H0拒绝拒绝 H00.02570533.01049317565.01289.11t2011年

33、年总体均值的检验总体均值的检验 (P 值的计算与应用值的计算与应用t 检验检验)l第第1步:步:进入Excel表格界面,直接点击【fx】l第第2步:步:在函数分类中点击【统计】,并在函数名的l 菜单下选择【TDIST】,然后【确定】l第第3步:步:在出现对话框的【X】栏中输入计算出的t的绝 l 对值0.7053,在【Deg-freedom】(自由度)栏中输l 入本例的自由度9,在【Tails】栏中输入2(表明l 是双侧检验,如果是单测检验则在该栏输入1) l第第4步:步:P值=0.498453 l P值=0.05,故不拒绝H0 2011年年总体均值的检验总体均值的检验 (用用SPSS进行检验进

34、行检验小样本小样本t检验检验)第第1步:步:选择选择【Analyze】下拉菜单,并选择下拉菜单,并选择【Compare MeansOne- Samples T Test】选项,进入主对话选项,进入主对话框框第第2步:步:将检验变量将检验变量(零件长度零件长度)选入选入【Test Variable(s)】;在;在【Test Value】框内输入假设值框内输入假设值(本题为本题为12)第第3步:步:点击点击【Options】,选择所需的置信水平,选择所需的置信水平(隐含值隐含值为为95%)。点击。点击【Continue】回到主对话框。点击回到主对话框。点击【OK】2011年年总体均值的检验总体均值

35、的检验 (用用SPSS进行检验进行检验小样本小样本t检验检验)O On ne e- -S Sa am mp pl le e T Te es st t-.7059.498-.1100-.463.243零件长度tdfSig.(2-tailed)MeanDifferenceLowerUpper95% Confidence Intervalof the DifferenceTest Value = 12总体均值的检验总体均值的检验 (用用SPSS进行检验进行检验小样本小样本t检验检验)2011年年一个总体均值的检验一个总体均值的检验(作出判断作出判断)s s 是否已是否已知知样本量样本量ns s 是否

36、已是否已知知 t 检验检验z 检验检验z 检验检验 z 检验检验用置信区间进行检验用置信区间进行检验 (例题分析例题分析)l 【例例】一种袋装食品每包的标一种袋装食品每包的标准重量应为准重量应为1000克。现从生产克。现从生产的一批产品中随机抽取的一批产品中随机抽取16袋,袋,测得其平均重量为测得其平均重量为991克。已克。已知这种产品重量服从标准差为知这种产品重量服从标准差为50克的正态分布。试确定这批克的正态分布。试确定这批产品的包装重量是否合格?产品的包装重量是否合格?( = 0.05)3、单侧:右侧检验与左侧检验、单侧:右侧检验与左侧检验l平均说来,一个有丈夫和两个孩子的家庭主妇每周用

37、于与家庭有关活动的时间不超过55h。抽取8个家庭主妇的每周工作时间作为样本,得到数据:58,52,64,63,59,62,62,55。有妇联组织认为每周平均工作时间超过55小时,你的结论是什么?(假设总体为正态分布)右侧检验问题右侧检验问题l解:l根据题意,l观测到的统计量的值等于55:55:10HH) 1(/0ntnsxt9416. 28/2067. 455375.59obst(1)根据)根据z值(或值(或t值)进行右侧检验值)进行右侧检验中央财经大学统计学院中央财经大学统计学院 850 t Z, t拒绝域拒绝域接受域接受域1 - 置信水平置信水平统计量的观测统计量的观测值等于值等于2.94

38、89.1)7(05.0 tl决策规则:决策规则:t obst 时拒绝零假设,否则不能拒时拒绝零假设,否则不能拒绝零假设。绝零假设。l本例中统计量的观测值等于本例中统计量的观测值等于2.94,拒绝零假设。,拒绝零假设。H0 0 0H1 0 0(2)根据)根据p值进行假设检验:右侧检验值进行假设检验:右侧检验0t 拒绝拒绝p-值值2.94)tt (bs0oHPp 值值右右侧侧检检验验中中 决策规则:决策规则: p值值 时时 拒绝拒绝 H0。 例中例中p值等于值等于0.01083 (Excel计算)。计算)。 t 89.1)7(05.0 t)zz(bs0oHP 或或左侧检验问题左侧检验问题l一家公司

39、付给生产一线雇员的平均工资是每小时20.0元。公司最近准备选一个新的城市建子公司,备选的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要因素。从备选的某城市抽取40名工人,样本数据的结果是:平均工资是每小时19.0元,样本标准差是2.4元。请在0.10的显著性水平下分析样本数据是否说明该城市工人的平均每小时工资显著低于20.0元。(1)根据)根据z值(或值(或t值)进行左侧检验值)进行左侧检验-t 拒绝域拒绝域接受域接受域 统计量的观测统计量的观测值等于值等于-2.6430.1)39(10.0 tl决策规则:决策规则:t obs-t 时拒绝零假设,否则不能时拒绝零假设,否

40、则不能拒绝零假设。拒绝零假设。l本例中统计量的观测值等于本例中统计量的观测值等于-2.64。H0 0H1 0左侧检验问题左侧检验问题l解:l根据题意(由于是大样本,本题也可以用Z统计量近似计算),l观测到的统计量的值等于) 1(/0ntnsxt64. 240/4 . 22019obst0 .20:0 .20:10HH(2)根据)根据p值进行左侧检验值进行左侧检验 拒绝拒绝p-值值)tt (0obsHPp 值值左左侧侧检检验验中中 决策规则:决策规则: p值值 时时 拒绝拒绝 H0。 本例中本例中p值等于值等于0.00593 (Excel计算)。计算)。 t )zz(bs0oHP 或或30.1)

41、39(10.0 t6.3两样本总体均值差检验两样本总体均值差检验l1. 两总体方差已知,关于两样本均值差的双侧检验(U检验)l2.两总体方差相等但未知,关于两样本均值差的双侧检验(t检验)0:412) 1() 1(212222112nnSnSnSw 加权平均的方差,以二样本各自的自由度为权数,对二样本的方差进行加权平均单个正态总体参数的检验单个正态总体参数的检验20:41两独立正态总体均值检验两独立正态总体均值检验0:412) 1() 1(21222211nnSnSnSw其中6.4 总体比例的检验总体比例的检验 l构造检验统计量构造检验统计量(np0 5,n(1-p0) 5)1 ,0()1(0

42、00NnppppZ l决策规则:同均值的决策规则,可以使用决策规则:同均值的决策规则,可以使用Z值、值、p值或置信区间进行双侧、左侧或值或置信区间进行双侧、左侧或右侧检验。右侧检验。案例案例l澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?=0.01.右侧检验右侧检验l解:l根据题意,显然有np0 5,n(1-p0) 5.l观测到的z统计量的值等于l检验的结论是拒绝零假设。061. 0:061. 0:10 HpH599. 814656/939. 0*061. 0061. 0078. 0obsz) 1 , 0()1 (000NnppppZ326. 201. 0 ZZ案例案例l美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者。根据调查结果能否认为费城的平均失业时间高于全国平均水平? =0.05。(用SPSS Statistics求解)【数据文件:失业时间.xls】描述统计结果描述统计结果(SPSS Statistics)假设检验结果假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论