统计学第七章假设检验与方差_第1页
统计学第七章假设检验与方差_第2页
统计学第七章假设检验与方差_第3页
统计学第七章假设检验与方差_第4页
统计学第七章假设检验与方差_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、假设检验的意义及程序二、总体均值的假设检验三、总体成数的假设检验四、总体方差的假设检验(略)五、单因素方差分析六、双因素方差分析(略)第七章 假设检验与方差分析0一、假设检验的概念什么是假设:在参数检验中,对总体参数的具体数值所作的陈述。就一个总体而言,总体参数包括总体均值、比例和方差总体均值、比例和方差等;分析之前之前必需陈述。 假设检验(Hypothesis testing)是利用样本的实际资料检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。 假设检验是从总体参数所做的一个假设开始的,然后根据样本资料对其假设进行分析检验。第一节 假设检验的基本理论假设检验的过程 拒绝假

2、设拒绝假设 别无选择别无选择! 作出决策作出决策总体总体有关人口寿命的分析问题我认为人口的平我认为人口的平均年龄是均年龄是8080岁岁 某厂生产一批产品,必须检验合格才能出厂,规定合格率为95%,现从中抽取100件进行质量检查,发现合格率为93%,假设检验就是利用样本指标p=93%的合格率,来判断原来假设P=95%合格率是否成立。如假设成立,产品就能出厂,如假设不成立,这批产品便不能出厂。例例1 1某地区去年职工家庭年收入为72000元,本年抽样调查结果表明,职工家庭年收入为71000元,这是否意味着职工生活水平下降呢?我们还不能下这个结论,最好通过假设检验,检验这两年职工家庭收入是否存在显著

3、性统计差异,才能判断该地区今年职工家庭年收入是否低于去年水平。例例2 2二、假设检验的基本原理(一)假设检验的基本思想与小概率原理(则) 1、假设检验的基本思想 是先对所研究的命题提出假设-无显著性差异的假设,然后利用“小概率原理”和“概率反证法”来论证假设是否成立的一种统计分析方法。 2 2、小概率原理(则)、小概率原理(则)/ /显著性水平显著性水平 小概率原理:小概率原理:也就是实际推断原理,它认为在一也就是实际推断原理,它认为在一次实验中,概率很小的事件,实际上是不可能发生次实验中,概率很小的事件,实际上是不可能发生的;或者说如果在一次观察中出现了小概率事件,的;或者说如果在一次观察中

4、出现了小概率事件,那么应该否定原有事件具有小概率的说法或者假设。那么应该否定原有事件具有小概率的说法或者假设。 这个小概率标准就是假设检验中的这个小概率标准就是假设检验中的显著性水平显著性水平(Level of significance)(Level of significance)。 显著水平对应的概率度显著水平对应的概率度T T称为临界值,记为称为临界值,记为T T/2/2。 例如例如=0.05=0.05时,临界值时,临界值T T/2/2=1.96=1.96。 3 3、概率反证法:、概率反证法: 概率反证法:概率反证法:如果在其他因素给定的前提下,要证明某一事实(对总体参数假定)是否成立,

5、只要假设该事实(参数只要假设该事实(参数假定)成立,在该事实成立的前提下,来证明由该事实(参假定)成立,在该事实成立的前提下,来证明由该事实(参数假定)和样本构建的统计量的取值落在否定域内的概率较数假定)和样本构建的统计量的取值落在否定域内的概率较小,以此来证明假定是否成立的方法。小,以此来证明假定是否成立的方法。 通俗来讲所谓反证法思想通俗来讲所谓反证法思想是先提出假设是先提出假设( (检验假设检验假设H H0 0) ),再,再用适当的统计方法确定假设成立的可能性大小,如可能性小,用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。则认

6、为假设不成立,若可能性大,则还不能认为假设不成立。 (二)假设检验中命题的基本形式 假设一般包括两部分: 原假设H0和备择假设H1。 1、原假设又称虚无假设或零假设。 在假设检验中,通常把被检验的那个假设称为零假设在假设检验中,通常把被检验的那个假设称为零假设(用符号(用符号H0表示),或者说,研究者想要收集证据给予反表示),或者说,研究者想要收集证据给予反驳的假设。驳的假设。 原假设建立的依据都是已有的、具有稳定性的,从经验看,没有发生条件的变化,是不会被轻易否定的。 假设检验的基本目的,就在于作出决策:接受原假设还是拒绝原假设。2、备择假设 备择假设又称择一假设,即原假设被否定之后应选择的

7、、与原假设逻辑对立的假设。用H1表示。0010:or HMMHMM0100:MMHMMHOR原假设和备择假设的表现形式: (1) H0: =0; H1: 0 (2) H0: 0; H1: 0 原假设和备择假设是一个完备事件组,而且原假设和备择假设是一个完备事件组,而且相互对立相互对立 在一项假设检验中,原假设和备择假设必有一在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立个成立,而且只有一个成立 2.2.先确定原假设,再确定备择假设先确定原假设,再确定备择假设3.等号等号“=”总是放在原假设上总是放在原假设上4.因研究目的不同,对同一问题可能提出不因研究目的不同,对同一问题可能

8、提出不同的假设同的假设(也可能得出不同的结论也可能得出不同的结论)【例【例1 1】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设【例【例2 2】一家研究机构估计,某城市中家庭拥有汽一家研究机构估计,某城市中家庭拥有汽车的比例超过车的比例超过30%30%。为验证这一估计是否正确,。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试该研究机构随机抽取了一个样本进行检验。试陈述用于

9、检验的原假设与备择假设。陈述用于检验的原假设与备择假设。解:解:想收集证据予以支持的假设是想收集证据予以支持的假设是“该城该城市中家庭拥有汽车的比例超过市中家庭拥有汽车的比例超过30%”30%”。建立的。建立的原假设和备择假设为:原假设和备择假设为:n H0 : m m 30% H1 : m m 30%例例3】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。(三)双侧(尾)检验与单侧(尾)检验 一般地,我们可以将假设检验分为双侧检验和单侧检验。具体地说,对总

10、体参数的检验形式常见的有:(1)双侧检验H0:=0,H1:0(2)左侧检验H0:0,H1:0 其中(2)和(3)又合称为单侧检验。 在实际问题中到底使用哪种形式的假设检验要根据实际问题的性质和要求来确定。1、双尾检验: 双尾检验中原假设的特点是,总体参数的假设值只取某一个数值。 具体形式:具体形式: 双尾检验双尾检验H H0 0:=:=0 0;H H1 1:0 01-1-/2/2/2/20双尾检验双尾检验H H0 0:=:=0 0;H H1 1:0 022220UUUUH2UU 在在假假设设的的双双尾尾检检验验中中,如如果果检检验验统统计计量量的的数数值值过过大大或或过过小小,都都将将否否定定

11、原原假假设设。否否定定域域位位于于正正态态分分布布曲曲线线两两边边,在在显显著著性性水水平平 条条件件下下,每每个个尾尾部部的的面面积积分分别别为为,临临界界值值为为和和。当当检检验验统统计计量量的的数数值值时时,就就否否定定原原假假设设;时时,认认为为差差异异不不显显著著,就就接接受受原原假假设设,见见图图:2212()U临界值2()U临界值否定域否定域接受域2、单尾检验: 理论上,在单尾检验的情况下需要对每个假设参数进行检验,但一般只完成个值的检验,即在相等点上的检验。0单尾检验的具体形式:单尾检验的具体形式:00100010: :HHmmmmmmmm在单尾检验中,如:H,则为左尾检验;如

12、:H,则为右尾检验,见下图: 1UU否定域接受域否定域接受域1右尾检验左边检验0.051.645 1.64520.1 1.645 1.645UUUU 当时,因为正态分布是双边的,当单边检验时,取,再查得临界值,(四)假设检验中的两类错误假设检验中各种可能结果的概率(四)假设检验中的两类错误 研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 第类错误(错误)n原假设为正确时拒绝原假设

13、n第类错误的概率记为,被称为显著性水平o2.第类错误(错误)n原假设为错误时未拒绝原假设n第类错误的概率记为(Beta)(四)假设检验中的两类错误 在统计检验中,不管我们如何选择否定域,都不可能完在统计检验中,不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言,第错误的危险压缩到最小。对任何一个给定的检验而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦一类错误的危险越小,第二类错误的概率就越大;反之亦然。然。 一般来讲,不可能具体估计出第二类错误的概率值。

14、第一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。果的概率之和。 被我们事先选定的可以犯第一类错误的概率,叫做检被我们事先选定的可以犯第一类错误的概率,叫做检验的显著性水平验的显著性水平(用用表示表示),它决定了否定域的大小。因此,它决定了否定域的大小。因此,有人也把第一类错误称之有人也把第一类错误称之错误错误 。相应地第二类错误被人。相应地第二类错误被人称为称为 错误。错误。1、弃真的错误 当H0为真时,不否定原假设当然是正确的。但是当原假设H0本来是真实的时候却也有可能被错误地

15、否定掉,这种否定真实原假设的错误称为第一类错误。犯第一类错误的概率的大小就是显著性水平。2、取伪的错误 当原假设H0非真时做出接受H0的选择,这种错误称为第二类错误,用表示犯第二类错误的概率。由于H0非真的状态不是唯一的,因此取伪的概率其数值也是不确定的。 三、假设检验的步骤 1提出原假设HO和备择假设Hl2给定显著性水平 以及样本容量n3确定检验统计量,由样本观察值计算统计量值4根据显著性水平 ,确定统计量的否定域和临界值。5按检验规则作出接受还是拒绝H0的判断2Z2Z0 0对假设检验中各个程序的具体解释对假设检验中各个程序的具体解释 1 1、提出原假设和、提出原假设和备选假设备选假设原假设

16、原假设( (又称虚无假设又称虚无假设) )是接受检验的假设,记作是接受检验的假设,记作H H0 0;备选假设备选假设 ( (又称又称替代假设替代假设) )是当原假设被否定时的另一是当原假设被否定时的另一种可成立的假设,记作种可成立的假设,记作H H1 1;H H0 0与与H H1 1两者是对立的,如两者是对立的,如H H0 0真实,则真实,则H H1 1不真实;如不真实;如H H0 0不不真实,则真实,则H H1 1为真实。为真实。 H H0 0和和H H1 1在统计学中称为统计假设。在统计学中称为统计假设。关于总体平均数的假设有三种情况: (1) H0: =0; H1: 0 (2) H0:

17、0; H1: 0以上三种类型,对第一种类型的检验,称双边检验,因为0,包含0和MSMSw w),),FFFF0.050.05(df(dfb b,df,dfw w), p0.05), p0.05,拒绝零假设,拒绝零假设, 说明样本来自不同说明样本来自不同的正态总体,说明处理造成均值的差异有统计意义;的正态总体,说明处理造成均值的差异有统计意义; 否则否则, FF, F0.05), p0.05不能拒绝零假设,说明样不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。本来自相同的正态总体,处理间无差异。 二、单因素方差分析二、单因素方差分析: 对单因素试验结果进行分析,检验因素对试验对单因素试

18、验结果进行分析,检验因素对试验结果有无显著性影响的方法叫单因素方差分析。结果有无显著性影响的方法叫单因素方差分析。 单因素方差分析是两个样本平均数比较的引单因素方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,从而伸,它是用来检验多个平均数之间的差异,从而确定因素对试验结果有无显著性影响的一种统计确定因素对试验结果有无显著性影响的一种统计方法。方法。三、单因素方差分析的方法步骤单因素方差分析的方法步骤 提出统计假设提出统计假设 H H0 0: :m m1 1= =m m2 2=.=.=m mk k H H1 1:H:H0 0不成立(或不成立(或m m1 1m m2 2. .

19、 m mk k) 计算统计量计算统计量F F值值1 1、列表计算下列各值、列表计算下列各值试验数据用试验数据用X Xijij表示表示 i列标 i =1,2,K j行标 j = 1,2,n 各水平重复试验数据之和 (各样本数据之和) 各水平重复试验数据平方和 (各样本数据平方和)(3) 各水平重复试验数据和的总和 (全部数据之和)(4) 各水平重复试验数据平方和的总和 (全部数据的平方和)njijX121njijXkinjijX11kinjijX1122 2、计算离差平方和、计算离差平方和(1)总离差平方和(2)组间离差平方和(3)组内离差平方和222ijTijijXSSXXcNNXcij222

20、2ijijijbiiXXXSScnNn wTbSSSSSS3 3、确定自由度、确定自由度(1)总自由度 dft=N-1 (2)组间自由度 dfb=k-1 (3)组内自由度 dfw=N-k=dft-dfb4 4、计算方差、计算方差(1)组间方差 (2)组内方差5 5、计算统计量、计算统计量F F值值bbbSSM SdfwwwSSMSdfbwM SFM S(三)查表求临界值(三)查表求临界值 F(dfb,dfw) dfb=k-1 dfw=N-k(四)根据统计量与临界值进行判别(四)根据统计量与临界值进行判别0.05(,)0.05bwdf dfFFp因素对试验结果无显著性影响0.05(,)0.05bwdfdfFFp因素对试验结果有显著性影响0.01(,)0.01bwdf dfFFp因素对试验结果有高度显著性影响对例1进行单因素方差分析43210:mmmmHijx70.69ijx2ijx31.2482ijx方法一方法二方法三方法四13.33.00.43

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论