《应用统计学(第三版)》课件第11章 假设检验_第1页
《应用统计学(第三版)》课件第11章 假设检验_第2页
《应用统计学(第三版)》课件第11章 假设检验_第3页
《应用统计学(第三版)》课件第11章 假设检验_第4页
《应用统计学(第三版)》课件第11章 假设检验_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章假设检验本章主要阐述假设检验的基本问题、正态总体的参数检验、正态总体方差检验、检定法、符号检验法、等级检验法、趋势性与随机性检验。其核心是怎样根据随机样本对某一统计假设作出接受或拒绝的统计决策。11.1

假设检验的基本问题11.1.1.假设检验的意义假设检验是以样本统计量来验证假设的总体参数是否成立,借以决定采取适当行动的统计方法,又称假设检定或假设测验。包括假设和检验两个基本环节。统计假设:对总体参数作出假设,这种假设可能正确,也可能是错误的。统计检验:检验所作的统计假设是否成立,作出接受或作出拒绝的结论。11.1.2假设检验的程序1.提出原假设H0和备选假设H1。原假设H0:是假设未知参数等于某一具体的值,是需要接受检验的假设。备选假设H1:又称替代假设或备择假设,是原假设的对立假设。关于总体平均数的假设有三种状况:①H0:u=u0;H1:u≠u0;(双尾检验)②H0:u≥u0;H1:u<u0;(单尾检验)③H0:u≤u0;H1:u>u0;(单尾检验)2.确定样本统计量及其分布。样本统计量有样本均值、样本比率、样本方差等,不同的样本统计量具有不同的分布,用于检验不同的统计假设。3.选择显著水平。显著水平a:原假设是正确的,发生的概率大1-a,而不发生的概率a则小

。a

常取0.05或0.01。显著水平的选择存在着犯两种错误的可能性:第一类为弃真错误:原假设本是正确的,由于a值选择过大,拒绝了原假设。第二类为取伪错误:原假设本是错误的,由于a值选择过小,接受了原假设。4.计算检验统计量或构建置信区间。根据样本统计量的数据和被假设的总体参数,计算检验统计量;或者根据样本统计量和置信概率构建置信区间,作为检验决策的依据。检验统计量的基本计算公式为:

5.作出统计决策。双尾检验:检验统计量落在接受区域内,接受原假设,反之,则拒绝原假设。单尾检验:检验统计量的绝对值大于临界绝对值,拒绝原假设。反之,接受原假设。11.1.3假设检验的方法假设检验的方法有参数假设检验和非参数假设检验两类。1.有参数假设检验.是指在已知总体分布的条件下,对总体均值、总体比率、总体方差等参数进行假设检验。有参数检验的方法主要有Z检验、t检验、F检验等等。2.非参数假设检验.。是在不考虑原总体分布或不作关于分布假定的前提下,进行统计检验和判断分析的一系列方法的总称。

主要应用于以下两个方面:(1)凡要求解决的问题不符合参数假设检验条件时,采用非参数假设检验。(2)采用列名尺度和顺序尺度计量的现象,需要进行检验时,采用非参数假设检验。非参数统计方法主要有的独立性检验、的一致性检验、的吻合性检验、正负符合检定法、各种等级检定法、游程检验法等。11.2一个正态总体的参数检验11.2.1总体方差已知的均值检验。若总体为正态分布,且总体方差已知,则可先计算检验统计量Z:

其次选择显著水平a,查Z分表,求得两个临界值,若检验统计量Z落在两个临界值构成的区域内,则可作出接受原假设的决策;否则拒绝原假设。图8-1假设检验示意图(双尾检验)

11.2.2总体方差未知的均值检验当总体为正态分布,总体方差未知,n>30时,可用样本方差代替总体方差,采用Z检验。当样本容量n<30,则需要采用t检验。由于总体方差未知,则可用样本方差先估计总体方差,再计算检验统计量t进行假设检验。

它服从自由度为n-1的t分布。

11.2.3.总体比率的假设检验在单个总体比例的假设检验中,当样本容量n大于30,np和n(1—p)两者都大于5时,样本比率p的抽样分布近似正态分布,可采用Z检验。检验统计量为:

其中p0为假设的总体比率,p为样本比率。

11.3两个正态总体的参数检验

11.3.1两个总体平均数之差的检验1.

样本容量n>30,采用Z检验。在检验两个总体平均数之差的假设时,无论总体是否服从正态分布,当样本容量n>30时,来自两个总体的样本平均数之差趋近于正态分布,故可采用Z检验,检验统计量为:

若两个总体方差未知,n>30时,可用样本方差代替或估计总体方差。(2)样本容量n<30,两个正态总体方差未知,采用t检验。如果两个正态总体方差已知,而样本容量n<30时,仍可采用Z检验。如果两个正态总体的方差相等而又未知,且n<30,则采用t分布检验。首先利用两个样本的方差求出它们共同方差的估计值。即:检验统计量为:当时μ1=μ2,t服从自由度为n1+n2的t分布。在给定的显著水平a的条件下,查t分布表,得出临界值ta/2,当│t│≥│ta/2│时,拒绝原假设H0,反之则接受原假设H0。

11.3.2两个总体比率之差的检验当样本容量较大时,来自两个总体的样本比率之差的抽样分布近似服从正态分布。若两个总体的比率P大体相同时,可求两个样本比率的联合估计值,代替未知的总体比率值;再检验统计量Z值进行两个总体比率之差的检验:

11.4正态总体方差的假设检验11.4.1单个正态总体方差的假设检验采用χ2分布检验,有两种检验方法:1.根据样本方差S2和给定的显著水平a,建立总体方差的置信区间,若假设的总体方差σ2

落在置信区间内,则接受原假设,反之,则拒绝原假设。总体方差估计的置信区间为:2.根据样本方差和假设的总体方差,计算检验统计量χ2,然后根据给定的显著水平α查χ2分布的两个临界值,若检验统计量落在两个临界值的区域内,则接受原假设,反之,则拒绝原假设。计算式为:接受区域:

11.4.2两个正态总体方差比的假设检验采用服从F分布的统计量来检验两个总体方差是否相等或同质的问题。有两种检验方法。1.根据两个样本方差建立两个总体之比的置信区间,然后观察

是否落在置信区间内,则可作出接受或拒绝原假设的决策。其置信区间为:

Fa/2根据自由度(n1-l,n2-1)和显著水平a/2从F分布表中查得,F1-a/2/2则根据自由度(n2

-l

,n1-l)和显著水平a/2从F分布表中查得F值后再取倒数。2.直接计算两个样本方差的检验统计量

,再与F分布的理论临界值Fa/2或F1-a/2比较,若F1-a/2<F<Fa/2,则接受原假设;若F<F1-a/2或

F>Fa/2,则拒绝原假设。11.5χ2检定法11.5.1χ2检验的基本原理为了了解某变量出现的实际次数(Oi)与理论次数(Ei)之间是否具有一致性,可采用χ2检验。χ2统计量定义为:

数理统计已证明,在大量的试验中若实际次数分布与理论次数分布相一致时,统计量χ2就服从分布。如果实际结果和理论假设不一致,其统计量χ2值很大,当大到按χ2分布出现的概率很小时,就可判断实际结果和理论假设不一致。χ2检验就是利用这一基本原理。χ2检验可用于独立性检验,一致性检验和吻合性检验。应用时应注意:1.卡方检验都是单尾检验。2.要求实际次数和理论次数必须为绝对次数,不能采用相对次数或频率。3.要求所有观察值的理论次数都需大于等于5,否则需合并。4.样本太小(n<20),χ2检验不能使用;样本太大,又会使检验失效。11.5.2χ2的独立性检验χ2的独立性检验用于判别两个变量或两种分类标准是否有联系的问题,如果两者之间没有联系,则两个变量或两种分类标准是相互独立的。检验两个变量之间是否有联系,通常要将研究对象按两个变量进行交错分类,编制两向分类的列联表,如表设n为样本容量(总次数),变量x1各组的次数合计为ni,组数为,变量χ2各组的次数合计为nj,组数为C;两个变量交叉分组的实际次数用Oij表示,理论次数用Eij表示,则检验统计量χ2为:

其中:理论次数

当显著水平为a时,根据自由度(γ-1)(γ-C)查χ2分布表,得χ21-α临界值,则:

χ2>χ21-α两变量间有联系(不是独立的)

χ2<χ21-α

两变量间独立的χ2的独立性检验,当两个变量的分类都只有两类时,从而形成了2×2的列联表,若用a、b、c、d分别表示其观察值,则χ2统计量的简便公式为:由χ2于分布是一个连续变量分布,而2×2的列联表中用的是离散的方法,其自由度为1,因此1934年耶莎(Yate)提出了修正公式:11.5.3χ2的一致性检验χ2的一致性检验用于判断两个或两个以上的样本比率是否具有显著的差别,或者说检验两个或两个以上的独立随机样本是否来自一致的总体。其统计量和决策法则均与的χ2独立性检验一样,但二者的不同之处有两点:1.独立性检验仅自一总体中抽取样本,而一致性检验是由不同总体分别抽取样本;2.独立性检验是检验不同分类标准间是否互相独立,而一致性检验是检验不同的随机样本所来自的总体是否具有一致性。11.5.4χ2的吻合性检验χ2的吻合性检验又称拟合优度或适合度检验。主要用于检验某变量的实际次数分布与理论分布是否相吻合,亦即判别某变量是否服从于某一理论分布。检验的统计量χ2仍为:自由度v=k-1(k为组数),若总体σ、μ等m个参数未知,须先作估计再求理论次数,则自由度v=(k-m-1)。检验的决策法则为:χ2>χ2(1-α,ν),次数分配不适合某理论分布。χ2>χ2(1-α,ν),次数分配适合某理论分布。理论次数由Ei=nPi确定,其中pi为按某种理论分布计算的概率或频率。11.6符号检验法符号检验法又称正负检验法,主要用于对总体中位数M是否为特定的值M0进行检验。

11.6.1单一样本中位数的符号检验设样本来自的总体的中位数为M0,D为样本内各观察值x与M0的离差,即D=x—M0,若有一个D为0,则删去。当D=x—M0的正负符号数目的概率均等(均为1/2)时,就可接受中位数M=M0的假设。当正号或负号出现的次数超过了应有的理论次数时,就可否定中位数M=M0的假设。

令检验统计量S为正号或负号中出现较少者的次数,则可视为在n次独立试验中成功的次数,故S分布为成功概率p=1/2的二项分布,当S值很小,表示中位数M可能不为M0。1.当样本容量n较小,采用二项分布处理,拒绝M=M0的条件为:2.当样本容量n较大,采用Z分布处理,拒绝M=M0的条件为:以上均为单尾检验,若作双尾检验,只需将显著水平a改为a/2即可。11.6.2两个独立样本的符号检验两个独立样本的符号检验用于检验抽自两个总体的独立样本的中位数是否相同。检验的方法是将两个样本的观察值统一按照顺序排列,找出中位数(M0),并分别计算各样本的D=x—M0的正、负符号数目,并整理成列联表的形式,采用χ2检验:若:χ2<χ21-α,两个总体中位数相同。

χ2>

χ21-α,两个总体中位数不同。

11.6.3两个有联系样本的符号检验两个有联系样本的符号检验主要用于对某种处理或试验进行比较,用以说明这种处理或试验是否具有显著的效应。检验时,要求两个有联系的样本有n对成对的样本观察值(x1,y1),(x2,y2),……,(xn,yn),然后计算观察值之差xi-yi再计算这些观察值之差M0的正负符号数目S+或S-,即可采用下列方法检验这种处理或试验是否具有显著的效应。1.n小,采用二项分布检验:效应显著

其中S为S+、S-中的较小者。双尾检验将a改为a/2。

2.n大,采用Z分布检验:

效应显著

11.7等级检验法

11.7.1符号等级检验法符号等级检定法不仅要考虑观察值与平均数或中位数之差的正负号,同时还要考虑其差额的大小,故检验的效率比单纯的符号检定法要高一些,又称威尔科克森检验法,可用于检验总体中位数M是否为特定值M0,也可用于两个有联系的样本的比较。设x为观察值,M0为中位数的特定值。则单一样本的符号等级检法的步骤为:1.求D=x—M0,并删去D=0者,使有效样本大小为n。2.排定|D|的等级,如绝对值有两个或两个以上相同的,则先给每个|D|一个顺序等级,再求其平均数代表它们的相同等级。3.分别求算D的正、负等级之和T+,T-;且检查4.以统计量T表示T+或T-二者中的较小者。5.作出检验决策。决策法则因样本大小不同而不同:

(1)当5≤n≤30,T≤Ta时,则M≠M0;或T≤Ta-2,则M≠M0。(2)当n>30,采用正态分布,计算统计量:若Z<-Z(1-a),则M≠M0;或Z<-Z(1-a/2),M≠M0。11.7.2曼—惠特尼U检验这种检验方法是建立在等级和的基础上的检验,常用于两个独立样本的比较,以检验两个总体是否具有相同的分布,或者检验两个独立样本所来自总体的中位数是否相等。它有两个基本假定:一是两总体均为连续分布,且变异程度相同;二是两个独立样本均为随机样本。其检验的步骤为:1.将两个样本混合排列,按观察值大小编上等级;2.分别计算两个样本的等级和,即T1,T2。3.计算两个样本的统计量U1,U2。U1+U2=n1n2,故取U1,U2中的小者作为检验统计量U。

4.作出检验决策。当n1,n2均≤20时,根据a、n1、n2查曼—惠特尼检验临界值表,决策法则为:U≤U(a),两个总体不具有相同分布(中位数不同)U≤U(a/2),两个总体不具有相同分布(中位数不同)当n1,n2中有一个大于20时,采用Z检验:Z<-Z(1-a),

两个总体不具有相同分布(中位数不同)。Z<-Z(1-a/2),两个总体不具有相同分布(中位数不同)。11.7.3多个样本的等级检验法多个样本的等级检验法又称克罗斯考尔—瓦里斯单因素方差分析法,它也是建立在等级和基础之上的非参数检验方法。它同样要求研究的变量是连续的,计量的水准至少是顺序的。检验时,等级的编排与等级和的计算同曼—惠特尼U检验相同,但检验的统计量为H:

其中:Ti为各样本的等级和,ni为各样本容量,n为各样本容量的总和。

H是近似于自由度为k-1的χ2分布,故可利用χ2分布进行检验。决策法则为:H>χ21-2:k个总体的中位数不相同。H<χ21-2

:k个总体的中位数相同。11.8趋势性与随机性检验11.8.1趋势性检验趋势性检验在于判别某种序列是否具有增加或减少的趋势性(倾向性),在实际工作中,某些数列的发展趋势往往不够明显,难以运用图表判别序列是否具有趋势性,可采用LOX-stuart趋势性检验法进行检验。基本程序为:1.建立假设,有三种情形:(1)H0:无增长趋势;H1:有增长趋势(2)H0:无减少趋势;H1:有减少趋势(3)H0:无趋势性H1:有趋势性2.数据配对。具体做法取xi和xi+c组成一对,这里c为:

n/2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论