7假设检验:均值与百分率_第1页
7假设检验:均值与百分率_第2页
7假设检验:均值与百分率_第3页
7假设检验:均值与百分率_第4页
7假设检验:均值与百分率_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章假设检验:均值与百分率

第一节基本知识假设检验概念:先成立一个关于总体情况的假设,继而抽取一个随机样本,然后以样本的统计值来验证假设类型:参数假设检验、非参数假设检验特点:采用逻辑上的反证法、依据统计上的小概率原理过程:提出假设、抽取样本、作出决策一、研究假设与虚无假设1、研究假设:科学研究一般是先成立假设,即假定在总体中存在某些情况,如假定青年中同意一胎化政策与反对一胎化政策的比例相等,或者假设变量X与变量Y相关。这个假设称为研究假设(简写H1)。研究的目的就是要知道它是对还是错。当我们用随机样本的资料作统计推论的时候,不是直接检定研究假设,而是首先检定与研究假设相对立的假设,从而间接检定研究假设正确的可能性。2、虚无假设:与研究假设相对立的假设,在统计学上称为虚无假设(简写H2)。例如研究假设是X与Y相关,则虚无假设就是X与Y不相关。检定假设的基本原则是直接检定H0,因而间接地检定H1,目的是排除抽样误差的可能性。二、否定域与显著度1、否定域(简写CR):抽样分布内一端或两端的小区域,如果样本的统计值在此区域范围内,就否定虚无假设。(1)否定域可以在抽样分布的一端或者两端,具体视研究假设的性质(H1)而定。否定域只在一端称一端检定,在两端称两端检定。(2)否定域的大小(一般是相当小的),取决于研究的需要,但最好是在抽样之前就决定,避免放“马后炮”的问题。如:在抽取10个青年考察他们对一胎化政策的态度例题中,CR≥9个。2、显著度(简写P):表示否定域在整个抽样分布中所占的比例,也即表示样本的统计值落在否定域内的机会。(1)显著度的大小,视乎研究的需要。在当前的社会学研究中,多用P≤0.05或P≤0.01.(2)显著度愈小,便愈难否定虚无假设(H0

),也即愈难证明研究假设(H1

)是对的。三、一端(单边/单尾)与二端检定(双边/双尾)1、一端检定:否定域只在一端(可以在右端,也可在左端)。二端检定:否定域在两端的位置。2、一般地讲:选用一端检定还是两端检定,取决于它是否可以确定研究假设(H1)的方向。如果根据某项理论或自己的经验,在成立H1

时可以定出方向,则选用一端检定的方法。例如:H1

:总体中同意的人数多于反对的人数。一端检定。例如:H1

:总体中同意人数不等于反对人数。两端检定。3、如果所选定的显著度相同,两端检定比一端检定更难否定虚无假设。假设研究的问题二端检定左侧检定右侧检定H1m≠m0m<m0m>m0H0m=m0mm0mm0左侧检定

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量右侧检定

(显著性水平与拒绝域)

H0值临界值a样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量二端检定

(显著性水平与拒绝域)

H0值临界值临界值a/2a/2

样本统计量拒绝域拒绝域接受域抽样分布1-置信水平四、假设检验中的两类错误:甲种误差与乙种误差1. 甲种错误(弃真错误):“以真为假”的第一类错误;虚无假设为真时拒绝虚无假设的可能性甲种错误的概率为被称为显著性水平2. 乙种错误(取伪错误):“以假为真”的第二类错误;虚无假设为假时接受虚无假设的可能性乙种错误的概率为

乙种错误的计算比较复杂,略去不谈。在样本量和统计方法确定的前提下,甲种误差与乙种误差是对立的,成反比的。小就大,大就小。一般研究中比较注意防止犯第一类错误,即不愿意“以真为假”,而不大考虑犯第二类错误的概率,因此一般都把概率都取得较小,这种假设被称为显著性检验。要完全消除两种误差是不可能的,减少两者的最简单的方法在于把样本增大。决定样本大小的最重要准则是:在研究资源(人力、物力和时间)许可的范围内,尽可能抽取最大的样本。同时,在决定了样本的大小后,还可用检定能力较强的推论统计法来减少误差。五、检定力:参数与非参数法检定假设的推论统计法有很多种,可以分为两类:参数鉴定法和非参数鉴定法。两者检定能力各不同,以前者较强。统计法的检定力:是指该统计法能够准确地判断虚无假设(H0)正误的能力由于统计推论之前,已经决定显著度(即甲种误差)的大小,故检定力的大小其实是指乙种误差的大小;如果在统计推论时所犯的乙种误差越小,该统计法的检定力就越大。检定力=1-乙种误差之机会1、参数检定法参数检定法的鉴定力大于非参数检定法,是因为原则上其在检定假设时所犯的乙种误差较小。参数检定法的特点:要求总体具备某些条件,如正态分布、标准差相等、要求变项的数值具有定距测量层次的特质。倘若总体具备这些特点,参数检定法能相当准确地判断虚无假设的正误。以后讲到的:Z检定法、F检定法、t检定法都是参数检定法。非参数检定法:也称分布自由检定法。其特点是不要求总体数值具备特殊的条件。以后介绍的卡方检定法就是非参数检定的一种。2、非参数检定法非参数检定法,一般不要求变量有定距测量性质,因而适用于推论定类与定序资料。但是,因为非参数检定法不理会总体的情况,在推论时就较为困难,准确性也因此受影响。因此,在总体确实具备某些条件时,参数检定法比非参数检定法更好。社会学界很重视非参数检定法,一方面因为它无需假定总体具有特殊的条件。另一方面是因为任何推论统计法的检定力都是与样本的大小成正比的。非参数法的检定力虽然较弱,但只要样本加大,就可使检定力增强。社会学所抽取的样本一般都是比较大的,超过100甚至1000都是经常的,使得非参数检定法取得相当大的检定力。因此,当样本足够大时,我们尽可以放心使用各种非参数检定法。六、检定假设的步骤根据研究假设(H1)成立虚无假设(H0)。选择适当的检验统计法,列举其假定和要求。确定抽样分布。规定显著性水平a,确定一端还是两端检定,然后从抽样分布中求出否定域的位置和大小。注意:所要求的显著度愈高,否定域就愈小,便愈难否定H0;再者,二端检定比一端检定更难否定H0,故此H1最好能说清方向。计算检验统计量的值,作出统计决策。若检定值在否定域的范围内,则否定H0,即H1可能是对的;否则就不能否定H0,也即H1可能是错误的。一个总体的单均值检验Z检验(大样本)

t检验(小样本)Z检验(大样本)

2检验(小样本)均值一个总体比例方差第二节单均值与均值差异一、单均值Z检定法与t检定法属于参数检定法。应用条件:①定距变量②随机抽样③总体正态分布。样本相当大时(n≥100)用Z检定法,样本较小,特别是n≤30时,用t检定法。

1、Z检定法(大样本)

假定H0是:总体均值是M。如果是大样本,则无限个样本均值的抽样分布会近似正态分布,正态分布的均值就等于总体的均值M,样本标准差SE就等于总体的标准差S除以样本大小n的平方根。公式:

Z检定法就是用标准化公式所计算得的Z值来检定虚无建设。这个数值,通常称为检定值。

假设检定基本逻辑:先设立H0(即总体均值是M),进而以此为基础来确定抽样分布。倘若我们所抽取的一个随机样本中的均值(),在以H0为基础的抽样分布中出现的机会是很小的,那就理应否定虚无假设(H0),改而接受研究假设(H1)。所选定的显著度愈高,愈难否定H0,也即愈难接受H1.单均值Z检验左侧:H0:0H1:<0Z0拒绝H0右侧:H0:0H1:>0Z0拒绝H02、t检定法(小样本)如果是小样本,尤其当n≤30,就要改用t检定法。公式:

需要注意:t的抽样分布形状(如扁平或高耸的程度)取决于自由度。所谓自由度(简写为df)是指有多少个个案的数值可以随意变更。如样本的均值,显然只有一个个案的数值受到限制,其余都可以自由变动。换言之,无论其余的个案数值怎样变动,我们都可以用一个来调节,获得已知的样本均值。因此df=n-1.而小样本的t分布就是取决于此数值的大小,df越小(即样本越小),则t分布就越扁平,df越大(即样本越大),则t分布就越高耸,且接近正态分布。既然不同自由度的t分布形状略有不同,则每个显著度所代表的否定域的大小也就有所不同。二、两个均值的差异两个正态总体的均值检验Z

检验(大样本)t

检验(小样本)t

检验(小样本)Z检验F

检验独立样本相关样本均值比例方差Z检定法与t检定法属于参数检定法。应用条件:①随机抽样②每个总体都是正态分布③两个总体的标准差相等。样本相当大时(n≥100)用Z检定法,样本较小,特别是n≤30时,用t检定法。1、Z检定法. 两个样本的个案总数额大,一般在(n1+n2)≥100时,可用如下公式:虚无假设:H0:u1

=

u2

;研究假设:H1:u1

u2

;如果每次抽取的两个随机样本的个案总数较大,则其平均差的抽样分布会近似正态分布。2、t检定法检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布或近似服从正态分布3、研究假设:H0:M1<M2;虚无假设:H1:M1=M24、计算公式:三、多个均值的差异研究时可能有三个或三个以上的样本,如比较三个或三个以上地区的家庭平均收入。这时通常运用方差分析比较样本之间的均值差异。H1:M1≠M2≠M3;H0:M1=M2=M3…倘若所研究的只有两个样本,则方差分析法(F检定)也可用来检定两个样本均值的差异,不一定要用前面介绍的Z检定法或者t检定法。因此,在社会学研究中,方差分析是很重要的和经常被应用的。Z检定法与t检定法的分别,在于前者基于正态抽样分布,要求大样本,后者则基于t值抽样分布,则可用于小样本。但是,当样本增大时,t值分布会逐渐接近正态分布,这时t检定法与Z检定法的分别就不大。因此,无论样本的大小如何,都可以用t检定法。Z检定法可以说是t检定法的一种特殊(大样本)情况。在社会学研究中,t检定法的应用更广泛。一个总体的检验Z

检验(单尾和双尾)

t检验(单尾和双尾)Z

检验(单尾和双尾)

c2检验(单尾和双尾)均值一个总体比例方差第三节单百分率与百分率差异一、单百分率(或比例)—Z检验样本较大时,百分率的抽样分布就会近似正态分布,故可用Z检定法。同时如果样本较大,Z检定法不要求总体是正态分布,只要求是随机抽样,公式如下:若样本较小,要改用二项抽样分布来检定假设。此时用于假设检定的是t检定法。二、两个百分率(或比例)的差异—Z检定法1. 假定条件两个总体是独立的

两个随机样本百分率之差的抽样分布接近正态分布2.计算公式:假设研究的问题没有差异有差异比例1≥比例2比例1<比例2总体1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论