第十章 卡方检验_第1页
第十章 卡方检验_第2页
第十章 卡方检验_第3页
第十章 卡方检验_第4页
第十章 卡方检验_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章卡方检验李金德思考:例1:随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异?39大于21,所以学校决定不要分科。这样做可以吗?例2:例某企业生产三种类型的手机:A类型、B类型、C类型。在一次市场调查中,公司市场研究小组提出了男女使用者对于三种手机类型偏好是否有差异的问题。有的人因此用t检验检验两者的差异,这样做行吗?ABC男204020女303010第一节检验的原理一、检验的假设(一)分类相互排斥,互不包容检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。(二)观测值相互独立各个被试的观测值之间彼此独立,这是最基本的一个假定,如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。

注意:当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。(三)期望次数的大小有规定为了努力使分布成为值合理准确的近似估计,每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格的标准,当自由度等于1时,在进行检验时,每一个单元格的期望次数至少不应低于10,这样才能保证检验的准确性。另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使用近似的检验。

二、检验的类别(一)配合度检验

配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近。这种检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。

(二)独立性检验

独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。这种类型的检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独立),如果再加入另一个变量的影响,即探讨三个变量之间关系时,就必须使用多维列联表分析方法。(三)同质性检验

同质性检验的主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著差异。当用同质性检验检测双样本在单一变量的分布情形,如果两样本没有差异,就可以说两个母总体是同质的,反之,则说这两个母总体是异质的。

三、检验的基本公式

检验的统计原理,是比较观察值与理论值的差别:1.如果两者的差异越小,检验的结果越不容易达到显著性水平;2.两者的差异越大,检验的结果越可能达到显著性水平,就可以下结论拒绝虚无假设而接受备择假设。基本公式如下:

其中表示实际观察次数,表示某理论次数。要求:≥5四、小期望次数的连续性校正运用检验时,有一个特殊的要求,单元格的理论次数不得小于5,小于5时可能违反统计基本假设,导致统计检验高估的情形出现。通常需要有80%以上的单元格理论值要大于5,否则检验的结果偏差非常明显。当单元格的人数过少时,处理的方法有四种:单元格合并法增加样本数去除样本法使用校正公式第二节配合度检验配合度检验(goodnessoffittest)主要用于检验单一变量的实际观察次数分布与某理论次数是否有差别。由于它检验的内容仅涉及一个因素多项分类的计数资料,故可以说是一种单因素检验(One-waytest)。一、配合度检验的一般问题(一)统计假设

统计假设如下:基本公式:

(二)自由度的确定

自由度确定的一般原则是:以相互独立的类别数k(或C)减去所受的限制数,即在各种适合性检验中,如果理论次数只受到总和的限制,即受的限制,则自由度为在正态分布的适合性检验,受到三个条件的限制,其自由度为

(三)理论次数的计算规则

数据分布以其理论概率为依据,这时的理论次数等于总次数乘以某种属性出现的概率,即

理论次数的计算,一般是根据某种理论,按一定的概率通过样本即实际观察次数计算。某种理论有经验概率,也有理论概率,如二项分布、正态分布等。

二、配合度检验的应用(一)检验无差假说

无差假说,是指各项分类的实计数之间没有差异,也就是假设各项分类之间的机会相等,或概率相等,因此理论次数完全按概率相等的条件计算。即:

理论次数=总数×例10-1:随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异?(p298)

解:此题只有两项分类。假设两项分类的实计数相等或无差别,其各项实计数的概率应相同,即p=q=0.5。因此,检验的问题“对分科的意见是否有显著差异”实际上是指每种态度的实计数与理论次数差异是否显著,因各项的理论次数项数相同,故可理解为对分科的态度是否一样或是否有差异。故:1)建立假设3)统计决策例10-2:某项民意测验,答案有同意、不置可否、不同意三种。调查了48人,结果同意的24人,不置可否的12人,不同意的12人。问持这三种意见的人数是否有显著不同?(p299)

解:此题为检验无差假说,已知分类的项数为三,故各项分类假设实计数相等。所以

1)建立假设

2)计算统计量

3)进行统计决策

查表,当时,因为,所以。达到显著性水平,拒绝原假设。说明三种态度有显著差异。

(二)检验假设分布的概率

假设某因素各项分类的次数分布为正态,检验实计数与理论上期望的结果之间是否有差异。因为已假定所观察的资料是按正态分布的,故其理论次数的计算应按正态分布概率,分别计算各项分类的理论次数。具体方法是先按正态分布理论计算各项分类应有的概率再乘以总数,便得到各项分类的理论次数。

如果不是事先假定所观察的资料为正态分布而是其他分布,如二项分布、泊松分布等,其概率应按各所假定的分布计算。事先假定的分布不是理论分布而是经验分布,亦可按此经验分布计算概率,在乘以总数便可得到理论次数,从而进一步检验假设分布与实计数的分布之间,亦即实计数与理论次数之间差异是否显著。例10-3:某班有学生50人,体检结果按一定标准划分为甲乙丙三类,其中甲类16人,乙类24人,丙类10人,问该班学生的身体状况是否符合正态分布?(299)解:该题中的理论次数应按假设的正态分布概率计算。按正态分布,就可以认为包括了全体,各等级所占的横坐标应该相同(),故各类人数应占的比率为:

答:可以说该班学生的身体状态不符合正态分布,或者说该班学生身体状况甲乙丙三类的人数分布与正态分布有显著差异。2)计算统计量例10-4:根据以往的经验,某校长认为高中生升学的男女比例为2:1,今年的升学情况是男生85人,女生35人,问今年升学的男女比例是否符合该校长的经验?(p300)解:此题是假设男女生升学的人数分布与校长的经验分布相同,故理论次数应按经验分布的概率计算。理论次数为:1)建立假设H0:男女升学比例符合校长经验H1:男女升学比例不符合校长经验

三、连续变量分布的吻合性检验(自学)复习1、什么是检验2、检验的步骤3、检验的类别(第二节)

目的:实际观察频数分布与理论频数分布是否相一致,或者说有无显著差异问题。包括:一个因素的多个分类多个因素的多个分类检验统计量:应用:计数数据返回

步骤(1)建立检验假设

H0:fe-f0=0H1

:fe-f0≠0(2)求检验统计量值(4)确定临界值,进行统计决策返回(3)确定自由度,显著性水平=0.05

如果>0.05(df),则拒绝H0配合度检验:拟合优度检验,重点考察一个观测次数分布(实际频数)与理论预测次数分布(理论频数)之间的差异。适用于研究某总体的分布是否与某种分布相符合。如:课堂练习例某企业生产三种类型的手机:A类型、B类型、C类型。在一次市场调查中,公司市场研究小组提出了男女使用者对于三种手机类型偏好是否有差异的问题。ABC男204020女303010问题:

手机偏好与使用者性别是否有关联?两个因素是否关联第三节独立性检验

教学内容一、独立性检验的一般问题与步骤1、几个重要概念2、独立性检验的内涵3、独立性检验的步骤四、独立性检验的两种类别四格表独立性检验列联表独立性检验五、列联表独立性检验一、几个重要概念1、列联表定义:呈现两个变量之间关系的表格记录两个变量不同水平的各种组合的被试频数2、观测频数实际观测到的频次3、期望频数假设两个变量之间没有任何联系的情况下,我们所预期的各种变量组合应有的频次4、边缘值列联表中每一行和每一列的观测频数的总和返回横标目纵标目表示变量X的r种水平表示变量Y的c种水平32列联表单元有20名被试在性别变量上是“男性”,在偏爱的手机上是“A类型”返回ABC男204020女303010计算期望次数如果性别与偏好无关,说明表中150个被试,8/15是男性,7/15是女性,则喜爱A类型的50人中,有8/15是男性,7/15是女性边缘值边缘值fe1=(5080)/150=26.67fe2=(7080)/150=37.3fe3=(3080)/150=16fe4=(5070)/150=23.33fe5=(7070)/150=32.7fe6=(3070)/150=14返回二、独立性检验的内涵独立性检验表示——对于x的每个值,y值的次数分布是否有差异。如果对于x的每个值,y值的次数分布一样,则表示:x变量和y变量毫无关系。如果对于x的每个值,y值的次数分布有差异,则表示:x变量和y变量有关联,或说两变量存在相关。所以,独立性检验也是对两个变量之间相关程度的一种检验。如果性别与手机类型偏好之间无联系,则表示不论男女,对这些手机都具有一致的偏好。那么,每个观测频次就应该与相应的期望频次相同,这时卡方值为0。如果性别与手机类型偏好之间联系越紧密,则表示较多的男性喜欢某种类型,而较多的女性喜欢其他类别的手机。则观测频次与相应的期望频次的差异越大。两个变量之间联系越紧密,观测频次与相应期望频次的差异就越大,这时卡方值就越大。返回例某企业生产三种类型的手机:A类型、B类型、C类型。在一次市场调查中,公司市场研究小组提出了男女使用者对于三种手机类型偏好是否有差异的问题。ABC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论