版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
群体间的差异比较——卡方检验第8章内容提要8.1卡方检验原理8.2拟合问题——样本率和已知总体率的比较8.3独立性检验——两个(多个)变量的相关8.4卡方检验的局限性及补救办法8.1卡方检验原理3卡方检验变量连续变量分类变量有序分类变量无序分类变量秩和检验卡方检验T检验、方差分析卡方检验原理原假设H0:每一个卡通片被选择为喜欢的可能性是相同的。即假定所研究的总体服从均匀分布,因此每一个卡通片被选择的概率π都应该是1/6。如果为真,300名儿童挑选每种卡通片的可能性应该是相等的,则选择每种卡通片的期望频次应该是:fe=nπ构造卡方统计量:例:许多儿童都喜欢看卡通片,有的人认为只要是卡通片儿童都爱看,而不管其类型;另一些人认为儿童对不同类型的卡通片有不同的偏好。为此,他们提供了6种类型的卡通片,让300名经常看电视的儿童观看,然后说出喜欢看哪一个,得到如下表所示的数据。卡方检验原理300名儿童对不同类型卡通片的偏好分布卡通片编号观测频次f0概率π(H0为真)期望频次fe=nπ偏差f0-fe偏差平方(f0-fe
)2加权结果(f0-fe
)2/fe1851/65035122524.52801/65030900183551/6505250.54101/650-401600325401/650-1010026301/650-204008合计30013000χ2=85P<0.001(二)非参数检验卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相互关联或相互独立。卡方检验的原假设H0是:观测频数与期望频数没有差别。卡方检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观测值与理论值之间的偏离程度。根据χ2分布,χ2统计量,以及自由度可以确定在假设H0成立的情况下获得当前统计量及更极端情况的概率P。判断:如果P值很小,说明观测值与理论值偏离程度太大,应当拒绝原假设,表示比较的类别之间有显著差异;否则就不能拒绝原假设,不能认为样本所代表的实际情况与理论假设有差别。8.2拟合问题
——样本率与已知总体率的比较8拟合问题————样本率与已知总体率的比较对于连续变量,我们可以使用单样本的t检验考察样本所在总体的均值与已知值是否存在显著差异,即样本均值与已知值的差异。对于分类变量,则可以使用卡方检验比较样本比率与已知值的差异。什么是拟合问题?假设一个总体中,某个变量的可能取值有n个水平;某一已知样本中,该变量的取值也是这n个水平。现在需要从样本的分类数据出发,来判断总体各取值水平出现的概率是否与已知概率相符,即该样本是否的确来自已知的总体分布。即单样本率与总体率的比较,被称之为拟合问题。拟合问题————样本率与已知总体率的比较原假设H0:摇奖机工作正常,则每个号码出现的概率为1/10。注意:原始数据在分析时,首先进行加权!!Analyze——NonparametricTests——Chi-Square例1:有奖有息储蓄摇奖的办法一般采取刻有数码0-9的编号球投入摇奖机,然后按一定规则,把摇出的数码组合成兑奖号码。南京市自开办有奖有息储蓄以来,13期中奖号码中各数码出现的频次见“数据摇奖.sav”。试判断摇奖机工作是否正常?拟合问题————样本率与已知总体率的比较所有类别比例相等自定义类别比例拟合问题————样本率与已知总体率的比较残差值卡方值P值小于5%,可以拒绝原假设。认为摇奖机工作不正常。拟合问题————样本率与已知总体率的比较原假设H0:顾客今年的颜色偏好与去年无显著差异。Analyze——NonparametricTests——Chi-Square例2:美国某小汽车经营商根据去年销售的小汽车颜色的百分率,认为今年顾客选择各种颜色的数目仍将不变,即20%的人选择黄色,30%选择红色,10%选择绿色,10%选择蓝色,30%选择白色。他随机抽取了150名顾客,询问他们所喜好的颜色。结果见color.sav。问是否应拒绝该经营商的假设?拟合问题————样本率与已知总体率的比较依次输入期望的类别比例。拟合问题————样本率与已知总体率的比较P值小于5%,可以拒绝原假设。顾客今年的颜色偏好与去年相比存在显著差异。8.3独立性检验
——两个(多个)变量的相关问题16独立性检验——两个(多个)变量的相关问题卡方检验可以非常容易地推广到两样本或多样本比较的问题,即应用卡方检验总体中两个特性有无相关性,这种检验也叫独立性检验。例:在电视收视率调查中,得到性别与收视习惯的列联表如下。试建立数据文件并分析性别与收视习惯的相关联系。男女几乎天天看3824偶尔看317独立性检验——两个(多个)变量的相关问题Analyze——DescriptiveStatistics——Crosstabs进行卡方检验独立性检验——两个(多个)变量的相关问题Analyze——DescriptiveStatistics——Crosstabs观测频数期望频数输出残差标准化残差独立性检验——两个(多个)变量的相关问题双侧近似概率Pearson卡方统计量双侧精确概率对数似然比计算的卡方Fisher’s确切概率法线性相关的卡方值,检验行列变量是否线性相关,多用于定序变量8.4卡方检验的局限性及补救办法21由于卡方检验简单直观,而且交互分析表又能提供非常丰富的信息,因此在各种调查统计中这种交互分析(列联表加卡方检验)的应用十分广泛。在实际应用中,不但定类变量采用此方法,对定序甚至定距变量也粗略地划分成几类后做成列联表。这可以从某种意义上简化数据,但这种交互分析也存在其局限性。卡方检验的局限性及补救办法卡方检验的局限性:卡方值随分类的不同而改变。如对教育程度、收入水平的分类,因此分类时最好有理论或实践依据,或者统计依据(中位数、四分位数等)样本量不能太小,也不宜过大。样本量太小,采用卡方分布为依据的检验便不再成立。一般要求n>40。但样本量过大,有时得到的结果便会失去意义。卡方值受样本量影响很大:样本量越大,越容易得到拒绝原假设H0的结果。卡方检验的局限性及补救办法卡方检验的局限性:列联表中期望频数小于5的个数不能太多。通常建议所有的期望频数都不小于5,最多也不能超过20%。如对3×5的列联表,共15个格,则期望频数小于5的格数不能超过3个。如果超过了20%,则需要对卡方值加以修正。对于连续型变量(定距、定比变量),卡方检验无法揭露其数量性质。卡方检验的一般原则:只要有数量型的变量出现,就应该采用可以提示其数量性质的统计工具(如t检验、方差分析、秩和检验等)来分析。卡方检验更适用于定类变量。卡方检验的局限性及补救办法统计指标的选择:当样本量n≥40,且所有单元格的期望频数fe≥5时,用普通的Pearson卡方检验;当样本量n≥40,且只有20%以下的单元格的期望频数1≤fe<5时,用校正的卡方检验:如对数似然比(LikelihoodRatio)计算的卡方,或用于2×2格表的连续性校正的卡方(ContinuityCorrection);当样本量n<40,或有20%以上的单元格期望频数fe<5,或有单元格期望频数fe<1时,采用确切概率法(Fisher’sExactTest).卡方检验的局限性及补救办法本章练习1、数据36选7.sav是体彩36选7连续45期中奖号码出现频次的统计,试分析中奖号码的出现概率是否随机。2、在周六晚节目单修订后,分别作了收视率的调查。在节目修改前,收视率记录为ABC29%,CBS28%,NBC25%,ITV18%。节目修改后,300个家庭所组成的样本产生下列电视收视数据:ABC95户,CBS70户,NBC89户,ITV46户,在5%的显著性水平下,检验电视收视率是否发生了变化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《专利检索与撰写》课程教学大纲
- 《行政管理专业实习》课程教学大纲
- 医疗纠纷防范技巧课件
- 小儿生理、病因、病理特点课件
- 2024年低价整修院子合同范本
- 2024年代理配货合同范本模板
- 2024年冰雪制冷采购合同范本
- 主题性区域活动教研
- 儿童抽搐护理查房
- 湖北省武汉市武昌区粮道街中学2024-2025学年上学期期中七年级英语试题(含答案无听力原文及音频)
- 幼儿园中班数学活动《图形分类》
- 2013工程量清单计价规范计算规则汇总
- 融资租赁租金计算表
- 大气的受热过程教案5页
- 中国古代服饰演变PPT
- 220kVGIS组合电器安装施工方案
- 爱护公物_从我做起ppt
- 淡谈柴油机冒黑烟故障的诊断与排除1
- 河南省南阳市高中毕业生登记表普通高中学生学籍册
- 低血糖的预防及处理(课堂PPT)
- 环境工程专业英语翻译理论PPT选编课件
评论
0/150
提交评论