版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第18章卡方检验
Chi-squareTest北京师范大学心理学院刘红云2014.10.13参数检验参数检验的方法,都是在给定或假定总体的分布形式基础上,对总体的未知参数进行估计或检验。总体的分布模式已经知道。参数检验需要满足某些总体参数的假定条件。例如:t检验、方差分析、Person相关分析解决的问题:一组独立样本是否是同分布的(取自同一总体)?一组相关样本是否是同分布的?两个变量是否独立?非参数检验非参数检验对总体分布不做严格假定,特别适用于计量信息较弱的数据,往往仅依据数据的顺序等即可进行统计推断。尚不知道总体的分布模式。与参数检验解决的问题是一样的非参数检验的特点一般不需要严格的前提假设,不论样本来自的总体分布形式如何,都可适用;可用于不便精确测量的数据或顺序数据(等级变量);可用于小样本;某些非参数检验方法计算简便,研究者在急需获得初步统计结果时可采用;未能充分利用数据的全部信息,导致检验效率下降,犯第Ⅱ类错误的可能性比参数检验大;另一局限性在于目前还不能处理“交互作用”。卡方检验的用途卡方检验主要用来检验分类数据的分布与关联,常用的卡方检验有:拟合度检验(testofgoodnessoffit):检验数据的次数分布是否符合某种特定的分布。独立性检验(testofindependence):检验两个类别变量之间是否有关联。拟合度检验我们经常想要知道样本在某些性质上的比例分布是否与总体相同。北京市居民的年龄分布是否与全国的人口年龄分布相同?民意调查的样本中,被访者的教育程度分布是否能正确反映全国人口的教育分布?用英国统计学家KarlPearson所发明的chi-squaregoodness-of-fit来进行统计检验。拟合度检验美国商业司以收入将家庭分类。人口统计资料显示美国的家庭收入有下列的分布:拟合度检验J市的市长想要知道该市的收入分布是否与全美国的情况相当:H0:p1=.2,p2=.3,p3=.4,p4=.1H1:H0中至少有一个比例不正确在J市中抽取200户人家来验证上述假设,并算出每层级收入中,实际的观察频数(observedfrequencies)分别为o1,o2,o3,o4。拟合度检验如果虚拟假设为真,则200户预期的分布为:拟合度检验将实际观察频数与期望频数作比较,如果两个次数十分接近,则虚拟假设为真的概率很大,但如果两者差距很大,则虚拟假设为真的概率不高。拟合度检验如何知道两组数字的差距是否够大?为了方便检验两者的差距是否很大,以一个简要的指标来衡量皮尔逊证明,该检验统计量满足自由度v=k-1的卡方分布。拟合度检验Chi-squareGoodness-of-FitTest:拟合度检验拟合度检验临界值
=7.815拟合度检验由上述的讨论可知,卡方拟合度检验的步骤为:(1)对于总体的分布作了一些假设,(2)然后找出在假设为真的前提下,预期得到的样本分布(3)比较实际观察到的分布与预期分布之间是否一致,以此来验证对于总体分布的假设是否合理。例题FBI公布1995美国暴力犯罪的类型分布500件2005年犯罪的随机样本请问暴力犯罪型态从1995以来是否已经发生变化例题请问暴力犯罪型态从1995以来是否已经发生变化?H0:2005年犯罪类型分布与1995一致H1:2005年犯罪类型分布与1995不同例题如果暴力犯罪的型态分布没有改变,则500件随机样本的预期期望值例题期望频数与观察频数的对比表例题临界值
=7.815
列联表列联表(contingencytable)为两个或两个以上类别变量所形成的观察频数表。社会中大多数的事件是同时发生或互相关联的:教育程度与薪资;人口密度与犯罪率;市场中厂商的数目与商品价格独立性检验从总体中抽取样本数为n的样本,假设每一个观察值可用两个不同的属性来交叉分类,我们想知道这两种分类方式是否相关?或者说两种分类方法是否独立?这种检验通常以列联表的方式来进行,故又称为列联表检验。X,Y的联合概率分布表例题广告公司想要了解观众的所得收入与电视节目收视是否相关,其虚拟假设为:H0:电视节目的选择与收入无关H1:收入与选择电视节目有关该公司抽取500户为样本,先用收入将样本区分成高、中、低三类,再以收看电视的种类分成运动、电影、新闻三类。例题以列联表方式呈现数据传统上以oij表示第i行第j列的观察值。如o32=13例题计算期望频数:设列联表有R行C列,如果行的类别用Ri来表示,列的类别用Cj来表达,并以小写字母ri及cj分别代表各类别的次数。如果Ri和Cj为独立事件,则P(Ri∩Cj)=P(Ri)‧P(Cj)虽然不知道总体中各类别发生的真正概率,但根据各类别观察次数来计算其相对次数,即以ri/n来估计P(Ri),cj/n来估计P(Cj)。
例题我们想要验证下列的虚拟假设:H0:P(Ri∩Cj)=P(Ri)‧P(Cj)foralliandjH1:P(Ri∩Cj)≠P(Ri)‧P(Cj)foratleastoneiandj如果虚拟假设为真:eij=n‧P(Ri∩Cj)=n‧P(Ri)‧P(Cj)如果用(ri/n)(cj/n)来估计总体中未知的概率P(Ri)P(Cj)则期望次数可以表为:eij=n(ri/n)(cj/n)=ricj/n例题计算下表的期望次数250*250/500=125150*50/500=15例题根据观察到的次数与预期次数是否一致,我们可以检证两参数为独立的假设是否合理。我们用下列的卡方统计量来做检证:例题计算χ2Criticalvalue=9.49例题例:某药品检验所随机抽取574名成年人,研究某抗生素的耐药性。其中179例未曾使用该抗生素,其耐药率为40.78%;而在395例曾使用过该药的人群中,耐药率为45.57%,试问两种人群的耐药率是否一样?用药史不敏感敏感合计耐药率(%)曾服该药.57
未服该药7310617940.78
合计25332157444.08例题建立检验假设H0:两种人群对该抗生素的耐药率相同H1:两种人群对该抗生素的耐药率不相同计算检验统计量查表及统计推断χ20.05(1)=3.84,本例χ2<χ20.05(1),P>0.05在α=0.05的检验水准下,接受H0。33Φ相关系数计算公式Φ相关用药史不敏感敏感曾服该药180215未服该药73106
如果abcd都扩大10倍,则χ2和Φ该怎么变化?例题1772全国性的样本调查婚姻状态与喝酒行为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 手术准备与操作规范管理制度
- 手术环境管理制度
- 2022年三年级语文下册第四单元主题阅读+答题技巧(含答案、解析)部编版
- 2024年客运证考什么的
- 2024年嘉峪关小型客运从业资格证考试题答案
- 2024年宜春客运从业资格证模拟考试练习题
- 2024年道路客运从业资格证继续教育模拟考试
- 2024年绵阳a1客运资格证
- 2024年海口客运从业资格证的考试题目
- 2024年河北客运上岗考试都考什么科目
- 中国书法简史
- 防水施工方案28433
- 磷石膏综合利用调查报告
- 防水工程施工报价表
- 生产条件未发生变化情况声明
- 二年级数学小故事(课堂PPT)
- 国家开放大学《生产与运作管理》形考作业1-4参考答案
- 《观沧海》说课(课堂PPT)
- SF305无卤阻燃型聚酰亚胺薄膜挠性覆铜板-PCBGlobal
- 政府采购会议领导讲话稿
- 交警大队协勤人员管理制度-规章制度文书
评论
0/150
提交评论