1.2 独立性检验的基本思想及其初步应用^-^、11_第1页
1.2 独立性检验的基本思想及其初步应用^-^、11_第2页
1.2 独立性检验的基本思想及其初步应用^-^、11_第3页
1.2 独立性检验的基本思想及其初步应用^-^、11_第4页
1.2 独立性检验的基本思想及其初步应用^-^、11_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.2独立性检验独立性检验分类变量:变量的不同”值”表示个体所属的不同类别.如:性别,是否吸烟,宗教信仰,国籍等日常生活中我们关心这样一些问题:吸烟与患肺癌之间有无关系?秃顶与心脏病之间有无关系?性别与喜欢数学课之间有无关系?以上问题能否用回归分析的知识来解决?为什么?例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了9965人,得到如下结果:不患肺癌患肺癌总计比例不吸烟77754278170.54%吸烟20994921482.28%总计9874919965问:吸烟是否对患肺癌有影响?解从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可能存在差异,我们再通过不同的图表来分析列联表:两个分类变量的频数表患肺癌三维柱形图不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965二维条形图等高条形图上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题我们首先设基本事件为:H0:吸烟与患肺癌没有关系我们下面就一般关系做一个推断不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d如果吸烟与患肺癌没有关系,则:a(c+d)≈c(a+b)ad-bc≈0因此,|ad-bc|越小,说明吸烟与患肺炎之间没有关系。为了使样本空间有一定的代表性,我们引入一个随机变量(n=a+b+c+d(样本容量))若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计算我们可以得到K的观测值:k=K2=56.632总计的四项说明:根据统计学家的分析:P(K2≥10.828)≈0.001P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001K。0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828表1-120.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828上面的利用K2来检验“两个变量有关系”的方法成为:独立性检验说明:两个变量X与Y独立性检验的一般方法:1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d4.利用统计概率表1-12查阅发生的概率3.计算变量X与Y的评判标准K2的观测值5.得出概率结论2.假设“X与Y无关”例1.在研究某种新药对小白兔的防治效果时,得到下表数据:存活数死亡数总计未用新药10138139用新药12920149总计23058288试分析新药对防治小白兔是否有效?99.5%的把握判定新药对防治小白兔是有效的.解:假设“新药对防治小白兔无效”

根据列联表中的数据,得到的观测值k为例2.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,是否可以以99%的把握认为秃顶与心脏病有关?患心脏病不患心脏病总计秃顶214175389不秃顶4515971048总计6657721437智慧的闪光!患心脏病患其他病总计秃顶214175389不秃顶4515971048总计6657721437所以有99%的把握认为”秃顶与患心脏病有关”解:假设“秃顶与患心脏病无关”研究人员表示,掉头发在很大程度上是由日渐增大的工作压力、不能充分休息、不正确饮食和睡眠不足等因素引起的。在接受调查的人群中,有41%的受秃头威胁的人表示,他们一日睡觉时间不足4小时秃顶=心脏病?总计aba+bcdc+d总计a+cb+da+b+c+d若要推断的结论为H1:”X与Y有关系”,可如下操作:1.通过三维柱形图和二维条形图,可以粗略地判断两个变量是否有关系,但是这种判断不精确.总计aba+bcdc+d总计a+cb+da+b+c+d不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d主对角线副对角线(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上两个柱形高度的乘积bc相差越大,H1成立的可能性就越大总计aba+bcdc+d总计a+cb+da+b+c+d不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d(2)在二维条形图中,两个比例的值相差越大,H1成立的可能性就越大2.利用独立性检验来考察两个分类变量是否有关系,

并且能较精确地给出这种判断的可靠程度.具体做

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论