独立性检验的基本思想及其初步应用 省赛获奖1 完整版课件_第1页
独立性检验的基本思想及其初步应用 省赛获奖1 完整版课件_第2页
独立性检验的基本思想及其初步应用 省赛获奖1 完整版课件_第3页
独立性检验的基本思想及其初步应用 省赛获奖1 完整版课件_第4页
独立性检验的基本思想及其初步应用 省赛获奖1 完整版课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.2独立性检验的基本思想及初步应用二个概念这种变量的不同取“值”表示个体所属的不同类别,这类变量称为分类变量1.分类变量对于性别变量,取值为:男、女分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等等。利用随机变量K2来确定在多大程度上可以认为”两个分类变量有关系”的方法称为两个分类变量的独立性检验.(为假设检验的特例)吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表在不吸烟者中患肺癌的比重是

在吸烟者中患肺癌的比重是

说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大0.54%2.28%1)通过图形直观判断两个分类变量是否相关:三维柱状图2)通过图形直观判断两个分类变量是否相关:二维条形图3)通过图形直观判断两个分类变量是否相关:患肺癌比例不患肺癌比例独立性检验H0:吸烟和患肺癌之间没有关系←→H1:吸烟和患肺癌之间有关系通过数据和图表分析,得到结论是:吸烟与患肺癌有关结论的可靠程度如何?用A表示“不吸烟”,B表示“不患肺癌”则H0:吸烟和患肺癌之间没有关系“吸烟”与“患肺癌”独立,即A与B独立等价于等价于吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d独立性检验引入一个随机变量作为检验在多大程度上可以认为“两个变量有关系”的标准。1)如果P(m>10.828)=0.001表示有99.9%的把握认为”X与Y”有关系;2)如果P(m>7.879)=0.005表示有99.5%的把握认为”X与Y”有关系;3)如果P(m>6.635)=0.01表示有99%的把握认为”X与Y”有关系;4)如果P(m>5.024)=0.025表示有97.5%的把握认为”X与Y”有关系;5)如果P(m>3.841)=0.05表示有95%的把握认为”X与Y”有关系;6)如果P(m>2.706)=0.010表示有90%的把握认为”X与Y”有关系;7)如果m≤2.706),就认为没有充分的证据显示”X与Y”有关系;设有两个分类变量X和Y它们的值域分别为{x1,x2}和{y1,y2}其样本频数列表(称为2×2列联表)为

y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2×2列联表适用观测数据a、b、c、d不小于5独立性检验吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965通过公式计算独立性检验已知在成立的情况下,即在成立的情况下,K2大于6.635概率非常小,近似为0.01现在的K2=56.632的观测值远大于6.635分类变量之间关系条形图柱形图列联表独立性检验背景分析例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效?[例2]某电视台联合相关报社对“男女同龄退休”这一公众关注的问题进行了民意调查,数据如下表所示:根据表中数据,能否在犯错误的概率不超过0.001的前提下认为对这一问题的看法与性别有关系?(P(K2≥10.828)≈0.001)赞同反对总计男198217415女476109585总计6743261000[解析]

假设H0:“对这一问题的看法与性别无关”,由列联表中的数据,可以得到:≈125.161>10.828又P(K2≥10.828)≈0.001,故在犯错误概率不超过0.001的前提下认为对“男女同龄退休”这一问题的看法与性别有关.练习.1、下面是一个2×2列联表则表中a、b处的值分别为 ()A.94、96 B.52、50C.52、59 D.54、52[答案]

Cy1y2合计x1a2173x272027合计b411002、对于事件A和事件B,通过计算得到K2的观测值k≈4.325,下列说法正确的是()BA.有99%以上的把握说事件A和事件B有关B.有95%以上的把握说事件A和事件B有关C.有99%以上的把握说事件A和事件B无关D.有95%以上的把握说事件A和事件B无关3.为调查学生对国家大事关心与否是否与性别有关,在学生中进行随机抽样调查,结果如下表,根据统计数据作出合适的判断分析.关心不关心合计男生18218200女生17624200合计35842400[点评]根据随机变量K2的值判断两分类变量是否有关的步骤:第一,假设两分类变量无关,第二,由数据及公式计算K2的观测值k,第三,将k的值与临界值比较得出结论.独立性检验基本的思想类似反证法(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下随机变量K2应该很能小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%.喜爱运动不喜爱运动总计男1016女614总计30

例3:第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余不喜爱. (1)根据以上数据完成以下2×2列联表:

P(K2

≥k0)0.400.250.100.010k00.7081.3232.7066.635参考公式:K2

(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关?

n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:喜爱运动不喜爱运动总计男10616女6814总计161430解析:(1)完成2×2列联表如下:(2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论