独立性检验演示文稿_第1页
独立性检验演示文稿_第2页
独立性检验演示文稿_第3页
独立性检验演示文稿_第4页
独立性检验演示文稿_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独立性检验演示文稿目前一页\总数六十六页\编于二点独立性检验目前二页\总数六十六页\编于二点1.掌握2×2列联表的独立性检验,能利用给出的数据列出列联表并会求K2的观测值.2.了解独立性检验的基本思想和方法.

目前三页\总数六十六页\编于二点1.本节课的重点是理解独立性检验的基本思想及实施步骤.2.本节课的难点是了解随机变量K2的含义和根据K2的值得出结论的意义.

目前四页\总数六十六页\编于二点1.分类变量变量的不同“值”表示个体所属的_____,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的____,称为列联表.不同类别频数表目前五页\总数六十六页\编于二点(2)2×2列联表:一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d目前六页\总数六十六页\编于二点3.独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(2)公式:K2=.其中n=_____.__________a+b+c+d目前七页\总数六十六页\编于二点1.在独立性检验中,计算得k=29.78,在判断变量相关时,P(K2≥6.635)≈0.01的含义是什么?提示:P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关.目前八页\总数六十六页\编于二点2.列联表中|ad-bc|的值与两个分类变量之间相关的强弱有什么关系?提示:在列联表中,若两个分类变量没有关系,则|ad-bc|≈0,所以|ad-bc|的值越小,两个分类变量之间的关系越弱;|ad-bc|的值越大,两个分类变量之间的关系越强.目前九页\总数六十六页\编于二点3.作散点图的主要目的是_______.【解析】散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是直观了解两个变量之间的关系.答案:直观了解两个变量之间的关系目前十页\总数六十六页\编于二点4.若由一个2×2列联表中的数据计算得K2的观测值k=4.013,则认为“两个变量有关系”犯错误的概率不超过_______.【解析】∵P(K2≥3.841)≈0.05,∴认为“两个变量有关系”犯错误的概率不超过0.05.答案:0.05目前十一页\总数六十六页\编于二点1.对于“分类变量”的理解(1)这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如,对于性别变量,其取值为男和女两种.那么这里的变量指的是性别,同样这里的“值”指的是“男”和“女”.因此,这里所说的“变量”和“值”不一定取的是具体的数值.目前十二页\总数六十六页\编于二点2.独立性检验与反证法的异同点独立性检验的思想来自于统计学的假设检验思想,它与反证法类似,假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事件的发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出利用结论成立的小概率事件的发生.目前十三页\总数六十六页\编于二点3.判断两个分类变量是否有关系的两种方法比较判断两个分类变量是否有关系的两种方法是:等高条形图和独立性检验.(1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判断的可靠程度,也常与图形分析法结合.

目前十四页\总数六十六页\编于二点等高条形图的应用【技法点拨】1.判断两个分类变量是否有关系的两个常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.目前十五页\总数六十六页\编于二点2.利用等高条形图判断两个分类变量是否相关的步骤目前十六页\总数六十六页\编于二点【典例训练】1.从发生交通事故的司机中抽取2000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:有责任无责任总计有酒精650150800无酒精7005001200总前十七页\总数六十六页\编于二点相应的等高条形图如图所示.试结合等高条形图分析血液中含有酒精与对事故负有责任是否有关系.目前十八页\总数六十六页\编于二点2.某学校对高三学生进行了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【解析】1.比较来说,两者差距较大,在“有酒精”和“无酒精”两个矩形中,阴影部分的面积不同,由此可以看出在某种程度上认为血液中含有酒精与对事故负有责任有关系.目前十九页\总数六十六页\编于二点2.作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020目前二十页\总数六十六页\编于二点相应的等高条形图如图所示,目前二十一页\总数六十六页\编于二点图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.目前二十二页\总数六十六页\编于二点【归纳】等高条形图的作法及作用小结.提示:1.首先作2×2列联表,注意对涉及的变量分清类别;其次要注意计算的准确性;第三画等高条形图,注意各变量的顺序与所画位置.2.通过等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的可靠程度.目前二十三页\总数六十六页\编于二点【变式训练】为了了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病人组和对照组的尿棕色素阳性数有无差别?组别阳性数阴性数总计铅中毒病人组29736对照组92837总计383573目前二十四页\总数六十六页\编于二点【解析】根据列联表作出等高条形图(如图).由图形可知,铅中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.目前二十五页\总数六十六页\编于二点独立性检验【技法点拨】解决一般的独立性检验问题的步骤目前二十六页\总数六十六页\编于二点【典例训练】1.(2012·武汉高二检测)在独立性检验中,若随机变量K2的观测值k≥6.635,则()(A)X与Y有关系,犯错的概率不超过1%(B)X与Y有关系,犯错的概率超过1%(C)X与Y没有关系,犯错的概率不超过1%(D)X与Y没有关系,犯错的概率超过1%目前二十七页\总数六十六页\编于二点2.(2012·厦门高二检测)在对人们休闲方式的一次调查中,共调查120人,其中女性70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)休闲方式与性别是否有关?目前二十八页\总数六十六页\编于二点【解析】1.选A.∵k≥6.635.说明两个变量X与Y有关系,这种说法犯错误的概率不超过0.01,即1%,故选A.2.(1)2×2的列联表为

性别看电视运动总计女性403070男性203050总计6060120休闲方式目前二十九页\总数六十六页\编于二点(2)计算K2的观测值为而2.706<3.429<3.841,因为P(K2>2.706)≈0.10,P(K2>3.841)≈0.05,所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关.目前三十页\总数六十六页\编于二点【互动探究】本题条件不变的情况下,画出等高条形图.【解析】目前三十一页\总数六十六页\编于二点【思考】1.求k的值的关键是什么?2.k的大小对“两个变量有关”有什么影响?提示:1.求K2的观测值k的关键是要准确列出2×2列联表,即找准表达式中的各个量的数值.2.利用K2的观测值进行独立性检验可以精确地给出这种判断的可靠程度,而且k的值越大,说明“X与Y有关系”成立的可能性越大.目前三十二页\总数六十六页\编于二点【变式训练】(2012·琼海高二检测)为了调查某地区老年人是否需要志愿者帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要帮助男女总计需要4030

70

不需要160270430总计200300500性别目前三十三页\总数六十六页\编于二点(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?附:P(K2≥k)0.0500.0100.001k3.8416.63510.828目前三十四页\总数六十六页\编于二点【解析】(1)需要帮助的老年人的比例估计值为(2)∵P(K2≥6.635)≈0.010∴在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.目前三十五页\总数六十六页\编于二点独立性检验的综合应用【技法点拨】判断两个变量是否有关的三种方法目前三十六页\总数六十六页\编于二点【典例训练】1.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男1310女720目前三十七页\总数六十六页\编于二点为了判断主修统计专业是否与性别有关系,根据表中的数据,得到因为P(k≥3.841)=0.05,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_______.目前三十八页\总数六十六页\编于二点2.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、等高条形图、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?目前三十九页\总数六十六页\编于二点【解析】1.根据独立性检验的思想,假设没关系正确的可能性为5%,所以,判断有关系错误的可能性也为5%.答案:5%目前四十页\总数六十六页\编于二点2.(1)2×2列联表如下:由列联表可得|ad-bc|=|982×17-493×8|=12750.相差较大,可在某种程度上认为“质量监督员甲是否在现场与产品质量有关系”.合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1475251500目前四十一页\总数六十六页\编于二点(2)画等高条形图.如图可知,在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.目前四十二页\总数六十六页\编于二点(3)由2×2列联表中数据,计算得到K2的观测值为因此,在犯错误的概率不超过0.001的前提下,认为质量监督员甲在不在生产现场与产品质量好坏有关系.目前四十三页\总数六十六页\编于二点【想一想】在独立性检验中,容易出现的错误有哪些?提示:①容易因不能准确列出列联表而犯错误;②用等高条形图粗略估计代替准确结论而犯错误;③由于记错K2公式、计算出错而犯错误;④由于不能利用K2的值与临界值k0比较而出错.目前四十四页\总数六十六页\编于二点【变式训练】对某校学生进行心理障碍测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?【解题指南】分别计算三种心理障碍的K2观测值k1,k2,k3,比较它们的值与3.841的关系,回答问题.焦虑说谎懒惰总计女生5101530男生20105080总计252065110目前四十五页\总数六十六页\编于二点【解析】对于上述三种心理障碍分别构造三个随机变量K2的观测值:k1,k2,k3,则所以,在犯错误的概率不超过0.05的前提下,认为焦虑与性别无关,说谎与性别有关,懒惰与性别无关.目前四十六页\总数六十六页\编于二点【规范解答】独立性检验【典例】(12分)(2012·荆州高二检测)调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.目前四十七页\总数六十六页\编于二点(1)将下面的2×2列联表补充完整;性别晚上白天总计男婴女婴总计

出生时间目前四十八页\总数六十六页\编于二点(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?P(K2≥k)0.150.100.05k2.0722.7063.841目前四十九页\总数六十六页\编于二点【解题指导】目前五十页\总数六十六页\编于二点【规范解答】(1)

…………………………6分性别晚上①白天②总计男婴243155女婴82634总计325789出生时间目前五十一页\总数六十六页\编于二点(2)由所给数据计算K2的观测值

………8分根据临界值表知P(K2≥2.706)≈0.10.………9分因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.……………12分目前五十二页\总数六十六页\编于二点【阅卷人点拨】通过阅卷后分析,对解答本题的失分警示和解题启示总结如下:(注:此处的①②见规范解答过程).失分警示①在解答过程中,若①处和②处插入表格处表中数据填写错误,会直接导致合计出错,也会直接导致k值求错,这种情况最多给3分.②在解答中,若③处公式记混,会导致k值出错,使得独立性检验出错,这种情况,只能给第(1)问的分数6分目前五十三页\总数六十六页\编于二点解题启示(1)错误填写2×2列联表,导致出错;(2)记准K2的计算公式,不至于因错记公式而出错;(3)正确回答独立性检验的结论.目前五十四页\总数六十六页\编于二点【规范训练】(12分)(2012·大庆高二检测)调查在2~3级风时的海上航行中男女乘客的晕船情况,共调查了71人,其中女性34人,男性37人.女性中有10人晕船,另外24人不晕船;男性中有12人晕船,另外25人不晕船.判断晕船是否与性别有关系.【解题设问】(1)本题两个分类变量是什么?_______________.(2)题中数据取值明确吗?_____.性别和是否晕船明确目前五十五页\总数六十六页\编于二点性别晕船不晕船总计女102434男122537总计224971【规范答题】列出2×2的列联表:…………………8分晕船情况目前五十六页\总数六十六页\编于二点计算………11分因为k<2.706,所以在样本数据中没有发现足够的证据支持结论“晕船与性别有关系”.…………………12分目前五十七页\总数六十六页\编于二点1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()(A)散点图(B)等高条形图(C)2×2列联表(D)以上均不对【解析】选B.等高条形图可以粗略地判断两个分类变量之间是否有关.目前五十八页\总数六十六页\编于二点2.分类变量X和Y的列联表如下,则下列说法中正确的是()(A)ad-bc越小,说明X与Y关系越弱(B)ad-bc越大,说明X与Y关系越强(C)(ad-bc)2越大,说明X与Y关系越强(D)(ad-bc)2越接近于0,说明X与Y关系越强Y1Y2总计X1aba+bX2cdc+d总计a+cb+da+b+c+d目前五十九页\总数六十六页\编于二点【解析】选C.∵∴(ad-bc)2越大,则K2越大,X与Y关系越强,故选C.目前六十页\总数六十六页\编于二点3.在吸烟与患肺病这两个分类变量的计算中,下列说法中正确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论