数学(人教版选修12)课件12独立性检验的基本思想及其初步应用_第1页
数学(人教版选修12)课件12独立性检验的基本思想及其初步应用_第2页
数学(人教版选修12)课件12独立性检验的基本思想及其初步应用_第3页
数学(人教版选修12)课件12独立性检验的基本思想及其初步应用_第4页
数学(人教版选修12)课件12独立性检验的基本思想及其初步应用_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章统计案例1.2独立性检验的基本思想及其初步应用1.了解独立性检验的基本思想、方法及其简单应用.(重点)2.通过收集数据,并依据独立性检验的原理作出合理推断,培养学生良好的思维习惯.(难点)1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的___________,像这样的变量称为_____________不同类别分类变量.(2)列联表①定义:列出的两个分类变量的________,称为列联表.②2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:频数表数据数据相互影响频率特征.【想一想】

1.如何理解分类变量?提示:(1)这里的“变量”和“值”都应作为“广义”的变量和值来理解.例如:对于性别变量,其取值有“男”和“女”两种,这里的“变量”指的是“性别”,这里的“值”指的是“男”或“女”.因此,这里说的“变量”和“值”不一定是取具体的数值.(2)分类变量是大量存在的.例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.2.利用等高条形图能否精确地判断两个分类变量是否有关系?为什么?提示:不能,因为通过等高条形图,可以粗略地判断两个分类变量是否有关系,但这种判断无法精确地给出所得结论的可靠程度.3.独立性检验两个分类变量有关系a+b+c+d临界值k0观测值kk≥k0犯错误的概率没有发现足够证据【想一想】

3.从本质上说,独立性检验是对两个分类变量是否有关系的判断吗?提示:独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握认为两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.4.在判断两个分类变量是否有关系时,等高条形图与独立性检验各有什么特点?提示:(1)通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.(2)利用独立性检验来判断两个分类变量是否有关系,能够精确地给出这种判断的可靠程度,也常与图形分析法结合.5.在判断变量相关时,若K2的观测值k=56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正确的?提示:两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下,认为两变量相关;而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过0.001的前提下,认为两变量相关.1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是(

)A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.答案:D答案:C解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.∴a+b=126.答案:1264.若由一个2×2列联表中的数据计算得K2的观测值k=4.013,那么在犯错误的概率不超过________的前提下认为两个变量有关系.解析:因为k=4.013>3.841,故在犯错误的概率不超过0.05的前提下认为两个变量有关系.答案:0.051.在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.2.独立性检验的基本思想(1)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k≥6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.(2)在实际问题中要记住以下几个常用值:①k>6.635有99%的把握认为“X与Y有关系”;②k>3.841有95%的把握认为“X与Y有关系”;③k>2.706有90%的把握认为“X与Y有关系”;④k≤2.706就认为没有充分证据显示“X与Y有关系”.(3)反证法原理与独立性检验原理的比较反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0不成立.独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.3.两个分类变量相关性检验方法利用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界a,然后查表确定临界值k0.②计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y”有关系,这种推断犯错误的概率不超过a,否则就认为在犯错误的概率不超过a的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.用2×2列联表分析两变量间的关系

1.题中条件不变,尝试用|ad-bc|的大小判断饮食习惯与年龄是否有关.解:将本例2×2列联表中的数据代入可得|ad-bc|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.

某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.用等高条形图分析两变量间的关系[自主解答]

作列联表如下:相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.2.观察下列各图,其中两个分类变量x,y之间关系最强的是(

)解析:在四幅图中,D图中两个阴影条的高度相差最明显,说明两个分类变量之间的关系最强.答案:D

下表是某地区的一种传染病与饮用水的调查表:独立性检验(1)这种传染病是否与饮用水的卫生程度有关?请说明理由;(2)若饮用干净水得病的有5人,不得病的有50人;饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.(2)依题意得2×2列联表:因为5.785>5.024,P(K2>5.024)≈0.025,所以我们有97.5%的把握认为该地区这种传染病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.3.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1000人进行问卷调查,只有80人志愿加入国家西部建设,而国家公布实施西部开发战略后,随机抽取1200名应届大学毕业生进行问卷调查,有400人志愿加入国家西部建设.问:实施西部开发战略的公布是否对应届大学毕业生的选择产生了影响?1.列联表与等高条形图列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论