版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.2独立性检验的根本思想及其初步应用1了解独立性检验(只要求22列联表)的根本思想,记住K2的计算公式2了解实际推断原理和假设检验的根本思想及其初步应用3通过实际问题培养学生的学习兴趣,激发学生学习的积极性和主动性,增强社会实践能力,培养分析问题、解决问题的能力1分类变量的定义如果某种变量的不同“值表示个体所属的不同类别,像这样的变量称为_分类变量222列联表一般地,假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ab_x2cd_总计_abcdabcdacbd3独立性检验.定义利用随机变量K2来判断“两个分类变量有关系”
2、的方法称为独立性检验公式K2_,其中n_.具体步骤根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定_利用公式计算随机变量K2的_如果_,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.kk0abcd临界值k0观测值k1重点:通过案例理解分类变量、列联表、独立性检验的含义;利用列联表的独立性检验进行估计2难点:独立性检验的根本思想;随机变量K2的含义3知识结构图4思维总结(1)22列联表是传统的调查研究中最常用的手法之一,用于研究两个变
3、量之间是相互独立还是存在某种关联性,它适用于分析两个变量之间的关系由于分类变量的独立性检验是建立在22列联表根底之上的,因而设计22列联表是独立性检验的关键所在(2)独立性检验所谓独立性检验,就是根据采集样本的数据,先利用三维柱形图和二维条形图粗略判断两个分类变量是否有关系,再利用公式计算K2的值,比较与临界值的大小关系,来判定事件x与y是否无关的问题 三维柱形图:如以下图所示,三维柱形图的特点是直观易懂,但用手工制作较麻烦,如有条件可用计算机作图人们对吸烟与患肺癌是否有关系很感兴趣,并且在抽样调查整理数据后绘制了此图,那么我们能从图中获得什么信息呢?如果我们假设吸烟与患肺癌没有关系,那么在吸
4、烟者中患肺癌的与不患肺癌的比例应该与不吸烟者中患肺癌的与不患肺癌的比例差不多,即二维条形图:二维条形图相对来说比较简单,其画法主要有两种,一种是根据抽样调查的数据直接成图,另一种是根据抽样调查的数据算出各局部所占的比例然后成图通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度利用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:a.根据实际问题的需要确定容许推断“两个分类变量有关系犯错误概率的上界,然后查表确定临界值k0.b.计算随机变量K2的观测值k.c.如果kk0,就推断“X与Y有关系,这种推
5、断犯错误的概率不超过,否那么就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系,或者在样本数据中没有发现足够证据支持结论“X与Y有关系图形的应用打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每晚都打鼾与患心脏病有关吗?用图表加以分析.患心脏病未患心脏病合计每晚都打鼾30224254不打鼾241 3551 379合计541 5791 633解析:法一:其三维柱形图如右上:由图可知,主对角线上柱体高度之积与副对角线上柱体高度之积差距较大,可在很大程度上认为患心脏病与每晚都打鼾有关法二:其二维条形图如下:从图表中可以粗略地看出每晚都打鼾与患心脏病有关点评:(1
6、)在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,x与y有关系的可能性就越大(2)在二维条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例 ,也可以估计满足条件Xx2的个体中具有Yy2的个体所占的比例 .两个比例的值相差越大,x与y有关的可能性就越大(3)三维柱形图及二维图的区别,要注意图表互化,加强识图能力的培养跟踪训练1为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:药物效果试验列联表患病未患病总计服用药104555没有服用药203050总计3075105试用图形判断服用药和患病之间是否有关系?解析:相应的等高条形
7、图如下:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系独立性检验方法K2公式在调查的480名男士中有38名患有色盲,520名女士中有6名患有色盲,能否在犯错误的概率不超过的前提下认为性别与患色盲有关系?分析:解析:根据题目所给的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561 000根据列联表中所给的数据可以得: a38,b442,c6,d514,ab480,cd520,ac44,bd956,n1 000.由于,所以在犯错误的概率不超过的前提下,认为性别与患色盲有关系但这个结论只对所调查的
8、这480名男士和520名女士有效点评:解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值;根据实际问题需要的可信程度确定临界值k0;(3)如果kk0,就推断“两个分类变量有关系,这种推断犯错误的概率不超过,否那么就认为在犯错误的概率不超过的前提下不能推断“两个分类变量有关系跟踪训练2(2021广东执信中学)某中学一位高三班主任对本班50名学生学习积极性和对待班级工作的态度进行长期的调查,得到的统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机调查这个班的一名学生,那么抽到积极参加班级工
9、作的学生的概率是多少?抽到不太积极参加班级工作且学习积极性一般的学生的概率是多少?(2)能否在犯错误的概率不超过的前提下认为学生的积极性与对待班级工作的态度有关系?所以,在犯错误的概率不超过的前提下,认为“学生的学习积极性与对待班级工作的态度有关系1独立性检验是对两个分类变量间是否存在相关关系的一种案例分析方法,其分析方法有:等高条形图法和利用假设的思想方法,计算出某一个随机变量K2的观测值来进行判断2在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例为 ,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例为 ,两个比例的值相差越大,两个分类变量相关的可能性就越大
10、3独立性检验的一般步骤:(1)根据样本数据制成22列联表;(2)根据公式K2 计算K2的观测值;(3)比较K2与临界值的大小关系作统计推断4对于两个分类变量:(1)如果k,那么在犯错误的概率不超过的前提下,认为X与Y有关系;(2)如果,那么在犯错误的概率不超过的前提下,认为X与Y有关系;(3)如果k,那么在犯错误的概率不超过的前提下,认为X与Y有关系;(4)如果k,那么在犯错误的概率不超过的前提下,认为X与Y有关系;(5)如果k,在样本数据中没有发现足够证据支持结论“X与Y有关系根底训练1在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A散点图B等高条形图C22列联
11、表 D以上均不对B2以下关于三维柱形图和二维条形图的表达正确的选项是()A从三维柱形图可以精确地看出两个分类变量是否有关系B从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D以上说法都不对C3对分类变量X与Y的随机变量K2的观测值k,说法正确的选项是()Ak越大,“ X与Y有关系可信程度越小Bk越小,“ X与Y有关系可信程度越小Ck越接近于0,“X与Y无关程度越小Dk越大,“X与Y无关程度越大B 4下面是一个22列联表:y1y2总计x1a2173x222527总计b46100那么表中a、b的值分别为
12、()A94、96 B52、50C52、54 D54、52C5性别与身高列联表如下:高(165 cm以上)矮(165 cm以下)总计男37441女61319总计431760那么,检验随机变量K2的值约等于 ()A0.043 BC22 DC 6给出列联表如下:优秀不优秀总计甲班103545乙班73845总计177390根据表格提供的数据,估计“成绩与班级有关系犯错误的概率约是()A0.4 BC0.75 DB7假设由一个22列联表中的数据计算得K2,那么在犯错误的概率不超过的前提下认为两个变量_关系(填“有或“没有)有82021韶关二模以下四个命题:在一次试卷分析中,从每个试室中抽取第5号考生的成绩
13、进行统计,是简单随机抽样;样本数据:3,4,5,6,7的方差为2;对于相关系数r,|r|越接近1,那么线性相关程度越强;通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如以下联表:男女总计走天桥402060走斑马线203050总计6050110P(K2)k0.050.0100.001k3.8416.63510.828附表答案:9某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2,因为K2,根据下表中的参考数据:P(
14、K2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.06357.87910.83所以判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为_5% 10某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(总分值100分)如下表所示:序号12345678910数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920数学成绩679364787790578
15、37283物理成绩77824885699161847886假设单科成绩85以上(含85分),那么该科成绩优秀(1)根据上表完成下面的22列联表(单位:人)数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀合计(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为22列联表)为:y1y2合计x1ababx2cdcd合计acbdabcd那么随机变量K2 ,其中nabcd为样本容量;独立检验随机变量K2的临界值参考表:P(K2k0)0.
16、500.400.250.150.10k00.4550.7081.3232.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828解析:(1)22列联表为(单位:人):数学成绩优秀数学成绩不优秀合计物理成绩优秀 527物理成绩不优秀 1 1213合计 6 1420在犯错误的概率不超过的前提下认为:学生的数学成绩与物理成绩之间有关系112021深圳二模2021年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,
17、得到了相关数据如下表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530使用未经淡化海砂151530总计4020601根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?2假设用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,那么取出的2个样本混凝土耐久性都达标的概率是多少?参考数据:P(k2k)0.100.0500.0250.0100.001k2.7063.8415.0246.63510.828解析:1提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值能
18、在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.2用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标的为 6=5,“混凝土耐久性不达标的为6-5=1,“混凝土耐久性达标记为A1,A2,A3,A4,A5;“混凝土耐久性不达标的记为B.在这6个样本中任取2个,有以下几种可能:A1,A2,A1,A3,A1,A4,A1,A5,A1,B,A2,A3,A2,A4,A2,A5,A2,B,A3,A4,A3,A5,A3,B,A4,A5,A4,BA5,B,共15种.设“取出的2个样本混凝土耐久性都达标为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土
19、耐久性不达标,包含A1,B,A2,B,A3,B,A4,B,A5,B,共5种可能.12(2021揭阳一模)某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510的产品为合格品,否那么为不合格品表1是甲流水线样本频数分布表,图1是乙流水线样本的频率分布直方图产品重量/克频数(490,4956(495,5008(500,50514(505,5108(510,5154表1甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本的频率分布直方图;(2)假设以频率作为概率,试估计从两条流水线分别任取1件产品,该产
20、品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面22列联表,能否在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品ab不合格品cd合计n附:下面的临界值表供参考:p(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解析:(1)甲流水线样本的频率分布直方图如下:(2)由表1知甲样本中合格品数为814830,由图1知乙样本中合格品数为0.03)54036,故甲样本合格品的频率为 ,乙样本合格品的频率为 ,据此可估计从甲流水线任取1件产品
21、,该产品恰好是合格品的概率为0.75.从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9.(3)22列联表如下:甲流水线乙流水线合计合格品a30b3666不合格品c10d414合计4040n80在犯错误的概率不超过的前提下认为产品的包装质量与两条自动包装流水线的选择有关真题再现1(2021湖南卷)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A有99%以上的把握认为“爱好该项运动与性别有关B有
22、99%以上的把握认为“爱好该项运动与性别无关C在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关D在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关A2为了比较注射A、B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表1和表2分别是注射药物A和药物B后的试验结果(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积60,65)65,70)70,75)75,80)80,85)频数1025203015(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(2)完成下面22列联表并答复能否在犯错误的概率不超过的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异.疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物Aab注射药物Bcd合计nP(K2k)0.10
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村蔬菜销售合同范例
- 工地清包合同模板
- 钢模板定制合同模板
- 岩棉板房合同范例
- 办公区域转租合同范例
- 2024年度舞蹈演员代理合同3篇
- 2024年度水电工程分包班组合作协议2篇
- 2024版KTV消防设施安全评估与整改方案施工合同3篇
- 鸡排配送合同模板
- 采购水稻种合同范例
- 国家开放大学《西方经济学(本)》章节测试参考答案
- 皮肤性病学期末试卷
- 学生劝返复学实施方案
- 收割机购销合同
- 医务人员医德医风诚信 档 案(模板)
- 脓毒症休克中西医详解
- 小兔子乖乖ppt课件.ppt
- 常压矩形容器设计计算软件
- 交流变换为直流的稳定电源设计方案
- PR6C系列数控液压板料折弯机 使用说明书
- 钢结构工程环境保护和文明施工措施
评论
0/150
提交评论