版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3 3.2 2独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用1.了解分类变量22列联表、随机变量K2的意义.2.通过对典型案例的分析,了解独立性检验的基本思想方法.3.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.121.数据的表示方法(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)用图表列出两个分类变量的频数表,称为列联表.(3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.12【做一做1】 班级与成绩22列联表:表示数据m,n,p,q的值应分别为()A.70,73,45,188
2、B.17,73,45,90C.73,17,45,90D.17,73,45,45答案:B122.独立性检验(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)独立性检验的基本思想类似于反证法.要判断“两个分类变量有关系”,首先假设结论不成立,即H0:“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小.如果由观测数据计算得到的K2的观测值k很大,则断言H0不成立,即认为“两个分类变量有关系”;如果观测值k很小,则说明在样本数据中没有发现足够证据拒绝H0.12(3)一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2,y1,y2,其样本频数列联表如下
3、:若要推断的结论为H1:“X和Y有关系”,可以通过频率直观地判断两个条件概率P(Y=y1|X=x1)和P(Y=y1|X=x2)是否相等.如果判断它们相等,就意味着X和Y没有关系;否则就认为它们有关系.因此,如果通过直接计算或等高条形图发现 相差很大,就判断两个分类变量之间有关系.12(4)独立性检验的具体做法:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.12如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1
4、2【做一做2-1】 下面是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比例约为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例约为60%解析:由题图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些,故选C.答案:C12【做一做2-2】 在吸烟与患气管炎这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=3.842,则在犯错误的概率不超过0.05的前提下认为吸烟与患气管炎有关系,那么在100个吸烟者中,必有95人患气管
5、炎B.由独立性检验可知,在犯错误的概率不超过0.10的前提下认为吸烟与患气管炎有关系时,我们说某人吸烟,那么他有90%的可能患有气管炎C.若由独立性检验求出在犯错误的概率不超过0.01的前提下认为吸烟与患气管炎有关系,是指有1%的可能性使得推断出现错误D.以上三种说法都不正确答案:C独立性检验在实际中的重要作用是什么剖析独立性检验是数理统计的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进行探索的一种基本思想.当然,对数据的统计分析得出的结论只能是在一定程度上对某种关系进行判断,而不是一种确定性的关系,这也是统计思想与确定性思维的差异所在.独立性检验在实际中有着广泛的应用,是对实际生
6、活中数据进行分析的一种方法,通过这种分析得出的结论对实际生活或者生产都有一定的指导作用.例如,通过吸烟和患肺癌关系的研究可以让我们认识吸烟的危害,及时预防吸烟对人体的危害;通过对水稻产量和施肥量关系的研究可以帮助人们正确施肥,提高水稻的产量,从而增加种植户收入等.题型一题型二题型三题型四【例1】 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:试画出列联表的等高条形图,分析铅中毒病人与对照组的尿棕色素阳性数有无差别,并判断铅中毒病人与尿棕色素为阳性是否有关系?分析画出图形,分析图中数据的差异,给出结论.题型一题型二题型三题型四解:等高条形图如
7、图.其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比较尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.题型一题型二题型三题型四题型一题型二题型三题型四【变式训练1】 打鼾不仅影响别人休息,而且可能与患某种疾病有关.下表是一次调查所得的数据.试问:每晚都打鼾与患心脏病有关吗?用图表分析.题型一题型二题型三题型四解:由列联表中的信息易知打鼾人群中未患心脏病的比例约为0.88,即患有心脏病的比例约为0.12;同理不打鼾人群中未患心脏病的比例约为0.98,即患有心脏病的比例约为0.02.作出等高条形图(如图).从图中可
8、以看出:打鼾样本中患心脏病的比例明显多于不打鼾样本中患心脏病的比例.因此可以认为“打鼾与患心脏病有关”.题型一题型二题型三题型四【例2】 在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.根据所给数据,能否在犯错误的概率不超过0.1的前提下认为在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机?分析求出随机变量K2的观测值,分析变量关系.题型一题型二题型三题型四解:根据题意,列出22列联表如下:假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机.由公式可得K2的观测值因此,可以在犯错误的概率不超过0.1的
9、前提下认为“在天气恶劣的飞行航程中,男乘客比女乘客更容易晕机”.题型一题型二题型三题型四反思反思解独立性检验问题的基本步骤:(1)认真读题,根据相关数据,得出22列联表;(2)根据22列联表中的数据,计算K2的观测值k;(3)比较观测值k与临界值k0;(4)给出结论.题型一题型二题型三题型四【变式训练2】 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:对于人力资源部的研究项目,根据上述数据能得出什么结论?题型一题型二题型三题型四李明和张宇都对该题进行了独立性检验的分析,李明的结论是“在犯错误的概率不超过0.01的前提
10、下,认为企业员工的工作积极性和对待企业改革的态度有关系”;张宇的结论是“在犯错误的概率不超过0.005的前提下,认为企业员工的工作积极性和对待企业改革的态度有关系”.他们两个的结论正确吗?为什么他们的结论不一样?题型一题型二题型三题型四解:由列联表中的数据求得K2的观测值为10.7597.8796.635,若以k0=7.879为临界值,则在犯错误的概率不超过0.005的前提下认为企业员工的工作积极性和对待企业改革的态度有关系;若以k0=6.635为临界值,则在犯错误的概率不超过0.01的前提下认为它们有关系.故李明和张宇的结论都正确.造成结论不一样的原因是他们两人采用了两种不同的判断规则,即所
11、选用的临界值不同.题型一题型二题型三题型四【例3】 为了调查某生产线上质量监督员甲是否在现场对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件.试分别用列联表、独立性检验的方法分析监督员甲是否在现场对产品质量好坏有无影响.分析根据题目中给出的相关数据,列出22列联表求解.题型一题型二题型三题型四解:(1)22列联表如下:由列联表可得|ac-bd|=|98217-4938|=12 750,则ac与bd相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.
12、(2)由22列联表中数据,计算得到K2的观测值为 所以在犯错误的概率不超过0.001的前提下认为“质量监督员甲是否在生产现场与产品质量有关系”.题型一题型二题型三题型四反思反思在判断两个分类变量关系的可靠性时一般利用随机变量K2来确定,把计算出的K2的观测值与相关的临界值作比较,确定出“X与Y有关系”的犯错误的概率.题型一题型二题型三题型四【变式训练3】 某中学对“学生性别和是否喜欢看NBA比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA的人数占男生人数的(1)若被调查的男生人数为n,根据题意建立一个22列联表;(2)若在犯错误的概率不超过0.05的前提下认为是否喜欢看NBA和性别有关,求男生至少有多少人?题型一题型二题型三题型四解:(1)由已知得: 题型一题型二题型三题型四题型一题型二题型三题型四易错点:理解独立性检验思想不清致错【例4】 若两个分类变量x和y的列联表为:求
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 1530零售业安全教育制度设计
- 美容美发技术交流合作协议书
- 跨校学生交流欺凌预防制度
- 党团组织统战工作总结
- 奶茶店品牌推广协议书
- 变电站电缆敷设环保方案
- 马术培训学校资金使用和管理制度
- 水泥供应商合作协议
- 零售药店医疗器械自查报告范文
- 电力工程安全风险防范方案
- 第四单元两、三位数除以一位数(单元测试)-2024-2025学年三年级上册数学苏教版
- 2024年消防月全员消防安全知识专题培训-附20起典型火灾案例
- 2025届高三化学一轮复习 第13讲 铁盐、亚铁盐及其转化 课件
- 【电商企业跨国并购的绩效探析案例:以阿里巴巴并购Lazada为例(论文)14000字】
- 恒牙临床解剖-上颌中切牙(牙体解剖学课件)
- 云南太阳能资源分析
- 2024智慧园区系统建设规范
- GB/T 44592-2024红树林生态保护修复技术规程
- 第5课 互联网接入 教学设计 2023-2024学年浙教版(2023)初中信息技术七年级上册
- 小学语文一年级上册课件第四单元01-10 ai ei ui
- 传感器技术-武汉大学
评论
0/150
提交评论