版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二课时列联表与独立性检验1.掌握分类变量的含义.2.通过实例,理解2×2列联表的统计意义.3.通过实例,了解2×2列联表独立性检验及其应用.CONTENTS010203/目录
知识·逐点夯实考点·分类突破课时·过关检测011.分类变量与列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:XY合计Y=0Y=1X=0aba+bXY合计Y=0Y=1X=1cdc+d合计a+cb+dn=a+b+c+d2.独立性检验(1)小概率值α的临界值:对于任何小概率值α,可以找到相应的正实数xα,使得关系P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大;
(3)独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);(5)应用独立性检验解决实际问题的主要环节:①提出零假设H0:X和Y相互独立,并给出在问题中的解释;②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;③根据检验规则得出推断结论;④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.(6)独立性检验中几个常用的小概率值和相应的临界值:α0.10.050.010.0050.001xα2.7063.8416.6357.87910.8281.判断正误.(正确的画“√”,错误的画“×”)(1)分类变量中的变量与函数的变量是同一概念.
(
)答案:(1)×
(2)等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.
(
)(3)独立性检验的方法就是用的反证法.
(
)(4)χ2的大小是判断事件A与B是否相关的统计量.
(
)答案:(2)√
答案:(3)×
答案:(4)√2.观察下面各等高堆积条形图,其中两个分类变量关系最强的是
(
)解析:B
通过等高堆积条形图可知,选项B中y1,y2的差异最大,故两个分类变量关系最强.故选B.3.(多选)若在研究吸烟与患肺癌的关系中,通过收集、整理、分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是
(
)A.在犯错误的概率不超过0.01的前提下,认为吸烟和患肺癌有关系B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:AD
独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.4.下面是一个2×2列联表:XY合计y1y2x1a2173x2222547合计b46120则表中的a=
,b=
.
解析:∵a+21=73,∴a=52.又a+22=b,∴b=74.答案:52
745.已知变量X,Y,由它们的样本数据计算得到χ2≈4.328,χ2的部分临界值表如下:α0.100.050.0250.0100.005xα2.7063.8415.0246.6357.879则最大有
的把握说变量X,Y有关系(填百分数).
解析:因为χ2≈4.328>3.841=x0.05,所以在犯错误的概率不超过0.05的前提下认为变量X,Y有关系.所以最大有95%的把握说变量X,Y有关系.答案:95%02分类变量与列联表1.(多选)根据如图所示的等高堆积条形图,下列叙述正确的是
(
)A.吸烟患肺病的频率约为0.2B.吸烟不患肺病的频率约为0.8C.不吸烟患肺病的频率小于0.05D.吸烟与患肺病无关系解析:ABC
从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.A、B、C都正确.2.(2023·安阳一模)如下是一个2×2列联表,则m+n=
.
XY合计y1y2x1a3545x27bn合计m73s解析:根据2×2列联表可知a+35=45,解得a=10,则m=a+7=17,又由35+b=73,解得b=38,则n=7+b=45,故m+n=17+45=62.答案:62|练后悟通|分类变量的两种统计表示形式(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是否有关联及关联强弱;(2)2×2列联表:直接利用2×2列联表中的数据进行计算分析,用定量的方式判断两分类变量是否有关联及关联强弱.分类变量关联性的判断【例1】
某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:患心脏病无心脏病秃发20300不秃发5450根据表中数据得到χ2≈15.968,因为χ2>10.828,则断定秃发与患心脏病有关系.那么这种判断出错的可能性为
(
)A.0.001B.0.05C.0.025D.0.01解析
因为χ2>10.828=x0.001,因此判断出错的可能性为0.001,故选A.答案
A|解题技法|
如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是(
)A.90%B.95%C.99%D.99.5%解析:B
由临界值表,得6.023>3.841=x0.05,所以可断言市民收入增减与旅游愿望有关系的可信程度为95%.独立性检验的应用【例2】
(2022·全国甲卷·改编)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)根据小概率值α=0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
α0.1000.0500.010xα2.7063.8416.635解
(2)零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关,列联表如下表所示:公司班次是否准点合计准点班次数未准点班次数A24020260B21030240合计45050500
为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验.为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,结果如下表.记成绩不低于70分的为“成绩优良”.分数[50,60)[60,70)[70,80)[80,90)[90,100]甲班频数56441乙班频数13655由以上统计数据列出2×2列联表,并判断能否依据小概率值α=0.05的χ2独立性检验认为“成绩优良与教学方式有关”.解:由题意,列联表如下:成绩班级合计甲班乙班优良91625不优良11415合计202040
031.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则χ2约为
(
)班级数学成绩合计优秀不优秀甲班113445乙班83745合计197190A.0.600B.0.828C.2.712D.6.014
2.为考察A,B两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果解析:B
从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.根据图中信息,在下列各项中,说法最佳的一项是(
)3.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c=(
)A.3B.4C.5D.6解析:A
列2×2列联表如下:XY合计y1y2x1102131x2cd35合计10+c21+d66
4.(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下2×2列联表,并计算得到χ2≈19.05,下列小波对A地区天气的判断正确的是(
)日落云里走夜晚天气下雨未下雨出现255未出现2545C.依据α=0.005的独立性检验,认为“日落云里走”是否出现与夜晚天气有关D.依据α=0.005的独立性检验,若出现“日落云里走”,则认为夜晚一定会下雨
5.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表,经计算χ2≈4.762,则可以推断出(
)满意不满意男3020女4010B.调研结果显示,该学校男生比女生对食堂服务更满意C.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.05D.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.01
6.(多选)有两个分类变量X,Y,其2×2列联表如下所示:XY合计y1y2x1a20-a20x215-a30+a45合计155065其中a,15-a均为大于5的整数,若依据小概率值α=0.05的独立性检验,认为X,Y有关,则a的值为
(
)A.6B.7C.8D.9
7.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为
.
答案:158.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出零假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知x0.05=3.841.则下列结论中,正确结论的序号是
.
①认为“这种血清能起到预防感冒的作用”犯错误的概率不超过0.05;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析:χ2≈3.918>3.841=x0.05,所以认为“这种血清能起到预防感冒的作用”,这种推断犯错误的概率不超过0.05.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:①9.某高校《统计初步》课程的教师随机调查了选该课的学生情况,调查数据如下表:非统计专业统计专业男1310女720为了判断是否主修统计专业与性别的关系,根据表中的数据,计算得到χ2≈
(保留三位小数),所以判定
(填“能”或“不能”)在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性别有关.
答案:4.844
能10.(2021·全国甲卷·改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值α=0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产品质量有差异?
A.25B.45C.60D.75解析:BCD
设男生的人数为5n(n∈N*),根据题意列出2×2列联表如下所示:是否喜欢航天性别合计男生女生喜欢航天4n3n7n不喜欢航天n2n3n合计5n5n10n
12.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:性别休闲方式合计读书健身女243155男82634合计325789在犯错误的概率不超过
的前提下认为性别与休闲方式有关系.
答案:0.113.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过
.
解析:由题意,可得如下2×2列联表:考试情况培训方式合计集中培训分散培训一次考试通过503080一次考试未通过52025合计5550105
答案:0.00114.某城市地铁将于2024年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025房地产企业股权转让居间合同
- 2024年农业机械定制购销与技术研发合同2篇
- 2024全新新能源项目股权出资转让与合资经营合同3篇
- 2024年度工业生产线水电安装合同2篇
- 2024年度物业线上线下融合服务合同3篇
- 2024年度互联网服务合同标的为云服务平台搭建2篇
- 2024年VIP会员会员卡使用合同3篇
- 2024年期商业物业中介招商合作合同书版B版
- 2024年度石油化工水电安装工程合同
- 2024年度企业搬迁服务与设备采购合同3篇
- 图书馆应急知识讲座
- 1937年南京大屠杀
- 工程伦理智慧树知到期末考试答案2024年
- 2024广西能源集团有限公司社会招聘笔试参考题库附带答案详解
- 西游记第一回
- 设备维保的备品备件与库存管理
- 医院导医个人工作总结
- 无人机技术在物流配送中的应用
- 酒吧sop服务流程
- 高低压电缆选型与敷设方案
- 心理学:蝴蝶效应
评论
0/150
提交评论