版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十一章
算法、统计与统计案例§11.5
列联表与独
立性检验考试要求1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用.
内容索引第一部分第二部分第三部分落实主干知识探究核心题型课时精练落实主干知识第一部分1.分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.列联表:列出的两个分类变量的频数表,称为列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
y1y2总计x1ab_____x2cdc+d总计a+c_____a+b+c+da+bb+d构造一个随机变量K2=______________________,其中n=a+b+c+d为样本容量.3.独立性检验:利用随机变量___来判断“两个分类变量有关系”的方法称为独立性检验.K2判断下列结论是否正确(请在括号中打“√”或“×”)(1)2×2列联表中的数据是两个分类变量的频数.(
)(2)两个分类变量的独立性检验无关,即两个分类变量互不影响.(
)(3)K2的大小是判断两个分类变量是否相关的统计量.(
)(4)在2×2列联表中,若|ad-bc|越小,则说明两个分类变量之间的关系越强.(
)√×√×1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,下列最适合的统计方法是A.均值
B.方差C.独立性检验
D.回归分析√由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.2.如表是2×2列联表,则表中a,b的值分别为A.27,38 B.28,38C.27,37 D.28,37√a=35-8=27,b=a+11=27+11=38.
y1y2总计x1a835x2113445总计b42803.已知P(K2≥6.635)=0.01,P(K2≥10.828)=0.001.在检验喜欢某项体育运动是否与性别有关的过程中,某研究员搜集数据并计算得到K2=7.235,则有_____的把握认为喜欢该项体育运动与性别有关.因为6.635<7.235<10.828,所以根据独立性检验,有99%的把握认为喜欢该项体育运动与性别有关.99%探究核心题型第二部分例1
(1)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:则a-b-c等于A.7B.8C.9D.10√题型一列联表与K2的计算
男生女生总计喜欢ab73不喜欢c25
总计74
根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,补充完整2×2列联表为:
男生女生总计喜欢522173不喜欢222547总计7446120则a-b-c=52-21-22=9.(2)为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如表:在对体育课成绩与文化课成绩进行独立性检验时,根据以上数据可得到K2的值约等于A.1.255 B.38.214 C.0.0037 D.2.058√
体育课不及格体育课及格总计文化课及格57221278文化课不及格164359总计732643372×2列联表是4行4列,计算时要准确无误,关键是对涉及的变量分清类别.思维升华跟踪训练1
某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中,a+b+d=____.由题意得a+b+d+6=50,所以a+b+d=50-6=44.
会外语不会外语总计男ab20女6d
总计18
5044题型二列联表与独立性检验例2
(12分)(2022·全国甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司在甲、乙两城之间长途客车准点的概率;[切入点:古典概型](2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?[关键点:K2的计算比较]
准点班次数未准点班次数A24020B21030P(K2≥k0)0.10.050.01k02.7063.8416.635独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)计算K2=
,其中n=a+b+c+d.(3)比较K2与临界值的大小关系,作统计推断.思维升华跟踪训练2
为了减少自身消费的碳排放,“绿色消费”等绿色生活方式渐成风尚.为获得不同年龄段的人对“绿色消费”意义的认知情况,某地研究机构将“90后与00后”作为A组,将“70后与80后”作为B组,并从A,B两组中各随机选取了100人进行问卷调查,整理数据后获得如下列联表:单位:人
知晓不知晓总计A组7525100B组4555100总计12080200(1)若从样本内知晓“绿色消费”意义的120人中用分层抽样的方法随机抽取16人,应在A组、B组中各抽取多少人?P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.828(2)能否有99.9%的把握认为对“绿色消费”意义的认知情况与年龄有关?由题意,得K2=
=18.75>10.828,根据临界值表可知,有99.9%的把握认为对“绿色消费”意义的认知情况与年龄有关.P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.828独立性检验的综合应用例3
体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020-2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩(单位:分)情况,得到如表数据:题型三约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前50%以内(含50%)的为“数学成绩达标”.(1)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表);数学成绩[30,50)[50,70)[70,90)[90,110)[110,130)[130,150]人数2512535030015050运动达标人数104514520010743所以估计该中学高三年级本次月考数学成绩的平均分为91.5分.(2)完成2×2列联表,并判断能否有99.9%的把握认为“数学成绩达标”与“运动达标”有关.单位:人
数学成绩达标数学成绩不达标总计运动达标
运动不达标
总计
P(K2≥k0)0.0100.0050.001k06.6357.87910.828列联表如表所示:单位:人
数学成绩达标数学成绩不达标总计运动达标350200550运动不达标150300450总计5005001000∴根据临界值表可知有99.9%的把握认为“数学成绩达标”与“运动达标”有关.独立性检验的考查,往往与概率和抽样统计图等一起考查,这类问题的求解往往按各小题及提问的顺序,一步步进行下去,是比较容易解答的,考查单纯的独立性检验往往用小题的形式,而且K2的公式一般会在原题中给出.思维升华跟踪训练3
某奶茶品牌公司计划在W市某区开设加盟分店,为了确定在该区开设分店的个数,该公司对该市已开设分店的5个区域的数据作了初步处理后得到下列表格,记x表示在5个区域开设分店的个数,y表示这x个分店的年收入之和.x(个)23456y(十万元)2.5344.56临界值表:P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.828(1)该公司经过初步判断,可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;(2)如果该公司最终决定在该区选择两个合适的地段各开设一个分店,根据市场调查得到如下统计数据,分店一每天的顾客平均为30人,其中5人会购买该品牌奶茶,分店二每天的顾客平均为80人,其中20人会购买该品牌奶茶.根据列联表判断是否有90%的把握认为顾客下单与分店所在地段有关.P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.828由题意可知2×2列联表如表所示:
不下单下单总计分店一25530分店二602080总计8525110∴根据临界值表可知没有90%的把握认为顾客下单与分店所在地段有关.课时精练第三部分基础保分练1.观察下列各图,其中两个分类变量x,y之间关系最强的是1234567891011121314观察等高条形图易知D选项两个分类变量之间关系最强.√2.下列关于独立性检验的说法正确的是A.独立性检验是对两个分类变量是否具有线性相关关系的一种检验B.独立性检验可以100%确定两个分类变量之间是否具有某种关系C.利用K2独立性检验推断吸烟与患肺病的关联中,若有99%的把握认为
吸烟与患肺病有关时,我们就可以说在100个吸烟的人中,有99人患
肺病D.对于独立性检验,随机变量K2的值越小,判定“两变量有关系”时犯
错误的概率越大√12345678910111213141234567891011121314对于A,独立性检验是通过计算K2来判断两个分类变量是否存在关联的可能性的一种方法,并非检验二者是否是线性相关,故错误;对于B,独立性检验并不能100%确定两个分类变量之间是否具有某种关系,故错误;对于C,99%是指“抽烟”和“患肺病”存在关联的可能性,并非抽烟的人中患肺病的发病率,故错误;对于D,根据K2计算的定义可知该选项正确.3.某地政府调查育龄妇女生育意愿与家庭年收入高低的关系时,随机调查了当地3000名育龄妇女,用独立性检验的方法处理数据,并计算得K2=7.326,则根据这一数据以及参考数据,判断育龄妇女生育意愿与家庭年收入高低有关系的可信度(参考数据:P(K2≥10.828)≈0.001,P(K2≥7.879)≈0.005,P(K2≥6.635)≈0.01,P(K2≥3.841)≈0.05,P(K2≥2.706)≈0.1)A.低于1% B.低于0.5%C.高于99% D.高于99.5%√12345678910111213141234567891011121314由于K2=7.326∈(6.635,7.879),而P(K2≥7.879)≈0.005,P(K2≥6.635)≈0.01,所以可信度高于99%.12345678910111213144.根据分类变量x与y的观察数据,计算得到K2=2.974.依据下面给出的临界值表,可知下列判断中正确的是A.有95%以上的把握认为变量x与y没有关系B.有95%以上的把握认为变量x与y有关系C.变量x与y没有关系,这个推断犯错误的概率不超过0.1D.变量x与y有关系,这个推断犯错误的概率不超过0.1√P(K2≥k0)0.500.400.250.150.100.050.0250.0100.005k00.4550.7081.3232.0722.7063.8415.0246.6357.8791234567891011121314因为K2=2.974>2.706,且2.974<3.841,所以依据独立性检验知,变量x与y有关系,这个推断犯错误的概率不超过0.1.5.2022年卡塔尔世界杯于11月21日拉开帷幕.某同学通过随机调查某小区100位居民是否观看世界杯比赛,得到以下列联表:1234567891011121314
观看世界杯不观看世界杯总计男402060女152540总计55451001234567891011121314经计算K2≈8.249.附表:P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828参照附表,下列结论正确的是A.有99.9%的把握认为“该小区居民是否观看世界杯与性别有关”B.有99.9%的把握认为“该小区居民是否观看世界杯与性别无关”C.在犯错误的概率不超过0.005的前提下,认为“该小区居民是否观看世
界杯与性别有关”D.在犯错误的概率不超过0.001的前提下,认为“该小区居民是否观看世
界杯与性别无关”√1234567891011121314由题意得,K2≈8.249>7.879,参照附表,可得在犯错误的概率不超过0.005的前提下,认为“该小区居民是否观看世界杯与性别有关”.12345678910111213146.为考查某种营养品对儿童身高增长的影响,选取部分儿童进行试验,根据100个有放回简单随机样本的数据,得到如下列联表,由表可知,下列说法正确的是
有明显增长无明显增长总计食用a1050未食用b3050总计60401001234567891011121314参考数据:P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.828A.a=b=30B.K2≈12.667C.从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿
童的概率是D.根据独立性检验,有99.9%的把握认为该营养品对儿童身高增长有影响√1234567891011121314由题可知a=50-10=40,b=50-30=20,所以A错误;所以根据独立性检验,有99.9%的把握认为该营养品对儿童身高增长有影响,所以B错误,D正确;从样本中随机抽取1名儿童,抽到食用该营养品且身高有明显增长的儿童的概率是
,所以C错误.12345678910111213147.如表是对于“喜欢运动与性别是否有关”的2×2列联表,依据表中的数据,得到K2≈________(结果保留到小数点后3位).4.722
喜欢运动不喜欢运动总计男402868女51217总计45408512345678910111213148.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:
注意力稳定注意力不稳定男生297女生335则K2≈________(精确到小数点后三位),依据独立性检验________95%的把握认为注意力的稳定性与性别有关.(选填“有”或“没有”)参考数据:P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.8280.538没有1234567891011121314由表中数据可知a=29,b=7,c=33,d=5,n=a+b+c+d=74,计算可知≈0.538<3.841,所以没有95%的把握认为注意力的稳定性与性别有关.
注意力稳定注意力不稳定男生297女生3359.(2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:1234567891011121314
一级品二级品总计甲机床15050200乙机床12080200总计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?1234567891011121314
一级品二级品总计甲机床15050200乙机床12080200总计270130400(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?1234567891011121314P(K2≥k0)0.0500.0100.001k03.8416.63510.8281234567891011121314根据题表中的数据可得因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.P(K2≥k0)0.0500.0100.001k03.8416.63510.828123456789101112131410.某花圃为提高某品种花苗质量,开展技术创新活动,某研究所在实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取花苗各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图.记综合评分为80及以上的花苗为优质花苗.(1)求图中a的值,并求综合评分的中位数;1234567891011121314由频率分布直方图的性质可知,0.005×10+0.010×10+0.025×10+10a+0.020×10=1,解得a=0.040,因为(0.005+0.010+0.025)×10=0.4<0.5,0.4+0.040×10=0.8>0.5,所以中位数位于[80,90)内,设中位数为x,则有0.4+0.040×(x-80)=0.5,解得x=82.5.故综合评分的中位数为82.5.1234567891011121314(2)填写下面的2×2列联表,并根据独立性检验,判断能否有99.9%的把握认为优质花苗与培育方法有关,请说明理由.
优质花苗非优质花苗总计甲培育法20
乙培育法
10
总计
P(K2≥k0)0.10.050.010.0050.001k02.7063.8416.6357.87910.8281234567891011121314由(1)得优质花苗的频率为0.6,所以样本中优质花苗的数量为60,2×2列联表如右:
优质花苗非优质花苗总计甲培育法203050乙培育法401050总计6040100≈16.667>10.828,所以根据独立性检验,有99.9%的把握认为优质花苗与培育方法有关.123456789101112131411.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:每周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图所示.已知在样本中,有40位女生每周平均体育锻炼的时间超过4小时,根据独立性检验原理,下列说法正确的是综合提升练1234567891011121314A.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B.有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”√P(K2≥k0)0.100.050.010.005k02.7063.8416.6357.8791234567891011121314由频率分布直方图可知,
每周平均体育锻炼时间不少于4小时的频率为2×(0.15+0.125+0.075+0.025)=0.75,故经常进行体育锻炼的学生有200×0.75=150(人).又其中有40位女生每周平均体育锻炼的时间超过4小时,故有150-40=110(位)男生经常锻炼.1234567891011121314
男生女生总计经常锻炼11040150不经常锻炼302050总计140602001234567891011121314因为2.706<3.17<3.841.故有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”.123456789101112131412.北京冬奥会的举办掀起了一阵冰雪运动的热潮.某高校在本校学生中对“喜欢滑冰是否与性别有关”做了一次调查,参与调查的学生中,男生人数是女生人数的3倍,
女生喜欢滑冰.若根据独立性检验的方法,有95%的把握认为喜欢滑冰和性别有关,则参与调查的男生人数可能为1234567891011121314参考数据:P(K2≥k0)0.100.050.0250.010k02.7063.8415.0246.635A.12 B.18 C.36 D.48√1234567891011121314设男生人数为3x,则女生人数为x,且x∈N*,可得列联表如右:因为有95%的把握认为喜欢滑冰和性别有关,所以
∈[3.841,5.024),x∈N*,解得11<x≤14,所以33<3x≤42,结合选项只有36∈(33,42].123456789101112131413.近年来,由于大学生不理智消费导致财务问题的新闻层出不穷,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S城某大学的10000名(其中男生6000名,女生4000名)在校本科生按性别采用分层抽样的方式抽取的1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计.通过整理得到如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人,根据上述数据和频率分布直方图,判断下列说法正确的是拓展冲刺练1234567891011121314参考数据与参考公式:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828A.月消费金额超过2000元的女生人数少于男生人数B.所调查的同学中月消费金额不超过500元的共有4人C.样本数据的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度铝灰处理技术咨询服务合同4篇
- 教育商业化背景下的家庭教育思考
- 二零二五版互联网+时代电商平台场摊位入驻协议3篇
- 二零二五版校园绿化项目生态保护与合同4篇
- 个人代理销售协议书(2024版)(标的:家居用品)2篇
- 三方住宅买卖协议2024版专业模板版B版
- 2025年度小微企业扶持不定期借款合同2篇
- 2025年度个人房屋抵押贷款还款合同3篇
- 生态与文明-探讨地球与宇宙的关系及未来发展
- 二零二五年度便利店生鲜商品批量采购合同2篇
- 销售与销售目标管理制度
- 2024年食品行业员工劳动合同标准文本
- 全屋整装售后保修合同模板
- 高中生物学科学推理能力测试
- GB/T 44423-2024近红外脑功能康复评估设备通用要求
- 2024-2030年中国减肥行业市场发展分析及发展趋势与投资研究报告
- 运动技能学习
- 2024年中考英语专项复习:传统文化的魅力(阅读理解+完型填空+书面表达)(含答案)
- 2024年公安部直属事业单位招聘笔试参考题库附带答案详解
- 临沂正祥建材有限公司牛心官庄铁矿矿山地质环境保护与土地复垦方案
- 六年级上册数学应用题练习100题及答案
评论
0/150
提交评论