考点43独立性检验_第1页
考点43独立性检验_第2页
考点43独立性检验_第3页
考点43独立性检验_第4页
考点43独立性检验_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计案例了解独立性检验(只要求 2X2列联表)的基本思想、方法及其简单应用,并能解决一些实际问题、蹴知识整合1.22列联表设X, Y为两个变量,它们的取值分别为 xi,X2和yi, y2,其样本频数列联表(2 2列联表)如下:yiy2总计Xiaba+ bX2cdc+ d总计a+ cb+da b c d.独立性检验利用随机变量 K2 (也可表不为2)n(ad bc)#上(其中 n(a b)(c d )(a c)(b d)a b c d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.独立性检验的一般步骤(1)根据样本数据列出 2 2列联表;(2)计算随机变量 K在犯错误的概率不超过 P

2、K2 k0的前提下不能推断 “X与丫有关系”.【注意】(1)通常认为k 2.706时,样本数据就没有充分的证据显示“X与Y有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可的观测值k,查下表确定临界值k0:2P(Kko)0.500.400.250.150.1000.0500.0250.0100.0050.001ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828如果k ko,就推断“X与Y有关系”,这

3、种推断犯错误的概率不超过P K2 ko ;否则,就认为能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.点考向考向一两类变量相关性的判断已知分类变量的数据,判断两类变量的相关性.可依据数据及公式计算K2,然后作出判断.典例引领典例1利用独立性检验来考查两个分类变量X和丫是否有关系时,通过查阅下表来确定“ X和丫有关系”的可信度.如果k 5.024,那么就有把握认为“X和Y有关系”的百分比为P K2 k0.500.400.250.150.100.050.0250.0100.0050.001K0.4550.7081.3232.0722

4、.7063.845.0246.6357.87910.828A. 25%B. 75%C. 2.5%D. 97.5%【答案】DL解析】二金5.024,而在观测值表中对应于5.024的是0.位5, 1 - 0.025=0575=97.5%,,有915%的把握认为这和F有关系”故选D.【名师点睛】本题考查独立性检验的应用,属于基础题,根据所给的观测值,与所给的临界值表中的数据进行比较,而在观测值表中对应于5.024的是0.025,从而得到结果.典例2有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看龟视6842110少看电视203858总计)SS80168附表:

5、P K2 k0.050.0250.0100.0050.001K3.845.0246.6357.87910.828则认为多看手机与人冷漠有关系的把握大约为A. 99.9%B. 97.5%C. 95%D. 90%【答案】A解析由题可得产=16g-x38-20K42)2 7T.I88x80 x110 x58,*TL37710.贬叼,有%.9%的把握认为看电视与人受冷漠有关系.故答案为A【名师点睛】本题主要考查独立性检验,意在考查学生对该知识的掌握水平和解决实际问题的能力.把所给的数据代入求独立性检验的观测值的公式,求出观测值,把观测值同独立性检验的临界值表进行比较,得到所求的值大于10.828,得到

6、有99.9%勺把握认为看电视与人变冷漠有关系.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取60名高中生做问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060._2由以上数据,计算得到 K2的观测值k 9.643,根据临界值表,以下说法正确的是附:P(K2 k0)0.500.400.250.150.100.050.050.0100.005k00.4550.7081.3232.0722.7063.8415.0246.6357.879A.在样本数据中没有发现足够证据支持结论“作文成绩优秀与课外阅读量大有关B.在犯错误

7、的概率不超过0.001的前提下,认为作文成绩优秀与课外阅读量大有关C.在犯错误的概率不超过0.05的前提下,认为作文成绩优秀与课外阅读量大有关D.在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关考向二 独立性检验与概率统计的综合独立性检验是一种统计案例,是高考命题的一个热点,多以解答题的形式出现,试题难度不大,多为中档 题,高考中经常是将独立性检验与概率统计相综合进行命题,解题关键是根据独立性检验的一般步骤,作 出判断,再根据概率统计的相关知识求解问题 典例引领典例3某中学对高三甲、乙两个同类班级进行“加强,语文阅读理解,训练对提高,数学应用题,率作用”的试验,其中甲

8、班为试验班 (加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:眄分以下6U70 分7180 分系120 分917QC 分甲班(人数)3fi111S12乙班(人数)4S131510现规定平均成绩在 80分以上(不含80分)的为优秀.(1)试分别估计两个班级的优秀率(2)由以上统计数据填写下面 2 2列联表,并问是否有 75%的把握认为“加强语文阅读理解 提高数学应用题得分率”有帮助?优秀人数非优秀人数合计甲班乙班合计参考公式及数据:k2n(ad bc)2(a

9、 b)(c d )(a c)(b,其中 n a b c d. d)_2P(Kk。)0.400.250.150.1000.0500.0250.010k00.7081.3232.0722.7063.8415.0246.635【答案】(1)甲、乙两班的优秀率分别为 60%和50%; (2)列联表见解析,没有 75%的把握认为得分),在训练对“加强语文阅读理解训练对提高数学应用题得分率”有帮助.【解析】m由题意知,甲,乙两班均有学生so人,3D甲班优秀人数为30人,优秀率为站= 6。%,乙班优秀人毅为25人,优秀率为 = 50% , 所以甲、乙两班的优秀率分别为60%和50%.(2) 22列联表如下:

10、100991.010 1.323,一 一 一 一 2因为 K210 (3 25 20 25)50 50 55 45所以由参考数据知,没有 75%的把握认为“加强,语文阅读理解,训练对提高,数学应用题,得分率”有帮助.高中生在被问及“家,朋友聚集的地方,个人空间 ”三个场所中“感到最幸福的场所在哪里?”这个问题时,从中国某城市的高中生中随机抽取了55人,从美国某城市的高中生中随机抽取了45人进行答题.2 3 3中国高中生答题情况是: 选择家的占一、朋友聚集的地方占 一、个人空间占 一.美国高中生答题情况是:51010r 31 人一,1 ,一朋友聚集的地方占一、家占一、个人空间占一.如下表:555

11、在豕里取中福在其他场所幸福合计中国局中生美国局中生合计(1)请将2 2列联表补充完整,试判断能否有95%的把握认为“恋家”与否与国别有关;(2)从被调查的不“恋家”的美国学生中,用分层抽样的方法选出 4人接受进一步调查, 再从4人中随 机抽取2人到中国交流学习,求 2人中含有在“个人空间”感到幸福的学生的概率.22n ad bc附:k -,其中 n a b c d .2P k2k。0.0500.0250.0100.001k03.8415.0246.63510.828、丰点冲关*.观察如图所示的等高条形图,其中最有把握认为两个分类变量x, y之间有关系的是A.B.C.D.在研究打酣与患心脏病之间

12、的关系中,通过收集数据、整理分析数据得“打酣与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是100个心脏病患者中至少有 99人打酣1个人患心脏病,那么这个人有99%勺概率打酣C.在100个心脏病患者中一定有打酣的人D.在100个心脏病患者中可能一个打酣的人都没有.已知两个统计案例如下:为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:患肺炎未患肺炎总计吸烟43162205不吸烟13121134总计56283339为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:母亲身高(cm)159160160163159154159

13、158159157女儿身高(cm)158159160161161155162157162156则对这些数据的处理所应用的统计方法是A.回归分析,取平均值B.独立性检验,回归分析C.回归分析,独立性检验D.独立性检验,取平均值.某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体检每年未体检合计老年人a7c年轻人6bd合计ef50已知抽取的老年人、年轻人各 25名则完成上面的列联表数据错误的是A. a 18B. b 19C. C d 50D. f e 15.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了下表:喜爱打篮球不喜爱打篮球合计

14、男生251035女生51015合计302050参考公式:i/2n(ad bc)2#上,K ,其中 n a b c d(a b)(c d)(a c)(b d)临界值表:P(K2 k0)0.1000.0500.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828根据表中的数据你认为喜爱打篮球与性别之间有关系的把握是A. 97.5%B. 99%C. 99.5%D. 99.9%6.为了普及环保知识,增强环保意识,某大学从理工类专业的A班和文史类专业的 B班各抽取20名同学参加环保知识测试.统计得到成绩与专业的列联表:优秀非优秀总计A班14620B班71

15、320总计211940附:参考公式及数据:(1)统计量:K2n(ad bc)2(a b)(c d)(a c)(b d)(2)独立性检验的临界值表:P(K2 k。)0.0500.010k。3.8416.635则下列说法正确的是A.有99%勺把握认为环保知识测试成绩与专业有关B.有99%勺把握认为环保知识测试成绩与专业无关C.有95%勺把握认为环保知识测试成绩与专业有关D.有95%勺把握认为环保知识测试成绩与专业无关7 .假设有两个分类变量X和Y的2 2列联表为:X_ Yy1y2总计x15b5 bX215d15 d总计204060对同一样本,以下数据能说明X与丫有关系的可能性最大的一组为A. b

16、5,d 35B. b 15,d 25D. b 30,d 10C. b 20,d 202 i/2n(ad bc)参考公式: K ,其中n a b c d.(a b)(c d )(a c)(b d)8 .某学校为判断高三学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2 2列联表:理科文科合计男131023女72027合计2030502根据 表中数 据得到K2 50 13 20 10 74844,已知P K2 3.8410.05 ,23 27 20 30一一2P K2 5.0240.025.现作出结论“选修文科与性别相关”,估计这种判断出错的可能性约为B. 95%D. 5%A. 97.5

17、%C. 2.5%附:K2n ad bc9.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查 根据从中随机抽取的 50份调查问卷,得到了如下的列联表:同意限定区域停车/、同意限定区域停车合计男20525女101525合计302050则认为“是否同意限定区域停车与家长的性别有关”的把握约为2a b c d a c b dPK2k00.500.400.250.150.10k00.4550.7081.3232.0722.706PK2k00.050.0250.0100.0050.001k03.8415.0246.6357.87910.82810.已知下列

18、命题:在线性回归模型中, 相关指数R2表示解释变量x对于预报变量y的贡献率,r2越接近于1,表示回归效果越好;1;两个变量相关性越强,则相关系数的绝对值就越接近于在回归直线方程 y0.5x 2中,当解释变量x每增加一个单位时,预报变量y平均减少0.5个单位;对分类变量 X与Y ,它们的随机变量 K 2的观测值k来说,k越小,“ X与丫有关系”的把握程度 越大.其中正确命题的序号是 一则“清华大学要求从2017级学生开始,游泳达到一定标准才能毕业”的消息在体育界和教育界引起了巨大反响.其实,已有不少高校将游泳列为必修内容.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关

19、,该学校对100名高一新生进行了问卷调查,得到如下2 2列联表:喜欢游泳/、喜欢游泳合计男生40女生30合计已知在这100人中随机抽取1人,抽到喜欢游泳的学生的概率为3.5(1)请将上述列联表 2 2补充完整,并判断是否可以在犯错误的概率不超过0.001的前提下认为喜欢游泳与性别有关(2)已知在被调查的学生中有6名来自高一(1)班,其中4名喜欢游泳,现从这 6名学生中随机抽取 2人,求恰有1人喜欢游泳的概率附:k2 =2n ad bca b c d a c b dP K2k00.100.0500.0250.0100.0050.001k02.7063.8415.0246.6357.87910.8

20、2812.随着资本市场的强势进入,互联网共享单车“忽如一夜春风来”,遍布了一二线城市的大街小巷 为了解共享单车在 A市的使用情况,某调查机构借助网络进行了问卷调查,并从参与调查的网友中抽取了200人进行抽样分析,得到表格: (单位:人)经常使用偶尔或不用合计30岁及以下703010030岁以上6040100合计13070200(1)根据以上数据,能否在犯错误的概率不超过0.15的前提下认为 A市使用共享单车情况与年龄有关?5人.(2)现从所抽取的30岁以上的网友中利用分层抽样的方法再抽取(i)分别求这5人中经常使用、偶尔或不用共享单车的人数;(ii)从这5人中,再随机选出2人赠送一件礼品,求选

21、出的2人中至少有1人经常使用共享单车的概2参考公式:K2n ad bcabcdacbd参考数据:_2P Kko0.150.100.050.0250.010ko2.0722.7063.8415.0246.6351.(2017年高考新课标n卷)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了 100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:旧蕊疸法新羔值法,估计A的概率;(1)记A表示事件“旧养殖法的箱产量低于50 kg(2)填写下面列联表,并根据列联表判断是否有99%勺把握认为箱产量与养殖方法有关;箱产量v 50 kg箱产量 50 kg旧养嫡法新力

22、广殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较附:P ()0.0500.0100.001k3.8416.63510.8282n(ad bc) (2018年高考新课标出卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种K 新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组(a b)(c d)(a c)(b d)(单位:min)第一种牛产厅式第二种生产方式工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间绘制了如下茎叶图:98776543 3m和不超过m(1)根据茎叶图判断哪种生

23、产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过超过m的工人数填入下面的列联表:不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有 99%勺把握认为两种生产方式的效率有差异?2附:K2n ad bcabcdacbd_2P K k0.0500.0100.001k3.8416.63510.828般参考答案,变式拓展.【答案】D【解析】因为根据临界值表,9.6437.879 ,所以在犯错误的概率不超过0.005的前提下,认为作文成绩优秀与课外阅读量大有关.故选D.【名师点睛】本题考查卡方含义,考查基本求解能力.根据临界

24、值表,确定犯错误的概率即可.【答案】(1)见解析;(2) 1.2【解析】(1)由已知得:在豕里取中福在其他场所幸福合计中国局中生223355美国局中生93645合计31691002K2100 22 36 9 33100 11 34.628 3.841 ,31 69 55 4531 23.有95%的把握认为“恋家”与否与国别有关.用分层抽样的方法抽出4人,其中在朋友聚焦的地方”感到幸福的有?人 在皿个人空间”感到幸福的有1人 分别设为4的.勺上一;总的基本事件空间为0= 巧乌):(%外(如%)=(%办他0,丁.总的基本事件个氨为以二6 一设喑有在个人空间塞到幸福的学生为事件4 则,=(4.(.力

25、),小石,事件/的个题为卅二3 一颉 P( 6 2【思路点拨】(1)根据题意填写列联表,计算观测值K2,对照临界值表得出结论;(2)用分层抽样方法抽出 4人,其中在“朋友聚焦的地方”感到幸福的有3人,在“个人空间”感到幸福的有1人,分别设为a.,a2,a3,b,再设“含有在个人空间感到幸福的学生”为事件A,求出基本 事件数,即可求得概率值.考点冲关【答案】D【解析】在等高条形图中,X2所占比例相差越大,分类变量 x, y有关系的把握越大.故答案为D【名师点睛】(1)本题主要考查通过等高条形图判断两个分类变量是否有关系,意在考查学生对该知识 的掌握水平和分析推理能力.(2)在等高条形图中,如果两

26、个分类变量所占的比例差距越大,则说明两个分类变量有关系的把握越大2.【答案】D【解析】利用浊立性检验摘论可得:若中酣与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的;则在1伽个心脏病患者中可有f打酎的人都没有.本题选揉D选项.【名师点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯 定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论, 否则就可能对统计计算的结果作出错误的解释.【答案】B【解析】常用独立性检验研究两个分类变量之间是否有关系,常用回归分析研究两个具有相关关系的变量的相关程度,综上可知选B.【

27、答案】D【解析】因为 a 7 c 25,6 b d 25,a 6 e,7 b f,c d 50,e f所以 a 18,b 19,c d50, e 24, f 26, f e 2.故选D.【名师点睛】本题考查列联表有关概念,考查基本求解能力 判断各选项.5.【答案】A.先根据列联表列方程组,解得a,b,c,d,e,f再2【解析】由已知可得 Kn(ad bc)2(a b)(c d )(a c)(b d)50 (25 10 10 5)235 15 30 206.3492 ,由临界值表可知P(K2 5.024) 0.025,所以根据表中的数据可以认为喜爱打篮球与性别之间有关系的把握是97.5%,故选A

28、.【答案】CC 40 (14 13 7 6)22【解析】因为 K240 (14 13 7 6)4.912,所以 3.841K27.789) =0.005=0.5%.25 25 30 20所以,我们有99.5%勺把握认为是否同意限定区域停车与家长的性别有关.故答案为99.5%.【名师点睛】本题考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题.禾I用公式求得 K2,与临界值比较,即可得到结论10 【答案】【解析】相关指数J;二表示解耗变量人对于预报变量N的贡献率I片越接近于L表示回归效果越好, 是正50的;两个变量相关性擅强,则相关系里的绝对值就越接近千L是正确的j在

29、回归直线方程,=HX5x+2中,当解筹变量工每增加一个单位时,预报变量G平均撼少0-5个单 位是正确的,因为回归方程,并不是样本点都落在方程上,故只能是估计值,所以说是平均熠长口 对分类变量与F,它们的随机变量之二的观测值上来说,南越小j “与F有关系a的把握程度越 小敌原命题错误一故答案为;0X3.【答案】(1)列联表见解析,可以;(2).153 【解析】(1)根据条件可知喜欢游泳的人数为 100 60人.5完成2 2列联表:喜欢游泳/、喜欢游泳合计男生401050女生203050合计604010022 100 40 30 20 10 根据表中数据,计算 K2 16.667 10.82860

30、 40 50 50所以可以在犯错误的概率不超过0.001的前提下认为喜欢游泳与性别有关(2)设“恰有一人喜欢游泳”为事件A,设4名喜欢游泳的学生为 31,32,33,34,不喜欢游泳的学生为bib, 基 本 事 件 总 数 有 15 种3132,3133,3134,34,3力2, 3233, 3234 , a26, 32为,3334,336 族?, a46, 34b bb2,其中恰有一人喜欢游泳的基本事件有8种:31bH 322, 32bl, 32b2,33bl, 33b2, 34bl, 34b2 ,所以P A . 15【名师点睛】本题考查了独立性检验与运算求解能力,同时考查通过列举法求概率的

31、应用,属于中档(1)根据题意计算喜欢游泳的学生人数,求出女生、男生多少人,完善列联表,再计算观测值K2,对照临界值表即可得出结论;(2)设“恰有一人喜欢游泳”为事件A,设4名喜欢游泳的学生为 ai,a2,a3,a4,不喜欢游泳的学生为bi,b2,通过列举法即可得到答案 .12 .【答案】(1)能在犯错误的概率不超过0.15的前提下认为 A市使用共享单车情况与年龄有关;(2) (i)经常使用共享单车的有 3人,偶尔或不用共享单车的有2人;(ii).10【解析】由列联表可知,片=L . 219g -130 x70 x100 x100因为 Z198 2.072,所以能在犯错误的概率不超过0-15的前

32、提下认为幺市使用共享单车情况与年龄有关.,- 60 八.(2) (i)依题意可知,所抽取的 5名30岁以上的网友中,经常使用共学单车的有5 3 (人),10040偶尔或不用共享单车的有 52匕 2 (人).100(ii)设这5人中,经常使用共享单车的 3人分别记为a, b, c;偶尔或不用共享单车的 2人分别记 为 d , e.则从5人中选出2人的所有可能结果为:a,b , a, c , a,d , a,e , b,c , b, d , b,e ,c,d , c,e , d,e ,共 10 种.其中没有1人经常使用共享单车的可能结果为:d,e,共1种, 一一一 19故选出的2人中至少有1人经常使用共学单车的概率P 1 一 一.10 10直通高考1 .【答案】(1) 0.62; (2)列联表见解析,有 99%勺把握认为箱产量与养殖方法有关;(3)新养殖法优于旧养殖法.【解析】(1)旧养殖法的箱产量低于 50 kg的频率为(0.012+0.014+0.024+0.034+0.04

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论