2017-2018学年高中数学 第一章 统计案例 1.2 独立检验的基本思想及其初步应用教学案 1-2_第1页
2017-2018学年高中数学 第一章 统计案例 1.2 独立检验的基本思想及其初步应用教学案 1-2_第2页
2017-2018学年高中数学 第一章 统计案例 1.2 独立检验的基本思想及其初步应用教学案 1-2_第3页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学必求其心得,业必贵于专精 1。2 独立检验的基本思想及其初步应用 核心必知1预习教材,问题导入根据以下提纲,预习教材p10p15的内容,回答下列问题阅读教材p10“探究的内容,思考:(1)是否吸烟、是否患肺癌是什么变量?提示:分类变量(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?提示:不是(3)如何研究吸烟是否对患肺癌有影响?提示:独立性检验2归纳总结,核心必记(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表称为列联表22列联表一般地,假设有两个分类变量x和y,它们的取值分别为x1,x2和y1,y2,其

2、样本频数列联表(称为22列联表)为y1y2总计x1ababx2cdcd总计acbdabcd(3)等高条形图图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征通过直接计算或观察等高条形图发现和相差很大,就判断两个分类变量之间有关系(4)独立性检验定义利用随机变量k2来判断“两个分类变量有关系”的方法称为独立性检验公式k2,其中nabcd具体步骤确定,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0。计算k2,利用公式计算随机变量k2的观测值k.下结论,如果kk0,就推断“x与y有关系”,这种推断犯错误的概

3、率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“x与y有关系”,或者在样本数据中没有发现足够证据支持结论“x与y有关系问题思考(1)有人说:“在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的你认为这种观点正确吗?为什么?提示:观点不正确犯错误的概率不超过0。01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?提示:不一定所有的推断只代表一种可能性,不代表具体情况(3)下面是22列联表。y1y2总计x1332154x2a1346总计b34则表中a,b处的值应

4、为多少?提示:a461333,b33a333366.课前反思(1)分类变量的定义是什么?(2)列联表的定义是什么?22列联表中的各个数据有什么意义?(3)什么是等高条形图,有什么作用?(4)独立性检验的内容是什么?讲一讲1在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主请根据以上数据作出饮食习惯与年龄的列联表,并利用与判断二者是否有关系尝试解答22列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以

5、肉类为主273360总计7054124将表中数据代入公式得0。671 875。0.45。显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系(1)作22列联表时,关键是对涉及的变量分清类别计算时要准确无误(2)利用22列联表分析两个分类变量间的关系时,首先要根据题中数据获得22列联表,然后根据频率特征,即将与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣练一练1假设有两个分类变量x与y,它们的可能取值分别为x1,x2和y1,y2,其22列联表为:y1y2x11018x2m26则当m取下面何值时,x与y的关系最弱()a8b9c14d19解析:选c由1026

6、18m,解得m14.4,所以当m14时,x与y的关系最弱讲一讲2某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系尝试解答作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例

7、高,可以认为考前紧张与性格类型有关利用等高条形图判断两个分类变量是否相关的步骤:练一练2在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561000根据列联表作出相应的等高条形图:从等高条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的讲一讲3研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;1

8、10名男生在相同的项目上作肯定的有22名,否定的有88名问:性别与态度之间是否存在某种关系?用独立性检验的方法判断(链接教材p13例1)附:p(k2k0)0。100。050。025k02.7063。8415。024尝试解答根据题目所给数据建立如下22列联表:肯定否定总计男生2288110女生223860总计44126170根据22列联表中的数据得到:k5.6225.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”根据题意列出22列联表,计算k2的观测值,如果k2的观测值很大,说明两个分类变量有关系的可能性很大;如果k2的观测值比较小,则认为没有充分的证据显示两个分类

9、变量有关系练一练3在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?附:p(k2k0)0.100。05k02。7063.848解:根据题意,列出22列联表如下:晕机不晕机总计男乘客243155女乘客82634总计325789假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机由公式可得k2的观测值k3.6892。706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”-课堂归纳感悟提升-

10、1本节课的重点是用22列联表、等高条形图分析两个分类变量间的关系以及独立性检验2本节课要重点掌握的规律方法(1)用22列联表分析两分类变量间的关系,见讲1;(2)用等高条形图分析两分类变量间的关系,见讲2;(3)独立性检验,见讲3.3解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用k2求出k2的观测值k;(3)如果kk0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“两个分类变量有关系 其中第(2)步易算错k2的值,是本节课的易错点课下能力提升(二)学业水

11、平达标练题组1用22列联表分析两分类变量间的关系1分类变量x和y的列联表如下:y1y2总计x1ababx2cdcd总计acbdabcd则下列说法正确的是()aadbc越小,说明x与y关系越弱badbc越大,说明x与y关系越强c(adbc)2越大,说明x与y关系越强d(adbc)2越接近于0,说明x与y关系越强解析:选cadbc|越小,说明x与y关系越弱,|adbc越大,说明x与y关系越强2假设有两个变量x与y,它们的取值分别为x1,x2和y1,y2,其列联表为:y1y2总计x1ababx2cdcd总计acbdabcd以下各组数据中,对于同一样本能说明x与y有关系的可能性最大的一组为()aa50

12、,b40,c30,d20ba50,b30,c40,d20ca20,b30,c40,d50da20,b30,c50,d40解析:选d当(adbc)2的值越大,随机变量k2的值越大,可知x与y有关系的可能性就越大显然选项d中,(adbc)2的值最大3某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:_(填“是”或“否”)解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众

13、中有27名观众收看新闻节目,即,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的答案:是题组2用等高条形图分析两分类变量间的关系4如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()a性别与喜欢理科无关b女生中喜欢理科的百分比为80c男生比女生喜欢理科的可能性大些d男生不喜欢理科的比为60%解析:选c从图中可以分析,男生喜欢理科的可能性比女生大一些5观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:选d在四幅图中,d图中两个深色条的高相差最明显,说明两个分类变量之间关系最强6为了研究子女吸烟与父母吸烟的关系,调查了一千多名青

14、少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221 200总计9156051 520利用等高条形图判断父母吸烟对子女吸烟是否有影响?解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”题组3独立性检验7在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()a平均数与方差 b回归分析c独立性检验 d概率解析:选c判断两个分类变量是否有关的最有效方法是进

15、行独立性检验8对于分类变量x与y的随机变量k2的观测值k,下列说法正确的是()ak越大,“x与y有关系”的可信程度越小bk越小,“x与y有关系”的可信程度越小ck越接近于0,“x与y没有关系”的可信程度越小dk越大,“x与y没有关系的可信程度越大解析:选bk越大,“x与y没有关系的可信程度越小,则“x与y有关系”的可信程度越大,即k越小,“x与y有关系”的可信程度越小9在吸烟与患肺病是否相关的判断中,有下面的说法:若k2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;从独立性检验可知在犯错误的概率不超过0。01的

16、前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;从独立性检验可知在犯错误的概率不超过0。05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误其中说法正确的是_解析:k2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案:10为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.70及70分以下70分以上总计对照班32185

17、0试验班123850总计4456100附:p(k2k0)0。0250.0100。005k05。0246。6357.879解:根据列联表中的数据,由公式得k2的观测值k16.234.因为16。2346。635,所以,在犯错误的概率不超过0。01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系能力提升综合练1利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件a和b有关系,则具体计算出的数据应该是()ak6。635 bk6.635ck7.879 dk7。879解析:选c有99。5的把握认为事件a和b有关系,即犯错误的概率为0。5,对应的k

18、0的值为7。879,由独立性检验的思想可知应为k7.879。2通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由k2算得,观测值k7。8。附表:p(k2k0)0。0500。0100.001k03。8416.63510。828参照附表,得到的正确结论是()a有99以上的把握认为“爱好该项运动与性别有关b有99%以上的把握认为“爱好该项运动与性别无关”c在犯错误的概率不超过0。1% 的前提下,认为“爱好该项运动与性别有关d在犯错误的概率不超过0。1% 的前提下,认为“爱好该项运动与性别无关解析:选a由k7。8及p(

19、k26。635)0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99以上的把握认为“爱好该项运动与性别有关”3某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1成绩性别不及格及格总计男61420女102232总计163652表2视力性别好差总计男41620女122032总计163652表3智商性别偏高正常总计男81220女82432总计163652表4阅读量性别丰富不丰富总计男14620女23032总计163652a成绩 b视力c智商 d阅读量解析:

20、选d因为k,k,k,k,则有kkkk,所以阅读量与性别有关联的可能性最大4下列关于k2的说法中,正确的有_k2的值越大,两个分类变量的相关性越大;k2的计算公式是k2;若求出k243.841,则有95的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;独立性检验就是选取一个假设h0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理现象,则作出拒绝h0的推断解析:对于,k2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故错;对于,(adbc)应为(adbc)2,故错;对答案:5某班主任对全班50名学生作了一

21、次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450由表中数据计算得到k2的观测值k5.059,于是_(填“能”或“不能”)在犯错误的概率不超过0。01的前提下认为喜欢玩电脑游戏与认为作业多有关解析:查表知若要在犯错误的概率不超过0。01的前提下认为喜欢玩电脑游戏与认为作业多有关,则临界值k06。635,本题中,k5。0596.635,所以不能在犯错误的概率不超过0。01的前提下认为喜欢玩电脑游戏与认为作业多有关答案:不能6随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查

22、得到如下列联表:常饮酒不常饮酒合计患肝病2不患肝病18合计30已知在全部30人中随机抽取1人,抽到肝病患者的概率为.(1)请将上面的列联表补充完整,并判断是否有99。5的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:p(k2k)0.150。100.050。0250.0100。0050。001k2。0722。7063.8415.0246.6357.87910.828解:(1)设患肝病中常饮酒的人有x人,,x6.常饮酒不常饮酒合计患肝病628不患肝病41822合计102030由已知数据可求得k28.5237。879,因此有99。5的把握认为患肝病与常饮酒有关(2)设常饮酒且患肝病的男性为a,b,c,d,女性为e,f,则任取两人有ab,ac,ad,ae,af,bc,bd,be,bf,cd,ce,cf,de,df,ef,共1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论