版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教a版选修12_第1页
版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教a版选修12_第2页
版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教a版选修12_第3页
版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教a版选修12_第4页
版高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用学案 新人教a版选修12_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.2独立性检验的基本思想及其初步应用1理解独立性检验的基本思想及其实施步骤(重点)2能利用条形图、列联表探讨两个分类变量的关系(易混点)3了解K2的含义及其应用4通过对数据的处理,来提高解决实际问题的能力(难点)基础初探教材整理1分类变量与列联表阅读教材P10P13的内容,完成下列问题1分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量2列联表(1)定义:列出的两个分类变量的频数表,称为列联表(2)22列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbda

2、bcd下面是一个22列联表:y1y2总计x1a2173x282533总计b46则表中a,b处的值分别为_【解析】a2173,a52.又ba852860.【答案】52,60教材整理2等高条形图阅读教材P14的内容,完成下列问题1定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图2等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征3观察等高条形图发现eq f(a,ab)和eq f(c,cd)相差很大,就判断两个分类变量之间有关系观察下列各图,其中两个分类变量x,y之间关系最强的是_图121【

3、解析】在四幅图中图(4)中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选(4)【答案】(4)教材整理3独立性检验阅读教材P12的内容,完成下列问题1定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验2公式K2eq f(nadbc2,abcdacbd),其中nabcd.1关于分类变量x与y的随机变量K2的观测值k,下列说法正确的是_(填序号)(1)k的值越大,“X和Y有关系”可信程度越小;(2)k的值越小,“X和Y有关系”可信程度越小;(3)k的值越接近于0,“X和Y无关”程度越小;(4)k的值越大,“X和Y无关”程度越大【解析】k的值越大,X和Y有关系的可能性就

4、越大,也就意味着X和Y无关系的可能性就越小【答案】(2)2式子|adbc|越大,K2的值就越_(填“大”或“小”)【解析】由K2的表达式知|adbc|越大,(adbc)2就越大,K2就越大【答案】大小组合作型用22列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主请根据以上数据作出饮食习惯与年龄的列联表,并利用eq f(a,ab)与eq f(c,cd)判断二者是否有关系【精彩点拨】eq x(对变量进行分类

5、)eq x(求出分类变量的不同取值)eq x(作出22列联表)eq x(计算f(a,ab)与f(c,cd)的值作出判断)【自主解答】22列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得eq f(a,ab)eq f(43,64)0.671 875.eq f(c,cd)eq f(27,60)0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系1作22列联表时,关键是对涉及的变量分清类别注意应该是4行4列,计算时要准确无误2利用22列联表分析两变量间的关系时,首先要根据题中数据

6、获得22列联表,然后根据频率特征,即将eq f(a,ab)与eq f(c,cd)eq blc(rc)(avs4alco1(或f(b,ab)与f(d,cd)的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣再练一题1某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众与年龄_(填“有关”或“无关”)【解析】因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节

7、目,即eq f(b,ab)eq f(18,58),eq f(d,cd)eq f(27,42),两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄有关【答案】有关用等高条形图分析两变量间的关系某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系【精彩点拨】eq x(作出22列联表)eq x(根据列联表数据作等高条形图)eq x(对比乘积的差距判断两个分类变量是否有关)【自主解答】作列联表如下:性格内向性格外向总计考前心情紧张33221

8、3545考前心情不紧张94381475总计4265941 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关1判断两个分类变量是否有关系的两种常用方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法(2)一般地,在等高条形图中,eq f(a,ab)与eq f(c,cd)相差越大,两个分类变量有关系的可能性就越大2利用等高条形图判断两个分类变量是否相关的步骤再练一题2为考察某种药物预防疾病的效果,

9、进行动物试验,得到如下的列联表:药物效果试验列联表患病未患病总计服用药104555没有服用药203050总计3075105试用图形判断服用药与患病之间是否有关系?【解】相应的等高条形图如下:从图形可以看出,服用药的样本中患病的比例明显低于没有服用药的样本中患病的比例,因此可以认为:服用药和患病之间有关系独立性检验在对人们休闲方式的一次调查中,共调查120人,其中女性70人、男性50人女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动(1)根据以上数据建立一个22的列联表;(2)休闲方式与性别是否有关?【精彩

10、点拨】先根据已知数据建立22列联表,再通过列联表中的数值求K2,再根据K2的值作出判断【自主解答】(1)22的列联表为看电视运动总计女性403070男性203050总计6060120(2)计算K2的观测值为keq f(120403020302,70506060)eq f(24,7)3.429.而2.7063.4292.706)0.10.所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关解决一般的独立性检验问题的步骤再练一题3为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有

11、兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关? 【导学号:81092004】【解】根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361根据列联表中数据由公式计算得K2的观测值为keq f(3611385273982,236125211150)71104.因为1.87110410.828,因此在犯错误不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关判断两个变量是否有关的三种方法再练一题4调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为

12、8人;出生时间在白天的男婴为31人,女婴为26人(1)将下面的22列联表补充完整;晚上白天总计男婴女婴总计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?【解】(1)22列联表如下:晚上白天总计男婴243155女婴82634总计325789(2)由所给数据计算K2的观测值keq f(8924263182,55343257)3.6892.706.根据临界值表知P(K22.706)0.10.因此在犯错误的概率不超过0.10的前提下认为婴儿的性别与出生时间有关系1在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近

13、视是否与性别有关时用什么方法最有说服力()A平均数与方差B回归分析C独立性检验D概率【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】C2为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用22列联表进行独立性检验,经计算K28.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为()P(K2k0)k0%B1%C99%D99.9%【解析】因为 K28.016.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”【答案】C3以下关于独立性检验的说法中,错误的是()A独立性检验依赖小概率原理B独立性检验得到的结论一定正确C样本不同,独立性

14、检验的结论可能有差异D独立性检验不是判定两事物是否相关的唯一方法【解析】受样本选取的影响,独立性检验得到的结论不一定正确,选B.【答案】B4在22列联表中,两个比值eq f(a,ab)与_相差越大,两个分类变量有关系的可能性越大. 【导学号:81092005】【解析】根据22列联表可知,比值eq f(a,ab)与eq f(c,cd)相差越大,则|adbc|就越大,那么两个分类变量有关系的可能性就越大【答案】eq f(c,cd)5某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计703010

15、0根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”【解】将22列联表中的数据代入公式计算,得keq f(nadbc2,abcdacbd)eq f(100601020102,70308020)eq f(100,21)4.762.因为4.7623.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”学业分层测评(建议用时:45分钟)学业达标一、选择题A和B有关,那么具体算出的数据满足()AK23.841BK2CK26.635DK2【解析】对应P(K2k0)的临界值表可知,当K2A与B有关【答案】A2下列关于等高条形图的叙述正确

16、的是()A从等高条形图中可以精确地判断两个分类变量是否有关系B从等高条形图中可以看出两个变量频数的相对大小C从等高条形图中可以粗略地看出两个分类变量是否有关系D以上说法都不对【解析】在等高条形图中仅能粗略判断两个分类变量的关系,故A错在等高条形图中仅能够找出频率,无法找出频数,故B错【答案】C3分类变量X和Y的列联表如下,则()y1y2总计x1abab x2cdcd总计acbdabcdA.adbc越小,说明X与Y的关系越弱Badbc越大,说明X与Y的关系越强C(adbc)2越大,说明X与Y的关系越强D(adbc)2越接近于0,说明X与Y的关系越强 【解析】结合独立性检验的思想可知|adbc|越

17、大,X与Y的相关性越强,从而(adbc)2越大,说明X与Y的相关性越强【答案】C4在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的下列说法中正确的是()A100个心脏病患者中至少有99人打鼾B1个人患心脏病,则这个人有99%的概率打鼾C100个心脏病患者中一定有打鼾的人D100个心脏病患者中可能一个打鼾的人都没有【解析】这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.【答案】D

18、5为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k9.643,根据临界值表,以下说法正确的是() 【导学号:81092006】A没有充足的理由认为课外阅读量大与作文成绩优秀有关B有0.5%的把握认为课外阅读量大与作文成绩优秀有关C有99.9%的把握认为课外阅读量大与作文成绩优秀有关D有99.5%的把握认为课外阅读量大与作文成绩优秀有关【解析】根据临界值表,9.6437.879,在犯错误的概率不超过0.005的前

19、提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关【答案】D二、填空题6为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后14天内的结果如表所示: 死亡存活总计第一种剂量141125第二种剂量61925总计203050 进行统计分析时的统计假设是_【解析】由独立性检验的步骤知第一步先假设两分类变量无关,即假设电离辐射的剂量与小白鼠的死亡无关【答案】 假设电离辐射的剂量与小白鼠的死亡无关7为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效有效总计男性患者153550女性患者64450总计2

20、179100设H0:服用此药的效果与患者性别无关,则K2的观测值k_,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为_【解析】由公式计算得K2的观测值k4.882,k3.841,有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错【答案】4.8825%8在对某小学的学生进行吃零食的调查中,得到如下表数据:吃零食不吃零食总计男生273461女生122941总计3963102根据上述数据分析,我们得出的K2的观测值k约为_【解析】由公式可计算得keq f(102272934122,39636141)2.334.【答案】三、解答题9对某校小学生进行心理障碍测

21、试得到如下列联表:有心理障碍没有心理障碍总计女生1030男生7080总计20110将表格填写完整,试说明心理障碍与性别是否有关?附:P(K2k0)k0【解】将列联表补充完整如下:有心理障碍没有心理障碍总计女生102030男生107080总计2090110keq f(110107020102,30802090)6.3665.024,所以有97.5%的把握认为心理障碍与性别有关10某市地铁即将于2017年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:月收入(单位:百元)15,25)25,35)35,45)45,55)55,65)65,7

22、5赞成定价者人数123534认为价格偏高者人数4812521(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);(2)由以上统计数据填下面22列联表,分析是否有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”.月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者赞成定价者总计附:K2eq f(nadbc2,abcdacad).P(K2k0)k0【解】(1)“赞成定价者”的月平均收入为x1eq f(201302403505603704,123534)50.56.“认为价格

23、偏高者”的月平均收入为x2eq f(2043084012505602701,4812521)38.75,“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1x250.5638.7511.81(百元)(2)根据条件可得22列联表如下:月收入不低于55百元的人数月收入低于55百元的人数总计认为价格偏高者32932赞成定价者71118总计104050K2eq f(503117292,10401832)6.276.635,没有99%的把握认为“月收入以55百元为分界点对地铁定价的态度有差异”能力提升1假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其22列联表为:Y Xy1y2总计x1ababx2cdcd总计acbdabcd对同一样本,以下数据能说明X与Y有关的可能性最大的一组为()Aa5,b4,c3,d2Ba5,b3,c4,d2Ca2,b3,c4,d5Da3,b2,c4,d5【解析】对于同一样本,|adbc|越小,说明x与y相关性越弱,而|adbc|越大,说明x与y相关性越强,通过计算知,对于A,B,C都有|adbc|1012|2.对于选项D,有|adbc|158|7,显然72.【

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论