选修 独立性检验_第1页
选修 独立性检验_第2页
选修 独立性检验_第3页
选修 独立性检验_第4页
选修 独立性检验_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§2独立性检验1.掌握利用2×2列联表进行独立性检验,会用2×2列联表解决实际问题.(重点)

2.了解独立性检验的基本思想及实施步骤.(重点)3.掌握独立性检验的简单应用.(难点)独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等。探究点1独立性检验为了调查吸烟与患肺癌是否有联系,某机构随机调查了6578人,得到表中的数据(单位:人)患肺癌不患肺癌吸烟561932不吸烟2345672×2列联表这一问题称为2×2列联表的独立性检验.患肺癌情况吸烟情况思考:如何根据表格中的数据来判断吸烟与患肺癌是否有联系?

为了讨论的方便,我们引入以下记号:变量A:A1=吸烟,变量B:B1=患肺癌,计算得如下表格:患肺癌B1未患肺癌B2总计吸烟吸烟A22345674590总计7964996578我们假设吸烟与患肺癌是独立的,即吸烟不影响患肺癌.根据直观的经验,我们把吸烟人群中患肺癌的人所占百分比,与不吸烟人群中患肺癌的人所占百分比作比较.如果吸烟不影响患肺癌,就意味着,无论吸烟与否,患肺癌的人所占的百分比应该是基本一样的,就此题而言:患肺癌情况吸烟情况通过表格中的数据计算可得吸烟人群中患肺癌的人所占百分比是:不吸烟人群中患肺癌的人所占百分比是:另一方面,如果吸烟与患肺癌是独立的,那么有都成立,由上表数据可得:患肺癌情况吸烟情况既吸烟又患肺癌的人频率为:,吸烟的人频率为:,患肺癌的人频率为:.显然,两边相差很大,可以估计结论:患肺癌与吸烟有关.设A,B为两个变量,每个变量都可取两个值,变量A:变量B:,=;

,=

.【概括总结】BAB1B2总计A1ab____A2cdc+d总计a+c____n=________

a+ba+b+c+db+d设

,用估计,估计,估计.

若有式子,则可认为与独立.同理,若则可认为A1与B2独立;若则可认为A2与B1独立;若则可认为A2与B2独立.在中,由于,,表示的是频率,不同于概率,即使变量之间独立,式子两边也不一定恰好相等,但是当两边相差很大时,变量之间就不独立.

考察棉花种子经过处理跟棉花生病之间的关系,得到数据如下:则判断种子处理与得病之间的独立性.【练一练】种子处理情况得病情况解:由题意可知a=32,b=101,c=61,d=213,从而可得,所以种子处理与得病之间是独立的.在上面吸烟是否对患肺癌有影响的问题中探究点2独立性检验的基本思想当上面的值较大时,变量A,B不独立.思考

:当这些量多大时才能说明变量间不独立呢?我们能不能选择一个量,用它的大小来检验变量之间是否独立呢?统计学家选取以下统计量,用它的大小来检验变量之间是否独立:当较大时,说明变量之间不独立.当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.1.如果≤2.706,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;3.如果>3.841,有95%的把握判定变量A,B有关联;2.如果>2.706,有90%的把握判定变量A,B有关联;4.如果>6.635,有99%的把握判定变量A,B有关联.患肺癌B1未患肺癌B2总计吸烟吸烟A22345674590总计7964996578对于吸烟和患肺癌的问题所以有99%以上的把握认为吸烟与患肺癌是有关的.患肺癌情况吸烟情况参加体育锻炼情况

性别喜欢参加体育锻炼不喜欢参加体育锻炼男19748女135120为了了解高中生是否喜欢参加体育锻炼与性别之间的关系,调查者随机调查了500名高中生的情况,调查结果如下(单位:人):试问:高中生是否喜欢参加体育锻炼与性别之间有关系吗?【变式练习】解:根据表中的数据得a=197,b=48,c=135,d=120所以有99%以上的把握认为高中生是否喜欢参加体育锻炼与性别之间是有关的.例2.容易生气的人更有可能患心脏病吗?某机构随机调查了2796人,下表给出了调查的结果(单位:人):患心脏病未患心脏病易怒27606不易怒532110试问:容易生气的人是否更有可能患心脏病?患心脏病情况是否易怒解:根据题中的数据计算得下表(单位:人):患心脏病未患心脏病总计易怒27606633不易怒5321102163总计8027162796所以有95%以上的把握认为患心脏病与易怒有关.患心脏病情况是否易怒眼睛虹膜颜色头发颜色蓝色棕色红∕金黄色15612黑色2024例3.生物学上对于人类头发的颜色与眼睛虹膜的颜色是否有关进行了调研,以下是一次调查结果,调查人数共212人,调查记录如表(单位:人):试问:头发的颜色与眼睛虹膜的颜色有关吗?解:根据表中的数据计算得下表(单位:人):眼睛虹膜颜色头发颜色蓝色棕色总计红∕金黄色15612168黑色202444总计17636n=212因为55.576>6.635,所以有99%以上的把握认为头发的颜色与眼睛虹膜的颜色有关.独立性检验第一步:H0:吸烟和患病之间没有关系通过数据和图表分析,得到结论是:吸烟与患病有关患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d第二步:列出2×2列联表

用χ2统计量研究这类问题的方法步骤第三步:引入一个随机变量:卡方统计量第四步:查对临界值表,作出判断。P(χ≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)判断性别与休闲方式是否有关系.【变式练习】

看电视运动总计女432770男213354总计6460124解:根据题中的数据计算得下表因为,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有97.5%的把握认为“休闲方式与性别有关”.休闲方式性别1.下面是一个2×2列联表:则表中a,b的值分别为()A.94,96B.52,50C.52,54D.54,52y1y2总计x1a2173x222527总计b46nCxy2.分类变量X和Y的列联表如下,则()解:由的计算公式可知,(ad-bc)2越大,则越大,故相关关系越强.CA.

ad-bc越小,说明X与Y的关系越弱B.

ad-bc越大,说明X与Y的关系越强C.(ad-bc)2越大,说明X与Y的关系越强D.(ad-bc)2越接近于0,说明X与Y的关系越强X1Y1X2Y1XY3.若由一个2×2列联表中的数据计算得=4.013,那么有______的把握认为两个变量有关联解:因为=4.013>3.841.所以有95%的把握判定两个变量有关联.95%5.气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示.问它们的疗效有无差异(可靠性不低于99%)?有效无效总计复方江剪刀草18461245胆黄片919100总计27570345解:根据表中的数据计算得所以我们有99%以上的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论