高中数学苏教版3第三章统计.2回归分析 第3章独立性检验_第1页
高中数学苏教版3第三章统计.2回归分析 第3章独立性检验_第2页
高中数学苏教版3第三章统计.2回归分析 第3章独立性检验_第3页
高中数学苏教版3第三章统计.2回归分析 第3章独立性检验_第4页
高中数学苏教版3第三章统计.2回归分析 第3章独立性检验_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独立性检验1.了解独立性检验的概念,会判断独立性检验事件.2.能列出2×2列联表,会求χ2(卡方统计量的值).3.能够利用临界值,作出正确的判断.(重点)4.应用独立性检验分析实际问题.(难点)[基础·初探]教材整理12×2列联表的意义阅读教材P91~P94“例1”以上部分,完成下列问题一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到如下表所示的抽样数据:Ⅱ类1类2合计Ⅰ类Aaba+b类Bcdc+d合计a+cb+da+b+c+d形如上表的表格称为2×2列联表,2×2列联表经常用来判断Ⅰ和Ⅱ之间是否有关系.下面是一个2×2列联表:y1y2合计x1a2173x282533合计b46则表中a,b处的值分别为________.【解析】∵a+21=73,∴a=52.又b=a+8=52+8=60.【答案】52,60教材整理2独立性检验阅读教材P93~P94“例1”以上部分完成下列各题.1.独立性检验2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,结果并不唯一.因此,由某个样本得到的推断有可能正确,也有可能错误.为了使不同样本量的数据有统一的评判标准,统计学中引入下面的量(称为卡方统计量):χ2=eq\f(nad-bc2,a+bc+da+cb+d)(*),其中n=a+b+c+d为样本容量.用eq\a\vs4\al(χ2)统计量研究这类问题的方法称为独立性检验(testofindependence).2.独立性检验的基本步骤要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表与公式(*)计算χ2的值;(3)查对临界值(如下表),作出判断.P(χ2≥x0)x0P(χ2≥x0)x01.关于分类变量x与y的随机变量χ2的观测值k,下列说法正确的是________.(填序号)(1)k的值越大,“X和Y有关系”可信程度越小;(2)k的值越小,“X和Y有关系”可信程度越小;(3)k的值越接近于0,“X和Y无关”程度越小;(4)k的值越大,“X和Y无关”程度越大.【解析】k的值越大,X和Y有关系的可能性就越大,也就意味着X和Y无关系的可能性就越小.【答案】(2)2.式子|ad-bc|越大,χ2的值就越________.(填“大”或“小”)【解析】由χ2的表达式知|ad-bc|越大,(ad-bc)2就越大,χ2就越大.【答案】大[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:解惑:疑问2:解惑:疑问3:解惑:[小组合作型]绘制2×2列联表在一项有关医疗保健的社会调查中,调查的男性为530人,女性为670人,发现其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.【精彩点拨】分成两类,找出不同类情况下的两个数据再列表.【自主解答】作2×2列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计60959112001.分清类别是作列联表的关键.2.表中排成两行两列的数据是调查得来的结果.3.选取数据时,要求表中的四个数据a,b,c,d都要不小于5,以保证检验结果的可信度.[再练一题]1.某电视公司为了研究体育迷是否与性别有关,在调查的100人中,体育迷75人,其中女生30人,非体育迷25人,其中男生15人,请作出性别与体育迷的列联表.【解】体育迷非体育迷合计男451560女301040合计7525100利用χ2值进行独立性检验某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:阳性例数阴性例数合计新防护服57075旧防护服101828合计1588103问这种新防护服对预防工人患职业性皮肤炎是否有效?并说明你的理由.【精彩点拨】通过有关数据的计算,作出相应的判断.【自主解答】提出假设H0:新防护服对预防皮肤炎没有明显效果.根据列联表中的数据可求得χ2=eq\f(103×5×18-70×102,75×28×15×88)≈.因为H0成立时,χ2≥的概率约为,而这里χ2≈>,所以我们有%的把握说新防护服比旧防护服对预防工人患职业性皮肤炎有效.根据2×2列联表,利用公式eq\f(nad-bc2,a+bc+da+cb+d)计算χ2的值,再与临界值比较,作出判断.[再练一题]2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.根据以上数据判断男性病人的秃顶与患心脏病是否有关系?【解】提出假设H0:男性病人的秃顶与患心脏病没有关系.根据题中所给数据得到如下2×2列联表:患心脏病未患心脏病合计秃顶214175389不秃顶4515971048合计6657721437根据列联表中的数据可以求得χ2=eq\f(1437×214×597-175×4512,389×1048×665×772)≈.因为当H0成立时,χ2≥的概率约为,而这里χ2≈>,所以有%的把握认为,男性病人的秃顶与患心脏病有关系.[探究共研型]独立性检验的综合应用探究1利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?【提示】利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.探究2在χ2运算后,得到χ2的值为,在判断变量相关时,P(χ2≥≈和P(χ2≥≈,哪种说法是正确的?【提示】两种说法均正确.P(χ2≥≈的含义是在犯错误的概率不超过的前提下认为两个变量相关;而P(χ2≥≈的含义是在犯错误的概率不超过的前提下认为两个变量相关.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过的前提下,认为质量监督员甲是否在生产现场与产品质量有关?【精彩点拨】解答本题可先列出2×2列联表,然后具体分析.【自主解答】(1)2×2列联表如下:合格品数次品数合计甲在生产现场9828990甲不在生产现场49317510合计1475251500由列联表可得|ad-bc|=|982×17-493×8|=12750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.(2)由2×2列联表中数据,计算得到χ2的观测值为χ2=eq\f(1500×982×17-493×82,990×510×1475×25)≈>,因此在犯错误的概率不超过的前提下,认为质量监督员甲是否在生产现场与产品质量有关.判断两个变量是否有关的三种方法[再练一题]3.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2列联表补充完整;晚上白天合计男婴女婴合计(2)能否在犯错误的概率不超过的前提下认为婴儿性别与出生时间有关系?【解】(1)晚上白天合计男婴243155女婴82634合计325789(2)由所给数据计算χ2的观测值χ2=eq\f(89×24×26-31×82,55×34×32×57)≈>.根据临界值表知P(χ2≥≈.因此在犯错误的概率不超过的前提下认为婴儿的性别与出生时间有关系.[构建·体系]1.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的________倍.【解析】由公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)中所有值变为原来的2倍,得(χ2)′=eq\f(2n2a·2d-2b·2c2,2a+2b2c+2d2a+2c2b+2d)=2χ2,故χ2也变为原来的2倍.【答案】22.下列说法正确的是________.(填序号)①对事件A与B的检验无关,即两个事件互不影响;②事件A与B关系越密切,χ2就越大;③χ2的大小是判断事件A与B是否相关的唯一数据;④若判定两事件A与B有关,则A发生B一定发生.【解析】对于①,事件A与B的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故①错.②是正确的.对于③,判断A与B是否相关的方式很多,可以用列联表,也可以借助于概率运算,故③错.对于④,两事件A与B有关,说明两者同时发生的可能性相对来说较大,但并不是A发生B一定发生,故④错.【答案】②3.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科文科合计男131023女72027合计203050已知P(χ2≥≈,P(χ2≥≈,根据表中数据得到χ2=eq\f(50×13×20-10×72,23×27×20×30)≈.则有__________的把握认为选修文科与性别有关.【答案】95%4.在2×2列联表中,两个比值eq\f(a,a+b)与________相差越大,两个分类变量有关系的可能性越大.【导学号:29440066】【解析】根据2×2列联表可知,比值eq\f(a,a+b)与eq\f(c,c+d)相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.【答案】eq\f(c,c+d)5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.【解】将2×2列联表中的数据代入公式计算,得χ2=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(100×60×10-20×102,80×20×70×30)=eq\f(100,21)≈.因为>,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.我还有这些不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论