第1章 §2 2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用_第1页
第1章 §2 2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用_第2页
第1章 §2 2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用_第3页
第1章 §2 2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用_第4页
第1章 §2 2.2 独立性检验+2.3 独立性检验的基本思想+2.4 独立性检验的应用_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页2.2独立性检验2.3独立性检验的基本思想2.4独立性检验的应用1.了解独立性检验的基本思想方法.(重点)2.了解独立性检验的初步应用.(难点)[基础·初探]教材整理1独立性检验阅读教材P21~P24第1行部分,完成下列问题.设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=eq\x\to(A)1;变量B:B1,B2=eq\x\to(B)1,有下面2×2列联表:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).【解析】因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即eq\f(b,a+b)=eq\f(18,58),eq\f(d,c+d)=eq\f(27,42),两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.【答案】是教材整理2独立性检验的基本思想阅读教材P24“练习”以下至P25“练习”以上部分,完成下列问题.在2×2列联表中,令χ2=eq\f(nad-bc2,a+bc+da+cb+d),当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.对分类变量X与Y的统计量χ2的值说法正确的是()A.χ2越大,“X与Y有关系”的把握性越小B.χ2越小,“X与Y有关系”的把握性越小C.χ2越接近于0,“X与Y无关系”的把握性越小D.χ2越大,“X与Y无关系”程度越大【解析】χ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.【答案】B[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:___________________________________________________解惑:___________________________________________________疑问2:___________________________________________________解惑:___________________________________________________疑问3:___________________________________________________解惑:___________________________________________________[小组合作型],2×2列联表在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用eq\f(a,a+b)与eq\f(c,c+d)判断二者是否有关系.【精彩点拨】eq\x(对变量进行分类)→eq\x(求出分类变量的不同取值)→eq\x(作出2×2列联表)→eq\x(计算\f(a,a+b)与\f(c,c+d)的值,作出判断)【自主解答】2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得eq\f(a,a+b)=eq\f(43,64)≈0.671875.eq\f(c,c+d)=eq\f(27,60)=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将eq\f(a,a+b)与eq\f(c,c+d)eq\b\lc\(\rc\)(\a\vs4\al\co1(或\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.[再练一题]1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.【解】作列联表如下:喜欢甜食情况性别喜欢甜食不喜欢甜食总计男117413530女492178670总计6095911200,独立性检验在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.未感冒感冒总计使用血清258242500未使用血清216284500总计4745261000【精彩点拨】独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.【自主解答】假设感冒与是否使用该种血清没有关系.由列联表中的数据,求得χ2的值为χ2=eq\f(1000×258×284-242×2162,474×526×500×500)≈7.075.χ2=7.075≥6.635,查表得P(χ2≥6.635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.1.熟练掌握χ2统计量的数值计算,根据计算得出χ2值,对比三个临界值2.706,3.841和6.635,作出统计推断.2.独立性检验的一般步骤:(1)根据样本数据列2×2列联表;(2)计算χ2=eq\f(nad-bc2,a+bc+da+cb+d)的值;(3)将χ2的值与临界值进行比较,若χ2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立.[再练一题]2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:【导学号:67720195】本地外地总计去年140728424249今年133120653396总计273849077645能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?【解】按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.因为χ2=eq\f(7645×1407×2065-2842×13312,4249×3396×2738×4907)≈30.35>6.635.所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.[探究共研型],独立性检验的综合应用探究1当χ2>3.841时,我们有多大的把握认为事件A与B有关?【提示】由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A与B有关.探究2在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?【提示】这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为eq\f(4,5).是否有充足的证据说明,学生对创建工作的满意情况与性别有关?【精彩点拨】解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.【自主解答】由题意得2×2列联表如下:满意不满意总计男生50555女生301545总计8020100χ2=eq\f(100×50×15-30×52,80×20×55×45)≈9.091>6.635,所以我们有99%的把握认为学生对创建工作的满意情况与性别有关.1.独立性检验的基本思想是:要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A与B有关,则推断结论为错误的可能性仅为5%(或1%).[再练一题]3.有两个变量x与y,其一组观测值如下2×2列联表所示:yxy1y2x1a20-ax215-a30+a其中a,15-a均为大于5的整数,则a取何值时,有95%的把握认为x与y之间有关系?【解】由题意χ2=eq\f(65[a30+a-20-a15-a]2,20×45×15×50)=eq\f(6565a-3002,20×45×15×50)=eq\f(1313a-602,5400).∵有95%的把握认为x与y之间有关系,∴χ2>3.841,∴eq\f(1313a-602,5400)>3.841,a>7.7或a<1.5.又a>5,15-a>5,∴7.7<a<10.又a∈N,∴a=8或a=9.[构建·体系]1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.【答案】C2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2=8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为()χ20.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828A.0.1% B.1%C.99% D.99.9%【解析】因为χ2>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.【答案】C3.在2×2列联表中,两个比值eq\f(a,a+b)与________相差越大,两个分类变量有关系的可能性越大.【解析】根据2×2列联表可知,比值eq\f(a,a+b)与eq\f(c,c+d)相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.【答案】eq\f(c,c+d)4.以下关于独立性检验的说法中,正确的是________.①独立性检验依据小概率原理;②独立性检验得到的结论一定正确;③样本不同,独立性检验的结论可能有差异;④独立性检验不是判断两分类变量是否相关的唯一方法.【解析】独立性检验得到的结论不一定正确,故②错,①③④正确.【答案】①③④5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品总计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.【解】将2×2列联表中的数据代入公式计算,得χ2=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论