2024年高中数学第4章点数统计案例4.3列联表独立性分析案例讲义含解析湘教版选修1-2_第1页
2024年高中数学第4章点数统计案例4.3列联表独立性分析案例讲义含解析湘教版选修1-2_第2页
2024年高中数学第4章点数统计案例4.3列联表独立性分析案例讲义含解析湘教版选修1-2_第3页
2024年高中数学第4章点数统计案例4.3列联表独立性分析案例讲义含解析湘教版选修1-2_第4页
2024年高中数学第4章点数统计案例4.3列联表独立性分析案例讲义含解析湘教版选修1-2_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE144.3列联表独立性分析案例[读教材·填要点]1.列联表一般地,对于两个因素X和Y,X的两个水平取值:A和eq\x\to(A)(如吸烟和不吸烟),Y也有两个水平取值:B和eq\x\to(B)(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.YXBeq\x\to(B)总计Aaba+beq\x\to(A)cdc+d总计a+cb+dn其中n=a+b+c+d.2.独立性分析事务A与B独立,这时应当有P(AB)=P(A)P(B)成立.我们用字母H0来表示上式,即H0:P(AB)=P(A)·P(B),称之为统计假设.我们引入统计中一个特别有用的χ2统计量,它的表达式是χ2=eq\f(nad-bc2,a+bc+da+cb+d).用它的大小可以确定是否拒绝原来的统计假设H0.假如算出的χ2值较大,就拒绝H0,也就是拒绝“事务A与B无关”,从而就认为它们是有关的了.[小问题·大思维]1.利用χ2进行独立性分析,估计值的精确度与样本容量有关吗?提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越精确.假如抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有牢靠性.2.在χ2运算后,得到χ2的值为29.78,在推断因素相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.88)≈0.005,哪种说法是正确的?提示:两种说法均正确.P(χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P(χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.独立性分析的原理某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.能否在犯错误的概率不超过0.001的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系?[自主解答]依据题目所给数据得如下2×2列联表:合格品次品总计甲在生产现场9828990甲不在生产现场49317510总计1475251500由列联表中的数据,得χ2=eq\f(1500×982×17-8×4932,990×510×1475×25)≈13.097>10.828.因此,在犯错误的概率不超过0.001的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系.1.解决一般的独立性分析问题,首先由所给2×2列联表确定a,b,c,d,n的值,然后代入随机变量的计算公式求出观测值χ2,将χ2与临界值x0进行对比,确定有多大的把握认为两个分类变量有关系.2.反证法原理与独立性检验原理的比较反证法原理——在假设H0下,假如推出一个冲突,就证明白H0不成立.独立性检验原理——在假设H0下,假如出现一个与H0相冲突的小概率事务,就推断H0不成立,且该推断犯错误的概率不超过小概率.1.某大型企业人力资源部为了探讨企业员工工作主动性和对待企业改革看法的关系,经过调查得到如下列联表:主动支持企业改革不太支持企业改革总计工作主动544094工作一般326395总计86103189依据列联表的独立性分析,能否在犯错误的概率不超过0.01的前提下认为工作看法与支持企业改革之间有关系?解:由列联表中的数据,得χ2=eq\f(189×54×63-40×322,94×95×86×103)≈10.759>6.635,∴在犯错误的概率不超过0.01的前提下,认为工作看法与支持企业改革之间有关系.独立性分析的应用某校对学生课外活动进行调查,结果整理如下表:体育文娱总计男生212344女生62935总计275279依据列联表的独立性分析,能否在犯错误的概率不超过0.01的前提下认为宠爱体育还是文娱与性别有关?[自主解答]由列联表中的数据,得χ2=eq\f(79×21×29-23×62,21+23×6+29×21+6×23+29)≈8.106>6.635.∴在犯错误的概率不超过0.01的前提下认为“宠爱体育还是宠爱文娱与性别有关.”独立性分析的步骤(1)提出统计假设H0:X与Y无关;(2)依据2×2列联表与χ2计算公式计算出χ2的值;(3)依据两个临界值,作出推断.2.同时抛掷两颗匀称的骰子,请回答以下问题:(1)求两颗骰子都出现2点的概率;(2)若同时抛掷两颗骰子180次,其中甲骰子出现20次2点,乙骰子出现30次2点,问两颗骰子在犯错误的概率不超过0.05的前提下均出现2点是否相关?解:(1)每颗骰子出现2点的概率都为eq\f(1,6),由相互独立事务同时发生的概率公式得两颗骰子都出现2点的概率为eq\f(1,6)×eq\f(1,6)=eq\f(1,36).(2)依题意,列2×2列联表如下:出现2点出现其他点合计甲骰子20160180乙骰子30150180合计50310360假设H0:两颗骰子在犯错误的概率不超过0.05的前提下均出现2点无关.由公式计算得χ2=eq\f(360×20×150-160×302,50×310×180×180)≈2.323.因为2.323<3.841,所以我们不拒绝H0,因此我们没有理由说两颗骰子在犯错误的概率不超过0.05的前提下均出现2点相关.独立性分析的综合应用为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015完成下面2×2列联表,并回答能否在犯错误的概率不超过0.01的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小于70mm2疱疹面积不小于70mm2总计注射药物Aa=b=注射药物Bc=d=总计n=[自主解答]依据题目数据得如下2×2列联表:疱疹面积小于70mm2疱疹面积不小于70mm2总计注射药物Aa=70b=30100注射药物Bc=35d=65100总计10595n=200由列联表中的数据,得χ2=eq\f(200×70×65-35×302,100×100×105×95)≈24.56>6.635.因此,我们有99%的把握,即在犯错误的概率不超过0.01的前提下认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要留意列联表中各行、各列中数据的意义及书写格式.3.某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成果,采纳分层抽样的方法在两校共抽取了200名学生的数学成果,如表.(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成果:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数10253530x乙校高二年级数学成果:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数153025y5(1)计算x,y的值,并分别估计以上两所学校数学成果的平均分(精确到1分);(2)若数学成果不低于80分为优秀,低于80分为非优秀,依据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成果有差异”?分类甲校乙校总计优秀非优秀总计解:(1)依题意,知甲校应抽取110人,乙应抽取90人,所以x=10,y=15.甲校的平均分为eq\f(1,110)×(55×10+65×25+75×35+85×30+95×10)≈75.乙校的平均分为eq\f(1,90)×(55×15+65×30+75×25+85×15+95×5)≈71.(2)数学成果不低于80分为优秀,低于80分为非优秀,得到列联表如下:分类甲校乙校总计优秀402060非优秀7070140总计11090200所以χ2=eq\f(200×40×70-20×702,110×90×60×140)≈4.714,又因为4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成果有差异”.在调查的480名男人中,有38名患色盲,520名女人中,有6名患色盲.试推断在犯错误的概率不超过0.01的前提下认为人的性别与患色盲有关?你所得到的结论在什么范围内有效?[解]由题意作2×2列联表如下:色盲非色盲总计男38442480女6514520总计449561000法一:由列联表中数据可知,在调查的男人中,患色盲的比例是eq\f(38,480)≈7.917%,女人中患色盲的比例为eq\f(6,520)≈1.154%,由于两者差距较大,因而我们可以认为性别与患色盲是有关系的.法二:由列联表中所给的数据可知,a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,代入公式得χ2=eq\f(1000×38×514-6×4422,480×520×44×956)≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握,即在犯错误不超过0.01的前提下认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.1.下面是2×2列联表:y1y2总计x1a2173x222527总计b46则表中a,b的值分别为()A.94,96 B.52,50C.52,54 D.54,52解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:C2.下列关于χ2的说法中正确的是()A.χ2在任何相互独立问题中都可以用于检验是否相关B.χ2的值越大,两个事务的相关性越大C.χ2是用来推断两个相互独立事务相关与否的一个统计量,它可以用来推断两个事务是否相关这一类问题D.χ2=eq\f(nad-bc,a+bc+da+cb+d)答案:C3.对于因素X与Y的随机变量χ2的值,下列说法正确的是()A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越大解析:χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.χ2越小,“X与Y有关系”的可信程度越小.答案:B4.若由一个2×2列联表中的数据计算得χ2的观测值k≈4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.055.当某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节起先,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:阳性例数阴性例数总计新防护服57075旧防护服101828总计1588103通过数据分析,说明有________的把握认为新防护服对预防工人职业性皮炎有效.解析:χ2=eq\f(103×5×18-70×102,75×28×15×88)≈13.826>6.635.故有99%的把握说,新防护服比旧防护服对预防工人职业性皮炎有效.答案:99%6.为了解某班学生宠爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:宠爱打篮球不宠爱打篮球总计男生ab=5女生c=10d总计50已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为eq\f(3,5).(1)请将上面的列联表补充完整;(2)是否有99%的把握认为宠爱打篮球与性别有关?请说明理由.解:(1)列联表补充如下:宠爱打篮球不宠爱打篮球总计男生20525女生101525总计302050(2)∵χ2=eq\f(50×20×15-10×52,30×20×25×25)≈8.333>6.635,∴有99%的把握认为宠爱打篮球与性别有关.一、选择题1.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成果,稳居金牌榜榜首,由此很多人认为中国进入了世界体育强国之列,也有很多人持反对看法,有网友为此进行了调查,在参与调查的2548名男性中有1560名持反对看法,2452名女性中有1200名持反对看法,在运用这些数据说明性别对推断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有劝服力()A.平均数与方差 B.回来直线方程C.独立性检验 D.概率解析:由于参与调查的人按性别被分成了两组,而且每一组又被分成了两种状况,推断有关与无关,符合2×2列联表的要求,故用独立性检验最有劝服力.答案:C2.春节期间,“厉行节约,反对奢侈”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015则下面的正确结论是()附表及公式:P(χ2≥x0)0.1000.0500.0100.001x02.7063.8416.63510.828χ2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.A.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:由列联表得到a=45,b=10,c=30,d=15,则a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100,计算得χ2=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(100×675-3002,55×45×75×25)≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.答案:A3.某高校“统计初步”课程的老师随机调查了选该课的一些学生状况,详细数据如下表:非统计专业统计专业男1310女720为了分析主修统计专业是否与性别有关,依据表中的数据,得到χ2=eq\f(5013×20-10×72,23×27×20×30)≈4.84,所以断定主修统计专业与性别有关系,这种推断出错的可能性为()A.0.025 B.0.05C.0.975 D.0.95解析:∵χ2≈4.84>3.841,所以我们有95%的把握认为主修统计专业与性别无关,即推断出错的可能性为0.05.答案:B4.已知P(χ2≥2.706)=0.10,两个因素X和Y,取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若在犯错误的概率不超过0.1的前提下,认为X与Y有关系,则c等于()A.5 B.6C.7 D.8答案:A二、填空题5.班级与成果2×2列联表:优秀不优秀总计甲班103545乙班738p总计mnq表中数据m,n,p,q的值应分别为________.解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸烟与患肺病是否相关的推断中,有下面的说法:①若χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③7.某卫朝气构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.解析:列出2×2列联表:发病不发病总计阳性家族史1693109阴性家族史17240257总计33333366所以随机变量χ2值为eq\f(366×16×240-17×932,109×257×33×333)≈6.067>3.841,所以在犯错误的概率不超过0.05的前提下,认为糖尿病患者与遗传有关.答案:95%8.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:______(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即eq\f(b,a+b)=eq\f(18,58),eq\f(d,c+d)=eq\f(27,42),两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是三、解答题9.某市对该市一重点中学2024年高考上线状况进行统计,随机抽查得到表格:语文数学英语综合科目上线不上线上线不上线上线不上线上线不上线总分上线201人17427178231762517526总分不上线43人3013232024192617总计20440201432004420143试求各科上线与总分上线之间的关系,并求出哪一科目与总分上线关系最大?解:对于上述四个科目,分别构造四个随机变量χeq\o\al(2,1),χeq\o\al(2,2),χeq\o\al(2,3),χeq\o\al(2,4).由表中数据可以得到:语文:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论