数学选修2-3学案第三章统计案例3.1_第1页
数学选修2-3学案第三章统计案例3.1_第2页
数学选修2-3学案第三章统计案例3.1_第3页
数学选修2-3学案第三章统计案例3.1_第4页
数学选修2-3学案第三章统计案例3.1_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学习目标1.了解2×2列联表的意义.2.了解统计量χ2的意义.3.通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一2×2列联表思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?答案可通过表格与图形进行直观分析,也可通过统计分析定量判断.梳理(1)2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:Ⅱ类1类2合计Ⅰ类Aaba+b类Bcdc+d合计a+cb+da+b+c+d(2)χ2统计量的求法公式χ2=eq\f(nad-bc2,a+bc+da+cb+d).知识点二独立性检验独立性检验的概念用χ2统计量研究两变量是否有关的方法称为独立性检验.知识点三独立性检验的步骤1.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828表示在H0成立的情况下,事件“χ2≥x0”发生的概率.2.推断依据(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”.(2)若χ2>6.635,那么有99%的把握认为“Ⅰ与Ⅱ有关系”.(3)若χ2>2.706,那么有90%的把握认为“Ⅰ与Ⅱ有关系”.(4)若χ2≤2.706,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.类型一2×2列联表例1在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.解作列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计6095911200反思与感悟分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.跟踪训练1(1)下面是2×2列联表:y1y2合计x1a2173x222527合计b46100则表中a,b的值分别为________,________.答案5254解析∵a+21=73,∴a=52.又∵a+2=b,∴b=54.(2)某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中有213名在考前心情紧张.作出2×2列联表.解作列联表如下:性格内向性格外向合计考前心情紧张332213545考前心情不紧张94381475合计4265941020类型二由χ2进行独立性检验例2对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.解假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据得a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式得χ2=eq\f(392×39×167-157×292,196×196×68×324)≈1.779.因为χ2≈1.779<2.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别.反思与感悟独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.跟踪训练2某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.解(1)2×2列联表如下所示:赞同不赞同总计老教师101020青年教师24630总计341650(2)假设“对新课程教学模式的赞同情况与教师年龄无关”.由公式得χ2=eq\f(50×10×6-24×102,34×16×20×30)≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.类型三独立性检验的综合应用例3电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时间的频率分布直方图如图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料推断“体育迷”与性别是否有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的概率分布,均值E(X)和方差V(X).附:χ2=eq\f(nad-bc2,a+bc+da+cb+d).P(χ2≥x0)0.100.050.01x02.7063.8416.635解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得χ2=eq\f(100×30×10-45×152,75×25×45×55)=eq\f(100,33)≈3.030.因为2.706<3.030<3.841,所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关.(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为eq\f(1,4).由题意知,X~B(3,eq\f(1,4)),从而X的概率分布为X0123Peq\f(27,64)eq\f(27,64)eq\f(9,64)eq\f(1,64)故E(X)=np=3×eq\f(1,4)=eq\f(3,4),V(X)=np(1-p)=3×eq\f(1,4)×eq\f(3,4)=eq\f(9,16).反思与感悟独立性检验的步骤第一步,假设两个分类变量X与Y无关系;第二步,找相关数据,列出2×2列联表;第三步,由公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d)计算出χ2的值;第四步,将χ2的值与临界值进行比较,进而作出统计推断.这些临界值,在高考题中常会附在题后,应适时采用.跟踪训练3某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数10253530x乙校高二年级数学成绩:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数153025y5(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分;(精确到1分)(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”?甲校乙校总计优秀非优秀总计解(1)依题意知,甲校应抽取110人,乙校应抽取90人,∴x=10,y=15,估计两个学校的平均分,甲校的平均分为eq\f(55×10+65×25+75×35+85×30+95×10,110)≈75.乙校的平均分为eq\f(55×15+65×30+75×25+85×15+95×5,90)≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到2×2列联表如下:甲校乙校总计优秀402060非优秀7070140总计11090200χ2=eq\f(200×40×70-20×702,60×140×110×90)≈4.714,又4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.1.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填有关,无关)答案有关2.为了考察长头发与女性头晕是否有关系,随机抽查301名女性,得到如下所示的列联表,试根据表格中已有数据填空.经常头晕很少头晕合计长发35①121短发37143②合计72③④则空格中的数据分别为:①________;②________;③________;④________.答案861802293013.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是________.(填序号)①若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③若从χ2与临界值的比较中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.答案③解析对于①,99%的把握是通过大量的试验得出的结论,这100个吸烟的人中可能全患肺病也可能都不患,是随机的,所以①错;对于②,某人吸烟只能说其患病的可能性较大,并不一定患病;③的解释是正确的.

4.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:心脏病无心脏病秃发20300不秃发5450根据表中数据得到χ2=eq\f(775×20×450-5×3002,25×750×320×455)≈15.968,因为χ2>6.635,则断定秃发与心脏病有关系,那么这种判断出错的可能性为________.答案0.01解析因为χ2>6.635,所以有99%的把握说秃发与患心脏病有关,故这种判断出错的可能性有1-0.99=0.01.5.根据下表计算:不看电视看电视男3785女35143χ2≈________.(保留3位小数)答案4.514解析χ2=eq\f(300×37×143-85×352,122×178×72×228)≈4.514.1.列联表列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算统计量χ2的值,如果χ2的值很大,说明假设不合理.χ2越大,两个分类变量有关系的可能性越大.课时作业一、填空题1.在对某小学的学生进行吃零食的调查中,得到如下表数据:吃零食不吃零食总计男学生273461女学生122941总计3963102根据上述数据分析,我们得出的χ2约为________.答案2.334解析由公式可计算得χ2=eq\f(102×27×29-34×122,39×63×61×41)≈2.334.2.有两个分类变量X,Y,其2×2列联表如下表所示,Y1Y2X1a20-aX215-a30+a其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为________.答案8或9解析根据公式,得χ2=eq\f(65×[a30+a-15-a20-a]2,20×45×15×50)=eq\f(13×13a-602,20×45×3×2)>3.841,根据a>5且15-a>5,a∈Z,求得当a=8,9时满足题意.3.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定“X与Y有关系”的可信程度.如果χ2≥5.024,那么有把握认为“X与Y有关系”的百分比为________.P(χ2≥x0)0.500.400.250.150.10x00.4550.7081.3232.0722.706P(χ2≥x0)0.050.0250.0100.0050.001x03.8415.0246.6357.87910.828答案97.5%解析x0=5.024,对应的0.025是“X和Y有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.4.在一个2×2列联表中,由其数据计算得χ2的估计值χ2=6.888,则其两个变量间有关系的可能性为________.答案99%解析由于χ2=6.888>6.635,所以其两个变量间有关系的可能性为99%.5.在独立性检验中,两个分类变量“X与Y有关系”的可信度为99%,则统计量χ2的取值范围是________.答案[6.635,7.879)6.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由χ2=eq\f(nad-bc2,a+bc+da+cb+d),算得χ2=eq\f(110×40×30-20×202,60×50×60×50)≈7.8.附表:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828参照附表,得到的正确结论是________.(填序号)①有99%以上的把握认为“爱好该项运动与性别有关”;②有99%以上的把握认为“爱好该项运动与性别无关”;③在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;④在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”.答案①解析由7.8>6.635知,有99%以上的把握认为“爱好该项运动与性别有关”.7.某班主任对全班50名学生进行了作业量的调查,数据如下表:认为作业量大认为作业量不大合计男生18927女生81523合计262450则推断“学生的性别与认为作业量大有关”这种事件犯错误的概率不超过________.答案0.025解析由公式得χ2=eq\f(50×18×15-8×92,26×24×27×23)≈5.059>5.024.∵P(χ2≥5.024)=0.025,∴犯错误的概率不超过0.025.8.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________.(填序号)①若χ2的观测值x0=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.答案③解析χ2是支持确定有多大的把握认为“两个分类变量吃零食与性别有关系”的统计量,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.9.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:无效有效总计男性患者153550女性患者64450总计2179100设H:服用此药的效果与患者的性别无关,则χ2≈_____________________________(小数点后保留3位有效数字),从而得出结论;服用此药的效果与患者的性别有关,这种判断出错的可能性为________.答案4.8825%解析由公式计算得χ2≈4.882,∵χ2>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.10.某班主任对全班30名男生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多合计喜欢玩电脑游戏12820不喜欢玩电脑游戏2810合计141630该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.答案0.050解析χ2=eq\f(30×12×8-8×22,14×16×20×10)≈4.286>3.841,∴推断犯错误的概论不超过0.050.11.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:月收入2000元以下月收入2000元以上合计高中文化以上104555高中文化及以下203050合计3075105由上表数据计算得χ2=eq\f(105×10×30-20×452,55×50×30×75)≈6.109,估计有________的把握认为“文化程度与月收入有关系”.答案97.5%解析∵χ2=6.109>5.024,∴有97.5%的把握认为“文化程度与月收入有关系”.12.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的________倍.答案2解析由公式χ2=eq\f(nad-bc2,a+bc+da+cb+d)中所有值变为原来的2倍,得(χ2)′=eq\f(2n2a·2d-2b·2c2,2a+2b2c+2d2a+2c2b+2d)=2χ2,故χ2也变为原来的2倍.二、解答题13.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数12638618292614乙厂:分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写下面的2×2列联表,并问能否在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异”?甲厂乙厂总计优质品非优质品总计解(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为eq\f(360,500)=72%;乙厂抽查的产品中有'320件优质品,从而乙厂生产的零件的优质品率估计为eq\f(320,500)=64%.(2)2×2列联表如下:甲厂乙厂总计优质品360320680非优质品140180320总计5005001000χ2=eq\f(1000×360×180-320×1402,500×500×680×320)≈7.353>6.635,所以在犯错误的概率不超过0.01的前提下认为“两个分厂生产的零件的质量有差异.”三、探究与拓展14.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:不喜欢西班牙队喜欢西班牙队总计高于40岁pq50不高于40岁153550总计ab100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为eq\f(3,5),则有超过__

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论