高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用省公开课一等奖新名师获奖课件_第1页
高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用省公开课一等奖新名师获奖课件_第2页
高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用省公开课一等奖新名师获奖课件_第3页
高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用省公开课一等奖新名师获奖课件_第4页
高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用省公开课一等奖新名师获奖课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.2独立性检验基本思想及其初步应用第1页第2页主题1列联表与等高条形图1.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450第3页喜欢玩电脑游戏学生中认为作业多所占百分比是多少?不喜欢玩电脑游戏学生中认为作业多呢?提醒:喜欢玩电脑游戏学生中认为作业多所占比例是,不喜欢玩电脑游戏学生中认为作业多所占百分比是.第4页2.某校对学生课外活动(文娱和体育)进行调查,结果整理成下列图(两个深色条高分别表示男生与女生样本中喜欢文娱学生频率),则喜欢文娱学生中是男生还是女生所占百分比多?第5页提醒:从图中能够看出,喜欢文娱学生中女生所占百分比较多.第6页结论:2×2列联表及等高条形图1.与列联表相关概念(1)分类变量:变量不一样“值”表示个体所属_________,这么变量称为分类变量.不一样类别第7页(2)列联表:①列出_____分类变量_______,称为列联表.②普通地,假设有两个分类变量X和Y,它们取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:两个频数表第8页y1y2总计x1ab____x2cd____总计________________a+bc+da+cb+da+b+c+d第9页2.等高条形图直观性:与表格相比,等高条形图更能直观地反应出两个分类变量间是否_________.用途:(1)惯用等高条形图展示列联表数据_________.(2)判断两个分类变量之间相关系能够经过观察等高条形图相差很大两个量是____和____.相互影响频率特征第10页【微思索】1.分类变量值就是指一些详细实数吗?提醒:这里“变量”和“值”都应作为广义变量和值来了解,只要不属于同种类别都是变量和值,并不一定是取详细数值,如男、女,上、下,左、右等.第11页2.在2×2列联表中,|ad-bc|越大,说明两个分类变量关系怎样?提醒:在2×2列联表中,|ad-bc|越小,说明两个分类变量没相关系或关系不大,若|ad-bc|越大,说明两个分类变量关系越大.第12页3.利用等高条形图能否准确地判断两个分类变量是否相关系?为何?提醒:不能.因为经过等高条形图,能够粗略地判断两个分类变量是否相关系,但这种判断无法准确地给出所得结论可靠程度.第13页主题2独立性检验思想1.在2×2列联表中,若|ad-bc|无限趋近于0时,K2=(其中n=a+b+c+d)值是否也无限趋近于0?若|ad-bc|逐步增大时,K2=(其中n=a+b+c+d)值是否也逐渐增大?第14页提醒:当|ad-bc|无限趋近于0时,也会无限地靠近于0;一样,当|ad-bc|逐步增大时,也会逐步增大.第15页2.类比反证法思想,若要证实“两个分类变量相关系”应怎样操作?提醒:应该先假设“两个分类变量相关系”不成立,即这两个分类变量无关,然后再推出矛盾.第16页3.预计上面问题2假设中,能得出K2=

会向着什么方向(靠近于0还是越来越大)发展?其可能性大了好还是小了好?提醒:靠近于0;其可能性越大越好.第17页结论:独立性检验1.定义:利用随机变量K2来判断“两个分类变量_______”方法称为独立性检验.2.K2=,其中n=________.相关系a+b+c+d第18页3.独立性检验详细做法(1)依据实际问题需要确定允许推断“两个分类变量相关系”犯错误概率上界α,然后查表确定_______k0.(2)利用公式计算随机变量K2_______k.临界值观察值第19页(3)假如_____,就推断“X与Y相关系”,这种推断犯错误概率不超出α,不然就认为在_____________不超过α前提下不能推断“X与Y相关系”,或者在样本数据中_________________支持结论“X与Y相关系”.k≥k0犯错误概率没有发觉足够证据第20页【微思索】1.在计算K2,判断变量是否相关时,若K2观察值k=56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正确?第21页提醒:两种说法均正确.P(K2≥6.635)≈0.01含义是在犯错误概率不超出0.01前提下,认为两变量相关;而P(K2≥10.828)≈0.001含义是在犯错误概率不超出0.001前提下,认为两变量相关.第22页2.独立性检验步骤与反证法步骤中在推导假设不成立时主要区分是什么?提醒:其主要区分为,反证法原理:在一个已知假设下,假如推出一个矛盾,就证实了这个假设不成立;独立性检验(假设检验)原理:在一个已知假设下,假如一个与该假设矛盾小概率事件发生,就推断这个假设不成立.第23页【预习自测】1.以下关于独立性检验说法中,错误是(

)A.独立性检验依据是小概率原理B.独立性检验得到结论一定正确C.样本不一样,独立性检验结论可能有差异D.独立性检验不是判定两分类变量是否相关唯一方法第24页【解析】选B.利用独立性原理检验时与样本选取相关,所以得到结论可能有误,所以选项B不是一定正确.第25页2.对于研究两个分类变量A与B关系统计量K2,以下说法正确是(

)A.K2越大,说明“A与B相关系”可信度越小B.K2越小,说明“A与B相关系”可信度越小C.K2越大,说明“A与B无关”程度越大D.K2靠近于0,说明“A与B无关”程度越小第26页【解析】选B.由独立性检验思想可知:K2越小,说明“A与B相关系”可信度越小.第27页3.在2×2列联表中,两个比值__________相差越大,两个分类变量之间关系越强.

(

)【解析】选A.

相差越大,说明ad与bc相差越大,两个分类变量之间关系越强.第28页4.在一项打鼾与患心脏病是否相关调查中,共调查了1978人,经过计算K2=28.63,依据这一数据分析,我们有理由认为打鼾与患心脏病是__________(填“相关”或“无关”).第29页【解析】因为K2=28.63>10.828,所以打鼾与患心脏病无关这一假设不成立,这就意味着打鼾与患心脏病相关.答案:相关第30页5.为防治某种疾病,今研制一个新预防药.任选取100只小白鼠作试验,得到以下列联表:患病未患病总计服用药154055没服用药202545总计3565100第31页参考数据:K2观察值为3.2079,则在犯错误概率不超出______前提下认为“药品对防治某种疾病有效”.P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828第32页【解析】K2观察值为3.2079,依据参考数据,因为k=3.2079>2.706,所以在犯错误概率不超出0.10前提下认为“药品对防治某种疾病有效”.答案:0.10第33页6.高中流行这么一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生调查所得数据,试问:在犯错概率不超出0.025前提下,能否判断“文科学生总成绩不好与数学成绩不好相关系”?第34页总成绩不好总成绩好总计数学成绩不好47812490数学成绩好39924423总计87736913第35页【解析】依题意,计算随机变量K2观察值:

所以在犯错误概率不超出0.025前提下,能够判断“文科学生总成绩不好与数学成绩不好相关系”.第36页类型一列联表和等高条形图应用【典例1】某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用图形判断监督员甲在不在生产现场对产品质量好坏有没有影响.能否在犯错误概率不超出0.001前提下认为质量监督员甲在不在生产现场与产品质量好坏相关系?第37页【解题指南】由题目所给数据列出列联表并画出对应等高条形图,进而可直观判断两个分类变量之间是否相关系,再用独立性检验判断上述推断是否正确.第38页【解析】依据题目所给数据得以下2×2列联表:合格品次品总计甲在生产现场9828990甲不在生产现场49317510总计1475251500第39页对应等高条形图如图所表示.第40页图中两个深色条高分别表示甲在生产现场和甲不在生产现场样本中次品频率.从图中能够看出,甲不在生产现场样本中次品频率显著高于甲在生产现场样本中次品频率.所以能够认为质量监督员甲在不在生产现场与产品质量好坏相关系.第41页由列联表中数据,得K2观察值为

所以,在犯错误概率不超出0.001前提下,认为质量监督员甲在不在生产现场与产品质量好坏相关系.第42页【方法总结】判定结论成立可能性步骤(1)经过等高条形图,能够粗略地判断两个分类变量是否相关系,不过这种判断无法准确地给出所得结论可靠程度.(2)能够利用独立性检验来考查两个分类变量是否相关系,而且能较准确地给出这种判断可靠程度.第43页【巩固训练】从发生交通事故司机中抽取名司机作随机样本,依据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理以下:有责任无责任总计有酒精650150800无酒精7005001200总44页试分析血液中含有酒精与对事故负有责任是否相关系.第45页【解析】作等高条形图如图,图中阴影部分表示有酒精负责任与无酒精负责任频率,从图中能够看出,二者差距较大,由此我们能够在某种程度上认为“血液中含有酒精与对事故负有责任”相关系.第46页【赔偿训练】为了解铅中毒病人与尿棕色素为阳性是否相关系,分别对病人组和对照组尿液作尿棕色素定性检验,结果以下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573第47页试画出列联表等高条形图,分析铅中毒病人和对照组尿棕色素阳性数有没有差异,铅中毒病人与尿棕色素为阳性是否相关系?第48页【解析】等高条形图如图所表示:第49页其中两个浅色条高分别代表铅中毒病人和对照组样本中尿棕色素为阳性频率.由图能够直观地看出铅中毒病人与对照组相比,尿棕色素为阳性频率差异显著,所以铅中毒病人与尿棕色素为阳性相关系.第50页类型二两个变量独立性检验【典例2】(1)某高校“统计初步”课程教师随机调查了选该课一些学生情况,详细数据如表:专业性别非统计专业统计专业男1310女720第51页为了判断主修统计专业是否与性别相关系,依据表中数据,得到因为K2≥3.841,所以判定主修统计专业与性别相关系,那么这种判断犯错可能性为________.第52页(2)为了探究学生选报文、理科是否与对外语兴趣相关,某同学调查了361名高二在校学生,调查结果以下:理科对外语有兴趣有138人,无兴趣有98人,文科对外语有兴趣有73人,无兴趣有52人.能否在犯错误概率不超出0.1前提下,认为“学生选报文、理科与对外语兴趣相关”?第53页【解题指南】(1)可利用K2值查找临界值表即可;(2)利用“犯错误概率不超出0.1”,对应K2值应满足K2≥2.706判断.【解析】(1)因为K2>3.841,所以在犯错误概率不超出0.05前提下,认为主修统计专业与性别相关,犯错可能性为5%.答案:5%第54页(2)依据题目所给数据得到以以下联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361第55页依据列联表中数据由公式计算得

因为1.871×10-4<2.706,所以,在犯错误概率不超出0.1前提下,不能认为“学生选报文、理科与对外语兴趣相关”.第56页【延伸探究】1.把本例(2)条件“理科对外语有兴趣有138人,无兴趣有98人,文科对外语有兴趣有73人,无兴趣有52人.”换成“理科对外语有兴趣有100人,无兴趣有136人,文科对外语有兴趣有93人,无兴趣有32人.”其它条件不变,再求解该问题.第57页【解析】依据题目所给数据得到以以下联表:理科文科总计有兴趣10093193无兴趣13632168总计236125361第58页依据列联表中数据由公式计算得

因为33.690>2.706,所以,在犯错误概率不超出0.1前提下,能够认为“学生选报文、理科与对外语兴趣相关”.第59页2.在上述探究中能否在犯错误概率不超出0.001前提下,认为“学生选报文、理科与对外语兴趣相关”?【解析】由上述探究可知k≈33.690>10.828,故在犯错误概率不超出0.001前提下,认为“学生选报文、理科与对外语兴趣相关”.第60页【方法总结】1.“K2”“W”两点了解“K2”“W”都是伴随样本改变而改变随机变量.“K

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论