版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)1上节学习了回归分析的基本方法线性回归模型ybxae不同于一次函数ybxa,含有_,其中x为_,y为_复习样本点的中心随机误差e解释变量预报变量残差平方和独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)3相关指数:(1)在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方.(2)R2取值越大(越接近1),则残差平方和越小,即模型的拟合效果越好.(实际上就是:|r|越大,则|e|越小)其中:4.独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)新课独立性检验的基
2、本思想及其初步应用(高中数学人教A版选修2-3)独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响等等? 独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3) 吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的
3、可能性大。0.54%2.28%探究独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计98749199651、列联表2、三维柱形图3、二维条形图不患肺癌患肺癌吸烟不吸烟不患肺癌患肺癌吸烟不吸烟080007000600050004000300020001000从三维柱形图能清晰看出各个频数的相对大小。从二维条形图能看出,吸烟者中患肺癌的比例高于不患肺癌的比例。通过图形直观判断两个分类变量是否相关:独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)不吸烟吸烟患肺癌比例不患肺癌比例4、等高条形图等高条形图更
4、清晰地表达了两种情况下患肺癌的比例。独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)某企业为了考察同一种产品在甲、乙两条生产线的产品合格率,同时各抽取100件产品,其中甲线中合格产品的个数为97,乙线中合格产品的个数为95。请做出列联表,三维柱形图与二维条形图。练习独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)合格不合格总计甲生产线973100乙生产线955100总计1928200独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)122列联表是传统的调查研究中最常用的方法之一,用于研究两个变
5、量之间相互独立还是存在某种关联性,它适用于分析两个变量之间的关系2在实际问题中,判断两个分类变量的关系的可靠性时,一般利用随机变量K2来确定,而不利用三维柱形图和二维条形图独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)练习:1.下面是一个22列联表则表中a、b处的值分别为()A94、96 B52、50C52、59 D54、52答案Cy1y2合计x1a2173x272027合计b41100独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)2用K2统计量进行独立性检验时,使用的表称为_,要求表中的四个数据_答案22列联表均大于5独立性检验的基本思想及其初步应用(高中数学
6、人教A版选修2-3)某学校对学生课外活动内容进行调查,结果整理成下表:利用图形判断学生课外活动的类别与性别是否有关系?体育文娱总计男生212344女生62935总计275279独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)解析某等高条形图如图所示由图可以直观地看出喜欢体育还是喜欢文娱在性别上有较大差异,说明课外活动的类别与性别在某种程度上有关系独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3) 上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。 现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”,
7、为此先假设 H0:吸烟与患肺癌没有关系.不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d把表中的数字用字母代替,得到如下用字母表示的列联表 用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即假设H0等价于 P(AB)=P(A)P(B).独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d在表中,a恰好为事件AB发生的频数;a+b和a+c
8、恰好分别为事件A和B发生的频数。由于频率接近于概率,所以在H0成立的条件下应该有独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3) 为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量-卡方统计量(1) 若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。根据表3-7中的数据,利用公式(1)计算得到K2的观测值为:那么这个值到底能告诉我们什么呢?(2) 独立性检验独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)在H0成立的情况下,统计学家估算出如下的概率 即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于0.01。 也就是说,
9、在H0成立的情况下,对随机变量K2进行多次观测,观测值超过的频率约为。思考 答:判断出错的概率为独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)判断 是否成立的规则如果 ,就判断 不成立,即认为吸烟与患肺癌有关系;否则,就判断 成立,即认为吸烟与患肺癌有关系。独立性检验的定义 上面这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。在该规则下,把结论“ 成立”错判成“ 不成立”的概率不会差过即有99%的把握认为 不成立。独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验的基本思想(类似反证法)(1)假设结
10、论不成立,即 “两个分类变量没有关系”.(2)在此假设下我们所构造的随机变量 K2 应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定可信程度上说明 不成立.即在一定可信程度上认为“两个分类变量有关系”;如果k的值很小,则说明由样本观测数据没有发现反对 的充分证据。(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为99%,即“两个分类变量有关系”这一结论成立的可信度为约为99%.独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)在实际应用中,要在获取样本数据之前通过下表确定临界值:0.500.400.250.150.100.
11、4550.7081.3232.0722.7060.050.0250.0100.0050.0013.8415.0246.6367.87910.828具体作法是:(1)根据实际问题需要的可信程度确定临界值 ;(2)利用公式(1),由观测数据计算得到随机变量 的观测值;(3)如果 ,就以 的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据。独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357
12、.87910.828独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)上面这种利用随机变量K2来确定在多大程度上可以认为”两个分类变量有关系”的方法称为两个分类变量的独立性检验独立性检验的基本思想类似于数学上的反证法.要确认”两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论”两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理.独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)总计aba+bcdc+d总计a+cb+da+b+c+d若要推断的结论为H1:”
13、X与Y有关系”,可如下操作:1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)总计aba+bcdc+d总计a+cb+da+b+c+d不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d主对角线副对角线(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)2.利用独立性检验来考察两个分类变量是否有关系, 并且能较精确地给出这种判断的可靠程度.
14、具体做法是:根据观测数据计算由给出的随机变量K2的值k,其值越大,说明”X与Y有关系”成立的可能性越大.当得到的观测数据a,b,c,d都不小于5时,可以通过查表来断言”X与Y有关系”的可信程度独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的_,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的_,称为列联表22列联表一般地,假设两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称22列联表)为自学导引1不同类别频数表独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)y1
15、y2总计x1ababx2cdcd总计acbdabcd想一想:如何理解分类变量?提示(1)这里的“变量”和“值”都应作为“广义”的变量和值来理解例如:对于性别变量,其取值有“男”和“女”两种,这里的“变量”指的是“性别”,这里的“值”指的是“男”或“女”因此,这里说的“变量”和“值”不一定是取具体的数值(2)分类变量是大量存在的例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验2定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2_其中n_具体步骤根据实际问题的需要,确定容许推断“两个分类变
16、量有关系”犯错误概率的上界.然后查表确定_利用公式计算随机变量K2的_如果_,就推断“X与Y有关系”,这种推断_不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中_支持结论“X与Y有关系”abcd临界值k0观测值k犯错误的概率没有发现足够证据kk0独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验临界值表P(K2k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828想一想:在K2运算时,在判
17、断变量相关时,若K2的观测值k,则P(K2和P(K2,哪种说法是正确的?提示两种说法均正确P(K2的含义是在犯错误的概率不超过的前提下,认为两变量相关;而P(K2的含义是在犯错误的概率不超过的前提下,认为两变量相关3.独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)题型一有关“相关的检验” 某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过的前提下,认为“喜欢体育还是文娱与性别有关系”?【例1】体育文娱总计男生212344女生62935总计275279独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)思路探索 可用数据计算
18、K2,再确定其中的具体关系解判断方法如下:假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则K2应该很小a21,b23,c6,d29,n79,且P(K2即我们得到的K2的观测值k超过,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于,即在犯错误的概率不超过的前提下认为“喜欢体育还是喜欢文娱与性别有关”独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:【变式1】成绩优秀成绩较差总计兴趣浓厚的643094 兴趣不
19、浓厚的227395总计86103189判断学生的数学成绩好坏与对学习数学的兴趣是否有关?独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3) 为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关?思路探索 要在选报文、理科与对外语有无兴趣之间有无关系作出判断,可以运用独立性检验的方法进行判断题型二有关“无关的检验”【例2】独立性检验的基本思想及其
20、初步应用(高中数学人教A版选修2-3)解列出22列联表理文总计有兴趣13873211无兴趣9852150总计236125361规律方法运用独立性检验的方法:(1)列出22列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:【变式2】 支持教育 改革情况学历积极支持教育改革不太赞成教育改革总计大学专科以上学历39157196大学专科以下学历29167196总计68324392对于教育机
21、构的研究项目,根据上述数据能得出什么结论独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3) 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表:甲厂 题型三独立性检验的基本思想【例3】分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数12638618292614独立性检验的基本思想及其初步应用(高中数学人教A版选修2-3)乙厂分组29.86,29.90)29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- tob企业品牌年度规划
- 制作和管理工作日志一
- 化妆品公司培训方案
- 医疗废物的处置原则
- 5月份规划报告
- 中小学安全知识培训
- 学期末汇报培训
- 外科相关疾病护理科普
- 315幼儿园主题活动
- 数学学案:课堂导学ax+b≤cax+b≥c型不等式的解法
- GB/T 25420-2021驱动耙
- 特应性皮炎积分指数AD 病情严重程度积分法(SCORAD)
- GB/T 19520.1-2007电子设备机械结构482.6mm(19in)系列机械结构尺寸第1部分:面板和机架
- GB/T 16762-2020一般用途钢丝绳吊索特性和技术条件
- 2023年北京市昌平区广播电视台(融媒体中心)招聘笔试题库及答案解析
- 主要耗能设备管理台账
- 2018年木地板公司组织架构及部门职能
- 露天矿山开采课件
- 语篇的衔接和连贯课件
- 蒋介石-教学讲解课件
- 《中级财务会计(二)》作业册形成性考核册国家开放大学电大
评论
0/150
提交评论