高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用 为你深度剖析独立性检验的基本思想素材 新人教A版选修2-3(通用)_第1页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用 为你深度剖析独立性检验的基本思想素材 新人教A版选修2-3(通用)_第2页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用 为你深度剖析独立性检验的基本思想素材 新人教A版选修2-3(通用)_第3页
高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用 为你深度剖析独立性检验的基本思想素材 新人教A版选修2-3(通用)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、为你深度剖析独立性检验的基本思想吃透独立性检验的基本思想,对于广大出学者来说都是首先要解决的一个问题.但这一问题并不是通过一段文字就能说明白的,也不是通过几个数据就能解决的.下面我们就从几个方面加以剖析、说明.一. 列联表相关的概念:1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”.不患肺癌患肺癌总计不吸烟777542

2、7817吸烟2099492148总计98749199652列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个值,这样的列联表称为. 如右图吸烟与患肺癌的列联表:由列联表可以粗略估计出吸烟者和不吸烟者患肺癌的可能性存在差异. 二. 独立性检验的基本思想:1独立性检验的必要性(为什么不能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.关于这一点在下面的例题中还要进一步说明.2独立性检验的步骤及原理(与反证法类似):反证法假设检验要证明结论A备择假设H在A不成立的前提下进行

3、推理在H不成立的条件下,即H成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1)很大没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H成立的小概率事件不发生,接受原假设3.独立性检验的案例展示案例.某医疗机构为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965个成年人,其中吸烟者2148人,不吸烟者7817 人,调查结果是:吸烟的2148 人中49人患肺癌,2099人不患肺癌;不吸烟的7817人中42人患肺癌,7775人不患肺癌.根据这些数据能否断定:患肺癌与吸烟有关?从问题“吸烟是否与

4、患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表,柱形图,和条形图的展示,使学生直观感觉到吸烟和患肺癌可能会有关系.不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965在不吸烟者中患肺癌的比重是0.54% ;在吸烟者中患肺癌的比重是 2.28% .说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.通过数据和图表分析,得到结论是:吸烟与患肺癌有关.但这种结论能否推广到总体呢?要回答这个问题,就必须借助于统计理论来分析.独立性检验就是检验两个分类变量是否有关的一种统计方法:用字母表示吸烟与患肺癌的列联表:不患肺癌患肺癌合计不吸烟

5、aba+b吸烟cdc+d合计a+cb+da+b+c+d样本容量 假设H0 :吸烟与患肺癌没有关系。则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:因此,越小,说明吸烟与患肺癌之间关系越弱.构造随机变量 其中作为检验在多大程度上可以认为“两个变量有关系”的标准 .若成立,则应该很小.把表中数据代入公式得:在成立的情况下,统计学家估算出如下概率:.即在成立的情况下,的值大于6.635的概率非常小.因此,我们有99%的把握认为“吸烟与患肺癌有关”.总结一:解题步骤总结:第一步:提出假设检验问题H:吸烟与患肺癌没有关系 H:吸烟与患肺癌有关系第二步:选择检验的指标(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H:吸烟与患肺癌有关系”成立的可能性越大.第三步:由下表查表得出结论P(k2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83总结二:结论的归纳总结:要确认“两个分类变量有关系”这一结论成立的可信度,首先假设该结论不成立,即假设 “两个分类变量没有关系”成立,在该假设下构造随机变量应该很小.而如果由观测数据计算得到的的观测值很大,则在一定可信程度上就说明了假设不成立.根据随机变量的含义,可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论