




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
独立性检验的根本思想
及其初步应用第1课时.1.两种变量及研究相关关系的方法:变量分类变量定量变量例如:身高、体重、考试成绩,温度等等3)例如是性别,否吸烟,是否患肺癌,宗教信仰等等1)变量的不同“值”表示个体的不同类别的变量(也叫属性变量或者定性变量)
定量变量的取值一定是实数,它们的取值大小有特定的含义,不同取值之间的运算也有特定的含义。2)分类变量的取值一定是离散的研究两个定量变量相关关系的方法:回归分析(画散点图,相关系数r,相关指数R2,残差分析等)4)研究两个分类变量相关关系的方法:
①通过图形直观判断两个分类变量是否相关;②独立性检验法.本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们主要考虑分类变量的之间是否有关系:例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等。在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。一.引入新课:2.引入:.二.问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果〔单位:人〕2×2列联表思考:根据以上表格。能否断定吸烟对患肺癌有影响?判断的标准是什么?吸烟与不吸烟,患病的可能性的大小是否有差异?不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965吸烟与患肺癌列联表〔列出两个分类变量的频数表〕:.方法1.用频率估计概率患病未患病合计(n)吸烟2.28%97.72%100%(2148)不吸烟0.54%99.46%100%(7817)方法2.通过图形直观判断由上表可看出,在不吸烟者中患肺癌的比重是
在吸烟者中患肺癌的比重是
0.54%2.28%根据统计分析的思想,用频率估计概率可知,吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大等高条形图患肺癌比例不患肺癌比例由上述图形显然可以得到结论是:吸烟与患肺癌有关思考:这种判断可靠吗?你能有多大把握认为“患病与吸烟有关〞呢?注意:与表格相比,图形能更直观地反映出相关数据的总体状况。.
首先,假设结论不成立,即记H0:吸烟和患肺癌之间没有关系
思考:通过数据和图表分析,得到结论是:吸烟与患肺癌有关.这种判断可靠吗?你能有多大把握认为“患病与吸烟有关〞呢?吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d吸烟的人中不患肺癌的比例:不吸烟的人中不患肺癌的比例:假设H0成立,即“吸烟与患肺癌没有关系〞,那么在吸烟者中不患肺癌的比例应该与不吸烟中不患肺癌的比例应差不多,即|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强..1.为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们引入一个随机变量〔其中n=a+b+c+d为样本容量)作为检验在多大程度上可以认为“两个变量有关系〞的标准思考:k2大小的标准是什么呢?在假设H0成立,即“吸烟与患肺癌没有关系〞成立的前提下,那么K2应该很小.故,当K2很小时,说明在一定可信程度上假设H0成立,即“吸烟与患肺癌没有关系〞成立当K2很大时,说明没有充分的证据说明假设H0成立,即没有充分的证据说明“吸烟与患肺癌没有关系〞成立,即“吸烟与患肺癌没有关系〞不成立,即“吸烟与患肺癌有关系〞成立,分析:K2越小,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;K2越大,
|ad-bc|越大,说明吸烟与患肺癌之间关系越强..k2大小的标准是什么呢?10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445
k0.0010.0050.0100.0250.050.100.150.50.400.50临界值表〔1〕如果k>=10.828,就有99.9%的把握认为“X与Y有关系〞;〔2〕如果k>=6.635,就有99%的把握认为“X与Y有关系〞;〔3〕如果k>=2.706,就有90%的把握认为“X与Y有关系〞;〔4〕如果k<=2.706,就认为没有充分的证据显示“X与Y有关系〞但也不能作出结论“H0成立〞,即X与Y没有关系。例如:对于两个分类变量X与Y临界值k.注:1〕这种判断可能会犯错误,但是犯错误的不会超过0.001,这是个小概率事件,即我们有99.9%的把握认为“吸烟与患癌症有关系〞2〕用统计量来确定在多大程度上可以认为“两个分类变量有关系〞的方法称为这两个分类变量的独立性检验。.在吸烟与患肺病这两个分类变量的计算中,以下说法正确的选项是〔〕A、假设K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患肺病B、从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病C、假设从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推理出现错误D、以上三种说法都不对c.课堂小结1、理解分类变量,会作列联表及等高条形图2、了解独立性检验的思想.3.独立性检验的根本思想:(类似于数学上的反证法,对“两个分类变量有关系〞这一结论成立可信程度的判断):〔1〕假设该结论不成立,即假设结论“两个分类变量没有关系〞成立.〔2〕在假设H0成立的条件下,计算构造的随机变量K2,由于在此假设下随机变量K2应该很小,故如果由观测数据计算得到的K2很大,那么在一定程度上说明假设“两个分类变量没有关系〞不合理,即说明两个分类变量之间有关系.〔3〕根据随机变量K2的含义,可以通过〔2〕式评价假设不合理的程度,如由实际计算出的k
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 舰桥上行走的规则
- 城市综合管廊建设与管理解决方案
- 环境科学中关于全球气候变化试题
- 企业ERP系统集成服务项目合同
- 地理信息系统应用知识点梳理与考核试题集
- 建筑结构与建筑设计练习题库
- 现代管理学原理应用问题解析题
- 企业研发投入与转化效率对比表
- 建筑工程施工承包协议
- 个性化学习服务平台构建及实施方案设计
- 数学家的故事华罗庚
- 山塘维修加固工程监理实施细则
- VDA6.3:2023 汽车核心工具自我评估测试题库真题 (含答案)
- 殡仪服务员考试殡仪服务员考试考点模拟考试练习
- 外国文学理论知到章节答案智慧树2023年湖南师范大学
- 【建模教程】-数学建模教案
- 全口义齿修复有关的基本知识 全口义齿固位和稳定
- 2023年湖南食品药品职业学院高职单招(数学)试题库含答案解析
- GB/T 2481.1-1998固结磨具用磨料粒度组成的检测和标记第1部分:粗磨粒F4~F220
- GB/T 20878-2007不锈钢和耐热钢牌号及化学成分
- 第2课《说和做》课件-部编版语文七年级下册
评论
0/150
提交评论