




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.2独立性检验的根本思想及其初步应用精选课件我们经常听到这些说法:吸烟对患肺癌有影响;数学好的人物理一般也很好;是否喜欢数学课程与性别之间有关系;人的血型会决定人的性格;星座与人的命运之间有某种联系.
这些说法都有道理吗?精选课件探究1独立性检验的根本思想对于性别变量,其取值为男和女两种.这种变量的不同“值〞表示个体所属的不同类别,像这样的变量称为.分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等.分类变量x是变量吗?y表示一年四季,那么y的取值有哪些?y是变量吗?x表示性别,那么x的取值有哪些?精选课件(2)分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义,如用“0〞表示“男〞,用“1〞表示“女〞.对分类变量的理解(1)分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等.精选课件不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:3-7吸烟与患肺癌列联表〔单位:人〕两个分类变量的频数表,称为列联表思考1:你如何由列联表中的数据判断吸烟是否对肺癌有影响?能不能从患肺癌的人数来判断?应该从什么量来判断?精选课件不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:3-7吸烟与患肺癌列联表〔单位:人〕在吸烟者中患肺癌的比重是_______.
2.28%在不吸烟者中患肺癌的比重是_______,
0.54%由计算结果,你会做出怎样的判断?你的判断一定正确吗?能知道判断犯错误的概率是多少吗?精选课件等高条形图患肺癌比例不患肺癌比例思考2:除了用比例来判断吸烟是否对患肺癌有影响外?还有其它方法来判断吗?〔1〕观察等高条形图,你得到什么结论?〔2〕你的判断一定正确吗?能知道判断的正确率是多少吗?精选课件思考3:通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关〞.但是我们不知道我们判断的正确率有多大,那么我们是否能够以一定的把握认为“吸烟与患肺癌有关〞呢?为了答复上述问题,我们先假设:H0:吸烟与患肺癌没有关系.用A表示不吸烟,B表示不患肺癌,那么“吸烟与患肺癌没有关系〞独立,即假设H0等价于P(AB〕=P(A〕×P(B).精选课件3-8吸烟与患肺癌列联表(单位:人)
不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d把表3-7中的数字用字母代替,得到如下用字母表示的列联表思考4:〔1〕在表3-8中,事件AB发生的频数是什么?〔3〕事件B发生的频数是什么?〔2〕事件A发生的频数是什么?〔4〕P(AB〕、P(A〕、P(B)分别是什么?它们之间有什么关系?〔5〕|ad-bc|越小,说明什么问题?|ad-bc|越大,说明什么问题?精选课件即〔a+b+c+d)a=(a+b)(a+c)即精选课件精选课件为使不同的样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量其中n=a+b+c+d为样本容量.思考5:〔2〕K2越大,说明什么问题?〔1〕K2越小,说明什么问题?结论:假设H0成立,即“吸烟与患肺癌没有关系〞,那么K2应该很小.精选课件不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965请根据表3-7中的数据,利用公式〔1〕计算K2的观测值3-7吸烟与患肺癌列联表〔单位:人〕精选课件思考6:这个值到底是大还是小,它能告诉我们什么呢?(2〕式说明,在H0成立的情况下,K2的观测值超过6.635的概率非常小,近似为0.01,所以K2≥6.635是一个小概率事件,根本不发生.思考7:〔1〕我们计算的K2的观测值k≈56.632,远远大于6.635,它发生的概率大不大?是不是一个小概率事件?〔2〕你觉H0成立吗?〔3〕你的判断会犯错误吗?犯错误的概率有多大?〔4〕上述的方法相比于之前讲的两种方法,它有什么优势?〔5〕你能总结上述检验方法及它的一般步骤吗?精选课件〔5〕你能总结上述检验方法及它的一般步骤吗?结论:在上述过程中,实际上是借助于随机变量K2的观测值k建立了一个判断H0是否成立的规那么:如果k≥6.635,就判断H0不成立,即认为吸烟与患肺癌有关系;否那么,就判断H0成立,即认为吸烟与患肺癌没有关系.在该规那么下,把结论“H0成立〞错判成“H0不成立〞的概率不会超过0.01,即有99%的把握认为不成立.一般步骤:①假设两个分类变量X与Y没有关系.②计算出K2的观测值k.③判断k的值的大小,即k是不是一个小概率事件,从而确定X与Y有关的程度或无关系.精选课件结论:这种判断两个分类变量是否有关系的方法称为“独立性检验〞1.定义:利用随机变量K2来判断“两个分类变量有关系〞的方法称为独立性检验.思考8:独立性检验与反证法有何异同?反证法独立性检验假设命题的结论不正确假设H0:两个分类变量X,Y没有关系在假设的前提下,推出矛盾在H0成立的条件下,得到一个小概率事件所以假设不成立,原命题成立所以H0不成立,即两个分类变量X,Y有关系精选课件2.独立性检验的一般步骤①假设两个分类变量X与Y没有关系.②计算出K2的观测值k.③判断k的值的大小,即k是不是一个小概率事件,从而确定X与Y有关的程度或无关系.精选课件问题1:如何判断K2的观测值k是大还是小呢?这仅需确定一个正数k0,当k≥k0时就认为K2的观测值k大.此时相应于的判断规那么为:如果k≥k0,就认为“两个分类变量之间有关系〞;否那么就认为“两个分类变量之间没有关系〞.我们称这样的k0为一个判断规那么的临界值.按照上述规那么,把“两个分类变量之间没有关系〞错误地判断为“两个分类变量之间有关系〞的概率为P(K2≥k0).在实际应用中,我们把k≥k0解释为有(1-P(K2≥k0))×100%的把握认为“两个分类变量之间有关系〞;把k<k0解释为不能以(1-P(K2≥k0))×100%的把握认为“两个分类变量之间有关系〞,或者样本观测数据没有提供“两个分类变量之间有关系〞的充分证据.精选课件0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828精选课件问题2:如何用独立性检验的方法来检验两个分类变量X和Y是否有关系呢?一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表〔称为2×2列联表〕为:表3-92×2列联表
y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d假设要推断的论述为Hl:X与Y有关系,可以按如下步骤判断结论Hl成立的可能性:精选课件假设要推断的论述为Hl:X与Y有关系,可以按如下步骤判断结论Hl成立的可能性:1.计算满足条件X=x1的个体中具有Y=y1的个体所占的比例和满足条件X=x2的个体中具有Y=y2的个体所占的比例.两个比例的值相差越大,H1成立的可能性就越大.也可以通过画出等高条形图,粗略地判断两个分类变量是否有关系,但是以上两种判断无法精确地给出所得结论的可靠程度.
2.可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:精选课件(3)如果k≥k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系〞;否那么就说样本观测数据没有提供“X与Y有关系〞的充分证据.①根据实际问题需要确定容许推断“两个分类变量有关系”犯错误的上界,然后查表3-11确定临界值;0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.828表3-11临界值表精选课件例1、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1)利用图形判断秃顶与患心脏病是否有关系;(2)能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?例题解析:思考:根据临界值表,在犯错误的概率不超过0.01的前提下,取的临界值是什么?精选课件患心脏病患其他病总计秃顶214175389不秃顶4515971048总计6657721437(1)相应的等高条形图如下所示,秃顶不秃顶不患心脏病患心脏病解:根据题目所给数据得到如以下联表:由图可认为秃顶与患心脏病有关系精选课件因此,在犯错误的概率不超过0.01的前提下,认为秃顶与患心脏病有关系.(2)根据列联表中的数据,得到注意:在熟悉了独立性检验的根本原理后,我们在判断两个分类变量是否有关时,可以直接算出的观测值〔不画等高条形图〕来解决两个分类变量的独立性检验问题。但是,借助于图形可以更直观地向非专业人士解释所得到的统计分析结果。精选课件精选课件精选课件练习2、在研究某种新药对小白兔的防治效果时,得到下表数据:存活数死亡数总计未用新药10138139用新药12920149总计23058288试分析新药对防治小白兔是否有效?有99.5%的把握判定新药对防治小白兔是有效的.解:精选课件练习3、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司收购合同协议书
- 全程服务委托合同协议书
- 建筑安装工程劳务合同
- 招标文件中合同条款
- 《假如》教学课件-
- 人民数据:数据资产入表解决方案2024
- 敲墙合同范本
- 托盘加工制作合同范本
- 大庆个人租房合同范本
- 2025年度合作方试销标准版合同
- 物流公司文件记录保存制度
- 输水管线工程施工方案
- 建设项目日照分析报告
- 电力公司电力设备运行维护管理手册
- 紫藤花的秘密课件
- 复工复产六个一方案模板
- DB11T 775-2010 透水混凝土路面技术规程
- 教案-人工智能通识课-AIGC - 任务11 内容生成之使用Kimi AI进行多文本阅读
- (部编版)统编版小学语文教材目录(一至六年级上册下册齐全)
- 2024-2030年中国人绒毛膜促性腺激素(HCG)行业市场发展趋势与前景展望战略分析报告
- 数据治理平台建设方案
评论
0/150
提交评论