版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、问题: 数学家庞加莱每天都从一家面包店买一块1000g 的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。 假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g ; “这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件; 这个小概率事件的发生使庞加莱得出推断结果。一:假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。例如,在前面的例子中, 原假设为: H0:面包分量足,备择假设为 H1:面包分量不足。这个假设检验
2、问题可以表达为: H0:面包分量足 H1:面包分量不足二:求解假设检验问题考虑假设检验问题: H0:面包分量足 H1:面包分量不足 在H0成立的条件下,构造与H0矛盾的小概率事件; 如果样本使得这个小概率事件发生,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。求解思路:三:二个概念这种变量的不同取“值”表示个体所属的不同类别,这类变量称为分类变量1.分类变量 对于性别变量,取值为:男、女 分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等等。利用随机变量K2来确定在多大程度上可以认为”两个分类变量有关系”的方法称为两个分类变量
3、的独立性检验.(为假设检验的特例) 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)列联表在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大0.54%2.28%1)通过图形直观判断两个分类变量是否相关:三维柱状图2) 通过图形直观判断两个分类变量是否相关:二维条形
4、图3)通过图形直观判断两个分类变量是否相关:患肺癌比例不患肺癌比例 独立性检验H0: 吸烟和患肺癌之间没有关系 H1: 吸烟和患肺癌之间有关系通过数据和图表分析,得到结论是:吸烟与患肺癌有关结论的可靠程度如何? 用 A 表示“不吸烟”, B 表示“不患肺癌”则 H0: 吸烟和患肺癌之间没有关系 “吸烟”与“患肺癌”独立,即A与B独立P P( (A AB B) )= = P P( (A A) )P P( (B B) )等价于等价于 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+
5、da+b+c+da+b+c+da a + + b ba a + + c ca aP P( (A A) ), ,P P( (B B) ), ,P P( (A AB B) )n nn nn n其其 中中 n n = = a a + + b b + + c c + + d dacac,a+bc+da+bc+d a a c c+ +d d c c a a+ +b b , ,adbcaa+ba+caa+ba+cnnnnnn2 22 2n n(a ad d- -b bc c)K K = =( (a a+ +b b) )( (c c+ +d d) )( (a a+ +c c) )( (b b+ +d d)
6、) 独立性检验0.adbca ad d- -b bc c 越越小小,说说明明吸吸烟烟与与患患肺肺癌癌之之间间的的关关系系越越弱弱,ad-bc 越大,说明吸烟与患肺癌之间的关系越强ad-bc 越大,说明吸烟与患肺癌之间的关系越强引入一个随机变量作为检验在多大程度上可以认为“两个变量有关系”的标准 。1)如果P(m10.828)= 0.001表示有99.9%的把握认为”X与Y”有关系;2)如果P(m7.879)= 0.005表示有99.5%的把握认为”X与Y”有关系;3)如果P(m6.635)= 0.01表示有99%的把握认为”X与Y”有关系;4)如果P(m5.024)= 0.025表示有97.5
7、%的把握认为”X与Y”有关系;5)如果P(m3.841)= 0.05表示有95%的把握认为”X与Y”有关系;6)如果P(m2.706)= 0.010表示有90%的把握认为”X与Y”有关系;7)如果m2.706),就认为没有充分的证据显示”X与Y”有关系;设有两个分类变量X和Y它们的值域分别为x1,x2和y1,y2其样本频数列表(称为22列联表) 为y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d22列联表22()()()()n ad bcKa b c d a c b d()2 2
8、P(k m)P(k m)适用观测数据a、b、c、d不小于5 独立性检验 吸烟与肺癌列联表吸烟与肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7775427817吸烟吸烟2099492148总计总计9874919965通过公式计算2242 209956.6327817 2148 9874 91K9965(7775 49) 独立性检验已知在 成立的情况下,0H2(6.635)0.01P K 即在 成立的情况下,K2 大于6.635概率非常小,近似为0.010H现在的K2=56.632的观测值远大于6.635分类变量之间关系条形图柱形图列联表独立性检验背景分析例1.在某医院,因为患心脏病
9、而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断是否有关?你所得的结论在什么范围内有效?例2.为考察高中生性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 性别与喜欢数学课程列联表喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程 总计总计 男男 37 37 85 85 122 122 女女 35 35 143 143 178 178 总计总计 72 72 228 228 300 300由表中数据计算得 ,高中生的性别与是否喜欢数学课程之间是否有关系?为什么?2 2K K 4 4. .5 51 13 3acdb独立性检验基本的思想类似反证法(1)假设结论不成立,即“两个分类变量没有关系”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 软件技术授权与技术服务合同
- 二零二五版专业打印设备销售及租赁合同3篇
- 2025年度化工企业安全教育培训师劳动合同规范
- 2025年度高速公路服务区环氧地坪施工与防滑处理合同
- 2025年度国际物流亚马逊FBA快速响应服务合同
- 2025年度股票期权财务顾问服务合同
- 2025年塑料家居用品采购合同范本
- 2025年度红砖产业投资基金合作合同
- 2025年国际货物运输保险责任险合同模板
- 2025年度俱乐部会员制管理承包合同范本
- 搞笑小品剧本《大城小事》台词完整版
- 人大代表小组活动计划人大代表活动方案
- 《大模型原理与技术》全套教学课件
- 2023年护理人员分层培训、考核计划表
- 《销售培训实例》课件
- 2025年四川省新高考八省适应性联考模拟演练(二)地理试卷(含答案详解)
- 【经典文献】《矛盾论》全文
- Vue3系统入门与项目实战
- 2024年宁夏回族自治区中考英语试题含解析
- 光伏发电项目试验检测计划
- 房屋建筑工程投标方案(技术方案)
评论
0/150
提交评论