版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2 2定定量量变变量量回回归归分分析析(画画散散点点图图、相相关关系系数数r r、变变量量 相相关关指指数数R R 、残残差差分分析析)分分类类变变量量研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。定量变量:体重、身高、温度、考试成绩等等。变量 分类变量:性别、是否吸烟、是否患肺癌、变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。宗教信仰、国籍等等。两种变量:独立性检验独立性检验分类变量分类变量:变量的不同”值”表示个体所属的不同 类别.如如:性别,是否吸烟,宗教信仰,国籍等日常生活中我们关心这样一些问题:日常生活中我们关心这样一些问题:吸烟与患肺癌之间有
2、无关系?吸烟与患肺癌之间有无关系?秃顶与心脏病之间有无关系?秃顶与心脏病之间有无关系?性别与喜欢数学课之间有无关系?性别与喜欢数学课之间有无关系?例例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了调查了9965人,得到如下结果:人,得到如下结果:不患肺癌患肺癌总计比例不吸烟77754278170.54吸烟20994921482.28总计9874919965问:吸烟是否对患肺癌有影响?问:吸烟是否对患肺癌有影响?解解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可可能性存在差异能性
3、存在差异,我们再通过不同的图表来分析,我们再通过不同的图表来分析列联表:两个分列联表:两个分类变量的类变量的频数表频数表患肺癌患肺癌三维柱形图三维柱形图不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965二维条形图二维条形图等高条形图等高条形图上面我们通过图形的分析,初步判断吸烟与患上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题要用统计的观点来考察这个问题我们首先设基本事件为:我们首先设基本事件为:H0:吸烟与患肺癌没有关系:吸烟与患肺癌没有关系我们下面
4、就一般关系做一个推断我们下面就一般关系做一个推断不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+d如果吸烟与患肺癌没有关系,则:如果吸烟与患肺癌没有关系,则:dccbaaa(c+d)c(a+b)ad-bc0因此,因此, ad-bc 越小,说明吸烟与患肺炎之间没有关系。越小,说明吸烟与患肺炎之间没有关系。为了使样本空间有一定的代表性,我们引入一个随机变量为了使样本空间有一定的代表性,我们引入一个随机变量)()()()(22dbcadcbabcadnK(n=a+b+c+d(样本容量))若,若,H0成立,成立,(吸烟与患肺癌无关吸烟与患肺癌
5、无关)则则K应该很小,通过计应该很小,通过计算我们可以得到算我们可以得到K的观测值:的观测值:kK256.632总计的四项总计的四项说明:根据统计学家的分析:说明:根据统计学家的分析:P(K210.828)0.001P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001K。0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828表表1-120.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.63
6、57.87910.8282()P Kkk(7)2.706,kXY如果就认为没有充分的证据显示与 有关系(6)2.706,90%kXY如果就有的把握认为与 有关系(1)10.828,99.9%kXY如果就有的把握认为与 有关系(2)7.879,99.5%kXY如果就有的把握认为与 有关系(3)6.635,99%kXY如果就有的把握认为与 有关系(4)5.024,97.5%kXY如果就有的把握认为与 有关系(5)3.841,95%kXY如果就有的把握认为与 有关系上面的利用上面的利用K2来检验来检验“两个变量有两个变量有关系关系”的方法成为:的方法成为:独立性检验独立性检验说明:说明:两个变量两个
7、变量X与与Y独立性检验的一般方法:独立性检验的一般方法:1.设两个变量的值域分别为设两个变量的值域分别为x1,x2y1.,y2,列频数列联表列频数列联表y y1 1y y2 2总计总计x x1 1a ab ba+ba+bx x2 2c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d4.利用统计概率表利用统计概率表1-12查阅发生的概率查阅发生的概率3.计算变量计算变量X与与Y的评判标准的评判标准K2的观测值的观测值5.得出概率结论得出概率结论2.假设假设“X与与Y无关无关”例1.在研究某种新药对小白兔的防治效果时,得到下表数据:存活数死亡数总计未用新药1013
8、8139用新药12920149总计23058288试分析新药对防治小白兔是否有效?2288101 2038 1298.6587.879139 149 230 58k99.5%的把握判定新药对防治小白兔是有效的.解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 观测值k为2K例例2.某心脏病医院为了研究秃顶是否与某心脏病医院为了研究秃顶是否与心脏病有关,对心脏病有关,对665名男性心脏和名男性心脏和772名名其他病人做了研究,是否可以以其他病人做了研究,是否可以以99%的的把握认为把握认为秃顶与心脏病有关?秃顶与心脏病有关?患心脏病不患心脏病总计秃顶214175389不秃顶45159
9、71048总计6657721437智慧的闪光智慧的闪光! ! 患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计665772143722,1437214 597 175 45116.3736.635389 1048 665 772Kk根据列联表中的数据 得的观测值为所以有99%的把握认为”秃顶与患心脏病有关”解:假设解:假设“秃顶与患心脏病无关秃顶与患心脏病无关”研究人员表示,掉头发在很大程度上研究人员表示,掉头发在很大程度上是由日渐增大的工作压力、不能充分是由日渐增大的工作压力、不能充分休息、不正确饮食和睡眠不足等因素休息、不正确饮食和
10、睡眠不足等因素引起的。在接受调查的人群中,有引起的。在接受调查的人群中,有41%的受秃头威胁的人表示,他们一的受秃头威胁的人表示,他们一日睡觉时间不足日睡觉时间不足4小时小时 秃顶心脏病秃顶心脏病?1212, ,(2 2):XYx xy y一般地 假设有两个分类变量 和它们的值域分别为和其样本频数列联表 称为列联表 为总计aba+bcdc+d总计a+cb+da+b+c+d1x2x1y2y若要推断的结论为H1:”X与Y有关系”,可如下操作:1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确.总计aba+bcdc+d总计a+cb+da+b+c+d1x2x1y2y不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+dabcd主对角线副对角线(1)在三维柱形图中,主对角线上两个柱形高度的乘积ad与 副对角线上两个柱形高度的乘积bc相差越大,H1成立的 可能性就越大总计aba+bcdc+d总计a+cb+da+b+c+d不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d1x2x1y2yabcd11XxYyaab满足条件的个体中具有的个体所占的比例为21XxYyccd满足条件的个体中具有的个体所占的比例为(2)在二维条形图中,两个比例的值相差越大,H1成立的可能性就
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 科技金融支持小微企业的策略研究
- 山东省滨州市滨城区北镇中学2024-2025学年八年级上学期期末考试历史试题(含答案)
- 出版业出版业版权保护体系建设与实施考核试卷
- DB50T 1165-2021 荣昌猪 种公猪饲养管理技术规范
- 2025年人教新课标八年级语文下册月考试卷
- 2025年沪教新版九年级历史下册阶段测试试卷
- 2025年湘教版高一历史下册月考试卷含答案
- 二零二五年度幕墙施工材料运输与仓储合同4篇
- 2025年度企业债券发行承销服务合同规范文本3篇
- 二零二五年度出租车司机劳动合同及职业规划合同4篇
- 垃圾车驾驶员聘用合同
- 2024年大宗贸易合作共赢协议书模板
- 新闻记者证600道考试题-附标准答案
- 变压器搬迁施工方案
- 单位转账个人合同模板
- 八年级语文下册 成语故事 第十五课 讳疾忌医 第六课时 口语交际教案 新教版(汉语)
- 中考语文二轮复习:记叙文阅读物象的作用(含练习题及答案)
- 2024年1月高考适应性测试“九省联考”数学 试题(学生版+解析版)
- (正式版)JBT 11270-2024 立体仓库组合式钢结构货架技术规范
- EPC项目采购阶段质量保证措施
- T-NAHIEM 101-2023 急诊科建设与设备配置标准
评论
0/150
提交评论