北师大版高中数学选修2-3:独立性检验()_第1页
北师大版高中数学选修2-3:独立性检验()_第2页
北师大版高中数学选修2-3:独立性检验()_第3页
北师大版高中数学选修2-3:独立性检验()_第4页
北师大版高中数学选修2-3:独立性检验()_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章统计案例§3.2独立性检验定量变量的取值一定是实数,它们的取值大小有特定的含义,不同取值之间的运算也有特定的含义.如身高、体重、考试成绩、温度等等.变量定量变量分类变量例如身高、体重、考试成绩等,张明的身高是180cm,李立的身高是175cm,说明张明比李立高180-175=5(cm).两个定量变量的相关关系分析:回归分析(画散点图、相关系数r、相关指数R2.残差分析)对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.在日常生活中,主要考虑分类变量之间是否有关系:如是否吸烟、宗教信仰、是否患肺癌、国籍等等.例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等.分类变量也称为属性变量或定性变量,它们的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.有时也可以把分类变量的不同取值用数字来表示,但这时的数字除了分类以外没有其他的含义,例如用0表示“男”,1表示“女”,性别变量就变成取值为0和1的随机变量,但是这些数字没有其他的含义.此时比较性别变量的两个不同值之间的大小没有意义,性别变量的均值和方差也没有意义.两个分类变量的相关关系的分析:通过图形直观判断两个分类变量是否相关;独立性检验.某医疗机构为了了解肺癌与吸烟是否有关,进行了一次抽样调查,共调查了6578,其中吸烟者1988人,不吸烟者4590人,调查结果是:吸烟的1988人中56人患肺癌,1932人未患肺癌;不吸烟的4590人中23人患肺癌,4567人未患肺癌。●根据这些数据能否断定:患肺癌与吸烟有关?问题:

吸烟与患肺癌列联表患肺癌不患肺癌总计吸烟5619321988不吸烟2345674590总计7964996578问题:为了调查吸烟是否对呼吸道有影响,某医疗研究所随机地调查了6578人,得到如下结果(单位:人)列联表我们的问题是:如何根据表格中的数据来判断吸烟与患肺癌是否独立,这一问题称为2×2列联表的独立性检验.我们假设吸烟与患肺癌是独立的,即吸烟不影响患肺癌.根据直观经验,我们把吸烟人群中患肺癌的人所占的百分比,与不吸烟人群中患肺癌的人所占的百分比作比较。如果二者基本一致说明没有关系.吸烟人群中患肺癌的人所占的百分比为:不吸烟人群中患肺癌的人所占的百分比为:很明显二者不相等,而且相差很大.所以推断假设不成立.由结果我们可以认为吸烟会对肺癌的发病率造成一定的影响.分析:B1B2总计A1aba+bA2cdc+d总计a+cb+da+b+c+d概括设A,B为两个变量,每一个变量都可以取两个值,通过观察问题我们可以得出下表:但是如果利用公式P(AB)=P(A)P(B)来判断的话,即使二者独立,式子两边也不一定恰好相等(因为我们计算的是频率而不是概率),但是如果独立的话二者相差不大,但是二者相差很大时变量之间就不独立了.同理可以判断其他两个变量间是否对立.作为检验在多大程度上可以认为“两个变量有关系”的标准。统计学家引入了卡方统计量究竟相差多大才能说明变量之间不独立呢?临界值表1)如果P(

>10.828)=0.001表示有99.9%的把握认为”X与Y”有关联;2)如果P(>7.879)=0.005表示有99.5%的把握认为”A与B”有关联;3)如果P(>6.635)=0.01表示有99%的把握认为”A与B”有关联;4)如果P(>5.024)=0.025表示有97.5%的把握认为”A与B”有关联;5)如果P(>3.841)=0.05表示有95%的把握认为”A与B”有关联;6)如果P(>2.706)=0.10表示有90%的把握认为”A与B”有关联;7)如果P(≤2.706),就认为没有充分的证据显示”A与B”有关联;用以下结果对变量的独立性进行判断现在,对于前面的问题我们可以计算所以,我们有99℅以上(99.9℅)的把握认为吸烟与患肺癌是有关的.典例分析例1某组织对男女青年是否喜爱古典音乐进行了一个调查,调查者随机调查了146名青年,给出了调查结果(单位:人):喜爱不喜爱男青年4630女青年2030试问:男女青年喜爱古典音乐的程度是否有差异?例2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?秃顶与患心脏病列联表患心脏病患其他病总计秃顶214175389不秃顶4515971048总计6657721437典例分析有99%的把握认为“秃顶与患心脏病有关”例3.为考察高中生的性别与是否喜欢数学课程之间的关系。在某城市的某校高中生随机抽取300名学生。得到如下列联表:性别与喜欢数学课程列联表喜欢不喜欢总计男3785122女35143178总计72228300

由表中数据计算得到的观测值≈4.514。能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?典例分析解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下,应该很小,并且而我们所得到的的观测值超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”。练习1.在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000解:设H0:感冒与是否使用该血清没有关系。因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认为该血清能起到预防感冒的作用。P(χ≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828练习2:对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392

试根据上述数据比较两种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论