独立性检验的基本思想及初步应用省赛一等奖_第1页
独立性检验的基本思想及初步应用省赛一等奖_第2页
独立性检验的基本思想及初步应用省赛一等奖_第3页
独立性检验的基本思想及初步应用省赛一等奖_第4页
独立性检验的基本思想及初步应用省赛一等奖_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

32独立性检验的基本思想及初步应用或P()=1-P(A)1了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法1.2×2列联表的意义.重点2.随机变量2的计算及应用.重点3.独立性检验的基本思想.难点♂对于性别变量,其取值为男和女两种♀这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量生活中的分类变量是否吸烟,宗教信仰,国籍…两个分类变量之间是否有关系性别是否喜欢数学课程吸烟患肺癌为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果单位:人不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对肺癌有影响吸烟与患肺癌列联表列出两个分类变量的频数表,称为列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965吸烟者与不吸烟者患肺癌的可能性存在差异从上面数据和图形可以看出吸烟和患肺癌有关从上面数据和图形可以看出吸烟和患肺癌有关事实是否如此我们能够有多大的把握认为“吸烟与患肺癌有关”?吸烟患肺癌吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d假设H0:吸烟与患肺癌没有关系A:不吸烟B:吸烟PAB=PABa:事件AB发生的频数ab:事件A发生的频数ac:事件B发生的频数H0成立时(n=a+b+c+d)(a+b+c+d)a≈(a+b)(a+c)ad-bc≈0|ad-bc|越小吸烟与患肺癌之间的关系越弱|ad-bc|越大吸烟与患肺癌之间的关系越强构造一个随机变量建立统一标准n=abcd若H0成立K2应该很小根据前面数据K2的观察值在“吸烟与患肺癌没有关系”成立的条件下可以估算出k≈56.6326.635远大于99%的把握认为“吸烟与患肺癌有关系”利用随机变量2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验确认“两个分类变量有关系”成立的可信程度假设该结论不成由观测数据计算2的观测值通过概率评价该假设不合理的程度>6635,假设不合理程度约为99%y1y2总计x1aba+bx1cdc+d总计a+cb+da+b+c+d假设有两个分类变量和Y,它们的值域分别为{1,2}和{y1,y2},其样本频数列联表2×2列联表若要推断的论述为H1:“X与Y有关系”可以按如下步骤判断结论H1成立的可能性1通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠度2可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度根据观测数据计算检验随机变量2的观察值P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度独立性检验的基本思想(类似反证法)(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下我们所构造的随机变量K2

应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定可信程度上说明不成立.即在一定可信程度上认为“两个分类变量有关系”;如果k的值很小,则说明由样本观测数据没有发现反对的充分证据。3根据随机变量2的含义,可以通过评价该假设不合理的程度,由实际计算出的的值与临界值比较,说明假设不合理的程度,即说明“两个分类变量有关系”这一结论成立的可信度上面这种利用随机变量2来判断“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:患心脏病不患心脏病总计秃顶214175389不秃顶4515971048总计6657721437根据联表1-13中的数据,得到所以有99%的把握认为“秃顶患心脏病有关”。P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828独立性检验的步骤0,假设两个分类变量没有关系;2列出2×2列联表,并计算2的观测值;0进行比较,并作出判断1当2>2706,有_________的把握判定两个分类变量有关系;2当2>3841,有_________的把握判定两个分类变量有关系;3当2>6635,有_________的把握判定两个分类变量有关系;P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.82890%95%99%例2春节期间,“厉行节约,反对浪费”之风悄然吹开,某市随机询问100名性别不同的居民是否能做到“光盘”行动,(1)完成如下列联表。(2)有多大的把握认为居民能否做到“光盘”与性别有关系?(3)能否在犯错误的概率不超过0010的前提下认为居民能否做到“光盘”与性别有关系?10075总计15女5545男总计做到光盘做不到光盘“光盘”与性别列联表例题解析:假设“性别与是否做到光盘之间没有关系”有90%的把握认为居民能否做到“光盘”与性别有关。1002575总计451530女551045男总计做到光盘做不到光盘“光盘”与性别列联表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.50假设“性别与是否做到光盘之间没有关系”不能在犯错误的概率不超过0010的前提下认为居民能否做到“光盘”与性别有关系1002575总计451530女551045男总计做到光盘做不到光盘“光盘”与性别列联表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.50在犯错误的概率不超过0010的前提下认为居民能否做到“光盘”与性别没有关系为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300练习:1性别与喜欢数学课由表中数据计算2的观测值4513在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300练习:1性别与喜欢数学课这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为005,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”解:假设高中生的性别与是否喜欢数学课程之间没关系由k4.513>3.8412某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下:损坏餐椅数未损坏餐椅数总计文明标语张贴前39157196文明标语张贴后29167196总计68324392由表中数据计算2约等于178你认为在餐厅墙壁上张贴文明标语对减少餐椅损坏数有效果吗2某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下:损坏餐椅数未损坏餐椅数总计文明标语张贴前39157196文明标语张贴后29167196总计68324392不能练习4、在吸烟和患肺癌这两个分类变量的计算中,下列说法正确的是()A、若2的观测值=6635,我们在犯错的概率不超过0010的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺病B、从独立性检验可知有99%的把

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论