独立性检验的基本思想_第1页
独立性检验的基本思想_第2页
独立性检验的基本思想_第3页
独立性检验的基本思想_第4页
独立性检验的基本思想_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.2 1.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用 在统计学中,独立性检验就是检验两个分类变量是在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。否有关系的一种统计方法。 所谓所谓“分类变量分类变量”,就是指个体所属的类别不同,也,就是指个体所属的类别不同,也称为称为属性变量属性变量或或定型变量定型变量。 在日常生活中,我们常常关心两个分类变量之间是在日常生活中,我们常常关心两个分类变量之间是否有关系,例如吸烟是否与患肺癌有关系?性别是否对否有关系,例如吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响等等。于喜欢数学课程有影响等等。 吸烟与

2、患肺癌列联表吸烟与患肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表2 22 2在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是 0.54%0.54%2.28%2.28%1)通过图形直观判断通过图形直观判断三

3、维柱三维柱状图状图2) 通过图形直观判断通过图形直观判断二维二维条形图条形图3)通过图形直观判断通过图形直观判断患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例等高等高条形图条形图 独立性检验H H0 0: 吸烟吸烟和和患肺癌患肺癌之间之间 没有关系没有关系 通过数据和图表分析,得到通过数据和图表分析,得到结论是:结论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可靠结论的可靠程度如何?程度如何? 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+daca

4、c,a+bc+da+bc+d a c+d c a+b , a c+d c a+b ,adbc吸烟的人中不患肺癌的比例:吸烟的人中不患肺癌的比例:baa不吸烟的人中不患肺癌的比例:不吸烟的人中不患肺癌的比例:dcc若若H H0 0成立成立0.adbcad-bc 越小,说明吸烟与患肺癌之间的关系越弱,ad-bc 越小,说明吸烟与患肺癌之间的关系越弱,ad-bc 越大,说明吸烟与患肺癌之间的关系越强ad-bc 越大,说明吸烟与患肺癌之间的关系越强引入一个随机变量:引入一个随机变量:卡方统计量卡方统计量作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准

5、 。dcban其中dbcadcbabcadnK22通过公式计算通过公式计算 吸烟与患肺癌列联表吸烟与患肺癌列联表患肺癌患肺癌不患肺癌不患肺癌总计总计吸烟吸烟49492099209921482148不吸烟不吸烟42427775777578177817总计总计91919874987499659965632.569198742148781720994249777599652k已知在已知在 成立的情况下,成立的情况下,0H故有故有99%99%的把握认为的把握认为H H0 0不成立,即有不成立,即有99%99%的把的把握认为握认为“患肺癌与吸烟有关系患肺癌与吸烟有关系”。即在即在 成立的情况下,成立的情

6、况下, 大于大于6.6356.635概率非常小,概率非常小,近似为近似为0.0100.0100H2K现在的现在的 =56.632=56.632的观测值远大于的观测值远大于6.6356.635,出现这样的观测值的概率不超过出现这样的观测值的概率不超过0.0100.010。k010.0)635.6(2KPa+b+c+da+b+c+db+db+da+ca+c总计总计c+dc+dd dc ca+ba+bb ba a总计总计一般地,对于两个分类变量一般地,对于两个分类变量X X和和Y Y。X X有两类取值:有两类取值:即类即类 和和 (如吸烟与不吸烟);(如吸烟与不吸烟);Y Y也有两类取值:也有两类取

7、值:即类即类 和和 (如患病与不患病)。于是得到下列样(如患病与不患病)。于是得到下列样本频数的本频数的2 22 2列联表为:列联表为:x1x2y2y1y1y2x1x2 用卡方统计量来确定在多大程度上可以认为用卡方统计量来确定在多大程度上可以认为“两个分类变量有关系两个分类变量有关系”的方法称为这两个分类变的方法称为这两个分类变量的量的独立性检验独立性检验。要推断要推断“X X和和Y Y有关系有关系”,可按下面的步骤进行:,可按下面的步骤进行:(1 1)提出假设)提出假设H H0 0 :X X和和Y Y没有关系;没有关系;(3 3)查对临界值,作出判断。)查对临界值,作出判断。(2 2)根据)

8、根据2 22 2列联表与公式计算列联表与公式计算 的值;的值;k2K0k0k0.050.0250.0100.0050.0013.8415.0246.6357.87910.828P( ) 0.500.400.250.150.100.4550.7081.3232.0722.706例例1.在某医院在某医院,因为患心脏病而住院的因为患心脏病而住院的665名男性病人名男性病人中中,有有214人秃顶人秃顶;而另外而另外772名不是因为患心脏病而住名不是因为患心脏病而住院的男性病人中有院的男性病人中有175秃顶秃顶.分别利用图形和独立性检分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系验方法判断秃顶

9、与患心脏病是否有关系?你所得的结论你所得的结论在什么范围内有效在什么范围内有效?秃顶与患心脏病列联表秃顶与患心脏病列联表患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437有有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”635. 6373.167726651048389)451175597214(14372k例例2 为考察高中生的性别与是否喜欢数学课程之间的关为考察高中生的性别与是否喜欢数学课程之间的关系。在某城市的某校高中生随机抽取系。在某城市的某校高中生随机抽取300名学生。得到名学生。得到如下

10、列联表:如下列联表:性别与喜欢数学课程列联表性别与喜欢数学课程列联表喜欢喜欢不喜欢不喜欢总计总计男男3785122女女35143178总计总计72228300 由表中数据计算得到由表中数据计算得到K2的观测值的观测值k4.514。能够。能够以以95的把握认为高中生的性别与是否喜欢数学课程的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?之间有关系吗?为什么? 解:在假设解:在假设 “ “性别与是否喜欢数学课程之间没有关系性别与是否喜欢数学课程之间没有关系”的前提下,的前提下, 应该很小,并且应该很小,并且而我们所得到的而我们所得到的 的观测值的观测值 超过超过3.8413.841,

11、这就,这就意味着意味着“性别与是否喜欢数学课程之间有关系性别与是否喜欢数学课程之间有关系”这一结论这一结论是错误的可能性约为是错误的可能性约为0.050.05,即有,即有95%95%的把握认为的把握认为“性别与性别与是否喜欢数学课程之间有关系是否喜欢数学课程之间有关系”。2K2K2K05. 0)841. 3(2KP514. 4k练习练习: ( P17 )甲乙两个班级进行一门考试甲乙两个班级进行一门考试,按照学生考试成绩优秀和按照学生考试成绩优秀和不优秀统计后不优秀统计后,得到如下列联表得到如下列联表:优秀优秀不优秀不优秀总计总计甲班甲班103545乙班乙班73845总计总计177390画出列联表的条形图出列联表的条形图,并通过图形判断成绩与班级是否并通过图形判断成绩与班级是否有关有关.利用列联表的独立性检验估计利用列联表的独立性检验估计,认为认为“成绩与班级成绩与班级有关系有关系”犯错误的概率是多少。犯错误的概率是多少。由图及表直观判断,好像由图及表直观判断,好像“成绩优秀与班级有关系成绩优秀与班级有关系”,由表中,由表中数据计算,得数据计算,得 的观察值为的观察值为 。由教科书中表。由教科书中表1-121-12,得,得从而由从而由50%50%的把握认为的把握认为“成绩优秀与班级有关系成绩优秀与班级有关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论