独立性检验的基本思想及其初步应用教案_第1页
独立性检验的基本思想及其初步应用教案_第2页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2.3独立性检验的基本思想及其初步应用授课类型:新授课一、教学内容与教学对象分析通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。 通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。了解独立性检验(只要求2X2列联表)的基本思想、方法及初步应用。 通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。二. 学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。2、过程与方法在本节知

2、识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。最后介绍了独立性检验思想的综合运用。3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生

3、去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给学生提供自主学习、独立探究、合作交流的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。三教学重点、难点教学重点:理解独立性检验的基本思想;独立性检验的步骤。教学难点;1、理解独立性检验的基本思想;2、了解随机变

4、量K2的含义;3、独立性检验的步骤。四、教学策略教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。教学手段:多媒体辅助教学五、教学过程:对于性别变量,其取值为男和女两种这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,等等在日常生活中,我们常常关心两个分类变量之间是否有关系例如,吸烟与患肺癌是否有关系?性别对于是否喜欢数学课程有影响?为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)表3-7吸烟与肺癌列联表那么吸烟是否对患肺癌有影响吗?像表3一7这样列

5、出的两个分类变量的频数表,称为列联表由吸烟情况和患肺癌情况的列联表可以粗略估计出:在不吸烟者中,有0.54患有肺癌;在吸烟者中,有2.28患有肺癌因此,直观上可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况图3.2一1是列联表的三维柱形图,从中能清晰地看出各个频数的相对大小.图3.2一2是叠在一起的二维条形图,其中浅色条高表示不患肺癌的人数,深色条高表示患肺癌的人数.从图中可以看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例.为

6、了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?为了回答上述问题,我们先假设H:吸烟与患肺癌没有关系.用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”独立”即假设H0等价于PAB)=P(A)+P(B).°把表3一7中的数字用字母代替,得到如下用字母表示的列联表:表3-8吸烟与肺癌列联表在表3一8中,a恰好为事件AB发生的频数;a+b和

7、a+c恰好分别为事件A和B发生的频数.由于频率近似于概率,所以在H0成立的条件下应该有aa+ba+cqxnnnLHE嘲SOM-2测IIKO¥fiOOO-3咖2OCffle不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d其中n=a+b+c+d为样本容量,(a+b+c+d)心(a+b)(a+c),即adbc.因此,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad-bc|越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量K2(1)n(ad-bc)2(a+b)(c+d)(a+c)(b+d)其

8、中n=a+b+c+d为样本容量.若H0成立,即“吸烟与患肺癌没有关系”则K“应该很小.根据表3一7中的数据,利用公式(1)计算得到K“的观测值为9965(7775x49-42x2099)2K2=q56.632,7817x2148x9874x91这个值到底能告诉我们什么呢?统计学家经过研究后发现,在H0成立的情况下,P(K2>6.635)q0.01.°(2)(2)式说明,在H0成立的情况下,K2的观测值超过6.635的概率非常小,近似为001,是一个小概率事件.现在K2的观测值k56.632,远远大于6.635,所以有理由断定H。不成立,即认为“吸烟与患肺癌有关系”但这种判断会犯

9、错误,犯错误的概率不会超过0.01,即我们有99的把握认为“吸烟与患肺癌有关系”.在上述过程中,实际上是借助于随机变量K2的观测值k建立了一个判断H0是否成立的规则:如果k26.635,就判断H0不成立,即认为吸烟与患肺癌有关系;否则,就判断H0成立,即认为吸烟与患肺癌没有关系在该规则下,把结论“H0成立”错判成“H0不成立”的概率不会超过P(K2>6.635)沁0.01,即有99的把握认为从不成立上面解决问题的想法类似于反证法要确认是否能以给定的可信程度认为“两个分类变量有关系”,首先假设该结论不成立,即H0:“两个分类变量没有关系”成立.在该假设下我们所构造的随机变量K2应该很小.如

10、果由观测数据计算得到的K2的观测值k很大,贝y在一定可信程度上说明H0不成立,即在一定可信程度上认为“两个分类变量有关系”如果k的值很小,则说明由样本观测数据没有发现反对H0的充分证据.怎样判断K2的观测值k是大还是小呢?这仅需确定一个正数k,当k>k时就认为K2的观测值k大.此00时相应于k的判断规则为:0如果k>k,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”.0我们称这样的k为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为0“两个分类变量之间有关系”的概率为P(K2>k).0在实际应用中,我们把k>k解释

11、为有(1-P(K2>k)x100%的把握认为“两个分类变量之间有关系”;00把k<k解释为不能以(1-P(K2>k)x100%的把握认为“两个分类变量之间有关系”,或者样本观测数据没00有提供“两个分类变量之间有关系”的充分证据.上面这种利用随机变量K2来确定是否能以一定把握认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验.?和人,y?,其样本频数列联表(称利用上面结论,你能从列表的三维柱形图中看出两个变量是否相关吗一般地,假设有两个分类变量X和Y,它们的可能取值分别为x,x12y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d为2X2列联表

12、)为:表3一92X2列联表若要推断的论述为Hl:X与Y有关系,可以按如下步骤判断结论Hl成立的可能性:1. 通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积be相差越大,H1成立的可能性就越大.a在二维条形图中,可以估计满足条件x=X的个体中具有Y=y的个体所占的比例,也可以估计满11a+bc足条件X=x的个体中具有Y=y,的个体所占的比例“两个比例的值相差越大,比成立的可能性就越大.22c+d12. 可以利用独立性检验来考察两个分类变量是否有关系,并

13、且能较精确地给出这种判断的可靠程度.具体做法是: 根据实际问题需要的可信程度确定临界值k;0 利用公式(1),由观测数据计算得到随机变量K2的观测值k;如果k>k,就以(1-P(K2>k)x100%的把握认为“X与Y有关系”否则就说样本观测数据没有提00供“X与Y有关系”的充分证据.在实际应用中,要在获取样本数据之前通过下表确定临界值:表3一10P(K2>k)00.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0721.3232.7063.8415.0246.63510.828(四)、举例:例1.在某

14、医院因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1) 利用图形判断秃顶与患心脏病是否有关系.(2) 能够以99的把握认为秃顶与患心脏病有关系吗?为什么?解:根据题目所给数据得到如下列联表:(2)根据列联表3一11中的数据,得到(1)相应的三维柱形图如图3.2一4所示.比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”k=1437X(214X597一175x451)2“373>6因此有99%的把握认为“秃顶与患心脏病有关”.389x1048x665x772例2.为考察高

15、中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:表3一12性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300由表中数据计算得K2的观测值k沁4.514.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据.解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a,b,c,d表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、a不喜欢数学课的女生人数.如

16、果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例与女生中喜欢a+bc数学课的人数比例应该相差很多,即c+d应很大acad-be1=1-a+be+d(a+b)(e+d)将上式等号右边的式子乘以常数因子(a+e)(b+d)然后平方得n(adbe)2K2=,(a+b)(e+d)(a+e)(b+d)'其中n=a+b+e+d因此K2越大,“性别与喜欢数学课之间有关系”成立的可能性越大.另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下,事件A=K2三3.841的概率为P(K2三3.841)0.05,因此事件A是一个小概率事件.而由样本数据计算得K2的观测值k=4.514,即小概率事件

17、A发生.因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5%所以,约有95的把握认为“性别与喜欢数学课之间有关系”.补充例题1:打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633解:略。补充例题2:对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术2916

18、7196合计68324392试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。解略(四)课堂小结1知识梳理2规律小结(1)三维柱形图与二维条形图(2)独立性检验的基本思想(3)独立性检验的一般方法(五)作业:五课后反思:本节内容对独立性检验的探讨过程学生基本没什么困难,还有学生提出了新的探讨路径和思想,学生思维活泼!对独立性检验的作用,本节课也作了系统总结比较。独立性检验练习题当堂自查题一、选择题1对长期吃含三聚氰胺的婴幼儿奶粉与患肾结石这两个分类变量的计算中,下列说法正确的是()A. 若K2的值大于6.635,我们有99%的把握认为长期吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系

19、,那么在100个长期吃含三聚氰胺的三鹿奶粉的婴幼儿中必有99人患有肾结石病;B. 从独立性检验可知有99%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系时,我们说某一个婴幼儿吃含三聚氰胺的三鹿婴幼儿奶粉,那么他有99%的可能患肾结石病;C. 若从统计量中求出有95%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,是指有5%的可能性使得推判出现错误;D. 以上三种说法都不正确。2为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:A.相互独立B.不相互独立C.有99.9的把握认为色盲与性别无关D.只有0.1的把握认为色盲与性别有关3.给出2X2列联表如下:优秀不优秀总

20、计甲班202545乙班182745总计385290根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是()A.0.4B.0.5C.0.75D.0.85课后检测题二、填空题4.通过计算高中生的性别与喜欢唱歌列联表中的数据,得到K2沁4.98,并且已知P(K2>3.841)沁0.05,那么可以得到的结论是5.下面是一个2X2列联表yiy2总计xa4268x181230总计b54则表中a、b处的值分别为6为了考查某种药物预防疾病的效果,进行动物实验,得到如下的列联表:患病未患病总计服用药104555没服用药203050总计3075105贝卩K2=三、计算题7.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论