独立性检验的基本思想及其初步应用教案_第1页
独立性检验的基本思想及其初步应用教案_第2页
独立性检验的基本思想及其初步应用教案_第3页
独立性检验的基本思想及其初步应用教案_第4页
独立性检验的基本思想及其初步应用教案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品教学教案223独立性检验的基本思想及其初步应用授课类型:新授课一、教学内容与教学对象分析 通过典型案例,学习下列一些常用的统计方法,并能初步应用这些方法解决一些实际问题。 通过对典型案例(如“患肺癌与吸烟有关吗”等)的探究。了解独立性检验(只要求2X 2列联表)的基本思想、方法及初步应用。 通过对典型案例(如“人的体重与身高的关系”等)的探究,了解回归的基本思想、方法及其初步应用。二学习目标1、知识与技能通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。明 确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。2、过程与方

2、法在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心, 在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进 而介绍K的平方的计算公式和 K的平方的观测值 R的求法,以及它们的实际意义。从中得出判断“X与Y有关系” 的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。最后介绍了独立性检验思想的综合运用。3、情感、态度与价值观通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较 与观测值之间的联

3、系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所 迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实 际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来 正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给学生提供自主学习、 独立探究、合作交流的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学 到的知识来解决实际问题。三、教学重点、难点教学重点:理解独立性检验的基本思想;独立性检验的步骤。教学难点;1、理解独

4、立性检验的基本思想;2、了解随机变量K2的含义;3、独立性检验的步骤。四、教学策略教学方法:诱思探究教学法学习方法:自主探究、观察发现、合作交流、归纳总结。教学手段:多媒体辅助教学五、教学过程:对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量在现实生活中,分类变量是大量存在的,例如是否吸烟,宗教信仰,国籍,等等在日常生活中,我们 常常关心两个分类变量之间是否有关系例如,吸烟与患肺癌是否有关系?性别对于是否喜欢数学课程有影响?9965人,得到如下结果(单位:人)为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了 表3-7吸烟与肺癌列联表那么吸

5、烟是否对患肺癌有影响吗?像表3 一 7这样列出的两个分类变量的频数表,称为列联表.由吸烟 情况和患肺癌情况的列联表可以粗略估计出:在不吸烟者中,有0.54有肺癌;在吸烟者中,有 2.28 %患有肺癌.因此,直观上可以得到结论: 吸烟者和不吸烟者患肺癌的可能性存在差异.不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计98749199653. 2 一 1是列联表的三与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况图 维柱形图,从中能清晰地看出各个频数的相对大小.图3.2 一 2是叠在一起的二维条形图,其中浅色条高表示不患肺癌的人数, 深色条高表示患肺癌的

6、人数.从图中可以看出,吸烟者中患肺癌的比例高于不吸 烟者中患肺癌的比例.患肺癌的比例.如图 3.2 一 3所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形, 们是否能够以为了回答上述问题,我们先假设我们得到的直观印象是 定的把握认为“吸烟与患肺癌有关”呢?H :吸烟与患肺癌没有关系用 与患肺癌没有关系”独立”PAB =P(A) +P(B).把表3A表示不吸烟,即假设He等价于7中的数字用字母代替,得到如下用字母表示的列联表:“吸烟和患肺癌有关”.那么我B表示不患肺癌,则“吸烟表3-8吸烟与肺癌列联表在表3 一 8中,a恰好为事件 AB 发生

7、的频数;a+b和a+c恰好分别为事 件A和B发生的频数.由于频率近似于 概率,所以在H)成立的条件下应该有a a b a c&x,n n n 其中n二a b c d为样本容量, 即 ad bc.不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d(a+b+c+d) (a+b)(a+c),为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下因此,|ad-bc|越小,说明吸烟与患肺癌之间关系越弱;|ad -bc|越大,说明吸烟与患肺癌之间关系越强.为了使不同样本容量的数据有统一的评判标准,基于上面的分析,我们构造一个随机变量2n adbea b c d a

8、c b d其中n = a b c d为样本容量.若He成立,即“吸烟与患肺癌没有关系”,则K “应该很小根据表 得到K “的观测值为(1)3 一 7中的数据,利用公式(1)计算56.632,9965(7775汉 49 -42 7099 丫7817 2148 9874 91这个值到底能告诉我们什么呢?统计学家经过研究后发现,在He成立的情况下,2P(K 一6.635) : 0.01.(2)(2 )式说明,在 H)成立的情况下,K的观测值超过6. 635的概率非常小,近似为0.01 ,是一个小概率事件.现在 K2的观测值k - 56.632,远远大于6. 635,所以有理由断定 H)不成立,即认为

9、“吸烟与患肺癌有关系” 但这种判断会犯错误,犯错误的概率不会超过 0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” 在上述过程中,实际上是借助于随机变量K2的观测值k建立了一个判断 H是否成立的规则:如果k 6. 635,就判断H不成立,即认为吸烟与患肺癌有关系;否则,就判断H)成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“ H。成立”错判成“ Ho不成立”的概率不会超过P(K2 _6.635) : 0.01,即有99%的把握认为从不成立.上面解决问题的想法类似于反证法要确认是否能以给定的可信程度认为“两个分类变量有关系”,首先假设该结论不成立,即Ho: “两个分类变量没有关系

10、”成立.在该假设下我们所构造的随机变量K2应该很小.如果由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明 Ho不成立,即在一定可信程度上认为“两个分类变量有关系”;如果k的值很小,则说明由样本观测数据没有发现反对 Ho的充分证据.怎样判断K2的观测值k是大还是小呢?这仅需确定一个正数ko,当k _ k。时就认为 K2的观测值k大.此时相应于ko的判断规则为:如果k 一 ko,就认为“两个分类变量之间有关系”;否则就认为“两个分类变量之间没有关系”我们称这样的ko为一个判断规则的临界值.按照上述规则,把“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率为P(K

11、2丄ko).在实际应用中,我们把 k 一 ko解释为有(1 - P(K2 一 kJ) 100%的把握认为“两个分类变量之间有关系”;2*y2总计xaba + bX2edc + d总计a +cb + da + b + c+ d2K来确定是否能以一定把握认为“两把k : ko解释为不能以(1-P(K -ko) 100%的把握认为“两个分类变量之间有关系”,或者样本观测数据没 有提供“两个分类变量之间有关系”的充分证据.上面这种利用随机变量个分类变量有关系”的方法,称为两个分类变量的独立性检验利用上面结论,你能从列表的三维柱形图中看出两个变量是否相关吗? x2和 %,y2,其样本频数列联表(称般地,

12、假设有两个分类变量 X和Y,它们的可能取值分别为为2X 2列联表)为:表3 一 9 2X 2列联表 若要推断的论述为Hl:X与Y有关系,可以按如下步骤判断结论 Hl成立的可能性:1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是 否有关系,但是这种判断无法精确地给出所得结论的可靠程度.在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积 be相差越大,H1成立的可能性就越大.a在二维条形图中,可以估计满足条件X= X的个体中具有 Y= %的个体所占的比例,也可以估计满a +bc足条件X= x,的个体中具有Y= y2,的个体所占的比例“两个比例的值相差越大,

13、Hl成立的可能性就越大.c +d2可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度具体做法是:根据实际问题需要的可信程度确定临界值k0 ;利用公式(1 ),由观测数据计算得到随机变量K2的观测值k ;如果k ko,就以(1 -P(K2 _ ko) 100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“ X与Y有关系”的充分证据.在实际应用中,要在获取样本数据之前通过下表确定临界值:表 3 一 10P(K2 也0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0721.32

14、32.7063.8415.0246.63510.828(四)、举例:例1 .在某医院, 因为患心脏病而住 院的665名男性病人中,有214人秃顶,而另外 772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1) 利用图形判断秃顶与患心脏病是否有关系.(2) 能够以99 %的把握认为秃顶与患心脏病有关系吗?为什么? 解:根据题目所给数据得到如下列联表:(1)相应的三维柱形图如图 3.2 一 4所示.比较来说,底面副对 角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃 顶与患心脏病有关”(2)根据列联表3 一 11中的数据,得到16.3736 .1437 (214 597 -17

15、5 451)2愿心腔病不亮顶因此有99 %的把握认为“秃顶与患心脏病有关例2.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,389 1048 665 772得到如下列联表:表3 一 12性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300由表中数据计算得 K2的观测值k 4.514 .能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关 系吗?请详细阐明得出结论的依据.作出这种判断的依据是独立性检验的解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”基本思想,具体过程如下:

16、分别用a , b , c , d表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、 不喜欢数学课的女生人数如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例一与女生中喜欢a+b数学课的人数比例 一应该相差很多,即c +d|斤丘冃琵行应很大.将上式等号右边的式子乘以常数因子.(a b c d ( a b( c d d(a+c)(M d) 2然后平方得2n(ad -bc)K 二(a + b)(c+d)(a+c)(b+d)其中n =a b c d .因此K2越大,“性别与喜欢数学课之间有关系”成立的可能性越大.另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下

17、,事件A = K2 3. 841的概率为P (K2 3. 841)0.05,._ 一 一 _ 2因此事件 A是一个小概率事件.而由样本数据计算得 K的观测值k=4.514,即小概率事件 A发生.因此应该断 定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5 % .所以,约有95 %的把握认为“性别与喜欢数学课之间有关系”补充例题1打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每 一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633解:略。补充例题2:对196个接受

18、心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。 解略(四)课堂小结1. 知识梳理2 规律小结(1)三维柱形图与二维条形图2)独立性检验的基本思想(3)独立性检验的一般方法(五) 作业:五课后反思:本节内容对独立性检验的探讨过程学生基本没什么困难,还有学生提出了新的探讨路径和思想,学生思维活泼! 对独立性检验的作用,本节课也作了系统总结比较。独立性检验练习题当

19、堂自查题一、选择题1 对长期吃含三聚氰胺的婴幼儿奶粉与患肾结石这两个分类变量的计算中,下列说法正确的是()A. 若K2的值大于6.635,我们有99%的把握认为长期吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,那么在100个长期吃含三聚氰胺的三鹿奶粉的婴幼儿中必有99人患有肾结石病;B. 从独立性检验可知有 99%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系时,我们说某一个婴幼儿吃含三聚氰胺的三鹿婴幼儿奶粉,那么他有99%的可能患肾结石病;C. 若从统计量中求出有 95%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,是指有5%的可能性使得推判出现错误;D. 以上三种说法都不

20、正确。2为了研究色盲与性别的关系,调查了1 000人,调查结果如下表所示:男女正常442514色盲386根据上述数据,试问色盲与性别关系是()A.相互独立B.不相互独立C.有99.9 %的把握认为色盲与性别无关D.只有0.1%的把握认为色盲与性别有关3给出2X 2列联表如下:优秀不优秀总计甲班202545乙班182745总计385290根据表格提供的数据,估计成绩与班级有关系”犯错误的概率约是()A. 0.4B. 0.5 C. 0.75 D. 0.85课后检测题、填空题4通过计算高中生的性别与喜欢唱歌列联表中的数据,得到K : 4.98,并且已知P(K2 一 3.841):、0.05,那么可以得到的结论是5.下面是一个2X 2列联表%y2总计Xia4268X2181230总计b54则表中a、b处的值分别为6为了考查某种药物预防疾病的效果,进行动物实验,得到如下的列联表:患病未患病总计服用药104555没服用药203050总计3075105则 K2 =三、计算题7.某大型企业人力资源部为了研究企业员工工作积极性和对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论