版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3.2独立性检验的独立性检验的基本思想及其初基本思想及其初步应用二)步应用二)不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟7775427817吸烟吸烟2099492148总计总计98749199651、列联表2、三维柱形图3、二维条形图不患肺癌患肺癌吸烟不吸烟不患肺癌患肺癌吸烟不吸烟080007000600050004000300020001000从三维柱形图能清晰看出从三维柱形图能清晰看出各个频数的相对大小。各个频数的相对大小。从二维条形图能看出,吸烟者中从二维条形图能看出,吸烟者中患肺癌的比例高于不患肺癌的比例。患肺癌的比例高于不患肺癌的比例。通过图形直观判断两个分类变量是否相关:通过
2、图形直观判断两个分类变量是否相关:不吸烟吸烟00.10.20.30.40.50.60.70.80.91不吸烟不吸烟吸烟吸烟患肺癌比例不患肺癌比例4、等高条形图等高条形图更清晰地表达了两种情况下患肺癌的比例。随机变量随机变量-卡方统计量卡方统计量22(),()()()()其中为样本容量。n adbcKab cdac bdnabcd 5、独立性检验0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.8280k0)k2P(K临界值表临界值表828.102K635. 62
3、K706. 22K22.706K 0.1%0.1%把握认为把握认为A A与与B B无关无关1%1%把握认为把握认为A A与与B B无关无关99.9%99.9%把握认把握认A A与与B B有关有关99%99%把握认为把握认为A A与与B B有关有关90%90%把握认为把握认为A A与与B B有关有关10%10%把握认为把握认为A A与与B B无关无关没有充分的依据显示没有充分的依据显示A A与与B B有关,但也不能显示有关,但也不能显示A A与与B B无关无关第一步:第一步:H0H0: 吸烟和患病之间没有关系吸烟和患病之间没有关系 患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸
4、烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d第二步:列出第二步:列出2 22 2列联表列联表 6、独立性检验的步骤、独立性检验的步骤第三步:计算第三步:计算第四步:查对临界值表,作出判断。第四步:查对临界值表,作出判断。)()()()(22dcbadbcabcadnKP(k kk0)0.500.400.250.150.100.050.025 0.010 0.005 0.001k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828反证法原理与假设检验原理反证法原理: 在一个已知假
5、设下,如果推出一个矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。例例1 在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665名男性病人中,有名男性病人中,有214人秃顶;而另外人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?病是否有关系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:解:
6、根据题目所给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“秃顶与患心脏病有关”。秃头不秃头例例1 在某医院,因为患心脏病而住院的在某医院,因为患心脏病而住院的665名男性病人中,有名男性病人中,有214人秃顶;而另外人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏人秃顶。分别利用图形
7、和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?病是否有关系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:解:根据题目所给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 根据联表1-13中的数据,得到221437 (214 597 175 451)16.3736.635.389 1048 665 772K所以有所以有99%的把握认为的把握认为“秃顶患心脏病有关秃顶患心脏病有关”。例1.秃头与患心脏病 在解决实际问题时,可以直接计算K2的观测值
8、k进行独立检验,而不必写出K2的推导过程 。 本例中的边框中的注解,主要是使得学生们注意统计结果的适用范围这由样本的代表性所决定)。因为这组数因为这组数据来自住院据来自住院的病人,因的病人,因此所得到的此所得到的结论适合住结论适合住院的病人群院的病人群体体例例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取某城市的某校高中生中随机抽取300名学生,得到如下联表:名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计72228300由表中数
9、据计算由表中数据计算K2的观测值的观测值k 4.514。能够以。能够以95%的把握认为高的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出结论的依据。结论的依据。解:可以有解:可以有95%以上的把握认为以上的把握认为“性别与喜欢数学课程之间有关系性别与喜欢数学课程之间有关系”。分别用分别用a,b,c,d表示样本中喜欢数学课的男生人数、不喜欢数学课的男生表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。人数、喜欢数学课的女生人数、不喜欢数学课的女生人数。如果性别与是否喜欢
10、数学课有关系,则男生中喜欢数学课的比例如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例 与与女生中喜欢数学课的比例女生中喜欢数学课的比例 应该相差很多,即应该相差很多,即aabccd()()acadbcabcdab cd()()()()()abcd ab cdac bd 例例2 为考察高中生的性别与是否喜欢数学课程之间的关系,在为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取某城市的某校高中生中随机抽取300名学生,得到如下联表:名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计
11、72228300由表中数据计算由表中数据计算K2的观测值的观测值k 4.514。能够以。能够以95%的把握认为高的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出中生的性别与是否喜欢数学课程之间有关系吗?请详细阐述得出结论的依据。结论的依据。()()()()()abcd ab cdac bd 22(),()()()()n adbcKab cd ac bd因此,因此, 越大,越大, “性别与喜欢数学课程之间有关系成立的可能性就越大。性别与喜欢数学课程之间有关系成立的可能性就越大。2K另一方面,在假设另一方面,在假设“性别与喜欢数学课程之间有关系的前提下,事件性别与喜欢数学课程之
12、间有关系的前提下,事件 的概率为的概率为23.841K 2(3.841)0.05,P K 因此事件因此事件A是一个小概率事件。而由样本数据计算得是一个小概率事件。而由样本数据计算得 的观测值的观测值k=4.514,即即小概率事件小概率事件A发生。因此应该断定发生。因此应该断定“性别与喜欢数学课程之间有关系成立,性别与喜欢数学课程之间有关系成立,并且这种判断结果出错的可能性约为并且这种判断结果出错的可能性约为5%。所以,约有。所以,约有95%的把握认为的把握认为“性性别与喜欢数学课程之间有关系别与喜欢数学课程之间有关系”。2KP(kk0)0.500.400.250.150.100.050.025
13、 0.010 0.005 0.001k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828有效有效无效无效合计合计口服口服585840409898注射注射646431319595合计合计1221227171193193解:设解:设H0:药的效果与给药方式没有关系。:药的效果与给药方式没有关系。3896.19598711224064315819322K因当因当H0成立时,成立时,K21.3896的概率大于的概率大于15%,故不能否定假设,故不能否定假设H0,即不能作出药的效果与给药方式有关的结论。,即不能作出药的效果与给药方式
14、有关的结论。例例4 4:为研究不同的给药方式口服与注射和药的效果有效:为研究不同的给药方式口服与注射和药的效果有效与无效是否有关,进行了相应的抽样调查,调查的结果列与无效是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的在表中,根据所选择的193193个病人的数据,能否作出药的效果个病人的数据,能否作出药的效果和给药方式有关的结论?和给药方式有关的结论?P(kk0)0.500.400.250.150.100.050.025 0.010 0.005 0.001k00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
15、例例5:气管炎是一种常见的呼吸道疾病,医药研究人:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?所得数据如表所示,问:它们的疗效有无差异?有效有效无效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345解:设解:设H0:两种中草药的治疗效果没有差异。:两种中草药的治疗效果没有差异。098.11100245702759161918434522K因当因当H0成立时,成立时,K210.828的概率为的概率为0.001,故有,故有9
16、9.9%的把握的把握认为,两种药物的疗效有差异。认为,两种药物的疗效有差异。例例6、某校高三年级在一次全年级的大型考试中,数学成绩优、某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?较大?物理物理化学化学总分总分数学优秀数学优秀228225267数学非优秀数学非优秀14315699注:该年级此次考试中,数学成绩优秀的有注:该年级此次考试中,数学成绩优秀的有360人,非优人,非优秀的有秀的有880人。人。物理优秀物理优秀物理非优秀物理非优秀合计合计数学优秀数学优秀数学非优秀数学非优秀合计合计(1列出数学与物理优秀的列出数学与物理优秀的2x2列联表如下列联表如下2281323601437378803718691240代入公式可得代入公式可得 2270.1143.K 注:该年级此次考试中,数学成绩优秀的有注:该年级此次考试中,数学成绩优秀的有360人,非优秀的有人,非优秀的有880人。人。物理物理化学化学总分总分数学优秀数学优秀228225267数学非优秀数学非优秀1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论