下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、独立性检验的基本思想及其初步应用【学习目标】1 . 了解独立性检验(只要求 2X2列联表)的基本思想、方法及初步应用2 .通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用【要点梳理】要点一、分类变量有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。要点诠释:(1)对分类变量的理解。这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。(2)分类变量可以有多种类别。例如:吸
2、烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。要点二、2X2列联表1 .列联表用表格列出的分类变量的频数表,叫做列联表。2 . 2 X2列联表对于两个事件 A, B,列出两个事件在两种状态下的数据,如下表所示:事件B事件B合计事件Aaba+b事件Acdc+d合计a+cb +da+b+c+d这样的表格称为2X2列联表。要点三:卡方统计量公式为了研究分类变量 X与Y的关系,经调查得到一张 2X2列联表,如下表所示YY2合计Xiaba+bXcdc+d合计a+cb+dn=a+b+c+d统计中有一个有用的(读做“卡方” )统计量,它的表达式是:2n = a+ b + c + d为样本容量
3、)2n(ad -bc)K 二(a b)(c d)(a c)(b d)要点四、独立性检验1 .独立性检验通过2X2列联表,再通过卡方统计量公式计算K2的值,利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。2 .变量独立性的判断通过对K2统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:如果K2W 3.841时,认为事件 A与B是无关的。如果K2 >3.841时,有95%勺把握说事件 A与事件B有关;如果K2 >6.635时,有99%的把握说事件 A与事件B有关;
4、 要点诠释:(1)独立性检验一般是指通过计算K 2统计量的大小对两个事件是否有关进行判断;(2)独立性检验的基本思想类似于反证法。即在H):事件A与B无关的统计假设下,利用 K2统计量即拒绝“事件 A与B无关",从而认为事件 A与B有的大小来决定在多大程度上拒绝原来的统计假设 关。独立性检验为假设检验的特例。(3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把握程度。3 .独立性检验的基本步骤及简单应用独立性检验的步骤:要推断“ A与B是否有关”,可按下面步骤进行:(1)提出统计假设 H):事件A与B无关(相互独立);(2)抽取样本(样本容量不要太小,每个
5、数据都要大于5);(3)列出2X2列联表;22n(ad bc)2 田(4)根据2X2列联表,利用公式:K =,计算出 K 的值;(a c)(b d)(a b)(c d)(5)统计推断:当 K 2 >3.841时,有95%的把握说事件 A与B有关;当K2>6.635时,有99%的把握说事件 A与B有关;当K2 >10.828时,有99.9 %的把握说事件 A与B有关;当K2W3.841时,认为事件A与B是无关的.要点诠释:2使用K统计量作2X2列联表的独立性检验时,要求表中的4个数据都要大于5.2一定要弄清K 2的表达式产n(ad bc)中各个量的含义.(a c)(b d)(a
6、 b)(c d) 独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系” 成立,在该假设下构造的随机变量 K2应该很小,如果由观测数据计算得到的 K 2的观测值很大,则在一定程度上说明假设不合理.根据随机变量K2的含义,由实际计算的 K2 >6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.当K2W 3.841时,认为两个分类变量是无关的.【典型例题】50名学类型一、利用2X2列联表计算卡方例1.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校
7、学生中随机地抽取了 生,得到如下列联表:喜欢数学小喜欢数学合计男131023女72027合计203050根据表中的数据,计算 K2【思路点拨】禾I用2K 2公式计算一 一2【解析】得到K 250 (13 20 -10 7)-4.84423 27 20 30【思路点拨】在利用2 M 2列联表计算 /统计量作独立性检验时,要求表中的4个数据大于等于5,为此,在选取样本的容量时一定要注意,这一点。举一反三:【变式1】研究两个事件 A, B之间的关系时,根据数据信息.列出如下的2X2列联表:BB合计An11n12n1+An21n22n2+合计n+1n+2n则以下 殍计算公式正确的是()A 2n(n11
8、n22 n12n21)2B2 _ n(n1 n1 -n2 n 2)2n ER n2.n/12n21n22C.2 Mm -n21n22)22n(n11n21 -n12n22)2n 1 n .2n1 .n .【答案】A【变式2】由列联表ViV2合计Xi43162205X213121134合计56283339则随机变量72 %。(精确到0.001 )【答案】由K 2公式计算得:7.469类型二、独立性检验例2.近年来,随着我国经济的飞速发展,在生产车间中,由于保护不当,对生产工人造成伤害的事件也 越来越多.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎(注:检查为阳性则 为患皮肤炎
9、),在生产季节开始时,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数的结果如下:阳性例数阴性例数合计新57075旧101828合计1588103问这种新防护服对预防工人患职业性皮肤炎是否有效?并说明你的理由.【思路点拨】这是一个2M 2列联表的独立性检验问题,根据列联表的数据求解判断。【解析】提出假设H):新防护服对预防工人患职业性皮肤炎无效.将表中数据代入K2n(ad bc)2(a c)(b d)(a b)(c d)2,得K电13.826,查表可知:2、P ( K >10.828 ) 0.001 ,而13.826 >10.
10、828,故有99.9 %的把握认为新防护服对预防这种职业性皮肤炎有效.【总结升华】在掌握了独立性检验的基本思想后我们一般通过计算K2的值,然后比较 K2的值与临界值的大小来精确地给出“两个分类变量”的相关程度.举一反三:【变式1】某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了,180件产品进行分析。其中设备改造前生产的合格品有 36件,不合格品有49件;设备改造后生产的合格品有 65件,不合格品 有30件。根据上面的数据,你能得出什么结论?【答案】由已知数据得到下表根据公式2合格品不合格品合计设备改造后653095设备改造前364985合计1017918022n(niin22
11、ni2n2i) 阳 180 65 49 -3630ma得12.38n 1n 2n1n2.95 85 101 79由于12.38 >6.635 ,可以得出产品是否合格与设备改造是有关的。【变式2】考察黄烟经过培养液处理与否跟发生青花病的关系。调查了457株黄烟,得到下表中数据,请根据数据作统计分析。培养液处理未处理合计青花病25210235无青花病80142222合计105352457分析:计算72的值与临界值的大小关系。 .一 一 一一 22457 25 142 80 210【答案】 根据公式 / = 41.61 o235 222 105 352由于41.61 >6.635 ,说明
12、经过培养液处理的黄烟跟发生青花病是有关的。【变式3】为了研究色盲与性别的关系,调查了 1000人,调查结果如下表所示:男女正常442514色盲386根据上述数据试问色盲与性别是否是相互独立的?【答案】由已知条件可得下表男女合计正常442514956色盲38644合计48052010002依据公式72=>(”22一221)2得21000 442 6 -38 514=956 44 480 520= 27.139 。由于27.139 >6.635 ,所以有99%勺把握认为色盲与性别是有关的,从而拒绝原假设, 可以认为色盲与性别不是相互独立的。【高清课堂: 独立性检验的基本思想及其初步应用
13、406875 例题1】例3.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.【思路点拨】先提出假设,然后根据K 2的大小做出准确估计判断。【解析】假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系.由于 a=39, b=157, c=29, d=167, a+b=196, c+d=196, a+c=68, b+d=324, n
14、=392,2所以 K2 tn(ad 3(a c)(b d)(a b)(c d)_ 392 M (39 父 167 15729)2 - 1 77g196 196 68 3240因为K2 = 1.779 V <2.706 ,所以不能作出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术 有关系的结论.即这两种手术对病人又发作过心脏病的影响没有差别.2【总结升华】此类问题的一般解法是利用,求出K2的值,再利用与临“2n(ad-bc)K (a c)(b d)(a b)(c d)界值的大小关系来判断假设是.否成立.在解题时应注意准确代数与计算.举一反三:【变式1】对男女大学生在购买食品时是否看营
15、养说明进行了调查,得到的数据如下表所示:看营养说明不看营养说明合计男大学生233255女大学生92534合计325789利用2X2列联表的独立性检验估计看营养说明与性别的关系中准确的是()A.二者一定无关B.有95%勺把握说二者有关C.有99%勺把握说二者有关D.没有理由说二者有关【答案】D;由公式得:,2=89>(23父25一32闷2 149,55 34 32 57因为2.149 V 3.841 ,所以我们没有理由说看营养说明与性别有关。故选D。【变式2】在大连一烟台的某次航运中,出现了恶劣气候。随机调查男、女乘客在船上晕,船的情况如卜表所示:晕船不晕船合计男人325183女人8243
16、2合计4075115据此资料,你能否认为在恶劣气候中航行时,男人比女人更容易晕船?22115 (32 24 -51 8)【答案】由卡万公式得:上='1 &1 870 。83 32 40 75因为1.870 V 3.841 ,所以我们没有理由说晕船跟性别有关。因此不能认为在恶劣气候中航行时,男人比女人更容易晕船。注意:解决本题主要运用卡方公式来判断,尽管这次航行中男人晕船比例多比女人晕船比例-8高,8332但我们不能就此认为在恶劣气候中航行时男,人比女人更容易晕船。类型三、独立性检验的应用例4.甲乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表:班
17、级与成绩列联表优秀不优秀总计甲班103545乙班73845总计177390画出列联表的条形图,并通过图形判断成绩与班级是否有关;利用列联表的独立性检验估计,认为“成绩与班级有关系”犯错误的概率是多少。【解析】列联表的条形图如图所示:由图及表直观判断,好像“成绩优秀与班级有关系”;由表中数据计算得0.653>0.455。K2的观察值为由下表中数据P (K2>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828得:P(K2>0.455)
18、=0.50 ,从而有50%勺把握认为“成绩与班级有关系”,即断言“成绩优秀与班级有关系”犯错误的概率为0.5。【总结升华】(1)画出条形图后,从图形上判断两个分类变量之间是否有关系。这里通过图形的直观感觉的结果 可能会出错。(2)计算得到K2的观测值比较小,所以没有理由说明“成绩优秀与班级有关系”。这与反证法也有 类似的地方,在使用反证法证明结论时,假设结论不成立的条件下如果没有推出矛盾,并不能说明结论成 立也不能说明结论不成立。在独立性检验中,在假设“成绩优秀与班级没有关系”的情况下,计算得到的 K2的值比较小,且P(K2>0.653) =0.42,说明事件(K2A0.653)不是一个
19、小概率事件,这个事件的发生不足以说明“成绩优秀与班级没有关系”,即没有理由说明“成绩优秀与班级有关系”。这里没有推出小概率 事件发生类似于反证法中没有推出矛盾。举一反三:【答案】 根据题目所给的数据作出如下的列联表:色盲不色盲合计男38442480女6514520合计449561000【变式1】 在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独 立性检验的方法来判断色盲与性别是否有关.你所得到的结论在什么范围内有效?作出相应的二维条形图,如图所示.由二维条形图可知在男人中患色盲的比例要比在.女人中患色盲的比-6386例一6-大,其差值定0.068比较大,因
20、而我们 可以认为性别与患色盲是有关的;520480 520根据列联表中所给的数据可知:a=38 , b=442, c=6, d=514, a+b= 480, c+d=520, a+c=44, b+d=956, n=1000)2小2n(ad-bc)代入公式二(a c)(b d)(a b)(c d)2得Z2 =()-之27.1 ,因为?2 =27.1 >10.828 ,所以我们有 99.9 %的把握认480 520 44 965为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.【变式2】某年高考后,某市教育主管部门对该市一重点中学高考上线情况进行统计,随机抽查244名
21、学生,得到如下表格:数学英语综合科目上线不上线上线不上线上线不上线上线不上线总分上线201人17427178231762517526总分不上线43人3013232024192617总计20440201432004420143试求各科上线与总分上线之间的关系,并求出哪一科目与总分上线关系最大?【答案】对于上述四个科目,分别构造四个随机变量 K12, K:, K;, K42,1234 ,由表中数据可以得到:2语文:Ki2244 (174 13 -27 30)2x 7.294 A6.635 ,201 43 204 40数学:K2_2244 (178 20-23 23)201 43 201 43% 30.008 >10.828 ,英语:K;_ 2244 (176 19 -25 24
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 实验教学法在小学教育中的多元化应用
- 家庭电器安全教育从漏电保护开始
- 营养摄入与学生心理健康的相互影响
- 国际实验教学的发展历程与未来趋势
- 2024年PS铝合金板项目资金需求报告代可行性研究报告
- 语文课堂中的情境模拟与口才训练
- 2025年珠海艺术职业学院高职单招语文2018-2024历年参考题库频考点含答案解析
- 2025年漳州科技职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2025年湖南高尔夫旅游职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 跨文化背景下的学校道德教育策略
- 校园保洁培训课件
- 渠道管理就这样做
- 大客户销售这样说这样做
- 精装修样板房房屋使用说明
- 乔迁新居结婚典礼主持词
- 小学四年级数学竞赛试题(附答案)
- 鲁科版高中化学必修2全册教案
- 《病理学基础》知识考核试题题库与答案
- 人口分布 高一地理下学期人教版 必修第二册
- 四年级上册英语试题-Module 9 Unit 1 What happened to your head--外研社(一起)(含答案)
- 子宫内膜异位症诊疗指南
评论
0/150
提交评论