版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精2.4独立性检验的应用1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.2.通过对典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用,了解随机变量χ2的含义.1.2×2列联表设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=________;变量B:B1,B2=________。若用a表示变量A取A1,且变量B取B1时的数据;用b表示变量A取A1,且变量B取B2时的数据;用c表示变量A取A2,且变量B取B1时的数据;用d表示变量A取A2,且变量B取B2时的数据,则会得到A,B之间的2×2列联表如下:如何根据表格中的数据来判断A,B之间是否独立,就称2×2列联表的____________.2×2列联表中,一定注意A2=eq\x\to(A)1,B2=eq\x\to(B)1.2.A,B相互独立的条件和结论若A,B是相互独立的,则有P(A1B1)=________,P(A1B2)=________,P(A2B1)=________,P(A2B2)=________,反之亦然.A,B是相互独立事件,则P(AB)=P(A)P(B).3.2×2列联表中的数据的作用设n=a+b+c+d,用eq\f(a,n)估计P(A1B1),用eq\f(a+b,n)估计P(A1),用eq\f(a+c,n)估计P(B1),若有式子______________,则可认为A1与B1独立.同理,若______________,则可以认为A1与B2独立;若______________,则可以认为A2与B1独立;若____________________,则可以认为A2与B2独立.(1)式子的左、右两边的数表示的是频率,不同于概率,即使变量之间相互独立,式子两边也不一定恰好相等,但是当两边相差很大时,变量之间就不独立.(2)根据A2=eq\x\to(A)1,B2=eq\x\to(B)1,知eq\f(a+b,n)+eq\f(c+d,n)=1及eq\f(a+c,n)+eq\f(b+d,n)=1.4.独立性检验统计学选取统计量____________________的大小来检验变量之间是否独立.在统计中,用以下结果对变量的独立性进行判断:其中χ2=eq\f(nad-bc2,a+bc+da+cb+d)。(1)当χ2≤2。706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>2。706时,有90%的把握判定变量A,B有关联;(3)当χ2>3。841时,有95%的把握判定变量A,B有关联;(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.【做一做1】考察棉花种子是否经过处理跟得病之间的关系,得如下表所示的数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据得χ2的值是__________.【做一做2】对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病总计心脏搭桥手术39157196血管清障手术29167196总计68324392试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.答案:1.eq\x\to(A)1eq\x\to(B)1独立性检验2.P(A1)P(B1)P(A1)P(B2)P(A2)P(B1)P(A2)P(B2)3.eq\f(a,n)=eq\f(a+b,n)·eq\f(a+c,n)eq\f(b,n)=eq\f(a+b,n)·eq\f(b+d,n)eq\f(c,n)=eq\f(c+d,n)·eq\f(a+c,n)eq\f(d,n)=eq\f(c+d,n)·eq\f(b+d,n)4.χ2=eq\f(nad-bc2,a+bc+da+cb+d)【做一做1】0.164【做一做2】解:根据列联表中的数据,得到χ2=eq\f(392×39×167-157×292,196×196×68×324)≈1。78.因为1.78<2。706,所以我们可以认为病人是否又发作过心脏病与其做过何种手术无关.1.利用2×2列联表判断两个变量之间是否独立剖析:2×2列联表中的数据是通过大量的实验、调查得到的数据,这些数据不一定全面反映两个变量之间的关系,但通过这些数据可透视A,B之间的关联程度的大小,即我们可以通过计算2×2列联表中变量的频率来估计.频率不同于概率,只能用频率来估计概率,所以即使两个变量之间相互独立,频率也不一定恰好相等,但是当两边相差很大时,可以断定两个变量之间不相互独立;如果相差很小,则可以说这两个分类变量是独立的.2.利用2×2列联表判断两个变量之间是否独立的步骤剖析:第一步:根据调查结果和数据,列出所要研究的两个变量之间的2×2列联表.第二步:计算总和,即变量A,B的总数.第三步:求频率.第四步:判断.①两个变量之间的2×2列联表如下:②两个变量的频率列表如下:若eq\f(a,n)=p·q,则A1与B1独立;若eq\f(b,n)=q(1-p),则A1与B2独立;若eq\f(c,n)=p(1-q),则A2与B1独立;若eq\f(d,n)=(1-p)(1-q),则A2与B2独立.3.独立性检验的理论依据剖析:独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量A,B是否有关联,首先假设该结论不成立,即假设结论“两个分类变量没有关系"成立.在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2很大,说明变量之间不独立,则在一定程度上说明假设不合理.根据随机变量χ2的含义,由实际计算出χ2>6.635,说明假设不合理的程度约为99%,也就是两个分类变量A,B有99%的把握有关联.题型一列出两个变量之间的2×2列联表【例题1】某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析.其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件.请根据数据,列出2×2列联表,可以用本列表研究什么问题?分析:对产品进行分类,设备按改造前后分类,产品按合格,不合格分类,列出2×2列联表,研究设备改造前后对产品合格是否有影响.反思:将文字叙述转为图表语言更为清晰,可为进一步研究问题作好充分的准备.题型二用频率来估计概率,判断变量之间是否有关联【例题2】甲、乙两个班级进行数学学科的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:请问成绩与班级有关系吗?分析:可通过计算各变量的频率,用频率来估计概率,并进行判断.反思:用频率来估计概率不是很准确,但也能说明一定的问题.从本题可知学习成绩主要取决于个人是否努力,与所在班级关系不大,不要强调外界环境.题型三用统计量χ2来判断两个变量之间有无关联【例题3】2009年春天山东出现了手足口传染病,在菏泽地区调查了350人,其中女孩170人,男孩180人,女孩中有14人被感染,其余未被感染;男孩中有21人被感染,其余未被感染.(1)根据以上数据建立一个2×2列联表;(2)判断性别与被感染是否有关系.分析:先根据题目的叙述,将文字信息转为图表信息,再计算χ2来判断关联程度.反思:独立性检验在科学研究和日常生活中有着广泛的应用,有时可以帮助我们作出正确的选择,独立性检验是利用随机变量χ2来确定在多大程度上可以认为“两个变量之间有关系"的方法.答案:【例题1】解:根据题意列出2×2列联表如下:通过研究此2×2列联表可以研究设备改造前后对产品合格是否有影响.【例题2】解:根据2×2列联表得频率表如下:由于eq\f(17,90)×eq\f(1,2)=eq\f(17,180),而eq\f(1,9)=eq\f(20,180);eq\f(73,90)×eq\f(1,2)=eq\f(73,180),而eq\f(7,18)=eq\f(70,180);eq\f(17,90)×eq\f(1,2)=eq\f(17,180),而eq\f(7,90)=eq\f(14,180);eq\f(73,90)×eq\f(1,2)=eq\f(73,180),而eq\f(19,45)=eq\f(76,180)。这些频率之间相差不大,可以认为成绩是否优秀与班级没有关系.【例题3】解:(1)2×2列联表如下:(2)由于χ2=≈1。1438<2。706,∴没有充分证据说明性别与被感染有关.1对分类变量X与Y的随机变量χ2的值说法正确的是().A.χ2越大,“X与Y有关系"的把握性越小B.χ2越小,“X与Y有关系"的把握性越小C.χ2越接近于0,“X与Y无关系”的把握性越小D.χ2越大,“X与Y无关系”的把握性越大答案:Bχ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.2下面是一个2×2列联表:y1y2总计X1a2173X222527总计b46表中a,b处的值分别为().A.94,96 B.52,50C.52,54 D.54,52答案:C由表可知73=a+21,∴a=52,∴b=a+2=52+2=54.3(2012·江苏扬州)有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则大约有__________的把握认为多看电视与人变冷漠有关系.答案:99%χ2=≈11。3765>6。635,所以有99%的把握认为多看电视与人变冷漠有关.4为了研究休闲方式是否与性别有关,共调查了120人,其中女性68人,男性52人,女性中有43人主要的休闲方式是看电视,另外的25人主要的休闲方式是运动;男性中有19人主要的休闲方式是看电视,另外的33人主要的休闲方式是运动,根据以上数据建立两个分类变量的列联表.解:根据数据可得两个分类变
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小王子书中情感读后感
- 教育培训业在线教育平台创新及市场拓展策略
- 2025年大理货运上岗证考试考哪些科目
- 2025年阿里运输从业资格证考试技巧
- 勤奋不息青春无悔
- 养生健康行业服务效果及退费处理协议书
- 美容服务合同
- 2025年普洱货运从业资格证考试题库答案
- 草房子主题征文记忆中的乡村生活
- 食品质量安全检测协议
- 2024年销售员工年度工作总结
- 2024-2025学年广东省深圳市南山区监测数学三年级第一学期期末学业水平测试试题含解析
- 现场生命急救知识与技能学习通超星期末考试答案章节答案2024年
- 成人流行性感冒抗病毒治疗专家共识(2022年)解读
- 四年级上册竖式计算300题及答案
- 工业通风换气次数的有关规定
- 语文五年级概括课文的主要内容PPT优秀课件
- 试剂验收记录表.doc
- 苏教版四年级数学上册口算练习题(精华版)
- (完整版)伤寒金匮之四大类方方剂汇总
- 现金流量表自动生成器
评论
0/150
提交评论