




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学必求其心得,业必贵于专精学必求其心得,业必贵于专精PAGE14-学必求其心得,业必贵于专精3.1独立性检验学习目标:1。了解分类变量、2×2列联表、随机变量χ2的意义。2。通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)3.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.(难点)教材整理独立性检验阅读教材P77~P78例2以上部分,完成下列问题.1.卡方统计量χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2),用χ2的大小可以决定是否拒绝原来的统计假设H0.如果算出的χ2值较大,就拒绝H0,也就是拒绝“事件A与B无关”,从而就认为它们是有关的了.2.两个临界值(1)当根据具体的数据算出的χ2>3.841时,有95%的把握说事件A与B有关;(2)当χ2〉6.635时,有99%的把握说事件A与B有关,当χ2≤3.841时,认为事件A与B是无关的.1.判断(正确的打“√”,错误的打“×")(1)分类变量中的变量与函数中的变量是同一概念.()(2)独立性检验的方法就是反证法.()(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.()【答案】(1)×(2)×(3)√2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407根据以上数据可得出()A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理决定是否生病D.有90%的把握认为种子经过处理与生病有关【解析】χ2=eq\f(407×32×213-61×1012,93×314×133×274)≈0.164<3。841,即没有充足的理由认为种子是否经过处理跟生病有关.【答案】B3.若由一个2×2列联表中的数据计算得χ2=4。013,那么有__________的把握认为两个变量之间有关系.【解析】查阅χ2表知有95%的把握认为两个变量之间有关系.【答案】95%用2×2列联表分析两变量间的关系【例1】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人的饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用eq\f(n11,n1+)与eq\f(n21,n2+)判断二者是否有关系.【精彩点拨】eq\x(对变量进行分类)→eq\x(求出分类变量的不同取值)→eq\x(作出2×2列联表)→eq\x(计算\f(n11,n1+)与\f(n21,n2+)的值作出判断)【解】饮食习惯与年龄2×2列联表如下:年龄在六十岁以上年龄在六十岁以下合计饮食以蔬菜为主432164饮食以肉类为主273360合计7054124将表中数据代入公式得eq\f(n11,n1+)=eq\f(43,64)≈0。67,eq\f(n21,n2+)=eq\f(27,60)=0.45。显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.1.上例中条件不变,尝试用|n11n22-n12n21|的大小判断饮食习惯与年龄是否有关.【解】将本例2×2列联表中的数据代入可得|n11n22-n12n21|=|43×33-21×27|=852。相差较大,可在某种程度上认为饮食习惯与年龄有关系。由χ2进行独立性检验【例2】在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用。未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000【精彩点拨】独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.【解】假设感冒与是否使用该种血清没有关系.由列联表中的数据,求得χ2=eq\f(1000×258×284-242×2162,474×526×500×500)≈7.075。χ2=7.075>6.635,P(χ2≥6。635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.1.独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足n11n22-n12n21≈0,因此|n11n22-n12n21|越小,关系越弱;|n11n22-n12n21|越大,关系越强.2.独立性检验的具体做法(1)根据实际问题的需要确定允许推断“事件A与B有关系”犯错误的概率的上界α,然后查表确定临界值k0.(2)利用公式χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2)计算随机变量χ2。(3)如果χ2≥k0,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.2.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:患胃病未患胃病合计生活不规律60260320生活有规律20200220合计80460540根据以上数据判断40岁以上的人患胃病与生活规律有关吗?【解】由公式得χ2=eq\f(54060×200-260×202,320×220×80×460)≈9.638。∵9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.独立性检验的综合应用[探究问题]1.利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?【提示】利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29。78,在判断变量相关时,P(χ2≥6。635)≈0.01和P(χ2≥7.879)≈0。005,哪种说法是正确的?【提示】两种说法均正确.P(χ2≥6.635)≈0。01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(χ2≥7.879)≈0。005的含义是在犯错误的概率不超过0。005的前提下认为两个变量相关.【例3】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.【精彩点拨】根据题中表格提供的数据,可通过求χ2的值进行判定.对于(1)(3)可依据古典概率及抽样方法分析求解.【解】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为eq\f(70,500)=14%.(2)χ2=eq\f(500×40×270-30×1602,200×300×70×430)≈9.967.由于9。967〉6。635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法进行抽样,这比采用简单随机抽样方法更好.1.检验两个变量是否相互独立,主要依据是利用χ2=eq\f(nn11n22-n12n212,n1+n2+n+1n+2)公式计算χ2的值,再利用该值与3.841,6。635两个值进行比较作出判断.2.χ2计算公式较复杂,一是公式要清楚;二是代入数值时不能张冠李戴;三是计算时要细心.3.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质.因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.3.若两个分类变量x和y的列联表为:yxy1y2x1515x24010则x与y之间有关系的概率约为________.【解析】χ2=eq\f(5+15+40+105×10-40×152,5+1540+105+4015+10)≈18。822。∵18.822〉6。635,∴x与y之间有关系的概率约为1-0.01=0.99。【答案】0.991.下列选项中,哪一个χ2的值可以有95%以上的把握认为“A与B有关系"()A.χ2=2。700 B.χ2=2。710C.χ2=3.765 D.χ2=5.014【解析】∵5.014〉3。841,故D正确.【答案】D2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050合计6050110经计算得χ2=eq\f(110×40×30-20×202,60×50×60×50)≈7。8。则正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关"【解析】根据独立性检验的思想方法,正确选项为C.【答案】C3.在一个2×2列联表中,由其数据计算得χ2=13.097,认为“两个变量有关系”犯错误的概率不超过________.【解析】如果χ2〉6.635时,认为“两变量有关系”犯错误的概率不超过0.01.【答案】0。014.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是________.【解析】由研究的问题可知,需收集的数据应为男正教授人数,女正教授人数,男副教授人数,女副教授人数.【答案】男正教授人数,女正教授人数,男副教授人数,女副教授人数5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 污水处理新技术及其环境效益-全面剖析
- 乡村生态旅游开发-全面剖析
- 新媒体生态中的隐私保护与舆论引导策略-全面剖析
- 对话框中长文本生成优化算法-全面剖析
- 投资协议风险评估-全面剖析
- 国际森林治理体系比较与优化建议-全面剖析
- 供应链协同机制构建-全面剖析
- 期末综合复习卷(二)(试卷)部编版语文五年级上册
- 护士辞职报告范文与注意事项
- 八年级物理教材分析与教学计划调整
- GB/T 20424-2025重有色金属精矿产品中有害元素的限量规范
- 2025年兰考三农职业学院高职单招职业适应性测试历年(2019-2024年)真题考点试卷含答案解析
- 2025电动自行车集中充电设施第2部分:充换电服务信息交换
- 输油管道安全培训
- 2025美国急性冠脉综合征(ACS)患者管理指南解读课件
- 统编历史七年级下册(2024版)第7课-隋唐时期的科技与文化【课件】f
- 2025年河南省高校毕业生“三支一扶”招募1100人高频重点模拟试卷提升(共500题附带答案详解)
- 2025年国家林业局西北林业调查规划设计院招聘4人历年高频重点模拟试卷提升(共500题附带答案详解)
- 桥梁检测报告模板
- 血管导管相关感染预防与控制指南课件
- 产品防错措施一览表
评论
0/150
提交评论