《独立性检验的基本思想及其初步应用》 市赛获奖_第1页
《独立性检验的基本思想及其初步应用》 市赛获奖_第2页
《独立性检验的基本思想及其初步应用》 市赛获奖_第3页
《独立性检验的基本思想及其初步应用》 市赛获奖_第4页
《独立性检验的基本思想及其初步应用》 市赛获奖_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独立性检验的基本思想及其初步应用自学导引1.分类变量和列联表

(1)分类变量 变量的不同“值”表示个体所属的

,像这样的变 量称为分类变量.

(2)列联表 ①定义:列出的两个分类变量的

,称为列联表.不同类别频数表②2×2列联表一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d想一想:如何理解分类变量?提示(1)这里的“变量”和“值”都应作为“广义”的变量和值来理解.例如:对于性别变量,其取值有“男”和“女”两种,这里的“变量”指的是“性别”,这里的“值”指的是“男”或“女”.因此,这里说的“变量”和“值”不一定是取具体的数值.(2)分类变量是大量存在的.例如:吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.2.独立性检验a+b+c+d

具体步骤①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界α.然后查表确定

.②利用公式计算随机变量K2的

.③如果

,就推断“X与Y有关系”,这种推断

不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中

支持结论“X与Y有关系”临界值k0观测值kk≥k0犯错误的概率没有发现足够证据3.独立性检验临界值表P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828想一想:在K2运算时,在判断变量相关时,若K2的观测值k=56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正确的?提示两种说法均正确.P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下,认为两变量相关;而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过0.001的前提下,认为两变量相关.名师点睛1.在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.2.独立性检验的基本思想

(1)独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k2≥6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%.(2)在实际问题中要记住以下几个常用值:①k>6.635有99%的把握认为“X与Y有关系”;②k>3.841有95%的把握认为“X与Y有关系”;③k>2.706有90%的把握认为“X与Y有关系”;④k≤2.706就认为没有充分证据显示“X与Y有关系”.(3)反证法原理与独立性检验原理的比较反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0不成立.独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.3.两个分类变量相关性检验方法利用独立性检验来考察两个分类变量是否有关系,能较精确地给出这种判断的可靠程度,具体的做法是:①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y”有关系,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.题型一有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表: 试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱总计男生212344女生62935总计275279且P(K2≥7.879)≈0.005即我们得到的K2的观测值k≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.【变式1】为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据: 判断学生的数学成绩好坏与对学习数学的兴趣是否有关?成绩优秀成绩较差总计兴趣浓厚的643094兴趣不浓厚的227395总计86103189题型二有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?

[思路探索]要在选报文、理科与对外语有无兴趣之间有无关系作出判断,可以运用独立性检验的方法进行判断.解列出2×2列联表理文总计有兴趣13873211无兴趣9852150总计236125361规律方法运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论.【变式2】某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论