1.2独立性检验的基本思想及其初步应用_第1页
1.2独立性检验的基本思想及其初步应用_第2页
1.2独立性检验的基本思想及其初步应用_第3页
1.2独立性检验的基本思想及其初步应用_第4页
1.2独立性检验的基本思想及其初步应用_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3.2独立性检验的基本思想及其初步应用1.数据的表示方法(1)变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)用图表列出的两个分类变量的频数表,称为列联表.(3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.【做一做1】 由如图所示的等高条形图,可知吸烟与患肺病关系.(填“有”或“没有”)解析:从题中等高条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率,所以吸烟与患肺病有关系.答案:有2.独立性检验(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)一般地,假设有两个分类变

2、量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)如下:(3)考察两个变量X,Y是否有关系,并且能较准确地给出这种判断的可信度,具体做法是:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查下表确定临界值k0.根据22列联表,利用公式 如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【做一做2】 在一个22列联表中,由其数据计算得K2=13.097,认为两个变量有关系犯错误的概率不超过 ()A.0

3、.001B.0.05C.0.1D.0.2答案:A思考辨析判断下列说法是否正确,正确的在后面的括号内画“”,错误的画“”.(1)吸烟人群是否与性别有关系,用独立性检验可解决. ()(2)想要判断喜欢参加体育活动是不是与性别有关,应该假设H0:喜欢参加体育活动与性别有关. ()(3)一般地,在等高条形图中, 相差越大,两个分类变量有关系的可能性就越大. ()(4)计算K2的值,如果K2的值很大,说明假设很合理,K2越大,两个分类变量有关系的可能性越大. ()(5)独立性检验的方法和数学上的反证法是一样的. ()(6)若通过22列联表求出样本恰好满足ad=bc,则说明两个分类变量相关性很强. ()

4、探究一探究二思维辨析利用图形与分类变量间的关系作出分析【例1】 某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的426人中有332人在考前心情紧张,性格外向的594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系?解:作列联表如下: ad-bc=332381-21394=106 470.ad-bc比较大,说明考前心情紧张与性格类型有关系.探究一探究二思维辨析图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向占的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型

5、有关系.探究一探究二思维辨析2.在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论,这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.探究一探究二思维辨析变式训练1网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人进行调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人期末考试不及格.利用图形判断学生经常上网与学习成绩是否有关系?解:根据题目所给的数据得到如下22列联表: 探究一探究二思维辨析得出等高

6、条形图如图所示. 比较图中深色条的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关系.探究一探究二思维辨析独立性检验与应用【例2】 为调查某地区的老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下:(1)估计在该地区的老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关?思路分析:(1)先求出老年人需要帮助的共有多少人,再求比值;(2)先利用公式计算出K2,再进行判断.探究一探究二思维辨析解:(1)调查的500位老年人中有70位需

7、要志愿者提供帮助,因此在该地区的老年人中,需要帮助的老年人的比例的估计值为(2)由列联表中的数据,得K2的观测值为 因为9.9676.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人需要志愿者提供帮助与性别有关.反思感悟解决一般的独立性检验问题,首先应确定22列联表及a,b,c,d,n的值,然后代入公式求得K2的观测值k,最后得出结论.探究一探究二思维辨析变式训练2某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?注:该年级在

8、此次考试中数学成绩优秀的有360人,非优秀的有880人.探究一探究二思维辨析解:列出数学成绩与物理成绩的22列联表如下: 探究一探究二思维辨析列出数学成绩与化学成绩的22列联表如下: 探究一探究二思维辨析列出数学成绩与总分成绩的22列联表如下: 由上面的分析知,在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀都有关系.探究一探究二思维辨析因对独立性检验的基本思想不理解而致错【典例】 已知两个分类变量X和Y的取值分别为x1,x2,y1,y2,若其列联表为则()A.X与Y之间有关系的概率为0.001B.X与Y之间有关系的概率为0.999C.认为X与Y有关系,犯错误的

9、概率为0.999D.认为X与Y有关系,犯错误的概率不超过0.001探究一探究二思维辨析易错分析:独立性检验的基本思想是指某件事发生在犯错概率不超过某个非常小的数据的前提下,我们有把握认为有关.理解有误会致误.解析:K2的观测值为 查表知P(K210.828)=0.001,所以在犯错误的概率不超过0.001的前提下,我们认为X与Y有关.答案:D纠错心得1.在求K2的过程中,弄混a,b,c,d而致错或者因运算量大而致错.2.没有理解好独立性检验的基本思想而致错.探究一探究二思维辨析跟踪训练两个分类变量X与Y的取值分别为x1,x2和y1,y2,其样本频数分别是a=10,b=21,c+d=35,若认为

10、“X与Y有关系”犯错误的概率不超过0.05,则c等于()A.4B.5C.6D.7解析:22列联表如下: 故把选项A,B,C,D代入验证可得选A.答案:A1 2 3 4 51.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对解析:在等高条形图中仅能粗略判断两个分类变量的关系,故A错,C对.在等高条形图中仅能够找出频率,无法找出频数,故B错.答案:C1 2 3 4 52.用等高条形图粗略估计两个分类变量是否相关.观察下列各图,其中两个分类

11、变量相关关系最强的是()1 2 3 4 5答案:D 1 2 3 4 53.对于分类变量X与Y的随机变量K2的观测值k,以下说法正确的是()A.k越大,“X与Y有关系”可信程度越小B.k越小,“X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”可信程度越小D.k越大,“X与Y无关”可信程度越大解析:k越大,说明“X与Y有关系”的可信程度越大,反之越小.答案:B1 2 3 4 54.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:.(填“是”或“否”)1 2 3 4 5解析:因为在20至40岁

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论