人教A版高中数学选修12第一章统计与案例补救达标_第1页
人教A版高中数学选修12第一章统计与案例补救达标_第2页
人教A版高中数学选修12第一章统计与案例补救达标_第3页
人教A版高中数学选修12第一章统计与案例补救达标_第4页
人教A版高中数学选修12第一章统计与案例补救达标_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学选修12第一章统计与案例补救达标班级姓名小组号【学习目标】了解独立性检验的基本思想、方法及其简单应用.会用等高条形图来分析问题3.能根据题目所给的列联表(只要求2×2列联表)求K2,进行简单的独立性检验.【重点难点】重点:难点:能根据题目所给的列联表(只要求2×2列联表)求K2,进行简单的独立性检验【学情分析】在解决实际问题时,研究的两个变量不一定都呈线性相关关系.对于这类问题,常采用适当的变量代换,把问题转化为线性回归问题,求出线性回归模型后,再通过相应的变换,得到非线性回归方程.自主学习内容回顾旧知:1相关指数R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))2,\i\su(i=1,n,)yi-\x\to(y)2),对于已知获取的样本数据,eq\i\su(i=1,n,)(yi-eq\x\to(y))2是一个定值,因此,残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^)))2越小,R2越大,模型的拟合效果越好;残差平方和越大,R2越小,模型的拟合效果越差.2独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个分类变量是否有关系时,列出2×2列联表,利用|ad-bc|的大小判断或用等高条形图判断,只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表;(2)代入公式计算K2的观测值k;(3)比较k与临界值k0的大小关系,作出统计推断.3在实际问题中,经常会面临需要推断的问题,在作推断时,我们不能仅凭主观意愿作出结论,而是要通过试验来收集数据,并根据回归分析或独立性检验的原理作出合理的推断.统计方法是可能犯错误的,不管是回归分析还是独立性检验,得到的结论都可能犯错误,好的统计方法就是尽量降低犯错误的概率.小组讨论问题预设题型一、基本概念1.在一组样本数据,,…,(,,,…,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为()A.3B.0C.1D.2.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3000人,计算发现k2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是()P(K2≥k)…0.250.150.100.0250.0100.005…k…1.3232.0722.7065.0246.6357.879…A.90%B.95%C.97.5%D.99.5%3.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;③线性回归直线必过;④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K2=13.079.则其两个变量间有关系的可能性是90%.其中错误的个数是()A.1B.2C.34.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病无心脏病秃发20300不秃发5450根据表中数据得到,因为K2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为()A.0.1B.0.05C.0.015.根据如下样本数据得到的回归方程为=bx+a,则()x345678y4.02.5-0.50.5-2.0-3.0A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,6.已知x与y之间的几组数据如下表:x

1

2

3

4

5

6

y

0

2

1

3

3

4

假设根据上表数据所得线性回归直线方程=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是().A.>b′,>a′B.>b′,<a′C.<b′,>a′D.<b′,<a′题型二、综合应用7.电视传媒公司为了解某地区观众对某体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).附:.P(K2≥k)0.050.01k3.8416.6358.某校为了解该校多媒体教学普及情况,根据年龄按分层抽样的方式调查了该校50名教师,他们的年龄频数及使用多媒体教学情况的人数分布如下表:(1)由以上统计数据完成下面的列联表,并判断是否有的把握认为以40岁为分界点对是否经常使用多媒体教学有差异?附:,.(2)若采用分层抽样的方式从年龄低于40岁且经常使用多媒体的教师中选出6人,再从这6人中随机抽取2人,求这2人中至少有1人年龄在3039岁的概率.9.从2017年1月18日开始,支付宝用户可以通过“扫‘福’字”和“参与蚂蚁森林”两种方式获得福卡(爱国福、富强福、和谐福、友善福、敬业福),除夕夜22:18,每一位提前集齐五福的用户都将获得一份现金红包.某高校一个社团在年后开学后随机调查了是否集齐五福性别是否合计男301040女35540合计651580(1)根据如上的列联表,能否在犯错误的概率不超过0.05的前提下,认为“集齐五福与性别有关”?(2)计算这80位大学生集齐五福的频率,并据此估算该校10000名在读大学生中集齐五福的人数;(3)为了解集齐五福的大学生明年是否愿意继续参加集五福活动,该大学的学生会从集齐五福的学生中,选取2位男生和3位女生逐个进行采访,最后再随机选取3次采访记录放到该大学的官方网站上,求最后被选取的3次采访对象中至少有一位男生的概率.提问展示问题预设:1散点图和相关指数R2的关系2用等高条形图判断相关性3.等高条形图可以粗略地判断两个分类变量是否有关系,但无法精确地给出所得结论的精确程度.因此,还需要进一步进行独立性检验,具体过程是:①通过列联表确定a,b,c,d,n的值;根据实际问题的需要确定可信度临界值k0;②利用公式K2=eq\f(nad-bc2,a+bc+da+cb+d)求出K2的观测值k;③如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超α的前提下不能推断“两个分类变量有关系”.课

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论