统计案例复习指导_第1页
统计案例复习指导_第2页
统计案例复习指导_第3页
统计案例复习指导_第4页
统计案例复习指导_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、n n1122 (x x )2x2n x nni1122 i ii iiii ii1n12学习方法报社全新课标理念,优质课程资源统计案例复习指导江苏 韩文美梳理知识,重温基础1线性回归模型(1) 函数关系是一种_关系,而相关关系是一种_关系(2) 回归分析是对具有_关系的两个变量进行统计分析的一种常用方法(3) 对于一组具有线性相关关系的数据(x ,y ),(x,y ),(x ,y ),回归直线 ybxa 的斜率和截距nn的最小二乘估计公式分别为b 样本点的中心, (x x )(yy ) , x y n x yi i i ii1 i1n n2i ii1 i1,a y b x ,其中( x ,

2、y )称为(4)线性回归模型 ybxae,其中 a 和 b 是模型的未知参数,e 称为_,自变量 x 称为_, 因变量 y 称为_2残差的概念对于样本点(x ,y ),(x,y ),(x ,y )而言,它们的随机误差为 e _,i1,2,n,其估 计值为e y y y b x a ,i1,2,n,e 称为相应于点(x ,y )的_3刻画回归效果的方式(1)残差图法作图时_为残差,_可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为 残差图在残差图中,残差点_地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽 度_,说明模型拟合精度越高,回归方程的预报精度越高(2

3、)残差平方和法n残差平方和 (y y )2 越小,模型拟合效果越好i ii1(3)利用 r2 刻画回归效果r2n, (yy )2 i i1 ,r2 (y y )2ii1表示_变量对于_变量变化的贡献率r2越接近于_,表示回归的效果越好4 如果两个变量不呈现线性相关关系,常见的两个变量间的关系还有指数函数关系、二次函数关系5 两个变量间的非线性关系可以通过对解释变量的变换(对数变换、平方变换等)转化为另外两个变量的 _关系6 比较不同模型的拟合效果,可以通过_的大小,_的大小来判断7 分类变量和列联表(1) 变量的不同“值”表示个体所属的_,像这样的变量称为分类变量(2) 定义:列出的两个分类变

4、量的_称为列联表一般地,假设有两个分类变量 x 和 y ,它们的取值分别为_和_,其样本频数列联表(也称为 22 列联表)为下表.y y 总计x a b ab1x c d cd2总计 ac bd abcd8等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否 _,常用等高条形图展示列联表 数据的_a c(2)观察等高条形图发现 和 相差很大,就判断两个分类变量之间_ab cd9独立性检验(1)定义:利用随机变量 k2 来判断“两个分类变量有关系”的方法称为独立性检验第 1 页 共 4 页0nn nn学习方法报社全新课标理念,优质课程资源(2)k2n(adbc)2 ,其中 n

5、abcd 为样本容量 (ab)(cd)(ac)(bd)(3)独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界 ,然后查表确定_ k ; 利用公式计算随机变量 k2 的_ k;如果_,就推断“x 与 y 有关系”,这种推断犯错误的概率不超过 ,否则就认为在_不超过 的前提下不能推断“x 与 y 有关系”,或者在样本数据中_支持结论“x 与 y 有关系”直击考点,精细复习考点 1 散点图与线性回归方程问题例 1 根据如下样本数据x 3 4 5 6 7 8y 4.0 2.50.5 0.52.03.0得到的回归方程为ybxa,则( )a a 0, b 0 ba0

6、, b 0 ca0, b 0da0, b 0解析:结合题目中的样本数据作出散点图如下,由图象不难得出,回归直线ybxa的斜率 b 0,所以 a 0, b0,故 2011 年至 2017 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5 千元,将 2019 年的年份代号 t9,代入(1)中的回归方程,得y0.592.36.8,故预测该地区 2019 年农村居民家庭人均纯收入为 6.8 千元第 2 页 共 4 页学习方法报社全新课标理念,优质课程资源点评:本题主要考查线性回归方程的求解与应用问题,考查数据处理的基本方法和能力,考查运用统计知识解 决简单实际应用问题的能力特别注意,对于线性

7、回归方程的求解中,计算量比较大,需要细心和耐心考点 3 独立性检验的判断问题例 3 某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机抽查了 52 名中学生,得到 统计数据如表 1 至表 4,则与性别有关联的可能性最大的变量是( )a 成绩 b视力 c智商 d阅读量表 1表 2表 3表 4n(adbc)2解析:方法一:通过计算可得,表 1 中的 k2 =(ab)(cd)(ac)(bd)52 (6 22 -14 10) 20 32 16 3620.009,n(adbc)2 52 (4 20 -16 12)表 2 中的 k2 =(ab)(cd)(ac)(bd)2032 16

8、3621.769,表 3 中的 k2n(adbc)2 = (ab)(cd)(ac)(bd)52 (8 24 -12 8) 20 32 16 3621.300,表 4 中的 k2n(adbc)2 = (ab)(cd)(ac)(bd)52 (14 30 -6 2) 20 32 16 36223.481,比较可得表 4 中的 k2最大,即与性别有关联的可能性最大的变量是阅读理,故选 d方法二:由于在 22 列联表中,|adbc|越小,两个研究对象这间的关系越弱;|adbc|越大,两个研究对象之 间的关系越强,表 1 中的|adbc|=8,表 2 中的|adbc|=112,表 3 中的|adbc|=9

9、6,表 4 中的|adbc|=408,则知表 4 中两个研究对象之间的关系最强,即与性别有关联的可能性最大的变量是阅读理,故选 d点评:本题主要考查独立性检验及其应用,主要是结合题目中给出的统计数据,利用卡方统计量公式来分析与 处理涉及卡方统计量公式计算时,要注意公式的应用与计算的准确性考点 4 独立性检验与统计的交汇问题例 4 某高校共有学生 15 000 人,其中男生 10 500 人,女生 4 500 人为调查该校学生每周平均体育运动时间 的情况,采用分层抽样的方法,收集 300 位学生每周平均体育运动时间的样本数据(单位:小时)(1) 应收集多少位女生的样本数据?(2) 根据这 300

10、 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据 的分组区间为:0,2),2,4),4,6),6,8),8,10),10,12估计该校学生每周平均体育运动时间超过 4 小时的概率第 3 页 共 4 页0学习方法报社全新课标理念,优质课程资源(3)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4 小时,请完成每周平均体育运动时间与性 别列联表,并判断能否在犯错误的概率不超过 0.05 的前提下认为“该校学生的每周平均体育运动时间与性别有关”p(k2k )0.10 0.05 0.010 0.005k02.7063.8416.6357.879附:k2n

11、(adbc)2(ab)(cd)(ac)(bd)4500解析:(1)300 90,所以应收集 90 位女生的样本数据15 000(2) 由频率分布直方图得每周平均体育运动超过 4 小时的频率为 12(0.1000.025)0.75,所以该校学 生每周平均体育运动时间超过 4 小时的概率的估计值为 0.75.(3) 由(2)知,300 位学生中有 3000.75225 位的每周平均体育运动时间超过 4 小时,75 人的每周平均体 育运动时间不超过 4 小时又因为样本数据中有 210 份是关于男生的,90 份是关于女生的,所以每周平均体育运动 时间与性别列联表如下:每周平均体育运动时间不超过 4 小时每周平均体育运动时间超过 4 小时总计男生45165210女生306090总计75225300结合列联表可算得 k2300(165304560)2 100 4.7623.841, 7522521090 21所以在犯错误的概率不超过 0.05 的前提下认为“该校学生的每周平均体育运动时间与性别有关”点评:本题是一个统计独立性检验知识的综合交汇题,通过分层抽样、频率分布直方图、频率以及独立性检验 等知识点的考查与应用来达到考查能力与应用的目的此类问题也是新课标高考中比较常见的热点考题之一,要加 以关注梳理知识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论