高中数学选择性必修3课件第八章 成对数据的统计分析章末复习课(人教A版)_第1页
高中数学选择性必修3课件第八章 成对数据的统计分析章末复习课(人教A版)_第2页
高中数学选择性必修3课件第八章 成对数据的统计分析章末复习课(人教A版)_第3页
高中数学选择性必修3课件第八章 成对数据的统计分析章末复习课(人教A版)_第4页
高中数学选择性必修3课件第八章 成对数据的统计分析章末复习课(人教A版)_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

章末复习课[网络构建][核心归纳]一、两个基本思想1.回归分析的基本思想

回归分析包括线性回归分析和非线性回归分析两种,而非线性回归分析往往可以通过变量代换转化为线性回归分析,因此,回归分析的思想主要是指线性回归分析的思想.

注意理解以下几点: (1)确定线性相关关系

线性相关关系有两层含义:一是具有相关关系,如广告费用与销售量的关系等在一定条件下具有相关关系,而气球的体积与半径的关系是函数关系,而不是相关关系;二是具有线性相关关系. (4)回归模型的拟合效果

判断回归模型的拟合效果的过程也叫残差分析,残差分析的方法有两种,一是通过残差图直观判断,二是通过计算决定系数R2的大小判断.2.独立性检验的基本思想

独立性检验的基本思想类似于反证法.要确认两个分类变量有关系的可信程度,先假设两个分类变量没有关系,再计算随机变量χ2的值,最后由χ2的值很大在一定程度上说明两个分类变量有关系.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:一是根据2×2列联表计算|ad-bc|,值越大关系越强;二是观察等高堆积条形图,两个深色条的高度相差越大关系越强;(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类变量一定有关系或没有关系.二、两个重要参数1.决定系数R2

决定系数R2是用来刻画回归模型的回归效果的,其值越大,残差平方和越小,模型的拟合效果越好.2.随机变量χ2

随机变量χ2是用来判断两个分类变量在多大程度上相关的变量.独立性检验即计算χ2的值,并与教材中所给表格中的数值进行比较,从而得到两个分类变量在多大程度上相关.三、两种重要图形1.散点图

散点图是进行线性回归分析的主要手段,其作用如下:

一是判断两个变量是否具有线性相关关系,如果样本点呈条状分布,则可以断定两个变量有较好的线性相关关系;

二是判断样本中是否存在异常.2.残差图

残差图可以用来判断模型的拟合效果,其作用如下:

一是判断模型的精度,残差点所分布的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.

二是确认样本点在采集中是否有人为的错误.要点一独立性检验独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是:可以先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.要点一独立性检验独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是:可以先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.【例1】考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:试分析种子灭菌与小麦发生黑穗病是否有关?

种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460解零假设为H0:认为种子灭菌与否与小麦发生黑穗病无关系.由列联表的数据可求得而4.804>3.841=x0.05,根据小概率值α=0.05的χ2独立性检验,我们推断H0不成立,即认为种子是否灭菌与小麦发生黑穗病有关系,此推断犯错误的概率不超过0.05.【训练1】在研究某种新措施对猪白痢的防治效果问题时,得到以下数据:试问新措施对防治猪白痢是否有效?

存活数死亡数合计对照11436150新措施13218150合计24654300解零假设为H0:新措施对防治猪白痢无效,由列联表可求得根据小概率值α=0.01的χ2独立性检验,我们推断H0不成立,即认为新措施对防治猪白痢有效,此推断犯错误的概率不超过0.01.要点二回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应的回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.【例2】某地搜集到的新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据如下表:房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222要点二回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应的回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.【例2】某地搜集到的新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据如下表:房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222(1)画出数据对应的散点图;(2)求回归直线方程;(3)根据(2)的结果,估计当房屋面积为150m2时的销售价格.解(1)设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.故当房屋面积为150m2时,估计销售价格是31.2442万元.【训练2】在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为

12345价格x1.41.61.822.2需求量y1210753解(1)散点图如下图所示:样本点分布在一条直线附近,y与x具有线性相关关系.故价格定为1.9万元,预测需求量大约为6.25t.要点三数形结合思想

数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将其转化为代数问题;在解决与数量有关的问题时,根据数量的结构特征,构造出相应的几何图形,即化为几何问题,从而利用数形的辩证统一和各自的优势尽快得到解决途径,这对提高分析和解决问题的能力有极大的帮助.数形结合的主要途径:(1)形转化为数,即用代数方法研究几何问题,这是解决几何问题的基本方法;(2)数转化为形,即根据给出的“数”的结构特点,构造出与之相应的几何图形,用几何方法解决代数问题;(3)数形结合,即用形研究数,用数研究形,相互结合,使问题变得直观、简捷.在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否有关系.【例3】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,据此资料你是否认为“体育迷”与性别有关?

非体育迷体育迷合计男

1055合计

(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).α0.050.01xα3.8416.635解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:

非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得:因为3.030<3.841=x0.05,所以没有理由认为“体育迷”与性别有关.【训练3】

PM2.5(细颗粒物)是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的质量分数是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:时间周一周二周三周四周五车流量x/万辆5051545758PM2.5的质量分数y/(微克/立方米)6970747879(1)根据上表数据,请在下面坐标系(如图)中画出散点图;解(1)散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.∴可以预测此时PM2.5的质量分数约为37微克/立方米.备用工具&资料(1)根据上表数据,请在下面坐标系(如图)中画出散点图;要点二回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为:通过散点图和经验选择回归方程的类型,然后通过一定的规则确定出相应的回归方程,通过一定的方法进行检验,最后应用于实际或对预报变量进行预测.【例2】某地搜集到的新房屋的销售价格y(单位:万元)和房屋面积x(单位:m2)的数据如下表:房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222解零假设为H0:认为种子灭菌与否与小麦发生黑穗病无关系.由列联表的数据可求得而4.804>3.841=x0.05,根据小概率值α=0.05的χ2独立性检验,我们推断H0不成立,即认为种子是否灭菌与小麦发生黑穗病有关系,此推断犯错误的概率不超过0.05.进行独立性检验要注意理解以下三个问题:(1)独立性检验适用于两个分类变量.(2)两个分类变量是否有关系的直观判断:一是根据2×2列联表计算|ad-bc|,值越大关系越强;二是观察等高堆积条形图,两个深色条的高度相差越大关系越强;(3)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对其是否有关系的判断.独立性检验的结论只能是有多大的把握确认两个分类变量有关系,而不能是两个分类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论