版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
章末复习课第八章
成对数据的统计分析内容索引知识网络考点突破真题体验1知识网络PARTONE2考点突破PARTTWO一、变量的相关性1.变量的相关关系与样本相关系数是学习一元线性回归模型的前提和基础,前者可借助散点图从直观上分析变量间的相关性,后者从数量上准确刻化了两个变量的相关程度.2.在学习该部分知识时,体会直观想象和数学运算的素养.例1
(1)下列两个变量具有相关关系且不是函数关系的是A.圆的半径与面积B.匀速行驶的车辆的行驶距离与时间C.庄稼的产量与施肥量D.人的身高与视力√解析对于A,圆的半径与面积是确定的关系,是函数关系;对于B,匀速行驶的车辆的行驶距离与时间是确定的关系,是函数关系;对于C,庄稼的产量与施肥量在一定范围内有相关关系,不是函数关系;对于D,人的身高与视力,不具有相关关系,也不是函数关系.故选C.(2)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为_____.-1方法二观察四个点,发现其在一条单调递减的直线上,故y与x的样本相关系数为-1.反思感悟变量相关性的判断的两种方法(1)散点图法:直观形象.(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.反思感悟变量相关性的判断的两种方法(1)散点图法:直观形象.(2)公式法:可用公式精确计算,需注意特殊情形的样本相关系数.如点在一条直线上,|r|=1,且当r=1时,正相关;r=-1时,负相关.跟踪训练1
(1)已知变量x和y满足关系y=-2x+1,变量y与z正相关,下列结论中正确的是A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关√解析根据题意,变量x和y满足关系y=-2x+1,其比例系数为-2<0,所以x与y负相关;又由变量y与z正相关,则x与z负相关.故选C.(2)如图所示,给出了样本容量均为7的A,B两组成对样本数据的散点图,已知A组成对样本数据的样本相关系数为r1,B组成对样本数据的样本相关系数为r2,则A.r1=r2 B.r1<r2C.r1>r2 D.无法判定√解析根据A,B两组成对样本数据的散点图知,A组成对样本数据几乎在一条直线上,且成正相关,∴样本相关系数为r1应最接近1,B组成对样本数据分散在一条直线附近,也成正相关,∴样本相关系数为r2,满足r2<r1,即r1>r2,故选C.二、一元线性回归模型及其应用1.该知识点是具有线性相关关系的两变量的一种拟合应用,目的是借助函数的思想对实际问题做出预测和分析.2.主要培养数学建模和数据分析的素养.例2
一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:人数xi10152025303540件数yi471215202327其中i=1,2,3,4,5,6,7.(1)以每天进店人数为横坐标,每天商品销售件数为纵坐标,画出散点图;解由表中数据,画出7个数据点,可得散点图如图所示.解由表中数据,画出7个数据点,可得散点图如图所示.(2)求经验回归方程;(结果保留到小数点后两位)(3)预测进店人数为80时商品销售的件数.(结果保留整数)反思感悟解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出经验回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的经验回归方程解决实际问题.跟踪训练2
某地搜集到的新房屋的销售价格(单位:万元)和房屋面积(单位:m2)的数据如下表:房屋面积/m211511080135105销售价格/万元24.821.618.429.222(1)画出数据对应的散点图;解设x轴表示房屋的面积,y轴表示销售价格,数据对应的散点图如图.(2)求经验回归方程;解由(1)知y与x具有线性相关关系,(3)根据(2)的结果,估计当房屋面积为150m2时的销售价格.解由(2)知当x=150时,销售价格的估计值为
=0.1962×150+1.8142=31.2442(万元).故当房屋面积为150m2时,估计销售价格是31.2442万元.三、非线性经验回归方程1.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.2.体现数学建模的优劣,提升数据分析的素养.例3
某公司为确定下一年度投入产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,于是对近8年的宣传费xi和年销售量yi(i=1,2,…,8)的数据进行了初步处理,得到如图所示的散点图及一些统计量的值.(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y之间的关系为z=0.2y-x,根据(2)的结果回答下列问题.①当年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的估计值最大?故当年宣传费为46.24千元时,年利润的估计值最大.反思感悟非线性经验回归方程的求解策略(1)本例中,y与x不是线性相关关系,但通过wi=
,转换为w与y的线性相关关系,从而可利用线性回归分析间接讨论y与x的相关关系.(2)可线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.跟踪训练3电容器充电达到某电压值时作为时间t的计算原点,此后电容器串联一电阻放电,测定各时间的电压值(U)所得数据见下表:t(h)012345678…U(V)100755540302015105…设U与t之间具有近似关系U≈U0e-αt(U0,α为常数,e≈2.71828…),求U对t的回归方程.解对U≈U0e-αt两边取自然对数,得lnU≈lnU0-αt.将U的各数据代入z=lnU,求得:t012345678…z4.6054.3174.0073.6893.4012.9962.7082.3031.609…即lnU=4.714-0.3553t,所以U=e4.714-0.3553t.故所求回归方程为U≈e4.714-0.3553t.四、独立性检验1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,查表分析并判断相关性结论的可信程度.2.通过计算χ2值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.例4奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020(1)用分层随机抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(2)依据小概率值α=0.01的独立性检验,能否据此推断该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828解零假设H0:该校高中生是否愿意提供志愿者服务与性别无关.所以依据小概率值α=0.01的独立性检验,可以认为该校高中生是否愿意提供志愿者服务与性别有关.反思感悟独立性检验问题的求解策略(1)等高堆积条形图法:依据题目信息画出等高堆积条形图,依据频率差异来粗略地判断两个变量的相关性.(2)通过公式χ2=
先计算χ2,再与临界值表作比较,最后得出结论.跟踪训练4考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:
种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试分析依据小概率值α=0.05的独立性检验,能否据此推断种子灭菌与小麦发生黑穗病有关?解零假设H0:种子灭菌与小麦发生黑穗病无关.由列联表的数据可求所以依据小概率值α=0.05的独立性检验,可以认为种子灭菌与小麦发生黑穗病有关系.3真题体验PARTTHREE121.(2020·全国Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);从而该地区这种野生动物数量的估计值为60×200=12000.12(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);1212(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.12解分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.122.(2020·新高考全国Ⅰ改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;12解由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,所以该市一天中,空气中的PM2.5浓度不超过75,12(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75]
(75,115]
12解由所给数据,可得2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]101012(3)根据(2)中的列联表,依据小概率值α=0.010的独立性检验,分析该市一天空气中PM2.5浓度与SO2浓度是否有关.12解零假设为H0:该市一天空气中PM2.5浓度与SO2浓度无关.根据列联表中数据,经计算得到≈7.484>6.635≈x0.010,根据小概率值α=0.010的独立性检验,我们推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关.12备用工具&资料(3)根据(2)中的列联表,依据小概率值α
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024专项房屋出租代理协议版B版
- 移动应用开发合同三篇
- 2024年度保险合同标的为货物运输的全面保险保障2篇
- 二零二四年度钢筋工劳务分包项目合同纠纷解决3篇
- 2024城市供水排水与环保工程设计与施工合同
- 班级管理中沟通技巧的应用计划
- 2024年度屋顶防水施工协议模板版
- 2024年中小学生线上培训协议3篇
- 快递员租赁合同
- 医疗设备采购合同管理规则
- 西师大版小学四年级数学(上)第三单元角测试题(含答案)
- 《钢制汽车零件感应淬火金相检验》
- 《鸿蒙智能互联设备开发(微课版)》 课件汇 苗玉虎 第5-8章 LiteOS-A 内核 -智能出行设备开发
- 办理资质延期合同模板
- 深圳大学《计算机网络与应用》2023-2024学年期末试卷
- 大学生职业规划课件
- 竞聘护理骨干
- 2024年人教版八年级英语上册期末考试卷(附答案)
- 居间合同范本协议书范文食品类
- 中层管理干部团队-执行力与领导力提升培训课件
- 2024年物业管理师(中级四级)考试题库大全-上(单选、多选题)
评论
0/150
提交评论