




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二节 成对数据的统计分析教材回扣夯实“四基”课程标准考情分析核心素养L了解样本相关系数的统计意义,了解样本相关 系数与标准化数据的关系.会通过相关系数比 较多组成对数据的相关性. 了解一元线性回归模型的含义,了解模型参 数的统计意义,了解最小二乘原理,掌握一元 线性回归模型参数的最小二乘估计方法,会用 一元线性回归模型进行预测.理解2X2列联表的统计意义,了解2义2歹U 联表独立性检验及其应用.2020年新高考第19题考 查了 2X2列联表和独立 性检验;2021年新高考(I )卷和(II)都未考查成对数据 的统计分析,数据分析 数学运算基础知识.变量的相关关系(1)两个变量有关系,但又没有
2、确切到可由其中一个去精确地决定另一个的程度,这种关 系称为相关关系.(2)正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现的趋势,我们就 称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现的趋势, 那么称这两个变量负相关.(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条附近,我们 就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性 相关或曲线相关.【微点拨】由散点图判断两个变量正相关、负相关的方法:当散点图中的点散布在平面直角坐标系 中从左下角到右上角的区域时,两个变量正相关
3、;当散点图中的点散布在平面直角坐标系中 从左上角到右下角的区域时,两个变量负相关.样本相关系数尸I毙】(毛:)(%一刃=w广冲,称r为变量x和变量 的样本相关系J优式XL/#% (%-刃2 叫好-依加匕/-犷 数.【微点拨】(1)当厂0时,称成对样本数据正相关;当vo时,称成对样本数据负相关.(2)样本相关系数尸的取值范围为-1, 1,当|尸|越接近1时,成对数据的线性相关程度 越强;当卜|越接近。时,成对数据的线性相关程度越弱. 一元线性回归模型第二节 成对数据的统计分析教材回扣夯实“四基”基础知识1.(2)增加减少直线3 .好差基本技能、思想、活动经验1. V 2Z 3.X 4.V.解析:
4、样本或总体具有线性相关关系时,才可求经验回归方程,而且由经验回归方程 得到的函数值是近似值,而非精确值,因此经验回归方程有一定的局限性,所以A, D错误.故 选AD.答案:AD.解析:设经验回归方程为y=bx+a,由散点图可知变量x, y负相关,经验回归直线 在y轴上的截距为正数,所以60,因此方程可能为?= L5x+2.应选B.答案:B.解析:列联表如下:分类做不到“光盘”能做到“光盘”总计男451055女301545总计7525100所以2=U等喏普器3.0302.706,所以在犯错误的概率不超过。.1的前提下,认 75x25x55x45为“该市居民能否做到光盘与性别有关”.应选C.答案:
5、c.解析:丁点(通力在经验回归直线上,_0+1+3+4X =_0+1+3+4X =2, y=2.2+4.34-4.8+6.7= 4.5,经验回归直线过点(2, 4.5).代入得4.5 = 0.95义2+心A a = 2.6.答案:2.6题型突破提高“四能”例1解析:(1)根据D点在散点图中的位置可知,。比拟偏离经验回归直线,故去掉 0(3, 10)后,数据比原来集中,相关程度变强,经验回归方程有所改变,A错误,B, C, D 都正确.(2)因为样本相关系数的绝对值越大,越接近于1,那么说明两个变量的线性相关程度越 强.因为点E到直线的距离最远,所以去掉点E余下的5个点所对应的数据的样本相关系
6、数最大,应选B.答案:(l)BCD (2)B巩固训练1解析:(1)由散点图得两个变量负相关,所以n0, r20,因为剔除点(10, 21)后,剩下点数据线性相关程度更强,比I更接近1,所以一IV。门0.应选D.(2)由回归方程y八=-2.352x+147.767,可得:x与y线性负相关,且y随x增大而减小.故 选B.答案:(1)D (2)B解析:(1)由题中数据得1=解析:(1)由题中数据得1=1+2+3+4+5=3, y=165+177+201+238+290= 214.2,Si=l(ti - t )2 = ( 2 + ( 1)2 + 02+ 12 + 22= I。, 由参考数据知,)(y)
7、 = 311,= 31.1,a=y-St=214.2-31.1X3=120.9,故所求经验回归方程为g=3Ll/+1209(2)将2022年对应的r=7代入经验回归方程,得y八=31.1义7+120.9 = 338.6,所以预测 2022年全国硕士研究生报考人数为338.6万.巩固训练2解析:(1)散点图如下图.ylt14 - TOC o 1-5 h z 12 -10 -8-6一 4 -2 -n 1 1110123 ”万元(2)由散点图可知,x, y线性相关.采用列表的方法计算6与反编号XyX2孙11.4121.9616.821.6102.561631.873.2412.642541052.2
8、34.846.693716.662又三义9=1.8,尸27=7.4,5=7.4+11.5X1,8=28.1,所以y关于x的经验回归方程为夕八=&+放=28.1 - lL5x. (3)当 x=1.9 时,=28.1- 11.5X 1.9=6.25, 所以价格定为1.9万元,需求量大约是6.25 t.例3解析:(1)由题意知/2=。.995 3, n =13.9413.94V1L67-V2L22V247.637 4= 0.885 8,因为|川|闻1,所有用=c+0模型建立y与的回归方程更合适. X(2)因为2 =(2)因为2 = -10,2 g Gyi3广4 _一2.1第1年-13汇20.21c
9、=y -d t =109.94+10 x0.16=111.54,所绮关于x的回归方程为夕=111.54又,X解析:(3)由题意知2 =20y - x = 20(111.54- )-x = 2 230.8-(+-x)2 230.8-20 2x 2x 2=2 210.8,所以2 6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SCh浓度有关.巩固训练4解析:(1)高一年级随机抽出50名学生竞赛成绩的平均值估计为X1 = (55X3 + 65X 10+75X 12 + 85X 15 + 95X 10)50 = 78.8;高二年级随机抽出50名学生竞赛成绩的平均值估计为又2 = (55
10、X4+65 X 6+75 X 10+85 X 18+95 X 12)50=80.6;故估计高一高二年级竞赛成绩的平均值分别为78.8与80.6.解析:(2)片=毁罢簪誓=嘿引.0102.706,故没有90%的把握认为竞赛成绩优秀与年级有 45X55X50X5099非优秀优秀合计高一年级252550高二年级203050合计4555100关.数学表述式:如果两个变量之间的关系可以表示为Y = bx + a + e,E(e) = 0, D(e) = a2.我们称该式为y关于x的一元线性回归模型.其中,丫称为因变量或响应变量,x称为自变量或解释变量;。和人为模型的未知参数, 称为截距参数,匕称为斜率参
11、数;e是丫与云+。之间的随机误差.(2)经验回归方程我们将9=&+金称为y关于x的经验回归方程,也称经验回归函数或经验回归公式,其(Q _ 不一文)(力一刃图形称为经验回归直线,其中 一匕-又)2 .( a = y bx(3)利用R2刻画回归效果R2的计算公式为之=1治,二%,其意义是R2越大,残差平方和,也1 (%-%)2越小,即模型的拟合效果越;R2越小,残差平方和越大,即模型的拟合效果越.【微点拨】(1)经验回归直线一定过样本点(又,y).(2)经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计 分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义
12、.4.列联表与独立性检验(1)2X2列联表(2)独立性检验依据上述2X2列联表构造统计量于=如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2X2列联表.XY合计Y=0r=ix=oabx=cdcd合计q+cb+dn=a-b+ c+dn(ad-bc)2 (a+b)(c+d)(a+c)(b+d)利用Y的取值推断分类变量X和y是否独立的方法称为好独立性检验,读作“卡方独立 性检验”,简称独立性检验.临界值表【微点拨】a0.10.050.010.0050.001Xa2.7063.8416.6357.87910.828根据手的值可以判断两个分类变量有关的可信程度.假设手的值越大,那么两个分类变量
13、有 关系的把握越大.基本技能、思想、活动经验题组一 思考辨析(正确的打“ J ”,错误的打“ x ”)1 .利用散点图可以直观判断两个变 量是否具有线性相关关系.().事件x, y关系越密切,那么由观测数据计算得到的x2越大.().经验回归直线y=6x+a至少经过点(为,yi),(Q,以),(无” 为)中的一个点.().两个变量的样本相关系数的绝对值越接近于1,它们的线性相关程度越强.()题组二教材改编.(多项选择)以下说法不正确的有()A.经验回归方程适用于一切样本和总体B.经验回归方程一般都有局限性C.样本取值的范围会影响经验回归方程的适用范围D.经验回归方程得到的预测值是响应变量的精确值
14、.变量羽y之间具有线性相关关系,其散点图如下图,那么其经验回归方程可能 为()A. 9=L5x+2C. 9=1.5%2 题组三易错自纠A. 9=L5x+2C. 9=1.5%2 题组三易错自纠B. y=-1.5x+2D. 9=一1.5%一2. “厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是关”关”关”关”关”关”光盘与性别有光盘与性别无光盘与性别有光盘与性别无否能做到“光盘”行动,得到列联表:分类做不到“光 盘”能做到“光 盘男4510女3015a0.10.050.01Xa2.7063.8416.635由此列联表得到的正确结论是()A.在犯错误的概率不超过1%的前提
15、下,认为“该市居民能否做到.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到关”8.x, y的取值如下表,从散点图可以看出y与x具有线性相关关系,且回归方程为g=0.95x+,那么a=%0134y2.24.34.86.7题型突破提高“四能”题型一数据的相关性例1 (1)(多项选择)有一散点图如下图,在5组(%, y)数据中去掉0(3, 10)后,以下说法 正确的选项是()E(10,12)0(3,10) C(4,5) 8(2,4)A(l,3)A.经验回归方程不变B.
16、样本相关系数一变大C.各组数据对应的点到经验回归直线的距离的平方和变小D.变量x与变量y的相关程度变强(2)如图是具有相关关系的两个变量的一组数据的散点图和经验回归直线,假设去掉一个点 使得余下的5个点所对应的数据的样本相关系数最大,那么应当去掉的点是()A. DB. EC. FD. A听课记录1类题通法判断数据的相关关系的三种方法巩固训练1 (1)相关变量的散点图如下图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程:9=bix+S,样本相关系数为不 方案二: 剔除点(10, 21),根据剩下数据得到经验回归方程:9=%x + a2,样本相关系数为私那么()302
17、0302010012216* 3 1 a10150rir2l0r2ril lrir20 lr2n0(2)某同学为了解气温对热饮销售的影响,经过统计分析,得到了一个卖出的热饮杯数y 与当天气温x的回归方程9=-2.352x+147.767.以下选项正确的选项是()x与y线性正相关x与y线性负相关y随x增大而增大y随冗减小而减小题型二 一元线性回归模型及其应用角度1经验回归方程及应用例2从中国教育在线官方分布的考研动机调查来看,本科生扎堆考研的原因大概集中 在这6个方面:本科就业压力大,提升竞争力;通过考研选择真正感兴趣的专业;为了获得 学历;继续深造;随大流;有名校情结.如图是20162020年
18、全国硕士研究生报考人数的折 线图.35030025020015010050O 12345年份代码r注:年份代码15分别对应年份20162020求了关于,的经验回归方程;(2)根据中的经验回归方程,预测2022年全国硕士研究生报考人数.5参考数据:小(乙一r)(y y) = 311. i = 1S Cti 一z) (y y) 经验回归方程 = %+中花,2( 21-1A1 一a=y-bt.听课记录类题通法求经验回归方程的步骤n 2 孙,2为 z=l第二步R代入公式b=第二步R代入公式b=二二E 工一z=l七22求 7=1第三步第三步i利用a=y-hx,求a第四步一!写出经验回归方程2张+否J I
19、._巩固训练2在一段时间内,某种商品的价格x(单位:万元)和需求量M单位:0之间的 一组数据为:价格3万元1.41.61.822.2需求量y/t1210753画出散点图;(2)建立 了 关于x的经验回归方程;假设价格定为1.9万元,预测需求量是多少.(精确到0.01)角度2 非线性回归方程及应用例3 2022.湖北八市联考近年来,明代著名医药学家李时珍故乡黄冈市薪春县大力发 展大健康产业,新艾产业化种植已经成为该县脱贫攻坚的主要产业之一,己知薪艾的株高M单 位:cm)与一定范围内的温度式单位:C)有关,现收集了薪艾的13组观测数据,得到如下的 散点图:株高v(cm)现根据散点图利用产或尸c+=
20、建立y关于X的回归方程,令s=5,/=:得 人Ji到如下数据:(2)根据(1)的结果及表中数据,建立/关于x的回归方程;(3)斯艾的利润z与、y的关系为z=20y%,当x为何值时,z的预报值最大.参考数据和公式:0.21 X21.22=4.456 2, 11.67X 21.22=247.637 4, 247.637 4 =15.736 5,对于一组数据(Ui, Vi)(i=l, 2, 3,,n),其回归直线方程丫 =。+闻的斜率和截距的最A小二乘法估计分别为PA小二乘法估计分别为Pn_ _XuiVin u - v i=lAA,a= v pu相关系数r =Zu; n u 2i=lZuiVj-n
21、u - v听课记录类题通法解决非线性回归分析问题的一般思路是换元,化非线性为线性,再用线性回归方程的方 法求解.巩固训练3近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了 一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某 线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天 数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:X123W十人次6112145673466101196根据以上数据,绘制了如下图的散点图.23220317414511687582901_.0 1 2 3 4 5 6 7 x(1)根据散点图判断,在推广期内,y=o+b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 悉尼大学重考题目及答案
- 物理考题填空题及答案
- 《表里的生物》读后感
- 外墙真石漆施工方案
- 瑞昌市2025年数学四年级第二学期期末考试模拟试题含解析
- 江西财经大学《景观设计方法Ⅱ》2023-2024学年第二学期期末试卷
- 江西应用工程职业学院《文本阅读与阐释》2023-2024学年第二学期期末试卷
- 合肥城市学院《再生医学基础与临床》2023-2024学年第二学期期末试卷
- 武汉科技大学《商业广告叙事》2023-2024学年第二学期期末试卷
- 德阳城市轨道交通职业学院《交互新媒体设计》2023-2024学年第一学期期末试卷
- 图神经网络前沿-深度研究
- 畜禽无害化处理项目可行性研究报告立项申请报告模板
- 2024年01月舟山普陀农村商业银行2024年春季招考信息笔试历年参考题库附带答案详解
- 斯大林格勒保卫战
- 质量控制与制造工艺
- 2025-2030年中国真空冻干蔬菜市场发展走势及投资策略分析报告
- 2024年全国职业院校技能大赛高职组(酒店服务赛项)备赛试题库(含答案)
- 云南省昆明市2025年中考语文模拟试卷六套【附参考答案】
- 国家科技安全教学课件
- 《AHA2023心肺复苏与心血管急救指南》解读课件
- 税收基础知识考试题库及答案(综合题型)
评论
0/150
提交评论