版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.1线性回归分析9.1.1变量的相关性9.1.2线性回归方程1.理解两个变量的相关关系的概念,能正确区分相关关系与函数关系.2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系.3.会求线性回归方程,并用线性回归方程进行预测.4.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用.
变量间的相关关系
分类函数关系相关关系特征两变量关系具有确定性两变量关系具有非确定
性两个变量之间具有一定的联系,但又没有①
确定性
函数关系,这种关系称为
②
相关关系
.将样本中的n个数据点(xi,yi)(i=1,2,3,…,n)描在平面直角坐标系中得到的图形称为
散点图.散点图中的点散布在一条直线附近,将具有这种特性的相关关系称为③
线性相关关系
.具有相关关系的两个变量的散点图如果呈从左下向右上方向发展的趋势,称这两
个变量之间④
正相关
,如果呈从左上向右下方向发展的趋势,则称这两个变量之间⑤
负相关
.
相关系数
x与y的n对数据(xi,yi)(i=1,2,3,…,n),一般用r=
来衡量y与x的线性相关强弱,这里的r称为相关系数.r具有的性质:(1)-1≤r≤1;(2)r⑥
>
0时y与x呈正相关关系,r⑦
<
0时y与x呈负相关关系;(3)|r|越接近1,y与x相关的程度就⑧
越强
,|r|越接近0,y与x相关的程度就⑨
越弱
.通常情况下,当|r时,认为线性相关关系显著;当|r时,认为几乎没有线性相
关关系.
线性回归方程
散点图上的点在一条直线附近,但并不都在同一条直线上.也就是说,这条直线并
不能精确地反映x与y之间的关系,y的值不能由x确定,在此,我们将两者之间的关
系表示为y=a+bx+ε,其中a+bx是确定性函数,ε称为随机误差.我们将⑩
y=a+bx+ε
称为线性回归模型.设有n对观测数据(xi,yi)(i=1,2,3,…,n),根据线性回归模型,对于每一个xi,对应的随机误差项εi=
yi-(a+bxi)
.当
+
+…+
取得最小值时得到的直线
=
+
x称为这n对数据的回归直线,此直线方程称为线性回归方程,其中
称为
回归截距
,
称为
回归系数
,
称为回归值.把上述方法称为“最小二乘法”.方程或公式线性回归方程:
=
+
x回归系数
的计算公式:
=
=
的计算公式:
=
-
上方加
记号“^”的意义
区分y的估计值
与实际值y
a、b上方加“^”表示由观察值按
最小二乘法求得的估计值性质:(1)回归直线一定过点
(
,
)
.(2)y与x正相关的充要条件是
>0,y与x负相关的充要条件是
<0
.(3)
的实际意义:当x增大一个单位时,
增大
个单位.
非线性回归方程
对于变量y与x的关系,不是线性相关关系,称为非线性相关关系,其方程称为
非线性回归方程.一般地,非线性回归方程的曲线类型可以通过作出散点图进行
猜测,而非线性回归方程有时可以通过变量替换后,借助求线性回归方程的过程
确定.
判断正误,正确的画“√”,错误的画“✕”.1.回归方程中,由x的值得出的y值是准确值.
(
✕)x与y之间的一组数据(0,1),(1,3),(2,5),(3,7),y与x线性相关,则回归直线
=
x+
必过点(1.5,4).
(√)因为
=
=1.5,
=
=4,所以回归直线必过点(1.5,4).3.回归直线一定过样本中的某一个点.
(
✕)回归直线不一定过样本中的某一个点.
同一个方程.
(
✕)5.|r|越小,线性回归方程的拟合效果越好.
(
✕)6.|r|=1的充要条件是散点图中的点都在回归直线上.
(√)当|r|=1时线性相关性最强,即所有点都在一条直线上.r满足0≤r≤1时,回归系数
也满足0≤b≤1.
(
✕)r与
正负号一样,大小上没有关系.
变量间相关关系的判断
利用散点图判断两个变量的相关性(1)一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第
一、第三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么关于均值
平移后的大多数散点将分布在第二、第四象限,对应的成对数据异号的居多.(2)如果散点落在一条直线附近,则认为这两个变量线性相关.
利用相关系数判断两个变量相关性强弱相关系数r是从数值上来判断变量间的线性相关程度的量,是定量分析.|r|刻画了
样本点集中于某条直线的程度.|r|越接近1,散点图中的样本点分布越接近一条直线,两个变量的线性相关程度越强.
(2020广东东莞高三期末调研测试)某农科所对冬季昼夜温差(最高温度与最低温
度的差)大小与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,
他们分别记录了4月1日至4月6日每天昼夜最高、最低的温度(如图甲),以及实验
室每天每100颗种子中的发芽数情况(如图乙).图甲图乙(1)请画出发芽数y与温差x的散点图;(2)判断两个变量是否线性相关,计算相关系数,并刻画它们的相关程度.参考数据:
参考公式:相关系数r=
.(当|r|>0.75时,认为成对样本数据的线性相关程度较强)
解析
(1)散点图如图所示.
(2)r=
≈
≈0.952.由相关系数r≈0.952>0.75,可以推断发芽数与温差这两个变量正相关,且线性相
关程度较强.规律总结
判断两个变量之间的线性相关关系一般用散点图,但在作图中,由于
存在误差,有时很难判断这些点是否分布在一条直线附近,此时可以利用样本相
关系数r来判断.相关系数是从数值上来判断的,是定量分析,比散点图(定性分析)
要精细得多.利用公式
=
,
=
-
求线性回归方程的一般步骤:(1)列出xi,yi,xiyi;(2)计算
,
,
,
xiyi;(3)代入公式计算
,
的值;(4)写出线性回归方程.
求线性回归方程
某地10户家庭的年收入和年饮食支出的统计数据如下表所示:年收
入x/万
元24466677810年饮
食支出y/万
元0.91.41.62.02.11.91.82.12.22.3(1)根据表中数据,确定家庭的年收入和年饮食支出的相关关系,并求出其回
归方程;(2)如果某家庭年收入为9万元,预测其年饮食支出(精确到0.1万元).参考公式:
=
,
=
-
.
解析
(1)由题意作出散点图如图所示.
从图中可以看出,样本点呈条状分布,年收入和年饮食支出有比较好的线性相关
关系,因此可以用线性回归方程刻画它们之间的关系,设线性回归方程为
=
x+
.因为
=6,
=1.83,
=406,
xiyi=117.7,所以
=
=
-
≈×6=0.798.所以所求线性回归方程为
x+0.798.(2)当x=9时,
×≈2.3,即当年收入为9万元时,年饮食支出约为2.3万元.
1.研究两个变量的关系时,依据样本画出散点图,从整体上看,如果样本点没有分
有线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过
回归方程的转换方式如下:
非线性回归分析
曲线方程曲线(曲线的一部
分)变换公式变换后的线性函数y=axb
c=lna,v=lnx,u=lnyu=c+bvy=aebx
c=lna,u=lnyu=c+bxy=a
c=lna,v=
,u=lnyu=c+bvy=a+blnx
v=lnxy=a+bv2.建立非线性回归模型的基本步骤:(1)确定研究对象,明确涉及的变量;(2)画出确定好的变量间的散点图,观察它们之间的关系(是否存在非线性关系);(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选
用反比例函数型、指数函数型、对数函数型模型等);(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;(5)按照公式计算线性回归方程中的参数,得到线性回归方程;(6)消去新元,得到非线性回归方程.
土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位:MPa)随龄期
(单位:天)的发展规律,质检部门在标准试验条件下记录了10组混凝土试件在龄期
xi(i=1,2,…,10)分别为2,3,4,5,7,9,12,14,17,21时的抗压强度yi的值,并对数据进行了
初步处理,得到散点图及一些统计量的值.
混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土
木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝
(xi-
)2
(wi-
)2
(xi-
)(yi-
)
(wi-
)·(yi-
)9.429.72370.45.5439.255表中wi=lnxi,
=
wi.(1)根据散点图判断y=a+bx与y=c+dlnx哪一个适宜作为抗压强度y关于龄期x的回
归方程类型,根据判断结果和表中数据,建立y关于x的回归方程;(2)工程中常把龄期为28天的混凝土试件的抗压强度f28视作混凝土抗压强度标准
值.已知该型号混凝土设置的最低抗压强度标准值为40MPa.①试预测该批次混凝土是否达标;②由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有
重要的意义.经验表明,该型号混凝土第7天的抗压强度f7与第28天的抗压强度f28具
有线性相关关系f28f7+7,试估计在早期质量控制中,龄期为7天的混凝土试件需
达到的抗压强度.参考数据:ln2≈0.69,ln7≈1.95.解析
(1)由散点图可以判断出,y=c+dlnx适宜作为抗压强度y关于龄期x的回归方程类型.令w=lnx,先建立y关于w的线性回归方程.由于
=
=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 买房卖房协议书样本
- 小学生卫生习惯教育主题班会《好习惯伴我成长》课件
- 八年级语文上册《古诗十九首 庭中有奇树》教案 新人教版
- 2024年五年级英语下册 Unit 1 Welcome to our school Fun Facts教案 人教精通版(三起)
- 八年级物理上册 第五章 第四节 眼睛和眼镜教案 (新版)新人教版
- 易制爆化学品使用部门职责
- 国开(湖北)2024年秋《国学经典选读》形考作业1-4答案
- 汽车试验技术 课件 项目6 整车碰撞安全性能试验
- 租厂房合同(2篇)
- 叶公好龙课件小班
- 猜想04整式的乘法与因式分解(易错必刷30题10种题型专项训练)
- 大学实训室虚拟仿真平台网络VR实训室方案(建筑学科)
- 体育赛事组织与执行手册
- 心理健康专题课件25心理健康
- 【课件】跨学科实践:制作隔音房间模型人教版物理八年级上册
- 2024-2025学年高二英语选择性必修第二册(译林版)UNIT 4 Grammar and usage教学课件
- 二十届三中全会精神学习试题及答案(100题)
- 《网络存储技术及应用(第2版)》高职全套教学课件
- 义务教育语文课程标准(2022年版)考试题库及答案1
- 2024Growatt 2500-6000MTL-S古瑞瓦特光伏逆变器用户手册
- 2024-2030年中国四足机器人行业市场发展趋势与前景展望战略分析报告
评论
0/150
提交评论