版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SANZHANG
第三章统计案例
,你坐过火车、乘过飞机吗?晕车、晕机与性别有无关系?肺癌是人类的一大杀手,
吸烟与患肺癌的关联性究竟有多大?你了解过你们班同学的身高与体重吗,身高与体重是否
线性相关?你统计过你们班同学的考试成绩吗,物理成绩的高低与数学成绩关联度有多
大?……这些都是统计学研究的内容.
本章我们将要学习独立性检验和回归分析的基本思想、方法.学习本章要注意学习收集、
整理、分析数据的方法,体会统计分析的基本思想、建模思想和现代计算技术在统计中的应
用,体会统计思维和确定性思维的差异.
3.1回归分析的基本思想及其初步应用
自主预习•探新知
情景引入
2019年6月17日四川宜宾发生6.1级地震,此后40分钟内连发四次余震,最高震级
5.1级,此次地震余震频繁而且震级还高,你知道地震的震级与地震次数之间有什么关系吗?
新知导学
一、回归直线方程
1.回归分析是处理两个变量之间相关关系的一种统计方法.若两个变量之间具有
线性相关关系,则称相应的回归分析为线性回归分析.
n__
A-,—
2.回归直线方程为y=bx+a,其中方=L=^-----=——.a=—y—x
X•曰0二七1
—(工J2)_称为样本点的中心•
3.线性相关关系强与弱的判断:用相关系数工来描述线性相关关系的强弱.
对于变量x、y随机抽取到的"对数据(xi,%)、(物”)、…、(X”,力),其相关系数r=
n__n__
y(x/-x)8-y)》沙一〃xy
1=1i=【
A/Z(Xi-X)2s(y,y)2A(Xxr-nx伙玄彳一”>,2)
\/I=Ii=i\/rij=i
当r>0时,表明两个变量正相关:当K0时,表明两个变量负相关,的绝对侑
越接近1,表明两个变量的线性相关性越」1_;/•的绝对值接近于0时,表明两个变量之
间几乎不存在线性相关关系.通常当历大于0.75时,认为两个变量有很强的线性相关关
系.
二、线性回归分析
1.随机误差
(1)随机误差的概念:当样本点散布在某一条直线的附近,而不是在一条直线上时,不
能用一次函数),=法+。来描述两个变量之间的关系,而是用线性回归模型y=fer+“+e
来表示,这里x称为解释变量,v称为预报变量,e称为随机误差,E(e)=0,
D(e)=<r.
(2)随机误差及其产生的原因
从散点图中我们可以看到,样本点散布在某一条直线附近,而不是在一条直线上,所以
不能用一次函数y=bx+a来描述它们之间的关系,我们用下面的线性回归模型来表示:y
^bx+a+e,其中队b为模型的未知数,e称为随机误差.产生随机误差的主要原因有以
下3个方面:
①用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型
是什么)所引起的误差.可能存在非线性的函数能更好地描述y与x之间的关系,但是现在
却用线性函数来表述这种关系,结果会产生误差.这种由模型近似所引起的误差包含在e
中.
②忽略了某些因素的影响.影响变量y的因素不只变量x,可能还包括其他许多因素(例
如在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、
生长环境等其他因素的影响),它们的影响都体现在e中.
③观测误差.由于测量工具等原因,导致y的观测值产生误差(比如一个人的体重是确
定的数,但由于测量工具的影响和测量人技术的影响可能会得到不同的观测值,与真实值之
间存在误差),这样的误差也包含在e中.
2.残差
对于样本点(X1,>|)、(X2,次)、…、(Xn,yn),其回归方程为用),作为回归模型
[y=bx+a+eA2A
|一、八,、,中6x+a的估计值,随机误差ei=VLbxi-a的估计值e:=y,—fer,一a
[E(e)=O,D(e)=(r
_(i=l,2,…,〃),称为相应于点(孙%)的残差.
3.残差图
以为纵坐标,一样本编号一(或身高数据,或体重的估计值等)为横坐标作出的
图形,称为残差图.
4.在线性回归模型中,」表示解释变量对预报变量变化的一贡献率一#2越接近于1,
表示解释变量和预报变量的线性相关性越强;反之,改越小,说明随机误差对预报变量的
效应越大.
nA
IT
相关指数R2的计算公式是/?2=1—什——.
Ji(>'/-y)2
R2的值越大,说明残差平方和越小,也就是说模型的拟合效果(即回归效果)越_好_.
在含有一个解释变量的线性模型中,一恰好等于一相关系数匚的平方.
预习自测
1.在对两个变量X,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(为,%),i—\,2,•••,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量X,y具有线性相关的结论,则在下列操作顺序中正
确的是(D)
A.①②⑤③④B.③②④⑤①
C.②④③①⑤D.②⑤④③①
[解析]对两个变量进行回归分析时,
首先收集数据8,»),i=l,2,…,”;根据所搜集的数据绘制散点图.
观察散点图的形状,判断线性相关关系的强弱,
求相关系数,写出线性回归方程,
最后依据所求出的回归直线方程作出解释;
故正确顺序是②⑤④③①,
故选D.
2.(2020•南充模拟)已知变量x与变量y之间具有相关关系,并测得如下一组数据:
X651012
y6532
则变量尤与),之间的线性回归直线方程可能为(B)
AA
A.>=0.7》一2.3B.y=0.7x+10.3
AA
C.y=-10.3x+0.7D.y=10.3x~0.7
[解析1根据表中数据,得;
—133
x=4(6+5+10+12)=彳,
—1
y=*+5+3+2)=4,
且变量y随变量x的增大而减小,是负相关,
所以,验证x=乎时,y=-0.7X^+10.3^4,
A
即回归直线y=-0.7x+10.3过样本中心点(x,y).
故选B.
3.(2020・武汉高二检测)在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了
一组样本数据:
年龄2327394145495053565860
脂肪9.517.821.225.927.526.328.229.631.433.535.2
A
通过计算得到回归方程为y=0.577x—0.448,利用这个方程,我们得到年龄37岁时体内
脂肪含量为20.90%,那么数据20.90%的意义是(D)
A.某人年龄37岁,他体内脂肪含量为20.90%
B.某人年龄37岁,他体内脂肪含量为20.90%的概率最大
C.某人年龄37岁,他体内脂肪含量的期望值为20.90%
D.20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计
A
[解析]利用回归方程),=0.577x—0.448,
可得x=37时,£=20.901,
即到年龄37岁时体内脂肪含量约为20.90%,
故20.90%是对年龄为37岁的人群中的大部分人的体内脂肪含量所作出的估计,
故选D.
4.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100
次和150次试验,并且利用线性回归方法,求得回归直线分别为6和自已知两个人在试验
中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下
列说法正确的是(A)
A./i和b有交点(s,f)
B.与/2相交,但交点不一定是(s,f)
C./|与/2必定平行
D.与/2必定重合
I解析]由题意知(S,。是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒
过样本点的中心,故选A.
5.(202。全国卷I)某校一个课外学习小组为研究某作物种子的发芽率>■和温度x(单
位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散
点图:
由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温
度x的回归方程类型的是(D)
A.y—a+bxB.y—a+bx2
C.y=a+be'D.y=a-Yb\nx
[解析]由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作
为发芽率),和温度x的回归方程类型的是y=a+b]nx.
故选D.
互动探究•攻重难
V
V
互动探究解疑
命题方向❶
变量间的相关性检测
典例1关于两个变量X和y的7组数据如下表所示:
X21232527293235
y711212466115325
试判断y与x是否线性相关.
[解析]7=1(21+23+25+27+29+32+35)^27.4,
—1
y=亍(7+11+21+24+66+115+325)^81.3,
7
2>?=212+232+252+272+292+322+352=5414,
/=1
7
f=21X7+23X11+25X21+27X24+29X66+32X115+35X325=18542.
X=1
7
Z^=72+ll2+212+242+662+1152+3252=124393,
1=1
7____
刀渺一7xy
7_7_
(端—7x2)(9-7y2)
i=\i=\
________18542-7X27.4X81.3________
4(5414—7X27.42)X(124393-7X81.32)
2948.66
=0.8639.
3520.92
由于r=0.8639>0.75,・・.x与y具有线性相关关系.
『规律总结』变量间是否具有线性相关关系,可通过散点图或相关系数作出判断,散
点图只是粗略作出判断,用相关系数能够较准确的判断相关的程度.
II跟踪练习1■
现随机抽取了我校10名学生在入学考试中的数学成绩(X)与入学后的第一次考试数学成
绩。),数据如下表:
学生号1234567891()
X12010811710410311010410599108
y84648468696869465771
请问:这10个学生的两次数学考试成绩是否具有显著的线性相关关系?
_1
【解析]x-JQ(120+108H---F99+108)=107.8,
7=-^(84+644---:57+71)=68,
10
1>7=1202+1082H----F992+1082=116584,
1=1
10
Xy?=842+642H----F572+712=47384,
/=1
10
120X84+108X64H----H08X71=73796,
i-i
所以,相关系数为
__________73796—10X107.8X68________
16584-10X107.82)(47384-10X68?)
«0.7506,
由0.7506>0.75知,两次数学考试成绩有显著的线性相关关系.
命题方向❷
求线性回归方程
典例2某班5名学生的数学和物理成绩如表:
学生学科成绩ABCDE
数学成绩(X)8876736663
物理成绩。)7865716461
(1)画出散点图;
(2)求物理成绩),对数学成绩x的线性回归方程;
(3)一名学生的数学成绩是96,预测他的物理成绩.
[解析](1)散点图如图.
90
80-•
70-•
60—।—।—।—।—।_»
60657075808590x
——I
⑵x=gX(88+76+73+66+63)=73.2,
—1
y=§X(78+65+71+64+61)=67.8.
5
£@•=88X78+76X65+73X71+66X64+63X61
i=l
=25054.
5
£X?=882+762+732+662+632=27174,
i=\
5_____
8yL5x•y
f=l
所以方=-------------=*0.625,
玉-5工2
1=1
含=y一8工n67.8—0.625X73.2=22.05,
所以y对x的回归直线方程是$=0.625x+22.05.
(3)当x=96时,2=0.625X96+22.05482,即可以预测他的物理成绩是82.
『规律总结』1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确
的两组数据,可先作散点图,从图中看它们有无关系,关系的密切程度,再进行相关的回归
分析.
2.求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方
程才有实际意义,否则,求出的回归直线方程毫无意义.
II跟踪练习2.■
(2020.湖南郴州质检)为了探究车流量与PM2.5的浓度是否相关,现采集到北方某城市
2016年12月份某星期星期一到星期日某一时间段车流量与PM2.5的数据如下表:
时间星期一星期二星期三星期四星期五星期六星期日
车流量X/万辆1234567
PM2.5的浓度
28303541495662
M微克/立方米)
(1)由散点图知y与x具有线性相关关系,求了关于x的线性回归方程:
⑵①利用⑴所求的回归方程,预测该市车流量为8万辆时PM2.5的浓度;
②规定:当一天内PM2.5的浓度平均值在(0,50]内,空气质量等级为优;当一天内PM2.5
的浓度平均值在(50,100]内,空气质量等级为良.为使该市某日空气质量为优或良,则应控
制当天车流量在多少万辆以内?(结果以万辆为单位,保留整数.)
n____
ZAO'I-«Xy
八八八AA_A_
参考公式:回归直线的方程是其中〃=,a=y~bx.
》,一〃x2
i=।
一1
[解析]⑴由数据可得x=,(1+2+3+4+5+6+7)=4,
-177A
y=,(28+30+35+41+49+56+62)=43,1372,140,b=
i=li=\
〉》一7xy
/=I1372-1204A_A_
=~-=6,u=y—bx=43-6X4=19,故y关于x的线性回归方
7_140—112
-7x2
i=l
程为y=6x+19.
(2)①当车流量为8万辆,即x=8时,f=6X8+19=67.故当车流量为8万辆时,PM2.5
的浓度约为67微克/立方米.
②根据题意得6x+19W100,即XW13.5,故要使该市某日空气质量为优或良,应控制
当天车流量在13万辆以内.
命题方向❸
线性回归分析
典例3某运动员训练次数与训练成绩之间的数据关系如下:
次数(X)3033353739444650
成绩。)3034373942464851
(1)作出散点图;
(2)求出回归方程;
(3)作出残差图;
(4)计算R2,并说明运动员的训练次数对成绩的影响占百分之几.
I解析[(1)作出该运动员训练次数x与成绩y的散点图,如图所示.由散点图可知,它
们之间具有相关关系.
60
50J
4。.1
3()•*
20
10
TJl-102030405060x
__88
(2)X=39.25,y=40.875,)=12656,力渺=13180,
/=!/=!
8__
X(加一次)8-y)
Ai=l
所以6=---;-------------、1.04]5,
E(为一x)2
i=\
A____A
a=~~bx=-0.003875,
A
.,.回归直线方程为y=1.0415x-0.003875.
(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数
据.
AA
Xy
3030-1.2411
3334-0.3656
35370.5514
37390.4684
39421.3854
44460.1779
46480.0949
5051-1.0711
作残差图如图所示.
由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.
(4)计算相关指数R2比0.9855,说明了该运动员的成绩的差异有98.55%是由训练次数引
起的.
『规律总结』1.解答本类题目应先通过散点图来分析两个变量间的关系是否线性相
关,再利用求回归方程的公式求解回归方程,并利用残差图或R2来分析函数模型的拟合效
果,在此基础上,借助回归方程对实际问题进行分析.
2.“咫、残差图”在回归分析中的作用:
nA
ZGif/
i=\
(1)R2是用来刻画回归效果的,由R2=l------------------可知/?2越大,意味着残差平方和
n-
£yy
/-i
越小,也就是说模型的拟合效果就越好.
(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状
区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.
II跟踪练习3一■
为研究质量x(单位:克)对弹簧长度),(单位:厘米)的影响,对不同质量的6个物体进行
测量,数据如表所示:
X51015202530
y7.258.128.959.9010.911.8
(1)作出散点图,并求线性回归方程;
(2)求出R?;
(3)进行残差分析.
I解析I(1)散点图如图所示.
——1
因为X=不乂(5+10+15+20+25+30)=17.5,
7=、X(7.25+8.12+8.95+9.90+10.9+11.8户9.487,
66
»?=2275,1076.2
/=1
AA
计算得,40.183,a七6.285,
所求线性回归方程为y=0.183x+6.285.
(2)列表如下:
A
yi-yi0.050.005-0.08-0.0450.040.025
yi-y-2.24-1.37-0.540.411.412.31
6A6―
所以Z8一对2*0.01318,Z(y,—y)2=14.6784.
/=1f=l
所以,必=1—:):)祟上0.9991,
14.0/O4
回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据
的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可
以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归
模型的精度较高,由以上分析可知,弹簧长度与重量成线性关系.
命题方向❹
非线性回归问题
典例4有一测量水流的实验装置——量水堰,测得试验数据如下表:
i1234567
水高Zz(厘米)0.71.12.54.98.110.213.5
流量。(升/分)0.0820.251.811.237.866.5134
根据表中数据,建立。与〃之间的回归方程.
[思路分析]作散点图,观察确定y与x的近似函数关系,作变量替换,列出新的对应
值表求出对应的线性回归方程,再作变量替换得回归方程.
[解析1根据测得数据作出散点图,如图,根据已有的函数知识,可以发现样本点分布
在某一条嘉函数型曲线。=a/(a、夕是待定的正常数)①的周围.为此将Q=a/两边取对数,
得到lgQ=/flg/z+lga②,令lgQ=y,lg〃=x,于是②式可化为y=/r+lga.这样y就是x的线
性函数了.可以利用线性回归模型来建立y和x之间的线性回归方程y=bx+“3=〃,lga=
〃)了.
ihiQiXi=lghixi孙•
10.70.082-0.1549-1.08620.0240.1683
21.10.250.0414一0.60210.0017-0.0249
32.51.80.39790.25530.15830.1016
44.911.20.69021.04920.47640.7242
58.137.80.90851.57400.82541.4300
610.266.51.00861.82281.01731.8385
713.51341.13032.12711.27762.4043
7777
L2为=4.022ZM=5.1401Z%?=3.7807X和尸6.642
尸i/=]厂i
先作出上面数据表,由表得到£比2.5097,lga~-0.7077,则。p0.1960.于是所得的
回归方程为。=0.193庐5097.
『规律总结』1.在建立经验公式时,选择合适的函数类型是十分重要的.通常是根据
实验数据,画出散点图,从中观察其变化规律,并与已知函数的图象对比,看接近于什么函
数,根据实践经验来决定选取公式的类型,所选的类型是否符合实际,还需要通过实践来检
验.有时候还需要选择不同的模拟函数作比较.
2.如果观察散点图,发现点的分布不呈条状分布,而是与某种曲线相近,这时可选择
这条曲线对应的函数作为拟合函数,作恰当变换,转化为线性函数,用线性回归模型求解.
例如:
h1
①反比例函数可作变换t=~,得
②寐函数型>=加">0)可作变换Y=lny,m=}na,t—\nx,则有
Y=m+bt.
③指数型函数y=k?v(a>0且“Wl,k>0)可作变换Y=\ny,m=\nk,则有:Y=m+(b\na)x
II跟踪练习4_・
为了研究某种细菌随时间x的变化繁殖个数y的变化,收集数据如下:
时间x/天123456
繁殖个数y612254995190
(1)将天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)描述解释变量与预报变量之间的关系;
(3)计算残差、相关指数
|解析|(1)由表中数据作散点图如下图所示.
“个
200
80
60
40
20
00
80
60
40
20
--■--
23456
(2)由散点图看出样本点分布在一条指数函数y=ciec加的图象的周围,其中。和。2是待
定系数.于是令z=lny,则z=〃x+a(n=lna,b-c2),因此变换后的样本点应该分布在直
线z=%x+〃的周围,因此可以用线性回归模型来拟合z与x的关系,则变换后的样本数据
如下表:
X123456
Z1.792.483.223.894.555.25
由表中数据得到线性回归方程?=0.69x+1.115.
因此细菌繁殖个数关于时间的回归方程为£=e°69/LU5.
(3)列出残差表:
编号i123456
A6.0812.1224.1796.06191.52
V/48.18
%612254995190
A
ei-0.08-0.120.830.82-1.06-1.52
6A6八
E〃=£Gf)2=4.8161,
/=1/=1
6_
X(M-y)2=24630.1,
i=l
乃=I__48161_9998
K1241630.1
故解释变量天数对预报变量繁殖个数解释了99.98%,说明该回归模型拟合效果非常好.
学科核心素养
利用线性回归方程进行预报变量的估计(规律方法)
利用线性回归方程可以进行预报,线性回归方程将部分观测值所反映的规律进行延伸,
是我们对有线性相关关系的两个变量进行分析和控制的依据.
典例5(2020•福州模拟)对具有线性相关关系的变量x,y,测得一组数据如
下表:
X24568
y2040607980
AA
根据上表,利用最小二乘法得它们的回归直线方程为y=10.5x+〃,据此模型来预测当x
=20时,y的估计值为(C)
A.210B.210.5
C.211.5D.212.5
————AAA
[解析]由已知得x=5,y=54,则(5,54)满足回归直线方程)=10.5]+“,解得4=1.5.
因此f=10.5x+1.5,当x=20时,£=10.5X20+1.5=211.5.故选C.
『规律总结』已知变量的某个值去预测相应预报变量的某个值时,先求出其所满足的
回归直线方程£=>+2把已知x取某一个值代入回归方程£=晨+1中,从而可求出y的估
计值.
II跟踪练习工■
某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了4次试验,得到
数据如下:
零件的个数M个)2345
加工的时间y(小时)2.5344.5
(1)在给定的坐标系中画出表中数据的散点图;
y
5----:一…•;
4---;--J--W---;--•
2--W..I..i---i--1
1……-i……-i……-i……\……i
-01~~2~~3~45x
AAA
(2)求y关于x的线性回归方程y=bx+〃;
(3)试预测加工10个零件需要的时间.
Z(为一x)8-y)Xx-yi-nxy
Ai=\i=l
b-=
参考公式:<i(xi~~)2f^-nT2
i=li=\
A—人—
、a=y-bx
[解析](1)散点图如图所示:
y
012345%
(2)由题中表格数据得x=3.5,y=3.5,
4__4_
X(羽一x)8-y)=3.5,X(为一工y=5.
/=1i=\
4__
z(X/—x)(yi-y)
由公式计算得,=二------------A——A—
=0.7,a=y-bx,
4_
Z(Xi-X尸
所以所求线性回归方程为f=6x+1=0.7x+1.05.
AAA
⑶当x=10时,y=6x+a=0.7X10+1.05=8.05,
所以预测加工10个零件需要8.05小时.
V
V
易混易错警示
求回归方程
典例6在一化学反应过程中,某化学物质的反应速度y(g/min)与一种催化剂
的量x(g)有关,现收集了如表所示的8组数据,则y与x的回归方程是f=e°-⑻2L°=85.
催化剂是x(g)1518212427303336
化学物质反应速度Mg/min)6830277020565350
——88
[错解]由表中数据可得x=25.5,>=95.125,»?=5580,£卬,,=24297,
i=li=\
8__
2>加一8xy
A1=1八__A__八
所以6=----------------------七12.94,a=~~b~=-234.845.所以回归方程式为y=一
8_
8X2
i=l
234.845+12.94元
[辨析]错误原因:未画散点图来确定回归类型,题中要求回归方程但不一定是回归直
线方程,错解中盲目地求成了回归直线方程.
防范措施:回归分析时,必须先画散点图,确定两个变量是否有关系,有什么样的关系,
然后确定是哪种回归模型才能进一步求解.
I正解]根据收集的数据作散点图,如图所示.
化学物质反应速度
400
350・
300
250
200•
150
100
50,
0I«?*'_1_1~―-
121518212427303336催化剂量/&
根据样本点的分布情况,可选用指数型函数模型、=。但。21=(口,C2为待定的参数),令
z=\ny,则z=C2x+lnc”即变换后样本点应该分布在直线z=fer+〃(〃=ln臼,/?=◎)的周围,
由y与X的数据表得Z与X的数据表如下:
化学物质反应速度的对数
8
6,・•
4,•
2,•'"
_,_,_,_,_,-----.
10152025303540催化剂敏/g
X1518212427303336
Z1.7922.0793.4013.2964.2485.3234.1745.858
作出Z与X的散点图,如图所示,由图可以看出变换后的样本点分布在一条直线附近,
所以可用线性回归方程来拟合.
由表中数据可得6^0.1812,-0.8485,故2=0.1812%—0.8485,所以£=一⑻浜-。的
5,因此该化学物质的反应速度与催化剂的量的非线性回归方程为f=e。♦⑻2「。.8485.
课堂达标•固基础
1.关于回归分析,下列说法错误的是(D)
A.回归分析是研究两个具有相关关系的变量的方法
B.散点图中,解释变量在x轴,预报变量在),轴
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
[解析】用散点图反映两个变量间的关系时,存在误差.
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,
计算可得它们的相关指数K分别如下表:
甲乙丙T
R20.980.780.500.85
哪位同学建立的回归模型拟合效果最好(A)
A.甲B.乙
C.丙D.丁
[解析]相关指数收越大,表示回归模型的效果越好.
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组
样本数据(为,…,n),用最小二乘法建立的回归方程为£=0.85x—85.71,则下列
结论中不正确的是(D)
A.),与x具有正的线性相关关系
B.回归直线过样本点的中心(二,7)
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg
[解析]A,B,C均正确,是回归方程的性质,D项是错误的,线性回归方程只能预测
学生的体重,选项D应改为“若该大学生某女生身高为170cm,则估计其体重大约为58.79
kg”.
4.某单位为了了解用电量y度与气温x"C之间的关系,随机统计了某4天的用电量与
当天气温,并制作了对照表:
气温(℃)181310-1
用电量(度)24343864
由表中数据得线性回归方程£=队+〃中匕=-2,预测当气温为一4℃时,用电
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《婴幼儿常见病识别与预防》课件-流行性腮腺炎
- 购房政策调解协议书模板
- 2024年秋新教科版八年级物理上册全册课件(新版教材)
- 幼儿园环境创设 课件 项目7 幼儿园民族民间文化环境创设
- 中国电动汽车热泵空调行业市场调查及投资前景分析报告2024-2030年
- 2022人工智能医疗产业发展蓝皮书
- 《 呼和浩特市残疾人就业保障金征收管理研究》
- 吊篮使用安全培训
- 各种手势文化英语知识
- 北师大版小学英语一年级上册期中考卷含参考答案
- 19S406建筑排水管道安装-塑料管道
- 沪教版九年级化学上册单元测试题及答案全套
- 铁路路基工程路基过渡段施工技术交底#附图
- (精选)“一户一策”精准脱贫帮扶计划
- 常用表面活性剂HLB值一览表
- 培训效果调查问卷(7种)
- 《歌唱祖国》的歌词完整版.doc
- 住院大病历-空白模板5页
- GDFJ005修改个人信息申请表
- 《有效教学方法》(各章节要点导读)
- 结构设计计算工具EXCEL版
评论
0/150
提交评论