版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3讲变量间的相关关系与统计案例
[考纲解读]1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相
关关系;根据最小二乘法求出回归直线方程.(重点)
2.了解独立性检验(只要求2X2列联表)的基本思想、方法及其初步应用.
[考向预测]从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测
2021年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决
实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,
难度为中等.止匕外,也可能出现在客观题中,此时试题难度不大,属中、低档题
型.
基础知识过关-
1.相关关系与回归方程
(1)相关关系的分类
①正相关:从散点图上看,点散布在从8[左下角到区右上角的区域内,如图
1;
②负相关:从散点图上看,点散布在从画左上角到因右下角的区域内,如图
2.
图1图2
⑵线性相关关系:从散点图上看,如果这些点从整体上看大致分布在四一条
直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做附回归直线.
(3)回归方程
①最小二乘法:使得样本数据的点到回归直线的以距离的平方和最小的方法
叫做最小二乘法.
②回归方程:两个具有线性相关关系的变量的一组数据(X1,%),(X2,力),…,
E(x「X)(y-y)nxy
=
AAAAj=l/1A
(xn,%),其回归方程为y=bx+a,则6==,a=y—
2(XL】)2'—nR
i=li=l
A_AA_1n_2n
bx.其中,b是回归方程的倒斜率,。是在y轴上的理截距,x=m?]X”V=.?/,
0(7,7)称为样本点的中心.
说明:回归直线)/=叔+。必过样本点的中心(T,歹),这个结论既是检验所求
回归直线方程是否准确的依据,也是求参数的一个依据.
(4)样本相关系数
n__
S(x「x)(%—y)
r=一;,用它来衡量两个变量间的线性相关关系.
Ai(XLX)2E(%—7)2
①当r>0时,表明两个变量口正相关;
②当厂<0时,表明两个变量盘负相关;
③r的绝对值越接近1,表明两个变量的线性相关性心越强;r的绝对值接近
于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个
变量有很强的线性相关关系.
2.残差分析
⑴残差:对于样本点的,力),仅2,力),…,(x”yn),它们的随机误差为e,
AAAAA
=y—bx—a,i=l,2,…,n,其估计值为巳=%—%=%-8为一。,i=l,2,…,n,e
,•称为相应于点(x”力)的残差.
nA
(2)残差平方和为区(%一城.
nA
,石⑴一城
(3)相关指数:7?2=i-a^———.
备(%—y)2
3.独立性检验
⑴分类变量:变量的不同“值”表示个体所属的以不同类别,像这类变量称
为分类变量.
(2)列联表:列出两个分类变量的©频数表,称为列联表.假设有两个分类变
量X和Y,它们的可能取值分别为{内,芍}和{M,竺},其样本频数列联表(称为2X2
列联表)为
2X2列联表
*总计
aba~\~b
Cdc~\~d
总计a~\~cb~\~dc~\~d
构造一个随机变量乙但许鬻生高,其中「四+b+c+d
为样本容量.
(3)独立性检验
利用随机变量四彳来判断“两个分类变量%有关系”的方法称为独立性检
验.
Q诊断自测
1.概念辨析
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.()
(2)“名师出高徒”可以解释为教师的教学水平与学生水平成正相关关
系.()
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()
(4)事件X,Y关系越密切,则由观测数据计算得到的片的观测值越大.()
(5)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某
人数学成绩优秀,则他有99%的可能物理优秀.()
答案(1)X(2)V(3)V(4)V(5)X
2.小题热身
A
(1)设回归方程为y=3—5x,则变量x增加一个单位时()
A.y平均增加3个单位B.y平均减少5个单位
C.y平均增加5个单位D.y平均减少3个单位
答案B
解析因为一5是斜率的估计值,说明X每增加一个单位,y平均减少5个单
位.故选B.
(2)在下列各图中,两个变量具有相关关系的图是()
A.①②B.①③
C.②④D.②③
答案D
解析①为函数关系;②显然成正相关;③显然成负相关;④没有明显相关
性.
⑶随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生
育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如
表.
非一线一线总计
愿生452065
不愿生132235
总计5842100
100X(45X22-20X13)^
舁何58X42X35X65
附表:
0.0500.0100.001
品3.8416.63510.828
参照附表,得到的正确结论是()
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
答案c
解析因为K2-9.616>6.635,所以有99%以上的把握认为“生育意愿与城市
级别有关”.
(4)已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示,若y
A
关于x的回归方程为y=1.3%—1,则m—.
X1234
y0.11.8m4
答案3.1
_1
解析由已知得x=4^(1+2+3+4)=2.5,
_11
y=^(0.1+1.8+/D+4)=^X(5.9+/D).
因为(x,y)在直线产1.3%—1上,
所以亍=1.3X2.5—1=2.25,
所以:X(5.9+〃z)=2.25,解得m=3.1.
-----------经典题型冲关------------
题型一相关关系的判断
【举例说明】
1.下列两变量中不存在相关关系的是()
①人的身高与视力;②曲线上的点与该点的坐标之间的关系;③某农田的水
稻产量与施肥量;④某同学考试成绩与复习时间的投入量;⑤匀速行驶的汽车的
行驶距离与时间;⑥商品的销售额与广告费.
A.①②⑤B.①③⑥
C.④⑤⑥D.②⑥
答案A
解析根据相关关系的定义知,①②⑤中两个变量不存在相关关系.
2.下列命题中正确的为()
A.线性相关系数r越大,两个变量的线性相关性越强
B.线性相关系数「越小,两个变量的线性相关性越弱
c.残差平方和越小的模型,模型拟合的效果越好
D.用相关指数网来刻画回归效果,川越小,说明模型的拟合效果越好
答案C
解析线性相关系数厂的绝对值越接近于1,两个变量的线性相关性越强,故
A,B错误;残差平方和越小,相关指数川越大,越接近于1,拟合效果越好,故
C正确,D错误.
3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,
正确的是()
0^5101520253035
相关系数为〃
①
J_____I______!______I______I______I______
05101520253035
相关系数为A相关系数为Q
③④
<<
A.f2^40<r3<riB.-4<-2<0<〃<—3
C/4<r2<0<厂3<片D.井2<厂4<0<片<〃3
答案A
解析易知题中图①与图③是正相关,图②与图④是负相关,且图①与图②
中的样本点集中分布在一条直线附近,则厂2<厂4<。<厂3<厂1.故选A.
【据例说法】
1.判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左
上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;厂<0时,负相关.|r|越趋近于1相关性越强.见
举例说明3.
(3)线性回归直线方程中:b>0时,正相关;b<0时,负相关.
2.判断拟合效果的两个方法
(1)残差平方和越小,拟合效果越好.见举例说明2.
(2)相关指数*越大,越接近于1,拟合效果越好.
【巩固迁移】
1.在一组样本数据(X1,M),(%2>竺),…,(X",%)("三2,Xi,X2,…,X"不全
相等)的散点图中,若所有样本点®,%)(,=1,2,…,〃)都在直线y=1x+l上,则
这组样本数据的样本相关系数为()
A.-lB.0
C.1D.1
答案D
解析所有点均在直线上,则样本相关系数最大即为1,故选D.
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性
回归方程,分别得到以下四个结论:
A
①y与x负相关且y=2.347元—6.423;
A
②y与x负相关且歹=—3.476x+5.648;
A
③y与x正相关且y=5.437x+8.493;
A
④y与x正相关且丁=-4.326%—4.578.
其中一定不正确的结论的序号是()
A.①②B.②③
C.③④D.①④
答案D
解析由回归方程y=bx+a知当b>0时,y与x正相关,当b<0时,y与x负
相关,..•①④一定错误.
题型二回归分析多角探究
【举例说明】
角度1线性回归方程及应用
1.某汽车的使用年数x与所支出的维修总费用y的统计数据如表:
使用年数X/年12345
维修总费用w万元0.51.22.23.34.5
根据上表可得y关于x的线性回归方程y=bx—0.69,若该汽车维修总费用超
过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1
年计算)()
A.8年B.9年
C.10年D.11年
答案D
AAA
解析由y关于x的线性回归直线y=6x—0.69过样本点的中心(3,2.34),得匕=
AA
1.01,即线性回归方程为y=L01x—0.69,令y=1.01x—0.69=10,得x^lO.6,所
以预测该汽车最多可使用11年.故选D.
2.(2019•东北三省三校三模)现代社会,“鼠标手”已成为常见病.一次实验中,
10名实验对象进行160分钟的连续鼠标点击游戏,每位实验对象完成的游戏关卡
一样,鼠标点击频率平均为180次/分钟,实验研究人员测试了实验对象使用鼠标
前后的握力变化,前臂表面肌电频率(SEMG)等指标.
(1)10名实验对象实验前、后握力(单位:N)测试结果如下:
实验前:346,357,358,360,362,362,364,372,373,376.
实验后:313,321,322,324,330,332,334,343,350,361.
完成茎叶图,并计算实验后握力平均值比实验前握力的平均值下降了多少
N?
(2)实验过程中测得时间/(分)与10名实验对象前臂表面肌电频率(sEMG)的中
位数y(Hz)的九组对应数据(3y)为(0,87),(20,84),(40,86),(60,79),(80,78),(100,78),
(120,76),(140,77),(160,75).建立y关于时间。的线性回归方程;
(3)若肌肉肌电水平显著下降,提示肌肉明显进入疲劳状态,根据(2)中9组数
据分析,使用鼠标多少分钟就该进行休息了?
9__
参考数据:?I(t/—t)(y-y)=—1800;
z—1,
参考公式:回归方程y=历+。中斜率和截距的最小二乘估计公式分别为:b=
n__
石t)(%—y)A_A_
Hzz,ci—y—bt
石修一f)2
解(1)根据题意得到茎叶图如下图所示:
实验前I实验后
313
32124
33024
6343
87350
4220361
63237
_1
由图中数据可得X1=^X(346+357+358+360+362+362+364+372+373
+376)=363,
_1
%2=15*(313+321+322+324+330+332+334+343+350+361)=333,
x1—x2=363—333=30(N),
•••故实验前后握力的平均值下降了30N.
—1
(2)由题意得t=^(0+20+40+60+80+100+120+140+160)=80,
—1
V=§X(87+84+86+79+78+78+76+77+75)=80,
9_
国(t-/)2=(0—80)2+(20—80)2+(40—80)2+(60—80)2+(80—80)2+(100
-80)2+(120-80)2+(140-80)2+(160-80)2=24000,
9__
又£(J—t)(^—)=-1800,
z—1z
9—_
.”石(L/)CVLy)-1800
••b—9ZZ0.075,
(t-t)224000
:.a=y-bt=80-(-0.075)X80=86,
A
关于时间t的线性回归方程为y=—0.075/+86.
⑶九组数据中40分钟到60分钟y的下降幅度最大,提示60分钟时肌肉已经
进入疲劳状态,故使用鼠标60分钟就该休息了.
9角度2非线性回归模型的应用
3.(2019•莆田二模)某芯片公司为制定下一年的研发投入计划,需了解年研发资
金投入量为(单位:亿元)对年销售额外(单位:亿元)的影响.该公司对历史数据进行
对比分析,建立了两个函数模型:®y=a+6x2,②y=j+t,其中a,6,A,t均
为常数,e为自然对数的底数.
现该公司收集了近12年的年研发资金投入量X;和年销售额%的数据,/=
1,2,…,12,并对这些数据作了初步处理,得到了如下的散点图及一些统计量的
值.
攵t年销售额/亿元
80
75.
70..
65•
60.•・
4:,'J...-
°1015202530年研发资金/亿元
令均=*,s=ln%(i=l,2,…,12),经计算得如下数据:
12_12_
(即一%)2)2
XEE8—yUV
y1=\Z=1
20667702004604.20
12_12_
12_E(%—u)•12_E(XLX)•
E(均一M)2!=1E(9一0)2;=1
i=\Z=1
(L7)(0LV)
3125000215000.30814
⑴设{出}和{%}的相关系数为厂1,㈤和也}的相关系数为厂2,请从相关系数的
角度,选择一个拟合程度更好的模型;
(2)①根据⑴的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
②若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少
亿元?
n__
E(x「%)(%—y)
i=l
附:相关系数r=
n_n_
E(x「%)2E(yi-y)2
i=li=l
回归直线y=a+fec中斜率和截距的最小二乘估计公式分别为6=
n__
E(即一x)(%—y)
i=1AA
,a=y~bx;
n_
E(XLXf
i=l
参考数据:308=4X77,痴心9.4868,e44"8^90.
12__
E(%-u)(%—y)
Z=1
解(1)由题意,
1212
E(均一U)2E(yi—y)2
i=l
21500_21500_43_
^3125000X200-25000-50--,
12__
E(XL%)(0LO)
i=l14
-2=
12124770X0.308
E%)2,(9一u)2
I:",
则伉|<|川,因此从相关系数的角度,模型y=e"x+t的拟合程度更好.
(2)①先建立v关于x的线性回归方程,
由y=e&",得lny=/+Ax,即o=/+Ax;
12__
E(%—x)(--p)
i=114
由于A==77c〜0・018,
12_/小
E(XL%)2
t=v-Ax=4.20-0.018X20=3.84,
所以。关于x的线性回归方程为0=0.02%+3.84,
所以Iny=0.02x+3.84,
贝日=e°mx+3-84.
②下一年销售额y需达到90亿元,即尸90,
代入尸e°g+&84,得9o=e°g+3.84,
448
又e-"^90,所以4.4998~0.02x+3.84,
4.4998—3.84
所以=32.99
x〜002
所以预测下一年的研发资金投入量约是32.99亿元.
【据例说法】
1.利用线性回归方程时的关注点
(1)正确理解计算b,。的公式和准确的计算是求线性回归方程的关键.
AAA
(2)回归直线方程必过样本点中心(x,y).见举例说明1.
(3)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变
量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计
和预测.
2.非线性回归方程的求法
(1)根据原始数据(x,力作出散点图.
(2)根据散点图选择恰当的拟合函数.
(3)作恰当的变换,将其转化成线性函数,求线性回归方程.
(4)在⑶的基础上通过相应变换,即可得非线性回归方程.见举例说明3.
【巩固迁移】
1.(2019•南宁二模)一汽车销售公司对开业4年来某种型号的汽车“五一”优
惠金额与销售量之间的关系进行分析研究并做了记录,得到如下资料.
日期第1年第2年第3年第4年
优惠金额1(千元)10111312
销售量y(辆)22243127
经过统计分析(利用散点图)可知X,y线性相关.
AAA
(1)用最小二乘法求出y关于X的线性回归方程y="x+a;
⑵若第5年优惠金额为8.5千元,估计第5年的销售量y(辆)的直
n__n____
E(为一%)(%—y)IXM一〃%y
==
AZ1i1AA
参考公式:b—=,a—y~bx.
n_n_
£(X-x)2Xx?—nx2
z=li=l
__44
解(1)由题意,得x=H.5,y=26,2>必=1211,2>/=534,
z=li=l
4___
科一4xy
.A_[___________⑵1—4X11.5X2615
"b=~534-4XH.52=T=3,
》;一4x2
Z=1
AAA
则a=^—6x=26-3X11.5=-8.5..\y=3x-8.5.
(2)当x=8.5时,y=17,.,.第5年优惠金额为8.5千元时,销售量估计为17
辆.
2.对某地区儿童的身高与体重的一组数据,我们用两种模型①y=fec+a,②y
=ce"x拟合,得到回归方程分别为3)=0.24x—8.81,>)=L70e0022x,作残差分析,
如下表:
身高x(cm)60708090100110
体重Mkg)6810141518
A
e⑴0.410.011.21-0.190.41
A
e⑵—0.360.070.121.69-0.34-1.12
(1)求表中空格内的值;
(2)根据残差比较模型①②的拟合效果,决定选择哪个模型;
(3)若残差大于1kg的样本点被认为是异常数据,应剔除,剔除后对(2)所选择
的模型重新建立回归方程.(结果保留到小数点后两位)
附:对于一组数据(xi,乃),3,"),…,(XH,%),其回归直线y=6x+a的斜
n__
人g(者一%)(%—y)八—八—
率和截距的最小二乘估计分别为。=J----二——,a=y-bx.
石(即一%)2
AA
解⑴根据残差分析,把x=80代入炉D=0.24X—8.81中,得严=10.39.
710-10.39=-0.39,
・••表中空格内的值为一0.39.
(2)模型①残差的绝对值的和为0.41+0.01+0.39+1.21+0.19+0.41=2.62,
模型②残差的绝对值的和为0.36+0.07+0.12+1.69+0.34+1.12=3.7.
V2.620.7,
・••模型①的拟合效果比较好,选择模型①.
(3)残差大于1kg的样本点被剔除后,剩余的数据如下表:
身高x(cm)607080100110
体重y(kg)68101518
A
e⑴0.410.01-0.39-0.190.41
A(%,—x)(y-y)A_A_
由公式b=n~y-bx9
石(XLX)2
A
得回归方程为y=0.24x—8.76.
题型三独立性检验
【举例说明】
L假设有两个分类变量X和Y的2X2列联表如下:
总计
Xla10a~\~10
c30c+30
总计6040100
对同一样本,以下数据能说明X与y有关系的可能性最大的一组为()
A.a=45,c=15B.。=40,c=20
C.a=35,c=25D.a=3Q,c=30
答案A
解析根据2X2列联表与独立性检验可知,当三而与相差越大时,X
〃十10c十30
与y有关系的可能性越大,即'相差越大,才历与小相差越大.故选A.
2.(2019-南昌三模)某校高三文科⑴班共有学生45人,其中男生15人,女生
30人.在一次地理考试后,对成绩作了数据分析(满分100分),成绩为85分以上
的同学称为“地理之星”,得到了如下列联表:
地理之星非地理之星合计
男生7
女生
合计
如果从全班45人中任意抽取1人,抽到“地理之星”的概率为;.
(1)完成“地理之星”与性别的2X2列联表,并回答是否有90%以上的把握
认为获得“地理之星”与“性别”有关?
(2)若已知此次考试中获得“地理之星”的同学的成绩平均值为90,方差为
7.2,请你判断这些同学中是否有得到满分的同学,并说明理由.(得分均为整数分)
参考公式:片=m+b)(c1+G,其中"=a+”+c+d.
临界值表:
2
P(K^k0)0.100.050.0100.0050.001
左02.7063.8416.6357.87910.828
t人数
30
20□男生
□金生
10
8—
0里之星类血
地理之星41三地£
解(1)根据题意知“地理之星”总人数为45xg=15,填写列联表如下:
地理之星非地理之星合计
男生7815
女生82230
合计153045
、45X(7X22—8X8/
=18<2706
根据表中数据,计算K=15X30X15X30-->所以没有90%的把
握认为获得“地理之星”与性别有关.
(2)没有得满分的同学,记各个分值由高到低分别为修,必,…,片5;
1
①若有2个以上的满分,则s2=^X[(100-90)2+(100-90)2H-----H(xi5一
40
90)2]>y>7.2,不符合题意.
②若恰有1个满分,为使方差最小,则其他分值需集中分布在平均数90的附
近,且为保证平均值为90,则有10个得分为89,其余4个得分为90,此时方差
取得最小值,
122
2
/.用in=Fx[(100—90)2+4X(90—90)2+10X(89-90)]=y>7.2,与题意方
差为7.2不符合,
所以这些同学中没有得满分的同学.
【据例说法】
独立性检验的一般步骤
(1)根据样本数据列出2X2列联表;
(2)计算随机变量片的观测值k,查表确定临界值履;
(3)如果左己岛,就推断“X与Y有关系”,这种推断犯错误的概率不超过
P(铲2k。);否则,就认为在犯错误的概率不超过RK2'%)的前提下不能推断“X
与y有关系”.
【巩固迁移】
1.学生会为了调查学生对2018年俄罗斯世界杯的关注是否与性别有关,抽
样调查100人,得到如下数据:
不关注关注总计
男生301545
女生451055
总计7525100
根据表中数据,通过计算统计量
心(小)(吉尤%)(狂4并参考以下临界数据:
0.500.400.250.150.100.050.0250.0100.0050.001
左00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828
若由此认为“学生对2018年俄罗斯世界杯的关注与性另।有关”,则此结论出
错的概率不超过()
A.0.10B.0.05
C.0.025D.0.01
答案A
解析由题意可得啜绫忆3.030>2.706,由此认为“学
43AjjA/jAZD
生对2018年俄罗斯世界杯的关注与性别有关”出错的概率不超过0.10.故选A.
2.(2018.全国卷III)某工厂为提高生产效率,开展技术创新活动,提出了完成
某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,
将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用
第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶
图:
第一种生产方式_________第二种生产方式
-8--655689
976270122345668
987765433281445
2110090
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时
间超过m和不超过m的工人数填入下面的列联表:
超过m不超过m
第一种生产方式
第二种生产方式
⑶根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
____n(ad—bcf____
(a+Z?)(c+d)(a+c)(b+d)'
P园/)0.0500.0100.001
左03.8416.63510.828
解(1)第二种生产方式的效率更高.理由如下:
①由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务
所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务
所需时间至多79分钟.因此第二种生产方式的效率更高.
②由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数
为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分
钟.因此第二种生产方式的效率更高.
③由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于
80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此
第二种生产方式的效率更高.
④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8
上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所
需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工
人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生
产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二
种生产方式的效率更高.
(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可)
⑵由茎叶图知m=-2—=80.列联表如下:
^.超过m不超过m
第一种生产方式155
第二种生产方式515
(3)由于K2的观测值左=%§黑鼎。^-=10>6.635,所以有99%的把握
认为两种生产方式的效率有差异.
课时作业
(N•'组基础关
i.观察下列各图形:
其中两个变量X,y具有相关关系的图是()
A.①②B.①④
C.③④D.②③
答案C
解析观察散点图可知,两个变量x,y具有相关关系的图是③④.
2.甲、乙、丙、丁四位同学各自对A,3两变量的线性相关性做试验,并用
回归分析方法分别求得相关系数厂与残差平方和m如下表:
甲乙丙T
r0.820.780.690.85
m106115124103
则哪位同学的试验结果体现A,3两变量有更强的线性相关性()
A.甲B.乙
C.丙D.T
答案D
解析在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,
相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越
强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,3两个变量有更
强的线性相关性.故选D.
3.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)
的关系,运用2X2列联表进行独立性检验,经计算g=7.069,则所得到的统计
学结论是:有的把握认为“学生性别与支持该活动有关系”.()
附:
。(都三岛)0.1000.0500.0250.0100.001
%02.7063.8415.0246.63510.828
A.0.1%B.1%
C.99%D.99.9%
答案C
解析因为7.069与附表中的6.635最接近,且7.069>6.635,所以得到的统计
学结论是:有1—0.010=0.99=99%的把握认为“学生性别与支持该活动有关
系”.
4.(2019•湖北省七市(州)教科研协作体联考)为了规定工时定额,需要确定加
工零件所花费的时间,为此进行了5次试验,得到5组数据:(修,刃),(巧,”),
(%3,为),(X4,>4),(%”).根据收集到的数据可知%1+松+尤3+%4+无5=100,用
A
最小二乘法求得回归直线方程为y=0.67x+54.8,则州+竺+为+以+乃的值为
()
A.68.2B.341
C.355D.366.2
答案B
_innA
解析由题意,得三=等=20,将其代入回归直线方程y=0.67x+54.8中,
得7=0.67X20+54.8=68.2,所以为+9+为+丁4+丁5=5歹=341.故选B.
5.(2020.甘肃兰州摸底)根据如下样本数据:
X12345
ya—1-10.5b+\2.5
得到的回归方程为y=6x+a样本点的中心为(3,0.1),当x增加1个单位,则y
近似()
A.增加0.8个单位B.减少0.8个单位
C.增加2.3个单位D.减少2.3个单位
答案A
_1_1
解析由题意,知x=5X(1+2+3+4+5)=3,y1)+(—1)+0.5
。+>+2
+(。+1)+2.5]=-g一=0.1,①
又回归直线方程过样本中心点(3,0.1),得36+。=01,②
由①②联立,解得a=—2.3,b=0.8,所以回归直线方程为y=0.8x—2.3,所
以当x增加1个单位时,y近似增加0.8个单位.
6.已知两个随机变量x,y之间的相关关系如下表所示:
X-4-2124
y-5-3-1—0.51
根据上述数据得到的回归方程为y=。尤+m则大致可以判断()
/«---、
^^xiy-nxy八_"
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023年袁州区委办公室等单位选调公务员笔试真题
- 2023年陕西航空职业技术学院招聘笔试真题
- 2023年金华市婺城交通投资集团有限公司招聘笔试真题
- 2023年成都市青白江区医疗卫生事业单位招聘卫生专业技术人才笔试真题
- 智能电网行业经营模式分析
- 2024年赣州客运资格证题库
- 低脂低糖食品科技行业相关项目诊断报告
- 《ISO 55001-2024资产管理-资产管理体系-要求》之9:“6策划-6.1应对风险和机遇的措施”解读和应用指导材料(雷泽佳-2024)
- 精准农产品加工行业消费者群体特征分析
- 公益广告制作与发布行业投资机会分析与策略研究报告
- 三年级上道德与法治课件我们的生命来之不易
- 钢结构质量检验计划
- 九年级英语全册单元测试题全套带答案(人教版新目标)
- 收发文登记台账(模板)
- 《保险合同》测试题
- 人教pep六年级上册英语 《Unit3 My weekend plan A Let's talk》教案
- 小学生体育课安全知识问卷调查
- 瓦斯抽采工安全技术专训(PPT123张)
- 原长沙铬盐厂铬污染场地土壤修复技术方案定稿版
- 变更验收单-模板
- (新版教材)粤教粤科版二年级上册科学全册课时练(同步练习)
评论
0/150
提交评论