版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
考点10-2回归分析与独立检验
卜维练基础J//
1.(2022♦河南•高三开学考试(文))在研究线性回归模型时,样本数据α,y)(i=l,2,3,M
所对应的点均在直线y=-;x+3上,用K?表示解释变量对于预报变量变化的贡献率,则
K=()
A.—1B.—C.1D.2
2
【答案】C
【分析】结合决定系数的知识确定正确答案.
【详解】因为样本数据所对应的点都在直线y=-<χ+3上,所以R2=I.
故选:C
2.(2023•全国•高三专题练习)如图是一组实验数据构成的散点图,以下函数中适合作为)
与X的回归方程的类型是()
o∖
2x
A.y=ax+hB.y=ax+cC.y=b∖ogax+cD.y=ba+c
【答案】D
【与析】由散点图中各点的变化趋势,结合题中选项给出的函数的性质,用排除法一一排除
得出答案.
【详莓】由散点图中各点的变化趋势知,各点不在一条直线上,排除A.
由散点图中各点呈单调递减趋势,排除B.又图中点的横坐标有正有负,故排除C.
故选:D.
3.(2023・全国•高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,
并分别计算出相关指数上,则线性相关程度最高的是()
Ψ乙丙T
R20.870.910.580.83
A.甲B.乙C.丙D.丁
【答案】B
【分析】利用相关指数K的性质,通过比较四位同学的N,即可得到线性相关程度最高的
同学
【详解】W越接近于1,两个变量的线性相关程度越高.
0.91>0.87>0.83>().58,则线性相关程度最高的是乙
故选:B.
4.(2023・全国•高三专题练习)下列是关于出生男婴与女婴调查的2x2列联表
晚上白天总计
男婴45AB
女婴E35C
总计98D180
那么O=.
[答案]82
【分析】根据2x2列联表,可得方程,解之即可得到结论.
【详解】解:由题意,45+E=98,A+35=D,45+A=B,E+35=C,5+C=180
.∙.A=47,B=92,C=88,D=82,£=53
故答案为:82.
5.(2023•全国•高三专题练习)设变量y与X的回归模型A、模型8、模型C相应的相关系
数r的值分别为0.28、0.35、0.3,则拟合效果最好的是模型______.
[答案]B
【分析】根据相关系数的绝对值越接近于1,则回归模型的拟合效果越好,可得答案.
【详解】因为相关系数的绝对值越接近于1,则回归模型的拟合效果越好,
又因为0.35>0.3>0.28,所以拟合效果最好的是模型B.
故答案为:B.
2维练能力JH
6.(2023∙全国♦高三专题练习)用模型y="/拟合一组数(%,χ)(i=l,2,…,10),若
7
Λ1+x2+.∙+ΛIU=10,yly2yl0=e°,设Z=Iny,得变换后的线性回归方程为z=6χ+4,
则成=()
A.12B.3e4C.4e3D.7
【答案】B
【分析】由已知,可根据%+w++∙⅞>=1O,%为y0=e7°先计算出GE),然后把样本
中心点带入线性回归方程为Z=族+4中计算出/>,从而得到线性回归方程,然后将方程化为
指数形式,通过待定系数法分别对应出〃、々的值,即可完成求解.
【详解】由已知,X1+X2++⅞)=10,所以I=%+.]+占。=1,
y∣%%)=e",Z=Iny,所以
-z+z+∙∙+z_Iny+lny+∙∙+lnyln(yyy)Ine70
N—-l210—l210—------l---2------K--)---------π/,
10101010
由题意,(E)满足线性回归方程为z=⅛r+4,所以7d.l+4,所以6=3,
此时线性回归方程为Z=3x+4,即Iny=3x+4,
可将此式子化为指数形式>'=e3t+4,即为y=e4.e3v,
因为模型为模型y="e",所以α=e4,k=3,
所以成=3e4.
故选:B.
7.(2023・全国•高三专题练习)下列命题中正确的是()
A.数据1,2,3,3,4,5的众数大于中位数
B.对一组数据x,(i=l,2,3,…,”),如果将它们变为%+C(i=l,2,3,…,〃),其中CwO,则平
均数和标准差均发生改变
C.有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样
本容量为30
D.一般可用相关指数配来比较两个模型的拟合效果,片越大,模型拟合效果越好
【答案】D
【分析】根据中位数和众数的定义判断A;根据平均数和标准差的性质可判断B;根据分层
抽样的性质判断C;根据相关指数的定义和性质判断D.
【详解】对于A,数据1,2,3,3,4,5的众数是3,中位数是手=3,众数等于中位数,
故A错误;
对于B,数据Mi=I23,…㈤,如果将它们变为%+C(i=l,2,3,∙∙∙,"),其中C≠0,则平均
数增加C,标准差不变,故B错误;
对于C,有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则
样本容量为(X(3+1+2)=18,故C错误;
对于D,由相关指数的性质可得可以通过比较相关指数后的大小比较两个模型的拟合效果,
且川越大,模型拟合效果越好,故D正确.
故选:D.
8.(2022•全国•高三专题练习)如下表,根据变量X与y之间的对应数据可求出9=-0∙32x+"
其中7=8.现从这5个样本点对应的残差中任取一个值,则残差不大于O的概率为()
X1015202530
y111086
【答案】C
【分析】计算;=20,y的最后一个数据为5,带入回归方程得到b=14.4,计算每个样本点
对应残差,得到概率.
【详解】由表中的数据可知,X=-------------------------=20,
设V的最后一个数据为〃,则亍=ll+l018+6+”=8,=
将X'y代入$=—0∙32x+b得力=14.4,
这5个样本点对应的残差分别为:
y1-j>l=ll-(-0.32×10+14.4)=-0.2,
y2-y2=10-(-0.32x15+14.4)=0.4,
%-%=8-(-0.32x20+144)=0,
J4-λ=6-(-0.32×25+14.4)=-0.4,
%一%=5-(-0.32x30+14.4)=0.2,所以残差不大于。的概率为,故选:C.
9.(2023・全国•高三专题练习)一只红铃虫产卵数)和温度X有关,现测得一组数据
(%,y)(i=l,2,…,10),可用模型y=qeQ*拟合,设Z=In),,其变换后的线性回归方程为
z=bx-4>若%+々+…+/=300,M必…即=e5",e为自然常数,则CG=.
【答案】0.31
【分析】经过Z=Iny变换后将非线性问题转化为线性问题,在求样本点的中心,回归直线
一定过该点,即可求出参数.
cx4
【详解】V=cle≈经过Z=Iny变换后,得到z=∖ny=c2x+∖nci,根据题意Inq=-4,故q=e^,
又用+Λ2+…+/=300,故嚏=30,YM…加=皆=Iny+In%+…+In加=50,故1=5,
于是回归方程为z=法-4一定经过(30.5),故306-4=5,解得b=0.3,即c?=0∙3,于是C1C2=
0.3e^4∙
故答案为:0.3e^4∙
10.(2023•全国•高三专题练习)已知变量X,N的关系可以用模型y=c∙*拟合,设Z=Iny,
其变换后得到一组数据如下:
X4681()
z2356
由上表可得线性回归方程Z=0.7x+α,则C=
【答案】e-ŋ-^ɪ
【分析】根据表格数据求工已代入回归方程求参数”,结合Z=Iny得Z=InC+",由方程
的形式可知α=lnc,即可求C.
-4+6+8+10_-2+3+5+6
【详解】由表格数据知:X=-------------=∕,z=------------
由z=0.7x+Q,得7x0.7+3=4'PPJcι——0.9.
・•・z=0.7x-0.9,
由y=c∙e'",得Z=Iny=In(C∙e")=InC+ln*V=InC+fcc,
ΛInc=-0.9,即c=r-
故答案为:c"0一
卜维练素养Jll
11.(2020.河南郑州•一模(理))根据最小二乘法由一组样本点(4其)(其中i=l,2,L,300),
求得的回归方程是》=加+否,则下列说法正确的是
A.至少有一个样本点落在回归直线5>=3X+G上
B.若所有样本点都在回归直线$=标+<5上,则变量同的相关系数为1
C.对所有的解释变量七(/=1,2,L,300),残,+4的值一定与y,有误差
D.若回归直线a=gχ+<?的斜率A>0,则变量X与y正相关
【答案】D
【分析】对每一个选项逐一分析判断得解.
【详解】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上,故A错误;
所有样本点都在回归直线夕=良+4上,则变量间的相关系数为±1,故B错误;
若所有的样本点都在回归直线»=标+2匕则b+G的值与%相等,故C错误;
相关系数,•与B符号相同,若回归直线5>=gχ+a的斜率3>0,则r>0,样本点分布应从左
到右是上升的,则变量X与y正相关,故D正确.
故选D.
【点睛】本题主要考查线性回归方程的性质,意在考查学生对该知识的理解掌握水平和分析
推理能力.
12.(2019•黑龙江•佳木斯一中高三阶段练习(文))针对时下的“抖音热”,某校团委对“学
生性别和喜欢抖音是否有关“作了一次调查,其中被调查的女生人数是男生人数的男生
喜欢抖音的人数占男生人数的:1,女生喜欢抖音的人数占女生人数2:,若有99%的把握认为
63
是否喜欢抖音和性别有关,则男生至少有()
Mad-
参考公式:K2=
(α+O)(c+d)(α+c)S+d)
K2>k]0.100.050.0250.0100.0050.001
k2.7063.8415.0246.6357.87910.828
A.12人B.18人C.24人D.30人
【答案】B
【分析】设男生人数为X,女生人数为完善列联表,计算K>6.635解不等式得到答案.
男女人数为整数
故答案选B
【I睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.
13.(2020•辽宁・蒙古族高级中学模拟预测(理))某次测量发现一组数据(x,∙,y,)具有较强
的相关性,并计算得;=χ+ι.5,其中数据(1,M)因书写不清楚,只记得M是。31上的一个
值,则该数据对应的残差(残差=真实值-预测值)的绝对位不大于0.5的概率为()
[答案]C
【分析】求得估计值,用真实值减去估计值求得残差,根据已知残差的绝对位不大于0.5列
不等式,解不等式求得X的取值范围,根据几何概型概率计算公式计算出所求概率.
【详解】依题意可知,估计值为1+1.5=2.5,残差为X-2.5,依题意得E-2∙5∣≤O5,解得
2≤y≤3,根据几何概型概率计算公式可得所求概率为彳=g,故选C.
【点睛】本小题主要考查残差的概念及计算,考查几何概型的计算,属于基础题.
14.(2022•全国•高三专题练习)有两个分类变量X和V,其中一组观测值为如下的2x2列
联表:
y.%总计
a15-a15
20—Q30+。50
总计204565
其中0,15-。均为大于5的整数,则q=时,在犯错误的概率不超过0.01的前
n(ad-be?
提下为“x和y之间有关系”.附:K2
(α+h)(c+d)(α+c)(Zj+d)
P(K2≥k)0.100.050.0250.0100.005
k2.7063.841
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度集装箱运输企业信用评价与风险管理合同3篇
- 二零二五年环保节能型监控设备采购与技术支持合同2篇
- 二零二五版房屋租赁及转让合同全方位权益创新协议2篇
- 二零二五版文化创意产业园区使用权转让合同3篇
- 二零二五年度国际公路运输代理合同2篇
- 二零二五版城市绿化苗木租赁合同3篇
- 二零二五版环保设备质押贷款合同模板3篇
- 二零二五年度高级管理人员出差责任免除服务合同范本2篇
- 二零二五版体育行业劳动合同管理规范及运动员权益保障协议3篇
- 二零二五年度节水减排供水合同范本3篇
- 2023年山东省青岛市中考化学试题(含答案解析)
- 商业计划书(BP)产品与服务的撰写秘籍
- 安徽华塑股份有限公司年产 4万吨氯化石蜡项目环境影响报告书
- 公司章程(二个股东模板)
- 世界奥林匹克数学竞赛6年级试题
- 药用植物学-课件
- 文化差异与跨文化交际课件(完整版)
- 国货彩瞳美妆化消费趋势洞察报告
- 云南省就业创业失业登记申请表
- UL_标准(1026)家用电器中文版本
- 国网三个项目部标准化手册(课堂PPT)
评论
0/150
提交评论