




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计数原理原理与概率统计解答题——回归分析
1.截至2021年12月,中国网民规模达10.32亿人,随之电信网络诈骗犯罪形势也非
常严峻.2021年6月,公安部推出国家级反诈防骗“王炸”系统一国家反诈中心APP”,
这是一款能有效预防诈骗、快速举报诈骗内容的软件,用户通过学习里面的防诈骗知识
可以有效避免各种网络诈骗的发生,减少不必要的财产损失,某省自“国家反诈中心APP”
推出后,持续采取多措并举的推广方式,积极推动全省“国家反诈中心APP”安装注册工
作.经统计,省反诈中心发现全省网络诈骗举报件数y(件)与推广时间有关,并记录
了经推广x个月后举报件数的数据:
推广月数(个)1234567
y(件)891888351220200138112
(1)现用y=作为回归方程模型,利用表中数据,求出该回归方程.
X
(2)分析该省一直加大力度推广下去有可能将网络诈骗举报件数降至接近于零吗?参考
数据(其中4='):
公
7
tE?i2-7x?2
i=li=l
15860.370.55
参考公式:对于一组数据(不乂),(々,%),(X3,%),(乙,以),其回归直线y=6x+G的斜
Yx-.y.-nxy
率和截距的最小二乘估计公式分别为:^=-4----------------------,a=y-bx.
麻2
i=l
2.某省为调查北部城镇2021年国民生产总值,抽取了20个城镇进行分析,得到样本
数据a,»)(i=l,2,,20),其中茗和y,分别表示第i个城镇的人口(单位:万人)和
该城镇2021年国民生产总值(单位:亿元),计算得
202()202020
=100,£%=800,£(占-可一=70,£(%-方:280,£(x;-x)(y,.-y)=120.
i=l/=1/=!1=1/=!
(1)请用相关系数,•判断该组数据中y与X之间线性相关关系的强弱(若卜归[0.75』,相
关性较强;若M《0.30,0.75),相关性一般;若re[-0.25,0.25],相关性较弱);
(2)求y关于x的线性回归方程;
(3)若该省北部某城镇2021年的人口约为5万人,根据(2)中的线性回归方程估计该城
镇2021年的国民生产总值.
£(%-可包-刃
参考公式:相关系数:=7丁'"』,对于一组具有线性相关关系的数据
\£(七-可5(%一寸
V/=11=1
(七,y)(i=1,2,,〃),其回归直线a=Ex+G的斜率和截距的最小二乘估计分别为
,可(%-刃
b=--------,a=y-bx
t(占F
f=l
3.为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的
特色水果开设直播带货专场.该特色水果的热卖黄金时段为2021年7月10日至9月
10S,为了解直播的效果和关注度,该电商平台统计了已直播的2021年7月10日至7
月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:
万人)的数据如下表:
日期7月10日7月11日7月12日7月13日7月14日
第X天12345
人数y(单位:万人)75849398100
(1)依据表中的统计数据,请判断该电商平台的第x天与到该电商平台专营店购物的人数
y(单位:万人)是否具有较高的线性相关程度?(参考:若03<0.75,则线性相
关程度一般,若卜1>。-75,则线性相关程度较高,计算r时精确度为0.01)
(2)求购买人数y与直播的第x天的线性回归方程;用样本估计总体,请预测从2021年
7月10日起的第38天到该专营店购物的人数(单位:万人).
5_5_________
参考数据:>')2=434,Z(%-x)(%-y)=64,74340=65.979.
f=l1=1
2(x;-x)(»-y)Z区一6(凹一7)
附:相关系数r=I_,回归直线方程的斜率方=———二
22
X(xi-x)X(yi-y),(±-x)2
V1=1/=!j=l
截距屋“版.
4.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非
原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
X12345678
y1126144.53530.5282524
根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用
反比例函数模型y=a+-和指数函数模型y=ce"'分别对两个变量的关系进行拟合.已求
得用指数函数模型拟合的回归方程为a=96.540-0,1叮与戈的相关系数/;=-0.94.
(i)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到o.oi),并用其估计产量
为10千件时每件产品的非原料成本.
参考数据:
8888
Z«,2-2
UU-,0.61x6185.5e
i=li=l»=|<=|
183.40.340.1151.5336022385.561.40.135
参考公式:对于一组数据(%,为),(的,修,,(““,乙),其回归直线£=近+饱的斜率和截
n
2火匕—nuv
距的最小一乘估计分别为:8---------,a=v-pu,相关系数
£仇;一nu2
/=1
n
归"”疝2.归口标2
V,=1V<=1
5.近年来,新能源产业蓬勃发展,已成为我市的一大支柱产业.据统计,我市一家新能
源企业近5个月的产值如下表:
月份5月6月7月8月9月
月份代码X12345
产值)亿元1620273037
(1)根据上表数据,计算)与X的线性相关系数r,并说明y与X的线性相关性强弱;
(0.75<|r|<l,则认为y与x线性相关性很强;|r|<0.75,则认为y与x线性相关性不强)
(2)求出>关于x的线性回归方程,并预测10月该企业的产值.
____
^y^nxy____________________________
参考公式:.,”…壬
心xjx心y--ny~nx
参考数据:£卬=442,*X;=55,^y,2=3654,V2740«52.3.
/=!i=l/=!
6.魔方,又叫鲁比克方块,通常意义下的魔方,即指三阶魔方,为3x3x3的正方体结
构,由26个色块组成.魔方竞速是一项手部极限运动,常规竞速玩法是将魔方打乱,然
后在最短的时间内复原.
(1)某魔方爱好者进行一段时间的魔方还原训练,每天魔方还原的平均速度y(秒)与训
练天数x(天)有关,经统计得到如下数据:
X(天)1234567
y(秒)99994532302421
现用y=a+2作为回归方程类型,请利用表中数据,求出该回归方程,并预测该魔方爱
X
好者经过长期训练后最终每天魔方还原的平均速度y约为多少秒(精确到1)?
184.50.370.55
参考公式:
对于一组数据(如匕),(的,©,…,(”",%),其回归直线/=&+加的斜率和截距的最
__
小二乘估计公式分别为:8=吟--------,a=v-pu.
Z»,2-«M2
/=1
(2)现有一个复原好的三阶魔方,白面朝上,现规定只可以扭动最外层的六个表面.某人
按规定将魔方随机扭动两次,每次均顺时针转动90。,记顶面白色色块的个数为X,求
X的分布列及数学期望E(X).
7.在疫情防控常态化的背景下,山东省政府各部门在保安全,保稳定的前提下有序恢
复生产,生活和工作秩序,五一期间,文旅部门在落实防控举措的同时,推出了多款套
票文旅产品,得到消费者的积极回应.下面是文旅部门在某地区推出六款不同价位的旅
游套票,每款的套票价格x(单位:元)与购买人数y(单位:万人)的数据如下表:
城市展馆齐鲁红冷山游园套观海套
旅游类别乡村特色游
科技游色游套票票票
套票价格X(元)394958677786
购买数量y(万人)16.718.720.622.524.125.6
在分析数据、描点绘图中,发现散点(匕,母)(14区6)集中在一条直线附近,其中
匕=InXj,?=Iny
(1)根据所给数据,求y关于x的回归方程;
(2)按照文旅部门的指标测定,当购买数量y与套票价格x的比在区间上,;]上时,该套
票受消费者的欢迎程度更高,可以被认定为“热门套票”,现有三位同学从以上六款旅游
套票中,购买不同的三款各自旅游.记三人中购买“热门套票'’的人数为X,求随机变量
X的分布列和期望.
6666
附:①可能用到的数据;\>。,=7532匕=246,>,=18.3,\>;=1014.
/=!<=1i=lr=l
②对于一组数据(匕,班),(彩,外),…,(匕,你),其回归直线治=加+&的斜率和截距的最小
〃
£4例-rivco
二乘估计值分别为B=鸟---------方=切-加
i=l
8.某研究所为了研究某种昆虫的产卵数y与温度x之间的关系,现将收集到的温度士和
一组昆虫的产卵数y1=1,2,…,6)的6组观测数据作了初步处理,得到如图的散点图及
一些统计数据.
薪90]
.80-
270-
60-
50-
40-
30-
20-
10-
0--
05101520253035
经计算得到以下数据:x=y.-j)=557,
6_26
之心-犬)=84,£(y-y)2
(1)若用线性回归模型来拟合数据的变化关系,求),关于x的回归方程§=必+%(结果
精确到0.1);
(2)若用非线性回归模型来拟合数据的变化关系,求得y关于X的回归方程y=O.O6e°23O3i,
且相关指数为R2=0.9672.
①试与(1)中的回归模型相比,用R2说明哪种模型的拟合效果更好;
②用拟合效果好的模型预测温度为35℃时该组昆虫的产卵数(结果四舍五入取整数).
附参考公式:对于一组具有线性相关关系的数据(%,.%),(%,力),……,优,券),其回归
直线),=区+4截距和斜率的最小二乘法估计公式分别为:
£(占-五)(为一刃Z(x-z)2
1=\________________9=亍-阮,相关系数:R2=1-参考数据:
EU-^)2
t=l1=1
8.0605会3167・
9.学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后的“自主学习”,包
括预习,复习,归纳整理等等,现在人们普遍认为课后花的时间越多越好,某研究机构
抽查了部分高中学生,对学生花在课后的学习时间(设为x分钟)和他们的数学平均成
绩(设为y)做出了以下统计数据,请根据表格回答问题:
X60708090100110120130
y92109114120119121121122
(1)请根据所给数据绘制散点图,并且从以下三个函数从①丫=法+";②
y=mxk(m>O,k>Oi):③y=«?+A+e三个函数中选择•一•个作为学习时间x和平均y
的回归类型,判断哪个类型更加符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出y与x的回归方程;
(3)请根据此回归方程,阐述你对学习时长和成绩之间关系的看法.
参考公式:回归方程y=6+R中斜率和截距的最小二乘估计公式分别为
^x^-nx-y
b=-〃------------,,aJ=y-bx.*
1=1
_______88
参考数据:Inx»4.52,Iny»4.74,In2x,.»164.18,InX,.Iny,.»171.64,e3-25«25.79
1=1<=l
10.当下,大量的青少年沉迷于各种网络游戏,极大地毒害了青少年的身心健康.为了
引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏,在内
测时收集了玩家对每一关的平均过关时间,如下表:
关卡X123456
平均过关时间y(单位:秒)5078124121137352
66
计算得到一些统计量的值为:Z%=28.5,»阳=106.05,其中,u.=In%.
/=lf=l
(1)若用模型y=ae"'拟合y与X的关系,根据提供的数据,求出y与X的经验回归方程;
(2)制定游戏规则如下:玩家在每关的平均过关时间内通过可获得积分2分并进入下一关,
否则获得T分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关
4
能在平均时间内通过的概率均为I,若甲玩一轮此款益脑游戏,求“甲获得的积分X”
的分布列和数学期望.
参考公式:对于一组数据(4%)(i=l,2,3,…其经验回归直线?=〃+4的斜率和
截距的最小二乘估计分别为5=号-------------,a=y-bx.
3;_位-2
<=1
11.为迎接2022年北京冬奥会,践行“更快更高更强”的奥林匹克格言,落实全民健身
国家战略.某校高二年级发起了“发扬奥林匹克精神,锻炼健康体魄”的年度主题活动,经
过一段时间后,学生的身体素质明显提高.
(1)为了解活动效果,该年级对开展活动以来近6个月体重超重的人数进行了调查,调查
结果统计如上图,根据上面的散点图可以认为散点集中在曲线y=e麻+"的附近,请根据
下表中的数据求出该年级体重超重人数)与月份x之间的经验回归方程(系数。和A的
最终结果精确到0.01),并预测从开展活动以来第几个月份开始该年级体重超标的人数
降至10人以下?
月份X123456
体重超标人数y987754483227
z=\ny4.584.373.983.873.463.29
(2)在某次足球训练课上,球首先由A队员控制,此后足球仅在A、B、C三名队员之间
传递,假设每名队员控球时传给其他队员的概率如下表所示:
控球队员ABC
接球队员BCAcAB
J_22J
概率
223333
若传球3次,记B队员控球次数为X,求X的分布列及均值.
附:经验回归方程:中,$=—;z-,a-y-H>x;
i=l
666
参考数据:Zz;=23.52,2彬=77.72,=91,In10=2.30.
r=li=li=l
12.2018年9月10日,全国教育大会在北京召开,习近平总书记在会上提出“培养德
智体美劳全面发展的社会主义建设者和接班人''.某学校贯彻大会精神,为学生开设了一
门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算
报名参加大赛.
(1)赛前,小明进行了一段时间的强化训练,加工完成一个模具的平均速度y(秒)与训练
天数x(天)有关,经统计得到如下表数据:
x(天)1234567
y(秒)990990450320300240210
经研究发现,可用y=a+2作为回归方程模型,请利用表中数据,求出该回归方程,并
X
预测小明经过50天训练后,加工完成一个模具的平均速度y约为多少秒?
(2)小明和小红拟先举行一次模拟赛,每局比赛各加工一个模具,先加工完成模具的人获
胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为(,已知在前3局中小明胜
2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.
参考数据:(其中(=')
77
tZd-7x产
/=1i=\
18450.370.55
参考公式:对于一组数据(如w),鱼,彩),…,(""#"),其回归直线e=a+的的斜率
-nu-v
和截距的最小二乘估计公式分别为夕=R---------,a=v-pu.
£u;-nu2
i=l
13.第24届冬奥会于2022年2月4日在北京市和张家口市联合举行,此项赛事大大激
发了国人冰雪运动的热情.某滑雪场在冬奥会期间开业,下表统计了该滑雪场开业第x
天的滑雪人数y(单位:百人)的数据.
天数代码X1234567
滑雪人数y(百人)11131615202123
(1)根据第1至7天的数据分析,可用线性回归模型拟合y与x的关系,请用相关系数加
以说明(保留两位有效数字);
(2)经过测算,若一天中滑雪人数超过3000人时,当天滑雪场可实现盈利,请建立y关
于x的回归方程,并预测该滑雪场开业的第几天开始盈利.
附注:参考公式:1>,=532£(占-可£(y-亍),57.5.
i=lV/=1/=!
参考公式:①对于一组数据(4,匕),(%,%),…,(〃”,5),其相关系数
V/=i/=i
②对于一组数据(4,匕),(〃2,彩),…,其回归直线y=a+E的斜率和截距的
祖匕-v)
最小二乘估计分别为:b=J-------,§=
(=1
14.数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9x9盘面上的已知数字,
推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3x3)内的数字均
含1—9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明在某数独4尸尸上进行一段时间的训练,每天的解题平均速度y(秒)与训练天
数x(天)有关,经统计得到如表的数据:
x(天)1234567
y(秒)990990450320300240210
现用y="+2作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过
X
50天训练后,每天解题的平均速度y约为多少秒?
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题
3
的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为《,已知在前3局
中小明胜2局,小红胜1局.若每局不存在平局,请你估计小明最终赢得比赛的概率.
参考数据(其中4='):
xi
7S7”7x广
4%t
,=|;=1
18450.370.555
参考公式:对于一组数据(%,匕),鱼,匕),…,其回归直线y=C+例的斜率
Zuivi-nu-v
和截距的最小二乘估计公式分别为:夕=等-------,a=v-(3-u.
i=\
15.1G和2G时代.我们的听觉得以随时随地的延伸,掏出手机拨通电话,地球那头的
声音近在咫尺.到了3G时代,我们的视觉也开始同步延伸,视频通话随时随地,一个
手机像一个小小窗口,面对面轻声闲聊笑眉如花,天涯若比邻.4G时代,我们的思想
和观念得以延伸,随时的灵感随时传上网,随手的视频随手拍和发,全球同步可读可转
可评,个人所有的思想和观点能够在全球的信息网络中延伸、保存、碰撞、交流,博客、
微博、微信朋友圈、抖音等等这些我们生活中极其常见的社交网络正是延伸与交流之
所.现在,5G的到来给人们的生活带来更加颠覆性的变革,某科技创新公司基于领先
技术的支持,5G经济收入在短期内逐月攀升,该创新公司在1月份至6月份的5G经济
收入y(单位,百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的
散点图.
收入〃百万元
月份X23456
收入y(百万元)6.68.616.121.633.341.0
(1)根据散点图判断,y=ax+b^y=c^(a,b,c,d均为常数)哪一个更适宜作为
5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该公司7月份的
5G经济收入;(结果保留小数点后两位)
(3)从前6个月的收入中随机抽取2个,求恰有1个月的收入超过20百万元的概率.
参考数据:
6_6-7
之(玉-幻2
2(巧7)(y-»«2.66
XyU产
<=!1=1»=i
3.5021.152.8517.50125.356.734.5714.30
其中,设"=lny,/=lny(i=l,2,3,4,5,6).
参考公式:对于一组具有线性相关关系的数据(x,/,)(i=l,2,3,L,〃),其回归直线
£=依+〃的斜率和截距的最小二乘估计公式分别为夕=上匕——Z—,a=v-px.
:(%-x)2
1
16.从2019年的11月份开始,新冠肺炎疫情逐渐在全球开始蔓延,目前,国内外疫情
防控形势仍严峻复杂.
(1)为有效控制疫情传播,需对特殊人群进行核酸检测,为提高检测效率,多采用混合检
测模式合1”“混采核酸检测是指:先将女个人的样本混合在一起进行1次检测,如果
这么个人都没有感染新冠病毒,则每人的检测结果均为阴性,检测结束;如果这女个人
中有人感染新冠病毒,则检测结果为阳性,此时需对每人再进行1次检测,得到每人的
检测结果,检测结束.现对100人进行核酸检测,假设其中只有2人感染新冠病毒,并
假设每次检测结果准确,若将这100人随平均分成20组,每组5人,且对每组都采用“5
合1”混采核酸检测试.求两名感染者不在同一组的概率.
(2)2021年12月来,西安市爆发了新冠局部疫情,受疫情影响,餐饮和旅游都受到了影
响.某网站统计了西安“蓬鲍面”在2022年1月7至11日的网络售量共单位:百件),
得到以下数据:
日期X7891011
销售量y(百件)1012111220
根据表中所给数据,用相关系数「加以判断,是否可用线性回归模型拟合y与x的关系?
若可以,求出y关于x之间的线性回归方程;若不可以,请说明理由.
参考数据:V10®3.162,
Sa-初一)
参考公式:相关系数厂=I「“.回归直线的方程是:y=bx+a,其中
V;=i<=i
一〃_
.2(%-丁)(%-刃Ex^-nxy
♦=『--------=母---------,a=y-bx.
£(%-可一一位2
;=1/=!
17.某西红柿种植户将一批西红柿批发给当地一家超市,超市根据西红柿的品质将其分
为一级品、二级品、和三级品,批发单价分别为6元/kg、5元/kg和4元/kg
(1)根据以往的经验,该种植户的西红柿为一级品、二级品和三级品的比例分别为
20%,50%,30%,估计这批西红柿的批发单价的平均值;
(2)为了对西红柿进行合理定价,超市对近5天的日销量),和单价若1=1,2,3,4,5)进行了
统计,得到一组数据如表所示:
销售单价匕(元/kg)56789
日销量%(kg)1501351109575
根据表中所给数据,用线性回归模型拟合y与x的关系,求出y关于尤的线性回归方程,
并预测当西红柿单价为12元/kg时,该超市西红柿的日销量.
参考公式:线性回归方程》=嬴+4中,B=吟------,a=y-bx.
*琴一〃厂
;=1
555
参考数据:»=565,2工/=3765,=255.
/=1r=li=1
18.随着全球经济一体化进程的不断加快,机械零件的加工质量决定了制造工厂的生存,
零件加工精度逐渐成为供应商判断制造公司产品的标准.已知某公司生产不同规格的一
种产品,根据检测精度的标准,其合格产品的质量y(g)与尺寸尤(mm)之间近似满
足关系式y=(b,C为大于。的常数).现随机从中抽取6件合格产品,测得数据如
下:
尺寸X(mm)384858687888
质量y(g)16.818.820.722.42425.5
根据测得数据作出如下处理:令匕=lnx,,%=ln%,得相关统计量的值如下表:
6666
A,
i=li=1i=\i=\
75.324.618.3101.4
(1)根据所给统计数据,求y关于x的回归方程;
(2)若从一批该产品中抽取"件进行检测,已知检测结果的误差%满足求
至少需要抽取多少件该产品,才能使误差J在(-0.1,0.1)的概率不少于0.9545?
附:①对于样本(匕,2,〃),其回归直线“=的斜率和截距的最小
Z(匕一")ZViUi~nV'U
二乘估计公式分别为:bT-----------=e---------—,a=u-bvife«2.7182.@
:=1i=l
X〜N(〃Q2),则P(|X—〃K2b)=0.9545
19.数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9x9盘面上的已知数字,
推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3x3)内的数字均
含1-9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与
训练天数x(天)有关,经统计得到如表的数据:
X(天)1234567
y(秒)990990450320300240210
现用y=a+2作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过
X
io。天训练后,每天解题的平均速度y约为多少秒?
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出
题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为金,已知在前3
局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.参考
1
数据(其中4=一)
%
77
it:-7xf
t1
1=11=1
18450.370.55
参考公式:对于一组数据(%,为),(〃2,匕),…,(%匕),其回归直线v=a+的的斜率
"___
和截距的最小二乘估计公式分别为:4二上厂——,a=v-pu.
Z-nu
/=1
20.某公司为了确定下一年度投入某种产品的宣传费用,需了解年宣传费x(单位:万
元)对年销量y(单位:吨)和年利润(单位:万元)的影响,对近6年宣传费x,和年
销售量》1=1,2,3,4,5,6)的数据做了初步统计,得到如下数据:
年份201620172018201920202021
年宣传费X(万元)384858687888
年销售量y(吨)16.818.820.722.424.025.5
经电脑模拟,发现年宣传费x(万元)与年销售量y(吨)之间近似满足关系式
y=力>0),即Iny=61nx+lna,对上述数据作了初步处理,得到相关的值如下
表:
666
lnxE(ln.v,)『
Z(lnx,・ln%)E(()E(lnx,
i=!»=|/=1/=|
75.324.618.3101.4
(1)从表中所给出的6年年销售量数据中任选2年做年销售量的调研,求所选数据中至多
有一年年销售量低于20吨的概率;
(2)根据所给数据,求y关于X的回归方程.
附:对于一组数据(如匕)、(%匕)、其回归直线□=&中的斜率和截距的
-nuv
最小二乘估计分别为尸=6---------'a=工-万晨
u-2-n-u2
E;=i
参考答案:
1000
1.(1)7=+30
x
⑵答案见解析
【分析】(1)通过令f=L,将问题转化为线性回归方程问题求解即可;
X
(2)根据得到的回归方程及实际政策回答即可.
(1)
由题意亍=;(891+888+351+220+200+138+"2)=400.
令,=,,设y关于,的线性回归方程为直线y=J+&
X
1586-7x0.37x400
则6二号-------=1000
*2-7X/0.55
*=1
则G=400-1000x0.37=30,
Ay=1000/+30,又/=,,
x
关于x的回归方程为丫=幽+30.
X
(2)
仅从现有统计数据所得回归方程了=咽+30,可发现当推广时间越来越长时,即x越来越
x
大时,y的值会逐渐降至接近于30,可知该省一直加大力度推广下去,网络诈骗举报件数大
概会逐渐降至30件.
但在使用经验回归方程进行预测时,方程只适用于所研究的样本总体,一般具有时效性,不
能期望回归方程得到的预报值就是响应变量的精确值,所以若加大力度一直推广下去,并随
着国家对网络诈骗的严厉打击和科技发展,再加上相关部门对个人信息防护手段的加强,人
们对网络诈骗犯罪的防范意识逐步提高,网络诈骗举报件数是有可能降至接近于零的.
2.(1))与x之间具有较强的线性相关关系
_,12220
a)y=—x+—
(3)估计该城镇2021年的国民生产总值40(亿元)
【分析】(1)根据题中数据和公式可以求得「“0.857,结合题意理解分析;(2)根据题中数
据和公式运算求解;(3)根据(2)中所求公式代入求解.
(1)
£20(巧-才)(凹-田
120120八。〃
题意知相关系数r二i=l-.=---n0.857
[20Tlo7,70x280140
Jia-)$(%-打
V1=11i=l
因为y与X的相关系数r满足|r|G[0.75,1],所以y与X之间具有较强的线性相关关系.
(2)
20
可(y,•-刃
12012
--------
;=1
。于心陋-以您=竺所以>马+型
•207207-77
(3)
由(2)可估计该城镇2021年的国民生产总值3=亍x5+寸=40(亿元).
3.(I)具有较高的线性相关程度
(2)^=6.4X+70.8,314万人
【分析】(1)由已知计算相关系数,•即可.
(2)由列表计算“、人可得线性回归方程进一步可得解.
(1)
5
由表中数据可得丁=3,歹=90,所以Z(%-丁产=1。,
<=!
又£(%-y)*12*=434,£(X,-x)(y,.-y)=64,
/=1i=l
5
£(玉-可(%-方64
所以r=7^-----------------=石石“°97>0,75,
J2—)妄(%-才回
V;=1/=1
所以该电商平台直播黄金时段的天数X与购买人数),具有较高的线性相关程度.
所以可用线性回归模型拟合人数y与天数X之间的关系.
(2)
.£5(七一丁)出一刃64
由表中数据可得6=上J-----------=—=6.4,
Z(iy10
r=l
贝!|&=歹一宸=90-6.4x3=70.8,所以y=6.4x+70.8.
令x=38,可得9=6.4x38+70.8=314(万人)
4.
X
(2)用反比例函数模型拟合效果更好,21元
【分析】(1)利用换元法,根据题中所给的公式进行求解即可;
(2)根据题中所给的相关系数公式,结合代入法进行求解即可.
(1)
令〃=,,则y=a+2可转化为〉=4+0”.
XX
8
因为一盲*360...
y=——=——=45
88
8
183.4-8x0.34x45
所以/;=/=1
1.53-8x0.115
—8w2
z=i
a==45-100x0.34=11,
得9=11+1(X)“,即y关于x的回归方程为$,=11+Ud.
X
(2)
由定义知y与L的相关系数为:
X
8
E一.61
「2==里=。99,
\归心犷品;一村70.61x6185.561.4
V/=!V/=1
则㈤<同,所以用反比例函数模型拟合效果更好.
当x=10时,5,=ll+-j^-=21(元),
则当产量为10千件时,每件产品的非原料成本为21元.
5.(l)r=0.993:相关系数较强;
(2)y=5.2x+10.4;10月该企业的产值约为41.6亿元
【分析】(1)利用表中数据求出,再由相关系数的求解公式即可求解.
(2)利用最小二乘法即可求解.
(1)
-1+2+3+4+5--16+20+27+30+37
=3,y=
442-5x3x26
«0.993
解2~~V55-5X9X73654-5X262V10XV274
~nxJZ%一〃y
因为Ms[0.75,1],所以y与X线性相关性较强.
(2)
设线性回归方程为:y=bx+a\
2-记442-5x3x26
/-I_______________________
55-5x9
a=y-1=26-5.2x3=10.4,
ERy=5.2x4-10.4,
10月份对应的代码为6,
y=5.2x6+10.4=41.6,
10月该企业的产值约为41.6亿元.
6.⑴,,=13+^^,13秒
(2)分布列见解析,—
【分析】(1)根据回归方程计算公式求得回归方程,进而求得预测值.
(2)结合古典概型的概率计算公式,求得分布列并求得数学期望.
(1)
由题意,根据表格中的数据,
—99+99+45+32+30+24+212
可得了==50,
Zzj-75•.区
184.5-7x0.37x50
可得3=/=1
/=1
所以<5=?一。三=50-100x0.37=13,
因此y关于x的回归方程为a=13+他,当x->+8时,手-13,
所以魔方爱好者经过长期训练后最终每天还原的平均速度y约为13秒.
(2)
由题可得随机变量X的取值为3,4,6,9,
所以X的分布列为:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肺结核服务规范
- (高清版)DB12 046.84-2011 产品单位产量综合能耗计算方法及限额 第84部分:聚苯乙烯发泡制品
- 网店美工与视觉设计 (第二版)电子教案
- 苏教版新课标数学八年级上册知识点总结
- 三年级数学(上)计算题专项练习附答案集锦
- 水溶液中的离子平衡知识点总结
- 安徽省部分地市2024-2025学年高一下学期开学检测语文试题(原卷版+解析版)
- 2025年河北省石家庄市第八十一中学中考一模化学试题(原卷版+解析版)
- 高效学习策略作业指导书
- 小学预防感染病
- 骨关节结核影像诊断教学课件
- 二年级上册美术教案及教学反思-3.7 美丽的叶子丨岭南版
- 心电监护操作评分标准
- 风机安装检验批质量验收记录1
- 二方审核计划
- 货币资金的清查方法课件
- 盘筑成型专题知识培训
- (完整版)CST使用教程
- Q∕SY 02098-2018 施工作业用野营房
- 山东大学毕业论文答辩通用ppt模板
- 天井施工方法及安全管理建议
评论
0/150
提交评论