(沪教版2020选修二)2022年上海高二数学同步讲义-第8章 成对数据的统计分析(压轴题专练)(学生版)_第1页
(沪教版2020选修二)2022年上海高二数学同步讲义-第8章 成对数据的统计分析(压轴题专练)(学生版)_第2页
(沪教版2020选修二)2022年上海高二数学同步讲义-第8章 成对数据的统计分析(压轴题专练)(学生版)_第3页
(沪教版2020选修二)2022年上海高二数学同步讲义-第8章 成对数据的统计分析(压轴题专练)(学生版)_第4页
(沪教版2020选修二)2022年上海高二数学同步讲义-第8章 成对数据的统计分析(压轴题专练)(学生版)_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8章成对数据的统计分析压轴题专练

出能力提升

一、单选题

1.(2022•全国•高三专题练习)设两个相关变量x和y分别满足%=i,y,=2i,i=l,

2,…,6,若相关变量x和丫可拟合为非线性回归方程£=22,则当x=7时,的估计值

为()

A.32B.63C.64D.128

二、填空题

2.(2022•全国•高三专题练习)有两个分类变量》和)',其中一组观测值为如下的2X2列

联表:

y%总计

*a15-a15

X220-a30+a50

总计204565

其中15-。均为大于5的整数,则〃=时,在犯错误的概率不超过0.01的前提下

n(ad-be1

为“X和y之间有关系”.附:K2

(a+6)(c+d)(a+c)(i»+d)

2

P(K>k)0.100.050.0250.0100.005

k2.7063.8415.0246.6357.879

三、解答题

3.(2020•全国•高二单元测试)习近平总书记在党的十九大报告中指出,要在“幼有所

育、学有所教、劳有所得、病有所医、老有所养、住有所居、弱有所扶”上不断取得新进

展,保证全体人民在共建共享发展中有更多获得感.现S市政府针对全市10所由市财政投资

建设的敬老院进行了满意度测评,得到数据如下表:

敬老院ABCDEFGHIK

满意度X(%)20342519262019241913

投资原y(万元)80898978757165626052

(1)求投资额y关于满意度x的相关系数;

(2)我们约定:投资额丫关于满意度x的相关系数『的绝对值在0.75以上(含0.75)是线性

相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则采取“末位淘汰”制

(即满意度最低的敬老院市财政不再继续投资,改为区财政投资).求在剔除“末位淘汰”

的敬老院后投资额N关于满意度x的线性回归方程(系数精确到0.1)

iorio

参考数据:元=21.9,歹=72.1,-10/=288.9,»37.16,

-10%-7=452.1,4288.9317.

附:对于一组数据(%,乂),(占,%),…,(乙,%),其回归直线£=%+&的斜率和截距的最小二乘

^y.-rix-y

估计公式分别为:$=个--------为=歹-宸.线性相关系数

4.(2021•广东•一模)在新冠肺炎疫情肆虐之初,作为重要防控物资之一的口罩是医务

人员和人民群众抗击疫情的武器与保障,为了打匾疫情防控阻击战,我国企业依靠自身强大

的科研能力,果断转产自行研制新型全自动高速口罩生产机,“争分夺秒、保质保量”成为

口罩生产线上的重要标语.

(1)在试产初期,某新型全自动高速口罩生产流水线有四道工序,前三道工序完成成品口

罩的生产且互不影响,第四道是检测工序,包括红外线自动检测与人工抽检.已知批次I的

成品口罩生产中,前三道工序的次品率分别为4=工,4=上.

①求批次I成品口罩的次品率Pl.

②第四道工序中红外线自动检测为次品的口罩会被自动淘汰,合格的口罩进入流水线并由工

人进行抽查检验.已知批次I的成品口罩红外线自动检测显示合格率为92%,求工人在流水线

进行人工抽检时,抽检一个口罩恰为合格品的概率(百分号前保留两位小数).

(2)已知某批次成品口罩的次品率为。(O<P<1),设100个成品口罩中恰有1个不合格品的

概率为9(p),记9(p)的最大值点为力,改进生产线后批次J的口罩的次品率Pi=P°.某医

院获得批次I,J的口罩捐赠并分发给该院医务人员使用.经统计,正常佩戴使用这两个批

次的口罩期间,该院医务人员核酸检测情况如下面条形图所示,求力,并判断是否有99.9%

的把握认为口罩质量与感染新冠肺炎病毒的风险有关?

附:心=______.

(a+6)(c+d)e+c)(6+d)

P(K2>k)0.0500.0100.0050.001

k3.8416.6357.87910.828

5.(2021•江西•景德镇一中高二期中)近年来我国电子商务行业迎来发展的新机

遇.2016年“618”期间,某购物平台的销售业绩高达516亿元人民币.与此同时,相关管理

部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对

其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做

出好评的交易为80次.

(1)选完成关于商品和服务评价的2x2列联表,再判断能否在犯错误的概率不超过0.001的

前提下,认为商品好评与服务好评有关?

(2)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对商品和服务全为好评

的次数为随机变量X:

①求对商品和服务全为好评的次数X的分布列;

②求X的数学期望和方差.

附临界值表:

尸(片训0.150.100.050.0250.0100.0050.001

k2.0722.7063.8415.0246.6357.87910.828

K2的观测值:%=由端潦E(其中…+g,+d)关于商品和服务评价的

2x2列联表:

对服务好评对服务不满意合计

对商品好评80

对商品不满意10

合计200

6.(2018•湖南株洲•一模(文))在党的第十九次全国代表大会上,习近平总书记指

出:“房子是用来住的,不是用来炒的”.为了使房价回归到收入可支撑的水平,让全体人

民住有所居,近年来全国各一、二线城市打击投机购房,陆续出台了住房限购令.某市一小

区为了进一步了解已购房民众对市政府出台楼市限购令的认同情况,随机抽取了本小区50

户住户进行调查,各户人平均月收入(单位:千元,)的户数频率分布直方图如下图:

其中,赞成限购的户数如下表:

人平均月

口,3)[3,5)[5,7)[7.9)[911)[11,13)

收入

赞成户数4912631

(D求人平均月收入在[9,13)的户数,若从他们中随机抽取两户,求所抽取的两户都赞成楼市

限购令的概率;

(2)求所抽取的50户的人平均月收入的平均数;

(3)若将小区人平均月收入不低于7千元的住户称为“高收入户”,人平均月收入低于7千元

的住户称为“非高收入户”.根据已知条件完成如图所给的2x2列联表,并说明能否在犯错

误的概率不超过0.01的前提下认为“收入的高低”与“赞成楼市限购令”有关.

非高收入户高收入户总计

赞成

不赞成

总计

附:临界值表

P(Kf)0.150.100.050.0250.0100.0050.001

k2.0722.7063.8415.0246.6357.87910.828

参考公式:K;两舞抵g

7.(2018•福建省福州格致中学高一单元测试)习近平总书记在十九大报告中指出,必须树

立和践行“绿水青山就是金山银山”的生态文明发展理念,这将进一步推动新能源汽车产业的迅

速发展.以下是近几年我国新能源乘用车的年销售量数据及其散点图:

年份20132014201520162017

年份代码X12345

新能源乘用车年

1.55.917.732.955.6

销量y(万辆)

酒5闻

4C-

*

X・

(I)请根据散点图判断,丫=依+6与¥=,/+1中哪一个更适宜作为年销售量y关于年份代码

X的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2018年我国新能源乘

用车的销售量(精确到0.1).

附:1.最小二乘法估计公式:

b---------,a=y-bt

E«-b2

f=l

W_25__5__

yZ(叱-w)Z(々-x)(y-y)Z(吗-M(y-y)

f=l1=11=1

22.72374135.2851.2

其中吗=x;

8.(2019•黑龙江•哈尔滨市第一中学校高二期末(文))某企业通过调查问卷的形式对本

企业900名员工的工作满意程度进行调查,并随机抽取了其中30名员工(16名女工,14名男工)

的得分,如下表:

女47363248344443474641434250433549

男3735344346363840393248334034

(1)根据以上数据,估计该企业得分大于45分的员工人数;

(2)现用计算器求得这30名员工的平均得分为40.5分,若规定大于平局得分为“满意”,否则

为“不满意”,请完成下列表格:

“满意”的人数“不满意”的人数合计

女员工16

男员工14

合计30

(3)根据上述表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提

下,认为该企业员工“性别”与“工作是否满意”有关?

参考数据:

P(K2>K)0.100.0500.0250.0100.001

K2.7063.8415.0246.63510.828

n^ad—bcy

(〃+b)(c+d)(a+c)(b+d)

9.(2021•辽宁沈阳•高三阶段练习)某中学为了解中学生的课外阅读时间,决定在该中

学的1200名男生和800名女生中按分层抽样的方法抽取20名学生,对他们的课外阅读时间进

行问卷调查.现在按课外阅读时间的情况将学生分成三类:A类(不参加课外阅读),B类

(参加课外阅读,但平均每周参加课外阅读的时间不超过3小时),C类(参加课外阅读,且

平均每周参加课外阅读的时间超过3小时).调查结果如下表:

A类B类C类

男生X53

女生y33

(I)求出表中x,y的值;

(II)根据表中的统计数据,完成下面的列联表,并判断是否有90%的把握认为“参加课外

阅读与否”与性别有关;

男生女生总计

不参加课外阅读

参加课外阅读

总计

(III)从抽出的女生中再随机抽取3人进一步了解情况,记X为抽取的这3名女生中A类人数

和C类人数差的绝对值,求X的数学期望.

n^ad-bcy

附:K?=)

(“+0)(c+"),+c)(b+d)

P(K2^k„)0.100.050.01

ko2.7063.8416.635

10.(【市级联考】江苏省上饶市“山江湖”协作体2018-2019学年高二上学期第三次月考

数学(文)试题)下表为某宝网站店主统计的月促销费用(万元)与月净利润(万元)数据表:

促销费用X2361013211518

月净利润y11233.5544.5

(1)根据数据绘制的散点图能够看出可用线性回归模型拟合与x的关系,请用相关系数,•加以说

明;(系数精确到001);

(2)建立y关于X的回归方程y=Bx+&(系数精确到0.01);如果该店主想月净利润超6万元,预测理

论上至少需要投入促销费用多少万元(结果精确到001).

参考数据:£(匕-11)(%-3)=74.5,火(%-11)2=340,£(¥-3)2=16.5,

iii

V340=18.44,、阳=4.06,其中如其分别为月促销费用和月净利润,,=1,2,3,...,8.

—为

参考公式:⑴样本(专》)(i=1,2,3...,")的相关系数「=屋’],.

用―一小一寸

⑵对于一组数据笫),其回归方程亍=晟+。的斜率和截距的最小二乘估计

A£♦一)(/-刃

分别为$=-------------,a=y-bx.

之GF

11.(2020•云南•罗平县第二中学高二期末)2018年8月16日,中共中央政治局常务委员会

召开会议,听取关于吉林长春长生公司问题疫苗案件调查及有关问责情况的汇报,中共中央总书

记习近平主持会议并发表重要讲话.会议强调,疫苗关系人民群众健康,关系公共卫生安全和国

家安全.因此,疫苗行业在生产、运输、储存、使用等任何一个环节都容不得半点瑕疵.国家规

定,疫苗在上市前必须经过严格的检测,并通过临床实验获得相关数据,以保证疫苗使用的安全

和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床实验,得到统计

数据如下:

未感染病毒感染病毒总计

未注射疫苗40PX

注射疫苗60qy

总计100100200

3

现从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为不

(1)求2x2列联表中的数据P,q,x,y的值;

(2)能否有99.9%把握认为注射此种疫苗有效?

(3)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取5只进行病例分析,然后从这

五只小白鼠中随机抽取3只对注射疫苗情况进行核实,求至少抽到2只为未注射疫苗的小白鼠的概

率.

n(ad-he)2

附:K2,n-a+b+c+d.

(a+b)(a+c)(c+d)(b+d)

P(K2>K„)0.050.010.0050.001

K。3.8416.6357.87910.828

12.(2022•全国•高三专题练习)某客户准备在家中安装一套净水系统,该系统为三级过

滤,使用寿命为十年.如图所示,两个一级过滤器采用并联安装,二级过滤器与三级过滤器

为串联安装.其中每一级过滤都由核心部件滤芯来实现,在使用过程中,一级滤芯和二级滤

芯都需要不定期更换(每个滤芯是否需要更换相互独立),三级滤芯无需更换,若客户在安

装净水系统的同时购买滤芯,则一级滤芯每个80元,二级滤芯每个160元.若客户在使用过程

中单独购买滤芯,则一级滤芯每个200元,二级滤芯每个400元,现需决策安装净水系统的同

时购滤芯的数量,为此参考了根据100套该款净水系统在十年使用期内更换滤芯的相关数据

制成的图表,其中图是根据200个一级过滤器更换的滤芯个数制成的柱状图,表是根据100个

二级过滤器更换的滤芯个数制成的频数分布表:

至三联出证三

'''''''-/■级—■智—

二级滤芯更换频数分布表:

二级滤芯更换的个数56

频数6040

以200个一级过滤器更换滤芯的频率代替1个一级过滤器更换滤芯发生的概率,以100个二级

过滤器更换滤芯的频率代替1个二级过滤器更换滤芯发生的概率.

M,|......

"他"I?1F讪鬻出幅芯的小故

(1)求一套净水系统在使用期内需要更换的各级滤芯总个数恰好为30的概率;

(2)记X表示该客户的净水系统在使用期内需要更换的一级滤芯总数,求X的分布列及数

学期望;

(3)记加,”分别表示该客户在安装净水系统的同时购买的一级滤芯和二级滤芯的个数.若

m+n=28,且〃e{5,6},以该客户的净水系统在使用期内购买各级滤芯所需总费用的期望值

为决策依据,试确定加,〃的值.

13.(2020•湖南师大附中高二阶段练习)在“新零售”模式的背景下,某大型零售公司为

推广线下分店,计划在S市的A区开设分店.为了确定在该区开设分店的个数,该公司对该市

已开设分店的其他区的数据作了初步处理后得到下列表格.记承示在各区开设分店的个

数,『表示这x个分店的年收入之和.

X(个)23456

y(百万元)2.5344.56

(D该公司经过初步判断,可用线性回归模型拟合y与x的关系,求y关于x的线性回归方程;

(2)假设该公司在A区获得的总年利润z(单位:百万元)与x,y之间满足的关系式为:

z=y-O.O5x2-1.85,请结合(1)中的线性回归方程,估算该公司应在A区开设多少个分店,

才能使A区平均每个分店的年利润最大?

附:回归方程§=鼠+》中的斜率和截距的最小二乘估计公式分别为:

"-时_-可(圻刃-—

b-「2一h-CTK'a一,一匕”•

一招',=1(七一工)

55

(参考数据:W>,X=885,ZX:=90)

1=1/=]

14.(2019•全国全国•高二专题练习(理))为研究质量x(单位:克)对弹簧长度N(单

位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:

X51015202530

y7.258.128.959.9010.911.8

(1)作出散点图并求线性回归方程;

(2)求出R2;

(3)进行残差分析.

15.(2020•安徽定远•高三阶段练习(文))某机构为了了解不同年龄的人对一款智能家

电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.

(I)设消费者的年龄为x,对该款智能家电的评分为孔若根据统计数据,用最小二乘法得

到y关于X的线性回归方程为y=1.2x+40,且年龄X的方差为f=14.4,评分y的方差为

s;=22.5.求y与x的相关系数r,并据此判断对该款智能家电的评分与年龄的相关性强弱.

(II)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为

,,好评”和“差评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评

价与年龄有关.

好评差评

青年816

中老年206

Z(x;-x)(y-y)

附:线性回归直线y=鼠+由的斜率分=3七——:-;相关系数

f(士7尸

(=1

_

Z®-x)(y-y)

n(ad-be)2

独立性检验中的片=其中

岳占々)2次(y-方(a+b)(a+c)(b+d)(c+d)

V/=1z=i

n=a+b+c+d.

临界值表:

P(K2>k0)0.0500.0100.001

k03.8416.63510.828

16.(2021•江西♦进贤县第一中学高二期中(文))近期,某公交公司分别推出支付宝和

微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引

越来越多的人开始使用扫码支付,某线路公交车队统计了活动刚推出一周内每一天使用扫码

支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),

绘制了如图所示的散点图:

y

232

203

174

145

116

87

58

29

Ox

(I)根据散点图判断在推广期内,了=〃+。》与丫=。小(C,d为为大于零的常数)哪一个

适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明

理由)

(II)根据(I)的判断结果求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人

次.

参考数据:

77

I。。*

XyV£片

r=l1=1i=\

4621.54253550.121403.47

|7

其中4=1g%,v=-^v,.

附:对于一组数据(外,匕),(“2,匕),…,(〃“,匕),其回归直线£=&+血,的斜率和截距的最小

,2%匕-“五

二乘估计分别为:8T--------,a=v-pii.

-nu'

1=1

17.(2020•河南郑州•高一学业考试)为利于分层教学,某学校根据学生的情况分成了

A,B,C三类,经过一段时间的学习后在三类学生中分别随机抽取了1个学生的5次考试成缎,

其统计表如下:

A类

第X次12345

分数y(满足150)145839572110

B类

第X次12345

分数y(满足150)85939076101

C类

第X次12345

分数y(满足150)8592101100112

(1)经计算已知A,B的相关系数分别为4=-0.45,4=0.25.,请计算出C学生的

(知》)(1=123,4,5)的相关系数,并通过数据的分析回答抽到的哪类学生学习成绩最稳定;

(结果保留两位有效数字,卜|越大认为成绩越稳定)

(2)利用(1)中成绩最稳定的学生的样本数据,已知线性回归直线方程为»=6.2*+石,利

用线性回归直线方程预测该生第十次的成绩.

力(若一切__.

附相关系数"nH而2-----一n,-------)7一,线性回归直线方程e=+

18.(2021•广东•高三专题练习)随着科学技术的飞速发展,网络也已经逐渐融入了人们

的日常生活,网购作为一种新的消费方式,因其具有快捷、商品种类齐全、性价比高等优势

而深受广大消费者认可.某网购公司统计了近五年在本公司网购的人数,得到如下的相关数

据(其中“尸1”表示2015年,“广2”表示2016年,依次类推;迷示人数):

X12345

y(万人)2050100150180

(1)试根据表中的数据,求出y关于*的线性回归方程,并预测到哪一年该公司的网购人数

能超过300万人;

(2)该公司为了吸引网购者,特别推出“玩网络游戏,送免费购物券”活动,网购者可根

据抛掷骰子的结果,操控微型遥控车在方格图上行进.若遥控车最终停在“胜利大本营”,

则网购者可获得免费购物券500元;若遥控车最终停在“失败大本营”,则网购者可获得免

费购物券200元.已知骰子出现奇数与偶数的概率都是方格图上标有第。格、第1格、第2

格、…、第20格。遥控车开始在第0格,网购者每抛掷一次骰子,遥控车向前移动一次.若掷

出奇数,遥控车向前移动一格(从k到左+1)若掷出偶数遥控车向前移动两格(从人到

么+2),直到遥控车移到第19格胜利大本营)或第20格(失败大本营)时,游戏结束。设遥

控车移到第格的概率为试证明{月-E-}是等比数列,并求网购者参与游戏一

次获得免费购物券金额的期望值.

工士必一疝y

附:在线性回归方程》=治+4中,$7--------,a=y-bx.

打;-旅

r=l

19.(2020•河北•正定中学高三阶段练习(文))某企业为确定下一年度投入某种产品的

生产所需的资金,需了解每投入2千万资金后,工人人数单位:日人)对年产能丫(单位:千

万元)的影响,对投入的人力和年产能的数据作了初步处理,得到散点图和统计量表.

T

Z(x,-x-l^x,-x)(lny,.-

XyIny)£A-x)(y

Xi=lZ=1a=l

5.8223.6E-0.15,11.07732827.87150.80-55.74126.56

人力xOTA)

u

(1)根据散点图判断:y=a+〃nx与y=er哪一个适宜作为年产能y关于投入的人力X的回

归方程类型?并说明理由?

(2)根据(I)的判断结果及相关的计算数据,建立y关于X的回归方程;

(3)现该企业共有2000名生产工人,资金非常充足,为了使得年产能达到最大值,则下一

年度共需投入多少资金(单位:千万元)?

附注:对于一组数据(S"),G冉),…,⑸乩),其回归直线,=加+。的斜率和截距的最小

2(S,-S)(Db

二乘估计分别为方=上七——:—,a=t-bs,(说明:/*)=}”的导函数为八外=心匚)

X(s,-s)2/

j=l

20.(2019•湖南•长沙一中高二阶段练习)2018年11月5日至10日,首届中国国际进口博

览会在国家会展中心(上海)举行,吸引过来58个“一带一路”沿线国家的超过1000多家企

业参展,成为共建“一带一路”的又一个重要支撑。某企业为了参加这次盛会,提升行业竞

争力,加大了科技投入;该企业连续6年来得科技投入x(百万元)与收益y(百万元)的数

据统计如下:

科技投入工24681012

收益y5.66.512.027.580.0129.2

根据散点图的特点,甲认为样本点分布在指数曲线y=c-2府的周围,据此他对数据进行了一

些初步处理,如下表:

y5〉/(x,—x)(y—y)2(%-F)」

.।■1

43.54.5854.034.712730.470.0

其中z,=log2»,_

z-----

6

(1)(i)请根据表中数据,建立y关于x的回归方程(保留一位小数);

(”)根据所建立回归方程,若该企业想在下一年的收益达到2亿,则科技投入的费用至少

要多少(其中1。区522.3)?

(2)乙认为样本点分布在二次曲线>=,〃/+”的周围,并计算得回归方程为

y=0.92/_12.0,以及该回归模型的相关指数收=0.94,试比较甲乙两位员工所建立的模

型,谁的拟合效果更好.

附:对于一组数据(4,匕),(…),……(”"%),其回归直线方程丫=。+例的斜率和截距的

^(W,.-i7)(v,.-v)Z(v,-v,)'

最小二乘估计分别为6=口----------,a=v-pu,相关指数:R』T---------

£(%+万)f(匕一叼

1=1i=)

21.(2021•全国•高二单元测试)B/河指数是用体重公斤数除以身高米数的平方得出的数

字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而

言,当数值大于或等于20.5时,我们说体重较重,当数值小于20.5时,我们说体

重较轻,身高大于或等于17氏、加我们说身高较高,身高小于170cm我们说身高较矮.

BMI指数

22.5•

**

21.5••

*

•••«*

20.5

・・..•••

•••*

19.5*•

18S

50160170180190

(1)已知某高中共有32名男体育特长生,其身高与指数的数据如散点图,请根据所得

信息,完成下述列联表,并判断是否有95%的把握认为男生的身高对BMZ指数有影响.

身高较矮身高较高合计

体重较轻

体重较重

合计

(2)①从上述32名男体育特长生中随机选取8名,fW身高和体重的数据如表所示:

编号12345678

身高(“I)X166167160173178169158173

体重/g)y5758536166575066

根据最小二乘法的思想与公式求得线性回归方程为y=O.8x-75.9.利用已经求得的线性回归

方程,请完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保

留两位有效数字)R2;

编号12345678

体重/g)y5758536166575066

残差20.10.30.9-1.5-0.5

②通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否

有人为的错误,已知通过重新采集发现,该组数据的体重应该为58(版).请重新根据最最小

二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.

(参考公式)

犬2=1-告W,-~~'a=y-bx,et=yt-bx.-a,

Z(Z-.V)f(x,T)£x;-nx

1=1»=11=1

n(ad-bc)2

,(〃=a+〃+c+d).

(4+b)(c+d)(a+c)(b+d)

(参考数据)

ZX”=78880,2=226112,5=168,7=58.5,-yf=226.

i=ln=li=l

P(K.人)0.100.050.010.005

ko2.7063.8116.6357.879

22.(2021•江苏•扬州中学高一阶段练习)某企业新研发了一种产品,产品的成本由原料

成本及非原料成本组成.每批产品的非原料总成本丫(元)与生产该产品的数量工(千件)

有关,经统计得到如下数据:

Xi234567

y611213466101196

观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型丫=。+9nx和指数函数

模型y=分别对两个变量的关系进行拟合.

(1)根据散点图判断,y=a+〃nx与y=c•.优(c,4均为大于零的常数)哪一个适宜作为

非原料总成本y关于生产该产品的数量x的回归方程类型;(给出判断即可,不必说明理

由)

(2)根据(1)的判断结果及表1中的数据,建立y关于x的回归方程;

(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多

能生产多少千件产品.

参考数据:

100.54

yV

»=1

62.141.54253550.123.47

]〃

其中匕=igy,.

/;=1

参考公式:对于一组数据于,K),参学),…,D其回归直线”&+血,的斜率和截距

n

2%匕-nuv

的最小二乘估计公式分别为/=七--------,a=v-fiu.

-nu2

23.(2021•湖南株洲•二模)某公司研发了一种帮助家长解决孩子早教问题的萌宠机器

人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝

的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教

育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎.为了更好

地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产

品),统计其性能指数并绘制频率分布直方图(如图1):

产品的性能指数在[50,70)的适合托班幼儿使用(简称4类产品),在[70,90)的适合小班和中

班幼儿使用(简称麽产品),在[90,110]的适合大班幼儿使用(简称於产品),A,B,C,

三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位

于各区间的频率代替产品的性能指数位于该区间的概率.

(1)求每件产品的平均销售利润;

(2)该公司为了解年营销费用工(单位:万元)对年销售量y(单位:万件)的影响,对近

5年的年营销费用升,和年销售量y,(i=L2,3,4,5)数据做了初步处理,得到的散点图(如图

2)及一些统计量的值.

5

口一祖q-u)火")2

1=1i=\1=1/=1

16.3024.870.411.64

表中/=lnx;,L>,.=Iny;,=.

〉i=l3i=l

根据散点图判断,y=可以作为年销售量y(万件)关于年营销费用x(万元)的回归

方程.

(7)建立y关于X的回归方程;

(/n用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最

大?

(收益=销售利润-营销费用,取/3=64).

参考公式:对于一组数据3得),(〃2,。21,(%%),其回归直线。=。+"的斜率和截距的最

小二乘估计分别为£=———二一,a=u-^.

/=l

24.(2021•河北•正定中学高二阶段练习)爱心蔬菜超市为确定某种蔬菜的日进货量,需

了解日销量丫(单位:kg)随上市天数x的变化规律.工作人员记录了该蔬菜上市10天来的

日销量必与上市天数天"=1,2,…,1。)的对应数据,并对数据做了初步处理,得到如图的散点

图及一些统计量的值:

1010101021()10

*£(%-可£

<=11=1i=\<=1t=l1=1i=l

55155.515.182.54.8494.924.2

表中4=Inx,(i=1,2,…,10).

yk日销量,kg..♦•

0_,_,_I_I__!_I__I_I_I_>->►x

12345678910天数

(1)根据散点图判断丫="+区与y=c+dlnx哪一个更适合作为日销量y关于上市天数x的回

归方程(给出判断即可,不必说明理由)?

(2)根据(1)中的判断结果及表中数据,求日销量y关于上市天数的回归方程,并预报上

市第12天的日销量.

附:①ln2=0.7,In3nl.1.

②对于一组数据(4yj,区为),…,(%,,”),其回归直线中的斜率和截距的最

小二乘估计分别为:y-t>x.

为”丫

1=1

25.(2020•重庆南开中学高三阶段练习)下面给出了根据我国2012年〜2018年水果人均占

有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年〜2018年

的年份代码x分别为1〜7).

我国1012〜2018年水果人均占有量散点图

年份代码*

我国1012〜2018年水果人均占有量残差图

2

10,।(1)根据散点图说明y与x之间的

泉[01234567

-1---------------------------------------------------------

*

一2反桥枝嬴-"

相关关系(线性正相关、线性负相关或无相关关系);

(2)根据散点图相应数据计算得£必=1071,£占y=4508,求y关于x的线性回归方程;

/=1»=1

(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.

附:回归方程了=〃+标中斜率和截距的最小二乘计公式分别为:

Js

b=\i--------------,a=y-bx,

E/=1")

26.(2020•河北省盐山中学高二期末)某个地区计划在某水库建一座至多安装3台发电机

的水电站,过去50年的水文资料显示,水的年入流量X(年入流量:一年内上游来水与库区

降水之和,单位:十亿立方米)都在4以上,其中,不足8的年份有10年,不低于8且不超过

12的年份有35年,超过12的年份有5年,将年入流量在以上三段的频率作为相应段的概率,

并假设各年的年入流量相互独立.

(1)求未来4年中,至多有1年的年入流量超过12的概率;

(2)若水的年入流量X与其蕴含的能量了(单位:百亿万焦)之间的部分对应数据为如下

表所示:

年入流量X681012

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论