专题52统计案例_第1页
专题52统计案例_第2页
专题52统计案例_第3页
专题52统计案例_第4页
专题52统计案例_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题52统计案例

【题型归纳目录】

题型一:变量间的相关关系

题型二:线性回归

题型三:非线性回归

题型四:独立性检验

题型五:误差分析

【考点预测】

知识点一、变量间的相关关系

1、变量之间的相关关系

当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于

相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收

集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.

注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,

而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.

2、散点图

将样本中的〃个数据点(毛,凹.)(,=1,2,…描在平面直角坐标系中,所得图形叫做散点图.根据散点图

中点的分布可以直观地判断两个变量之间的关系.

(1)如果散点图中的点散布在从左下角到右上角的区域内:对于两个变量的这种相关关系,我们将它

称为正相关,如图(1)所示;

(2)如果散点图中的点散布在从左上角到右下角的区域内:对于两个变量的这种相关关系,我们将它

称为负相关,如图(2)所示.

(I)(2)

3、相关系数

若相应于变量X的取值W,变量),的观测值为丫.(Iqy〃),则变晟.,与y的相关系数

〃__n_

Z(E-x)(y-y)-〃抄

/•=「=一,通常用,•来衡量k与y之间的线性关系的强弱,r

的范围为TW/W1.

(1)当厂>0时,表示两个变量正相关:当尸v0时,表示两个变量负相关.

(2)卜|越接近i,表示两个变审的线性相关性越强;卜|越接近o,表示两个变量间几乎不存在线性相

关关系.当|”=1时,所有数据点都在一条直线上.

(3)通常当川>0.75时,认为两个变量具有很强的线性相关关系.

知识点二、线性回归

1、线性回归

线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.

对于一组具有线性相关关系的数据(制,“),(念,以),…,(•%”)3,其回归方程),=/»+〃的

求法为

〃__〃__

Z(x,-X)(y.-y)^X,y^nxy

b=J---------——...........—

£(七7)2次

i=l/=l

a=y-bx

其中,x="!•£%.,y=-Xy,»(x,y)称为样本点的口心.

〃/=i

2、残差分析

对于预报变量y,通过观测得到的数据称为观测值£,通过回归方程得到的),称为预测值,观测值减

去预测值等于残差,自称为相应于点(七,£)的残差,即有自=¥「1•・残差是随机误差的估计结果,通过对

残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差

分析.

(1)残差图

通过残差分析,残差点(冷日)比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这

样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.

(2)通过残差平方和。=£(M-力)2分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;

/=1

反之,不合适.

(3)相关指数

£(X_”2

用相关指数来刻画回归的效果,其计算公式是:♦=]_?」’.

Z(z--y)2

r=l

户越接近于1,说明残差的平方和越小,也表示回归的效果越好.

知识点三、非线性回归

解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线

性回归方程化归转化为我们熟悉的线性回归方程.

求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原

后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.

1、建立非线性回归模型的基本步骤:

(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;

(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);

(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二

次函数、指数函数、对数函数、号函数模型等);

(4)通过换元,将非线性回归方程模型转化为线性回归方程模型:

(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;

(6)消去新元,得到非线性回归方程;

(7)得出结果后分析残差图是否有异常.若存在异常,则殓查数据是否有误,或模型是否合适等.

知识点四、独立性检验

I、分类变量和列联表

<1)分类变量:

变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表:

①定义:列出的两个分类变量的频数表称为列联表.

②2x2列联表.

一般地,假设有两个分类变量X和匕它们的取值分别为{川,戈2}和{),1,),2),其样本频数列联表(称

为2x2列联表)为

>1为总计

aba+b

工2Cdc+d

总计a+cb+da+b+c+d

从2x2列表中,依据,—与二—的值可直观得出结论:两个变量是否有关系.

a±bc+d

2、等高条形图

(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示

列联表数据的频率特征.

(2)观察等高条形图发现,-与工相差很大,就判断两个分类变量之间有关系.

a+bc+d

3、独立性检验

(1)定义:利用独立性假设、随机变量Y来确定是否有定把握认为“两个分类变量有关系”的方法

称为两个分类变量的独立性检验.

⑵公式:…一屋鬻露…,其中…+F+”为样本容量.

(3)独立性检验的具体步骤如下:

①计算随机变量K2的观测值3查下表确定临界值勺:

尸(片次)0.50.400.250.150.100.050.0250.0100.0050.001

k。0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果上2々0,就推断“X与V有关系”,这种推断犯错误的概率不超过〃(六2&);否则,就认为在犯

错误的概率不超过〃(尺22片)的前提下不能推断“X与丫有关系”.

(2)两个分类变量x和y是否有关系的判断标准:

统计学研究表明:

当K2K3.841时,认为X与y无关;

当六>3.841时,有95/的把握说X与y有关;

当六>6.635时\有99/的把握说X与V有关;

当犬>10.828时,有99.9/的把握说X与V有关.

【方法技巧与总结】

常见的非线性回归模型

(1)指数函数型y=c优(。>0且1,c>0)

两边取自然对数,lny=ln(cav),即Iny=lnc+xlna,

令P'7",原方程变为y,=lnc、+flna,然后按线性回归模型求出Ina,Inc.

x=x

(2)对数函数型),=Z?lnx+a

令=:,原方程变为y'=〃x'+。,然后按线性回归模型求出〃,〃.

x=Inx

(3)寻函数型)、=办"

两边取常用对数,lgy=lg(ar"),即Igy=〃lgx+lga,

令,原方程变为P'=/*+lg。,然后按线性回归模型求出〃,Iga.

X=IgA:

(4)二次函数型),=>「+〃

令卜:=5,原方程变为>'=法'+。,然后按线性回归模型求出力,a.

x=

(5)反比例函数型),=〃+2型

x

y,=y

令,1,原方程变为>'=区'+。,然后按线性回归模型求出力,a.

x=—

X

【题型归纳目录】

题型一:变量间的相关关系

题型二;线性回归

题型三:非线性回归

题型四:独立性检验

题型五:误差分析

【典例例题】

题型一:变量间的相关关系

例1.(2022・上海嘉定・高三阶段练习)通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利

店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导

致了疾病:丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断

哪位成员的意见最可能成立()

A.甲B.乙C.丙D.T

【答案】D

【解析】当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,但相关关系

是一种非确定性关系,相关关系不等于因果关系,丁的意见最可能成立.

故选:D.

例2.(2022.四川.成都七中高三阶段练习(理))某统计部门对四组数据进行统计分析后,获得如图所示的

散点图.

35

3530

3025

2520

2015

15I0

105

50

0

51015202530355101520253035

相关系数为勺相关系数为,2

3535

3030

2525

2020

1515

1010

55

0

5101520253035

相关系数为勺相关系数为々

下面关于相关系数的比较,正确的是()

A.r,</;</;<B.r2<r4<r]<r3C.r2<rA<r3<rxD.r4<r2<r3<rt

【答案】C

【解析】由图可知:々/所对应的图中的散点呈现正相关,而且5对应的相关性比G对应的相关性要强,

故0<4<*aG所对应的图中的散点呈现负相关,且根据散点的分布情况可知4<。,因此

4<G”4,

故选:C

例3.(2022・上海交大附中高三阶段练习)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有

所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽

样的方法抽取20个作为样区,调查得到样本数据(4y)(i=l,2,,20),其中巧和H分别表示第,个样区的

2020

植物覆盖面积(单位:公顷)和这种野生动物的数量(单位:头),并计算得£玉=60,Z)'i=1200,

i=Ir=l

2020_220__

2卜7)=80,£(M—.V)=9000,—y)=800.

r=li=l

⑴估计该地区这种野生动物的数最;

⑵求样本(4y)(i=l,2,,20)的相关系数.(精确到)

120I

y=—yyr.=—x1200=600

【解析】(1)由已知得样本平均数20鹏20,

从而该地区这种野生动物数量的估计值为20x600=12000.

Z177)--802L(>7->-)2-90002卜;-K)(y-y)-800

(2)由I,*->,*->,

可得样本(七,.%)"=12,20)的相关系数为

20

Z(x,7)(y—F)

8008002&…

—_________—______-____、()94

2020-780x9000-60072~3

一寸

i=l;=l

变式1.(2022.陕西・宝鸡市陈仓高级中学高三开学考试(理))对两个变量x,y进行线性相关检验,得线性

相关系数门=,对两个变量〃,-进行线性相关检验,得线性相关系数/2=-,则下列判断正确的是()

A.变量x与),正相关,变量〃与I,负相关,变量工与),的线性相关性较强

B.变量x与),负相关,变量〃与】,正相关,变量x与y的线性相关性较强

C.变量x与),正相关,变量〃与U负相关,变量〃与u的线性相关性较强

D.变量x与),负相关,变量〃与u正相关,变量〃与u的线性相关性较强

【答案】C

【解析】依题意:[=0.8995历=-0.9568,

所以x,y正相关,〃〜负相关,

间<用<1,所以〃力的线性相关性较强.

故选:C

变式2.(2022・全国•高三专题练习)甲、乙、丙、丁四位同学各自对尤丁两变量的线性相关性做试验,分别求

得样本相关系数小如下表:

甲乙丙T

/•0.20-0.95-0.120.85

则试验结果中元),两变量有更强线性相关性的是()

A.甲B.乙C.丙D.丁

【答案】B

【解析】由已知,乙的相关系数的绝对值为|r|=“95,是四人中最大的,因此乙同学有更强的相关性.

故选:B.

变式3.(2022•江苏・南京市第一中学高三阶段练习)某网络电视剧已开播一段时间,其每口播放量有如下统

计表:

开播天数工(单

12345

位:天)

当天播放量),

(单位:百万335910

次)

(1)请用线性回归模型拟合),与工的关系,并用相关系数加以说明;

(2)假设开播后的两周内(除前5天),当天播放量),与开播天数x服从(I)中的线性关系.若每百万播放量

可为制作方带来万元的收益,且每开播一天需支出1万元的广告费,估计制作方在该剧开播两周内获得的

利润.

方(内-可(凹-田°汽住-三)(另一刃,

r,=,

参考公式;=In------------------上J--------------;—,a=y-bx.

心(为-,)2曲-丫

555____

参考数据:^xiyi=110,2X=55,=224,Vi~i0-10.5.

1=1r-l/=!

注:①一般地,相关系数r的绝对值在以上(含)认为线性相关性较强;否则,线性相关性较弱.②利润=

收益一广告费.

-|-1

x=-(l+2+3+4+5)=3,y=-(3+3+5+9+10)=6

【解析】(1)由题得5•5

£(—)(一)

6+3+3+8

所以〃二------------

£(%一可2(1-3)2+(2-3)2+(4-3)2+(5-3)2

所以力=》一位=6—2x3=0.

所以线性回归方程为y=2r.

£(%-可(另一到

20_10、10

相关系数”式许»0.952>0.95

x/10xx/44-x/Ho10.5

所以每日的播放量和开播天数线性相关性较强.

(2)设利润为〃,则〃=[30+2(6+7+8+9+10+11+12+13+14)卜0.7-14=133

所以估计制作方在该剧开播两周内获得的利润为133万元..

答:估计制作方在该剧开播两周内获得的利润为133万元..

题型二;线性回归

例4.(2022•重庆南开中学高三阶段练习)重庆位于北半球亚热带内陆地区,其气候特征恰如几句俗谚:春

早气温不稳定,夏长酷热多伏旱,秋凉绵绵阴雨天,冬暖少雪云雾多.尤其是10月份,昼夜温差很大,某

数学兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了2021

年10月某六天的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:

日期第一日第三日第五日第四日第二日第六日

昼夜温差X(℃)47891214

就诊人数〉(个)X%>14儿

其中:yeN*,』,2,3,4,5,6,参考数据:£>7=2658,£(另一丁=258,7258«16.

⑴根据散点图可以认为x与)'之间存在线性相关关系,且相关系数,•==,请用最小二乘法求出线性回归

方程y=+a(a,用分数表示);

(2)分析数据发现:第六日就诊人数%=30,第一日就诊患者中有3个小孩,其他患者全是大人,现随机的

Q

从第一日所有就诊患者中选出2人,若2人中至少有一个小孩的概率为会;

①求M的值;

②若%<%<”<%,求%,为,筋,乃的值(只写结果,不要求过程).

Z(y-J=258

【解析】(1)因为",

2

所以靖+%2+…+y6-2(x+%+…+乂)y+6.F=258,

6_

因为=2658,y+%+…+)k=6)3

21

所以2658—129+6^=258,得不=20,

-1

因为x=-x(4+7+8+9+12+14)=9,

6

所以之(毛=(4-9)2+(9-9)2+L+(14_9y=64,

127八2。-二9=也

所以〃手,

6464

即线性回归方程上瑞力胃

⑵①由题意可得:2人中至少有一个小孩的概率为%15,得:4才-49,+90=0

9

所以y=10或y=*(舍)

②由⑴得亍=20,

因为M-10,y6-30,

所以10+%+,3+尤+)'5+3。=120,得必+),3+居+为=8().

因为Z.V;=2658,

/-I

所以100+必2+W+H+W+900=2658,

所以W+W+y;+>52=1658,

因为必,必,乂,兑€N",y2<y3<y4<y5,

所以X=15,)3=18,j4=22,y5=25.

例S.(2022•全国•高三专题练习)已知X,丁的取值如表:

X0134

ya

若x,具有线性相关关系,且回归方程为3=0.95X+2.6,贝心=.

【答案】2.2

【解析】将X=——-——=Zy=---------------=---代入回归方程为y=0.95x+2.6,可得

444

空泗=4.5=4=22,应填答案2.2.

例6.(2022•河北衡水•高三阶段练习)已知一组样本数据(为,乂),(为均,…,(玉,%)(〃22,芯,演,…,

互不相等),若这组数据的样本相关系数为-1,则在这组样本数据的散点图中,所有样本点(£,y)(;=1,

2,…,〃)所在的曲线可能是()

A.y=-2x+3B.y=x+3C.y=-x2+3D.y=«+3

【答案】A

【解析】样本相关系数「的绝对值越接近于1,样本数据的散点图越接近于•条直线.因为该组数据的样本

相关系数〃=-1,故样本数据呈负相关,所以所有样本点(七,y)(i=l,2,…,〃)所在的曲线可能在直线

y=-2x+3上,

故选:A.

变式4.(2022.仝国.高三专题练习(文))给出下列说法:①回归直线§,=八+右恒过样本点的中心正5),

且至少过一个样本点;②两个变量相关性越强,则相关系数1川就越接近1;③将一组数据的每个数据都加

一个相同的常数后,方差不变;④在回归直线方程亍=2-0.5%中,当解释变量1增加一个单位时,预报变量

》平均减少个单位.其中说法正确的是()

A.①②®B.②®®C.①③④D.②④

【答案】B

【解析】对于①中,回归直线$,=最+4恒过样本点的中心丘,亍),但不一定过一个样本点,所以不正确;

对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,所以是正确的;

对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所

以是正确的:

对于④中,根据回归系数的含义,可得在回归直线方程3=2-0.5X中,当解释变量x增加一人单位时,预

报变量贫平均减少个单位,所以是正确的.

故选:B.

变式工(2022.全国•高三专题练习)对于数据组(七,),,.)«=1,2,3,…,〃),如果由线性回归方程得到的对应于自

变量者的估计值是先,那么将y-y.称为相应于点(七,£)的残差.某工厂为研究某种产品产量x(吨)与

所需某种原材料了吨)的相关性,在生产过程中收集4组灼应数据(尤力如下表所示:

X3456

y34ni

根据表中数据,得出)关于x的线性回归方程为y=0.7x+a,据此计算出样本点(4,3)处的残差为一,则

表中加的值为()

A.B.C.5D.

【答案】B

【解析】由题意可知,在样本(4,3)处的残差一,则y=3.15,即3.15=0.71+〃,

解得〃=0.35,即y=0.7x+0.35,

-3+4+5+6

又”=:=4.5,且线性方程过样本中心点(工,于),

4

mi—八,门1―2・5+3+4+"z今「

贝ljv=().7X4.5+().35=3.5,则y=--------------------=3.5,

4

解得〃?=45

故答案为:B

变式6.(2022・全国•高三专题练月)已知两个变量%和N之间有线性相关关系,经调查得到如下样本数据,

X34567

y

根据表格中的数据求得同归方程»=几+6,则下列说法正确的是()

A.«>0,Z?>0B.«>0,/?<0

C.«<0,b>0D.a<0,b<0

【答案】B

【解析】由已知数据,可知》随着工的增大而减小,

则变量工和变量y之间存在负相关的关系,二〃<o,

当”=0时,则a=y>3.5>0,

即:a>0,b<0.

故选:B.

变式7.(2022・全国•高三专题练习)为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验

数据:

天数X(天)3456

繁殖个数)’(千个)34

由最小二乘法得V与x的线性回归方程为a=0.7x+2,则当x=7时,繁殖个数V的预测值为()

A.B.

C.D.

【答案】B

-3+4+54-69-25+3+4+457

【解析】由题意,根据表格中的数据,可得X;

9779

即样本中心为弓,5),代入回归直线方程»=0.7x+/BP^=0.7x|+«,

解得a=0.35,BP回归直线的方程为>'=0.7x+0.35,

当工=7时,>-=0.7x7+0.35=5.25,故选B.

变式8.(2022•北京师大附中高三阶段练习(文))为了规定工时定额,需要确定加工某种零件所需的时间,

为此进行了5次试验,得到5组数据:(内/),小,%),(七,)’3),(4”),(0%),由最小二乘法求得回归直线

方程为),=0.67x+54.9・若已知玉十期+$+~+%=150,则y十%十)3+X+K=

A.75B.155.4C.375D.466.2

【答案】C

一150

【解析】由题意,可得x=(=30,代入回归直线的方程,可得»=0.67x30+54.9=75,

所以y+义+、3+尤+*=5X$,=375,故选C.

变式9.(2022•广东•顺德-中高三阶段练习)据一组样本数据(不'),(乙,为),…,(天,”),求得经验回归

方程为S,=1.5x+0.5,且;=3.现发现这组样本数据中有两个样本点(122.2)和(4.8,7.8)误差较大,去除后

重新求得的经验回归直线/的斜率为,则()

A.去除两个误差较大的样本点后,)'的估计值增加速度变快

B.去除两个误差较大的样本点后,重新求得的回归方程一定过点(3,4)

C.去除两个误差较大的样本点后,重新求得的回归方程为5=L2x+1.4

D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为

【答案】C

【解析】对A,因为1.5>1.2,所以去除两个误差较大的样本点后y的估计值增加速度变慢,放A错误;

对B,当7=3时,7=3XL5+O.5=5,设去掉两个误差较大的样本点后,横坐标的平均值为■纵坐标的

平均值为7,

则7=%+*+…+/-6=口=3,y=yl+y2+-+X,-10=5H-10=5>故B错误;

fi-2n-2n-2n-2

对C,因为去除两个误差较大的样本点后,重新求得回归直线/的斜率为,

所以5=3x12+。,解得5=1.4,

所以去除两个误差较大的样本点后的经验回归方程为S,=12r+L4,故C正确;

对D,因为§,=L2x2+1.4=3.8,所以)」»=3.75—3.8=-0.05,故D错误.

故选:C.

变式10.(2022・全国•高三专题练习)新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要

贡献.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益),(亿元)的数据统计如下:

研发投入X(亿元)12345

产品收益y(亿元)3791011

(1)计算x,),的相关系数〃并判析是否可以认为研发投入与产品收益具有较高的线性相关程度?(若

O.36KO.75,则线性相关程度一股,若I小0.75,则线性相关程度较高)

(2)求出),关于x的线性回归方程,并预测研发投入20(亿元)时产品的收益.

参考数据:力(—)2=10,£(M-刃、40,次仁-可(必-刃=19.

i=lc-1M

-可(V-同之(z-可(£-百

附:相关系数公式:,=―------------------,回归直线方程的斜率方=-------------,截距

£(再-“

1-1

A

a=y-bx.

2a-可2=io£(%-y)2=40E(a-x)(v..-y)=i9

【解析】⑴V

期EE=-=22=0,5>0,75,

710x5/4020

・•・该中医药企业的研发投入x与产品收益),具有较高的线性相关程度.

A2(*一)5-方19

b=—―7-----------=—=1.9

ZU-X)210

(2),/E

x=-(l+2+3+4+5)=3,y=-(34-7+9+10+ll)=8,

=8—1.9x3=2.3.

・4关于x的线性回归方程为y=1.9A+2.3,

将工=20代入线性回归方程可得,y=1.9x20+2.3=40.3,

,预测研发投入20(亿元)时产品的收益为(亿元).

变式U.(2022•全国•模拟预测(文))2020年,国庆“遇上”中秋,中国人把这个“超长黄金周''过出了年味.

假期期间,全国各大旅游景点、车站、机场人头攒动的景象也吸引了世界的目光.外国媒体、专家和网友“实

名羡慕“,这一派热闹景象证明了抗疫的成功,也展示了中国经济复苏的劲头.抗疫的成功离不开国家强大的

医疗卫生体系,下表是某省2013年至2019年医疗卫生机构数),(单位:万个):

年份2013201420152016201720182019

年份代号,1234567

医疗卫生机构数)’

(1)求了关于/的线性回归方程)、=百+4(4,B保留两位小数);

(2)规定若某年的实际医疗卫生机构数与估计值的差的绝对值不超过500个,则称该年是“吻合”年.利用(1)

的结果,假设2020年该省医疗卫生机构数的估计值为实际值,现从2013年至2020年这8年中任选3年,

其中,,吻合”年的个数为X,求X的分布列与数学期望.

参考数据:±*=132.2,晨4.6.

1-1

参考公式:线性回归方程中斜率和截距的最小二乘估计公式分别为:b=m---------,

热可

a=y-bt.

【解析】(1)由题意得7=4,=(-3)2+(-2)2+(-1)2+0+12+22+32=28,

1=1

打“…)(£”=自/一7%]32.2—7、4、4.6=织、0/2

£"丫£")'2828

1=11=1

贝必="而会4.6-0.12x4=4.12,

所以)'关于,的线性回归方程为y=0.12/+4.12.

(2)2013年至2019年这7年该省医疗卫生机构数的估计值与实际值(单位:万个)如下表所示:

年份2013201420152016201720182019

实际值

估计值

则2013年至2020年这8年中“吻合”年有2013年,2015年,2018年,2020年,共4年,

故X的所有可能取值为0,123,

且P(X=k)=^^~,A:=0,1,2.3,

J

故X的分布列为

X0123

1331

P

147714

133

巨斤以E(X)=0x—+lx3+2x3+3x—=3.

'J1477142

变式12.(2022・全国•高三专题练习)在我国抗疫期间,素有“南抖音,北快手”之说的小视频除了给人们带

来生活中的快乐外,更在于传递了一种正能量,为抗疫起到了积极的作用,但一个优秀的作品除了需要有

很好的素材外,更要有制作上的技术要求,某同学学习利用“快影”软件将己拍摄的素材进行制作,每次制作

分三个环节来进行,其中每个环节制作合格的概率分别为;3,4?彳,只有当每个环节制作都合格才认为一

453

次成功制作,该小视频视为合格作品.

(1)求该同学进行3次制作,恰有一次合格作品的概率;

(2)若该同学制作10次,其中合格作品数为X,求X的数学期望与方差;

(3)该同学掌握技术后制作的小视频被某广告公司看中,聘其为公司做广告宣传,决定试用一段时间,每

天制作小视频(注:每天可提供素材制作个数至多40个),其中前7天制作合格作品数》与时间/如下表:(第

/天用数字/表示)

时间(,)1234567

合格作品数()')343468

其中合格作品数()')与时间(1)具有线性相关关系,求)'关于,的线性回归方程(精确到0.01),并估算第14天

能制作多少个合格作品(四舍五入收整)?

之内一儿盯'£(工7心一)')

(参考公式〃=月--------=---------;—,》=3-猿,参考数据:1?/=163.)

/=1r=l

3422

【解析】⑴由题意知:制作一次视频成功的概率为

3丫54

所以该同学进行3次制作,恰有一次合格作品的概率C;xx

S5)125

(2)根据题意可得:x

2、2312

所以E(X)=/?〃=10xg=4,0(X)=H/?(1-/?v)=10x—x—=—,

(3)根据表格数据可计算出:

I+2+3+4+5+6+73+4+34-4+7+6+8

=4,y5,

77

163-7x4x5233।

所以方=耳一-----------=一«0.821,

-2140-7x1628

-nx

r=l

所以§=]切=50.821x4=1.72,

所以)'关于/的线性回归方程为5=0.82,+1.72,

令1=14,得§,=0.82xl4+1.72=13.2al3,

即估计第14天能制作13个合格作品.

题型三:非线性回归

例7.(2022・广东・顺德一中高三阶段练习)在国家大力发展新能源汽车产业的政策下,我国新隹源汽车的产

销量高速增长.已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:

年份(年)20142015201620172018201920202021

年份代码X12345678

保有量W千辆

参考数据:9=12.1了=2.1,Z%;=204,ZX/=613.7.ZM=924,其中

r=1c=1r=l

。=In)】,lg2h(),30/g3x0.48Jg^=0.43.

⑴根据统计表中的数据画出散点图(如图),请判断a=/;x+d与哪一个更适合作为y关于X的经验

1可归方程(给出判断即可,不必说明理由),并根据你的判断结果建立),关于x的经验【可归方程:

(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相

同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有星将下降10%.

试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.

参考公式:而于一组数据(%,v/),(%,匕),…,(〃”,匕),其经验回归直线0=£〃+々的斜率和截距的最小

Z(w(-万)(4-v)Z-V

二乘估计公式分别为------------------------,&=9-流;;

-")2名”疝2

/=1r=l

【解析】(1)根据该地区新能源汽车保有量的增长趋势知,应选择的函数模型是y=e"“,令,=lny,则

A

I=cx+d

因为工=4.5,£x;=204,Zx/.=92.4,t=2.1,

8

Vx/.-8x-7

92.4-8x4.5x2.116.8

所以,£二9---------=0.4,

204-8x4.5?42

1=1

J=7-^=2.1-0.4x4.5=03,所以丁=e°4"+"3

(2)设传统能源汽车保有量每年下降的百分比为八依题意得,500(l-r)$=500(1-10%),解得1--=0.9

y=500(1-rX=5000.於

IZr,设从2021

设从2021年底起经过x年后的传统能源汽车保有量为},千辆,则有

年底起经过x年后新能源汽车的数量将超过传统能源汽车,则有

严川)+0.3>50()o.於,所以(0.4x+3.5)lge>3-lg2+0.2M21g3-l),

解得x>:二片一生警=6.64,故从2021年底起经过7年后,即2028年底新能源汽车的数量将超过

0.2+0.4Ige-0.4lg3

传统能源汽车.

例8.(2022•全国•高三专题练习)2020年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地

二手房交易却“逆市”而行.下图是该地某小区2019年11月至2020年11月间,当月在售二手房均价(单位:

万元/平方米)的散点图.(图中月份代码1至13分别对应2019年11月至2020年11月)()

A当月在手二手房

1・°4-均价1,....

1.02-•••・

1.00-••

0.98-•.

0.96-

0.94■

°12345678910111213月份代码;v

根据散点图选择〉,=。+〃△和y=c+,〃nx两个模型进行拟合,经过数据处理得到的两个回归方程分别为

y=0.9369+0.02856和),=0.9554+0.0306Inx,并得至U以下一些统计量的值:

),=0.9369+0.0285Ay=0.9554+0.0306Inx

R2

注:"是样本数据中X的平均数,亍是样本数据中y的平均数,则于列说法不一定成立的是()

A.当月在售二手房均价)与月份代码工呈正相关关系

B.根据),=0.9369+0.0285人可以预测2021年2月在售二手房均价约为万元/平方米

C.曲线尸0.9369+0.0285&与y=0.9554

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论