2023年高考数学一轮复习习题:第十章第4节 变量间的相关关系与统计案例_第1页
2023年高考数学一轮复习习题:第十章第4节 变量间的相关关系与统计案例_第2页
2023年高考数学一轮复习习题:第十章第4节 变量间的相关关系与统计案例_第3页
2023年高考数学一轮复习习题:第十章第4节 变量间的相关关系与统计案例_第4页
2023年高考数学一轮复习习题:第十章第4节 变量间的相关关系与统计案例_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4节变量间的相关关系与统计案例

考纲要求1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;

2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回

归方程系数公式不要求记忆);3.了解独立性检验(只要求2X2列联表)的基本思想、方法及

其简单应用;4.了解回归分析的基本思想、方法及其简单应用.

知识分类落实回扣知识•夯实基础

知识梳理

1.相关关系与回归分析

回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统

计图是:散点图;统计量有相关系数与相关指数.

(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们

将它称为正相关.

(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.

(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.

2.线性回归方程

(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

(2)回归方程:两个具有线性相关关系的变量的一组数据:⑶,yi),(X2,刃),…,(X",力),

n__n__

Σ(XLX)(yl-y)∑χ∣yi-nxy

八八八八L1Llʌʌʌ

其回归方程为y=bx+α,贝Ijb=-------------------------=-----------------------,a=y-Ox.其中,b

2

∑(XLX)Yjxχ~nX2

I=II=I

是回归方程的斜率,1是在y轴上的截距.

回归直线一定过样本点的中心(三,7).

3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

⑵样本点的中心:对于一组具有线性相关关系的数据(即,V),(X2,"),…,(X,”为),其中

(T,亍)称为样本点的中心.

(3)相关系数

当r>0时,表明两个变量正相关;

当KO时,表明两个变量负相关.

r的绝对值越接近于1,表明两个变量的线性相关性越强.

的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常Irl大于0.75时,

认为两个变量有很强的线性相关性∙

〃A

Σ0,<∙-y<)2

尸1nΛ

(4)相关指数:R2=l----------------.其中∑8—»)2是残差平方和,其值越小,则R2越大(接

n---I=I

Σ(y∣-y)2

Z=1

近1),模型的拟合效果越好.

4.独立性检验

(1)利用随机变量群来判断“两个分类变量有关系”的方法称为独立性检验.

(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和匕它

们的可能取值分别为{xι,右}和{»,”},其样本频数列联表(2X2列联表)为

y2总计

Xiaha+b

X2cdc+d

总计a+cb+da+b+c+d

则随机变量小日瑞谭舟,其中〃=在』及为样本容量.

•——常用结论与微点提醒

AA————

1.求解回归方程的关键是确定回归系数4,6,应充分利用回归直线过样本点的中心(X,y).

A

2.根据回归方程计算的y值,仅是一个预报值,不是真实发生的值.

3.根据心的值可以判断两个分类变量有关的可信程度,若烂越大,则两分类变量有关的

把握越大.

诊断自测

〉思考辨析

1.判断下列结论正误(在括号内打“J”或“X”)

(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()

(2)通过回归直线方程£=源+1可以估计预报变量的取值和变化趋势.()

(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()

(4)事件X,y关系越密切,则由观测数据计算得到的月的观测值越大.()

答案(I)J(2)√(3)√(4)√

〉教材衍化

2.为调查中学生近视情况,测得某校在150名男生中有80名近视,在140名女生中有70

名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力()

A.回归分析B.均值与方差

C.独立性检验D.概率

答案C

解析“近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.

3.两个变量y与X的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其

中拟合效果最好的模型是()

A.模型1的相关指数K为0.98

B.模型2的相关指数R2为0.80

C.模型3的相关指数R2为0.50

D.模型4的相关指数R2为0.25

答案A

解析在两个变量),与X的回归模型中,它们的相关指数R2越近于1,模拟效果越好,在四

个选项中A的相关指数最大,所以拟合效果最好的是模型1.

►•考题体验

4.(2020・贵阳期末)已知关于变量X,的线性回归方程为f=0.25x+0∙55,且x,y的相关数

据如下表所示,则表格中加的值为()

X1234

y0.8m1.41.5

A.lB.1.05C.1.2D.2

答案A

解析由题意知;=1+2:3+4=2.5,

—0.8+加+1.4+1.53.7+/71

y=4=-r-,

所以样本点的中心为(2.5,WΞ2),

A37~∖~Hl

代入线性回归方程y=0.25x+0.55,得—=0.25×2.5+0.55,解得m=l.

5.(2020.全国I卷)某校一个课外学习小组为研究某作物种子的发芽率),和温度H单位:°C)

的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(为,y)(i=l,2,…,20)

得到下面的散点图:

由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度X

的回归方程类型的是()

A.y—a+bxB.y-a+bx2

C.y=a+he'D.y=a÷⅛lnx

答案D

解析由散点图可以看出,这些点大致分布在对数型函数的图象附近.故选D.

6.(2021•衡阳八中月考)某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽

取了选修课程的55名学生,得到数据如下表:

喜欢“应用统计”课不喜欢“应用统计”课

程程

男生205

女生1020

附表:

P(心/)0.100.050.0250.0100.0050.001

^^faΓ2.7063.8415.0246.6357.87910.828

参考公式:心=g+颂黑+0,其中w=α+6+c+d∙参照附表,得到的正确结论

是()

A.在犯错误的概率不超过0.1%的前提下,认为喜欢''应用统计”课程与性别有关

B.在犯错误的概率不超过0.1%的前提下,认为喜欢“应用统计”课程与性别无关

C.有99.99%以上的把握认为喜欢“应用统计”课程与性别有关

D.有99.99%以上的把握认为喜欢“应用统计”课程与性别无关

答案A

..C55×(20×20-5×IO)2

解λπ4析γ•烂=<=11.978>10.828,

所以有99.9%的把握认为喜欢“应用统计”课程与性别有关,即在犯错误的概率不超过0.1%

的前提下,认为喜欢“应用统计”课程与性别有关.

考点分层突破考点聚焦•题型剖析

考点一相关关系的判断自主演练

1.下列四个散点图中,变量X与y之间具有负的线性相关关系的是()

O

AB

OXO*

CD

答案D

解析观察散点图可知,只有D选项的散点图表示的是变量X与y之间具有负的线性相关

关系.故选D.

2.(2020・昆明诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:

月份123456

人均销售额658347

利润率(%)12.610.418.53.08.116.3

根据表中数据,下列说法正确的是()

A.利润率与人均销售额成正相关关系

B.利润率与人均销售额成负相关关系

C.利润率与人均销售额成正比例函数关系

D.利润率与人均销售额成反比例函数关系

答案A

解析由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;

其属于正相关关系,A正确,B错误.

>

3.在一组样本数据(x∣,>∣)>(X2,j2)>,",(X",yn)(π⅛:2,x∖,冷,…,x∏不全相等)的散点

图中,若所有样本点(为,V)(i=l,2,…,〃)都在直线y=—5+1上,则这组样本数据的样本

相关系数为()

A.-IB.0C.-ɪD.I

答案A

解析完全的线性关系,且为负相关,故其相关系数为-1,故选A.

感悟升华判断相关关系的两种方法:

(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;

如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.

(2)相关系数法:利用相关系数判定,卜|越趋近于1,相关性越强.

考点二回归分析多维探究

角度1线性回归方程及应用

【例1】下面给出了根据我国2012〜2018年水果人均占有量M单位:kg)和年份代码X绘

制的散点图和线性回归方程的残差图.(2012年〜2018年的年份代码X分别为1〜7)

1我国2()12年~2018年水果人均占有量散点图

18(

17(

16(

15(

14(

13(

2(

23456

年份代码工

卫我国2012年~20I8年水果人均占有量残差图

IVi:

ɔɑ-ɪ•

S^20I234567

年份代码∙i

⑴根据散点图分析y与尤之间的相关关系;

77

⑵根据散点图相应数据计算得Σ>=1074,⅛=4517,求y关于X的线性回归方程;(精

I—1I—1

确到0.01)

(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.

n____

ΛΛΛΛS(XLX)0'L>)

i

附:回归方程y=α+bx中斜率和截距的最小二乘估计公式分别为h=~½-------=——

2

∑1(XLX)

∑iχiyi-nXyλ_A—

—----二^一,a=y—hX.

∑ιxi~nX2

解(1)从散点图可以看出,这些点的分布整体上在一条直线附近,且当X由小变大时,y也

由小变大,

所以y与X之间具有线性相关关系,且是正相关.

—1+2+3+4+5+6+7

(2)由题意可知,X3=4,

一13I074

y=拓片〒,

7

2222222

r∑=lx?=l+2+3+4+5+6+7≈140,

7-------1074

λ高扬一7Xy4517-7×4×-^?21

•"=A_7不一140-7×42^~=/289,

1074

∙∙a=V~bX7.89X4^121.87,

7

Λγ关于X的线性回归方程为y=7.89x+121.87.

(3)由残差图可以看出历年数据的残差均分布在一2〜2之间,且图中各点比较均匀地分布在

数值O所在直线附近,带状区域很窄,说明对应的回归直线拟合效果较好.

角度2非线性回归方程及应用

【例2】(2021•四川七市一诊)已知某地区某种昆虫产卵数和温度有关.现收集了一只该品

种昆虫的产卵数y(个)和温度x(°C)的7组观测数据,其散点图如图所示:

产卯数M个)

300

25(1-

2()0-

150∙.

10()

50-,

OL'‘'一:’:..............

182()222426283()323436温度X(P)

根据散点图,结合函数知识,可以发现产卵数),和温度X可用方程y=卢来拟合,令Z=

In),,结合样本数据可知Z与温度X可用线性回归方程来拟合.

根据收集到的数据,计算得到如下值:

7——7——7————

2∑(ZLZ)2

Xy7∑1(XLX)1∑1(Xi-X)(ZLZ)

27743.53718211.946.418

表中Zi=Inyi,Z=甯声

(1)求Z和温度X的回归方程(回归系数结果准确到0.001);

(2)求产卵数y关于温度X的回归方程;若该地区一段时间内的气温在26°C〜36°C之间(包

括26℃与36-C),估计该品种一只昆虫的产卵数的范围.(参考数据e3∙282%27,e3∙792^44,

«5.832*341,e6∙°87≈440,e6342≈568)

ΛΛA

附:对于一组数据(①I,01),(①2,。2),.......,(必,%),其回归直线0=α十/①的斜率和截

n-------

-

Λ,∑(ω<3)(υ,-u)__

距的最小二乘估计分别为或=lJ--------=——,aλ=υ­βλω.

∑(Si-ω)2

I—1l

ΛΛΛΛS(XLX)(ZLZ)

解(1)由题意,z和温度X可以用线性回归方程拟合,设z=fox+α,^∖h=^-------=——

2

∑1(为一%)

46.418

=182"0.255,

a=~-b~=3.537-0.255×27=-3.348,

故Z关于1的线性回归方程为z=0.255χ-3.348.

(2)由(1)可得,Iny=0.255χ-3.348,

于是产卵数y关于温度X的回归方程为y=e025*-3∙348.

当X=26时,y=e0∙255x26^3∙348=e3∙282≈27;

当X=36时,y=e0255*36-3.348=e5,832^34L

:函数y=e°∙255L3∙348为增函数,

气温在26℃~36℃之间时,

估计该品种一只昆虫的产卵数的范围是[27,341J内的正整数.

感悟升华回归分析问题的类型及解题方法

(1)求回归方程

①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.

②利用公式,求出回归系数

③待定系数法:利用回归直线过样本点的中心求系数2

(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.

(3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数A

(4)回归方程的拟合效果,可以利用相关系数判断,当Irl越趋近于1时,两变量的线性相关性

越强.

【训练1】(2021•榆林模拟)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种

液体肥料每亩使用量M千克)之间的对应数据的散点图如图所示:

》(百千克)

6

5

4

3

24568M千克)

(1)依据数据的散点图可以看出,可用线性回归模型拟合了与X的关系,请计算相关系数并

加以说明(若M>0.75,则线性相关程度很高,可用线性回归模型拟合);

(2)求y关于X的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加

量约为多少.

Σ(XLX)8-y)

附:相关系数r=

,-

ΛAΛΛ篙(XLX)0∕∙y)

回归直线y=8x+”的斜率和截距的最小二乘估计分别为人=

£1(XLX)2

∑,xiyi-nXʃλ_A_

-nZZ^-,a=y-bX.

2

z∑=∣,x{-nx

.—2+4+5+6+8

解⑴X=---------5---------=5,

—3+4+5+6+7

J=ξ=5.

∑1(x∕--)(γz--)=(-3)×(-2)+(-I)×(-l)+O×O+l×I+3×2=14,

5—

222222

∑j(Xi-X)=(-3)+(-l)+0+l+3=20,

5—

.£(y—y)2=(—2)2+(—1)2+O2+12+22=10.

5__

Σ(XLX)6Ly)_

,

.=_14_7√2.

10

Nl(XLʒ7)2yJ±GL')24义回

.∙.可用线性回归模型拟合y与X的关系.

5————

Λ,?I(XLX)8一)')id

Q)b=-P―=~—=而=07,

∑l(XLX)

则1=亍一金"=5-0.7X5=1.5,

Λy=0.7x+l.5.

当X=I2时,J=0.7×12+1.5=9.9,

预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.

考点三独立性检验师生共研

[例3](2020・全国川卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和

当天到某公园锻炼的人次,整理数据得到下表(单位:天):

[0,200](200,400](400,600]

1(优)21625

2(良)51012

3(轻度污染)678

4(中度污染)720

(1)分别估计该市一天的空气质量等级为123,4的概率;

(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代

表);

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”:若某天的空气质量等级为3

或4,则称这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据列联

表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?

人次W400人次›400

空气质量好

空气质量不好

ʌ________________n(ad—bCy______

:K-=(α+3(c+S(a+c)S+J)'

P(FW0.0500.0100.001

k3.8416.63510.828

解(1)由所给数据,得该市一天的空气质量等级为123,4的概率的估计值如下表:

空气质量等级1234

概率的估计值0.430.270.210.09

(2)一天中到该公园锻炼的平均人次的估计值为

ɪ(100×20+300×35+500×45)=350.

(3)根据所给数据,可得2X2列联表:

人次W400人次>400

空气质量好3337

空气质量不好228

根据列联表得

100×(33×8-22×37)2

烂的观测值k=­Z÷-7T-T-——r^5.820.

ɔɔʌ43ʌ/Uʌ

由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量

有关.

感悟升华1.在2X2列联表中,如果两个变量没有关系,则应满足“4-bc∙Q0.∣αd—bc∣越小,

说明两个变量之间关系越弱;|,以一儿|越大,说明两个变量之间关系越强.

2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一

般步骤:

(1)根据样本数据制成2X2列联表:

根据公式2计算分的观测值k;

(2)K=(,a÷上b〜)(a丝十弋c)(b曾十a;),(c上+a小)

⑶通过比较观测值A与临界值的大小关系来作统计推断.

【训练2]为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,

得到如下2X2列联表:

理科文科

1310

~1Γ720

己知P(烂23.841)<0.05,P(心25.024)=0.025.根据表中数据,得到心的观测值k=

50×(13×20-10×7)2

=4.844.则认为选修文科与性别有关系出错的可能性为

23X27X20X30

答案5%

解析K2的观测值⅛^4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断

定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.

课后巩固作业分层训练・提升能力

A级基础巩固

一、选择题

1.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是()

3535

3030

2525

2020

15IS

1010

55

()510152()2530350510152()253035

相关系数为〃相关系数为q

(2)

35

3()

2525

2()20

151.">

1010

ɔ.■>

051()152()25303505101520253035

相关系数为心相关系数为Q

(3)(4)

A.r2<r4<O<r3<nB.r4<r2<O<r1<r3

C.Γ4<Γ2<0<r3<ΓιD.r2<r4<O<rι<r3

答案A

解析由散点图知图(1)与图(3)是正相关,故r∣>0,∕∙3>0,图(2)与图(4)是负相关,故∕∙2<0,

∕∙4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2D4<0<∕∙3<r∣,故选A.

2.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模

型比较合适;②用相关指数R2来刻画回归的效果,R2值越接近于1,说明模型的拟合效果

越好;③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,

拟合效果越好.正确的是()

A.①②B.②③C.①(§)D.①②③

答案D

3.如表是2X2列联表:

工y∖>2总计

Xia2173

225-27-

总计b46

则表中m〃处的值分别为()

A.94,96B.52,50C.52,54D.54,52

答案C

4+21=73,。=52,

解析由2X2列联表知解得,

a+2=h,⅛=54.

4.(2021・南昌模拟)已知一组样本数据点(X1,»),(X2,丫2),(X3,>3),…,(X6,丫6),用最小

二乘法求得其线性回归方程为>=—2x+4.若X”X2,X3,…,X6的平均数为1,则>1+”+

>3H----H'6=()

A.10B.12C.13D.14

答案B

解析由题意,设样本点的中心为(1,7),将其代入回归直线方程,可得7=-2Xl+4

—2,则y1+y2+y3+/+y5+y6=6X2=i2,故选B.

5.(2021.广东百校联盟联考)下表是我国某城市在2019年1月份至10月份期间各月最低温

度与最高温度(单位:"C)的数据一览表.

月份12345678910

最高温度∕°c-59911172427303121

最低温度/℃-12一3~Γ-271719232510

已知该城市的各月最低温度与最高温度具有相关关系,根据该一览表,则下列结论错误的是

()

A.最低温度与最高温度为正相关

B.每月最高温度与最低温度的平均值在前8个月逐月增加

C.月温差(最高温度减最低温度)的最大值出现在1月

D.1月至4月的月温差(最高温度减最低温度)相对于7月至10月,波动性更大

答案B

解析将最高温度、最低温度、温差列表如下:

月份12345678910

最高温度/°C59911172427303121

最低温度/℃-12-3~~Γ一271719232510

温差度/℃171281310787611

由表格可知,最低温度大致随最高温度的升高而升高,A正确;

每月最高温度与最低温度的平均值在前8个月不是逐月增加,B错误;

月温差的最大值出现在1月,C正确;

1月至4月的月温差相对于7月至10月,波动性更大,D正确.

6.2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽

的黄巾风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解

“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:

赞成“自助游”不赞成“自助游”总计

男性301545

女性451055

总计7525100

参考公式:X=m+b)(%(T)3+4其中"="+6+c+d

尸(蜉2⑹0.150.100.050.0250.0100.0050.001

2.0722.7063.8415.0246.6357.87910.828

参照公式,得到的正确结论是()

A.有99.5%以上的把握认为“赞成'自助游'与性别无关”

B.有99.5%以上的把握认为“赞成‘自助游’与性别有关”

C.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游'与性别无关”

D.在犯错误的概率不超过0.1的前提下,认为“赞成'自助游'与性别有关”

答案D

解析将2X2列联表中的数据代入计算,得心」黑合鼠Q)2Q3.030,

43Sʌɔɔʌ/ɔʌNɔ

V2.706<3.030<3.841,

二在犯错误的概率不超过0.1的前提下,可以认为“赞成‘自助游'与性别有关”.

二、填空题

7.已知X和y的散点图如图所示,在相关关系中,若用y=αe⑵拟合时的相关指数为此,

用Q=源+1拟合时的相关指数为此,则而此中较大的是

3(XK)

2500

2(XN)

ɪ5(K)

1(KKI

5(X)

0123456789IOx

答案咫

解析由散点图知,用y=°es∙拟合的效果比£=源+1拟合的效果要好,所以此>明,故较

大者为大

8.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成

如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是(填序号).

脂肪含量/%

35

3()

25

20

15

10

L...................................__►

o1520253()354045505560年龄/岁

①人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%;

②人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%;

③人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%;

④人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%.

答案②

解析观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.

9.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名

未使用血清的人一年中的感冒记录作比较,提出假设”o:“这种血清不能起到预防感冒的

作用”,利用2X2列联表计算得Q⅛3.918,经查临界值表知P(K223.841)M)∙05∙则下列结

论中,正确结论的序号是.

①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么

他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预

防感冒的有效率为5%.

答案①

解析3.918N3.841,而P(K223.814)七0.05,所以有95%的把握认为“这种血清能起

到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有

关系的,不是同一个问题,不要混淆.

三、解答题

10.(2020.全国Il卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增

加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用

简单随机抽样的方法抽取20个作为样区,调查得到样本数据(为,y)(i=l,2,…,20),其中

国和y分别表示第,•个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得

202020——20——20————

3产=60,篙V=I200,J1(Xi-X>=80,石(M—y/=9000,a(x,-X)8—),)=800.

(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物

数量的平均数乘以地块数);

⑵求样本8,W(i=l,2,…,20)的相关系数(精确到0.01);

(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地

区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

n____

Z(XLX)8-y)L

附:相关系数r=:/,_“_=,√2¾=1.414.

ʌ/,i,(XLX)2,⅜ULyF

——120

解⑴由已知得样本平均数y=古Zy=60,从而该地区这种野生动物数量的估计值为

60X200=12000.

(2)样本(为,y∙)(i=l,2,…,20)的相关系数

20————

高(XLX)8—y)8002」…

z--

L瓦~^—v,1(~^^√80×90003〜•.

2

^∖J∑ι(.Xi-X)∑1(yi-yYY

(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.

理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关性.由于各

地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样

的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该

地区这种野生动物数量更准确的估计.

11.某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第

X年与年销售量M单位:万件)之间的关系如下表:

X1234

y12284256

(1)在图中画出表中数据的散点图;

t”万件

40

3()

10-

o\1234√⅛

(2)根据散点图选择合适的回归模型拟合y与X的关系(不必说明理由);

(3)建立y关于X的回归方程,预测第5年的销售量.

参考公式:回归直线X的斜率和截距的最小二乘估计分别为

Σ(XLX)8-y)∑χ∣yi-nχy

A

h=a=y-bX.

Σ(XLX)2∑x?-nX2

/=1i=\

解(1)作出的散点图如图:

“万件

50

40

20

10

O1234

⑵根据散点图观察,可以用线性回归模型拟合y与X的关系.

⑶观察(1)中散点图可知各点大致分布在一条直线附近,列出表格:

zXiA7Xiyi

∏i-iF-i-12

2228456

33429126

445616224

Σ1013830418

569

可得

X2,

4

∑Xjy-4Xy569

418—4X5X7%

所以6=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论