高考数学复习- 统计与统计案例_第1页
高考数学复习- 统计与统计案例_第2页
高考数学复习- 统计与统计案例_第3页
高考数学复习- 统计与统计案例_第4页
高考数学复习- 统计与统计案例_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第10章概率与统计

10.3统计与统计案例

象命题探究骨

本部分的主要内容有:抽样方法、用样本估计总体、变量间的相关关系、独立性检验,其中随机抽样

和总体估计是高考考查的热点内容,一般以选择题、填空题的形式出现,主要考查对抽样方法的理解与选

择,各种统计图表的识别以及有关样本数据、数字特征的计算等.独立性检验一般在解答题中出现,常结

合概率考查,一般难度不大.

片承新题速递

1.(2022•乙卷)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如图茎叶图:

则下列结论中错误的是()

甲乙

615.

85306.3

75327.46

64218.12256666

429.0238

10.1

A.甲同学周课外体育运动时长的样本中位数为7.4

B.乙同学周课外体育运动时长的样本平均数大于8

C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4

D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6

73+75

【解答】解:由茎叶图可知,甲同学周课外体育运动时长的样本中位数为\—=7.4,选项A说法正

确;

由茎叶图可知,乙同学周课外体育运动时长的样本平均数大于8,选项8说法正确;

sa

甲同学周课外体育运动时长大于8的概率的估计值为=7<0・4,选项C说法错误;

168

13

乙同学周课外体育运动时长大于8的概率的估计值为二=0.8125>0.6,选项D说法正确.

故选:C.

2.(2022•甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位

社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后

问卷答题的正确率如图:

则()

A.讲座前问卷答题的正确率的中位数小于70%

B.讲座后问卷答题的正确率的平均数大于85%

C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差

D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

【解答】解:对于A,讲座前问卷答题的正确率从小到大为:

60%,60%,65%,65%,70%,75%,80%,85%,90%,95%,

讲座前问卷答题的正确率的中位数为:(70%+75%)/2=72.5%,故A错误;

对于8,讲座后问卷答题的正确率的平均数为:

1

—(80%+85%+85%+85%+85%+90%+90%+95%+100%+100%)=89.5%>85%,故8正确;

10

对于C,由图形知讲座前问卷答题的正确率相对分散,讲座后问卷答题的正确率相对集中,

...讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,故C错误:

对于。,讲座后问卷答题的正确率的极差为:100%-80%=20%,

讲座前正确率的极差为:95%-60%=35%,

讲座后问卷答题的正确率的极差小于讲座前正确率的极差,故。错误.

故选:B.

3.(2022•新高考H)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样

本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);

(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;

(3)已知该地区这种疾病的患者的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人

口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50〉,求此人患这种疾病的概率(以样本

数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).

【解答】解:(1)由频率分布直方图得该地区这种疾病患者的平均年龄为:

x=5X0.001X10+15X0.002X10+25X0.012X10+35X0.017X10+45X0.023X10+55X0.020X10+65X

0.017X10+75X0.006X10+85X0.002X10=47.9岁•

(2)该地区一位这种疾病患者的年龄位于区间[20,70)的频率为:

(0.012+0.017+0.023+0.020+0.017)X10=0.89,

估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率为0.89.

(3)设从该地区中任选一人,此人的年龄位于区间[40,50)为事件B,此人患这种疾病为事件C,

贝!]P(C|B)=多需=61%:歌3x10=00014.

4.(2022•甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行

情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:

准点班次数未准点班次

A24020

B21030

(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;

(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?

______.(ad-be/______

(a+b)(c+d)(a+c)(b+d),

p(K2上)0.1000.0500.010

k2.7063.8416.635

【解答】解:(1)A公司一共调查了260辆车,其中有240辆准点,故A公司准点的概率为一=一;

26013

2107

B公司一共调查了240辆车,其中有210辆准点,故8公司准点的概率为

2408

(2)由题设数据可知,准点班次数共450辆,未准点班次数共50辆,A公司共260辆,B公司共240

辆,

7

500x(240x30—210x20)/

:.K2

260x240x450x50-一

・♦•有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.

5.(2022•乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积

量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:〃/)和材积量(单位:m3),得到

如下数据:

样本号i2345678910总和

根部横截面积为0.040.060.040.080.080.050.050.070.070.060.6

材积量yi0.250.400.220.540.510.340.360.460.420.403.9

并计算得£旦婷=0.038,型1”=1.6158,£旦孙=0.2474.

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为

186届.己知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量

的估计值.

附:相关系数,生18:祖y「y)VL896«1.377.

闻1(々一书411⑶「刃

【解答】解:(1)设这棵树木平均一棵的根部横截面积为运平均一棵的材积量为歹,

则根据题中数据得:x==0.06/n2,y==0.39m3;

(2)由题可知,*耳⑺一©」一刃—工旦"Mf药—0.0134

6-1(x「元)2*耳⑶「刃2J(鹉叶一位2)白昌为2一冲2)V0.002x0,0948

0.0134_0,0134

0.01X/L896=0.01377印・“;

(3)设总根部面积和X,总材积量为匕则-=}故丫=需'186=1209(m3).

真题归纳

题型一•抽样方法与统计图表

1.(2015•福建)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级

学生中抽取一个容量为45的样本,则应抽取的男生人数为25.

451

【解答】解:根据题意得,用分层抽样在各层中的抽样比为——=—

90020

则应抽取的男生人数是500X4=25人,

故答案为:25.

2.(2018•新课标I)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了

解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下

饼图:

则下面结论中不正确的是()

A.新农村建设后,种植收入减少

B.新农村建设后,其他收入增加了一倍以上

C.新农村建设后,养殖收入增加了一倍

D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半

【解答】解:设建设前经济收入为小建设后经济收入为2a.

A项,种植收入37%X2a-60%a=14%a>0,

故建设后,种植收入增加,故A项错误.

B项,建设后,其他收入为5%义2。=10%。,

建设前,其他收入为4%m故10%a+4%〃=2.5>2,

故2项正确.

C项,建设后,养殖收入为30%X2a=60%a,

建设前,养殖收入为30%”,故60%公30%〃=2,

故C项正确.

。项,建设后,养殖收入与第三产业收入总和为(30%+28%)X2a=58%X2m

经济收入为2m故(58%*2。)+2。=58%>50%,

故。项正确.

因为是选择不正确的一项,

故选:A.

3.(2017•新课标III)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月

至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

2014年2015年2016年

根据该折线图,下列结论错误的是()

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月

D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

【解答】解:由已有中2014年1月至2016年12月期间月接待游客量(单位:万人)的数据可得:

月接待游客量逐月有增有减,故A错误;

年接待游客量逐年增加,故B正确;

各年的月接待游客量高峰期大致在7,8月,故C正确;

各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故。正确;

故选:A.

4.(2016•新课标HI)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最

低气温的雷达图,图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃,

下面叙述不正确的是()

A.各月的平均最低气温都在0℃以上

B.七月的平均温差比一月的平均温差大

C.三月和十一月的平均最高气温基本相同

D.平均最高气温高于20℃的月份有5个

【解答】解:4.由雷达图知各月的平均最低气温都在以上,正确

艮七月的平均温差大约在10°左右,一月的平均温差在5°左右,故七月的平均温差比一月的平均温差

大,正确

C.三月和十一月的平均最高气温基本相同,都为10°,正确

D.平均最高气温高于20℃的月份有7,8两个月,故。错误,

故选:D.

5.(2021•甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调

查数据整理得到如下频率分布直方图:

2.53.54.55.56.57.58.59.510.511.512,513.514.5收入/万元

根据此频率分布直方图,下面结论中不正确的是()

A.该地农户家庭年收入低于4.5万元的农户比率估计为6%

B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%

C.估计该地农户家庭年收入的平均值不超过6.5万元

D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

【解答】解:对于A,该地农户家庭年收入低于4.5万元的农户比率为(0.02+0.04)X1=0.06=6%,故

选项A正确;

对于8,该地农户家庭年收入不低于10.5万元的农户比率为(0.04+0.02X3)X1=0.1=10%,故选项8

正确:

对于C,估计该地农户家庭年收入的平均值为3X0.02+4X0.04+5X0.1+6X0.14+7X0.2+8X0.2+9X0.1+10

X0.1+11X0.04+12X0.02+13X0.02+14X0.02=7.68>6.5万元,故选项C错误;

对于。,家庭年收入介于4.5万元至8.5万元之间的频率为(0.1+0.14+0.2+0.2)Xl=0.64>0.5,

故估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故选项。正确.

故选:C.

6.(2015•山东)为比较甲,乙两地某月14时的气温,随机选取该月中的5天,将这5天中14时的气温数

据(单位:。C)制成如图所示的茎叶图,考虑以下结论:

①甲地该月14时的平均气温低于乙地该月14时的平均气温;

②甲地该月14时的平均气温高于乙地该月14时的平均气温;

③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;

④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.

其中根据茎叶图能得到的统计结论的编号为()

甲乙

~9~I~~~~

113012

A.①③B.①④C.②③D.②④

【解答】解:由茎叶图中的数据,我们可得甲、乙两地某月14时的气温抽取的样本温度分别为:

甲:26,28,29,31,31

乙:28,29,30,31,32;

1

可得:甲地该月14时的平均气温:-(26+28+29+31+31)=29,

1

乙地该月14时的平均气温:-(28+29+30+31+32)=30,

故甲地该月14时的平均气温低于乙地该月14时的平均气温;

甲地该月14时温度的方差为:S^=1[(26-29)2+(28-29)2+(29-29)2+(31-29#+(31-29)

2J=3.6

乙地该月14时温度的方差为:S;=g(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)

2]=2,

故S%>S"

所以甲地该月14时的气温的标准差大于乙地该月14时的气温标准差.

故选:B.

题型二用样本估计总体

1.(2019•新课标II)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原

始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的

数字特征是()

A.中位数B.平均数C.方差D.极差

【解答】解:根据题意,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,

7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变,

故选:A.

2.(2017•新课标I)为评估一种农作物的种植效果,选了〃块地作试验田.这〃块地的亩产量(单位:kg)

分别是用,垃,…,血,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()

A.xi,xi,X"的平均数B.xi,X2,,,,,X”的标准差

C.x\,X2,…,X”的最大值D.x\,X2,…,X”的中位数

【解答】解:在A中,平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标,

故A不可以用来评估这种农作物亩产量稳定程度;

在B中,标准差能反映一个数据集的离散程度,故8可以用来评估这种农作物亩产量稳定程度;

在C中,最大值是一组数据最大的量,故C不可以用来评估这种农作物亩产量稳定程度:

在。中,中位数将数据分成前半部分和后半部分,用来代表一组数据的“中等水平”,

故D不可以用来评估这种农作物亩产量稳定程度.

故选:B.

3.(2020•新课标HD设一组样本数据xi,%2,…,的方差为0.01,则数据10制,10x2,…,10斯的方差

为()

A.0.01B.0.1C.1D.10

【解答】解:...样本数据xi,",…,*的方差为0.01,

,根据任何一组数据同时扩大几倍方差将变为平方倍增长,

数据10X1,10X2,…,10X"的方差为:100X0.01=1,

故选:C.

(多选)4.(2021•新高考H)下列统计量中,能度量样本XI,X2,…,初的离散程度的有()

A.样本Xl,JQ,…,尤"的标准差

B.样本xi,X2,…,X”的中位数

C.样本xi,X2,…,X”的极差

D.样本xi,X2,…,物的平均数

【解答】解:中位数是反应数据的变化,

方差是反应数据与均值之间的偏离程度,

极差是用来表示统计资料中的变异量数,反映的是最大值与最小值之间的差距,

平均数是反应数据的平均水平,

故能反应一组数据离散程度的是标准差,极差.

故选:AC.

(多选)5.(2021•新高考I)有一组样本数据加,及,…,xn,由这组数据得到新样本数据yi,”,…,

yn,其中y=x/+c(i=l,2,…,n),c为非零常数,则()

A.两组样本数据的样本平均数相同

B.两组样本数据的样本中位数相同

C.两组样本数据的样本标准差相同

D.两组样本数据的样本极差相同

【解答】解:对于A,两组数据的平均数的差为c,故A错误;

对于8,两组样本数据的样本中位数的差是c,故B错误;

对于C,:标准差。(")=D(x,+c)=D(为),

两组样本数据的样本标准差相同,故C正确;

对于。,(i=1,2,,,,,n),c为非零常数,

X的极差为y的极差为(X,”at+C)-—Xmax~Xmint

两组样本数据的样本极差相同,故。正确.

故选:CD.

6.(2020•新课标I)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,。四

个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;

对于。级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工

成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各

试加工了100件这种产品,并统计了这些产品的等级,整理如下:

甲分厂产品等级的频数分布表

等级ABCD

频数40202020

乙分厂产品等级的频数分布表

等级ABCD

频数28173421

(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;

(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承

接加工业务?

40

【解答】解:(1)由表格可得,甲分厂加工出来的一件产品为A级品的频数为40,故频率为一=0.4,

100

28

乙分厂加工出来的一件产品为A级品的频数为28,故频率为——=0.28,

100

故甲、乙两分厂加工出来的一件产品为A级品的概率估计值分别是0.4,0.28;

(2)由表格可知甲分厂加工四个等级的频率分别为0.4,0.2,0.2,0.2,

故其平均利润为(90-25)X0.4+(50-25)X0.2+(20-25)X0.2+(-50-25)X0.2=15(元故

同理乙分厂加工四个等级的频率分别为0.28,0.17,0.34,0.21,

故其平均利润为(90-20)X0.28+(50-20)X0.17+(20-20)X0.34+(-50-20)X0.21=10(%);

因为15>10,所以选择甲分厂承接更好.

7.(2019•新课标m)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分

成4、8两组,每组100只,其中A组小鼠给服甲离子溶液,8组小鼠给服乙离子溶液.每只小鼠给服

的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分

比.根据试验数据分别得到如图直方图:

甲离子残留百分比直方图

记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.

(1)求乙离子残留百分比直方图中小方的值;

(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).

【解答】解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,

根据直方图得到P(C)的估计值为0.70.

则由频率分布直方图得:

(a+0.20+0.15=0.7

10.05+b+0.15=1-0.7'

解得乙离子残留百分比直方图中。=0.35,匕=0.10.

(2)估计甲离子残留百分比的平均值为:

环=2X0.15+3X0.20+4X0.30+5X0.20+6X0.10+7X0.05=4.05.

乙离子残留百分比的平均值为:

五=3X0.05+4X0.1+5X0.15+6X0.35+7X0.2+8X0.15=6.00.

8.(2018•新课标I)某家庭记录了未使用节水龙头50天的日用水量数据(单位:〃?3)和使用了节水龙头

50天的日用水量数据,得到频数分布表如下:

未使用节水龙头50天的日用水量频数分布表

日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)

频数13249265

使用了节水龙头50天的日用水量频数分布表

日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)

频数151310165

(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;

频率/组距

3.4

32

3.0

2.8

2.6

2.4

22

2.0

1.8

1.6

1.4

12

1.0

0.8

0.6

0.4

02

56日用水量m»

(2)估计该家庭使用节水龙头后,日用水量小于0.35/的概率:

(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数

据所在区间中点的值作代表)

【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,

作出使用了节水龙头50天的日用水量数据的频

题型三.独立性检验

1.(2021•甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品

的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:

一级品二级品合计

甲机床15050200

乙机床12080200

合计270130400

(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?

(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?

2

n(ad—bc)

:尺=(a+b)(c+d)(a+c)(b+d)・

P(犬22)0.0500.0100.001

k3.8416.63510.828

【解答】解:(1)由题意可得,甲机床、乙机床生产总数均为200件,

1503

因为甲的一级品的频数为15。,所以甲的一级品的频率为丽下

1203

因为乙的一级品的频数为⑵,所以乙的一级品的频率为丽=9

n(ad-bc)2_400(150x80—50x120)

(2)根据2X2列联表,可得非=-«10.256>6.635.

(a+b)(c+d)(a+c)(b+d)-270x130x200x200

所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.

2.(2020•新课标HI)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的

人次,整理数据得到下表(单位:天):

锻炼人次[0,200](200,400](400,600]

空气质量等级

1(优)21625

2(良)51012

3(轻度污染)678

4(中度污染)720

(1)分别估计该市一天的空气质量等级为1,2,3,4的概率:

(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);

(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称

这天“空气质量不好”.根据所给数据,完成下面的2X2列联表,并根据列联表,判断是否有95%的把

握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?

人次W400人次>400

空气质量好

空气质量不好

2

附.产=_____九(血一儿)_______

叫,A(a+b)(c+d)(a+c)(b+d)

P(片》&)0.0500.0100.001

k3.8416.63510.828

2+16+2543

【解答】解:(1)该市一天的空气质量等级为1的概率为:

100100'

5+104-1227

该市一天的空气质量等级为2的概率为:

100100'

6+7+821

该市一天的空气质量等级为3的概率沏-

7+2+09

该市一天的空气质量等级为4的概率沏-

(2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:

1

x=y^x[100X(2+5+6+7)+300X(16+10+7+2)+500X(25+12+8+0)J=350,

(3)根据所给数据,可得下面的2义2列联表,

人次W400人次>400总计

空气质量好333770

空气质量不好22830

总计5545100

2

小夷山痂捉用俎_____n(ad-bc)________100x(33x8-37x22)2

由表中数据可信*一(q+b)(c+d)(Q+c)(b+d)-70x30x55x45-«5.820>3.841,

所以有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.

3.(2017•新课标H)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100

个网箱,测量各箱水产品的产量(单位:版),其频率分布直方图如下:

(1)记A表示事件“旧养殖法的箱产量低于50依”,估计A的概率;

(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:

箱产量<50依箱产量N50版

旧养殖法

新养殖法

(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.

附:

P(K2K)0.0500.0100.001

K3.8416.63510.828

2

_____n(ad-bc)______

一(a+b)(c+d)(Q+c)(b+d).

【解答】解:(1)根据题意,由旧养殖法的频率分布直方图可得:

P(A)=(0.012+0.014+0.024+0.034+0.040)X5=0.62;

(2)根据题意,补全列联表可得:

箱产量<50版箱产量250万总计

旧养殖法6238100

新养殖法3466100

总计96104200

2

则有产=2懦湍<9第2g°5>6.635,

故有99%的把握认为箱产量与养殖方法有关;

(3)由频率分布直方图可得:

旧养殖法100个网箱产量的平均数元1=(27.5X0.012+32.5X0.014+37.5X0.024+42.5X0.034+47.5X

0.040+52.5X0.032+57.5X0.02+62.5X0.012+67.5X0.012)X5=5*9.42=47.1;

新养殖法100个网箱产量的平均数元2=(37.5X0.004+42.5X0.020+47.5X0.044+52.5X0.054+57.5X

0.046+62.5X0.010+67.5X0.008)*5=5X10.47=52.35;

比较可得:7|<X2.

故新养殖法更加优于旧养殖法.

题型四.回归分析

1.(2020•新课标I)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,

在20个不同的温度条件下进行种子发芽实验,由实验数据(孙加)(/=1,2,--20)得到下面的散点

由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类

型的是()

A.y=a+hxB.y=a+bx2C.y=a+bekD.y=a+blnx

【解答】解:由散点图可知,在10℃至40℃之间,发芽率y和温度x所对应的点(x,y)在一段对数函

数的曲线附近,

结合选项可知,y=a+R巾可作为发芽率y和温度x的回归方程类型.

故选:D.

2.(2018•新课标H)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000

年至2016年的数据(时间变量f的值依次为1,2,…,17)建立模型①:y=—30.4+13.5六根据2010

年至2016年的数据(时间变量f的值依次为1,2,…,7)建立模型②:y=99+17.5r.

(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;

(2)你认为用哪个模型得到的预测值更可靠?并说明理由.

【解答】解:(1)根据模型①:y=-30.4+13.56

计算f=19时,y=-30.4+I3.5X19=226.1;

利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;

根据模型②:y=99+17.56

计算1=9时,y=99+17.5X9=256.5;

利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;

(2)解法1:模型②得到的预测值更可靠,因为从总体数据看,该地区从2000年到2016年的环境基础

设施投资额是逐年上升的,从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅

度较大些,所以利用模型②的预测值更可靠些.

解法2,模型②对应的7个点分布宽度小于模型①对应的17个点的分布宽度,则g|>|ril,所以模型②较

好;

解法3,选择与2018邻近的三个年份(2014,2015,2016)计算模型②对应的残差绝对值之和=2.5+5+15

=9,模型①对应的残差绝对值之和=12+23.5+21=56.5;且9<56.5,所以模型②较好;

所以利用模型②的预测值更可靠些.

3.(2016•新课标HI)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.

注:年份代码1-7分别对应年份2008-2014.

(I)由折线图看出,可用线性回归模型拟合y与,的关系,请用相关系数加以证明;

(II)建立y关于f的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.

附注:

参考数据:羽=i»=9.32,乎=1//y,=40.17,收位(y.-y)2=0.55,77*2.646.

参考公式:相关系数y-一蓬L8/优二刃

物=i(与司%(y-y)

回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为:

,(tt-t)(y-y)9.

u-5。=y—bt.

%(t.-t)

【解答】解:(1)由折线图看出,y与f之间存在较强的正相关关系,理由如下:

电9一月小一刃=戏=i5一7目x40.17-4x9.32~2.89

229106

鬲/1(y19)2JS7=1(y-y)2"0.55

V0.99>0.75,

故y与f之间存在较强的正相关关系;

£却(女一下)仇一汾二£烈女丫「7型

(2)〜翳=0.10

b=2

次=1(GT%tj-7tZo

a=y-bt«1.33-0.10X4^0.93,

;.),关于t的回归方程y=0.10r+0.93,

2016年对应的f值为9,

故y=0.10X9+0.93=1.83,

预测2016年我国生活垃圾无害化处理量为1.83亿吨.

4.(2020•新课标H)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地

区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20

个作为样区,调查得到样本数据(为,》)(i=l,2,…,20),其中即和H分别表示第i个样区的植物覆

2

盖面积(单位:公顷)和这种野生动物的数量,并计算得£幽Xi=60,£陷刀=1200,£幽(x,-I)

=80,Xi=iy)2=9000,£雷(xi-x)(yt-y)=800.

(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平

均数乘以地块数);

(2)求样本(X,;»•)(1=1,2,■­,20)的相关系数(精确至)0.01);

(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生

动物数量更准确地估计,请给出一种你认为更合理的抽样方法,并说明理由.

附:相关系数片/(々;元)。「刃V2«1.414.

也?=i@一元)xjli(yt-y)

【解答】解:(1)由己知,2&%=1200,

.♦.20个样区野生动物数量的平均数为烹匕=1200x/=60,

该地区这种野生动物数量的估计值为60X200=12000;

(2)驾幽(々一盼2=go,鹏(yt-y)2=9000,鹏(阳—7)(%一为=800)

...=EJi(%一元)(%一刃=800=_^00_=巫之094.

一也忆](%一君2第]⑶「力2780x9000600忘3

(3)更合理的抽样方法是分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽

样.

理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆

盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本

结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确地估计.

5.(2015•新课标I)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对

年销售量y(单位:力和年利润z(单位:千元)的影响,对近8年的年宣传费为和年销售量》(i=l,

2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

■年俏售里/t

620-

600-.•

580-.••

560-•

540-•

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论