版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
专题12概率统计
方法点拨
一、统计
1.统计中的四个数字特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,
就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即5=:(x+X2+L+x“).
(4)方差与标准差
方差:S2
标准差:
2.频率分布直方图的三个结论
(1)小长方形的面积=组距X频率.
(2)各小长方形的面积之和等于1.
(3)小长方形的高频=病率,所有小长方形高的和为融]
3.线性回归方程
线性回归方程亍=凉+/一定过样本点的中心(x,y).
4.独立性检验
n(ad-be)一
利用随机变量K2=来判断“两个分类变量有关系”的方法称为独立性
(a+b)(c+d)(a+c)(b+d)
检验.如果K?的观测值K越大,说明“两个分类变量有关系”的这种判断犯错误的可能性越小.
二、概率
1.若事件A、A2.&LA,,彼此互斥,它们至少有一个发生的概率
P(A+&+L+4)=P(A)+P(4)+L+P(A).
2.若事件4、A—A3LA〃相互独立,它们至少有一个发生的概率
P(A+4+L+4)=1-P(/4LA)-
3.独立重复试验与二项分布
如果事件A在一次试验中发生的概率是P,那么它在〃次独立重复试验中恰好发生k次的概率为
K(Q=C,:P*(1-P)"YM=0,1,2,L,〃,用X表示事件A在〃次独立重复试验中发生的次数,则X
服从二项分布,即X:B(〃,P)且P(X=攵)=C:尸(l—p)j.
4.离散型随机变量的分布列
(1)设离散型随机变量J可能取的值为X”X?,L,X,,L*取每一个值X,的概率为PR=Xj=%
则称下表
4X1x?X3・・・Xi•・・
P66・・・p.・・・
为离散型随机变量J的分布列.
(2)离散型随机变量4的分布列具有两个性质:①£20;②片+g+L+《+L=1(/=1,2,3,L).
(3)£(J)=X£+X26+L+XiPi+L+X,局为随机变量J的数学期望或均值.
。⑷式区-石⑷北+旧-七⑶)2g+L+(x,_Eq))2q+L+(x“-E⑷了匕叫做随机变量
自的方差.
(4)性质
①£(ag+b)=aE(4)+b,£>(^+Z?)=a2£>(<^);
②X:B(n,P),则E(X)=D(X)=nP(l-P);
③X服从两点分布,则E(X)=P,D(X)=P(1-P).
5.正态分布
如果随机变量X服从正态分布,则记为X:NJ。?).满足正态分布的三个基本概率的值是:
①P(〃-cr<XW〃+cr)=0.6826;②尸("-2b<XWM+2(T)=0.9544;③
尸(〃—3b<XW//+3b)=0.9974.
试题汇编
一、选择题.
1.(安徽省池州市2021届高三一模)为了研究“同时处理多任务时男女的表现差异”课题,研究
组随机抽取男女志愿者各150名,求他们同时完成“解题、读地图、接电话”等任务,志愿者完成任
务所需时间的分布如图所示,表述正确的选项是()
①总体上女性处理多任务平均用时短;
②所有女性处理多任务的能力都要优于男性;
③男性的用时众数比女性用时众数大;
④女性处理多任务的用时为正数,男性处理多任务的用时为负数.
A.①④B.②③C.①③D.①③④
【答案】C
【解析】①中,女性处理多任务平均用时集中在2〜3分钟,男性平均用时在3~4分钟,
所以总体上女性处理多任务平均用时短,所以①正确;
②中,从图中可以看到男性与女性处理多任务所需要的时间有交叉,所以并不是“所有女性都优
于男性",所以②不正确;
③中,根据分布的特点,可知男性的用时众数比女性用时众数大,所以③正确;
④中,女性和男性处理多任务的用时均为正数,所以④不正确,
故选C.
2.(安徽省宣城市2020-2021学年高三一模)人口普查是世界各国所广泛采取的一种调查方法,
根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学
决策的重要基础工作.截止2021年6月,我国共进行了七次人口普查,下图是这七次人口普查
的城乡人数和增幅情况,下列说法箱考的是()
A.城镇人口数逐次增加B.历次人口普查中第七次普查城镇人口最多
C.城镇人口比重逐次增加D.乡村人口数逐次增加
【答案】D
【解析】根据给定的条形图,可得城镇人口在逐年增加,所以A正确;
从给定的条形图象,可得再历次人口普查中第七次普查城镇人口最多的,所以B正确;
从图表中的数据可得,七次人口普查中城镇人口比重依次为13.26,18.30,20.91,26.44,
36.22,49.68,63.89,可知城镇人口比值逐次增加,所以C正确;
由图表,可得乡村人口先增加后减少,所以D不正确,
故选D.
3.(四川省内江市高中2022届第一次模拟)小李于2016年底贷款购置了一套房子,将通过10年
期每月向银行还数额相同的房贷,且截止2020年底,他没有再购买第二套房子.下图是2017年
和202()年小李的家庭收入用于各项支出的比例分配图,根据以上信息,判断下列结论中正确的
是()
A.小李一家2020年用于饮食的支出费用与2017年相同
B.小李一家2020年用于其他方面的支出费用是2017年的3倍
C.小李一家2020年的家庭收入比2017年增加了1倍
D.小李一家2020年用于房贷的支出费用比2017年减少了
【答案】B
【解析】由于小李每月向银行还数额相同的房贷,故可知2020年用于房贷方面的支出费用跟
2017年相同,故D选项错误;
设一年房贷支出费用为凡,则可知2017小李的家庭收入为‘一=2,202()年小李的家庭收入为
60%3
—,—xl50%=—,所以小李一家2020年的家庭收入比2017年增加了5()%,故C选项
40%232
错误;
2017年,202()年用于饮食的支出费用分别为2X25%=2,—x25%=—,故A选项错误;
31228
2017年,2020年用于其他方面的支出费用分别为2X6%=K,—xl2%=—,故B选项正确,
310210
故选B.
4.(广西柳州市2021届高三第一次模拟)下图为四组样本数据的条形图,则对应样本的标准差
最大的是()
【答案】D
【解析】对于A,由于各个数据相同,所以标准差为0,
对于B,x=0.05x6+0.2x7+0.5x8+0.2x9+0.05x10=8,
则S=^1[(6-8)2+(7-8)2+(8—8)2+(9—8)2+(10—8)2]=0;
对于C,%=0.1x6+0.2x7+0.4x8+0.2x9+0.1x10=8,
则s=J1[(6-8)2+(7-8尸+(8—8)2+(9—8>+(10—8尸]=/;
对于D,x=0.35x6+0.15x7+0.1x8+0.15x9+0.35x10=8.8,
则S=^|[(6-8.8)2+(7-8.8)2+(8-8.8)2+(9-8.8)2+(10-8.8)2]=^64,
所以样本D的标准差最大,故选D.
5.(南昌2020高三一模)总体由编号01,02,19,20的20个个体组成.利用下面的随机
数表选取5个个体,选取方法是随机数表第1行的第5列和第6列数字开始由左到右依次选取两
个数字,则选出来的第5个个体的编号为()
78166572080263140702436997280198
32049234493582003623486969387481
A.08B.07C.02D.01
【答案】D
【解析】从第一行的第5列和第6列起由左向右读数划去大于20的数分别为08,02,14,07,
01,
所以第5个个体是01,选D.
6.(四川省内江市高中2022届第一次模拟考试)“事件A与事件B是对立事件”是“事件A与事
件B是互斥事件”的()
A.充分而不必要条件B.必要而不充分条件
C.充要条件D.既不充分也不必要条件
【答案】A
【解析】因为当事件A与事件B是对立事件时,可得事件A与事件8一定是互斥事件,
而当事件A与事件B是互斥事件时,事件A与事件B不一定是对立事件,
所以“事件A与事件B是对立事件”是“事件A与事件B是互斥事件”的充分而不必要条件,
故选A.
7.(四川省凉山州2021-2022学年高三一模)盒中有3个大小相同的球,其中白球2个,黑球1
个,从中任意摸出2个,则摸出黑球的概率为()
1112
A.-B.-C.-D.-
6323
【答案】D
【解析】设白球编号为1,2,黑球编号为3,从中任意摸出2个,基本事件有12,13,23共3种,
其中摸出黑球的事件为13,23共2种,
所以摸出黑球的概率为白,故选D.
3
8.(江西省九江市2021届高考一模)如图八面体中,有公共边的两个面称为相邻的面,若从八
个面中随机选取两个面,则这两个面不相邻的概率为()
【答案】c
【解析】从八个面中随机选取两个面有C;=28种,其中两个面相邻的有12种,
则这两个面不相邻的概率为尸="二以=±,故选C.
287
9.(陕西省汉中市2022届高三一模)在一个坛子中装有16个除颜色之外完全相同的玻璃球,其
中有2个红的,3个蓝的,5个绿的,6个黄的,从中任取一球,放回后,再取一球,则第一次
取出红球且第二次取出黄球的概率为()
3213
A.—B.-C.—D.-
645208
【答案】A
【解析】Q在一个坛子中装有16个除颜色外完全相同的玻璃球,
其中有2个红的,3个蓝的,5个绿的,6个黄的,
从中任取一球,放回后,再取一球,
第一次取出红球且第二次取出黄球的概率.[乂2弓,故选A.
10.(多选)(福建省龙岩市2021届高三一模)一个不透明的袋子中装有6个小球,其中有4个
红球,2个白球,这些球除颜色外完全相同,则下列结论中正确的有()
A.若一次摸出3个球,则摸出的球均为红球的概率是:
B.若一次摸出3个球,则摸出的球为2个红球,1个白球的概率是?
5
C.若第一次摸出一个球,记下颜色后将它放回袋中,再次摸出一个球,则两次摸出的球为不同
颜色的球的概率是上
9
D.若第一次摸出一个球,不放回袋中,再次摸出一个球,则两次摸出的球为不同颜色的球的概
率是(
【答案】BC
【解析】对于A,总事件数是C:=20,摸出的球均为红球的事件数为=4,所以摸出的球均
为红球的概率是1,故选项A错误;
5
对于B,总事件数是C;=20,摸出的球为2个红球,1个白球的事件数为C:C;=12,所以摸出
的球为2个红球,1个白球的概率是3,故选项B正确;
5
对于C,①若第一次摸出红球,第二次摸出白球,则概率为2x2=刍;
6636
②若第一次摸出白球,第二次摸出红球,则概率为2、9=刍,
6636
故两次摸出的球为不同颜色的球的概率是色+2=3,故选项c正确;
36369
对于D,①若第一次摸出红球,第二次摸出白球,则概率为些*2=*;
6530
②若第一次摸出白球,第二次摸出红球,则概率为2、a=刍,
6530
故两次摸出的球为不同颜色的球的概率是老+色=§,故选项D错误,
303015
故选BC.
11.(吉林省长春市东北师范大学附属中学2019-2020学年高三一模)任意向(0,1)区间上投掷一
个点,用x表示该点的坐标,设事件A={x[o<x<;,,事件B=<x;<x<l",则P(B|A)=()
A.0.25B.0.125C.0.5D.0.625
【答案】C
【解析】由题意可得:AB={x|0.25<x<0.5},所以尸(AB)=竺?”=0.25,
又因为P(A)=0.5,所以「(8|A)=^^=;=0.5,故选C.
12.(四川省泸州市2019-2020学年高三一模)古希腊数学家欧多克索斯在深入研究比例理论时,
提出了分线段的“中末比''问题:将一线段MN分为两线段MG,GN,使得其中较长的一段MG是
全长MN与另一段GNGN的比例中项,即满足丝2=旭=也二1,后人把这个数称为“黄金分
MNMG2
害数,把点G称为线段MN的“黄金分割”点.在矩形ABCD中,E,尸是线段A8的两个“黄金
分割''点.在矩形ABC。内任取一点〃,则该点落在VDE尸内的概率为()
C-一2
■2
【答案】C
【解析】设正方形ABC。的边长为1,则=二EE=2Ab—l=«-2,
2
S;xEFxADr_2
所求的概率为尸=ZDEF=2——_=二/,故选c.
S正方形ABOAD-2
13.(重庆市第一中学2021届高三一模)第六届世界互联网大会发布了15项世界互联网领先科
技成果,其中有5项成果均属于芯片领域,分别为华为的鳏鹏920、特斯拉全自动驾驶芯片、寒
武纪云端4芯片、思元270、赛灵思的Versa自适应计算加速平台.现有3名学生从这15项世界
互联网领先科技成果中分别任选1项进行了解,且学生之间的选择互不影响,则至少有1名学生
选择芯片领域的概率为()
A.双B.2c.2D,12
919112527
【答案】D
【解析】现有3名学生从这15项世界互联网领先科技成果中分别任选1项进行了解,且学生之间
的选择互不影响,则基本事件总数〃=15x15x15=3375,
至少有1名学生选择芯片领域的对立事件是没有学生选择芯片领域,
则至少有1名学生选择芯片领域的概率尸==U,故选D.
337527
14.(福建省厦门市2021届高三一模)已知某地居民在2020年“双十一”期间的网上购物消费额
。(单位:千元)服从正态分布N(2,l),则该地某居民在2020年“双十一”期间的网上购物消费额
在(0,3]内的概率为()
附:随机变量服从正态分布-cr<&<〃+cr)M0.6827,
—2b<"〃+2cr)。0.9545,—3b<。V〃+3b)«0.9973.
A.0.9759B.0.8186C.0.73D.0.4772
【答案】B
【解析】因为单位:千元)服从正态分布N(2,l),所以〃=2,(y=l,
则P(0<=(〃一++(〃-2b<jW〃+2b)=g(0.6827+0.9545)=0.8186,
故选B.
15.(福建省泉州市2021届高三一模)“立定跳远”是《国家学生体质健康标准》测试项目中的一
项,已知某地区高中男生的立定跳远测试数据4(单位:cm)服从正态分布N(200Q2),且
P((^>220)=0.1,现从该地区高中男生中随机抽取3人,并记<不在(180,220)的人数为X,
则()
A.P(180<^<220)=0.9B.E(X)=2.4
C.D(X)=0.16D.P(X>1)=0.488
【答案】D
【解析】由aN(200,CT2),则2(42220)=2(44180)=0.1,
则P(180<g<220)=l-P(^>220)-P(J<180)=0.8,故A错误;
由题知,J不在(180,220)的概率为1-0.8=0.2,则X:B(3,0.2),
则£(X)=3x0.2=0.6,故B错误;
D(X)=3x0.2x(1-0.2)=0.48,故C错误;
P(X>1)=1-P(X=0)=1-0.83=0.488,故D正确,
故选D.
16.(四川省成都市2021-2022学年高三一模)已知某篮球运动员每次罚球命中的概率为0.4,
该运动员进行罚球练习(每次罚球互不影响),则在罚球命中两次时,罚球次数恰为4次的概率
是()
A.至B.2C.&D.旻
625125625125
【答案】C
【解析】由已知命中的概率为0.4,不命中的概率为1-0.4=0.6,
罚球4次,命中两次,说明第4次命中,前3次命中1次,
故概率尸=&0.4x(OS,x0.4=0.1728=壑,故选c.
625
17.(山东省潍坊市2021届高三一模)接种疫苗是预防和控制传染病最经济、有效的公共卫生干
预措施.根据实验数据,人在接种某种病毒疫苗后,有8()%不会感染这种病毒,若有4人接种了
这种疫苗,则最多1人被感染的概率为()
A.垩B.空C.生D.X
625625625625
【答案】A
【解析】由题得最多1人被感染的概率为《(A,+cdxS、变上型=生,故选A.
555625625
18(宜春市2021高三一模)饕餐纹是青铜器上常见的花纹之一,最早见于长江中下游地区的良
渚文化陶器和玉器上,盛行于商代至西周早期.将青铜器中的饕餐纹的一部分画到方格纸上,如
图所示,每个小方格的边长为一个单位长度,有一点P从点A出发,每次向右或向下跳一个单位
长度,且向右或向下跳是等可能的,那么点P经过3次跳动后恰好是沿着饕餐纹的路线到达点8
的概率为()
【答案】B
【解析】点P从点4出发,每次向右或向下跳一个单位长度,跳3次,
则样本空间。={(右,右,右),(右,右,下),(右,下,右),(下,右,右),(右,下,下),
(下,右,下),(下,下,右),(下,下,下)},
记“3次跳动后,恰好是沿着饕餐纹的路线到达点中为事件C,则C={(下,下,右)},
由古典概型的概率公式可知P(C)=:,故选B.
二、解答题.
19.(四川省凉山州2021-2022学年高三一模)某数学课题组针对高三学生掌握基本知识点的单
位值x和“一诊”基础题目得分值y进行统计分析,所得统计数据如表所示:
X35557595
y20303555
(1)请根据如表提供的数据,用最小二乘法求出y关于x的线性回归方程$=%+心
(2)若|y-q215,则称y为异常值,现有8名学生的成绩,其中有3个异常值,现从8个成绩
中逐一抽取,每次抽取后不放回,求至多抽取4次就能将3个异常值全部找出来的概率.
£4%-nxy
(参考公式:B=----------=--------,a=y-bx.)
-元>^xj-rix2
/=1/=1
【答案】(1)y=-x--;(2)—.
■20414
35+55+75+9520+30+35+55
【解析】(1)由题意可得了=65,=35,
4
4
Z(%-元)(%-》)=(35-65)(20-35)+(55-65)(30-35)+(75-65)(35-35)+
/=1
(95-65)(55-35)=1100,
£(七一可2=(35—65)2+(55—65)2+(75—65y+(95—65)2=2000,
i=\
4
小一元)”歹)110011
•b=-.............=----=——,
_、2200020
i=l
则右=9一位=35—UX65=-3,
-204
所以y关于x的线性回归方程为£=养》-?.
(2)①恰好3此就能将3个异常值找出的概率为6=4=-L,
A56
②恰好4此就能将3个异常值找出的概率为B="咨=—,
A56
所以,至多抽取4次就能将3个异常值找出的概率为4+6=5+0='.
20.(四川省成都市2021-2022学年高三一模)某项目的建设过程中,发现其补贴额x(单位:百
万元)与该项目的经济回报y(单位:千万元)之间存在着线性相关关系,统计数据如下表:
补贴额x(单位:百万元)23456
经济回报y(单位:千万
2.5344.56
元)
(1)请根据上表所给的数据,求出y关于x的线性回归直线方程亍=晟+心
(2)为高质量完成该项目,决定对负责该项目的7名工程师进行考核.考核结果为4人优秀,3
人合格.现从这7名工程师中随机抽取3人,用X表示抽取的3人中考核优秀的人数,求随机
变量X的分布列与期望.
参考公式:b=----------,a^y-bx.
f(七一叶
i=\
【答案】(1)9=0.85x+0.6;(2)分布列见解析,数学期望为2.
-7
2+3+4+5+62.5+3+4+45+6
【解析】(1)Qx==4,5==4.
55
5
^(X,.-X)(X-7)=(-2)X(-1.5)+(-1)X(-1)+OXO+1XO.5+2X2=8.5,
Z=1
之(七一工)2=4+1+0+1+4=10,
/=!
5
*(玉-可(y「引
》=上y----------=0.85指=4-0.85X4=0.6,
EU-^)2
/=1
/.y=0.85x+0.6.
(2)由题意可知,X的可能取值为0,1,2,3,
OPfY-Ol-S-XRx-八.当-上-2)VC』
<^5-0)-二行/”一1)一可一支「”一2)一百一七
p(x=3)=q=3,
《35
.•.X的分布列为
X0123
112184
P
35353535
・•・E(X)=0」+l』+2x竺+3」上
',353535357
21.(四川省内江市高中2022届第一次模拟)某兴趣小组为了研究昼夜温差大小与患感冒人数多
少之间的关系,请一所中学校医务室人员统计近期昼夜温差情况和到该校医务室就诊的患感冒学
生人数,如下是2021年10月、11月中的5组数据:
日期10月8日10月18日10月28日11月8日11月18日
昼夜温差X(℃)8116155
就诊人数y131712199
(1)通过分析,发现可用线性回归模型拟合就诊人数y与昼夜温差x之间的关系,请用以上5
组数据求就诊人数关于昼夜温差的线性回归方程亍=%+4(结果精确到0.01);
(2)一位住校学生小明所患感冒为季节性流感,传染给同寝室每个同学的概率为0.6.若该寝
室的另3位同学均未患感冒,在与小明近距离接触后有X位同学被传染季节性流感,求X的分
布列和期望.
参考数据:EU-x)(y,.-y)=63,月(%-寸=66.
/=1/=1
£(苍-亍)(%-9)
参考公式:8二旦=----------,a^y-bx.
f(工厂寸
1=1
【答案】(1)y=0.95x+5.41;(2)分布列见解析,期望为1.8.
【解析】(1)(1)由表格中数据可得,元=9,9=14,
:.b=i^__=—«0.95,.,.«=y-ftx=14-—x9«5.41,
Z(x,--x)26666
i=l
...就诊人数y关于昼夜温差尤的线性回归方程为9=0.95x+5.41.
(2)X的可能取值为0,1,2,3,
VX~5(3,0.6),P(X=0)=C^x0.6°x0.43=0.064,P(X=1)=x0.6x0.42=0.288,
p(X=2)=《x0.62x0.4=0.432,P(X=3)=C^x0.63x0.4°=0.216,
X的分布列为
X0123
P0.0640.2880.4320.216
期望E(X)=3x0.6=1.8.
22.(安徽省池州市2021届高三一模)科学技术是第一生产力,创新是引领发展的第一动力.某
企业积极响应国家“科技创新”的号召,大力研发新产品.为对新研发的一批产品进行合理定价,
将该产品按事先拟定的价格进行试销,得到一组销售数据(4%)«=1,2,3,4,5,6)如表格所
不:
试销单价x(百元)123456
产品销量y件918682787370
(1)统计学认为,两个变量兑y的相关系数;•的大小可表明两变量间的相关性强弱.一般地,
如果上归[0.75』],那么相关性很强;如果,归[0.30,0.75),那么相关性一般;如果”[0,0.25],
那么相关性较弱.试判断变量的相关性强弱;
(2)若变量无、y线性相关时,由线性回归方程求得的与光对应的产品销售量估计值白与实际值-
差的绝对值小于1时,则将销售数据称为“有效数据”,现从这6组销售数据中任取2组,求抽取
的2组销售数据都是“有效数据”的概率.(求线性回归方程时,之方精确到个位)
1666______
参考公式及数据:9=—Zy=80,ZX/=1606,ZX;=91,V5495«74,
6i=ii=ii=i
,Zx^i-rix-ySa--亍)(y,-歹)
3=上―----------=R--------------------------,a=y-bx,i=l
£(毛_可2£工;_加2£(七-可2.汽(y厂才
r=li=l/,=1/=1
7
【答案】(1)变量x、y间的相关性很强;(2)
【解析】(1)£(%-才力(%-y)2=5495,
f=li=l
7
1606-6x-x80
-------/2---«-1|r|«1e[0.75,1],故变量x、y间的相关性很强.
V5495
Zx/-6/歹
1606—6x3.5x80
«-46=9一尻=80+4x3.5=94,
(2)b=-----------91—6x3.52
£音-6x
(=1
故y=-4x+94,
当再=1时,x=90;当尤2=2时,乂=86;当七=3时,%=82;当%=4时,%=78;当x§=5
时,%=74;当天=6时,%=70.
与销售数据对比可知满足民2,…,6)的共有4个“有效数据”:(2,86)、(3,82).(4,78)
、(6,70).
给6组销售数据编号,则从6组销售数中任取2组有:(1,2)、(1,3)、(1,4)、(1,5).(1,6)、(2,
3).(2,4).(2,5),(2,6).(3,4).(3,5).(3,6),(4,5).(4,6).(5,6)共15种情况,
其中两组都是有效数据的情况有6种,
抽取的2组销售数据都是“有效数据”的概率为〃=9=2.
155
23.(2019届云师大学附中高三一模)某果园种植“糖心苹果”已有十余年,为了提高利润,该果
园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2009年至2018年,
该果园每年的投资金额x(单位:万元)与年利润增量y(单位:万元)的散点图:
该果园为了预测2019年投资金额为20万元时的年利润增量,建立了y关于x的两个回归模型.
模型①:由最小二乘公式可求得y与x的线性回归方程:y=2.50x-2.50;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:y=)lnx+a的附近,对投资金额x
10101010
做交换,令,=Inx,则y=〃•f+a,且有2号=22.00,工y=230,=569.00,习;=50.92.
/=1/=1/=1/=!
年利润增量y(万元)
45
40
35
30
25
20
15
10
5
01234567891011121314151617181920
投资金额式万元)
(1)根据所给的统计量,求模型②中y关于x的回归方程;
(2)分别利用这两个回归模型,预测投资金额为20万元时的年利润增量(结果保留两位小数);
(3)根据下列表格中的数据,比较两种模型的相关指数A2,并说明谁的预测值精度更高、更可
罪.
回归模型模型①模型②
回归方程y=2.50%-2.50y=h\nx+a
10.
102.2836.19
/=1
EU-?)(X-7)
附:样本&,y)(i=l,2,…,小的最小乘估计公式为。=『----------,a=y-bT-,
—)2
f=l
2(必一力2
相关指数K=l—个一----.参考数据:In2«0.6931,In5PL6094.
E(x-y)2
Z=J
【答案】(1)y=251nx-32;(2)42.89(万元);(3)答案见解析.
1010
【解析】(1)由题意,知£%=22.00,工》=230,可得亍=2.20,歹=23,
/=1/=1
£()(》,-9)fr/TOT;
569.00-10x2.20x23
又由........../=1______________
ZU-F)2办-心50.92-10x2.20x2.20
1=11=1
则4=了-标=23-25x2.20=-32,
所以,模型②中y关于x的回归方程3=251nx-32.
(2)当x=20时,模型①的年利润增量的预测值为£=2.50x20—2.50=47.50(万元),
当x=20时,模型②的年利润增量的预测值为
y=25xln20-32=25x(21n2+ln5)-32«25x(2x0.6931+1.6094)-32=42.89(75%).
102283649
(3)由表格中的数据,可得102.28>36.19,B[J,0>10,
Z(x-y)2E(X-7)2
/=1i=\
所以模型①的R2小于模型②,说明回归模型②刻画的拟合效果更好,
所以当x=20时,模型②的预测值$=42.89比模型①的预测值$=47.50,精度更高、更可靠.
24.(广西柳州市2021届高三第一次模拟)某试验小组得到6组某植物每日的光照时间x(单位:
//)和每日平均增长高度y(单位:mm)的数据,现分别用模型①§=汨+由和模型②苧:泮仔对
以上数据进行拟合,得到回归模型,并计算出模型的残差如下表:(模型①和模型②的残差分别
为年和号,残差号=》_外)
X5678910
y0.43.55.27.08.610.7
片-0.60.540.280.12-0.24-0.1
-0.631.712.101.63-0.7-5.42
(1)根据上表的残差数据,应选择哪个模型来刻画该植物每日的光照时间与每日平均增长高度
的关系较为合适,简要说明理由;
(2)为了优化模型,将(1)中选择的模型残差绝对值最大所对应的一组数据(x,y)剔除,根据
剩余的5组数据,求该模型的回归方程,并预测光照时间为Uh时,该植物的平均增长高度.
2
(剔除数据前的参考数据:x=7.5,3=5.9,£x(.y.=299.8,£x,=355,z=lny,z«1.41,
;=1f=l
6d-〃ry_
Z平产73.10,In10.7®2.37,e*。34a56.49.)参考公式:^=-^;------,%=y—为x.
/=1
【答案】(1)应选择模型①,理由见解析;(2)12.34mm.
【解析】(1)应选择模型①,
因为模型①每组数据对应的残差绝对值都比模型②的小,残差波动小,残差点比较均匀地落在水
平的带状区域内,说明拟合精度高.(言之有理即可)
(2)由(1)知,需剔除第一组数据,得到下表
X678910
y3.55.27.08.610.7
则上表的数据中,元=7.5X6-5=8,5.9x6-0.4=7,5元y=280,5/=320,
55
55
=299.8-5x0.4=297.8,=355-25=330,
i=li=\
5
所以「2-^-----=2975-280=皿=i78,
6=阮=7-1.78x8=—7.24,
330-32010
i=l
得模型①的回归方程为§=1.78%-7.24,
贝ijx=11时,$'=1.78x11-7.24=12.34mm,
当光照时间为1lh时,该植物的平均增长高度为12.34mm.
25.(四川省乐山市高中2022届第一次模拟)某校为纪念“12.9”运动,组织了全校学生参加历史
知识竞赛,某教师从高一、高二年级各随机抽取50名学生的竞赛成绩(满分为10()分),绘制成如
下所示的频率分布直方图:
(1)分别估计高一、高二竞赛成绩的平均值X与石(同一组中的数据以该组数据所在区间的中
点值为代表);
(2)学校规定竞赛成绩不低于80分的为优秀,根据所给数据,完成下面的2x2列联表,并判断
是否有90%的把握认为竞赛成绩的优秀与年级有关?
非优秀优秀合计
高一年级
高二年级
合计100
附:K2=------巴丝士------其中"=a+6+c+d.
(a+b)(c+d)(〃+c)(b+d)
P(K2“。)0.150.100.050.01
k2.0722.7063.8416.635
【答案】(1)77.8,81.0;(2)列联表见解析,没有90%的把握认为竞赛成绩优秀跟年级有关.
【解析】(1)高一年级随机抽出50名学生竞赛成绩的平均值估计为:
,=(4x55+10x65+14x75+12x85+10x95)+50=77.8;
高二年级随机抽出5()名学生竞赛成绩的平均值估计为:
兀=(2x55+8x65+10x75+18x85+12x95)+50=81.0.
(2)完成的2x2列联表为:
非优秀优秀合计
高一年级282250
高二年级203050
合计4852100
2_100(28x30—22x20)2=100
50x50x48x52-~37
故没有90%的把握认为竞赛成绩优秀跟年级有关.
26.(山西省怀仁市第一中学校2021届高三一模)5G网络(5GNetwork)是第五代移动通信网络,
与之前的四代移动网络相比较而言,5G网络在实际应用过程中表现出更加强大的功能.随着5G
技术的诞生,用智能终端分享3。电影、游戏以及超高画质(U/7Q)节目的时代正向我们走来.某
机构调查了某营业厅30位用户的性别与升级5G套餐情况,得到的数据如下表所示:
不升级5G升级5G总计
男性用户713
女性用户14
总计30
(1)请将上述2x2列联表补充完整,并判断是否有95%的把握认为用户升级5G套餐与性别有
关;
(2)若从这30名用户的男性用户中随机抽取2人参加优惠活动,记其中升级5G套餐用户的人
数为X,求X的分布列和均值.
附:心=.7.一7眄、了匚~~,,n=a+b+c+d.
p(W0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
【答案】(1)列联表见解析,有95%的把握认为用户升级5G套餐与性别有关;(2)分布列见解
析,中)=*
【解析】(1)依题意,完善表格如下:
不升级5G升级5G总计
男性用户6713
女性用户14317
总计201030
30x(14x7-6x3『
K2«4.344>3.841,
20x10x13x17
故有95%的把握认为用户升级5G套餐与性别有关.
(2)依题意知X的可能取值为0,1,2,
C2c05c'c17c°c27
p(x=o)=Ea=2,尸(X=I)=上孕='P(X=2)=^p=
CZ26CZ13c”26
所以X的分布列为
X012
577
p
261326
577id
所以£(X)=Ox—+lx—+2x一=一
26132613
27.(陕西省榆林市2021届高三一模)国际学生评估项目(P/SA),是经济合作与发展组织(OECD)
举办的,该项目的内容是对15岁学生的阅读、数学、科学能力进行评价研究.在2018年的79
个参测国家(地区)的抽样测试中,中国四省市(北京、上海、江苏、浙江作为一个整体在所有
参测国家(地区)取得全部3项科目中第一的好成绩,某机构为了分析测试结果优劣的原因,从
参加测试的中国学生中随机抽取了200名参赛选手进行调研,得到如下统计数据:
成绩一
成绩优秀总计
般
家长高度重视学生教育90Xy
家长重视学生教育度一
30ZCD
般
总计12080200
若从上表“家长高度重视学生教育”的参测选手中随机抽取一人,则选到的是“成绩一般”的选手的
概率为二.
13
(1)判断是否有99.9%的把握认为“学生取得的成绩情况”与“家长对学生的教育重视程度”有关;
(2)现从成绩优秀的选手中按照分层抽样的方法抽取20
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024初三期中考试复习计划指导
- 年度技术工作计划
- 近期的销售工作计划
- 岭南师范学院《工业设计专业英语》2021-2022学年第一学期期末试卷
- 临沂大学《民族民间舞-藏族舞蹈》2023-2024学年第一学期期末试卷
- 女生宿舍管理工作计划宿舍卫生工作计划
- 教育局安全计划
- 小学下学期体育教学工作计划
- 2024物业公司年度工作计划范文
- 幼儿园小班教师个人工作计划第一学期
- 初中数学专项练习《二次函数》92道计算题包含答案
- 玻璃出厂检验报告
- SHL在线测评题库顺丰
- 云计算导论完整
- 妊娠合并系统性红斑狼疮演示课件
- 《迎接青春期》课件
- 小学科学教学仪器配备标准
- 安全生产职业病预防培训
- 三级医院评审(人力资源管理)应知应会宣讲课件
- 2024年陕西西安重装集团招聘笔试参考题库含答案解析
- 水洗厂规章制度
评论
0/150
提交评论