统计、概率与分布列大题-2025年高考数学一轮复习知识清单(原卷版)_第1页
统计、概率与分布列大题-2025年高考数学一轮复习知识清单(原卷版)_第2页
统计、概率与分布列大题-2025年高考数学一轮复习知识清单(原卷版)_第3页
统计、概率与分布列大题-2025年高考数学一轮复习知识清单(原卷版)_第4页
统计、概率与分布列大题-2025年高考数学一轮复习知识清单(原卷版)_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题26统计'概率与分布列大题归类

更盘点•置击看考

目录

题型一:非线性回归型...........................................................................1

题型二:数据调整型..............................................................................3

题型三:残差型..................................................................................5

题型四:相关系数型..............................................................................7

题型五:二项分布型.............................................................................10

题型六:超几何分布.............................................................................11

题型七:正态分布型.............................................................................13

题型八:下棋与比赛型分布列.....................................................................16

题型九:数列递推型:马尔科夫链.................................................................17

题型十:数列递推型:传球模式...................................................................19

题型十一:多线程多人比赛型.....................................................................20

题型十二:跳棋模式分布列.......................................................................21

题型十三:分布列导数计算求最值.................................................................23

题型十四:新高考分布列型第19题................................................................24

题型十五:分布列综合..........................................................................26

^突围・檐谁蝗分

题型一:非线性回归型

"旨I点I迷I津

;非线性回归,可以通过换元转化为线性回归。比较常见的有反比例型换元,一元二次型换元,指数型换

;元,对数型换元,对于指数型,也可以通过取对数换元转化为线性回归。

r724-253所莫荃国三天最奉弃章血之二:丽看免朝司诲布美屈茁

设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费x,(单位:

百万元)和年销售量%(单位:百万辆)关系如图所示:令”=山%[=1,2,--,5),数据经过初步处理得:

上年销售量(百万辆)

O123456

年广告费(百万元)

555555

Zx-泉£(%-于Z(x-y)2S(v,-v)22a-元)(%-刃E(y-y)(匕-D)

J=1i=lZ=1i=\Z=1i=\Z=1

444.81040.31.61219.58.06

现有①>="+q和②y=〃inx+〃2两种方案作为年销售量>关于年广告费》的回归分析模型,其中0,b,

m,〃均为常数.

⑴请从相关系数的角度,分析哪一个模型拟合程度更好?

⑵根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广

告费为6(百万元)时,产品的年销售量是多少?

2.(23-24高二下•河北石家庄•阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方

式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个

周期)与产品销售额y(千元)的数据统计如下:

直播周期数X12345

产品销售额y(千元)37153040

根据数据特点,甲认为样本点分布在指数型曲线丫=2灰+。的周围,据此他对数据进行了一些初步处理.如下

表:

555

Z2(%-寸2(%-4

1=11=1i=lZ=1i=l

3.75538265978101

[5

其中马=log?%,z

〉Z=1

⑴请根据表中数据,建立y关于x的回归方程;

(2)乙认为样本点分布在直线>=〃就+〃的周围,并计算得回归方程为9=9.7x-1Q1,以及该回归模型的相关

指数暇=0.98,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(心精确到0.01)

附:对于一组数据(如匕),饱,%),…,(%匕),其回归直线f=&+血的斜率和截距的最小二乘估计分别为

J(V,-V)(M,-M)E(v,-v,)2

-----------,a=v-pu,相关指数:R-T---------

i=li=l

3.(24-25高三上•福建泉州•阶段练习)一只药用昆虫的产卵数V与一定范围内的温度x有关,现收集了该种

6

归模型的残差平方和=236.64,e&°时5土3167,其中4斗分别为观测数据中的温差和产卵数,

i=l

z=1,2,3,4,5,6.

⑴若用线性回归方程,求》关于x的回归方程勺=%+&(精确到o.i);

(2)若用非线性回归模型求得'关于x回归方程为5=0O6ea23g,且相关指数々=0.9522.

(i)试与(1)中的回归模型相比,用尺2说明哪种模型的拟合效果更好.

(ii)用拟合效果好的模型预测温度为35P时该种药用昆虫的产卵数(结果取整数).

附:一组数据(国,%),(々,%),…,(当,笫),其回归直线》=以+&的斜率和截距的最小二乘估计为

2

^(x..-x)(z.-y)S(x-x)

g=J-----------,a^y-bx.相关指数R*一号---------.

£(%-寸方(%-寸

1=11=1

4.(2023•四川•模拟预测)下表是某工厂记录的一个反应器投料后,连续8天每天某种气体的生成量(L):

日期代码X12345678

生成的气体)(L)481631517197122

为了分析该气体生成量变化趋势、工厂分别用两种模型:®y=bx2+a,②£=对变量x和y的关系

进行拟合,得到相应的回归方程并进行残差分析,残差图如下:

888

注:残差9=经计算得X4-元)(%一刃=728,^(X,.-X)2=42,E(z,-可(%-9)=6868,

z=li=li=l

⑴根据残差图、比较模型①,模型②的拟合效果,应该选择哪个模型?并简要说明理由;

(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);

⑶若在第8天要根据(2)问求出的回归方程来对该气体生成量做出预测,那么估计第9天该气体生成量是

多少?(精确到个位)

8

--可(y-歹)

附:回归直线的斜率和截距的最小二乘估计公式分别为:B-----------,a=y-bx.

Z=1

题型二:数据调整型

1.(24-25高二上•陕西•开学考试)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身

高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标价(单位:cm),计

算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;

抽取次序12345678910

身高155158156157160161159162169163

记抽取的第i个女生的身高为毛(1=1,2,3,10),样本平均数三=160,方差$2=15.

参考数据:历士3.9,159?=25281,1692=28561.

⑴若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身

高在[160,165]范围内的人数;

⑵用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数〃和标准差。,求〃,。的值;

⑶如果女生样本数据在3-2s,元+2s)之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的

平均数与方差.

2.(23-24高一下•福建南平•期末)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的

身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),

计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:

抽取次序12345678910

身高155158156157160161159162169163

记抽取的第i个女生的身高为不«=1,2,3,…,10),样本平均数元=160,方差

110,1<10

:2=15.

参考数据:715«3.9,1592=25281,169?=28561.

⑴若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身

高在[160,165]范围内的人数;

(2)如果女生样本数据在(元-2s3+2s)之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的

平均数与方差;

⑶用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数〃和标准差。,求〃,的值.

3.(22-23高二•全国•课后作业)为了监控某种零件的一条生产线的生产过程,检验员每隔30min从该生产

线上随机抽取一个零件,并测量其尺寸(单位:cm)做好记录.下表是检验员在一天内依次抽取的16个零

件的尺寸:

抽取次序12345678

零件尺寸(cm)9.9510.129.969.9610.019.929.9810.04

抽取次序910111213141516

零件尺寸(cm)10.269.9110.1310.029.2210.0410.059.95

经计算得工=9.97,S=弁$UE=弁序考_1640.212,^(/-8.5)2-18.439,

16

(X,.-7)(/-8.5)=-2.78,其中者为抽取的第i个零件的尺寸(1=1,2,…,16).

1=1

⑴求(%,。[=1,2,-16)的相关系数『,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而

系统地变大或变小(若N<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);

⑵一天内抽检的零件中,如果出现了尺寸在(元-3s,元+3s)之外的零件,就认为这条生产线在这一天的生产

过程可能出现了异常情况,需对当天的生产过程进行检查.

①从这一天抽检的结果看,是否需对当天的生产过程进行检查?

②在(元-3s,元+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与

标准差.(精确到0.01)

4.(20-21高二上•山东德州•期末)某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得

到数据如下表:

企业abcdefghij

满意度X(%)21332420252124232512

投资额y(万元)79868978767265625944

(1)求投资额'关于满意度x的相关系数(精确到Q01);

(2)约定:投资额V关于满意度x的相关系数r的绝对值在0.7以上(含0.7)是线性相关性较强,否则,

线性相关性较弱.如果没有达到较强线性相关,则根据满意度"末位淘汰”规定,关闭满意度最低的那一所企

业,求关闭此企业后投资额V关于满意度尤的线性回归方程(精确到0.1).

—10_I7~io1010一

参考数据:参22.8,y=71,X%,2-10/2=248,I^x,2-10xXy?-10y»643.7,-10xy=406,

1=1YIi=l八z=lJi=l

2282=51984,228x71=16188.

附:对于一组数据(A,兀),(巧,%),…,(七,%),其回归直线9=标+&的斜率和截距的最小二乘估计公

/__

力谢-而__2尤,y,一〃xy

式分别为:3=号------&=7-为.线性相关系数厂=八0、,“

Js^2-2JZx2-?

题型三:残差型

指I点I迷I津

残差:观测值减去一预估值称为残差

1.(23-24高三上,湖南衡阳•阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科

技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中

根据散点图,分别用模型①y=6x+“,②丫.+4五作为年研发投入y(单位:亿元)关于年份代码尤的

经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计

量的值:

10101010

ytE(—)22(%-刃(%-元)-刃&k)

i=li=li=l

752.2582.54.512028.35

__110

表中4=«,/=而[以

⑴根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经

验回归方程模型?并说明理由;

(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;

(ii)设该科技公司的年利润L(单位:亿元)和年研发投入y(单位:亿元)满足L=(111.225-y)«(xeN,

且xe[l,20]),问该科技公司哪一年的年利润最大?

附:对于一组数据(久1,%),(x2,y2),其经验回归直线亍=&+标的斜率和截距的最小二乘估计

分别为♦=-...........,5=^-bx.

£(%-可2

i=l

2.(22-23高三下•广西防城港•阶段练习)某互联网公司为了确定下季度的前期广告投入计划,收集了近6

个月广告投入量x(单位:万元)和收益V(单位:万元)的数据如表:

月份123456

广告投入量24681012

收益14.2120.3131.831.1837.8344.67

他们用两种模型①y=6x+a,②丫=加麻分别进行拟合,得到相应的回归方程并进行残差分析,得到如图

所示的残差图及一些统计量的值.

T残差

残差图

6卜a

/\

4/A\

.\\45

3月初

———————————z————————

X

一模型①•一模型向1

66

X

i=li=l

7301464.24364

⑴根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;

⑵残差绝对值大于2的数据被认为是异常数据,需要剔除.

(i)剔除异常数据后求出(1)中所选模型的回归方程;

(ii)若广告投入量x=18时,(1)中所选模型收益的预报值是多少?

附:对于一组数据(%y),(%,%),…,(%,%),其回归直线》=几+力的斜率和截距的最小二乘估计分别为:

n〃

人2(—)(%-刃Sx^-rix-y

b=上―...........=旦^----------,a=y-bx

fa-元『储;一;沅?

Z=1Z=1

3.(20-21高二下•湖北孝感•期末)"金山银山不如绿水青山;绿水青山就是金山银山”.复兴村借力"乡村振兴”

国策,依托得天独厚的自然资源开展乡村旅游.乡村旅游事业蓬勃发展.复兴村旅游协会记录了近八年的游客

人数,见下表.

年份2013年2014年2015年2016年2017年2018年2019年2020年

年份代码尤12345678

游客人数y(百人)481632517197122

为了分析复兴村未来的游客人数变化趋势,公司总监分别用两种模型对变量y和尤进行拟合,得到了相应的

回归方程,绘制了残差图.残差图如下(注:残差q=y-y):

A残差

细虚线为模型①,粗虚线为模型②

模型①丫=加+°;模型②y=6Zx+c.

(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;

(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);

(3)根据(2)问求出的回归方程来预测2021年的游客人数.

_18

参考数据见下表:其中:Z=/,Z=gZz,

8i=i

8_

力(王-尤9)=42

-h=728£L「Z).(%T=6868

i=\;=1i=l

£")2=357088

£z,=204EX=400

Z=1Z=1Z=1

附:回归直线的斜率和截距的最小二乘估计公式分别为:g=J--------a=y—bx

Z(A-)

i=l

4.(2023全国•模拟)(本小题满分12分)

为了研究黏虫孵化的平均温度》(单位:℃)与孵化天数y之间的关系,某课外兴趣小组通过试验得到如

下6组数据:

组号123456

平均温度15.316.817.41819.521

孵化天数16.714.813.913.58.46.2

他们分另U用两种模型①>=法+。,②/=。*分别进行拟合,得到相应的回归方程并进行残差分析,得到

如图所不的残差图:

经计算得了=17,9=13.5,缶%%=1297,安西2=1774,

nn

(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)

(2)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立v关于x的线性

回归方程.(精确到0.1)

着(占一可一刃&

b=25=y-bx,.

题型四:相关系数型

T旨I点I迷I津

,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.

如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相

:关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.

!相关系数/■的性质:

①当r>0时,称成对样本数据正相关;

;当r<0时,成对样本数据负相关;

;当厂=0时,成对样本数据间没有线性相关关系;

②样本相关系数『的取值范围为[-1闻_;

:当年|越接近1时,成对样本数据的线性相关程度越强;

;当W越接近0时,成对样本数据的线性相关程度越弱.

73)兀矗民谓须履拟预测)党的二十大报告提出:"必须坚持新藁济殍声另二人才是黄二逐晨创

新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断

塑造发展新动能新优势."某数字化公司为加快推进企业数字化进程,决定对其核心系统DAP,采取逐年增加

研发人员的办法以提升企业整体研发和创新能力.现对2018〜2022年的研发人数作了相关统计(年份代码厂5

分别对应2018〜2022年)如下折线图:

2018-2022年研发人数折线图

600------------------------------------------------------

500

400

300

200

100—也------------------------------

0------------------------------------------------------

12345

⑴根据折线统计图中数据,计算该公司研发人数,与年份代码1的相关系数乙并由此判断其相关性的强弱;

⑵试求出丁关于元的线性回归方程,并预测2023年该公司的研发人数(结果取整数).

5

参考数据:E(X-V)2=54944,阿丽。741.2当上40.75,1]认为两个变量间的相关性较强

1=1

参考公式:相关系数

.£(可-可(天-力

回归方程y=晟+d中的斜率和截距的最小二乘法估计公式分别为3=上―-----------,a=y-bx.

Z=1

2.(22-23高三上•河南•期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以

其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求

与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强

市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017〜2021年的研发人数作了相

关统计,如下图:

2017~2021年公司的研发人数情况(年份代码1〜5分别对应2017〜2021年)

个研发人数M人)

⑴根据条形统计图中数据,计算该公司研发人数y与年份代码X的相关系数r,并由此判断其相关性的强弱;

(2)试求出y关于X的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)

参考数据:-5丫=55960,"荻它37.4.参考公式:

相关系数r=.线性回归

1=1

.t(一)(…)__

方程的斜率6=上一-----——,截距八丁-".附:

i=l

Id[0,0.25][0.30,0.75)[0.75,1]

相关性弱一般强

3.(2021•云南•模拟预测)西尼罗河病毒(WNV)是一种脑炎病毒,WAV通常是由鸟类携带,经蚊子传播

给人类.1999年8-10月,美国纽约首次爆发了WNU脑炎流行.在治疗上目前尚未有什么特效药可用,感

染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV的复制,抑制

其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5

组实验数据,得到利巴韦林的投入量x(千克)和利巴韦林含片产量y(百盒)的统计数据如下:

投入量X(千克)12345

产量y(百盒)1620232526

由相关系数「可以反映两个变量相关性的强弱,Ide[0.75,1],认为变量相关性很强;|r|e[0.3,0.75],认为

变量相关性一般;I川e[0,0.25],认为变量相关性较弱.

(1)计算相关系数r,并判断变量x、y相关性强弱;

(2)根据上表中的数据,建立y关于x的线性回归方程9=嬴+&;为了使某组利巴韦林含片产量达到150

百盒,估计该组应投入多少利巴韦林?

参考数据:7660«25.69,22(%,-丁)5-刃=25,£-x)2=10,之(%-寸=66.

i=li=li=l

力(%-可(%-区)ta-工)(%-刃

参考公式:相关系数r=/=1线性回归方程9=&中,i>=『-----------,a=y-bx.

i=l

4.(2022高二•全国•专题练习)某数学小组从气象局和医院分别获得了2021年1月至2021年6月每月20日

的昼夜温差x(单位:回,X23)和患感冒人数》的数据,并根据所得数据画出如图所示的折线图.

⑴求y与x之间的相关系数。,并判断y与x的相关性的强弱(匕|>。8时,认为y与x高度相关,即认为

,与X的相关性很强);

(2)建立y关于X的回归直线方程(回归系数的结果精确到0。1),并预测昼夜温差为4。(7时患感冒的人数.

参考数据:卒=54.9,--y)=94,也(内-可=6,甘a2.646.

题型五:二项分布型

指I点I迷I津

若在一次实验中事件发生的概率为Q(0<〃<1),则在〃次独立重复实验中恰好发生七次概率=左)=

C:pkQ-p)T(k=0,1,2,...,小,称4服从参数为的二项分布,记作J~B(n,p),E广叩,

£>i=npq.

1.(24-25高三上•云南昆明•期中)一项没有平局的对抗赛分为两个阶段,参赛者在第一阶段中共参加2场

比赛,若至少有一场获胜,则进入第二阶段比赛,否则被淘汰,比赛结束;进入第二阶段比赛的参赛者共

参加3场比赛.在两个阶段的每场比赛中,获胜方记1分,负方记0分,参赛者参赛总分是两个阶段得分

的总和,若甲在第一阶段比赛中每场获胜的概率都为。,在第二阶段比赛中每场获胜的概率都为1,

Q

每场比赛是否获胜相互独立.已知甲参赛总分为2分的概率为药.(1)求P;

⑵求甲参赛总分X的分布列和数学期望.一

2.(中学生标准学术能力诊断性测试2024-2025学年高三上学期10月测试数学试卷)乒乓球比赛有两种赛

制,其中就有“5局3胜制"和"7局4胜制","5局3胜制”指5局中胜3局的一方取得胜利,"7局4胜制”指

7局中胜4局的一方取得胜利.

⑴甲、乙两人进行乒乓球比赛,若采用5局3胜制,比赛结束算一场比赛,甲获胜的概率为0.8;若采用7

局4胜制,比赛结束算一场比赛,甲获胜的概率为0.9.已知甲、乙两人共进行了加(〃zeN*)场比赛,请根

据小概率值々=0。10的片独立性检验,来推断赛制是否对甲获胜的场数有影响.

(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为p,没有平局.记事件"甲只要取得3局比

赛的胜利比赛结束且甲获胜"为4事件"两人赛满5局,甲至少取得3局比赛胜利且甲获胜”为8,试证明:

P(A)=P(B).

⑶甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是。(P>0.5),没有平局.若采用"赛满2〃-1局,胜方

至少取得w局胜利"的赛制,甲获胜的概率记为尸5).若采用"赛满2"+1局,胜方至少取得〃+1局胜利”的赛

制,甲获胜的概率记为PS+1),试比较P(")与P(〃+l)的大小.

n(ad-be)2

其中孔=〃+/?+c+d.

(a+Z?)(c+d)(a+c)(Z?+d)

尸(心次)

0.050.0250.010

k。3.8415.0246.635

3.(2024・广东广州•模拟预测)在某地区进行高中学生每周户外运动调查,随机调查了1000名高中学生户外

运动的时间(单位:小时),得到如下样本数据的频率分布直方图.

O24681012141618时间(小时)

⑴求。的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)

⑵为进一步了解这1000名高中学生户外运动的时间分配,在。4/6],(16,18]两组内的学生中,采用分层抽

样的方法抽取了5人,现从这5人中随机抽取3人进行访谈,记在。4,16]内的人数为X,求X的分布列和期

望;

⑶以频率估计概率,从该地区的高中学生中随机抽取8名学生,用"4化)"表示这8名学生中恰有七名学生

户外运动时间在(8,10]内的概率,当月出最大时,求左的值.

4.(24-25高二上•黑龙江哈尔滨•阶段练习)如图,在研究某种粒子的实验装置中,粒子从A腔室出发,到

达C腔室,粒子从A室经过1号门进入B室后,等可能的变为上旋或下旋状态,粒子从3室经过2号门进入C

室后,粒子的旋转状态发生改变的概率为1.粒子间的旋转状态相互独立.现有两个粒子从A室出发.

413I*C

高,12“

II

⑴求两粒子进入C室都为上旋状态的概率;

(2)若实验装置出现故障,两个粒子进入C室后,共裂变为机个粒子,裂变后的每个粒子再经过2号门返回8

2

室的概率为1,各粒子返回B室相互独立.

①m=4时,写出返回8室的粒子个数X的分布列、期望、方差;

②加=30时,记有厂个粒子返回8室的概率为了⑺,贝卜为何值时,/⑺取最大值.

题型六:超几何分布

指I点I迷I津

总数为N的两类物品,其中一类为M件,从N中取〃件恰含”中的加件,〃z=0,l,2…,左,其中左为

「n-m

M与〃的较小者,P(J=m)=用:-M,称第服从参数为的超几何分布,记作抑〜

CN

H(N,M,n),此时有公式综=胃。

一般地,假设一批产品共有N件,其中有〃件次品.从N件产品中随机抽取"件(不放回),用X表不抽

取的〃件产品中的次品数,则X的分布列为尸(X=k)=鱼沁,k=m,m+1,m+2,-

r.其中n,

C"N

N,MeN*.M<N,n<N,m=max{O,n-N+M},r=min{凡/}.如果随机变量X的分布列具有上式

的形式,那么称随机变量X服从超几何分布一.风X)=up.

1.(24-25高二下•全国•课后作业)第十四届全国人民代表大会第一次会议于2023年3月5日上午召开.某

社区为了调查社区居民对该会议的关注度,随机抽取了60名社区居民进行调查,并将结果绘制成如图所示

⑴以频率估计概率,若社区计划从60名社区居民中,再次随机抽取三人进行回访,求至少有两人的年龄在

区间[30,35)内的概率;

(2)若[20,25)和[40,45]年龄段的所有居民对该会议的关注度都很高,社区准备从中抽取3人谈谈对该会议的

感受,设4表示年龄段在[20,25)的人数,求D(7J+3).

2.(22-23高三下•山东济宁,开学考试)某市为进行学科能力竞赛表彰,其中数学组、物理组获奖情况如下

表,组委会为使活动有序进行,活跃会场气氛,活动中穿插抽奖活动.并用分层抽样的方法从两个学科组抽

取15人在前排就座,其中物理组有5人.

数学组物理组

男生3020

女生30

⑴求数学组中女生的人数;

(2)若从前排就座的物理组5人中任选2人上台领奖,设女生的人数为X,求女生人数X的分布列和数学期

望.

3.(24-25高二下•全国•课后作业)某校为了了解学情,对各学科的学习兴趣作了问卷调查,经过数据整理

得到下表:

语文兴趣数学兴趣英语兴趣物理兴趣化学兴趣生物兴趣

答卷份数350470380400300500

兴趣良好频率0.70.950.80.750.850.86

假设每份调查问卷只调查一科,各类调查是否达到良好的标准相互独立.

⑴从收集的答卷中随机选取一份,求这份试卷的调查结果是英语兴趣良好的概率;

(2)从该校任选一位同学,试估计他在语文兴趣良好、数学兴趣良好、生物兴趣良好方面,至少具有两科兴

趣良好的概率;

⑶按分层抽样的方法从参与物理兴趣和化学兴趣调查的同学中抽取7人,再从这7人中抽取3人,记3人

中来自化学兴趣的人数为",求〃的分布列和期望.

4.(24-25高三上•四川成都•阶段练习)2024年7月26日,第33届夏季奥林匹克运动会在法国巴黎正式开

幕.人们在观看奥运比赛的同时,开始投入健身的行列.某兴趣小组为了解成都市不同年龄段的市民每周锻炼

时长情况,随机从抽取200人进行调查,得到如下列联表:

周平均锻炼时长

年龄合计

周平均锻炼时间少于4小时周平均锻炼时间不少于4小时

50岁以下4060100

50岁以上(含50)2575100

合计65135200

⑴试根据,=0.05的/独立性检验,分析周平均锻炼时长是否与年龄有关?(/精确到0.001);

(2)现从50岁以下的样本中按周平均锻炼时间是否少于4小时,用分层随机抽样法抽取5人做进一步访谈,

题型七:正态分布型

指I点I迷I津

(1)若X是正态随机变量,其概率密度曲线的函数表达式为/'(x)=^^e2/,XGR(其中〃,o■是

弋2兀a

参数,且cr>0,-co</j<+co)o

其图像如图13-7所示,有以下性质:

①曲线在无轴上方,并且关于直线x=〃对称;

②曲线在x=〃处处于最高点,并且此处向左右两边延伸时,逐渐降低,呈现“中间高,两边低”的形状;

③曲线的形状由。确定,a越大,曲线越“矮胖”,b越小,曲线越“高瘦”;

④/(%)图像与x轴之间的面积为1.

(2)〜,D^=(y-,记作.〜NJ,。?).

;当〃=0,cr=l时,邮』服从标准正态分布,记作曲〜N(0,l).

(3)|<|]〜N(〃,cr2),则叫在(〃一cr,〃+cr),(〃一2cr,〃+2cr),(〃一3cr,〃+3cr)上取值的概率分别为

68.3%,95.4%,99.7%,这叫做正态分布的3b原则。

1.(20五疝面露瓶叔神而一融翠而藕薪・筋亍二薪薪碗花奉「笄龙疝尸赢"云)丽黄奉康存亍阜一

次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现

对测试数据进行整理,得到如下的频率分布直方图:

(1)估计这100辆汽车的单次最大续航里程的平均值元(同一组中的数据用该组区间的中点值代表);

(2)由频率分布直方图计算得样本标准差s的近似值为49.75.根据大量的汽车测试数据,可以认为这款汽车的

单次最大续航里程X近似地服从正态分布其中〃近似为样本平均数元,。近似为样本标准差£

(0)利用该正态分布,求P(250.25<X<399.5);

(回)假设某企业从该汽车公司购买了20辆该款新能源汽车,记Z表示这20辆新能源汽车中单次最大续航

里程位于区间(250.25,399.5)的车辆数,求E(Z);

参考数据:若随机变量^服从正态分布N(〃,4),则P(M-b<J<〃+b)=0.6827,

P(ku-2cr<<^<//+2cr)=0.9545,P(//-3cr<4<〃+3cr)=0.99731.

⑶某汽车销售公司为推广此款新能源汽车,现面向意向客户推出"玩游戏,送大奖”活动,客户可根据抛掷

硬币的结果,操控微型遥控车在x轴上从原点。出发向右运动,已知硬币出现正、反面的概率都;,客户

每掷一次硬币,遥控车向右移动一次,若掷出正面,则遥控车向移动一个单位,若掷出反面,则遥控车向

右移动两个单位,直到遥控车移到点(59,0)(胜利大本营)或点(60,0)(失败大本营)时,游戏结束,

若遥控车最终停在"胜利大本营",则可获得购车优惠券.设遥控车移到点(",0)的概率为月(1W〃(6O),试证

明数列花-月/是等比数列(2W〃W59),求出数列陀}(1W/W60)的通项公式,并比较4和%的大小.

2.(24-25高三上•广西贵港•开学考试)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的

100名学生,整理得到如下列联表:

男学生女学生合计

喜欢跳绳353570

不喜欢跳绳102030

合计4555100

⑴依据a=0.1的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联?

⑵已知该校学生每分钟的跳绳个数X〜N070,100),该校学生经过训练后,跳绳个数都有明显进步.假设经

过训练后每人每分钟的跳绳个数都增加10,该校有1000名学生,预估经过训练后该校每分钟的跳绳个数在

[170,200]内的人数(结果精确到整数).

n(ad-be)2_,,,

P(T•X2—7j\//\/j中〃=a+b+c+d

a0.10.050.01

%2.7063.8416.635

若X〜N(〃,〃),则P(〃-erWXW〃+cr)。0.6827,P(〃-2(rWXW〃+2o■卜0.9545,

P(〃一3bVXW〃+3b)a0.9973.

3.(2024•辽宁,模拟预测)某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,

对其生产的第一批零件的内径进行测量,统计绘制了如下图所示的频率分布直方图.

⑴求。的值以及这批零件内径的平均值方和方差S2(同一组中的数据用该组区间的中点值作代表);

(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间[2.45,2.55)内的零件个数为Z,求Z的

分布列以及数学期望;

⑶已知这批零件的内径X(单位:mm)服从正态分布现以频率分布直方图中的平均数元作为〃

的估计值,频率分布直方图中的标准差6作为的估计值,则在这批零件中随机抽取200个,记内径在区间

[2.285,2.705]上的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论