高考专题练习 概率统计中的数学建模与数据分析_第1页
高考专题练习 概率统计中的数学建模与数据分析_第2页
高考专题练习 概率统计中的数学建模与数据分析_第3页
高考专题练习 概率统计中的数学建模与数据分析_第4页
高考专题练习 概率统计中的数学建模与数据分析_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1-,1-,s2.(2020·广东六校第一次联)某机构组织语文、数学学科能力竞赛,按照一定比例淘汰后发一等奖(分别对应成绩等级的一等级)有某考场所有考生的两科成绩等级统计如图所示中获数学二等奖的考生有12.图1求该考场考生中获语文一等奖的人数;用随机抽样的方法从获得数学和语文二等奖的考生中各抽取人,进行综合素质测试,将他们的综合得分绘成茎叶图(如图2所示),求样本的平均数及方差并进行比较分析;图2已知本考场的所有考生中,恰有人两科均获一等奖,在至少一科获一等奖的考生中,随机抽取2人进行访谈,求这人两科均获一等奖的概率.【解】

因为获数学二等奖的考生有12人,所以该考场考生的总人数为

121-0.260.10

=50.故该考场获语文一等奖的考生人数为×(1×-=4.-(2)获数学二等奖考生综合得分的平均数和方差分别为,s2

,获语文二等奖考生综合得分的平均数和方差分别为x

22

51521515113112515215151131122312233-8184++93x=

=88-7989++87x=

=85ss

×[(7)(-2+222]22,×[(6)42(1)12]11.6,因为以获数学二等奖考生较获语文二等奖考生综合素质测试的平均分高,但是成绩差距较大.两科均获一等奖的考生共有人,则仅数学获一等奖的考生有人,仅语文获一等奖的考生有人,把两科均获一等奖的人分别记为1A2A仅数学获一等奖的2分别记为B,2,语文获一等奖的1人为则在至少一科获一等奖的考生中随机抽取2的基本事件有AA,,,BA,AB,ABABABBB,BC,共个.记“这人两科均获一等奖为事件,则事件M含的基本事件有12,A1A,A2A,个,所以P()=15

,故这人两科均获一等奖的概率为

15

.统计与概率“搭台”,方案选择“唱戏”破解此类频率分布直方图层抽样与概率相交汇的开放性问题的关键是会观图读数据能从频率分布直方图中读出频率进而求出频数是能根据

33分层抽样的抽样比或各层之间的比例求出分层抽样中各层需取的个数是会转化,会对开放性问题进行转化.某校学生参与一项社会实践活动,受生产厂家委托采取随机抽样方法调查我市市民对某新开发品牌洗发水的满意度同学们模仿电视问政的打分制由被调查者在0分到的整数分中给出自己的认可分数现将收集到的100市民的认可分数分为6组,50),[6070),,[80,90),,,绘制出如图所示的频率分布直方图.求这100市民认可分数的中位数(精确到,平均数(同一组中的数据用该组区间的中点值作代表);生产厂家根据同学们收集到的数据,拟随机在认可分数为80及其以上的市民中选出2市民当产品宣传员求这2位宣传员都来自认可分数为的概率.解:由于[40,50),[50,60),[60,的频率分别有0.1,0.20.3.故中位数位于[60,中,其值为60×

2≈平均为10(45×55×0.0265×750.02585×+950.005)=67.认可分数位于[,90)人数为10,可分数位于[90,人数为5,从认可分数位于[90,的5中随机选择2的基本事件数为12+=10从认可分数位于[80,和[90,的15中随机选择2人的基本事件数为+23…+14

102102故这位宣传员都来自认可分数为[90,100]的概率为=10521

.图表与独立性检验相交汇(师生共研)某种常见疾病可分为Ⅰ,Ⅱ两种类型.为了了解所患该疾病类型与地域、初次患该疾病的年(位:岁)(以下简称初次患病年)关系,在甲、乙两个地区随机抽取名患者调查其所患疾病类型及初次患病年龄到如下数据.初次患病年龄[10,[20,[30,[40,[50,[60,70]

甲地Ⅰ型疾病患者人843332

甲地Ⅱ型疾病患者/人1358911

乙地Ⅰ型疾病患者/人532421

乙地Ⅱ型疾病患者/114467从Ⅰ型疾病患者中随机抽取1人其初次患病年龄小于岁的概率;(2)记“初次患病年龄[10,的患者”为“低龄患者”初次患病年龄在[40内的患者”为“高龄患者”.根据表中数据,决以下问题.①将以下两个列联表补充完整判断“地域”“初次患病年龄”这两个变量中哪个变量与所患疾病的类型有关联的可能性更大.(直接写出结论,不必说明理由)表一患者所在地域

疾病类型

Ⅰ型

Ⅱ型

总计甲地乙地总计

100表二

0000初次患病年龄低龄高龄总计

疾病类型

Ⅰ型Ⅱ型

总计100②记①中与所患疾病的类型有关联的可能性更大的变量为99.9%的把握为所患疾病的类型与有关?

问:是否有附:K

2

n(-)2=,其中=+++d.(a+b)(+d)(a+)(+)(K2)k

0.10

0.05

【解】(1)题意,、乙两地Ⅰ型疾病患者共40,、乙两地Ⅰ型疾病患者初次患病年龄小于岁的人数分别为15则从Ⅰ型疾病患者中随机抽取人,其初次患病年龄小于岁的概率的估计值为

1510=408

.①填空结果如下.表一疾病类型Ⅰ型

Ⅱ型

总计患者所在地域甲地乙地总计

231740

372360

6040100表二疾病类型Ⅰ型

Ⅱ型

总计初次患病年龄

低龄高龄总计

251540

154560

4060100“初次患病年龄”与所患疾病的类型有关联的可能性更大.②由①可知X初次患病年龄,据表二中的数据可得=b15=15d45n100,则K

2

100××-×15=14.063,40×××因为,故有99.9%把握认为所患疾病类型与初次患病年龄有关.本题的易错点有三处是审题不认真误认为甲两地区Ⅰ疾病患者的总数为100误列式

1510100

=0.25不能从频数分布表中获取相关数据无法正确填写列联表不能根据列联表中数据的含义做出正确判断是代错公式或计算错误,从而导致统计判断出错.(2021·福州市适应性考试世界互联网大会是由中华人民共和国倡导并每年在浙江省嘉兴市桐乡乌镇举办的世界性互联网盛会会旨在搭建中国与世界互联互通的国际平台和国际互联网共享共治的中国平台各国在争议中求共识、在共识中谋合作、在合作中创共年11月23至日,第七届世界互联网大会如期举行,为了大会顺利召开,组委会特招募000志愿者.某部门为了了解志愿者的基本情况,调查了其中00名志愿者的年龄(单:岁),得到了他们年龄的中位数为,年龄在[,内的人数为15,并根据调查结果画出如图所示的频率分布直方图.

0000求,的值并估算出志愿者的平均年龄(同一组的数据用该组区间的中点值代表);(2)这次大会志愿者主要通过现场报名和登录大会官网报名,即场和网络两种方式报名参加这名志愿者的报名方式部分数据如下表所示完善下面的表格,通过计算说明能否在犯错误的概率不超过的前提下,认为“选择哪种报名方式与性别有关系”?男性

女性

总计现场报名

50网络报名

31总计

50参考公式及数据:

2

n()2=,(a+b)(+)(a)(b+d)其中n=ab+c+d.(K2≥k)k

0.05

0.01

解:因为志愿者年龄在[40,内的人数为,所以志愿者年龄在[,45)内的频率为

15100

=由频率分布直方图,m+×0.15,,①由中位数为可得,0.02052×5×(3430)0.5,5m4n,②由①②解得=0.020n0.025.所愿的均年(22.5××32.5×

1212×0.050×0.030×0.010)×=34()根据题意得到列联表,所以

K2=

男性女性总计现场报名193150网络报名311950总计5050100100×1919313122×[+31×(-)]=505050×5050××

2

=5.76<10.828,所以不能在犯错误的概率不超过0.001前提下认为“选择哪种报名方式与性别有关系”.图表与线性回归分析相交汇(师生共研)如图是某部门公布的一年内道路交通事故成因分析,由图可知,超速驾驶已经成为交通事故的一个主要因素研究表明急刹车时的停车距离等于反应距离与制动距离的和表是根据某部门的调查结果整理所得的数据v表示行车速度,单位:d,分别表示反应距离和制动距离,单位m).v

64

72

80

89

97

105

113

121

128

135d

1

13.4

15.2

16.7

18.6

20.1

21.9

23.5

25.3

26.8

28.5从一年内发生的道路交通事故中随机抽出起进行分析研究,求其中恰好有1属于超速驾驶的概率(用频率代替概率);

参考数据:∑v=1∑(d)=210,(d)22,参考数据:∑v=1∑(d)=210,(d)22,=106i1ii1ii12nniii=i=55iiiiii已知与的平方成正比,且当行车速度为100时,制动距离为65①由表中数据可知,d与之间具有线性相关关系请建立1与之间的回归方程,并估计车速为的停车距离;②我国《道路交通安全法》规定:车速超过时,应该与同车道前车保持100以上的距离,请解释一下上述规定的合理性.101010∑i

1i

1i

1i

111≈52参考公式:对于一组数据(x,),(,y),…,(x,y),其回归直线y=+a的斜率和截距的最小二乘估计分别为=--bx

n--∑()(yyn-∑()2i1

-=【解】

(1)由题意可,从年内发生的交通事故中随机抽出一起事故则该起事故是恰好是超速驾驶的概率为,“好有一起事故属于超速驾驶”为事件A则P(A)3×

1148×125由题意,设2k

2

,当行车速度为100km/h时,制动距离为m.所以k,即

2

=v①设

1

=b+ann(x-x)(y)-xy因为=

i

1

i

1

,n(x-x)2

n2-x

2i

1

i

1

1i1^^1i1^^10--idi10d

1所以=

i

110

2i

--10v

2i

1=

22-10××10610

15

≈,故

1

=0.21+*把(,代入*,解得=-0.084所以

与v之间的回归方程为=v-设停车距离为,则=

1d2,=0.006v

2

+0.21-0.084当v=110km/h,d101.666,即车速为110km/h的停车距离为m.②易知当车速为时,停车距离为85.916,该距离小于,又因为当车速为时的停车距离为m,距离大于100m由以上两个数据可知车速超过100时须与同车道前车保持100m上的距离才能保证行驶安全.破解此类分层抽样率性回归相交汇的开放性问题的关键是会制图即会根据频数分布表把两组数据填入茎叶图中是会对开放性问题进行转化熟练掌握求线性回归方程的步骤出ab可写出线性回归方程.一个工厂在某年里连续月每月产品的总成本y万元)与该月产量x万件)之间有下一组数据,xy

1.082.25

1.122.37

1.192.40

1.282.55

1.362.64

1.482.75

1.592.92

1.683.03

1.803.14

1.873.26通过画散点图发现可用线性回归模型拟合yx的关系请用相关系数加以说明;

10iiii^iiii^iia+bx斜率和截距的最小二乘估10iiii^iiii^iia+bx斜率和截距的最小二乘估计公式分别为=i^-^^2i,2i-^-^^①建立月总成本与月产量x之间的线性回归方程;②通过建立的y关于x的回归方程,估计某月产量为1.98万件时,产品的总成本为多少万元?(均精确到0.001)附注:①参考数据∑∑27.31,ii110-∑x-10xi1

2

≈0.850,

10-∑y-10yi1

2

≈,≈1.223.②参考公式:相关系r=

n--∑xy-nxi1n--(∑x-n)∑y-nyi1i

2

,回归直线y=n--∑xy-nx^^^in-∑-ni

,a=-x解:由已知条件得,rb

10-∑-i10-∑-i1所以r1.223

≈,这说明y与x正相关,且关性很强.-①由已知求得x

=,y2.731,aybx×1.445,所以所求回归直线方程为y1.223x0.964.②当x1.98时=×+0.964≈3.386(元),此时产品的总成本约为3.386万元.[A级

基础练]1.(2020·考全国卷Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:

40284028件)按标准分为A,B,,D四个等级.加工业务约定:对于A级品、B品、C级品,厂家每件分别收取加工费90,50元,元;对于级品,厂家每件要赔偿原料损失费元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为元件.厂家为决定由哪个分厂承接加工业务两个分厂各试工了件这种产品统计了这些产品的等级,整理如下,甲分厂产品等级的频数分布表等级频数

A40

B20

C20

D20乙分厂产品等级的频数分布表等级频数

A28

B17

C34

D21分别估计甲、乙两分厂加工出来的一件产品为A级品的率;分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解:由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为=0.4100乙分厂加工出来的一件产品为A级品的概率的估计值为=0.28.100由数据知甲分厂加工出来的产品利润的频数分布表为利润频数

6540

2520

-520

-7520因此甲分厂加工出来的件产品的平均利润为654025×5×-×100

=15.由数据知乙分厂加工出来的件产品利润的频数分布表为利润

70300

-70

=200=200频数

28173421因此乙分厂加工出来的件产品的平均利润为702830×0×-×100

=10.比较甲、乙两分厂加工的产品的平均利润应选甲分厂承接加工业务.2福州市质量检测)垃圾分一分美十分圾分类人有责市为进一步推进生活垃圾分类工作调动全民参与的积极性举办“垃圾分类游戏挑战赛统计,在为期2月的活动中,共有万人参与.为鼓励市民积极参与活动市文明办随机抽取名参与该活动的网友以他们单次游戏得分作为样本进行分析,由此得到如下频数分布表,单次游戏得分频数

[30,10

[40,50)40

[50,60

[60,40

[70,80)30

[80,90]20根据数据,估计参与活动的网友单次游戏得分的平均值及标准(同一组中的数据用该组区间的中点值作代表其中标准差的计算结果要求精确到0.01);(2)若要从单次游戏得分40),[6070),[80,90]的三组参与者中,用分层抽样的方法选取7人进行电话回访再从这7人中任选2赠送话费求此2单次游戏得分不在同一组内的概率.附:185≈370≈解:参与该活动的网友单次游戏得分的平均值-x××+×+55×6065×+×+85×=60.标准差s

25

2

×1015

2

×402×6052200

×4015

2

×3025

2

×20=185≈13.60.用分层抽样抽取人,其中得分在[30,的有人,得分在[60,70)有人,得分在[80,的有2.

134122341212114112324212233132414134122341212114112324212233132414212121314232431272^^^^ii,a=-xi5iii112112211112222分别记为,b

,b,b,b,,c,7人中任选人有21种结果,别是(ab

1

,(a,b),ab)(a),a),(a,),(b,b),b,b),b,b)(b,)(b,c),b,b),b,b),(b,)(b,c),(b,b,b,c),b,),b,),b,c),,c)其中人得分在同一组的有7分别是{b}{,}{,b}{,}

}{b}{bb}{b,故人得分不在同一组内的概率=1=213

.3.最近青年的视力健康问题引起家长们的高度重视,某地区为了解当地24小学24初中和所高中的学生的视力状况准备采用分层抽样的方法从这些学校中随机抽取5所学校对学生进行视力调查.若从所抽取的所学校中再随机抽取3所学校进行问卷调查,求抽到的这3学校中,小学、初中、高中分别有一所的概率;若某小学被抽中,调查得到了该小学前五个年级近视率的数据如下表,年级号x近视率y

10.05

20.09

30.16

40.20

50.25根据前五个年级的数据利用最小二乘法求出y关于的线性回归方程并根据方程预测六年级学生的近视率.附:回归直线yba斜率和截距的最小二乘法估计公式分别为n--∑xy-nxi1^-^n-∑x-n

b=i

1

参考数据:∑y=2.76∑x=55.i

1i

1解:由24∶24∶12∶∶,抽取的5学校中有所小学2初中、1高中,分别设为

,a,b,b,c,从这所学校中随机抽取3学校的所有基本事件为a

,a,b),(a,a,b,(a,a,c,(a,b,b),ab),ab,(a,b,b),(a,b,

21111221224211112212242----数据:∑5iii^^^^c,(a,,c,(b,b,c),10,设事件A表示“抽到的这3所学校中,小学、初中、高中分别有一所”,则事件A包含的基本事件为(

,b,c,(a,b,c),a,b,c),a,b,,共种,故P(A)=10

.-由题中表格数据得x

=3=0.15x=2.255x245且由参考xy=,=55,i1i得b

2.765545

=,a

=0.150.051×3-,得线性回归方程为=0.051x0.003.当x6,代入得y×-=,所以六年级学生的近视率在0.303左右.[B级

综合练]4.某网络台从购买该平台某课程的客户中,随机抽取了位客户的数据,并将这100数据按学时数、客户性别等进行统计,整理得到下表:学时数

[5,,20)[20,,35)[35男性女性

182

124

98

92

67

413

24根据上表估计男性客户购买该课程学时数的平均(同一组中的数据用该组区间的中点值作代表,结果保留小数点后两位);从这100客户中,对购买该课程学时数20下的女性客户按照分层抽样的方式随机抽取7人从这7中随机抽取人求这人购买的学时数都不低于15概率;将购买该课程达到学时及以上者视为“十分爱好该课程者”学时以下者视为“非十分爱好该课程者”,请根据已知条件完成以下×列联表,

00-111234100-111234123412242122342114243462并判断是否有的把握认为“十分爱好该课程者”与性别有关?非十分爱好该课程者

十分爱好该课程者

总计男性女性总计

100附:K

2

n(-)2=,其中=+++d.(a+b)(+d)(a+)(+)(K

2

≥k)

k

解:依题意,在这100位购买该课程的客户中,男性客户购买该课程学值=

60

×(7.5×12.5×9×27.5×6×+37.52)≈16.92.所以估计男性客户购买该课程学时数的平均值为设“所抽取的2人购买的学时数都不低于15”事件,依题意按照分层抽样的方式分别从学时数[5,[10,,女性客户中抽取1人(设为),人(别设为b

,b),4人(别设为c,c,,c)则从这人中随机抽取2所包含的基本事件为ab

,ab,ac,ac,,acb,bcbbc,bc,b,bbc,b,cc,c,cc,c,c,共21个,其中事件A包含的基本事件为c1c2cc4c2共个.所以事件A生的概率(==217依题意得×2联表如下,非十分爱好该课程者

.

十分爱好该课程者

总计男性

48

12

60

K

2

女性1624总计6436100×482416122=64××40

40100故有99.9%把握认为“十分爱好该课程者”与性别有关.5.某客户察了一款热销的净水器,使用寿命为十年,该款净水器为三级过滤每一级过滤都由核心部件滤芯来实现在使用过程中一级滤芯需要不定期更换,其中每更换3个一级滤芯就需要更换个二级滤芯,三级滤芯无需更换其中一级滤芯每个元二级滤芯每个400记一台净水器在使用期内需要更换的二级滤芯的个数构成的集合为.如图是根据台该款净水器在十年使用期内更换的一级滤芯的个数制成的柱状图.结合柱状图,写出集合M根据以上信息,求一台净水器在使用期内更换二级滤芯的费用大于1元的概率(以台净水器更换二级滤芯的频率代替1净水器更换二级滤芯发生的概率);若在购买净水器的同时购买滤芯,则滤芯可享受5折优惠(使用过程中如需再购买无优惠).假设上述100台净水器在购机的同时,每台均购买a个一级滤芯b二级滤芯作为备用滤芯(其中bM+=14)计算这台净水器在使用期内购买滤芯所需总费用的平均数并以此作为决策依据如果客户购买净水器的同时购买备用滤芯的总数也为14,则其中一级滤芯和二级滤芯的个数应分别是多少?解(1)题意可知当一级滤芯更换,10,11时,级滤芯需要更换个,当一级滤芯更换个时,二级滤芯需要更换4,

3030所以M{3,4}.由题意可知,二级滤芯更换个,需1元,二级滤芯更换4,需600,在100台净水器中,二级滤芯需要更换个的净水器共台,二级滤芯需要更换

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论