高考数学 提炼信息——数据分析与模型建构_第1页
高考数学 提炼信息——数据分析与模型建构_第2页
高考数学 提炼信息——数据分析与模型建构_第3页
高考数学 提炼信息——数据分析与模型建构_第4页
高考数学 提炼信息——数据分析与模型建构_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 / 25 提炼信息提炼信息数据分析与模型建构数据分析与模型建构 微点聚焦突破 概率统计综合问题是高考应用型问题,解决问题需要经历收集数据、整理数据、分析数据、处理数据、得出有用的结论几个复杂过程如果数据处理不当则会陷入庞大的数据运算中,因此解决这类问题首先需要根据题目条件提取有用数据,然后根据统计思想对数据进行相关处理、运算,下面就如何从概率统计综合问题中迅速提取数据,并作出正确处理及模型构建提供典例展示 类型一 频率分布直方图、条形图数据处理及模型建构 【例 1】 (2016 全国卷)某公司计划购买 2 台机器,该种机器使用三年后即被淘汰机器有一易损零件,在购进机器时,可以额外购买这种零

2、件作为备件,每个 200 元在机器使用期间,如果备件不足再购买,则每个 500 元现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种机器在三年使用期内更换的易损零件数,得下面柱状图: 以这 100 台机器更换的易损零件数的频率代替 1 台机器更换的易损零件数发生的概率,记 x 表示 2 台机器三年内共需更换的易损零件数,n 表示购买 2 台机器的同时购买的易损零件数 (1)求 x的分布列; (2)若要求 p(xn)0.5,确定 n 的最小值; (3)以购买易损零件所需费用的期望值为决策依据,在 n19 与 n20 之中选其一,应选用哪个? 解 (1)由柱状图并以频率代

3、替概率可得,一台机器在三年内需更换的易损零件2 / 25 数为 8,9,10,11 的概率分别为 0.2,0.4,0.2,0.2.可知 x 的所有可能取值为16、17、18、19、20、21、22, p(x16)0.20.20.04; p(x17)20.20.40.16; p(x18)20.20.20.40.40.24; p(x19)20.20.220.40.20.24; p(x20)20.20.40.20.20.2; p(x21)20.20.20.08; p(x22)0.20.20.04; 所以 x的分布列为 x 16 17 18 19 20 21 22 p 0.04 0.16 0.24 0

4、.24 0.2 0.08 0.04 (2)由(1)知 p(x18)0.44,p(x19)0.68,故 n 的最小值为 19. (3)记 y表示 2 台机器在购买易损零件上所需的费用(单位:元) 当 n 19 时 , e(y) 192000.68 (19200 500)0.2 (19200 2500)0.08(192003500)0.044 040. 当 n20 时, e(y)202000.88(20200500)0.08(202002500)0.04 4 080. 可知当 n19 时所需费用的期望值小于 n20 时所需费用的期望值,故应选 n19. 思维升华 频率分布直方图、条形图、柱状图等是

5、考查数据收集和整理的常用依据,掌握图中常见数据的提取方法,将频率看作概率是解决这类问题的关键 【训练 1】 某市某中学的环保社团参照国家环境标准制定了该市空气质量指数与空气质量等级对应关系,如下表(假设该区域空气质量指数不会超过 300) 空气质量指数 (0,50 (50,100 (100,150 (150,200 (200,250 (250,300 空气质量等级 1 级优 2 级良 3级轻度污染 4级中度污染 5 级重度污染 6 级严重污染 3 / 25 该社团将该市在 2020 年 100 天的空气质量指数监测数据作为样本,绘制的频率分布直方图如图,把该直方图所得频率估计为概率 (1)请估

6、算 2020 年(以 365 天计算)全年该市空气质量优良的天数(未满一天按一天计算); (2)该市将于 2020 年 12月 25、26、27日举办一场国际会议,若这三天中某天出现 5 级重度污染,则该天需要净化空气费用 10 万元,出现 6 级严重污染,则该天需要净化空气费用 20 万元,假设每天的空气质量等级相互独立,记这三天净化空气总费用为 x万元,求 x 的分布列及数学期望 解 (1)由直方图可得 2020 年(以 365 天计算)全年该市空气质量优良的天数为(0.0020.004)503650.3365109.5110. (2)由题可知,x的所有可能取值为 0,10,20,30,4

7、0,50,60, 则 p(x0)45364125, p(x10)c1311045224125, p(x20)c231102451c1311045210850027125, p(x30)1103c13110c1211045491 000, p(x40)c231102110c23110245271 000, p(x50)c23110211031 000, p(x60)110311 000, x的分布列为 x 0 10 20 30 40 50 60 4 / 25 p 64125 24125 27125 491 000 271 000 31 000 11 000 e(x)064125102412520

8、2712530491 00040271 0005031 0006011 0009(万元) 类型二 茎叶图数据分析及模型建构 【例 2】 (2018 全国卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式为比较两种生产方式的效率,选取 40名工人,将他们随机分成两组,每组 20 人,第一组工人用第一种生产方式,第二组工人用第二种生产方式根据工人完成生产任务的工作时间(单位:min)绘制了如图所示的茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求 40名工人完成生产任务所需时间的中位数 m,并将完成生产任务所需时间超过 m和不超过 m

9、的工人数填入下面的列联表: 超过 m 不超过 m 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异? 附:k2n(adbc)2(ab)(cd)(ac)(bd), p(k2k0) 0.050 0.010 0.001 k0 3.841 6.635 10.828 解 (1)第一种生产方式时间集中在区间80,90,且平均工作时间x184. 第二种生产方式的时间集中在区间70,80),且平均工作时间x274.7. x1x2,所以第一种生产方式完成任务的平均时间大于第二种, 第二种生产方式的效率更高 5 / 25 (2)由茎叶图数据得到 m80.

10、 由此填写列联表如下: 超过 m 不超过 m 总计 第一种生产方式 15 5 20 第二种生产方式 5 15 20 总计 20 20 40 (3)根据(2)中的列联表计算 k2n(adbc)2(ab)(cd)(ac)(bd)40(151555)220202020106.635,所以有 99%的把握认为两种生产方式的效率有差异 思维升华 茎叶图提供了具体的数据,找准各组数据共同的茎及各自的叶是处理此类问题的关键如果所有数据过大,在计算平均数时,可以将所有数据同时减去一个数字再计算,减去一个数后方差不变,另外除了要掌握各类数据的计算方法以外,还要能从提供的数据的趋势分析预测结果茎叶图数据很具体,常

11、联系古典概型进行考查 【训练 2】 甲、乙两名运动员参加“选拔测试赛”,在相同条件下,两人 6 次测试的成绩(单位:分)记录如下: 甲 86 77 92 72 78 84 乙 78 82 88 82 95 90 (1)用茎叶图表示这两组数据,现要从中选派一名运动员参加比赛,你认为选派谁参赛更好?说明理由(不用计算) (2)若将频率视为概率,对运动员甲在今后 3 次测试中的成绩进行预测,记这 3次测试的成绩高于 85 分的次数为 x,求 x 的分布列和数学期望 e(x)及方差d(x) 解 (1)茎叶图如图: 6 / 25 由图可知乙的平均水平比甲高,故选派乙参赛更好 (2)由题意得,甲运动员每次

12、测试的成绩高于 85 分的概率是13,3 次测试的成绩高于 85 分的次数 x 服从二项分布,即 xb3,13,x 所有可能的取值为 0,1,2,3, 所以 p(x0)c03130233827, p(x1)c1313123249, p(x2)c2313223129, p(x3)c33133230127, x的分布列为 x 0 1 2 3 p 827 49 29 127 e(x)3131,d(x)3132323. 类型三 表格数据的提取、处理及模型建构 【例 3】 (2020 山东名校联考)甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪 80 元,每单送餐员抽成 4 元;乙公司,无底

13、薪,40 单以内(含 40 单)的部分送餐员每单抽成 6 元,超出 40 单的部分送餐员每单抽成 7元假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其 50 天的送餐单数,得到如下频数表: 甲公司送餐员送餐单数频数表 送餐单数 38 39 40 41 42 天数 10 15 10 10 5 乙公司送餐员送餐单数频数表 送餐单数 38 39 40 41 42 天数 5 10 10 20 5 7 / 25 (1)现从记录甲公司的 50 天送餐单数中随机抽取 3天的送餐单数,求这 3天送餐单数都不小于 40的概率 (2)若将频率视为概率,回答下列两个问题: 记

14、乙公司送餐员日工资为 x(单位:元),求 x的分布列和数学期望 e(x); 小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王做出选择,并说明理由 解 (1)设抽取的 3 天送餐单数都不小于 40 为事件 m,甲公司记录的 50 天中,有 1010525天送餐单数不小于 40, 则 p(m)c325c35023196. (2)设乙公司送餐员的送餐单数为 a, 当 a38 时,x386228, 当 a39 时,x396234, 当 a40 时,x406240, 当 a41 时,x40617247, 当 a42 时,x40627254, 所以 x的所

15、有可能取值为 228,234,240,247,254. 故 x的分布列为 x 228 234 240 247 254 p 110 15 15 25 110 所以 e(x)228110234152401524725254110241.8. 依题意,甲公司送餐员的日平均送餐单数为 380.2390.3400.2410.2420.139.7, 所以甲公司送餐员的日平均工资为 80439.7238.8元 由得乙公司送餐员的日平均工资为 241.8元 因为 238.8241.8,所以推荐小王去乙公司应聘 思维升华 处理表格数据的关键是搞清表格中各行、各列数的意义,解决问题的关键是以频率视为概率,用样本估

16、计总体 【训练 3】 (2019 全国卷)某行业主管部门为了解本行业中小企业的生产情8 / 25 况,随机调查了 100 个企业,得到这些企业第一季度相对于前一年第一季度产值增长率 y 的频数分布表 y 的分组 0.20,0) 0,0.20) 0.20,0.40) 0.40,0.60) 0.60,0.80) 企业数 2 24 53 14 7 (1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表)(精确到 0.01)附: 748.602. 解 (1)根据产值增长率频数分布表得

17、,所调查的 100 个企业中产值增长率不低于 40%的企业频率为1471000.21. 产值负增长的企业频率为21000.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比例为 21%,产值负增长的企业比例为 2%. (2)100 个企业的产值增长率平均数为 y1100(0.1020.10240.30530.50140.707)0.30, s211005i1ni(yiy)2 1100(0.40)22(0.20)22402530.202140.40270.029 6, s 0.029 60.02 740.17. 所以,这类企业产值增长率的平均数与标准差的估计值分别为

18、0.30,0.17. 类型四 折线图中的数据分析及模型建构 【例 4】 (2020 广州调研)某基地蔬菜大棚采用无土栽培的方式种植各类蔬菜根据过去 50 周的资料显示,该地周光照量 x(小时)都在 30 小时以上,其中不足 50 小时的有 5 周,不低于 50 小时且不超过 70 小时的有 35 周,超过 70 小时的有 10 周根据统计,该基地的西红柿增加量 y(千克)与使用某种液体肥料的质量 x(千克)之间的关系为如图所示的折线图 9 / 25 (1)依据折线图,是否可用线性回归模型拟合 y 与 x 的关系?请计算相关系数 r并加以说明(精确到 0.01)(若|r|0.75,则线性相关程度

19、很高,可用线性回归模型拟合) (2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪运行台数受周光照量 x限制,并有如下关系: 周光照量 x (单位:小时) 30x50 50x70 x70 光照控制仪最多可运行台数 3 2 1 若某台光照控制仪运行,则该台光照控制仪周利润为 3 000 元;若某台光照控制仪未运行,则该台光照控制仪周亏损 1 000 元以频率作为概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台? 附:相关系数公式 rni1 (xix)(yiy)ni1 (xix)2ni1 (yiy)2, 参考数据: 0.30.55, 0.90.9

20、5. 解 (1)由已知数据可得x2456855, y3444554. 因为5i1 (xix)(yiy)(3)(1)000316,5i1 (xix)2(3)2(1)20212322 5, 5i1 (yiy)2 (1)202020212 2. 所以相关系数 r5i1 (xix)(yiy)5i1 (xix)25i1 (yiy)262 5 29100.95. 因为 r0.75,所以可用线性回归模型拟合 y 与 x 的关系 10 / 25 (2)记商家周总利润为 y 元,由条件可知至少需安装 1 台,最多安装 3 台光照控制仪 安装 1台光照控制仪可获得周总利润 3 000元 安装 2台光照控制仪的情形

21、: 当 x70 时,只有 1台光照控制仪运行,此时周总利润 y3 0001 0002 000(元),p(y2 000)10500.2, 当 30x70 时,2 台光照控制仪都运行,此时周总利润 y23 0006 000(元),p(y6 000)40500.8, 故 y的分布列为 y 2 000 6 000 p 0.2 0.8 所以 e(y)2 0000.26 0000.85 200(元) 安装 3台光照控制仪的情形: 当 x70 时,只有 1台光照控制仪运行,此时周总利润 y13 00021 0001 000(元), p(y1 000)10500.2, 当 50x70 时,有 2 台光照控制仪

22、运行,此时周总利润 y23 00011 0005 000(元), p(y5 000)35500.7, 当 30x50时,3台光照控制仪都运行,周总利润 y33 0009 000(元),p(y9 000)5500.1, 故 y的分布列为 y 1 000 5 000 9 000 p 0.2 0.7 0.1 所以 e(y)1 0000.25 0000.79 0000.14 600(元) 综上可知,为使商家周总利润的均值达到最大,应该安装 2 台光照控制仪 思维升华 1.折线图中拐点处的坐标是我们提取数据的关键点,注意横坐标、11 / 25 纵坐标的意义即可 2“最小二乘法”求回归方程,计算是这类问题

23、的难点,需要根据题目中提供的数据进行分析,从而求解回归方程ybxa,其中求b是问题的关键,计算出b后,可以将样本点的中心(x,y)代入方程求解出a. 【训练 4】 (2018 全国卷)如图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图 为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型根据 2000 年至 2016 年的数据(时间变量 t 的值依次为 1,2,17)建立模型:y30.413.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型:y9917.5t. (1)分

24、别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 解 (1)利用模型,该地区 2018 年的环境基础设施投资额的预测值为y30.413.519226.1(亿元) 利用模型,该地区 2018年的环境基础设施投资额的预测值为 y9917.59256.5(亿元) (2)利用模型得到的预测值更可靠 理由如下: ()从折线图可以看出,2000 年至 2016 年的数据对应的点没有随机散布在直线y30.413.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施投资额的趋势.2010

25、年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近,这说明从 2010 年开始环境基础设施投资额的变化规律呈线性增长趋势,利12 / 25 用 2010 年至 2016 年的数据建立的线性模型y9917.5t 可以较好地描述 2010年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠 ()从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值 226.1 亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠 以上给出了 2种理由,考生答出其中任意

26、一种或其他合理理由均可得分 类型五 文字语言及符号语言的转化及模型建构 【例 5】 (2019 全国卷)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验试验方案如下:每一轮选取两只白鼠对药效进行对比试验对于两只白鼠,随机选一只施以甲药,另一只施以乙药一轮的治疗结果得出后,再安排下一轮试验当其中一种药治愈的白鼠比另一种药治愈的白鼠多 4 只时,就停止试验,并认为治愈只数多的药更有效为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得 1 分,乙药得1 分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得 1 分,甲药得1 分;若

27、都治愈或都未治愈则两种药均得 0 分甲、乙两种药的治愈率分别记为 和 ,一轮试验中甲药的得分记为 x. (1)求 x的分布列 (2)若甲药、乙药在试验开始时都赋予 4 分,pi(i0,1,8)表示“甲药的累计得分为 i 时,最终认为甲药比乙药更有效”的概率,则 p00,p81,piapi1bpicpi1(i1,2,7),其中 ap(x1),bp(x0),cp(x1)假设 0.5,0.8. 证明:pi1pi(i0,1,2,7)为等比数列; 求 p4,并根据 p4的值解释这种试验方案的合理性 (1)解 x的所有可能取值为1,0,1. p(x1)(1),p(x0)(1)(1), p(x1)(1) 所

28、以 x的分布列为 13 / 25 x 1 0 1 p (1) (1)(1) (1) (2)证明 由(1)得 a0.4,b0.5,c0.1, 因此 pi0.4pi10.5pi0.1pi1, 故 0.1(pi1pi)0.4(pipi1), 即 pi1pi4(pipi1) 又因为 p1p0p10,所以pi1pi(i0,1,2,7)是公比为 4,首项为p1的等比数列 解 由可得 p8p8p7p7p6p1p0p0 (p8p7)(p7p6)(p1p0)p04813p1. 由于 p81,故 p13481, 所以 p4(p4p3)(p3p2)(p2p1)(p1p0)p0 4413p11257. p4表示最终认

29、为甲药更有效的概率由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为 0.8时,认为甲药更有效的概率为 p412570.003 9,此时得出错误结论的概率非常小,说明这种试验方案合理 思维升华 文字阅读与信息提取能提升数学核心素养,这是近几年高考命题的关注点概率与其他知识融合是高考的热点,如概率与数列、概率与函数、概率与正态分布等,很好地考查了信息提取与模型建构,解决这类问题的关键是培养敢于克服困难完成读题、建模的能力 【训练 5】 (2020 重庆质检)“工资条里显红利,个税新政入民心”随着 2019年新年钟声的敲响,我国自 1980 年以来,力度最大的一次个人所得税(简称个税)改革迎来

30、了全面实施的阶段.2019 年 1 月 1 日起实施的个税新政主要内容包括:个税起征点为 5 000 元;每月应纳税所得额(含税)收入个税起征点专项附加扣除;专项附加扣除包括住房贷款利息或者住房租金(以下简称住房)、子女教育、赡养老人等新旧个税政策下每月应纳税所得额(含税)计算方14 / 25 法及其对应的税率表如下: 旧个税税率表(个税起征点 3 500 元) 新个税税率表(个税起征点 5 000元) 缴税 级数 每月应纳税所得额(含税)收入个税起征点 税率(%) 每月应纳税所得额(含税)收入个税起征点专项附加扣除 税率(%) 1 不超过 1 500元的部分 3 不超过 3 000元的部分

31、3 2 超过 1 500元至 4 500元的部分 10 超过 3 000元至 12 000 元的部分 10 3 超过 4 500元至 9 000元的部分 20 超过 12 000元至 25 000 元的部分 20 4 超过 9 000元至 35 000元的部分 25 超过 25 000元至 35 000 元的部分 25 5 超过 35 000元至 55 000元的部分 30 超过 35 000元至 55 000 元的部分 30 随机抽取某市 1 000 名同一收入层级的 it 从业者的相关资料,经统计分析,预估他们 2019 年的人均月收入为 24 000 元统计资料还表明,他们均符合住房专项

32、附加扣除;同时,他们每人至多只有一个符合子女教育专项附加扣除的孩子,并且他们之中既不符合子女教育专项附加扣除又不符合赡养老人专项附加扣除、符合子女教育专项附加扣除但不符合赡养老人专项附加扣除、符合赡养老人专项附加扣除但不符合子女教育专项附加扣除、既符合子女教育专项附加扣除又符合赡养老人专项附加扣除的人数之比是 2111;此外,他们均不符合其他专项附加扣除新个税政策下该市的专项附加扣除标准为:住房 1 000元/月,子女教育每孩 1 000元/月,赡养老人 2 000元/月等 假设该市该收入层级的 it 从业者都独自享受专项附加扣除,将预估的该市该收入层级的 it 从业者的人均月收入视为其个人月

33、收入根据样本估计总体的思想,解决如下问题: (1)设该市该收入层级的 it 从业者 2019 年月缴个税为 x 元,求 x 的分布列和期15 / 25 望; (2)根据新旧个税政策,估计从 2019年 1月开始,经过多少个月,该市该收入层级的 it从业者各月少缴纳的个税之和就超过其 2019年的人均月收入? 解 (1)既不符合子女教育专项附加扣除又不符合赡养老人专项附加扣除的人群每月应纳税所得额(含税)为 24 0005 0001 00018 000(元), 月缴个税 x3 0003%9 00010%6 00020%2 190; 符合子女教育专项附加扣除但不符合赡养老人专项附加扣除的人群每月应

34、纳税所得额(含税)为 24 0005 0001 0001 00017 000(元), 月缴个税 x3 0003%9 00010%5 00020%1 990; 符合赡养老人专项附加扣除但不符合子女教育专项附加扣除的人群每月应纳税所得额(含税)为 24 0005 0001 0002 00016 000(元), 月缴个税 x3 0003%9 00010%4 00020%1 790; 既符合子女教育专项附加扣除又符合赡养老人专项附加扣除的人群每月应纳税所得额(含税)为 24 0005 0001 0001 0002 00015 000(元), 月缴个税 x3 0003%9 00010%3 00020%1

35、 590. 所以 x的可能值为 2 190,1 990,1 790,1 590. 依题意,上述四类人群的人数之比是 2111, 所以 p(x2 190)25,p(x1 990)15, p(x1 790)15,p(x1 590)15. 所以 x的分布列为 x 2 190 1 990 1 790 1 590 p 25 15 15 15 所以 e(x)2 190251 990151 790151 590151 950. (2)因为在旧个税政策下该市该收入层级的 it 从业者 2019 年每月应纳税所得额(含税)为 24 0003 50020 500(元), 16 / 25 所以其月缴个税为 1 50

36、03%3 00010%4 50020%11 50025% 4 120(元) 因为在新个税政策下该市该收入层级的 it从业者 2019年月缴个税的均值为 1 950 元, 所以该收入层级的 it从业者每月少缴纳的个税为 4 1201 9502 170(元) 设经过 x 个月,该市该收入层级的 it从业者各月少缴纳的个税的总和就超过 24 000 元, 则 2 170 x24 000,因为 xn,所以 x12. 所以经过 12 个月,该市该收入层级的 it 从业者各月少缴纳的个税的总和就超过 2019 年的人均月收入. 巩固提升训练 1(2019 江西五校协作体测试)食品安全问题越来越受到人们的重

37、视,某超市在某种蔬菜进货前,要求食品安检部门对每箱蔬菜进行三轮各项指标的综合检测,只有三轮检测都合格,蔬菜才能在该超市销售已知每箱这种蔬菜第一轮检测不合格的概率为17,第二轮检测不合格的概率为18,第三轮检测合格的概率为89,每轮检测只有合格与不合格两种情况,且各轮检测是否合格相互之间没有影响 (1)求每箱这种蔬菜不能在该超市销售的概率; (2)如果这种蔬菜能在该超市销售,则每箱可获利 400 元,如果不能在该超市销售,则每箱亏损 200 元,现有 4 箱这种蔬菜,求这 4 箱蔬菜总收益的分布列和数学期望 解 (1)记 ai(i1,2,3)分别为事件“第一、二、三轮检测合格”,a 为事件“每箱

38、这种蔬菜不能在该超市销售” 由题设知 p(a1)11767,p(a2)11878,p(a3)89,且 a1,a2,a3相互独立, 所以 p(a)1p(a1)p(a2)p(a3)167788913. (2)设这 4 箱蔬菜的总收益为随机变量 x,则 x 的所有可能取值为 1 600,1 17 / 25 000,400,200,800, 且 p(x1 600)c442341301681, p(x1 000)c34233133281, p(x400)c242321322481, p(x200) p(x800)c04230134181. 故 x的分布列为 x 1 600 1

39、000 400 200 800 p 1681 3281 2481 881 181 x的数学期望 e(x)1 60016811 00032814002481200881800181800. 2(2020 福州模拟)某学校八年级共有学生 400 人,现对该校八年级学生随机抽取 50 名进行实践操作能力测试,实践操作能力测试结果分为四个等级水平,一、二等级水平的学生实践操作能力较弱,三、四等级水平的学生实践操作能力较强,测试结果统计如下表: 等级 水平一 水平二 水平三 水平四 男生/名 4 8 12 6 女生/名 6 8 4 2 (1)根据表中统计的数据填写下面 22 列联表,并判断是否有 95%

40、的把握认为学生实践操作能力强弱与性别有关? 实践操作能力较弱 实践操作能力较强 合计 男生/名 女生/名 合计 (2)现从测试结果为水平一的学生中随机抽取 4 名进行学习力测试,记抽到水平一的男生的人数为 ,求 的分布列和数学期望 18 / 25 下面的临界值表供参考: p(k2k0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828 参考公式:k2n(adbc)2(ab)(cd)(ac)(bd),其中 nabcd. 解 (1) 实践操作能力较弱 实践操作能力较强 合计 男生

41、/名 12 18 30 女生/名 14 6 20 合计 26 24 50 所以 k250(6121418)230202624225524.3273.841. 所以有 95%的把握认为学生实践操作能力强弱与性别有关 (2) 的取值为 0,1,2,3,4. p(0)c46c410114,p(1)c14c36c410821, p(2)c24c26c41037,p(3)c34c16c410435, p(4)c44c4101210. 所以 的分布列为 0 1 2 3 4 p 114 821 37 435 1210 所以 e()01141821237343541210851.6. 3(2020 临沂质检)

42、在某市高中某学科竞赛中,某一个区 4 000 名考生的参赛成绩统计如图所示 19 / 25 (1)求这 4 000 名学生的竞赛平均成绩x (同一组中的数据用该组区间的中点值作代表) (2)由直方图可认为考生竞赛成绩 z 服从正态分布 n(,2),其中 ,2分别取考生的平均成绩x和考生成绩的方差 s2,那么该区 4 000 名考生的成绩超过84.81 分(含 84.81分)的人数估计有多少? (3)如果用该区参赛考生成绩的情况来估计全市的参赛考生的成绩情况,现从全市参赛考生中随机抽取 4 名,记成绩不超过 84.81 分的考生人数为 ,求p(3)(精确到 0.001) 附:s2204.75,

43、204.7514.31;0.841 340.501;zn(,2),则 p(z)0.682 7,p(2z2)0.954 5. 解 (1)由题意知 中点值 45 55 65 75 85 95 频率 0.1 0.15 0.2 0.3 0.15 0.1 x450.1550.15650.2750.3850.15950.170.5, 这 4 000 名学生的竞赛平均成绩x为 70.5分 (2)依题意 z服从正态分布 n(,2),其中 x70.5, 2s2204.75,14.31, z 服从正态分布 n(,2)n(70.5,14.312), 而 p(z)p(56.19z84.81)0.682 7, p(z8

44、4.81)10.682 720.158 7. 又 0.158 74 000634.8635. 竞赛成绩超过 84.81分的人数估计为 635. (3)全市竞赛考生的成绩不超过 84.81分的概率 p10.158 70.841 3. 而 b(4,0.841 3),p(3)1p(4)1c440.841 3410.5010.499. 4(2020 广东名校联考)现有两种投资方案,一年后投资盈亏的情况如下表: 投资股市: 20 / 25 投资结果 获利 40% 不赔不赚 亏损 20% 概率 12 18 38 购买基金: 投资结果 获利 20% 不赔不赚 亏损 10% 概率 p 13 q (1)当 p1

45、4时,求 q的值 (2)已知甲、乙两人分别选择了“投资股市”和“购买基金”进行投资,如果一年后他们中至少有一人获利的概率大于45,求 p的取值范围 (3)丙要将家中闲置的 10 万元钱进行投资,决定在“投资股市”和“购买基金”这两种方案中选择一种,已知 p12,q16,那么丙选择哪种投资方案,才能使得一年后投资收益的数学期望较大?请说明理由 解 (1)“购买基金”后,投资结果只有“获利”、“不赔不赚”、“亏损”三种, 且三种投资结果相互独立,p13q1. 又 p14,q512. (2)记事件 a为“甲投资股市且获利”,事件 b为“乙购买基金且获利”, 事件 c为“一年后甲、乙两人中至少有一人投

46、资获利”, 则 cababab,且 a,b独立 由题意可知,p(a)12,p(b)p, p(c)p(ab)p(ab)p(ab) 12(1p)12p12p1212p. p(c)1212p45,p35. 又 p13q1,q0,p23. 21 / 25 p 的取值范围为35,23. (3)假设丙选择“投资股市”的方案进行投资,记 x为丙投资股市的获利金额(单位:万元), 随机变量 x的分布列为 x 4 0 2 p 12 18 38 则 e(x)412018(2)3854. 假设丙选择“购买基金”的方案进行投资,记 y 为丙购买基金的获利金额(单位:万元), 随机变量 y的分布列为 y 2 0 1 p

47、 12 13 16 则 e(y)212013(1)1656. e(x)e(y),丙选择“投资股市”,才能使得一年后的投资收益的数学期望较大 5随着移动互联网的快速发展,基于互联网的共享单车应运而生某市场研究人员为了了解共享单车运营公司 m 的经营状况,对该公司 6 个月内的市场占有率进行了统计,并绘制了相应的折线图 (1)由折线图可以看出,可用线性回归模型拟合月度市场占有率 y 与月份代码 x之间的关系求 y 关于 x 的线性回归方程,并预测 m公司 2017年 4月份(即 x7 时)的市场占有率 22 / 25 (2)为进一步扩大市场,公司拟再采购一批单车现有采购成本分别为 1 000 元/

48、辆和 1 200 元/辆的 a,b两款车型可供选择,按规定每辆单车最多使用 4年,但由于多种原因(如骑行频率等)会导致车辆使用年限各不相同考虑到公司运营的经济效益,该公司决定先对两款车型的单车各 100 辆进行科学模拟测试,得到两款单车使用年限频数表如下: 使用年限 车型 1年 2年 3年 4年 总计 a 20 35 35 10 100 b 10 30 40 20 100 经测算,平均每辆单车每年可以带来收入 500 元不考虑除采购成本之外的其他成本,假设每辆单车的使用年限都是整数,且以频率作为每辆单车使用年限的概率如果你是 m 公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型? 参考公式:回归直线方程为ybxa,其中bni1xiyinx yni1x2inx2,aybx. 解 (1)由数据计算可得x12345663.5, y111316152021616, 由公式计算可得,b2,a1623.59. 所以月度市场占有率 y 与月份代码 x 之间的线性回归方程为y2x9. 当 x7时,y27923. 故 m 公司 2017年 4 月份的市场占有率预计为 23%. (2)由频率作为概率,每辆 a 款车可使用 1 年,2 年,3 年和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论