押题09 第15-17题 统计与概率(五大题型)-冲刺2024年高考数学考点押题模拟预测卷新高考专用含解析_第1页
押题09 第15-17题 统计与概率(五大题型)-冲刺2024年高考数学考点押题模拟预测卷新高考专用含解析_第2页
押题09 第15-17题 统计与概率(五大题型)-冲刺2024年高考数学考点押题模拟预测卷新高考专用含解析_第3页
押题09 第15-17题 统计与概率(五大题型)-冲刺2024年高考数学考点押题模拟预测卷新高考专用含解析_第4页
押题09 第15-17题 统计与概率(五大题型)-冲刺2024年高考数学考点押题模拟预测卷新高考专用含解析_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

押题09第15-17题统计与概率(五大题型)-冲刺2024年高考数学考点押题模拟预测卷(新高考专用)押题09第15-17题统计与概率(五大题型)1.(2023·全国·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:

利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率%时,求临界值c和误诊率;(2)设函数,当时,求的解析式,并求在区间的最小值.2.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.0500.0100.001k3.8416.63510.8283.(2022·全国·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间的概率;(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).4.(2021·全国·高考真题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.押题09统计与概率高考模拟题型分布表题型序号题型内容题号题型1随机变量及其分布1-6题型2正态、二项、超几何分布7-11题型3列联表12-14题型4线性回归15-19题型5古典概率在统计中的应用20-25题型1:随机变量及其分布1.(2024·辽宁抚顺·一模)2024年元旦期间,辽宁省推出了将冰雪温泉、民俗文化与体育活动深度融合的冬季主题系列活动.现主委会要招募一批志愿者,应聘者需参加相关测试,测试合格者才能予以录用.测试备选题中关于冰雪温泉内容的有3道,关于民俗文化内容的有4道,关于体育活动内容的有道.已知应聘者甲随机抽出2道题都是关于冰雪温泉内容的概率为.(1)求的值;(2)招募方案规定:每位应聘者要从备选题中随机抽出3道题进行测试,至少答对2道题者视为测试合格.已知应聘者甲能答对备选题中的6道题,应聘者乙答对每道备选题的概率都是.(ⅰ)求应聘者甲答对题的数量的分布列和数学期望;(ⅱ)试估计甲、乙两名应聘者谁被录用的可能性大,并说明理由.2.(2024·重庆·模拟预测)甲、乙两同学参加趣味数学对抗赛,比赛规则:两人轮流作答且每题仅一人作答,每答一次视为一轮比赛;答正确一方积分加2分,另一方积分加0分;答错误一方积分加0分,另一方积分加2分;一方比另一方积分多6分或进行了7轮比赛,对抗赛结束;结束时积分多者获胜.已知甲、乙每次作答正确的概率都是,且每次作答是否正确相互独立.(1)求甲恰在第5轮比赛后获胜的概率;(2)设表示对抗赛结束时比赛进行轮数,求的分布列和数学期望.3.(2024·山东泰安·一模)某学校为了缓解学生紧张的复习生活,决定举行一次游戏活动,游戏规则为:甲箱子里装有3个红球和2个黑球,乙箱子里装有2个红球和2个黑球,这些球除颜色外完全相同,每次游戏从这两个箱子里各随机摸出2个球,且每次游戏结束后将球放回原箱,摸出一个红球记2分,摸出一个黑球记分,得分在5分以上(含5分)则获奖.(1)求在1次游戏中,获奖的概率;(2)求在1次游戏中,得分X的分布列及均值.4.(2024·湖北·一模)如图,一个质点在随机外力的作用下,从数轴点1的位置出发,每隔向左或向右移动一个单位,设每次向右移动的概率为.

(1)当时,求后质点移动到点0的位置的概率;(2)记后质点的位置对应的数为,若随机变量的期望,求的取值范围.5.(2024·江苏·一模)我国无人机发展迅猛,在全球具有领先优势,已经成为“中国制造”一张靓丽的新名片,并广泛用于森林消防、抢险救灾、环境监测等领域.某森林消防支队在一次消防演练中利用无人机进行投弹灭火试验,消防员甲操控无人机对同一目标起火点进行了三次投弹试验,已知无人机每次投弹时击中目标的概率都为,每次投弹是否击中目标相互独立.无人机击中目标一次起火点被扑灭的概率为,击中目标两次起火点被扑灭的概率为,击中目标三次起火点必定被扑灭.(1)求起火点被无人机击中次数的分布列及数学期望;(2)求起火点被无人机击中且被扑灭的概率.6.(2024·辽宁葫芦岛·一模)2024年初,OpenAI公司发布了新的文生视频大模型:“Sora”,Sora模型可以生成最长60秒的高清视频.Sora一经发布在全世界又一次掀起了人工智能的热潮.为了培养具有创新潜质的学生,某高校决定选拔优秀的中学生参加人工智能冬令营.选拔考试分为“Python编程语言”和“数据结构算法”两个科目,考生两个科目考试的顺序自选,若第一科考试不合格,则淘汰;若第一科考试合格则进行第二科考试,无论第二科是否合格,考试都结束.“Python编程语言”考试合格得4分,否则得0分;“数据结构算法”考试合格得6分,否则得0分.已知甲同学参加“Python编程语言”考试合格的概率为0.8,参加“数据结构算法”考试合格的概率为0.7.(1)若甲同学先进行“Python编程语言”考试,记为甲同学的累计得分,求的分布列;(2)为使累计得分的期望最大,甲同学应选择先回答哪类问题?并说明理由.题型2:正态、二项、超几何分布7.(2024·四川成都·二模)某省举办了一次高三年级化学模拟考试,其中甲市有10000名学生参考.根据经验,该省及各市本次模拟考试成绩(满分100分)都近似服从正态分布.(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有228人.甲市学生的成绩为76分,试估计学生在甲市的大致名次;(2)在该省本次模拟考试的参考学生中随机抽取40人,记表示在本次考试中化学成绩在之外的人数,求的概率及的数学期望.参考数据:参考公式:若,有,8.(2024·陕西渭南·模拟预测)第19届亚运会将于2023年9月23日在我国杭州举行,这是继北京亚运会后,我国第二次举办这一亚洲最大的体育盛会,为迎接这一体育盛会,浙江某大学举办了一次主题为“喜迎杭州亚运,讲好浙江故事”的知识竞赛,并从所有参赛大学生中随机抽取了40人,统计他们的竞赛成绩(满分100分,每名参赛大学生至少得60分),并将成绩分成4组:,,,(单位:分),得到如下的频率分布直方图.由频率分布直方图可以认为,这次竞赛中所有参赛大学生的竞赛成绩X近似服从正态分布,其中为样本平均数(同一组数据用该组数据的区间中点值作代表),,试用正态分布知识解决下列问题:(1)若这次竞赛共有1.2万名大学生参加,试估计竞赛成绩超过90.5分的人数(结果精确到个位);(2)现从所有参赛的大学生中随机抽取5人进行座谈,设其中竞赛成绩超过81分的人数为Y,求随机变量Y的期望.附:若随机变量X服从正态分布,则,,.9.(2024·陕西西安·一模)某市为提升中学生的环境保护意识,举办了一次“环境保护知识竞赛”,分预赛和复赛两个环节,预赛成绩排名前三百名的学生参加复赛.已知共有12000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到频率分布直方图如图:

(1)规定预赛成绩不低于80分为优良,若从上述样本中预赛成绩不低于60分的学生中随机地抽取2人,求至少有1人预赛成绩优良的概率,并求预赛成绩优良的人数X的分布列及数学期望;(2)由频率分布直方图可认为该市全体参加预赛学生的预赛成绩Z服从正态分布,其中可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组区间的中点值代替),且,已知小明的预赛成绩为91分,利用该正态分布,估计小明是否有资格参加复赛?附:若,则,,;.10.(23-24高三上·江西·期末)面试是求职者进入职场的一个重要关口,也是机构招聘员工的重要环节.某科技企业招聘员工,首先要进行笔试,笔试达标者进入面试,面试环节要求应聘者回答3个问题,第一题考查对公司的了解,答对得2分,答错不得分,第二题和第三题均考查专业知识,每道题答对得4分,答错不得分.(1)若一共有100人应聘,他们的笔试得分X服从正态分布,规定为达标,求进入面试环节的人数大约为多少(结果四舍五入保留整数);(2)某进入面试的应聘者第一题答对的概率为,后两题答对的概率均为,每道题是否答对互不影响,求该应聘者的面试成绩Y的数学期望.附:若(),则,,.11.(2023·全国·模拟预测)2023年中秋国庆双节期间,我国继续执行高速公路免费政策.交通部门为掌握双节期间车辆出行的高峰情况,在某高速公路收费点记录了10月1日上午这一时间段内通过的车辆数,统计发现这一时间段内共有1000辆车通过该收费点,为方便统计,时间段记作区间,记作,记作,记作,对通过该收费点的车辆数进行初步处理,已知,时间段内的车辆数的频数如下表:时间段频数100300mn(1)现对数据进一步分析,采用分层随机抽样的方法从这1000辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中在9:00~9:40通过的车辆数为,求的分布列与期望;(2)由大数据分析可知,工作日期间车辆在每天通过该收费点的时刻,其中可用(1)中这1000辆车在之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代替(同一组中的数据用该组区间的中点值代表),已知某天共有800辆车通过该收费点,估计在之间通过的车辆数(结果四舍五入保留到整数).参考数据:若,则①;②;③.题型3:列联表12.(2024·内蒙古包头·一模)为了比较两种治疗高血压的药(分别称为甲药,乙药)的疗效,随机选取20位患者服用甲药,20位患者服用乙药,这40位患者在服用一段时间后,记录他们日平均降低的血压数值(单位:mmhg).根据记录的数据绘制了如下茎叶图:

(1)根据茎叶图判断哪种药的疗效更好?并给出两种理由进行说明;(2)求40位患者在服用一段时间后,日平均降低血压数值的中位数,并将日平均降低血压数值超过和不超过的患者数填入下面的列联表:超过不超过服用甲药服用乙药(3)根据(2)中的列联表,能否有的把握认为这两种药物的疗效有差异?附:,0.150.100.052.0722.7063.84113.(2024·山东淄博·一模)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.

年龄次数[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为,求小明星期天选择跑步的概率.参考公式:附:α0.100.050.010.0050.0012.7063.8416.6357.87910.82814.(2024·陕西渭南·模拟预测)第19届亚运会将于2023年9月23日在我国杭州举行,这是继北京亚运会后,我国第二次举办这一亚洲最大的体育盛会.为迎接这一体育盛会,浙江某大学举办了一次主题为“喜迎杭州亚运,讲好浙江故事”的知识竞赛,并从所有参赛大学生中随机抽取了100人,统计他们的竞赛成绩(满分100分,每名参赛大学生至少得60分),并将成绩分成4组:,,,(单位:分),得到如下的频率分布直方图.

(1)试用样本估计总体的思想,估计这次竞赛中参赛大学生成绩的平均数及中位数;(同一组数据用该组数据的区间中点值作代表)(2)现将竞赛成绩不低于90分的学生称为“亚运达人”,成绩低于90分的学生称为“非亚运达人”.这100名参赛大学生的情况统计如下.亚运达人非亚运达人总计男生153045女生55055判断是否有99.5%的把握认为能否获得“亚运达人”称号与性别有关.附:(其中).0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828题型4:线性回归15.(2024·陕西·二模)为了提高市民参观的体验感,某博物馆需要招募若干志愿者对馆藏文物进行整理.已知整理所需时长y(单位:小时)与招募的志愿者人数x(单位:人)的数据统计如下表:志愿者人数x12345整理时长y70m504035(1)若,求y关于x的线性回归方程;(2)根据(1)中的线性回归方程,若博物馆计划在20小时内完成对文物的整理工作,求博物馆至少需要招募的志愿者人数.附:线性回归方程中,,.16.(2024·四川成都·模拟预测)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,某线下家电商场为提升人气和提高营业额也开通了在线直播,下表统计了该商场开通在线直播的第x天的线下顾客人数y(单位:百人)的数据:x12345y1012151820(1)根据第1至第5天的数据分析,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后三位);(2)根据第1至第5天的数据分析,可用线性回归模型拟合y与x的关系,试求出该线性回归方程并估计该商场开通在线直播的第10天的线下顾客人数.(参考公式:相关系数,参考数据:回归方程:,其中,)17.(2024·河南郑州·模拟预测)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长y(cm)与身高x(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:x159165170176180y6771737678(1)根据上表数据,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(2)建立y关于x的回归方程(系数精确到0.01);(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为X,求.参考数据:,,参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.18.(2024·全国·模拟预测)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为重庆市20142022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相关关系.(数据来源于重庆市统计局2023-05-06发布).年份201420152016201720182019202020212022全体居民人均可支配收入(元)183522011022034241532638628920308243380335666参考数据:.参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到0.01),并根据所求回归方程,预测2023年重庆市全体居民人均可支配收入;(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从20142022中任取3年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.19.(2024·湖北武汉·模拟预测)随着科技发展的日新月异,人工智能融入了各个行业,促进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货销售金额得到逐步提升,以下为该公司自2023年8月使用虚拟角色直播带货后的销售金额情况统计.年月2023年8月2023年9月2023年10月2023年11月2023年12月2024年1月月份编号123456销售金额/万元15.425.435.485.4155.4195.4若与的相关关系拟用线性回归模型表示,回答如下问题:(1)试求变量与的样本相关系数(结果精确到0.01);(2)试求关于的经验回归方程,并据此预测2024年2月份该公司的销售金额.附:经验回归方程,其中,,样本相关系数;参考数据:,.题型5:古典概率在统计中的应用20.(2024·陕西榆林·二模)甲、乙参加一次有奖竞猜活动,活动有两个方案.方案一:从装有编号为的6个小球的箱子内随机抽取2个小球,若抽取的小球的编号均为偶数,则获奖.方案二:电脑可以从内随机生成一个随机的实数,参赛者点击一下即可获得电脑生成的随机数,若,则获奖.已知甲选用了方案二参赛,乙选用了方案一参赛.(1)求甲获奖的概率.(2)试问甲、乙两人谁获奖的概率更大?说明你的理由.21.(2024·山东菏泽·一模)某商场举行“庆元宵,猜谜语”的促销活动,抽奖规则如下:在一个不透明的盒子中装有若干个标号为1,2,3的空心小球,球内装有难度不同的谜语.每次随机抽取2个小球,答对一个小球中的谜语才能回答另一个小球中的谜语,答错则终止游戏.已知标号为1,2,3的小球个数比为1:2:1,且取到异号球的概率为.(1)求盒中2号球的个数;(2)若甲抽到1号球和3号球,甲答对球中谜语的概率和对应奖金如表所示,请帮甲决策猜谜语的顺序(猜对谜语的概率相互独立)球号1号球3号球答对概率0.80.5奖金10050022.(23-24高三下·内蒙古赤峰·开学考试)某数学兴趣小组模拟“刮刮乐”彩票游戏,每张彩票的刮奖区印有从10个数字1,2,3,…,10中随机抽取的3个不同数字,刮开涂层即可兑奖,中奖规则为:每张奖卷只能中奖一次(按照最高奖励算)若3个数的积为3的倍数且不为5的倍数时,中三等奖;若3个数的积为5的倍数且不为3的倍数时,中二等奖;若3个数的积既为3的倍数,又为4的倍数,又为7的倍数时,中一等奖;其他情况不中奖.(1)随机抽取一张彩票,求这张彩票中奖的概率;(2)假设每张彩票售价为元,且获得三、二、一等奖的奖金分别为5元,10元,50元,从出售该彩票可获利的角度考虑,求的最小值.23.(2024·全国·模拟预测)已知把相同的椅子围成一个圆环;两个人分别从中随机选择一把椅子坐下.(1)当时,设两个人座位之间空了把椅子(以相隔位子少的情况计数),求的分布列及数学期望;(2)若另有把相同的椅子也围成一个圆环,两个人从上述两个圆环中等可能选择一个,并从中选择一把椅子坐下,若两人选择相邻座位的概率为,求整数的所有可能取值.24.(2024·福建厦门·一模)已知甲、乙两支登山队均有n名队员,现有新增的4名登山爱好者将依次通过摸出小球的颜色来决定其加入哪支登山队,规则如下:在一个不透明的箱中放有红球和黑球各2个,小球除颜色不同之外,其余完全相同先由第一名新增登山爱好者从箱中不放回地摸出1个小球,再另取完全相同的红球和黑球各1个放入箱中;接着由下一名新增登山爱好者摸出1个小球后,再放入完全相同的红球和黑球各1个,如此重复,直至所有新增登山爱好者均摸球和放球完毕.新增登山爱好者若摸出红球,则被分至甲队,否则被分至乙队.(1)求三人均被分至同一队的概率;(2)记甲,乙两队的最终人数分别为,,设随机变量,求.25.(23-24高二上·四川宜宾·期末)某企业在招聘员工时,应聘者需要参加测试,测试分为初试和复试,初试从道题中随机选择道题回答,每答对题得分,答错得分,初试得分大于或等于分才能参加复试,复试每人回答两道题,每答对一题得分,答错得分.已知在初试道题中甲有道题能答对,乙有道题能答对;在复试的两道题中,甲每题能答对的概率都是,乙每题能答对的概率都是(1)求甲、乙两人各自能通过初试的概率;(2)若测试总得分大于或等于分为合格,请问:在参加完测试后,甲、乙合格的概率谁更大?押题09第15-17题统计与概率(五大题型)1.(2023·全国·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:

利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率%时,求临界值c和误诊率;(2)设函数,当时,求的解析式,并求在区间的最小值.【答案】(1),;(2),最小值为.【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出;(2)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出.【解析】(1)依题可知,左边图形第一个小矩形的面积为,所以,所以,解得:,.(2)当时,;当时,,故,所以在区间的最小值为.2.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:不够良好良好病例组4060对照组1090(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:;(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.附,0.0500.0100.001k3.8416.63510.828【答案】(1)答案见解析(2)(i)证明见解析;(ii);【分析】(1)由所给数据结合公式求出的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异;(2)(i)根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求.【解析】(1)由已知,又,,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为,所以所以,(ii)由已知,,又,,所以3.(2022·全国·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:

(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间的概率;(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)岁;(2);(3).【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设{一人患这种疾病的年龄在区间},根据对立事件的概率公式即可解出;(3)根据条件概率公式即可求出.【解析】(1)平均年龄

(岁).(2)设{一人患这种疾病的年龄在区间},所以.(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,则由已知得:,则由条件概率公式可得从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.4.(2021·全国·高考真题)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记为小明的累计得分,求的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【答案】(1)见解析;(2)类.【分析】(1)通过题意分析出小明累计得分的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答类问题的数学期望,比较两个期望的大小即可.【解析】(1)由题可知,的所有可能取值为,,.;;.所以的分布列为(2)由(1)知,.若小明先回答问题,记为小明的累计得分,则的所有可能取值为,,.;;.所以.因为,所以小明应选择先回答类问题.押题09统计与概率高考模拟题型分布表题型序号题型内容题号题型1随机变量及其分布1-6题型2正态、二项、超几何分布7-11题型3列联表12-14题型4线性回归15-19题型5古典概率在统计中的应用20-25题型1:随机变量及其分布1.(2024·辽宁抚顺·一模)2024年元旦期间,辽宁省推出了将冰雪温泉、民俗文化与体育活动深度融合的冬季主题系列活动.现主委会要招募一批志愿者,应聘者需参加相关测试,测试合格者才能予以录用.测试备选题中关于冰雪温泉内容的有3道,关于民俗文化内容的有4道,关于体育活动内容的有道.已知应聘者甲随机抽出2道题都是关于冰雪温泉内容的概率为.(1)求的值;(2)招募方案规定:每位应聘者要从备选题中随机抽出3道题进行测试,至少答对2道题者视为测试合格.已知应聘者甲能答对备选题中的6道题,应聘者乙答对每道备选题的概率都是.(ⅰ)求应聘者甲答对题的数量的分布列和数学期望;(ⅱ)试估计甲、乙两名应聘者谁被录用的可能性大,并说明理由.【答案】(1)(2)(ⅰ)分布列见解析,(ⅱ)甲被录用的可能性大,理由见解析【分析】(1)根据古典概型计算公式可得,解得;(2)(ⅰ)易知的所有可能取值为,分别求得其对应概率可得分布列和期望,(ⅱ)分别计算出甲、乙两人测试合格的概率为,比较大小可得结论.【解析】(1)设事件表示甲抽出的2道题都是关于冰雪温泉内容的,则,解得.(2)(ⅰ)甲答对题的数量的所有可能取值为.则,,所以的分布列为0123于是的数学期望.(ⅱ)设事件表示甲测试合格,则由(ⅰ)可知.设事件表示乙测试合格,则.因为,所以甲被录用的可能性大.2.(2024·重庆·模拟预测)甲、乙两同学参加趣味数学对抗赛,比赛规则:两人轮流作答且每题仅一人作答,每答一次视为一轮比赛;答正确一方积分加2分,另一方积分加0分;答错误一方积分加0分,另一方积分加2分;一方比另一方积分多6分或进行了7轮比赛,对抗赛结束;结束时积分多者获胜.已知甲、乙每次作答正确的概率都是,且每次作答是否正确相互独立.(1)求甲恰在第5轮比赛后获胜的概率;(2)设表示对抗赛结束时比赛进行轮数,求的分布列和数学期望.【答案】(1)(2)分布列见解析,【分析】(1)依题意前轮必须恰有轮为乙积分,另轮甲积分,求出甲一次积分为分的概率,再根据相互独立事件的概率公式计算可得;(2)依题意的可能取值为、、,求出所对应的概率,即可得到分布列与数学期望.【解析】(1)因为第轮比赛后甲、乙共有积分分,由题意可知甲积分,故前轮必须恰有轮为乙积分,另轮甲积分,第轮和第轮都必须是甲积分,甲一轮积分为分的概率为,故概率为,所以甲恰在第5轮比赛后获胜的概率;(2)依题意只能为、、,当时,甲、乙各自获胜的概率为,即;当时,由(1)得甲获胜的概率为,由每轮甲、乙积分的概率相等,故,所以,所以的分布列为:357所以.3.(2024·山东泰安·一模)某学校为了缓解学生紧张的复习生活,决定举行一次游戏活动,游戏规则为:甲箱子里装有3个红球和2个黑球,乙箱子里装有2个红球和2个黑球,这些球除颜色外完全相同,每次游戏从这两个箱子里各随机摸出2个球,且每次游戏结束后将球放回原箱,摸出一个红球记2分,摸出一个黑球记分,得分在5分以上(含5分)则获奖.(1)求在1次游戏中,获奖的概率;(2)求在1次游戏中,得分X的分布列及均值.【答案】(1);(2)分布列见解析,.【分析】(1)利用组合应用问题,结合古典概率公式求出摸到3个或4个红球的概率,再利用互斥事件求出概率.(2)求出的可能值,及各个值对应的概率,列出分布列并求出期望.【解析】(1)设“在1次游戏中摸出个红球”为事件,设“在1次游戏中获奖”为事件,则,且互斥,,,所以在1次游戏中,获奖的概率.(2)依题意,所有可能取值为,由(1)知,,,,,,所以的分布列为:258数学期望.4.(2024·湖北·一模)如图,一个质点在随机外力的作用下,从数轴点1的位置出发,每隔向左或向右移动一个单位,设每次向右移动的概率为.

(1)当时,求后质点移动到点0的位置的概率;(2)记后质点的位置对应的数为,若随机变量的期望,求的取值范围.【答案】(1)(2)【分析】(1)利用独立重复实验的概率求解(2)写出随机变量可能值,利用期望大于0解不等式求解.【解析】(1)后质点移动到点0的位置,则质点向左移动了3次,向右移动了2次,所求概率为:.(2)所有可能的取值为,且,,,,由,解得,又因为,故的取值范围为.5.(2024·江苏·一模)我国无人机发展迅猛,在全球具有领先优势,已经成为“中国制造”一张靓丽的新名片,并广泛用于森林消防、抢险救灾、环境监测等领域.某森林消防支队在一次消防演练中利用无人机进行投弹灭火试验,消防员甲操控无人机对同一目标起火点进行了三次投弹试验,已知无人机每次投弹时击中目标的概率都为,每次投弹是否击中目标相互独立.无人机击中目标一次起火点被扑灭的概率为,击中目标两次起火点被扑灭的概率为,击中目标三次起火点必定被扑灭.(1)求起火点被无人机击中次数的分布列及数学期望;(2)求起火点被无人机击中且被扑灭的概率.【答案】(1)分布列见解析,(2)【分析】(1)由二项分布概率公式求概率即可得分布列,再由二项分布期望公式可得;(2)根据条件概率以及全概率公式求解可得【解析】(1)起火点被无人机击中次数的所有可能取值为,.的分布列如下:0123.(2)击中一次被扑灭的概率为击中两次被火扑灭的概率为击中三次被火扑灭的概率为所求概率.6.(2024·辽宁葫芦岛·一模)2024年初,OpenAI公司发布了新的文生视频大模型:“Sora”,Sora模型可以生成最长60秒的高清视频.Sora一经发布在全世界又一次掀起了人工智能的热潮.为了培养具有创新潜质的学生,某高校决定选拔优秀的中学生参加人工智能冬令营.选拔考试分为“Python编程语言”和“数据结构算法”两个科目,考生两个科目考试的顺序自选,若第一科考试不合格,则淘汰;若第一科考试合格则进行第二科考试,无论第二科是否合格,考试都结束.“Python编程语言”考试合格得4分,否则得0分;“数据结构算法”考试合格得6分,否则得0分.已知甲同学参加“Python编程语言”考试合格的概率为0.8,参加“数据结构算法”考试合格的概率为0.7.(1)若甲同学先进行“Python编程语言”考试,记为甲同学的累计得分,求的分布列;(2)为使累计得分的期望最大,甲同学应选择先回答哪类问题?并说明理由.【答案】(1)分布列见详解(2)先回答“Python编程语言”考试这类问题,理由见详解.【分析】(1)由已知可得的所有可能取值,分别计算概率即可求解;(2)设甲同学先进行“数据结构算法”考试,记为甲同学的累计得分,求解的分布列,分别计算,的期望,比较大小,即可求解.【解析】(1)由题意的所有可能取值为,,,所以,,,所以的分布列为

(2)甲同学选择先回答“Python编程语言”考试这类问题,理由如下:由(1)可知,甲同学先进行“数据结构算法”考试,记为甲同学的累计得分,则的所有可能取值为,,,,,,所以的分布列为

,所以,所以甲同学选择先回答“Python编程语言”考试这类问题.题型2:正态、二项、超几何分布7.(2024·四川成都·二模)某省举办了一次高三年级化学模拟考试,其中甲市有10000名学生参考.根据经验,该省及各市本次模拟考试成绩(满分100分)都近似服从正态分布.(1)已知本次模拟考试甲市平均成绩为65分,87分以上共有228人.甲市学生的成绩为76分,试估计学生在甲市的大致名次;(2)在该省本次模拟考试的参考学生中随机抽取40人,记表示在本次考试中化学成绩在之外的人数,求的概率及的数学期望.参考数据:参考公式:若,有,【答案】(1)1587名(2)0.0989;期望为【分析】(1)由本次模拟考试成绩都近似服从正态分布,,87分以上共有228人,结合原则,求得,再由甲市学生在该次考试中成绩为76分,且求解;(2)由随机变量服从二项分布,即求解.【解析】(1)解:已知本次模拟考试成绩都近似服从正态分布,由题意可得.即,解得.甲市学生在该次考试中成绩为76分,且,又,即.学生在甲市本次考试的大致名次为1587名.(2)在本次考试中,抽取1名化学成绩在之内的概率为0.9974.抽取1名化学成绩在之外的概率为0.0026.随机变量服从二项分布,即..的数学期望为.8.(2024·陕西渭南·模拟预测)第19届亚运会将于2023年9月23日在我国杭州举行,这是继北京亚运会后,我国第二次举办这一亚洲最大的体育盛会,为迎接这一体育盛会,浙江某大学举办了一次主题为“喜迎杭州亚运,讲好浙江故事”的知识竞赛,并从所有参赛大学生中随机抽取了40人,统计他们的竞赛成绩(满分100分,每名参赛大学生至少得60分),并将成绩分成4组:,,,(单位:分),得到如下的频率分布直方图.由频率分布直方图可以认为,这次竞赛中所有参赛大学生的竞赛成绩X近似服从正态分布,其中为样本平均数(同一组数据用该组数据的区间中点值作代表),,试用正态分布知识解决下列问题:(1)若这次竞赛共有1.2万名大学生参加,试估计竞赛成绩超过90.5分的人数(结果精确到个位);(2)现从所有参赛的大学生中随机抽取5人进行座谈,设其中竞赛成绩超过81分的人数为Y,求随机变量Y的期望.附:若随机变量X服从正态分布,则,,.【答案】(1)(2)【分析】(1)由频率分布直方图可得,再利用正态分布对称性可得概率,求出人数;(2)易知随机变量服从二项分布,由二项分布期望值公式可得结论.【解析】(1)由频率分布直方图可得;即可得则,所以估计竞赛成绩超过90.5分的人数为人.(2)依题意,则,从所有参赛的大学生中随机抽取5人进行座谈,可得随机变量;因此.9.(2024·陕西西安·一模)某市为提升中学生的环境保护意识,举办了一次“环境保护知识竞赛”,分预赛和复赛两个环节,预赛成绩排名前三百名的学生参加复赛.已知共有12000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到频率分布直方图如图:

(1)规定预赛成绩不低于80分为优良,若从上述样本中预赛成绩不低于60分的学生中随机地抽取2人,求至少有1人预赛成绩优良的概率,并求预赛成绩优良的人数X的分布列及数学期望;(2)由频率分布直方图可认为该市全体参加预赛学生的预赛成绩Z服从正态分布,其中可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组区间的中点值代替),且,已知小明的预赛成绩为91分,利用该正态分布,估计小明是否有资格参加复赛?附:若,则,,;.【答案】(1),分布列见解析,(2)有资格参加复赛【分析】(1)根据超几何分布的概率计算即可求解分布列,(2)根据正态分布的对称性即可求解.【解析】(1)预赛成绩在范围内的样本量为:,预赛成绩在范围内的样本量为:,设抽取的2人中预赛成绩优良的人数为X,可能取值为0,1,2,则,又,则X的分布列为:X012P故.(2),,则,又,故,故全市参加预赛学生中,成绩不低于91分的有人,因为,故小明有资格参加复赛,10.(23-24高三上·江西·期末)面试是求职者进入职场的一个重要关口,也是机构招聘员工的重要环节.某科技企业招聘员工,首先要进行笔试,笔试达标者进入面试,面试环节要求应聘者回答3个问题,第一题考查对公司的了解,答对得2分,答错不得分,第二题和第三题均考查专业知识,每道题答对得4分,答错不得分.(1)若一共有100人应聘,他们的笔试得分X服从正态分布,规定为达标,求进入面试环节的人数大约为多少(结果四舍五入保留整数);(2)某进入面试的应聘者第一题答对的概率为,后两题答对的概率均为,每道题是否答对互不影响,求该应聘者的面试成绩Y的数学期望.附:若(),则,,.【答案】(1)16(2)【分析】(1)由正态分布的性质可求得,由此可估计进入面试的人数.(2)由已知得的可能取值为0,2,4,6,8,10,分别求得取每一个可能的值的概率,得的分布列,根据数学期望公式可求得答案.【解析】(1)因为服从正态分布,所以,,,所以.进入面试的人数,.因此,进入面试的人数大约为16.(2)由题意可知,的可能取值为0,2,4,6,8,10,则;;;;;.所以.11.(2023·全国·模拟预测)2023年中秋国庆双节期间,我国继续执行高速公路免费政策.交通部门为掌握双节期间车辆出行的高峰情况,在某高速公路收费点记录了10月1日上午这一时间段内通过的车辆数,统计发现这一时间段内共有1000辆车通过该收费点,为方便统计,时间段记作区间,记作,记作,记作,对通过该收费点的车辆数进行初步处理,已知,时间段内的车辆数的频数如下表:时间段频数100300mn(1)现对数据进一步分析,采用分层随机抽样的方法从这1000辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中在9:00~9:40通过的车辆数为,求的分布列与期望;(2)由大数据分析可知,工作日期间车辆在每天通过该收费点的时刻,其中可用(1)中这1000辆车在之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代替(同一组中的数据用该组区间的中点值代表),已知某天共有800辆车通过该收费点,估计在之间通过的车辆数(结果四舍五入保留到整数).参考数据:若,则①;②;③.【答案】(1)分布列见解析,期望为(2)【分析】(1)根据分层抽样、超几何分布等知识求得分布列并求得数学期望.(2)先求得,然后根据正态分布的对称性求得正确答案.【解析】(1)因为,,所以,.由分层随机抽样可知,抽取的10辆车中,在9:00~9:40通过的车辆数位于时间段,这两个区间内的车辆数为,车辆数的可能取值为0,1,2,3,4,,,,,,所以X的分布列为所以.(2)这1000辆车在时间段内通过该收费点的时刻的平均值,即9:04,,所以.估计在这一时间段内通过的车辆数,也就是通过的车辆数,工作日期间车辆在每天通过该收费点的时刻,,所以估计在这一时间段内通过的车辆数为.题型3:列联表12.(2024·内蒙古包头·一模)为了比较两种治疗高血压的药(分别称为甲药,乙药)的疗效,随机选取20位患者服用甲药,20位患者服用乙药,这40位患者在服用一段时间后,记录他们日平均降低的血压数值(单位:mmhg).根据记录的数据绘制了如下茎叶图:

(1)根据茎叶图判断哪种药的疗效更好?并给出两种理由进行说明;(2)求40位患者在服用一段时间后,日平均降低血压数值的中位数,并将日平均降低血压数值超过和不超过的患者数填入下面的列联表:超过不超过服用甲药服用乙药(3)根据(2)中的列联表,能否有的把握认为这两种药物的疗效有差异?附:,0.150.100.052.0722.7063.841【答案】(1)乙药的疗效更好,理由见解析(2),列联表见解析(3)没有95%的把握认为这两种药物的疗效有差异【分析】(1)根据茎叶图数据分析即可;(2)根据茎叶图数据分析出中位数,即可得到列联表;(3)计算出卡方,即可判断.【解析】(1)乙药的疗效更好.参考理由如下:(ⅰ)用各自的平均数说明.设甲药观测数据的平均数为,乙药观测数据的平均数为,由茎叶图可知,,,因为,所以乙药的疗效更好.(ⅱ)用茎2和茎3上分布的数据说明.由茎叶图可知,用甲药有的患者日平均降低血压数值在20及以上,用乙药有的患者日平均降低血压数值在20及以上,所以乙药的疗效更好.(ⅲ)用各自的中位数说明.由茎叶图可知,用甲药的患者日平均降低血压数值的中位数为,用乙药的患者日平均降低血压数值的中位数为,所以乙药的疗效更好.(ⅳ)用各自的叶在茎上的整体分布说明.由茎叶图可知,用甲药的患者日平均降低血压数值分布集中在“单峰”茎1上,且关于茎1大致呈对称分布;用乙药的患者日平均降低血压数值分布集中在“单峰”茎2上,且关于茎2大致呈对称分布,又用两种降压药患者日平均降低血压数值都分布的区间内,所以乙药的疗效更好.(2)由茎叶图可知内有个数据,内有个数据,内有个数据,,则中位数位于之间,且内的数据从小到大排列为,,,,,,,,,,,,,,,所以中位数.列联表如下:超过不超过服用甲药713服用乙药137(3)由于,所以没有的把握认为这两种药物的疗效有差异.13.(2024·山东淄博·一模)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.

年龄次数[20,30)[30,40)[40,50)[50,60]每周0~2次70553659每周3~4次25404431每周5次及以上552010(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为,求小明星期天选择跑步的概率.参考公式:附:α0.100.050.010.0050.0012.7063.8416.6357.87910.828【答案】(1)有关(2)分布列见解析;期望为(3)【分析】(1)求出卡方值并与临界值比较即可得到结论;(2)根据步骤列出分布列,利用数学期望公式即可得到答案;(3)利用全概率公式即可得到答案.【解析】(1)零假设:体育锻炼频率的高低与年龄无关,由题得列联表如下:青年中年合计体育锻炼频率低12595220体育锻炼频率高75105180合计200200400,根据小概率值的独立性检验推断不成立,即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于0.01.(2)由数表知,利用分层抽样的方法抽取的8人中,年龄在内的人数分别为1,2,依题意,的所有可能取值分别为为0,1,2,所以,,,所以的分布列::012所以的数学期望为.(3)记小明在某一周星期六选择跑步、篮球、羽毛球,分别为事件A,B,C,星期天选择跑步为事件,则,,所以所以小明星期天选择跑步的概率为.【点睛】关键点点睛:本题第3问的解决关键是熟练掌握全概率公式,从而得解.14.(2024·陕西渭南·模拟预测)第19届亚运会将于2023年9月23日在我国杭州举行,这是继北京亚运会后,我国第二次举办这一亚洲最大的体育盛会.为迎接这一体育盛会,浙江某大学举办了一次主题为“喜迎杭州亚运,讲好浙江故事”的知识竞赛,并从所有参赛大学生中随机抽取了100人,统计他们的竞赛成绩(满分100分,每名参赛大学生至少得60分),并将成绩分成4组:,,,(单位:分),得到如下的频率分布直方图.

(1)试用样本估计总体的思想,估计这次竞赛中参赛大学生成绩的平均数及中位数;(同一组数据用该组数据的区间中点值作代表)(2)现将竞赛成绩不低于90分的学生称为“亚运达人”,成绩低于90分的学生称为“非亚运达人”.这100名参赛大学生的情况统计如下.亚运达人非亚运达人总计男生153045女生55055判断是否有99.5%的把握认为能否获得“亚运达人”称号与性别有关.附:(其中).0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828【答案】(1)平均数,中位数(2)有99.5%的把握认为能否获得“亚运达人”称号与性别有关【解析】(1)平均数,由,,故中位数位于,设中位数为,则有,解得,即平均数,中位数;(2),故有99.5%的把握认为能否获得“亚运达人”称号与性别有关.题型4:线性回归15.(2024·陕西·二模)为了提高市民参观的体验感,某博物馆需要招募若干志愿者对馆藏文物进行整理.已知整理所需时长y(单位:小时)与招募的志愿者人数x(单位:人)的数据统计如下表:志愿者人数x12345整理时长y70m504035(1)若,求y关于x的线性回归方程;(2)根据(1)中的线性回归方程,若博物馆计划在20小时内完成对文物的整理工作,求博物馆至少需要招募的志愿者人数.附:线性回归方程中,,.【答案】(1)(2)7【分析】(1)由题意求出m的值,即可求得,即可求得答案;(2)结合(1)的结果,令,解不等式,即可求得答案.【解析】(1)由于,故,则,,,故,,故y关于x的线性回归方程为;(2)令,解得,而,故,故博物馆计划在20小时内完成对文物的整理工作,博物馆至少需要招募的志愿者人数为7.16.(2024·四川成都·模拟预测)数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,某线下家电商场为提升人气和提高营业额也开通了在线直播,下表统计了该商场开通在线直播的第x天的线下顾客人数y(单位:百人)的数据:x12345y1012151820(1)根据第1至第5天的数据分析,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后三位);(2)根据第1至第5天的数据分析,可用线性回归模型拟合y与x的关系,试求出该线性回归方程并估计该商场开通在线直播的第10天的线下顾客人数.(参考公式:相关系数,参考数据:回归方程:,其中,)【答案】(1)0.997,相关关系很强.(2),33.2百人.【分析】(1)根据所给数据及参考公式计算出相关系数,即可判断;(2)首先求出回归直线方程,再令求出即可得解.【解析】(1)依题意可得,,

,,∴两个变量与相关关系很强.(2)因为,,,,所以时(百人),故预估该商场开通在线直播的第天的线下顾客人数为百人.17.(2024·河南郑州·模拟预测)某高中数学兴趣小组,在学习了统计案例后,准备利用所学知识研究成年男性的臂长y(cm)与身高x(cm)之间的关系,为此他们随机统计了5名成年男性的身高与臂长,得到如下数据:x159165170176180y6771737678(1)根据上表数据,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(2)建立y关于x的回归方程(系数精确到0.01);(3)从5名样本成年男性中任取2人,记这2人臂长差的绝对值为X,求.参考数据:,,参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.【答案】(1)说明见解析(2)(3)【分析】(1)利用相关系数的计算公式即可得解;(2)利用已知数据和公式得到关于的线性回归方程;(3)根据已知条件求出随机变量X的取值,利用古典概型的概率公式计算随机变量取值相应的概率,再利用离散型随机变量的期望公式即可求解.【解析】(1)由表中的数据和附注中的参考数据得,,,,,,,∴.因为y与x的相关系数近似为0.997,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.(2)由及(1)得,,所以y关于x的回归方程为.(3)X的取值依次为2,3,4,5,6,7,9,11,,,,,,,,,X的分布列X所以.18.(2024·全国·模拟预测)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为重庆市20142022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相关关系.(数据来源于重庆市统计局2023-05-06发布).年份201420152016201720182019202020212022全体居民人均可支配收入(元)183522011022034241532638628920308243380335666参考数据:.参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到0.01),并根据所求回归方程,预测2023年重庆市全体居民人均可支配收入;(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从20142022中任取3年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.【答案】(1);3.77万元(2)分布列见解析;1【分析】(1)利用最小二乘法计算回归方程,并计算预测值即可;(2)利用离散型随机变量的分布列及数学期望公式计算即可.【解析】(1)由题意得,,,故,故回归方程为,又2023年的年份编号为10,将代入,得,即预测2023年重庆市全体居民人均可支配收入为3.77万元;(2)由图表知,人均可支配收入超过3万的年份有3年,故X的可能取值为,则,,,,故随机变量的分布列为:X0123P故.19.(2024·湖北武汉·模拟预测)随着科技发展的日新月异,人工智能融入了各个行业,促进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货销售金额得到逐步提升,以下为该公司自2023年8月使用虚拟角色直播带货后的销售金额情况统计.年月2023年8月2023年9月2023年10月2023年11月2023年12月2024年1月月份编号123456销售金额/万元15.425.435.485.4155.4195.4若与的相关关系拟用线性回归模型表示,回答如下问题:(1)试求变量与的样本相关系数(结果精确到0.01);(2)试求关于的经验回归方程,并据此预测2024年2月份该公司的销售金额.附:经验回归方程,其中,,样本相关系数;参考数据:,.【答案】(1)0.96(2),219.4万元【分析】(1)由题意根据参考公式线分别算得以及,进一步代入相关系数公式即可求解;(2)根据(1)中的数据以及参数数据依次算得,由此即可得经验回归方程并预测.【解析】(1),,所以.(2)由题意,所以,所以关于的经验回归方程为,所以预测2024年2月份该公司的销售金额为万元.题型5:古典概率在统计中的应用20.(2024·陕西榆林·二模)甲、乙参加一次有奖竞猜活动,活动有两个方案.方案一:从装有编号为的6个小球的箱子内随机抽取2个小球,若抽取的小球的编号均为偶数,则获奖.方案二:电脑可以从内随机生成一个随机的实数,参赛者点击一下即可获得电脑生成的随机数,若,则获奖.已知甲选用了方案二参赛,乙选用了方案一参赛.(1)求甲获奖的概率.(2)试问甲、乙两人谁获奖的概率更大?说明你的理由.【答案】(1)(2)获奖的概率更大,理由见解析【分析】(1)根据题意,由几何概型的概率计算公式,即可得到结果;(2)根据题意,计算甲获奖的概率与乙比较,即可得到结果.【解析】(1)由,得,所以由几何概型可知,甲获奖的概率为.(2)从装有编号为的6个小球的箱子内随机抽取2个小球,所有的抽取情况为,,共15种情况,其中,均为偶数的有3种,所以乙获奖的概率为.因为,所以甲获奖的概率更大.21.(2024·山东菏泽·一模)某商场举行“庆元宵,猜谜语”的促销活动,抽奖规则如下:在一个不透明的盒子中装有若干个标号为1,2,3的空心小球,球内装有难度不同的谜语.每次随机抽取2个小球,答对一个小球中的谜语才能回答另一个小球中的谜语,答错则终止游戏.已知标号为1,2,3的小球个数比为1:2:1,且取到异号球的概率为.(1)求盒中2号球的个数;(2)若甲抽到1号球和3号球,甲答对球中谜语的概率和对应奖金如表所示,请帮甲决策猜谜语的顺序(猜对谜语的概率相互独立)球号1号球3号球答对概率0.80.5奖金100500【答案】(1)4个(2)推荐甲先回答3号球中的谜语再回答1号球中的谜语【分析】(1)由取到异号球的概率为,设1,2,3号球的个数分别为n,,n,列方程求解;(2)分先回答1号球中的谜语和先回答3号球中的谜语两种情况,分别计算奖金的数学期望,比较后得结论.【解析】(1)由题意可设1,2,3号球的个数分别为n,,n,则取到异号球的概率,,即.解得.所以盒中2号球的个数为4个.(2)若甲先回答1号球再回答3号球中的谜语,因为猜对谜语的概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论