数学-概率与统计专题_第1页
数学-概率与统计专题_第2页
数学-概率与统计专题_第3页
数学-概率与统计专题_第4页
数学-概率与统计专题_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高考高中资料无水印无广告word版不加密群559164877精品资料,天天更新高考数学高中数学资料群562298495;新高考资料全科总群732599440;概率与统计专题一:二项分布一、必备秘籍一般地,在重伯努利试验中,设每次试验中事件发生的概率为(),用表示事件发生的次数,则的分布列为()如果随机变量的分布列具有上式的形式,则称随机变量X服从二项分布(binomialdistribution),记作。二、例题讲解1.(2021·全国高三其他模拟)羽毛球是一项隔着球网,使用长柄网状球拍击打用羽毛和软木刷制作而成的一种小型球类的室内运动项目.羽毛球比赛的计分规则:采用21分制,即双方分数先达21分者胜,3局2胜.每回合中,取胜的一方加1分.每局中一方先得21分且领先至少2分即算该局获胜,否则继续比赛;若双方打成29平后,一方领先1分,即算该局取胜.某次羽毛球比赛中,甲选手在每回合中得分的概率为,乙选手在每回合中得分的概率为.(1)在一局比赛中,若甲、乙两名选手的得分均为18,求在经过4回合比赛甲获胜的概率;(2)在一局比赛中,记前4回合比赛甲选手得分为,求的分布列及数学期望.2.(2021·青铜峡市高级中学高三开学考试(理))设甲、乙两位同学上学期间,每天7:30之前到校的概率均为.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用表示甲同学上学期间的每周五天中7:30之前到校的天数,求随机变量的分布列和数学期望;(2)记“上学期间的某周的五天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多3天”为事件,求事件发生的概率.3.(2020·全国高三专题练习(理))一名学生每天骑车上学,从他家到学校的途中有个交通岗,假设他在各个交通岗遇到红灯的事件是相互独立的,并且概率都是.(1)设为这名学生在途中遇到红灯的次数,求的分布列、期望、方差;(2)设为这名学生在首次停车前经过的路口数,求的分布列;(3)求这名学生在途中至少遇到一次红灯的概率.实战练习1.(2021·湖北武汉·)在一次国际大型体育运动会上,某运动员报名参加了其中3个项目的比赛.已知该运动员在这3个项目中,每个项目能打破世界纪录的概率都是,那么在本次运动会上:(1)求该运动员至少能打破2项世界纪录的概率;(2)若该运动员能打破世界纪录的项目数为,求的分布列及期望.2.(2021·渝中·重庆巴蜀中学高三开学考试)某医院为筛查某病毒,需要检验血液是不是阳性,现有份血液样本,为了优化检验方法,现在做了以下两种检验方式:实验一:逐份检验,则需要检验次.实验二:混合检验,将其中(且)份血液样本分别取样混合在一起检验.若检验结果为阴性,这份血液样本全为阴性,因而这份血液样本只要检验一次就够了;若检验结果为阳性,为了明确这份血液样本究竟哪几份为阳性,就要对这份血液样本再逐份检验,此时这份血液样本的检验次数总共为.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为.现取其中(且)份血液样本,记釆用逐份检验方式,需要检验的这份样本的总次数为,釆用混合检验方式,需要检验的这份样本的总次数为.(1)若每份样本检验结果是阳性的概率为,以该样本的阳性概率估计全市的血液阳性概率,从全市人民中随机抽取3名市民,(血液不混合)记抽取到的这3名市民血液成阳性的市民个数为,求的分布列及数学期望(2)若每份样本检验结果是阳性的概率为,为使混合检验需要的检验的总次数的期望值比逐份检验的总次数的期望值更少,求的最大值.(,,)3.(2021·全国高三其他模拟(理))新冠疫情这特殊的时期,规定居民出行或出席公共场合均需佩戴口罩,现将地区居民人一周的口罩使用量统计如表所示,其中个人一周的口罩使用为个以及个上的有人.个人的一周口罩使用数量(单位:个)频率(1)求、的值;(2)用样本估计总体,将频率视为概率,若从地区的所有居民中随机抽取人,记一周使用口罩数量(单位:个)在范围的人数为,求的分布列及数学期望.4.(2021·新沂市第一中学高三其他模拟)市教育部门为研究高中学生的身体素质与课外体育锻炼时间的关系,对该市某校200名高中学生的课外体育锻炼平均每天锻炼的时间进行了调查,数据如下表:平均每天锻炼的时间(分钟)总人数203644504010将学生日均课外体育锻炼时间在内的学生评价为“课外体育达标”.(1)请根据上述表格中的统计数据填写下面列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关;课外体育不达标课外体育达标总计男女20110总计(2)从上述课外体育不达标的学生中,按性别用分层抽样的方法抽取10名学生,再从这10名学生中随机抽取3人了解他们锻炼时间偏少的原因,记所抽取的3人中男生的人数为随机变量,求的分布列和数学期望;(3)将上述调查所得到的频率视为概率来估计全市的情况,现在从该市所有高中学生中抽取4名学生,求其中恰好有2名学生课外体育达标的概率.5.(2021·陕西汉中·高三月考(理))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了树木,某农科所为了研究树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取棵树木,调查得到树木根部半径(单位:米)与树木高度(单位:米)的相关数据如表所示:(1)求关于的线性回归方程;(2)对(1)中得到的回归方程进行残差分析,若某树木的残差为零,则认为该树木“长势标准”,以此频率来估计概率,则在此片树木中随机抽取棵,记这棵树木中“长势标准”的树木数量为,求随机变量的数学期望与方差.参考公式:回归直线方程为,其中6.(2021·四川成都·双流中学高三三模(理))从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图.(1)求的值并估计该市中学生中的全体男生的平均身高(假设同组中的每个数据用该组区间的中点值代替);(2)从该市的中学生中随机抽取一名男生,根据直方图中的信息,估计其身高在以上的概率.若从全市中学的男生(人数众多)中随机抽取人,用表示身高在以上的男生人数,求随机变量的分布列和数学期望.7.(2021·安徽安庆一中高三三模(理))安庆市某学校高三年级开学之初增加晚自习,晚饭在校食堂就餐人数增多,为了缓解就餐压力,学校在原有一个餐厅的基础上增加了一个餐厅,分别记做餐厅甲和餐厅乙,经过一周左右统计调研分析:前一天选择餐厅甲就餐第二天选择餐厅甲就餐的概率是25%、选择餐厅乙就餐的概率为75%,前一天选择餐厅乙就餐第二天选择餐厅乙就餐的概率是50%、选择餐厅甲就餐的概率也为50%,如此往复.假设学生第一天选择餐厅甲就餐的概率是,择餐厅乙就餐的概率是,记某同学第n天选择甲餐厅就餐的概率为.(1)记某班级的3位同学第二天选择餐厅甲的人数为X,求X的分布列,并求E(X);(2)请写出与的递推关系;(3)求数列的通项公式并帮助学校解决以下问题:为提高学生服务意识和团队合作精神,学校每天从20个班级中每班抽调一名学生志愿者为全体学生提供就餐服务工作,根据上述数据,如何合理分配到餐厅甲和餐厅乙志愿者人数?请说明理由.8.(2021·湖北恩施·高三其他模拟)目前某市居民使用天然气实行阶梯价格制度,从该市随机抽取10户调查同一年的天然气使用情况,得到统计表如下:用气居民编号12345678910年用气量(立方米)95106112161210227256313325457(1)现要在这10户家庭中任意抽取3户,求抽到的年用气量超过228立方米而不超过348立方米的用户数的分布列与数学期望;(2)若以表中抽到的10户作为样本估计全市居民的年用气情况,现从全市居民中抽取10户,其中恰有户年用气量不超过228立方米的概率为,求使取到最大值时,的值.概率与统计专题二:超几何分布一般地,假设一批产品共有件,其中有件次品.从件产品中随机抽取件(不放回),用表示抽取的件产品中的次品数,则的分布列为,其中,,,,,,,则称随机变量服从超几何分布.1.公式中个字母的含义—总体中的个体总数—总体中的特殊个体总数(如次品总数)—样本容量—样本中的特殊个体数(如次品数)注意:(1)“由较明显的两部分组成”:如“男生、女生”,“正品、次品”;(2)不放回抽样;(3)注意分布列的表达式中,各个字母的含义及随机变量的取值范围。二、例题讲解1.(2021·贵州省思南中学高三月考(理))某班利用课外活动时间举行了一次“函数求导比赛”活动,为了解本次比赛中学生的总体情况,从中抽取了甲、乙两个小组的样本分数的茎叶图如图所示.(1)分别求出甲、乙两个小组成绩的平均数与方差,并判断哪个小组的成绩更稳定?(2)从甲组同学成绩不低于70分的人中任意抽取3人,设表示所抽取的3名同学的得分在的人数,求的分布列及数学期望.2.(2021·合肥市第六中学高三开学考试(理))近日,国家卫健委公布了2020年9月到12月开展的全国性近视专项调查结果:2020年,我国儿童青少年总体近视率为.为掌握某校学生近视情况,从该校高三(1)班随机抽取7名学生,其中4人近视、3人不近视.现从这7人中随机抽取球3人做进一步医学检查.(1)用表示抽取的3人中近视的学生人数,求随机变量的分布列与数学期望;(2)设为事件“抽取的3人,既有近视的学生,又有不近视的学生”,求事件发生的概率.三、实战练习1.(2021·安徽高三开学考试(理))为预防某种疾病发生,某团队研发一种药物进行提前干预,现进入临床试验阶段.为了考察这种药物预防疾病的效果,进行动物试验,得到如下列联表.患病未患病总计服药1045未服药50总计30(1)请将上面的列联表补充完整;(2)现按分层抽样的方法从未患病动物中抽取10只作为样本,从该样本中随机抽取4只动物,设其中未服用药的动物为只,求的分布与列与期望.2.(2021·湖南益阳市箴言中学高三其他模拟)2021年五一节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握五一节期间车辆出行的高峰情况,在某高速公路收费站点记录了3日上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段9:20~9:40记作,9:40~10:00记作,10:00~10:20记作,10:20~10:40记作,例如:9:46,记作时刻46.(1)估计这600辆车在9:20~10:40时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代替)(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中,在9:20~10:00之间通过的车辆数为,求X的分布列;(3)根据大数据分析,车辆在每天通过该收费站点的时刻T服从正态分布,其中可用3日数据中的600辆车在9:20~10:40之间通过该收费站点的时刻的平均值近似代替,用样本的方差近似代替(同一组中的数据用该组区间的中点值代替).假如4日上午9:20~10:40这一时间段内共有1000辆车通过该收费站点,估计在9:46~10:40之间通过的车辆数(结果保留到整数)附:若随机变量T服从正态分布,则,,.3.(2021·浑源县第七中学校(理))由商务部和北京市人民政府共同举办的2020年中国国际服务贸易交易会(简称服贸会)于9月4日开幕,主题为“全球服务,互惠共享”.某高校为了调査学生对服贸会的了解情况,决定随机抽取100名学生进行采访.根据统计结果,采访的学生中男女比例为3:2,已知抽取的男生中有10名不了解服贸会,抽取的女生中有25名了解服贸会,请你解答下面所提出的相关问题.(1)完成2×2列联表,并回答“是否有99%的把握认为学生对服贸会的了解情况与性别有关”.了解不了解合计男生女生合计100(2)若从被采访的学生中利用分层抽样的方法抽取5人,再从这5人中随机抽取3人在校内开展一次“介绍服贸会”的专题活动,记抽取男生的人数为,求出的分布列及均值.附:.0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.8284.(2021·全国高三二模)某初中为了解学生的肥胖是否与经常饮用碳酸饮料有关,现对40名七年级学生进行了问卷调查,得到数据如表所示(平均每天喝以上为常喝,体重超过为肥胖.单位:人)经常饮用不经常饮用合计肥胖818不肥胖15合计40(1)将列联表补充完整,并回答能否有的把握认为学生是否肥胖和经常饮用碳酸饮料有关?(2)已知经常饮用碳酸饮料且肥胖的8名同学中,有5名男同学,3名女同学,现从这5名男同学和3名女同学中选5人进行家访,求被选中的男生人数的分布列和期望.参考公式及数据:,.0.1000.0500.0100.0012.7063.8416.63510.8285.(2021·赤峰二中高三其他模拟(理))学期结束时,学校对食堂进行测评,测评方式:从全校学生中随机抽取100人给食堂打分,打分在60以下视为“不满意”、在60~80视为“基本满意”,在80分及以上视为“非常满意”.现将他们给食堂打的分数分组:,得到如下频率分布直方图:(1)求这100人中“不满意”的人数并估计食堂得分的中位数;(2)若按满意度采用分层抽样的方法,从这100名学生中抽取15人,再从这15人中随机抽取3人,记这3人中对食堂“非常满意”的人数为.(i)求的分布列;(ii)若抽取的3人中对食堂“非常满意”的同学将获得食堂赠送的200元现金,其他同学将获得100元现金,请估计这3人将获得的现金总额.6.(2021·陕西西安·高三其他模拟(理))某中学高一(1)班在接种了“新冠疫苗”之后,举行了“疫情防控,接种疫苗”知识竞赛.这次竞赛前名同学成绩的茎叶图如图所示,已知前名女生的平均得分为分.(1)①求茎叶图中的值;②如果在竞赛成绩高于分且按男生和女生分层抽样抽取人,再从这人中任选人作为后期举行的“接种疫苗,感恩祖国”主题班会中心发言人,求这人中有女生的概率;(2)如果在竞赛成绩高于分的学生中任选人参加学校座谈会,用表示人中成绩超过分的人数,求的分布列和期望.7.(2021·全国高三专题练习(理))自“新冠肺炎”爆发以来,中国科研团队一直在积极地研发“新冠疫苗”,在科研人员不懈努力下,我国公民率先在2020年年末开始可以使用安全的新冠疫苗,使我国的“防疫”工作获得更大的主动权,研发疫苗之初,为了测试疫苗的效果,科研人员以白兔为实验对象,进行了一些实验.(1)实验一:选取10只健康白兔,编号1至10号,注射一次新冠疫苗后,再让它们暴露在含有新冠病毒的环境中,实验结果发现,除2号、3号和7号白兔仍然感染了新冠病毒,其他白兔未被感染,现从这10只白兔中随机抽取4只进行研究,将仍被感染的白兔只数记作,求的分布列和数学期望.(2)科研人员在另一个实验中发现,疫苗可多次连续注射,白兔多次注射疫苗后,每次注射的疫苗对白兔是否有效互相不影响,相互独立,试问,若将实验一中未被感染新冠病毒的白兔的频率当做疫苗的有效率,那么一只白兔注射两次疫苗能否保证有效率达到96%,如若可以请说明理由,若不可以,请问每支疫苗的有效率至少要达到多少才能满足以上要求.8.(2021·辽宁高三其他模拟)1.2020年11月22日,第29届全国中学生数学奥林匹克决赛举行,若将本次成绩转化为百分制,现从中随机抽取了100名学生的成绩,经统计,这批学生的成绩全部在,之内,将数据按照,,,,,,,的分组作出频率分布直方图,如图所示.已知,,成等差数列且.(1)求频率分布直方图中,,的值;(2)并估计这100名学生成绩的众数;(3)若按照分层抽样从成绩在,,,的两组中抽取了6人,再从这6人中随机抽取3人,记为3人中成绩在,的人数,求的分布列和数学期望.9.(2021·全国高三专题练习)某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组,第二组,,第五组(单位:分),得到如下的频率分布直方图.(1)若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关;(2)用分层抽样方法,在成绩不低于85的学生中抽取6人,再从这6人中随机选3人发言谈体会,设这3人中成绩在的人数为,求的分布列与数学期望.附:,.临界值表:0.100.050.0250.010.0052.7063.8415.0246.6357.87910.(2021·全国高三其他模拟)垃圾分类指的是按照一定规定或者标准将垃圾分类储存、投放和搬运,从而转变成公共资源的一系列活动的总称我国的垃圾分类大致分为厨余垃圾、可回收垃圾、有害垃圾、其他垃圾四类,而正确的掌握垃圾分类也是中学生的必修课之一.某学校从甲、乙两个班级中各随机抽取了8名学生参加垃圾分类知识的检测,并将检测后的成绩统计如表所示:甲7364747865728785乙748576747786其中,,,.(1)求,的值;(2)现从乙班同学中随机抽取4人,记80分以上的人数为,求的分布列以及数学期望.11.(2021·全国(理))随着如今人们生活水平的不断提高,旅游成了一种生活时尚,尤其是老年人的旅游市场在不断扩大.为了了解老年人每年旅游消费支出(单位:元)的情况,相关部门抽取了某地区名老年人进行问卷调查,并把所得数据列成如下所示的频数分布表:组别频数(1)求所得样本平均数(精确到元);(2)根据样本数据,可近似地认为老年人的旅游费用支出X服从正态分布,若该地区共有老年人人,试估计有多少位老年人旅游费用支出在元以上;(3)已知样本数据中旅游费用支出在范围内的名老人中有名女性,名男性.现想选其中名老人回访,记选出的男生人数为,求的分布列.附:若,,必备秘籍1、若随机变量的概率分布密度函数为对任意的,,它的图象在轴的上方.可以证明轴和曲线之间的区域的面积为1.我们称为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.若随机变量的概率分布密度函数为,则称随机变量服从正态分布(normaldis-tribution),记为.特别地,当时,称随机变量服从标准正态分布,即.由的密度函数及图象可以发现,正态曲线有以下特点:曲线在轴的上方,与轴不相交。(2)曲线是单峰的,它关于直线对称.(3)曲线在处达到峰值(最高点)(4)当无限增大时,曲线无限接近轴.(5)轴与正态曲线所夹面积恒等于1.2、正态分布的原则二、例题讲解1.(2021·湖南高三其他模拟)数学建模是高中数学核心素养的一个组成部分数学建模能力是应用意识和创新意识的重要表现.为全面推动数学建模活动的开展,某学校举行了一次数学建模竞赛活动已知该竞赛共有60名学生参加,他们成绩的频率分布直方图如下.(1)为了对数据进行分析,将60分以下的成绩定为不合格,60分以上(含60分)的成绩定为合格.为科学评估该校学生数学建模水平决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会.记为抽取的4人中,成绩不合格的人数,求的分布列和数学期望;(2)已知这60名学生的数学建模竞赛成绩服从正态分布,其中可用样本平均数近似代替,可用样本方差近似代替(用一组数据的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,试估计此次竞赛受到奖励的人数.(结果根据四舍五入保留到整数位)解题中可参考使用下列数据:,,.2.(2021·全国高三其他模拟)中国人民解放军装甲兵学院(前身蚌埠坦克学院),建校至今为我国培养了一大批优秀的军事人才.在今年新入学的学生中,为了加强爱校教育,现在从全体新入学的学生中随机的抽取了100人,对他们进行校史问卷测试,得分在45~95之间,分为,,,,五组,得到如图所示的频率分布直方图,其中第三组的频数为40.(1)请根据频率分布直方图估计样本的平均数和方差(同一组中的数据用该组区间的中点值代表);(2)根据样本数据,可认为新人学的学生校史问卷测试分数近似服从正态分布,其中近似为样本平均数,近似为样本方差.(i)求;(ii)在某间寝室有6人,求这6个人中至少有1人校史问卷测试分数在90.8分以上的概率.参考数据:若,则,,,,,.三、实战练习1.(2021·全国高三专题练习(理))在创建“全国文明卫生城”过程中,某市“创城办”为了调查市民对创城工作的了解情况,进行了一次创城知识问卷调查(一位市民只能参加一次).通过随机抽样,得到参加问卷调查的1000人的得分(满分100分)统计结果如下表所示.组别频数2515020025022510050(1)由频数分布表可以大致认为,此次问卷调查的得分服从正态分布,近似为这1000人得分的平均值(同一组数据用该组数据区间的中点值表示),请用正态分布的知识求;(2)在(1)的条件下,“创城办”为此次参加问卷调查的市民制定如下奖励方案:(ⅰ)得分不低于的可以获赠2次随机话费,得分低于的可以获赠1次随机话费;(ⅱ)每次获赠送的随机话费和对应的概率为:赠送的随机话费(单元:元)2040概率0.750.25现有市民甲要参加此次问卷调查,记(单位:元)为该市民参加问卷调查获赠的话费,求的分布列与数学期望.参考数据与公式:,若,则①;②;③.2.(2021·沙坪坝·重庆八中高三月考)消费扶贫是社会各界通过消费来自贫困地区和贫困人口的产品与服务,帮助贫困人口增收脱贫的一种扶贫方式,是社会力量参与脱贫攻坚的重要途径.某地为了解消费扶贫对贫困户帮扶情况,该地民政部门从本地的贫困户中随机抽取2000户时2020年的收入进行了一个抽样调查,得到如表所示的频数表:收入(千元)频数200600600300200100(1)将调查的2000户贫困户按照收入从低到高依次编号为1,2,3,……,2000,从这些贫困户中用系统抽样方法等距抽取50户贫困户进行深度帮扶,已知8号被抽到;(i)收入在和的贫困户卬被抽到进行深度帮扶的户数分别为多少?(ii)收入在和的贫困户中被抽到进行深度帮扶的凡中随机选取2户,记选取的2户中来自的户数为,求的分布列和数学期望;(2)由频率分布表可认为该地贫困户的收入近似服从正态分布.现从该地的所有贫困户中随机抽取10户,记收入在之外的户数为,求(精确到0.001).参考数据1:当时,,,.参考数据2:,.3.(2021·湖北高三开学考试)从某企业生产的某种产品中抽取1000件,测量这些产品的一项质量指标值,由测量结果得如下频率分布表和频率分布直方图.分组频数频率20.0020.0541060.1061490.1493521900.1901000.100470.047合计10001.000(1)求,,的值;(2)求出这1000件产品质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(3)由直方图可以认为,这种产品的质量指标值服从正态分布,其中近似为样本平均数,近似为样本方差,其中已计算得.如果产品的质量指标值位于区间,企业每件产品可以获利10元,如果产品的质量指标值位于区间之外,企业每件产品要损失100元,从该企业一天生产的产品中随机抽取20件产品,记为抽取的20件产品所获得的总利润,求.附:,,.4.(2021·四川高三其他模拟(理))在创建“全国文明城市”过程中,我市“创城办”为了调查市民对创城工作的了解情况,进行了一次创城知识问卷调查(一位市民只能参加一次)通过随机抽样,得到参加问卷调查的100人的得分统计结果如表所示:组别[30,40)[40,50)[50,60)[60,70)[70,80)[80,90)[90,100]频数213212524114(1)由频数分布表可以大致认为,此次问卷调查的得分,近似为这100人得分的平均值(同一组中的数据用该组区间的左端点值作代表),①求的值;②利用该正态分布,求;(2)在(1)的条件下,“创城办”为此次参加问卷调查的市民制定如下奖励方案:①得分不低于的可以获赠2次随机话费,得分低于的可以获赠1次随机话费;②每次获赠的随机话费和对应的概率为:赠送话费的金额(单位:元)2050概率现有市民甲参加此次问卷调查,记(单位:元)为该市民参加问卷调查获赠的话费,求的分布列与数学期望.参考数据与公式:.若,则,,.5.(2021·辽宁)《中国制造2025》提出,坚持“创新驱动、质量为先、绿色发展、结构优化、人オ为本”的基本方针,通过“三步走”实现制造强国的战略目标:第一步,到2025年迈入制造强国行列;第二步,到2035年中国制造业整体达到世界制造强国阵营中等水平;第三步,到新中国成立一百年时,综合实力进入世界制造强国前列.质检部门对设计出口的甲、乙两种“无人机”分别随机抽取100架检测某项质量指标,由检测结果得到如下的频率分布直方图:(1)写出频率分布直方图(甲)中a的值;记甲、乙两种“无人机”100架样本的质量指标的方差分别为,试比较的大小(只需给出答案);(2)若质检部门规定质量指标高于20的无人机为优质产品,根据上面抽取的200架无人机的质量指标进行判断,是否有95%的把握认为甲、乙两种“无人机”的优质率有差异?甲乙合计优质产品不是优质产品合计1001002000.050.0100.0050.0013.8416.6357.87910.828(3)由频率分布直方图可以认为,乙种“无人机”的质量指标值Z服从正态分布.其中近似为样本平均数近似为样本方差,设表示从乙种无人机中随机抽取10架,其质量指标值位于(11.6,35.4)的架数,求的数学期望.注:①同一组数据用该区间的中点值作代表,计算得;②若,则.6.(2021·山西高三三模(理))2021年是中国共产党百年华诞.中国站在“两个一百年”的历史交汇点,全面建设社会主义现代化国家新征程即将开启.2021年3月23日,中宣部介绍中国共产党成立100周年庆祝活动八项主要内容,其中第一项是结合巩固深化“不忘初心、牢记使命”主题教育成果,在全体党员中开展党史学习教育.这次学习教育贯穿2021年全年,总的要求是学史明理、学史增信、学史崇德、学史力行,教育引导党员干部学党史、悟思想、办实事,开新局.为了配合这次学党史活动,某地组织全体党员干部参加党史知识竞赛,现从参加人员中随机抽取100人,并对他们的分数进行统计,得到如图所示的频率分布直方图.(1)现从这100人中随机抽取2人,记其中得分不低于80分的人数为,试求随机变量的分布列及期望;(2)由频率分布直方图,可以认为该地参加党史知识竞赛人员的分数服从正态分布,其中近似为样本平均数,近似为样本方差,经计算.现从所有参加党史知识竞赛的人员中随机抽取500人,且参加党史知识竞赛的人员的分数相互独立,试问这500名参赛者的分数不低于82.3的人数最有可能是多少?参考数据:,,,.7.(2021·全国高三其他模拟)从2020年开始,部分高校实行强基计划,选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,越来越多的学生通过参加数学竞赛来证明自己的数学实力.某省举行的数学联赛初赛有10000名学生参加,成绩数据服从正态分布N(80,100),现随机抽取了某市50名参赛学生的初赛成绩进行分析,发现他们的成绩全部位于区间[50,110]内.将成绩分成6组:[50,60),[60,70),[70,80),[80,90),[90,100),[100,110],得到如图所示的频率分布直方图,该50名学生成绩的平均分是77分.(1)求a,b的值(同一组数据用该组区间的中点值为代表).(2)(i)若要在全省选拔15.865%的同学通过初赛进入决赛,则分数线应定为多少?(ii)若给成绩位于全省前228名的同学颁发初赛一等奖的证书,现从本市这50名同学里面能成功进入决赛的同学中任意抽取3人,记这3人中得到初赛一等奖的数为,求的分布列和数学期望.附:若X~N(μ,σ²),则P(μ﹣σ≤X≤μ+σ)≈0.6827,P(μ﹣2σ≤X<μ+2σ)≈0.9545,P(μ﹣3σ≤X≤μ+3σ)≈0.9973.8.(2021·河南郑州·(理))已知某生产线的生产设备在正常运行的情况下,生产的零件尺寸(单位:)服从正态分布.(1)从该生产线生产的零件中随机抽取个,求至少有一个尺寸小于的概率;(2)为了保证生产线正常运行,需要对生产设备进行维护,包括日常维护和故障维修,假设该生产设备使用期限为四年,每一年为一个维护周期,每个周期内日常维护费为元,若生产设备能连续运行,则不会产生故障维修费;若生产设备不能连续运行,则除了日常维护费外,还会产生一次故障维修费.已知故障维修费第一次为元,此后每增加一次则故障维修费增加元.假设每个维护周期互相独立,每个周期内设备不能连续运行的概率为.求该生产设备运行的四年内生产维护费用总和的分布列与数学期望.参考数据:若,则,,,.9.(2021·通辽新城第一中学高三其他模拟(理))近年来,学生职业生涯规划课程逐渐进入课堂,考生选择大学就读专业时不再盲目扎堆热门专业,报考专业分布更加广泛,之前较冷门的数学、物理、化学等专业报考的人数也逐年上升.下表是某高校数学专业近五年的录取平均分与当年该学校的最低提档线对照表:年份20162017201820192020年份代码()该校最低提档分数线数学专业录取平均分提档线与数学专业录取平均分之差()(1)根据上表数据可知,与之间存在线性相关关系,用最小二乘法求关于的线性回归方程;(2)据以往数据可知,该大学每年数学专业的录取分数服从正态分布,其中为当年该大学的数学录取平均分,假设2021年该校最低提档分数线为分.(i)若该大学2021年数学专业录取的学生成绩在分以上的有人,本专业2021年录取学生共多少人?进入本专业高考成绩前名的学生可以获得一等奖学金.一等奖学金分数线应该设定为多少分?请说明理由.(ii)若同学2021年高考考了分,他很想报考这所大学的数学专业,想第一志愿填报,请利用概率与统计知识,给该同学一个合理的建议.(第一志愿录取可能性低于,则建议谨慎报考)参考公式:,.参考数据:,,10.(2021·合肥一六八中学高三其他模拟(理))2020年是全面建成小康社会之年,是脱贫攻坚收官之年.莲花村是乡扶贫办的科学养鱼示范村,为了调查该村科技扶贫成果,乡扶贫办调查组从该村的养鱼塘内随机捕捞两次,上午进行第一次捕捞,捕捞到60条鱼,共105kg,称重后计算得出这60条鱼质量(单位kg)的平方和为200.41,下午进行第二次捕捞,捕捞到40条鱼,共66kg.称重后计算得出这40条鱼质量(单位kg)的平方和为117.(1)请根据以上信息,求所捕捞100条鱼质量的平均数和方差;(2)根据以往经验,可以认为该鱼塘鱼质量X服从正态分布,用作为的估计值,用作为的估计值.随机从该鱼糖捕捞一条鱼,其质量在的概率是多少?(3)某批发商从该村鱼塘购买了1000条鱼,若从该鱼塘随机捕捞,记为捕捞的鱼的质量在的条数,利用(2)的结果,求的数学期望.附:(1)数据,,…的方差,(2)若随机变量X服从正态分布,则;;.13.(2021·湖南师大附中高三其他模拟)某工厂引进新的生产设备M,为对其进行评估,从设备M生产零件的流水线上随机抽取100件零件作为样本,测量其直径后,整理得到下表:直径/5859616263646566676869707173合计件数11356193318442121100经计算,样本的平均值,标准差,以频率值作为概率的估计值.(1)为评估设备M对原材料的利用情况,需要研究零件中某材料含量y和原料中的该材料含量x之间的相关关系,现取了8对观测值,求y与x的线性回归方程.附:①对于一组数据,其回归直线的斜率和截距的最小二乘法估计公式分别为,;②参考数据:,,,.(2)为评判设备M生产零件的性能,从该设备加工的零件中任意抽取一件,记其直径为X,并根据以下不等式进行评判(P表示相应事件的概率);①;②;③.评判规则为:若同时满足上述三个不等式,则设备等级为甲;仅满足其中两个,则等级为乙;若仅满足其中一个,则等级为丙;若全部不满足,则等级为丁,试判断设备M的性能等级.(3)将直径小于等于或直径大于的零件认为是次品.从样本中随意抽取2件零件,再从设备M的生产流水线上随意抽取2件零件,计算其中次品总数Y的数学期望E(Y).概率与统计专题四:独立性检验一、必备秘籍1.列联表设,为两个变量,它们的取值分别为和,其样本频数列联表(列联表)如下:总计总计2.独立性检验利用随机变量(也可表示为)(其中为样本容量)来判断“两个变量有关系”的方法称为独立性检验.3.独立性检验的一般步骤(1)根据样本数据列出列联表;(2)计算随机变量的观测值k,查下表确定临界值k0:(3)如果,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”.【注意】(1)通常认为时,样本数据就没有充分的证据显示“X与Y有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.二、例题讲解1.(2021·榆林市第十中学高三月考(文))随着经济的发展,人们的生活水平显著提高,健康意识不断增强,健康管理理念深入人心,人们参加体育锻炼的次数与时间在逐渐增加.某校一个课外学习小组为研究居民参加体育锻炼的时长(时长不超过60分钟)是否与性别有关,对某小区居民进行调查,并随机抽取了100名居民的调查结果,其中男性有55人,根据调查结果绘制了居民日均锻炼时间的频率分布直方图如下:(1)求样本中居民日均锻炼时间的中位数;(2)将日均锻炼时间不低于40分钟的居民称为“健生达人”(健康生活达人),已知样本中“健生达人”中有10名女性,根据已知条件完成下面列联表,并据此资料判断是否有的把握认为“健生达人”与性别有关.非健生达人健生达人合计男女10合计100附:,.0.100.050.012.7063.8416.6352.(2021·江苏南京市·高三开学考试)科研小组为提高某种水果的果径,设计了一套实验方案,并在两片果园中进行对比实验.其中实验园采用实验方案,对照园未采用.实验周期结束后,分别在两片果园中各随机选取100个果实,按果径分成5组进行统计:,,,,(单位:).统计后分别制成如下的频率分布直方图,并规定果径达到36及以上的为“大果”.(1)请根据题中信息完成下面的列联表,并判断是否有的把握认为“大果”与“采用实验方案”有关;采用实验方案未采用实验方案合计大果非大果合计100100200(2)根据长期种植经验,可以认为对照园中的果径服从正态分布,其中近似为样本平均数,,请估计对照园中果径落在区间内的概率.(同一组中的数据以这组数据所在区间中点的值作代表)附:①;②若服从正态分布,则,,.三、实战练习1.(2021·定远县育才学校高三开学考试(文))微信是腾讯公司推出的一种手机通信软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人.为了调查微信用户每天使用微信的时间,某经销化妆品的店家在一广场随机采访男性、女性用户各50名,将男性、女性平均每天使用微信的时间(单位:h)分成5组:分别加以统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图估计女性平均每天使用微信的时间;(2)若每天玩微信超过的用户称为“微信控”,否则称为“非微信控”,判断是否有90%的把握认为“微信控”与性别有关.附表:0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(参考公式:,其中)2.(2021·河北唐山·高三开学考试)数字人民币是由央行发行的法定数字货币,它由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.截至2021年6月30日,数字人民币试点场景已超132万个,覆盖生活缴费、餐饮服务、交通出行、购物消费、政务服务等领域.为了进一步了解普通大众对数字人民币的感知以及接受情况,某机构进行了-次问卷调查,部分结果如下:学历小学及以下初中高中大学专科大学本科硕士研究生及以上不了解数字人民币35358055646了解数字人民币406015011014025(1)如果将高中及高中以下的学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的列联表;学历了解情况低学历高学历合计不了解数字人民币了解数字人民币合计(2)若从低学历的被调查者中,按对数字人民币的了解程度用分层抽样的方法抽取8人,然后从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率;(3)根据列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:0.0500.0100.001k3.8416.63510.8283.(2021·广东实验中学高三月考)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格:潜伏期(单位:天)人数85205310250130155(1)求这1000名患者的潜伏期的样本平均值(同一组中的数据用该组区间的中点值作代表);(2)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表请将列联表补充完整,并根据列联表判断是否有95%的把捏认为潜伏期与息者年龄有关;潜伏期天潜伏期天总计50岁以上(含50)10050岁以下55总计200(3)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期超过6天的人数最有可能(即概率最大)是多少?附:,其中.0.050.0250.0103.8415.0246.6354.(2021·黑龙江高三其他模拟(文))据有关部门统计,2020年本科生的平均签约薪酬为每月4300元.2020年某高校毕业生就业指导中心为了分析本校本科毕业生的专业课成绩优秀与否与本科毕业生就业后获得薪酬的关系,随机调查了从学校毕业的200名本科毕业学进行研究.研究结果表明:在专业课成绩优秀的120名本科毕业生中有90人每月工资超过人民币4300元,另30人每月工资低于人民币4300元;在专业课成绩不优秀的80名本科毕业生中有20人每月工资超过人民币4300元,另60人每月工资低于人民币4300元.(1)试根据上述数据完成列联表;专业课优秀专业课不优秀合计每月平均工资超过4300元每月平均工资低于4300元合计(2)能否在犯错误的概率不超过的前提下认为“该高校本科毕业生的专业课成绩优秀”与“每月工资超过当年本科生的平均签约薪酬”有关系?参考公式:,其中.()5.(2021·山东济宁一中高三开学考试)为提高教育教学质量,越来越多的高中学校采用寄宿制的封闭管理模式.某校对高一新生是否适应寄宿生活十分关注,从高一新生中随机抽取了100人,其中男生占总人数的40%,且只有20%的男生表示自己不适应寄宿生活,女生中不适应寄宿生活的人数占总人数的32%,学校为了考察学生对寄宿生活适应是否与性别有关,构建了如下2×2列联表:不适应寄宿生活适应寄宿生活合计男生女生合计(1)请将2×2列联表补充完整,并依据小概率值的独立性检验,分析“适应寄宿生活与否”是否与性别有关;(2)从男生中以“是否适应寄宿生活”为标准采用分层抽样的方法随机抽取10人,再从这10人中随机抽取2人,若所选2名学生中的“不适应寄宿生活”人数为,求随机变量的分布列及数学期望.附:,其中.0.150.100.050.0250.010.0012.0722.7063.8415.0256.63510.8286.(2021·全国高三月考)某企业计划招聘新员工,现对应聘者关于工作的首要考虑因素进行调查﹐所得统计结果如下表所示:男性女性以月薪作为主要考虑因素以发展前景作为主要考虑因素(1)是否有的把握认为应聘者关于工作的首要考虑因素与性别有关;(2)若招聘考核共设置个环节,应聘者需要参加全部环节的考核,每个环节设置两个项目,若应聘者每通过一个项目积分,未通过积分.已知甲第环节每个项目通过的概率均为,第环节每个项目通过的概率均为,各环节、各项目间相互独立.求甲经过两个环节的考核后所得积分之和的分布列和数学期望.参考公式:,其中.参考数据:7.(2021·重庆垫江第五中学校高三月考)随着垫江五中教学质量的提升学生总人数达到了历史最高点即4700人左右,但学校发展的同时也对学校学生就餐带来前所未有的挑战.因此学校领导制定出学生分时就餐(第一轮11:40,第二轮12:30).经过一段时间的运行后,学校对就餐满意度进行调查,现从学校初、高中学生中随机抽取200人作为样本,得到下表(单位:人次)满意度初中学生高中学生男生女生男生女生满意45403530不满意5101520(1)初中学生高中学生合计满意不满意合计(2)(1)通过上表完成下列列联表,并判断能否有97.5%的把握认为“是否满意”与初、高中学生有关?(2)现从调查的学生中按表(2)分层抽样的方法抽取8人,再从这8人中任选2人,记X为这2人中为满意的人数,求X的分布列和数学期望.参考公式及数据:,其中.0.400.250.150.100.050.0250.7801.3232.0722.7063.8415.0248.(2021·全国高三月考(理))梨树绝大多数品种自花授粉,结实率很低,因此果农在栽培梨树的时候,必须在果园配置授粉树,并结合适当的辅助授粉方法,以便更顺利地完成梨树的授粉受精过程,以此达到果园丰产稳产、高品质的目的.某地区将梨树蜜蜂授粉和自然授粉的花朵坐果率进行比较,统计数据如下:坐果授粉方式总计自然授粉蜜蜂授粉花朵未坐果花朵坐果(1)自然授粉和蜜蜂授粉的花朵坐果数的频率分别是多少?(2)根据数据完成下列列联表,并据此判断能否有的把握认为自然授粉与蜜蜂授粉的花朵坐果率有差异?坐果授粉方式总计自然授粉蜜蜂授粉花朵未坐果花朵坐果总计附:,9.(2021·陕西西安中学高三月考(文))2019年2月4日20:00,2019年央视春晚在中央电视台综合频道等频道并机直播.人们通过手机、互联网、电视等方式,都在观看央视春晚.某调查网站从观看央视春晚的观众中随机选出200人,经统计这200人中通过传统的传媒方式电视端口观看的人数与通过新型的传媒PC端口观看的人数之比为4:1.将这200人按年龄分组:第1组,第2组,第3组,第4组,第5组,其中统计通过传统的传媒方式电视端口观看的观众得到的频率分布直方图如图所示.(1)求的值及通过传统的传媒方式电视端口观看的观众的平均年龄;(2)把年龄在第1,2,3组的观众称青少年组,年龄在第4,5组的观众称为中老年组,若选出的200人中通过新型的传媒方式端口观看的中老年人有12人,请完成下面2×2列联表,则能否在犯错误的概率不超过0.1的前提下认为观看央视春晚的方式与年龄有关?附:通过PC端口观看通过电视端口观看合计青少年中老年合计(其中为样本容量).0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.82810.(2021·合肥市第六中学高三开学考试(文))医学统计表明,疾病在老年人中发病率较高.已知某地区老年人的男女比例为3:2,为了解疾病在该地区老年人中发病情况,按分层抽样抽取100名老人作为样本,对这100位老人是否患有疾病进行统计,得条形图如下所示.(1)完成下列2×2列联表,并判断有没有90%的把握认为患疾病与性别有关?男性女性合计患有疾病未患疾病合计(2)在这100个样本中,将未患疾病老年人按年龄段,,,,分成5组,得频率分布直方图如图二所示.求未患病老年人的中位数(精确到小数点后一位).附:,其中.0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.82811.(2021·武功县普集高级中学高三开学考试(理))某校组织了全体学生参加“建党周年”知识竞赛,从高一、高二年级各随机抽取名学生的竞赛成绩(满分分),统计如下表:分数段高一年级高二年级(1)分别估计高一、高二年级竞赛成绩的平均值与(同一组中的数据以该组数据所在区间中点的值作代表);(2)学校规定竞赛成绩不低于分的为优秀,根据所给数据,完成下面的列联表,并判断是否有的把握认为竞赛成绩优秀与年级有关?非优秀优秀合计高一年级高二年级合计附:,其中.概率与统计专题五:回归直线方程一、必备秘籍1.两个变量线性相关(1)散点图:将样本中个数据点(i=1,2,…,)描在平面直角坐标系中得到的图形.(2)正相关与负相关①正相关:散点图中的点散布在从左下角到右上角的区域.②负相关:散点图中的点散布在从左上角到右下角的区域.2.回归直线的方程(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.(3)回归方程的推导过程:①假设已经得到两个具有线性相关关系的变量的一组数据,,.②设所求回归方程为,其中是待定参数.③由最小二乘法得其中,是回归方程的斜率,是截距.二、例题讲解1.(2021·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自年月日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前周每周普及宣传的人数与时间的数据,得到下表:时间周人数(1)若可用线性回归模型拟合与的关系,求关于的线性回归方程;(2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.参考公式及数据:回归方程中斜率和截距的最小二乘估计公式分别为,,.2.(2021·合肥市第六中学高三模拟预测(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了树木,某农科所为了研究树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵树木,调查得到树木根部半径(单位:米)与树木高度(单位:米)的相关数据如表所示:0.10.20.30.40.50.61.11.31.61.52.02.1(1)求关于的线性回归方程;(2)对(1)中得到的回归方程进行残差分析,若某树木的残差为零则认为该树木“长势标准”,在此片树木中随机抽取1棵树木,估计这棵树木“长势标准”的概率.参考公式:回归直线方程为,其中,.三、实战练习1.(2021·湖南师大附中高三月考)今年五月,某医院健康管理中心为了调查成年人体内某种自身免疫力指标,从在本院体检的人群中随机抽取了100人,按其免疫力指标分成如下五组:,其频率分布直方图如图1所示.今年六月,某医药研究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y与疫苗注射量x个单位具有相关关系,样本数据的散点图如图2所示.(1)健管中心从自身免疫力指标在内的样本中随机抽取3人调查其饮食习惯,记表示这3人中免疫力指标在内的人数,求的分布列和数学期望;(2)由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以健管中心抽取的100人作为普通人群的样本,据此估计疫苗注射量不应超过多少个单位.附:对于一组样本数据,其回归直线的斜率和截距的最小二乘估计值分别为.2.(2021·安徽师范大学附属中学(理))根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村名居民(未接种)的一个样本,天内每天新接种疫苗的情况,如下统计表:第天新接种人数(1)建立关于的线性回归方程;(2)假设全村共计名居民(均未接种过疫苗),用样本估计总体来预测该村居民接种新冠疫苗需要几天?参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.3.(2021·九龙坡·重庆市育才中学高三月考)随着城市规模的扩大和人们生活水平的日益提高,某市近年机动车保有量逐年递增.根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数据情况为:年度周期1995~20002000~20052005~20102010~20152015~2020时间变量12345纯增数量(单位:万辆)3691527其中,时间变量对应的机动车纯增数据为,且通过数据分析得到时间变量与对应的机动车纯增数量(单位:万辆)具有线性相关关系.(1)求机动车纯增数量(单位:万辆)关于时间变量的回归方程,并预测2025~2030年间该市机动车纯增数量的值;附:回归直线方程中斜率和截距的最小二乘估计公式分别为:;.(2)该市交通管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了200名市民,将他们的意见和是否拥有私家车情况进行了统计,得到如下的列联表:赞同限行不赞同限行合计没有私家车8515100有私家车7525100合计16040200根据上面的列联表判断,能否有95%的把握认为“对限行的意见与是否拥有私家车”有关.附:,.0.150.100.050.0250.0100.0050.0012.0722.7063.8415.0246.6357.87910.8284.(2021·贵州贵阳·高三月考(理))据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm,其余均在50mmm以上,局地超过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数(,且)表示是否下雨:当时表示该地区下雨,当时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下:332714740945593468491272073445992772951431169332435027898719(1)求出k的值,使得该地区每一天下雨的概率均为;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;(2)2016年到2020年该地区端午节当天降雨量(单位:mm)如表:时间2016年2017年2018年2019年2020年年份12345降雨量2827252322经研究表明:从2016年到2020年,该地区端午节有降雨的年份的降雨量与年份具有线性相关关系,求回归直线方程.并预测该地区2022年端午节有降雨的话,降雨量约为多少?参考公式:,.5.(2021·重庆高三月考)为了研究义务教育阶段学生的数学核心素养与抽象能力指标分、推理能力指标分、建模能力指标分的相关性,其中,,,并将它们各自量化为一级、二级、三级3个等级,再用综合指标的值评定学生的数学核心素养,若,则数学核心素养为一级若,则数学核心素养为二级若,则数学核心素养为三级,为了了解重庆市1年级至9年级在校学生的数学核心素养,调查人员随机抽取了该地的五个年级,访问了每个年级的2个学生,统计得到这10个学生的如下数据:年级24568数学核心素养分29,3138,4247,5356,6469,71数学核心素养平均分分3040506070(1)画出散点图,并判断,之间是否具有相关关系(2)若,之间具有线性相关关系,试估计重庆市9年级的学生数学核心素养平均分为多少(3)在这10名学生中任取三人,其中数学核心素养等级是一级的学生人数记为,求随机变量的分布列和数学期望.附:①参考数据:,②求线性回归方程的系数公式,6.(2021·沙坪坝·重庆南开中学高三月考)近年来,学生职业生涯规划课程逐渐进入课堂,考生选择大学就读专业时不再盲目扎堆热门专业,报考专业分布更加广泛,报考之前较冷门专业的人数也逐年上升.下表是某高校专业近五年来在某省录取平均分与当年该大学的最低提档线对照表:年份20172018201920202021年份代码()该校最低提档分数线专业录取平均分专业录取平均分与提档线之差()(1)根据上表数据可知,与之间存在线性相关关系,用最小二乘法求关于的线性回归方程;(2)据以往数据可知,该大学专业每年录取分数服从正态分布,其中为当年该大学专业录取的平均分.假设2022年该大学最低提档线为分.①利用(1)的结果预测2022年专业录取平均分;②若某同学2022年高考考了分,该大学专业在该省共录取100人,录取成绩前五名的学生可以获得一等奖学金,请问该同学能否获得该奖学金?请说明理由.参考公式:,.参考数据:,,.7.(2021·全国(理))某药厂为了了解某新药的销售情况,将今年2至6月份的销售额整理得到如下图表:月份23456销售额(万元)1925353742(1)根据2至6月份的数据,求出每月的销售额关于月份的线性回归方程;(2)根据所求线性回归方程预测该药厂今年第三季度(7,8,9月份)这种新药的销售总额.(参考公式:,)8.(2021·眉山市彭山区第一中学(文))为助力湖北新冠疫情后的经济复苏,某电商平台为某工厂的产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:单价(元/件)88.28.48.68.89销量(万件)908483807568(1)根据以上数据,求关于的线性回归方程;(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润?(参考公式:回归方程,其中,)9.(2021·四川内江·高三其他模拟(文))为了选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部开展了招生改革工作——强基计划.现对某高中学校学生对强基课程学习的情况进行调查,在参加数学和物理的强基计划课程学习的学生中,随机抽取了名学生.(1)在某次数学强基课程的测试中,这名学生成绩的统计数据如茎叶图所示,其中某男生的成绩被污损(为整数),求女生的平均分数超过男生的平均分数的概率.男生女生(2)已知学生的物理成绩与数学成绩是线性相关的,现统计了小明同学连续次在强基课程测试中的数学和物理成绩(如下表).若第次测试该生的数学成绩达到,请你估计第次测试他的物理成绩大约是多少?数学成绩物理成绩附:,.10.(2021·全国高三模拟预测(文))发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:年份20152016201720182019编号12345年光伏发电量(亿千瓦时)395665117817752243其中.(1)请用相关系数说明是否可用线性回归模型拟合年光伏发电量与的关系;(2)建立年光伏发电量关于的线性回归方程,并预测2021年年光伏发电量(结果保留整数).参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,,11.(2021·全国高三其他模拟(文))实施新规后,某商场2020年1月份至10月份的收入情况如表.月份12345678910收入(万元)10121513161715161620并计算得,,,.(1)是否可用线性回归模型拟合与的关系?请用相关系数加以说明;(当时,那么变量,有较强的线性相关关系)(2)建立关于的回归方程(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)附:,,.概率与统计专题六:非线性回归方程必备秘籍当经验回归方程并非形如()时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:曲线方程变换公式变换后的线性关系式建立非线性经验回归模型的基本步骤1.确定研究对象,明确哪个是解释变量,哪个是响应变量;2.由经验确定非线性经验回归方程的模型;3.通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);4.按照公式计算经验回归方程中的参数,得到经验回归方程;5.消去新元,得到非线性经验回归方程;6.得出结果后分析残差图是否有异常.二、例题讲解1.(2021·全国高三专题练习(文))人类已经进入大数据时代.目前,数据量级已经从(1=1024)级别跃升到(1=1024),(1=1024)乃至(1=1024)级别.国际数据公司(IDC)研究结果表明,2008年全球产生的数据量为0.49,2009年数据量为0.8,2010年增长到1.2,2011年数据量更是高达1.82.下表是国际数据公司(IDC)研究的全球近6年每年产生的数据量(单位:)及相关统计量的值:年份201420152016201720182019序号123456年数据量6.68.616.121.633.041.03.521.152.8517.5813.82125.356.73表中,.(1)根据上表数据信息判断,方程(是自然对数的底数)更适宜作为该公司统计的年数据量y关于年份序号x的回归方程类型,试求此回归方程(精确到0.01).(2)有人预计2021年全世界产生的数据规模将超过2011年的50倍.根据(1)中的回归方程,说明这种判断是否准确,并说明理由.参考数据:,,回归方程中,斜率最小二乘法公式为,.2.(2021·全国高三专题练习(文))有一种速度叫中国速度,有一种骄傲叫中国高铁.中国高铁经过十几年的发展,取得了举世瞩目的成就,使我国完成了从较落后向先进铁路国的跨越式转变.中国的高铁技术不但越来越成熟,而且还走向国外,帮助不少国家修建了高铁.高铁可以说是中国一张行走的名片.截至到2020年,中国高铁运营里程已经达到3.9万公里.下表是2013年至2020年中国高铁每年的运营里程统计表,它反映了中国高铁近几年的飞速发展:年份20132014201520162017201820192020年份代码12345678运营里程万公里1.31.61.92.22.52.93.53.9根据以上数据,回答下面问题.(1)甲同学用曲线来拟合,并算得相关系数,乙同学用曲线来拟合,并算得转化为线性回归方程所对应的相关系数,试问哪一个更适合作为关于的回归方程类型,并说明理由;(2)根据(1)的判断结果及表中数据,求关于的回归方程(系数精确到).参考公式:用最小二乘法求线性回归方程的系数公式:;参考数据:令三、实战练习1.(2021·山东菏泽·高三二模)“十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为2021年到2025年.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额和年盈利额数据进行分析,建立了两个函数模型:;,其中,,,均为常数,为自然对数的底数令,经计算得如下数据:,,,,,,,,,,问:(1)请从相关系数的角度,分析哪一个模型拟合度更好?(2)根据(1)的选择及表中数据,建立,关于的回归方程(系数精确到0.01)(3)若希望2021年盈利额y为500亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)附:①相关系数r=回归直线中:,参考数据:,.2.(2021·重庆高三三模)近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数(单位:千件)之间的关系,对该网点近5天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位;元)(i=1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.45.160.4152.028300.507表中,.(1)根据散点图判断,与哪一个适宜作为关于的回归方程类型?并根据判断结果及表中数据求出关于的回归方程;(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数(单位:千件)与单件快递的平均价格(单位;元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:①预测该网点某天揽收2000件快递可获得的总利润;②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.3.(2021·安徽蚌埠二中高三模拟预测(文))自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).日期(月/日)4/095/045/296/237/188/13统计时间序号123456累计确认人数43.3118.8179.4238.8377.0536.0日期(月/日)9/0610/0110/2611/1912/14统计时间序号7891011累计确认人数646.0744.7888.91187.41673.7(1)将4月9日作为第1次统计,若将统计时间序号作为变量,每次累计确诊人数作为变量,得到函数关系,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值,,,,,,,,,,根据相关数据,确定该函数关系式(参数,的取值精确到0.01);(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率.参考公式:线性回归方程中,,;4.(2021·贵州(理))某二手车交易市场对2020年某品牌二手车的交易进行了统计,得到如图所示的频率分布直方图和散点图.用表示该车的使用时间(单位:年),表示其相应的平均交易价格(单位:万元).(Ⅰ)已知2020年在此交易市场成交的该品牌二手车为辆,求使用时间在的车辆数;(Ⅱ)由散点图分析后,可用作为此交易市场上该种车辆的平均交易价格关于其使用时间的回归方程.5.59230080385表中,.根据上述相关数据,求关于的回归方程.附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.5.(2021·河南洛阳市·高三二模(理))某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间近似满足关系式(、为大于0的常数).按照某项指标测

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论