




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2讲用样本估计总体[考纲解读]1.了解频率分布直方图的意义和作用,能根据频率分布表画频率分布直方图、频率折线图,并体会它们各自的特点.(重点)2.理解样本数据标准差的意义和作用,会计算数据的标准差;能从样本数据中提取基本的数字特征,并作出合理的解释.3.会用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征.(难点)4.会用随机抽样的基本方法和样本估计总体的思想解决实际问题.[考向预测]从近三年高考情况来看,本讲是高考中的一个热点.预测2021年将会考查用样本估计总体,主要体现在利用频率分布直方图估计总体,利用样本数字特征估计总体.题型以客观题呈现,试题难度不大,属中、低档题型.频率分布直方图也可能出现于解答题中,与概率等知识综合命题.1.作频率分布直方图的步骤2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的eq\o(□,\s\up3(01))中点,就得到频率分布折线图.(2)总体密度曲线:随着eq\o(□,\s\up3(02))样本容量的增加,作图时所分的组数增加,eq\o(□,\s\up3(03))组距减小,相应的频率折线图就会越来越接近于一条光滑曲线,即总体密度曲线.3.样本的数字特征(1)众数、中位数、平均数数字特征样本数据频率分布直方图优点与缺点众数出现次数eq\o(□,\s\up3(01))最多的数据取最高的小长方形底边eq\o(□,\s\up3(02))中点的横坐标通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征中位数将数据按大小依次排列,处在最eq\o(□,\s\up3(03))中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积eq\o(□,\s\up3(04))相等的分界线与x轴交点的横坐标是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点续表数字特征样本数据频率分布直方图优点与缺点平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之eq\o(□,\s\up3(05))和平均数和每一个数据有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低(2)方差和标准差方差:s2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(xn-eq\o(x,\s\up6(-)))2],标准差:s=eq\r(\f(1,n)[x1-\o(x,\s\up6(-))2+x2-\o(x,\s\up6(-))2+…+xn-\o(x,\s\up6(-))2]).(3)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.1.概念辨析(1)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.()(2)一组数据的方差越大,说明这组数据的波动越大.()(3)从频率分布直方图中得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.()(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越高.()答案(1)×(2)√(3)√(4)√2.小题热身(1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数答案B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.(2)港珠澳大桥于2018年10月2日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程,桥隧全长55千米.桥面为双向六车道高速公路,大桥通行限速100km/h,现对大桥某路段上1000辆汽车的行驶速度进行抽样调查.画出频率分布直方图(如图),根据直方图估计在此路段上汽车行驶速度在区间[85,90)的车辆数和行驶速度超过90km/h的频率分别为()A.3000.25 B.3000.35C.600.25 D.600.35答案B解析由频率分布直方图,得在此路段上汽车行驶速度在区间[85,90)的频率为0.06×5=0.3,∴在此路段上汽车行驶速度在区间[85,90)的车辆数为0.3×1000=300,行驶速度超过90km/h的频率为(0.05+0.02)×5=0.35.故选B.(3)(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.答案eq\f(5,3)解析这组数据的平均数为8,故方差为s2=eq\f(1,6)×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=eq\f(5,3).题型一样本数字特征的计算及应用1.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数 B.平均数C.方差 D.极差答案A解析中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.2.(2019·长沙二模)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x1,x2,x3,…,x100,它们的平均数为eq\o(x,\s\up6(-)),方差为s2;其中扫码支付使用的人数分别为3x1+2,3x2+2,3x3+2,…,3x100+2,它们的平均数为eq\o(x,\s\up6(-))′,方差为s′2,则eq\o(x,\s\up6(-))′,s′2分别为()A.3eq\o(x,\s\up6(-))+2,3s2+2 B.3eq\o(x,\s\up6(-)),3s2C.3eq\o(x,\s\up6(-))+2,9s2 D.3eq\o(x,\s\up6(-))+2,9s2+2答案C解析根据题意,数据x1,x2,…x100的平均数为eq\o(x,\s\up6(-)),方差为s2;则eq\o(x,\s\up6(-))=eq\f(1,100)(x1+x2+x3+…+x100),s2=eq\f(1,100)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(x100-eq\o(x,\s\up6(-)))2],若3x1+2,3x2+2,3x3+2,…,3x100+2的平均数为eq\o(x,\s\up6(-))′,则eq\o(x,\s\up6(-))′=eq\f(1,100)[(3x1+2)+(3x2+2)+…+(3x100+2)]=3eq\o(x,\s\up6(-))+2,方差s′2=eq\f(1,100)[(3x1+2-3eq\o(x,\s\up6(-))-2)2+(3x2+2-3eq\o(x,\s\up6(-))-2)2+…+(3x100+2-3eq\o(x,\s\up6(-))-2)2]=9s2.3.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的eq\f(2,3)倍,则该数据的方差为________.答案9解析根据题意知,该组数据的众数是2,则中位数是2÷eq\f(2,3)=3,把这组数据从小到大排列为1,2,2,x,5,10,则eq\f(2+x,2)=3,解得x=4,所以这组数据的平均数为eq\o(x,\s\up6(-))=eq\f(1,6)×(1+2+2+4+5+10)=4,方差为s2=eq\f(1,6)×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:s2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\o(x,\s\up6(-))2]或写成s2=eq\f(1,n)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-eq\o(x,\s\up6(-))2,即方差等于原数据平方的平均数减去平均数的平方.(3)平均数、方差的公式推广①若数据x1,x2,…,xn的平均数为eq\o(x,\s\up6(-)),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq\o(x,\s\up6(-))+a.见举例说明2.②数据x1,x2,…,xn的方差为s2.a.数据x1+a,x2+a,…,xn+a的方差也为s2;b.数据ax1,ax2,…,axn的方差为a2s2.见举例说明2.1.(2019·六安模拟)某样本中共有5个个体,其中4个值分别为0,1,2,3,第5个值丢失,但该样本的平均值为1,则样本方差为()A.2B.eq\f(6,5)C.eq\r(2)D.eq\f(\r(30),5)答案A解析设第5个值为x,则由题意,得eq\f(1,5)×(0+1+2+3+x)=1,解得x=-1,所以样本方差s2=eq\f(1,5)×[(0-1)2+(1-1)2+(2-1)2+(3-1)2+(-1-1)2]=2.2.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案0.98解析eq\o(x,\s\up6(-))=eq\f(10×0.97+20×0.98+10×0.99,10+20+10)=0.98.则经停该站高铁列车所有车次的平均正点率的估计值为0.98.题型二扇形图、折线图1.(2020·株洲市高三摸底)某市2019年12个月的PM2.5的平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是()A.第一季度B.第二季度C.第三季度D.第四季度答案B解析根据图中数据,知第一季度的数据是72.15,43.96,93.13;第二季度的数据是66.5,55.25,58.67;第三季度的数据是59.16,38.67,51.6;第四季度的数据是82.09,104.6,168.05;观察得出第二季度的数据波动性最小,所以第二季度的PM2.5的平均浓度指数方差最小.故选B.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A解析设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,(1)通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(2019·东北三省四市教研联合体模拟)“科技引领,布局未来”,科技研发是企业发展的驱动力量.2007年至2018年,某企业连续12年累计研发投入达4100亿元.我们将研发投入与经营收入的比值记为研发投入占营收比.这12年间的研发投入(单位:十亿元)用如图中的条形图表示,研发投入占营收比用如图中的折线图表示.根据折线图和条形图,下列结论错误的是()A.2012年至2013年研发投入占营收比增量相比2017年至2018年增量大B.2013年至2014年研发投入数量相比2015年至2016年增量小C.该企业连续12年研发投入逐年增加D.该企业连续12年研发投入占营收比逐年增加答案D解析由题图可知,该企业在2008年至2009年、2013年至2014年和2016年至2017年研发投入占营收比是下降的,所以D错误.故选D.题型三频率分布直方图角度1求频率或频数1.党的十九大报告指出:“脱贫攻坚战取得决定性进展,六千多万贫困人口稳定脱贫,贫困发生率从百分之十点二下降到百分之四以下.”2019年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3000户家庭的2019年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为()A.900户B.600户C.300户D.150户答案A解析由频率分布直方图得:年收入不超过6万的家庭所占频率为:(0.005+0.010)×20=0.3,∴年收入不超过6万的家庭大约为0.3×3000=900.角度2求数字特征2.某市在对两千多名出租车司机的年龄进行的调查中,从两千多名出租车司机中随机抽选100名司机,已知这100名司机的年龄都在20岁至50岁之间,且根据调查结果得出的年龄情况频率分布直方图如图所示(部分图表污损).利用这个残缺的频率分布直方图,可估计该市出租车司机年龄的中位数大约是()A.31.4岁 B.32.4岁C.33.4岁 D.36.4岁答案A解析由频率分布直方图可知[20,25)的频率为0.1,[25,30)的频率为0.3,[30,35)的频率为0.35,因为0.1+0.3<0.5<0.1+0.3+0.35,所以中位数x0∈[30,35),由0.1+0.3+(x0-30)×0.07=0.5,得x0≈31.4.故选A.3.(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.1.频率分布直方图的性质(1)小长方形的面积=组距×eq\f(频率,组距)=频率.见举例说明1.(2)各小长方形的面积之和等于1.2.频率分布直方图中的众数、中位数与平均数(1)最高的小长方形底边中点的横坐标即是众数;(2)平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位数;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.见举例说明3.1.(2019·湘潭三模)统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数分成如下6组:[
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省2024-2025学年高三1月期末语文试题(解析版)
- 加盟投资合同范例
- 单位打井工程合同标准文本
- 个人坟地买卖合同标准文本
- 农村拆迁收款合同范例
- 2025二手房买卖阴阳合同存在哪些风险?合同问题需警惕
- 华英证券合同范例
- 买方有两个单位合同范本
- 农村土地购买合同标准文本
- 卖茶叶佣金合同范例
- 第5课+光色交汇+课件-2024-2025学年浙人美版(2024)初中美术七年级下册
- 临沂考科目一试题及答案
- 2025年初级等保测评试题及答案
- 2025年全国中小学生安全知识竞赛参考试题库500题(含答案)
- DB11∕T493.1-2024道路交通管理设施设置规范 第1部分:道路交通标志
- 教师如何使用AI开展教学DeepSeek使用指南人工智能 课件
- 2025新人教版七年级下语文-4.16《有为有不为》教案教学设计
- 如何做好护理实习生的带教
- (二调)武汉市2025届高中毕业生二月调研考试 生物试卷(含标准答案)
- 2025年宁夏建设职业技术学院单招职业倾向性测试题库一套
- 《智能家居控制系统方案》课件
评论
0/150
提交评论