第14讲统计(核心考点讲与练)-2022-2023学年高二数学考试满分全(2020必修三)_第1页
第14讲统计(核心考点讲与练)-2022-2023学年高二数学考试满分全(2020必修三)_第2页
第14讲统计(核心考点讲与练)-2022-2023学年高二数学考试满分全(2020必修三)_第3页
第14讲统计(核心考点讲与练)-2022-2023学年高二数学考试满分全(2020必修三)_第4页
第14讲统计(核心考点讲与练)-2022-2023学年高二数学考试满分全(2020必修三)_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第14讲统计(核心考点讲与练)考点考点考向1.总体、样本、样本容量要考察的对象的全体叫做总体,每一个考察对象叫做个体,从总体中被抽取的考察对象的集体叫做总体的一个样本,样本中个体的数目叫做样本容量.2.获取数据的基本途径获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.(1)统计报表是指各级企事业、行政单位按规定的表格形式、内容、时间要求报送程序,自上而下统一布置,提供统计资料的一种统计调查方式.(2)年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书.汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书.3.简单随机抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.(3)应用范围:总体中的个体数较少.4.分层抽样(1)定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.5.频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=eq\f(极差,组数);第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示eq\f(频率,组距),每个小矩形的面积表示样本落在该组内的频率.6.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.7.样本的数字特征数字特征定义众数在一组数据中,出现次数最多的数据叫做这组数据的众数中位数将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数样本数据的算术平均数,即eq\o(x,\s\up6(-))=eq\f(x1+x2+…+xn,n)方差s2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-x)2+…+(xn-x)2],其中s为标准差8.百分位数如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n个观测值按数值大小排列.如,处于p%位置的值称第p百分位数.方法技巧方法技巧1.统计图表人类辨识影像的能力要优於辨识文字与数字的能力,因此我们采用图形的方式来展现数据时,常常不我们直接观察数据要来的快.2.平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.能力拓展能力拓展类型一:总体和样本1.(2021·上海高二专题练习)某样本平均数为,总体平均数为,那么()A. B. C. D.是的估计值【答案】D【分析】统计学中利用样本数据估计总体数据,可知样本平均数是总体平均数的估计值.【详解】解:样本平均数为,总体平均数为,统计学中,利用样本数据估计总体数据,∴样本平均数是总体平均数的估计值.故选:D.【点睛】本题考查了利用样本数据估计总体数据的应用问题,是基础题.类型二:抽样方法1.(2021·上海高二专题练习)从名学生志愿者中选择名学生参加活动,若采用下面的方法选取:先用简单随机抽样从人中剔除人,剩下的人再按系统抽样的方法抽取人,则在人中,每人入选的概率()A.不全相等 B.均不相等C.都相等,且为 D.都相等,且为【答案】D【分析】根据简单随机抽样与系统抽样方法的定义,结合概率的意义,即可判断出每个人入选的概率.【详解】在系统抽样中,若所给的总体个数不能被样本容量整除时,则要先剔除几个个体,然后再分组,在剔除过程中,每个个体被剔除的概率相等,所以,每个个体被抽到包括两个过程,一是不被剔除,二是选中,这两个过程是相互独立的,因此,每个人入选的概率为.故选D.【点睛】本题考查简单随机抽样和系统抽样方法的应用,也考查了概率的意义,属于基础题.2.(2021·上海高二专题练习)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为的样本,其中高中生有24人,那么等于A.12 B.18 C.24 D.36【答案】D【详解】∵有高中生人,初中生人∴总人数为人∴其高中生占比为,初中生占比为由分层抽样原理可知,抽取高中生的比例应为高中生与总人数的比值,即,则.故选D.3.(2021·长宁区·上海市延安中学高二期末)某学校高一、高二、高三共有2400名学生,为了调查学生的课余学习情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知高一有820名学生,高二有780名学生,则在该学校的高三应抽取__________名学生.【答案】40【分析】首先算出高三的学生人数,然后可得答案.【详解】高三的学生有名所以在该学校的高三应抽取名学生故答案为:404.(2021·上海高二专题练习)某校共有师生1800人,现用分层抽样的方法,从所有师生中抽取一个容量为150的样本,已知从学生中抽取的人数为140,则该学校的教师人数是__________;【答案】120;【分析】设该学校的教师人数是x,根据分层抽样的比例,由求解.【详解】设该学校的教师人数是x,则,解得,故答案为:120【点睛】本题主要考查分层抽样的方法,属于基础题.类型三:统计图表1.(2021·上海浦东新区·华师大二附中高二开学考试)惠州市某工厂10名工人某天生产同一类型零件,生产的件数分别是10、12、14、14、15、15、16、17、17、17,记这组数据的平均数为a,中位数为b,众数为c,则()A.a>b>c B.b>c>a C.c>a>b D.c>b>a【答案】D【分析】根据平均数的求法,所有数据的和除以总个数即可,中位数求法是从大到小排列后,最中间一个或两数的平均数,众数是在一组数据中出现次数最多的即是众数,根据以上方法可以确定出众数与中位数.【详解】平均数,中位数,众数,则,故选:D.2.(2021·上海高二专题练习)已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则()A. B.C. D.【答案】A【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两组数据的方差,并比较大小.【详解】由题意,可得,设收集的48个准确数据分别记为,则,,所以.故选:A.【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.3.(2021·宝山区·上海交大附中高二期末)已知某社区的家庭年收入(单位:万元)的频率分布直方图如图所示,同一组中的数据用该组区间的中点值做代表,则该社区内家庭的平均年收入的估计值是________万元.【答案】【分析】根据频率分布直方图的平均的计算公式,准确计算,即可求解.【详解】根据频率分布直方图的平均数的计算公式,可得该社区内年收入的平均值为:.即该社区内家庭的平均年收入的估计值是万元.故答案为:.4.(2021·上海高二专题练习)从总体中抽取一个样本是5,6,7,8,9,则总体方差的估计值是____________.【答案】【分析】先求出样本平均数,由此能求出总体方差的估计值.【详解】解:从总体中抽取一个样本是5,6,7,8,9,样本平均数为,总体方差的估计值,故答案为:2.5.【点睛】本题考查总体方差的估计值的求法,考查平均数、总体方差等基础知识,考查运算求解能力,属于基础题.5.(2021·上海高二专题练习)已知经停某站的高铁列车有100个车次,随机从中选取了40个车次进行统计,统计结果为:10个车次的正点率为0.97,20个车次的正点率为0.98,10个车次的正点率为0.99,则经停该站的所有高铁列车正点率的标准差的点估计值为______(精确到0.001).【答案】【分析】根据平均数的公式,求出平均数,再根据标准差公式求出标准差即可.【详解】由题意可知:所有高铁列车平均正点率为:.所以经停该站的所有高铁列车正点率的标准差的点估计值为:故答案为:【点睛】本题考查了平均数和标准差的运算公式,考查了应用数学知识解决实际问题的能力.6.(2021·上海高二专题练习)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图(如图).组号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的,的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)【答案】(1)0.9;(2)=0.085,=0.125;(3)第4组.【分析】(1)根据频率分布表求出1周课外阅读时间少于12小时的频数,再用频率和为1求出所求的频率;(2)根据小矩形的高,即可求、的值;(3)利用平均数公式求得数据的平均数,可得答案.【详解】解:(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生课外阅读时间少于12小时的频率是故从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以===0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以===0.125.(3)同一组中的每个数据用该组区间的中点值代替,则数据的平均数为:(小时),样本中的100名学生该周课外阅读时间的平均数在第四组.7.(2021·上海高二专题练习)电视传媒为了解某市100万观众对足球节目的收视情况,随机抽取了100名观众进行调查.如图是根据调查结果绘制的观众每周平均收看足球节目时间的频率分布直方图,将每周平均收看足球节目时间不低于1.5小时的观众称为“足球迷”,并将其中每周平均收看足球节目时间不低于2.5小时的观众称为“铁杆足球迷”.(1)试估算该市“足球迷”的人数,并指出其中“铁杆足球迷”约为多少人;(2)该市要举办一场足球比赛,已知该市的足球场可容纳10万名观众.根据调查,如果票价定为100元/张,则非“足球迷”均不会到现场观看,而“足球迷”均愿意前往现场观看.如果票价提高元/张,则“足球迷”中非“铁杆足球迷”愿意前往观看的人数会减少,“铁杆足球迷”愿意前往观看的人数会减少.问票价至少定为多少元/张时,才能使前往现场观看足球比赛的人数不超过10万人?【答案】(1)16万“足球迷”,3万“铁杆足球迷”,(2)140元/张【详解】(1)样本中“足球迷”出现的频率=“足球迷”的人数=(万)“铁杆足球迷”=(万)所以16万“足球迷”中,“铁杆足球迷”约有3万人.(2)设票价为元,则一般“足球迷”中约有万人,“铁杆足球迷”约有万人去现场看球.令化简得:解得:,由,即平均票价至少定为100+40=140元,才能使前往现场观看足球比赛的“足球迷”不超过10万人.考点:频率分布直方图巩固巩固提升一、单选题1.(2022·上海市崇明中学高二期中)为比较甲、乙两地某月14时的气温,随机选取该月中的5天,将这5天中午14时的气温数据(单位:)制成如图所示的茎叶图,考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的平均气温的标准差大于乙地该月14时的平均气温的标准差;④甲地该月14时的平均气温的标准差小于乙地该月14时的平均气温的标准差;其中根据茎叶图能得到的统计结论的编号为(

)A.①③ B.①④ C.②③ D.②④【答案】A【分析】根据给定的茎叶图,求出甲乙两地某月14时的平均气温及其标准差即可比较作答.【详解】由茎叶图知,甲地该月14时的平均气温,甲地该月14时的平均气温的标准差,乙地该月14时的平均气温,乙地该月14时的平均气温的标准差,即甲地该月14时的平均气温低于乙地该月14时的平均气温,甲地该月14时的平均气温的标准差大于乙地该月14时的平均气温的标准差,所以根据茎叶图能得到的统计结论的编号为①③.故选:A2.(2022·上海市延安中学高二期末)下列命题中假命题是(

)A.一组数据的极差可以表示这组数据的波动范围大小;B.任意给定统计数据,都可以绘制散点图;C.茎叶图既可以用于呈现单组数据,也可以用于对两组同类数据的比较分析;D.一组数据中的百分位数既可能是这组数据中的数,也可能不是这组数据中的数.【答案】B【分析】根据极差、散点图、茎叶图和百分位数的定义即可判断答案.【详解】极差表示最大值与最小值的差距,它在一定程度上能表示这组数据的波动大小范围.A正确;散点图应该是表示两个变量组成的数对.B错误;根据茎叶图的作法可知,C正确;一组n个观测值按数值大小排列,处于p%位置的值称第p百分位数,例如中位数是第50百分位数,显然中位数可以在数据中,也可以不在数据中.D正确.故选:B.3.(2022·上海·格致中学高二期末)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是.A.90 B.75 C.60 D.45【答案】A【详解】样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.考点:频率分布直方图.二、填空题4.(2022·上海交大附中高二期中)某校有学生1200人,其中高三学生400人,为了解学生的身体素质情况,采用按年级分层随机抽样的方法,从该校学生中抽取一个120人的样本,则样本中高三学生的人数为__________.【答案】40【分析】根据分层抽样的抽样比相等即可求解.【详解】某校有学生1200人,从该校学生中抽取一个120人的样本,抽样比为,所以样本中高三学生的人数为人,故答案为:40.5.(2022·上海市实验学校高二期中)现对某批电子元件的寿命进行测试,因此使用随机数法从该批次电子元件中抽取200个进行加速寿命试验,测得的寿命(单位:h)结果如下表所示:寿命(h)100120140160180200220240个数1032443424261218试估计这批电子元件的第60百分位数____________【答案】170【分析】根据条件及百分位数的含义即得.【详解】∵,故这批电子元件的第60百分位数160.故答案为:170.6.(2022·上海市延安中学高二期末)我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有______人.【答案】8100【解析】先设出北乡人,再根据分层抽样的方法列出式子,即可求解.【详解】解:设北乡有人,根据题意得:,解得:,故北乡共有人.故答案为:.7.(2022·上海浦东新·高二期末)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.三、解答题8.(2022·上海市崇明中学高二期中)某校对学生成绩进行统计(折合百分制,得分为整数),考虑该次竞赛的成绩分布,将样本分成5组,绘成频率分布直方图(如图),图中从左到右依次为第一组到第五组,各小组的小长方形的高的比为,第五组的频数为12.(1)该样本的容量是多少?(2)成绩落在哪一组中的人数最多?并求该小组的频率;(3)该样本的第75百分位数在第几组中?【答案】(1)96;(2)第三组,;(3)第四组.【分析】(1)根据给定条件,求出第五小组的频率即可计算作答.(2)确定频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论