版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第14讲统计(核心考点讲与练)
Q著点考向
1.总体、样本、样本容量
要考察的对象的全体叫做总体,每一个考察对象叫做个体,从总体中被抽取的考察对象的集
体叫做总体的一个样本,样本中个体的数目叫做样本容量.
2.获取数据的基本途径
获取数据的基本途径包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等.
⑴统计报表是指各级企事业、行政单位按规定的表格形式、内容、时间要求报送程序,自
上而下统一布置,提供统计资料的一种统计调查方式.
(2)年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具
书.汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书.
3.简单随机抽样
(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体
中的各个个体有±1®的可能性被抽到,这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
(3)应用范围:总体中的个体数较少.
4.分层抽样
(1)定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部
分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫
做分层抽样.
(2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
5.频率分布直方图
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=振极差;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表璃靠,每个小矩形的面积表示样本落在该组内的频率.
6.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的史虎,就得到频率分布折线
图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率
分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
7.样本的数字特征
数字特征定义
众数在一组数据中,出现次数量多的数据叫做这组数据的众数
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据
中位数
的王均数)叫做这组数据的中位数
样本数据的算术平均数,即"十尤:+从
平均数X—2
1二
2
方差$2=才⑴一%)2±3-X)2T--------\-(Xn—X)]f其中S为标准差
8.百分位数
如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就
称为这一百分位的百分位数.可表示为:一组n个观测值按数值大小排列.如,处于p%位置
的值称第p百分位数.
Q方法技巧
1.统计图表人类辨识影像的能力要优於辨识文字与数字的能力,因此我们采用图形的方式来展
现数据时,常常不我们直接观察数据要来的快.
2.平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大
小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散
程度越小,越稳定.
J能力拓展
类型一:总体和样本
1.(2021•上海高二专题练习)某样本平均数为总体平均数为加,那么()
A.a=mB.a>mC.a<mD.。是,”的估计值
【答案】D
【分析】统计学中利用样本数据估计总体数据,可知样本平均数是总体平均数的估计值.
【详解】解:样本平均数为。,总体平均数为加,
统计学中,利用样本数据估计总体数据,
样本平均数a是总体平均数m的估计值.
故选:D.
【点睛】本题考查了利用样本数据估计总体数据的应用问题,是基础题.
类型二:抽样方法
1.(2021•上海高二专题练习)从2018名学生志愿者中选择50名学生参加活动,若采用
下面的方法选取:先用简单随机抽样从2018人中剔除18人,剩下的200°人再按系统抽样
的方法抽取50人,则在2018人中,每人入选的概率()
A.不全相等B.均不相等
125
C.都相等,且为一D.都相等,且为——
401009
【答案】D
【分析】根据简单随机抽样与系统抽样方法的定义,结合概率的意义,即可判断出每个人入
选的概率.
【详解】在系统抽样中,若所给的总体个数不能被样本容量整除时,则要先剔除几个个体,
然后再分组,在剔除过程中,每个个体被剔除的概率相等,
所以,每个个体被抽到包括两个过程,一是不被剔除,二是选中,这两个过程是相互独立的,
因此,每个人入选的概率为3-=25
20181009
故选D.
【点睛】本题考查简单随机抽样和系统抽样方法的应用,也考查了概率的意义,属于基础题.
2.(2021•上海高二专题练习)某中学有高中生960人,初中生480人,为了了解学生的身
体状况,采用分层抽样的方法,从该校学生中抽取容量为九的样本,其中高中生有24人,
那么〃等于
A.12B.18C.24D.36
【答案】D
【详解】:有高中生960人,初中生480人
二总人数为960+480=1440人
...其高中生占比为%=2,初中生占比为工
144033
22
由分层抽样原理可知,抽取高中生的比例应为高中生与总人数的比值一,即〃x—=24,则
33
〃=36.
故选D.
3.(2021•长宁区•上海市延安中学高二期末)某学校高一、高二、高三共有2400名学生,
为了调查学生的课余学习情况,拟采用分层抽样的方法抽取一个容量为120的样本,已知高
一有820名学生,高二有780名学生,则在该学校的高三应抽取名学生.
【答案】40
【分析】首先算出高三的学生人数,然后可得答案.
【详解】高三的学生有2400-820-780=800名
所以在该学校的高三应抽取800x卫二=40名学生
2400
故答案为:40
4.(2021・上海高二专题练习)某校共有师生1800人,现用分层抽样的方法,从所有师生
中抽取一个容量为150的样本,已知从学生中抽取的人数为140,则该学校的教师人数是
【答案】120;
【分析】设该学校的教师人数是x,根据分层抽样的比例,由I,。=12求解.
1800—xx
【详解】设该学校的教师人数是X,
解得%=120,
故答案为:120
【点睛】本题主要考查分层抽样的方法,属于基础题.
类型三:统计图表
1.(2021•上海浦东新区•华师大二附中高二开学考试)惠州市某工厂10名工人某天生产
同一类型零件,生产的件数分别是10、12、14、14、15、15、16、17、17、17,记
这组数据的平均数为a,中位数为b,众数为c,则()
A.a>b>cB.t)>c>aC.c>a>bD.c>U>a
【答案】D
【分析】根据平均数的求法,所有数据的和除以总个数即可,中位数求法是从大到小排列后,
最中间一个或两数的平均数,众数是在一组数据中出现次数最多的即是众数,根据以上方法
可以确定出众数与中位数.
,_十业心人
,JSAUi,10+12+14x2+15x2+16+17x3
【详斛】平均数--------------------------------=114.7,中位数Z7=15,众数
10
c-Yl,则
故选:D.
2.(2021・上海高二专题练习)已知某样本的容量为50,平均数为70,方差为75.现发现
在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记
录为90.在对错误的数据进行更正后,重新求得样本的平均数为无,方差为则()
A.元=70,$2<75B.元=70,1〉75
C.x>70,?<75D.x<70,?>75
【答案】A
【分析】根据题中所给的平均数的条件,重新列式求新数据的平均数,根据方差公式写出两
组数据的方差,并比较大小.
70x50+80-60+70-90
【详解】由题意,可得了==70,
50
设收集的48个准确数据分别记为石,々,…,》48,
2222
则75=焉[(芭-70)+(x2-70)+…+(%_70)2+(60-70)+(90-70)]
=点[(王一70)2+(%-70)2+…+(%-70)2+500],
『=点[(%]-70)2+(W-70>+…+(%-70f+(80_70)2+(70-70)2]
=\仙-70)2+(%-70)2+…+(%-70)2+100]<75,所以d<75.
故选:4
【点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平
均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.
3.(2021•宝山区•上海交大附中高二期末)已知某社区的家庭年收入(单位:万元)的频
率分布直方图如图所示,同一组中的数据用该组区间的中点值做代表,则该社区内家庭的平
均年收入的估计值是万元.
【答案】6.5
【分析】根据频率分布直方图的平均的计算公式,准确计算,即可求解.
【详解】根据频率分布直方图的平均数的计算公式,可得该社区内年收入的平均值为:
1=4.5x0.20+5.5x0.20+6.5x0.20+7.5x0.26+8.5x0.07+9.5x0.07=6.5•
即该社区内家庭的平均年收入的估计值是6.5万元.
故答案为:6.5.
4.(2021・上海高二专题练习)从总体中抽取一个样本是5,6,7,8,9,则总体方差的估
计值是.
【答案】2.5
【分析】先求出样本平均数,由此能求出总体方差的估计值.
【详解】解:从总体中抽取一个样本是5,6,7,8,9,
-1
样本平均数为x=,(5+6+7+8+9)=7,
,总体方差的估计值S?=’](5-7『+(6-7『+(7-7『+(8-7『+(9-7月=2.5,
故答案为:2.5.
【点睛】本题考查总体方差的估计值的求法,考查平均数、总体方差等基础知识,考查运算
求解能力,属于基础题.
5.(2021•上海高二专题练习)已知经停某站的高铁列车有100个车次,随机从中选取了40
个车次进行统计,统计结果为:10个车次的正点率为0.97,20个车次的正点率为0.98,10个
车次的正点率为0.99,则经停该站的所有高铁列车正点率的标准差的点估计值为(精
确到0.001).
【答案】0.007
【分析】根据平均数的公式,求出平均数,再根据标准差公式求出标准差即可.
【详解】由题意可知:所有高铁列车平均正点率为:
亍=-----1------x(10x0.97+20x0.98+10x0.99)=0.98.
10+20+10
所以经停该站的所有高铁列车正点率的标准差的点估计值为:
s=^x[10x(-0.01)2+20x02+10x0.012]=^x0.01=0.00707x0.007
故答案为:0.007
【点睛】本题考查了平均数和标准差的运算公式,考查了应用数学知识解决实际问题的能力.
6.(2021・上海高二专题练习)从某校随机抽取100名学生,获得了他们一周课外阅读时间
(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图(如图).
组号分组频数
1[0,2)6
2[2,4)8
3[4,6)17
4[6,8)22
5[8,10)25
6[10,12)12
7[12,14)6
8[14,16)2
9[16,18)2
合计100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的。,Z?的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该
周课外阅读时间的平均数在第几组.(只需写出结论)
【答案】(1)0.9;(2)a=0.085,6=0.125;(3)第4组.
【分析】(1)根据频率分布表求出1周课外阅读时间少于12小时的频数,再用频率和为1
求出所求的频率;
_频率
(2)根据小矩形的高=与三,即可求。、b的值;
组距
(3)利用平均数公式求得数据的平均数,可得答案.
【详解】解:(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6
+2+2=10(名),所以样本中的学生课外阅读时间少于12小时的频率是1------=0.9
100
故从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.
频率017
(2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以。=弁3=^—=0.085.
组距2
课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以6=彳频3率==0=205.125.
组距2
(3)同一组中的每个数据用该组区间的中点值代替,
则数据的平均数为:
1x0.06+3x0.08+5x0.17+7x0.22+9x0.25+11x0.12+13x0.06+15x0.02+17x0.02=7.68
(小时),
二样本中的100名学生该周课外阅读时间的平均数在第四组.
7.(2021•上海高二专题练习)电视传媒为了解某市100万观众对足球节目的收视情况,随
机抽取了100名观众进行调查.如图是根据调查结果绘制的观众每周平均收看足球节目时间
的频率分布直方图,将每周平均收看足球节目时间不低于L5小时的观众称为“足球迷”,并
将其中每周平均收看足球节目时间不低于2.5小时的观众称为“铁杆足球迷”.
(1)试估算该市“足球迷”的人数,并指出其中“铁杆足球迷”约为多少人;
(2)该市要举办一场足球比赛,已知该市的足球场可容纳10万名观众.根据调查,如果票
价定为100元/张,贝U非“足球迷”均不会到现场观看,而“足球迷”均愿意前往现场观看.如
果票价提高10%元/张(xeN),则“足球迷”中非“铁杆足球迷”愿意前往观看的人数会
减少10%%,“铁杆足球迷”愿意前往观看的人数会减少更竺%.问票价至少定为多少元
x+11
/张时,才能使前往现场观看足球比赛的人数不超过10万人?
【答案】⑴16万“足球迷”,3万“铁杆足球迷”,(2)140元/张
【详解】(1)样本中“足球迷”出现的频率=(0.16+0.10+0.06)x0.5=16%
“足球迷”的人数=100x16%=16(万)
“铁杆足球迷”=100x(0.06x0.5)=3(万)
所以16万“足球迷”中,“铁杆足球迷”约有3万人.
(2)设票价为100+lOx元,则一般“足球迷”中约有13(1-10x%)万人,“铁杆足球迷”
约有3(1—当L%)万人去现场看球.
X+11
100x13x3x
令13(1—10x%)+3(1-%)=16-—―一<10
x+1110x+11
化简得:13X2+113X-660>0
解得:x<------,或x>4,由xeN,x>4
13
即平均票价至少定为100+40=140元,才能使前往现场观看足球比赛的“足球迷”不超过10
万人.
考点:频率分布直方图
一、单选题
1.(2022•上海市崇明中学高二期中)为比较甲、乙两地某月14时的气温,随机选取该月中
的5天,将这5天中午14时的气温数据(单位:°C)制成如图所示的茎叶图,考虑以下结
论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的平均气温的标准差大于乙地该月14时的平均气温的标准差;
④甲地该月14时的平均气温的标准差小于乙地该月14时的平均气温的标准差;
其中根据茎叶图能得到的统计结论的编号为()
甲乙
986289
113012
A.①③B.①④C.②③D.②④
【答案】A
【分析】根据给定的茎叶图,求出甲乙两地某月14时的平均气温及其标准差即可比较作答.
—1
【详解】由茎叶图知,甲地该月14时的平均气温石=^(26+28+29+31+31)=29,
甲地该月14时的平均气温的标准差心=J1[(-3)2+(-1)2+02+22+22]=7l6,
——1
乙地该月14时的平均气温%2=5(28+29+30+31+32)=30,
乙地该月14时的平均气温的标准差心=J1[(-2)2+(-l)2+02+l2+22]=尬,
即甲地该月14时的平均气温低于乙地该月14时的平均气温,
甲地该月14时的平均气温的标准差大于乙地该月14时的平均气温的标准差,
所以根据茎叶图能得到的统计结论的编号为①③.
故选:A
2.(2022.上海市延安中学高二期末)下列命题中假命题是()
A.一组数据的极差可以表示这组数据的波动范围大小;
B.任意给定统计数据,都可以绘制散点图;
C.茎叶图既可以用于呈现单组数据,也可以用于对两组同类数据的比较分析;
D.一组数据中的百分位数既可能是这组数据中的数,也可能不是这组数据中的数.
【答案】B
【分析】根据极差、散点图、茎叶图和百分位数的定义即可判断答案.
【详解】极差表示最大值与最小值的差距,它在一定程度上能表示这组数据的波动大小范
围.A正确;
散点图应该是表示两个变量组成的数对.B错误;
根据茎叶图的作法可知,C正确;
一组n个观测值按数值大小排列,处于p%位置的值称第p百分位数,例如中位数是第50
百分位数,显然中位数可以在数据中,也可以不在数据中.D正确.
故选:B.
3.(2022・上海•格致中学高二期末)某工厂对一批产品进行了抽样检测.右图是根据抽样检测
后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],
样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净
重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是.
A.90B.75C.60D.45
【答案】A
【详解】样本中产品净重小于100克的频率为(0.050+0.100)x2=0.3,频数为36,
.♦•样本总数为二=120.
03
•.•样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)x2=
0.75,
.•.样本中净重大于或等于98克并且小于104克的产品的个数为120x0.75=90.
考点:频率分布直方图.
二、填空题
4.(2022.上海交大附中高二期中)某校有学生1200人,其中高三学生400人,为了解学生
的身体素质情况,采用按年级分层随机抽样的方法,从该校学生中抽取一个120人的样本,
则样本中高三学生的人数为.
【答案】40
【分析】根据分层抽样的抽样比相等即可求解.
【详解】某校有学生12。。人从该校学生中抽取一个12。人的样本,抽样比为血=方
所以样本中高三学生的人数为400x^=40人,
故答案为:40.
5.(2022・上海市实验学校高二期中)现对某批电子元件的寿命进行测试,因此使用随机数
法从该批次电子元件中抽取200个进行加速寿命试验,测得的寿命(单位:h)结果如下表
所示:
寿命(h)100120140160180200220240
个数1032443424261218
试估计这批电子元件的第60百分位数尸60=
【答案】170
【分析】根据条件及百分位数的含义即得.
10+32+44+34_60
【详解】•;
200~100
故这批电子元件的第60百分位数P60=16°^18°=170160.
故答案为:170.
6.(2022.上海市延安中学高二期末)我国古代数学名著《九章算术》有一抽样问题:“今有
北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北
乡需遣一百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有人.
【答案】8100
【解析】先设出北乡人,再根据分层抽样的方法列出式子,即可求解.
【详解】解:设北乡有x人,
108300-108
根据题意得:
T-7488+6912
解得:x=8100,
故北乡共有8100人.
故答案为:8100.
7.(2022•上海浦东新•高二期末)我国高铁发展迅速,技术先进.经统计,在经停某站的高
铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正
点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为.
【答案】0.98.
【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.
【详解】由题意得,经停该高铁站的列车正点数约为10x0.97+20x0.98+10x0.99=39.2,
392
其中高铁个数为1。+2。+1。=4。,所以该站所有高铁平均正点率约为行38.
【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,
难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点
列车数量与列车总数的比值.
三、解答题
8.(2022•上海市崇明中学高二期中)某校对学生成绩进行统计(折合百分制,得分为整数),
考虑该次竞赛的成绩分布,将样本分成5组,绘成频率分布直方图(如图),图中从左到右
依次为第一组到第五组,各小组的小长方形的高的比为1:3:6:4:2,第五组的频数为12.
(1)该样本的容量是多少?
(2)成绩落在哪一组中的人数最多?并求该小组的频率;
(3)该样本的第75百分位数在第几组中?
4
【答案】(1)96;⑵第三组,f;(3)第四组.
O
【分析】(1)根据给定条件,求出第五小组的频率即可计算作答.
(2)确定频率分布直方图中面积最大的小矩形,再求出频率作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论