2025届高三数学一轮总复习 第八章 第二讲 用样本估计总体配套课件_第1页
2025届高三数学一轮总复习 第八章 第二讲 用样本估计总体配套课件_第2页
2025届高三数学一轮总复习 第八章 第二讲 用样本估计总体配套课件_第3页
2025届高三数学一轮总复习 第八章 第二讲 用样本估计总体配套课件_第4页
2025届高三数学一轮总复习 第八章 第二讲 用样本估计总体配套课件_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲用样本估计总体2025年高考一轮总复习第八章

统计与统计分析1.总体取值规律的估计(1)绘制频率分布直方图的步骤①求极差:即一组数据中最大值与最小值的差.②决定组距和组数:当样本量不超过100时,常分成5~12组.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.

④列频率分布表:登记频数,计算频率,列出频率分布表.

将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.⑤画频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的频率组距,这样得到一系列的长方形,每个长方形的面积恰好是该组的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于1.(2)不同统计图的特点

扇形图主要用于直观描述各类数据占总数的比例;条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;折线图主要用于描述数据随时间的变化趋势.条形图适用于描述离散型数据,直方图适用于描述连续型数据.2.总体百分位数的估计(1)第p百分位数的定义

一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.

第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.(3)四分位数

25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.名称概念平均数如果有n个数x1,x2,…,xn,那么这组数据的平均数为

(x1+x2+…+xn)中位数将一组数据按从小到大(或从大到小)的顺序排列,处在中间的一个数据(当数据个数是奇数时)或中间两个数据的平均数(当数据个数是偶数时)叫做这组数据的中位数众数一组数据中出现次数最多的数据叫做这组数据的众数3.总体集中趋势的估计

4.总体离散程度的估计

(1)极差

一组数据中最大值与最小值的差. (2)方差和标准差(3)总体方差和标准差(4)样本方差和标准差【名师点睛】平均数、方差的公式推广考点一总体百分位数的估计考向1计算一组数据的第p百分位数[例1]从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;

(2)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.

解:(1)将所有数据从小到大排列,得 7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9.

因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,第95百分位数是第12个数据9.9.

(2)由(1)可知样本数据的第25百分位数是8.15,第50百分位数为8.5,第95百分位数是9.9,所以质量小于或等于8.15g的珍珠为次品,质量大于8.15g且小于或等于8.5g的珍珠为合格品,质量大于8.5g且小于或等于9.9g的珍珠为优等品,质量大于9.9g的珍珠为特优品.

考向2根据频率分布直方图估计样本数据的百分位数

[例2]某市为了了解人们对“垃圾分类”的认知程度,对不同年龄和不同职业的人举办了一次“垃圾分类”知识竞赛,满分100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄(单位:岁)分成5组,第一组为[20,25),第二组为[25,30),第三组为[30,35),第四组为[35,40),第五组为[40,45].得到的频率分布直方图如图8-2-1所示,已知第一组有5人.图8-2-1(1)求x的值;(2)求抽取的x人的年龄的50%分位数(结果保留整数);

(3)从参赛者中随机抽取10人,成绩(单位:分)如下:90,96,97,95,92,92,98,88,96,99.求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“垃圾分类”的认知程度.解:(1)第一组频率为0.01×5=0.05,

(3)把这10人的成绩(单位:分)按从小到大的顺序排列,得88,90,92,92,95,96,96,97,98,99.

从20%分位数和平均数来看,参赛人员对“垃圾分类”的认知程度比较高.【题后反思】(1)计算一组n个数据的第p百分位数的一般步骤估计值左侧的矩形面积为(2)频率分布直方图中第p百分位数的估计①确定百分位数所在的区间[a,b);②频率分布直方图中矩形的面积对应频率,第p百分位数的【考法全练】1.(考向1)一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的第25百分位数是()A.15B.25C.50D.75

解析:把数据从小到大排列,可得6,7,15,36,39,40,41,42,43,47,49,一共11项.因为11×25%=2.75,故第25百分位数是第3项,为15.故选A.

答案:A

2.(考向2)(2023年北京市校级期末)某校组织全体学生参加知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),得到的频率分布直方图如图8-2-2所示.下列说法正确的是()图8-2-2A.直方图中x的值为0.035B.在被抽取的学生中,成绩在区间[60,70)中的学生有10人C.估计全校学生的平均成绩不低于80分D.估计抽取的全校学生成绩的样本数据的80%分位数约为93分解析:对于A,由图可知(0.005+0.010+0.015+0.040+x)×10=1,解得x=0.030,故A错误;对于B,成绩在区间[60,70)中的被抽中的学生人数为0.010×10×200=20,故B错误;

对于C,由图可知平均数为55×0.005×10+65×0.010×10+75×0.015×10+85×0.030×10+95×0.040×10=84(分),故C正确;0.8-0.6对于D,由图可知样本数据的80%分位数为90+0.04=95(分),故D错误.

故选C.答案:C

考点二总体集中趋势的估计1.(2023年南开区校级月考)已知一组数据的频率分布直方图)如图8-2-3所示,则数据的中位数估计值为(

图8-2-3A.64B.65C.64.5D.66

解析:因为(0.03+0.04)×10=0.7>0.5,所以中位数位于[60,70)之间,设中位数为x,则0.03×10+(x-60)×0.04=0.5,解得x=65,即中位数为65.故选B.答案:B答题居民序号12345678910得分/分72836576889065909576

2.(2023年安庆市校级期中)《“健康中国2030”规划纲要》提出,健康是促进人的全面发展的必然要求,是经济社会发展的基础条件.实现国民健康长寿,是国家富强、民族振兴的重要标志,也是全国各族人民的共同愿望.为普及健康知识,某公益组织为社区居民组织了一场健康知识公益讲座.为了解讲座效果,在讲座后随机抽取了10位居民进行健康知识问卷调查,这十位居民的得分情况如下表所示:则以下说法错误的是()A.该10位居民的答卷得分的极差为30分B.该10位居民的答卷得分的中位数为94分C.该10位居民的答卷得分的中位数小于平均数D.该10位居民的答卷得分的方差为104.4解析:把得分数据从小到大排列,可得65,65,72,76,76,83,88,90,90,95.极差为95-65=30(分),故A正确;=80(分),79.5<80,故C正确;(80-88)2+(80-90)2+(80-65)2+(80-90)2+(80-95)2+(80-76)2]=104.4,故D正确.故选B.答案:B

3.(多选题)(2023年福州市期中)为推动学校体育运动发展,引导学生积极参与体育锻炼,增强健康管理意识,某校根据性别比采用分层抽样方法随机抽取了120名男生和80名女生,调查并分别绘制出男、女生每天在校平均体育活动时间的频率分布直方图(如图8-2-4所示),则()图8-2-4A.a=0.010B.该校男生每天在校平均体育活动时间中位数的估计值为75minC.估计该校至少有一半学生每天在校平均体育活动时间超过1

hD.估计该校每天在校平均体育活动时间不低于80min的学生中男、女生人数比为3∶1

解析:对于A,10a+10×0.020+10×0.035+10×0.020+10a+10×0.005=1,解得a=0.010,正确;对于B,a=0.010,前两个小矩形面积之和为0.3,前三个小矩形面积之和为0.65,即中位数在[60,70)内,设中位数为mmin,则

m-6070-60×0.035×10+0.3=0.5,解得m=60+40 7≈65.7,故该校男生每天在校平均体育活动时间中位数的估计值为65.7min,错误;对于C,根据频率分布直方图可得,男生中每天在校平均体育活动时间超过1h的频率为10×(0.035+0.020+0.010+0.005)=0.700,人数为120×0.7=84,女生中每天在校平均体育活动时间超过1h的频率为10×(0.030+0.010+0.005)=0.450,人数为80×0.450=36,故学生每天在校平均体育活动时间超过1h的频率为

=0.6,故该校至少有一半学生每天在校平均体育活动时间超过1h,正确;对于D,男生中每天在校平均体育活动时间不低于80min的频率为10×(0.010+0.005)=0.15,人数为120×0.15=18,女生中每天在校平均体育活动时间不低于80min的频率为10×0.005=0.050,人数为80×0.050=4,所以该校每天在校平均体育活动时间不低于80min的学生中男、女生人数比为18∶4=9∶2,错误.故选AC.答案:AC【题后反思】(1)众数、中位数和平均数的意义

众数描述的是在一组数据中出现次数最多的数据;中位数等分样本数据所占的频率;平均数反映所有数据的平均水平.第p百分位数的估计值左边的小矩形面积之和是(2)利用频率分布直方图估计样本的数字特征的方法①众数的估计值为最高矩形的底边中点对应的横坐标;②平均数的估计值等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和;③中位数的估计值的左边和右边的小矩形面积的和是相等的.旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5考点三总体离散程度的估计考向1方差与标准差

[例3](2021年全国乙卷文科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:解:(1)由表格中的数据易得成绩y/分456789频数3711964考向2分层随机抽样的方差与标准差

[例4]为调查高一、高二学生的心理健康达标情况,某学校采用分层随机抽样方法,从高一、高二学生中分别抽取了50人、40人参加心理健康测试(满分10分).经初步统计,参加测试的高一学2.6,高二学生的成绩yi(i=1,2,3,…,40)的统计表如下:解:(1)由题意知,【题后反思】分层随机抽样的均值与方差分数段/分[60,70)[70,80)[80,90)[90,100]频数10304020考向3用频率分布直方图估计方差

[例5]数字乡村既是乡村振兴的战略方向,也是建设数字中国的重要内容.某公司为了助力数字乡村发展,决定从100名员工中挑选30名员工组建“数字乡村发展部”,对这100名员工的各项素质进行综合评分,得到如下频数分布表:(1)在图8-2-5中作出这些数据的频率分布直方图;图8-2-5(2)估计这100名员工各项素质分数的平均数与方差;(同一组中的数据用该组区间的中点值作为代表)(3)若该公司准备挑选成绩较好的员工组建“数字乡村发展部”,则被挑选的员工的分数不低于多少?分数段/分频数频率频率/组距[60,70)100.10.01[70,80)300.30.03[80,90)400.40.04[90,100]200.20.02解:(1)由题意可知,频率分布表如下.所以频率分布直方图如图8-2-6所示.图8-2-6(2)由题知,平均数为x=65×0.1+75×0.3+85×0.4+95×0.2=82(分),方差为s2=0.1×(65-82)2+0.3×(75-82)2+0.4×(85-82)2+0.2×(95-82)2=81.

(3)因为从100名员工中挑选30名成绩较好的员工组建“数字乡村发展部”,所以应选成绩大于等于第70百分位数的员工.设第70百分位数为m分,则0.1+0.3+(m-80)×0.04=0.7,解得m=87.5,所以被挑选的员工分数不低于87.5分.【考法全练】1.(考向1)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(

)A.0.01C.1B.0.1D.10

解析:∵样本数据x1,x2,…,xn的方差为0.01,∴样本数据10x1,10x2,…,10xn的方差为102×0.01=1,故选C.

答案:C

2.(考向2)某班成立了A,B两个数学兴趣小组,A组10人,B组30人,经过一周的学习后进行了一次测试,在该测试中,A组的平均成绩为130分,方差为115,B组的平均成绩为110分,方差为215.求在这次测试中全班学生的平均成绩和方差.

3.(考向3)(2023年铁岭市校级期末)某学校为了了解高二年级学生的数学运算能力,对高二年级的200名学生进行了一次测试.已知参加此次测试的学生的分数xi(i=1,2,3,…,200)全部介于45分到95分之间,该校将所有分数分成5组:[45,55),[55,65),…,[85,95],整理得到如图8-2-7所示的频率分布直方图(同组数据以这组数据的中间值作为代表).(1)求m的值,并估计此次校内测试分数的平均值x;图8-2-7解:(1)因为0.006×10+0.014×10+10m+0.036×10+0.020×10=1,所以m=0.024.此次校内测试分数的平均值的估计值为x=0.06×50+0.14×60+0.24×70+0.36×80+0.20×90=75(分).所以得分为52分的同学的成绩没有进入[52.2,97.8]范围内,得分为94分的同学的成绩进入了[52.2,97.8]范围内.

⊙统计图表及其应用

[例6]已知某市某居民小区户主人数和户主对户型结构的满意率分别如图8-2-8(1)和图8-2-8(2)所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()(1)(2)图8-2-8A.240,18B.200,20C.240,20D.200,18解析:样本量n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.答案:A

[例7](多选题)(2023年安顺市期末)根据某地3月5日到3月15日的每天最高气温与最低气温数据(单位:℃)绘制如图8-2-9所)示的折线图,那么下列叙述正确的是(

图8-2-9A.5日到15日的最低气温的极差比最高气温的极差小B.5日的最高气温与最低气温的差值最大C.最高气温数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论