第02讲 用样本估计总体(原卷版)_第1页
第02讲 用样本估计总体(原卷版)_第2页
第02讲 用样本估计总体(原卷版)_第3页
第02讲 用样本估计总体(原卷版)_第4页
第02讲 用样本估计总体(原卷版)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

备战2024年高考《解读•突破•强化》一轮复习讲义(新高考)统计与成对数据的统计分析第02讲用样本估计总体【考试要求】1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.能用数字特征估计总体集中趋势和总体离散程度.一、样本的数字特征1.百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据这个值.计算一组个数据的的第百分位数的步骤(1)按从小到大排列原始数据.(2)计算.(3)若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.2.四分位数我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.3.平均数、中位数和众数(1)平均数:eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).4.标准差和方差(1)标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.(2)方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.二、频率分布直方图1.频率、频数、样本容量的计算方法①eq\f(频率,组距)×组距=频率.②eq\f(频数,样本容量)=频率,eq\f(频数,频率)=样本容量,样本容量×频率=频数.③频率分布直方图中各个小方形的面积总和等于.2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.均数、方差的性质:如果数据的平均数为,方差为,那么①一组新数据的平均数为,方差是.②一组新数据的平均数为,方差是.③一组新数据的平均数为,方差是.1.(多选)下列结论正确的是()(1)对一组数据来说,平均数和中位数总是非常接近.(2)方差与标准差具有相同的单位.(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中,可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数3.若数据x1,x2,…,x9的方差为2,则数据2x1,2x2,…,2x9的方差为()A.2B.4C.6D.84.某射击运动员7次的训练成绩分别为86,88,90,89,88,87,85,则这7次成绩的第80百分位数为()5.某校体育节10名旗手的身高(单位:cm)分别为175,178,176,180,179,175,176,179,180,179,则中位数为________.考点一总体百分位数的估计例1(1)一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是()A.15 B.25C.50 D.75(2)如图是将高三某班80名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的模拟考试成绩的80%分位数是________.(结果保留两位小数)【对点演练1】(1)某中学高一年级8名学生某次考试的数学成绩(满分150分)分别为85,90,93,99,101,103,116,130,则这8名学生数学成绩的第75百分位数为()A.102B.103C.109.5D.116【对点演练2】(2023秋·贵州贵阳·高三校联考阶段练习)如图,是某一数据的频率分布直方图,则由图形中的数据,可知其75%分位数(上四分位数)的估计值为(保留2位小数)【对点演练3】(2023秋·贵州·高二贵州省兴义市第八中学校联考阶段练习)今年,被称为“村超”的贵州榕江县“和美乡村足球超级联赛”,使榕江成为网络顶流,刷爆各大网络平台,更吸引了大量游客到赛事举办地观赛游玩,为更好地发展当地的旅游业,政府随机调查了18个旅游团对榕江县旅游满意度的综合评分情况,得到如下数据:.若恰好是这组数据的上四分位数,则的值不可能为(

)A.93 B.94 C.95 D.96【对点演练4】(2023河北唐山二模)某校高三年级一共有名同学参加数学测验,已知所有学生成绩的第百分位数是分,则数学成绩不小于分的人数至少为()A. B. C. D. 【对点演练5】2.已知100个数据的第75百分位数是9.3,则下列说法正确的是 ()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数考点二平均数与众数例2(1)(多选)(2023·哈尔滨模拟)下面是某城市某日在不同观测点对细颗粒物(PM)的观测值:396275268225168166176173188168141157若在此组数据中增加一个比现有的最大值大25的数据,下列数字特征发生改变的是()A.极差 B.中位数C.众数 D.平均数(2)(多选)如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则下列说法正确的是 ()A.图中的x的值为0.018B.该班50名学生期中考试数学成绩的众数是75C.该班50名学生期中考试数学成绩的中位数是75D.该班50名学生期中考试数学成绩的平均数是75【对点演练1】每年的4月23日是世界读书日,某中学为了了解八年级学生的读书情况,随机调查了50名学生读书的册数,统计数据如表所示:册数01234人数31316171则这50名学生读书册数的众数、中位数是(

)A.3,3 B.2,2 C.2,3 D.3,2【对点演练2】(多选)(2023·广东惠州·统考模拟预测)在某市高二举行的一次期中考试中,某学科共有2000人参加考试.为了了解本次考试学生成绩情况,从中抽取了部分学生的成绩(成绩均为正整数,满分为100分)作为样本进行统计,样本容量为.按照的分组作出频率分布直方图,如图所示.其中,成绩落在区间内的人数为16.则下列结论正确的有(

)A.样本容量B.图中C.估计该市全体学生成绩的平均分为分D.该市要对成绩由高到低前的学生授予“优秀学生”称号,则成绩为78分的学生肯定能得到此称号【对点演练3】(2023·山东·统考二模)某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为(

)A. B. C.8 D.考点三均值与方差例3某稻谷试验田试种了,两个品种的水稻各10亩,并在稻谷成熟后统计了这20亩地的稻谷产量如下表,记,两个品种各10亩产量的平均数分别为和,方差分别为和.(单位:)60635076718575636364(单位:)56626068787576626370(1)分别求这两个品种产量的极差和中位数;(2)求,,,;(3)依据以上计算结果进行分析,推广种植品种还是品种水稻更合适.【对点演练1】(2023·安徽马鞍山·统考三模)某校高三(1)班(45人)和高三(2)班(30人)进行比赛,按照分层抽样的方法从两个班共抽取10名同学,相关统计情况如下:高三(1)班答对题目的平均数为,方差为;高三(2)班答对题目的平均数为,方差为,则这10人答对题目的方差为(

)A. B. C. D.【对点演练2】某学校在上报《国家学生体质健康标准》高三年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样方法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数为3000mL,方差为10;抽取了女生30人,其肺活量平均数为2500mL,方差为20,则可估计高三年级全体学生肺活量的平均数为________,方差为________.【对点演练3】(2023·云南师大附中模拟)根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①,②,③,④,依次计算得到结果如下:①平均数eq\x\to(x)<4;②平均数eq\x\to(x)<4且极差小于或等于3;③平均数eq\x\to(x)<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A.1组B.2组C.3组D.4组【对点演练4】(2022·济宁模拟)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)求两位学生预赛成绩的平均数和方差;(2)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.1.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据的 ()2.甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是 ()3.(2023四川成都七中二诊)一个果园培养了一种少籽苹果,现随机抽样一些苹果调查苹果的平均果籽数量,得到下列频率分布表:

则根据表格,这批样本的平均果籽数量为()A. B. C. D. 4.(2023•浙江一模)已知一组样本数据,,,的平均数为,由这组数据得到另一组新的样本数据,,,,其中,2,,,则A.两组样本数据的平均数相同 B.两组样本数据的方差不相同 C.两组样本数据的极差相同 D.将两组数据合成一个样本容量为20的新的样本数据,该样本数据的平均数为5.(2023•四川一模)某部门调查了200名学生每周的课外活动时间(单位:,制成了如图所示的频率分布直方图,其中课外活动时间的范围是,,并分成,,,,,,,,,五组.根据直方图,判断这200名学生中每周的课外活动时间不少于的人数是A.56 B.80 C.144 D.1846.(多选)下表为2022年某煤炭公司1~10月份的煤炭生产量:月份12345678910产量(单位:万吨)2325242126293027则下列结论正确的是 ()7.(多选)若甲组样本数据x1,x2,…,xn(数据各不相同)的平均数为2,方差为4,乙组样本数据3x1+a,3x2+a,…,3xn+a的平均数为4,则下列说法正确的是 ()A.a的值为-28.(多选)习近平总书记强调,要坚持健康第一的教育理念,加强学校体育工作,推动青少年文化学习和体育锻炼协调发展.某学校对高一年级学生每周在校体育锻炼时长(单位:小时)进行了统计,得到如下频率分布表:分组[2,3)[3,4)[4,5)[5,6]频率则下列关于高一年级学生每周体育锻炼时长的说法中正确的是()9.(多选)第24届冬奥会于2022年2月4日在国家体育场鸟巢举行了盛大开幕式.在冬奥会的志愿者选拔工作中,某高校承办了面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩并分为五组,绘制成如图所示的频率分布直方图,则下列说法正确的是(每组数据以区间的中点值为代表)()A.bC.在被抽取的候选者中,成绩在区间[65,75)之间的候选者有30人10.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是.

11.已知一个样本的样本容量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为x,方差为s2,则x=,s2=.

12.(2023河北石家庄部分学校开学考)湖北省中药材研发中心整合省农业科技创新中心、省创新联盟相关资源和力量,为全省中药材产业链延链、补链、强链提供科技支撑,某科研机构研究发现,某品种中医药的药物成分甲的含量(单位:)与药物功效(单位:药物单位)之间满足,检测这种药品一个批次的个样本,得到成分甲的含量的平均值为,标准差为,则估计这批中医药的药物功效的平均值为__________药物单位.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论