




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025届新高考数学热点冲刺复习
统计与成对数据分析
教学目标1.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法,掌握分层随机抽样的样本均值和样本方差.2.理解统计图表的含义3.会用统计图表对总体进行估计,会求n个数据的第p百分位数.4.会用数字特征估计总体集中趋势和总体离散程度.知识梳理1.常见的统计图表:
、
、
、
、
等.2.频率分布直方图(1)制作步骤:
.(2)纵轴表示:
;小长方形的面积=
。(3)众数:
;平均数:
;中位数:
;3.百分位数(1)一组数据的第p百分位数,这组数据中至少有
的数据小于或等于这个值,且至少有
的数据大于或等于这个值.(2)计算百分位数步骤:
;知识梳理4.平均数、中位数和众数(1)中位数:
;(2)众数:
;(3)平均数:
。5.方差与标准差:(1)标准差s=
;(2)方差s2=
.跟踪训练1.10组数据如下:82,85,88,90,92,92,92,96,96,98,第25百分位数为
2.已知数据x1,x2,…,x10的平均数为2,方差为3,那么数据2x1+3,2x2+3,…,2x10+3的平均数和方差分别为__
____。1.(2020,全国3卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(
)A.0.01 B.0.1 C.1 D.102.(2021新高考Ⅰ,9)(多选)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则
(
)A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同3.(2019新课标全国2卷,5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是(
)A.中位数
B.平均数
C.方差
D.极差真题体验真题体验4.(2023课标I,9)(多选)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则
(
)A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差5.(2020,全国3卷)在一组样本数据中,1,2,3,4出现的频率分别为
p1,p2,p3,p4,且,则下面四种情形中,对应样本的标准差最大的一组是(
)A.p1=p4=0.1,p2=p3=0.4 B.p1=p4=0.4,p2=p3=0.1C.p1=p4=0.2,p2=p3=0.3 D.p1=p4=0.3,p2=p3=0.2pi=1真题体验6.(2022,全国乙卷)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是
(
)A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8的概率的估计值大于0.67.(2022全国甲,理2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则
(
)A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差课堂小结1.平均数、中位数和众数2.方差与标准差:3.百分位数专题复习专题九:统计与成对数据分析
(2)频率分布直方图知识梳理1.常见的统计图表:
、
、
、
、
等.2.频率分布直方图(1)制作步骤:
.(2)纵轴表示:
;小长方形的面积=
。(3)众数:
;平均数:
;中位数:
;3.百分位数(1)一组数据的第p百分位数,这组数据中至少有
的数据小于或等于这个值,且至少有
的数据大于或等于这个值.(2)计算百分位数步骤:
;跟踪训练1.
从某小区抽取100户居民用户进行月用电量调查,发现他们的他们的用电量都在50—350kw.h之间,进行适当分组后,画出如图9-2-18所示的频率分布直方图。(1)直方图中x的值为
;(2)在被调查的用户中,用电量落在区间[100,250)内的户数为
。真题体验11.(2020,天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(
)A.10B.18 C.20 D.36真题体验12.(2021全国甲理,2)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是(
)
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间真题体验21.(2021湖北怀化高一期中)随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170cm及以上的学生人数;(2)将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.真题体验22.(2022新高考Ⅱ,19)在某地区进行某种疾病调查,随机调查了100位这种疾病患者的年龄,得到如下样本数据频率分布直方图.
(1)估计该地区这种疾病患者的平均年龄;(同一组中的数据用该组区间的中点值代表)(2)估计该地区一人患这种疾病患者年龄位于区间[20,70)的概率;(3)已知该地区这种疾病患者的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口数的16%,从该地区任选1人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率(精确到0.0001).真题体验23.(2019,全国3卷,17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).真题体验24.(2020全国1卷文,17)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?甲分厂产品等级的频数分布表
等级ABCD频数40202020乙分厂产品等级的频数分布表等级ABCD频数28173421课堂小结1.频率分布直方图(1)制作步骤:
.(2)纵轴表示:
;小长方形的面积=
。(3)众数:
;平均数:
;中位数:
;专题复习专题九:统计与成对数据分析
(3)一元线性回归模型1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.知识梳理1.变量的相关关系的分类:
和
;2.相关系数(2)当r>0时,称成对样本数据
;当r<0时,称成对样本数据
.(3)|r|≤1;当|r|越接近1时,相关程度越
;当|r|越接近0时,相关程度越
.知识梳理3.一元线性回归模型(2)残差:观测值减去预测值称为残差.跟踪训练1.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是(
)A.-0.82
B.0.78C.-0.69
D.0.872.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表;气温(℃)181310-1用电量(度)24343864由表中数据得到经验回归方程
,当气温为-4℃时,预测用电量约为
;真题体验1.(2020.全国2卷,18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法.并说明理由.真题体验2.(2022全国乙理,19,12分)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i12345678910总和根部横截面积xi0.040.060.040.080.080.050.050.070.070.060.6材积量yi0.250.400.220.540.510.340.360.460.420.403.9(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.课堂小结1.相关系数2.一元线性回归模型专题复习专题九:统计与成对数据分析
(4)列联表与独立性检验1.通过实例,理解2×2列联表的统计意义.2.通过实例,了解独立性检验及其应用知识梳理1.列联表:分类变量X和Y的抽样数据的2×2列联表:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d列联表与独立性检验知识梳理列联表与独立性检验2.独立性检验:计算随机变量利用χ2的取值推断分类变量X和Y
的方法称为χ2独立性检验.如表为5个常用的小概率值和相应的临界值.α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828跟踪训练1.甲、乙两台机床生产同种产品,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年黑龙江护理高等专科学校单招职业适应性测试题库汇编
- 电影院数字化改造与智能控制技术
- 2025年甘肃省庆阳地区单招职业适应性测试题库及参考答案
- 科技创新如何助力企业转型升级
- 电商技术中的数据安全与隐私保护研究
- 2025年嘉兴职业技术学院单招职业适应性测试题库附答案
- 2025年广西信息职业技术学院单招职业技能测试题库及参考答案
- 2025年贵州电子信息职业技术学院单招职业倾向性测试题库1套
- 2025重庆市建筑安全员考试题库
- 2025年甘肃畜牧工程职业技术学院单招职业技能测试题库必考题
- 护理学概述课程
- 《自主创新对于钢结构发展的重要性》2400字
- 食品采购与进货台账
- GB/T 24353-2022风险管理指南
- GB/T 6284-2006化工产品中水分测定的通用方法干燥减量法
- GB/T 3003-2017耐火纤维及制品
- GB/T 22080-2016信息技术安全技术信息安全管理体系要求
- GB/T 13915-2013冲压件角度公差
- 制药工程导论课件
- 瑜伽师地论(完美排版全一百卷)
- 桨声灯影里的秦淮河1-课件
评论
0/150
提交评论