2025版高考数学一轮总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体课件_第1页
2025版高考数学一轮总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体课件_第2页
2025版高考数学一轮总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体课件_第3页
2025版高考数学一轮总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体课件_第4页
2025版高考数学一轮总复习第9章统计成对数据的统计分析第1讲随机抽样用样本估计总体课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计成对数据的统计分析考

究考题考点考向关键能力考查要求核心素养2023新课标Ⅰ,9;2023新课标Ⅱ,19抽样方法与总体分布的估计样本的数字特征、频率分布直方图及其应用运算求解逻辑思维应用性数学运算2021新高考Ⅰ,9抽样方法与总体分布的估计中位数、平均数、极差、标准差的理解与判断运算求解基础性数据分析数学运算【命题规律与备考策略】本章内容主要在选择题、填空题中考查抽样方法、统计图表、样本的数字特征(如众数、中位数、百分位数等)、线性回归方程及独立性检验.解答题常考线性回归分析或将独立性检验与随机变量分布列综合的问题.备考时要准确理解统计的基本概念,精准计算.注意材料的阅读理解,掌握线性回归分析及独立性检验的应用.第一讲随机抽样用样本估计总体知识梳理·双基自测知

理普查——对每一个调查对象都进行调查的方法.抽样调查——根据一定目的,从总体中__________________进行调查,并以此为依据对总体的情况作出估计和推断的调查方法.调查对象的________称为总体,组成总体的__________________称为个体.从总体中抽取的那部分个体称为样本,____________________称为样本容量,简称样本量.抽取一部分个体全体每一个调查对象样本中包含的个体数知识点一简单随机抽样1.定义:一般地,设一个总体含有N(N为正整数)个个体,从中________抽取n(1≤n<N)个个体作为样本,如果抽取是________的,且每次抽取时总体内的各个个体被抽到的概率__________,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是____________,且每次抽取时总体内未进入样本的各个个体被抽到的概率__________,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为________________.逐个放回都相等不放回的都相等简单随机抽样2.常用方法:__________和____________.注:本章所称的简单随机抽样指不放回简单随机抽样.抽签法随机数法知识点二分层随机抽样1.定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为________________,每一个子总体称为______.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为____________.2.分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样.分层随机抽样

层比例分配知识点三总体取值规律的估计频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.求极差最大值最小值决定组距与组数组数组数将数据分组列频率分布表画频率分布直方图知识点四总体百分位数的估计一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.计算一组n个数据的第p百分位数的步骤:第1步,按从小到大的顺序排列原始数据;第2步,计算i=n×p%;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均值.(2)一组数据的平均数、中位数都是唯一的.众数不唯一,也可以有多个.(3)众数一定是原数据中的数,平均数和中位数都不一定是原始数据中的数.

展1.两种抽样方法的区别与联系类别共同点各自特点联系适用范围简单随机抽样①抽样过程中每个个体被抽到的可能性相等;②每次抽出个体后不再将它放回,即不放回抽样.从总体中直接随机抽取,是一种等可能抽样.最基本的抽样方法.常用方法抽签法和随机数法.总体个数不多,且希望被抽取的个体带有随机性,无固定间隔.分层抽样将总体分成互不交叉的层,分层进行抽取,是一种等比例抽样.各层抽样时,采用简单随机抽样.

总体由差异明显的几部分组成.双

测题组一走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)抽签法中,先抽的人抽中的可能性大.(

)(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.(

)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(

)××√(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(

)(5)1,2,2,3,5的80%分位数是3.(

)(6)对单峰频率直方图,和中位数相比,平均数总是在“长尾巴”那边.(

)×√√题组二走进教材2.(必修2P184T3改编)高二年级有男生490人,女生510人,男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.各层中按比例分配样本,总样本量为100,那么在男生中应抽取了________名,在这种情况下,估计高二年级全体学生的平均身高为____________cm.49165.4

3.(必修2P197T1改编)从某小区抽取100户居民用户进行用电量调查,发现他们的用电量都在50~350kW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,则直方图中x=_________,在被调查的用户中,用电量的平均值为_______kW·h,用电量落在区间[100,250)内的户数为________.0.0044

18670[解析]

(0.0024+0.0036+0.0060+x+0.0024+0.0012)×50=1,计算得x=0.0044.50×(75×0.0024+125×0.0036+175×0.006+225×0.0044+275×0.0024+325×0.0012)=186.(0.0036+0.0060+0.0044)×50×100=70.题组三走向高考4.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到频率分布直方图:根据此频率分布直方图,下面结论中不正确的是(

)A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间C[解析]

因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%>50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.故选C.5.(多选题)(2021·新高考Ⅰ)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则(

)A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同CD[解析]

两组数据的平均数的差为c,故A错误;两组样本数据的样本中位数的差是c,故B错误;∵标准差D(yi)=D(xi+c)=D(xi),∴两组样本数据的样本标准差相同,故C正确;∵yi=xi+c(i=1,2,…,n),c为非零常数,x的极差为xmax-xmin,y的极差为(xmax+c)-(xmin+c)=xmax-xmin,∴两组样本数据的样本极差相同,故D正确.故选CD.考点突破·互动探究抽样方法——自主练透1.(多选题)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生、6名女生,则下列命题正确的是(

)A.这次抽样可能采用的是简单随机抽样B.这次抽样可能是分层抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率AB[解析]

本题看似一道分层抽样的题,实际上每种抽样方法都可能出现这个结果,故A,B正确.根据抽样的等概率性知C,D不正确.2.(2023·江西景德镇质检)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,…,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数(下面摘取了随机数表中的第3行至第5行),根据下表,读出的第6个数的编号是(

)1676622766

5650267107

3290797853

1355385859

88975414101256859926

9682731099

1696729315

5712101421

88264981765559563564

3854824622

3162430990

0618443253

2383013030A.827 B.315C.696 D.729B[解析]

从685开始向右数,即685,992,696,827,310,991,696,729,315,跳过992,991,696重复,跳过,所以第6个数字为315.故选B.3.(多选题)(2024·山西忻州名校联考)航海模型项目在我国已开展四十余年,深受青少年的喜爱,该项目融合国防、科技、工程、艺术、物理、数学等知识,主要通过让参赛选手制作、遥控各类船只、舰艇等模型航行,普及船艇知识,探究海洋奥秘,助力培养未来海洋强国的建设者.某学校为了解学生对航海模型项目的喜爱程度,用分层随机抽样法从某校高一、高二、高三年级所有学生中抽取部分学生做抽样调查,已知该学校高一、高二、高三年级学生人数的比例如图所示,若抽取的样本中高三年级学生有32人,则下列说法正确的是(

)A.该校高一学生人数是2000B.样本中高二学生人数是28C.样本中高三学生人数比高一学生人数多12D.该校学生总人数是8000BC[解析]

由图可知高三年级学生人数占总人数的40%,抽取的样本中高三年级学生有32人,则抽取的学生总人数为32÷40%=80,则样本中高一学生人数为80×(1-40%-35%)=20.样本中高二学生人数为80×35%=28,从而样本中高三学生人数比高一学生人数多32-20=12.因为从该校所有学生中抽取的学生总人数是80,但抽取的比例不知道,所以该校高一学生人数和该校学生总人数求不出来,故选BC.【变式训练】1.(2024·山西临汾模拟)现从某学校450名同学中用随机数表法随机抽取30人参加一项活动.将这450名同学编号为001,002,…,449,450,要求从下表第2行第5列的数字开始向右读,则第5个被抽到的编号为__________.162277943949544354821737932378873520964384263491648442175331572455068877047447672176335025839212067663016378591695556719981050717512867358074439523879447[解析]

根据随机数表的读取方法,依次抽取到的编号分别为:175,331,068,047,447,…,故第5个被抽到的编号为447.2.某中学高一年级共有学生2400人,为了解他们的身体状况,按性别用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高一年级共有女生(

)A.1260 B.1230C.1200 D.1140D频率分布直方图——师生共研(多选题)(2024·广东摸底联考)在某市高二年级举行的一次体育统考中,共有10000名考生参加考试.为了解考生的成绩情况,随机抽取了n名考生的成绩,其成绩均在区间[50,100],按照[50,60),[60,70),[70,80),[80,90),[90,100]分组作出如图所示的频率分布直方图.若在样本中,成绩落在区间[50,60)的人数为32,则()A.n=100B.考生成绩的中位数为71C.考生成绩的第70百分位数为75D.估计该市考生成绩的平均分为70.6(每组数据以区间的中点值为代表)BD[引申]这组样本数据的众数是

______.

75【变式训练】(2024·陕西西安铁一中质检)某校举行知识竞赛,对全校参赛的1000名学生的得分情况进行了统计,把得分数据按[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,得到如图所示的频率分布直方图,则下列说法不正确的是(

)A.图中的x值为0.020B.得分在[80,100]的人数为400C.这组数据的极差为50D.这组数据的平均数的估计值为77C[解析]

由(0.005+x+0.035+0.030+0.010)×10=1,可解得x=0.020,故A正确;得分在80分及以上的人数的频率为(0.030+0.010)×10=0.4,故人数为1000×0.4=400,故B正确;频率分布直方图无法看出这组数据的最大值和最小值,故C不正确;这组数据的平均数的估计值为:55×0.05+65×0.2+75×0.35+85×0.3+95×0.1=77,故D正确.总体集中趋势、离散程度的估计——多维探究

角度1已知样本数据的总体集中趋势、离散程度的估计(多选题)(2024·广西南宁、玉林摸底)为深入学习宣传党的二十大精神,某校开展了“奋进新征程,强国伴我行”二十大主题知识竞赛,其中高一年级选派了10名同学参赛,且该10名同学的成绩依次是:70,85,86,88,90,90,92,94,95,100.则下列说法正确的有()A.中位数为90,平均数为89B.70%分位数为93C.极差为30,标准差为58D.去掉一个最低分和一个最高分,平均数变大,方差变小ABDABDBDACBD3.(角度3)(2024·重庆检测)四名同学各掷骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果、可以判断出一定没有出现点数6的是(

)A.平均数为2,方差为3.1B.中位数为3,方差为1.6C.中位数为3,众数为2D.平均数为3,中位数为2A名师讲坛·素养提升几种常见的统计图形一、扇形图(饼状图)——用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.(多选题)(2024·南京师大附中阶段测试)某中学为了解学生数学史知识的积累情况,随机抽取150名同学参加数学史知识测试,测试题共5道,每答对一题得20分,答错得0分,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则(

)A.该次数学史知识测试及格率超过90%B.该次数学史知识测试得满分的同学有15名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有1500名学生,则数学史知识测试成绩能得优秀的同学大约有720名AC[解析]

由图知,及格率为1-8%=92%>90%,故A正确;该测试满分同学的百分比为1-8%-32%-48%=12%,即有12%×150=18名,故B错误;由图知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确;由题意,1500名学生成绩能得优秀的同学有1500×(48%+12%)=900,故D错误.故选AC.二、条形图(柱状图)——建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.(2023·安徽蚌埠质检)已知某地区中小学生人数如图甲所示,为了解该地区中小学生的近视情况,卫生部门根据当地中小学生人数,用分层抽样的方法抽取了10%的学生进行调查,调查数据如图乙所示,则估计该地区中小学生的平均近视率为(

)A.50%

B.32%C.30%

D.27%D三、折线图——建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.折线图主要用于描述数据随时间的变化趋势.(多选题)(2024·湖湘名校联合体联考)某学校校医对生病的甲、乙两名同学一周的体温进行了统计,其结果如图所示,则下列说法正确的有()A.甲同学的体温的平均值为36.4℃B.甲同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论