高三数学一轮复习第十章统计与成对数据的统计分析第1课时随机抽样、统计图表学案_第1页
高三数学一轮复习第十章统计与成对数据的统计分析第1课时随机抽样、统计图表学案_第2页
高三数学一轮复习第十章统计与成对数据的统计分析第1课时随机抽样、统计图表学案_第3页
高三数学一轮复习第十章统计与成对数据的统计分析第1课时随机抽样、统计图表学案_第4页
高三数学一轮复习第十章统计与成对数据的统计分析第1课时随机抽样、统计图表学案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【教师备选资源】新高考卷三年考情图解高考命题规律把握1.常考点:用样本估计总体、独立性检验(1)高考常以频率分布直方图为载体,考查用样本的数字特征估计总体的数字特征;(2)以2×2列联表为载体,结合统计、概率等知识考查独立性检验,对数据分析、数学运算素养要求较高.2.轮考点:分层随机抽样、回归分析、成对数据的线性相关性(1)高考对分层随机抽样的考查一般较为简单;(2)高考多利用相关系数进行相关性分析,体会数学不但能为生产实践服务,还能在实际应用过程中不断地被修正和完善,对数学运算和数据处理能力要求较高.第1课时随机抽样、统计图表[考试要求]1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法,掌握分层随机抽样的均值计算方法.3.理解统计图表的含义.考点一简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,除非特殊声明,所学的简单随机抽样指不放回简单随机抽样.(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和随机数法.[典例1](1)用简单随机抽样的方法从含有10个个体的总体中,抽取一个样本量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是()A.110,110C.15,310(2)(2024·山东临沂模拟)某中学举行“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为()4567321212310201045215200112512932049234493582003623486969387481A.12B.20C.29D.23(1)A(2)C[(1)法一:在抽样过程中,个体a每一次被抽中的可能性是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为110法二:第一次被抽到,显然为110;第二次被抽到,首先第一次不能被抽到,第二次才被抽到,可能性为910×(2)依次从数表中读出的有效编号为:12,02,01,04,15,20,29,得到选出来的第7个个体的编号为29.故选C.]简单随机抽样的适用范围简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).跟进训练1(多选)下列抽取样本的方式,不是简单随机抽样的是()A.从无限多个个体中抽取100个个体作为样本B.盒子里共有80个零件,从中逐个不放回地选出5个零件进行质量检验C.从80件玩具中一次性抽取3件进行质量检验D.某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛ACD[对于选项A:简单随机抽样中总体的个数是有限的,题中是无限的,不是简单随机抽样,故选项A不是简单随机抽样;对于选项B:满足简单随机抽样的定义,从N个个体中逐个不放回的抽取n个个体n≤考点二分层随机抽样1.总体与样本(1)总体与样本的概念:统计的研究对象是数据,获取数据的方法有全面调查和抽样调查,调查对象的全体称为总体,组成总体的每一个调查对象称为个体,从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.(2)总体与样本的均值一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则总体均值Y=Y1+Y2+…+如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则样本均值y=y1+y22.分层随机抽样(1)分层随机抽样的概念一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)分层随机抽样的平均数计算在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为x,y,样本平均数为w,则w=MM+N我们可以用样本平均数w估计总体平均数W.[常用结论]总体数是N,样本容量为n,每一层的总体数分别是N1,N2,…,Nm,每一层中抽取的样本数为n1,n2,…,nm,则满足关系:(1)nN=n1N1=(2)n1∶n2∶…∶nm=N1∶N2∶…∶Nm;(3)n1=nN1N,…,nm求总体或样本容量[典例2](2024·福建三明模拟)已知某地区中小学生人数比例和近视情况分别如图甲和图乙所示,为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法随机抽取1%的学生进行调查,其中被抽取的小学生有80人,则样本容量和该地区的高中生近视人数分别为()A.200,25 B.200,2500C.8000,25 D.8000,2500B[由扇形图结合分层随机抽样知识易知样本容量为8040%=200,则样本中高中生的人数为200×25%=50,易知总体中高中生的总人数为501%=5000,结合近视率条形图得该地区高中生近视人数为5000分层随机抽样及均值[典例3](2024·湖北襄阳模拟)一支田径队有男运动员48人,女运动员36人,用分层随机抽样从全体运动员中抽取一个容量为21的样本,抽出的男运动员平均身高177.5cm,抽出的女运动员平均身高为168.4cm,则估计该田径队运动员的平均身高是()A.173.6cm B.172.95cmC.172.3cm D.176cmA[由题意,田径队男运动员、女运动员的人数比例为48∶36=4∶3,用分层随机抽样从全体运动员中抽取一个容量为21的样本,设男运动员4x名,女运动员3x名,故4x+3x=21,解得x=3,即男运动员12名,女运动员9名,故该田径队运动员的平均身高大约为:177.5×12+168.4×921分层随机抽样中有关计算的方法(1)抽样比=该层样本量n总样本量N(2)在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为mx+nym+n跟进训练2(1)(2024·河南郑州统考模拟)为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师于今年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为()A.30棵B.50棵C.72棵D.80棵(2)(2023·天津南开二模)某车间从生产的一批零件中随机抽取了1000个进行一项质量指标的检测,整理检测结果得到此项质量指标的频率分布直方图如图所示.若用分层随机抽样的方法从质量指标在区间[40,70)的零件中抽取170个进行再次检测,则质量指标在区间[50,60)内的零件应抽取()A.30个B.40个C.60个D.70个(1)C(2)C[(1)由题意,中年教师应分得树苗的数量为600×35+3+2=180棵,所以中年教师应分得梧桐的数量为180×(2)设质量指标在区间[50,60)内的零件应抽取x个,则x170=0.30.35+0.3+0.2,解得考点三统计图表1.频率分布表、频率分布直方图的制作步骤及意义2.频率分布折线图用线段连接频率分布直方图中各个矩形上面一边的中点,就得到频率分布折线图.3.其他常见的统计图表统计图表主要应用扇形图直观描述各类数据占总数的比例条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随时间的变化趋势[典例4](1)(2024·西藏昌都模拟预测)若某校高一年级8个班参加合唱比赛的得分如表所示,有一个数据被墨点覆盖,已知这组数据的平均数是91.5,则中位数是()8790968991·9493A.91B.91.5C.92D.92.5(2)(2023·贵州黔东南模拟预测)“说文明话、办文明事、做文明人,树立城市新风尚!创建文明城市,你我共同参与!”为宣传创文精神,某实验中学高一(2)班组织了甲、乙两名志愿者,利用一周的时间在街道对市民进行宣传,将每天宣传的次数绘制成如下频数分布折线图,则以下说法不正确的为()A.甲的众数小于乙的众数B.乙的极差小于甲的极差C.甲的方差大于乙的方差D.乙的平均数大于甲的平均数(3)(多选)(2024·湖北武汉模拟)为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中正确的是()A.芯片、软件行业从业者中,“90后”占总人数的比例超过50%B.芯片、软件行业中从事技术、设计岗位的“90后”人数超过总人数的25%C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多(1)B(2)D(3)ABD[(1)设被墨点覆盖的数据为x,则18(87+90+96+89+91+x+94+93)=91.5,解得x所以这8个数据从小到大排序为:87,89,90,91,92,93,94,96,所以中位数为91+922故选B.(2)由图可知,甲志愿者的宣传次数分别为:4,5,6,3,4,3,3,乙志愿者的宣传次数分别为:5,4,4,5,4,3,3,甲的平均数为17×(4+5+6+3+4+3+3)=4,乙的平均数为17甲的极差为3,乙的极差为2,则乙的极差小于甲的极差,故B正确;甲的方差为17×[2×(4-4)2+(5-4)2+(6-4)2+3×(3-4)2]=8乙的方差为17×[2×(5-4)2+3×(4-4)2+2×(3-4)2]=4(3)对于选项A,芯片、软件行业从业者中“90后”占总人数的55%,故选项A正确;对于选项B,芯片、软件行业中从事技术、设计岗位的“90后”占总人数的(37%+13%)×55%=27.5%,故选项B正确;对于选项C,芯片、软件行业中从事技术岗位的“90后”占总人数的37%×55%=20.35%,“80后”占总人数的40%,但从事技术的“80后”占总人数的百分比不知道,无法确定二者人数多少,故选项C错误;对于选项D,芯片、软件行业中从事市场岗位的“90后”占总人数的14%×55%=7.7%,“80前”占总人数的5%,故选项D正确.故选ABD.]几种统计图表的特点及使用方法(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)频率分布直方图的数据特点:①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.跟进训练3为提升本地景点的知名度、美誉度,各地文旅局长纷纷出圈,作为西北自然风光与丝路人文历史大集合的青甘大环线再次引发热议.为了更好地提升服务,某地文旅局对到该地的5000名旅行者进行满意度调查,将其分成以下6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],整理得到如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)在这些旅行者中,满意度得分在60分及以上的有多少人?(3)为了打造更加舒适的旅行体验,文旅局决定在这5000名旅行者中用分层随机抽样的方法从得分在80,奖励.再从这6名旅行者中抽取一等奖两名,求中奖的2人得分都在[80,90)内的概率.[解](1)由题意,得(0.006+0.010+a+0.018+0.020+0.032)×10=1,解得a=0.014.(2)由频率分布直方图,满意度得分在60分及以上的频率是1-(0.006+0.014)×10=0.8,所以满意度得分在60分及以上的人数约为5000×0.8=4000.(3)用分层随机抽样的方法抽取的6名旅行者中,得分在[80,90)内的有4人,设为A,B,C,D;得分在[90,100]内的有2人,设为E,F.因此从6人中任取2人的试验有Ω={AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF},共15个基本事件,设2人得分都在[80,90)内为事件M,则M={AB,AC,AD,BC,BD,CD},共6个基本事件,所以中奖的2人得分都在[80,90)内的概率P(M)=615=2课后习题(五十六)随机抽样、统计图表1.(人教A版必修第二册P177练习T1改编)从某市参加升学考试的学生中随机抽查1000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是()A.总体指的是该市参加升学考试的全体学生B.样本是指1000名学生的数学成绩C.样本量指的是1000名学生D.个体指的是1000名学生中的每一名学生B[对于A,总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;对于B,样本是指1000名学生的数学成绩,故B正确;对于C,样本量是1000,故C错误;对于D,个体指的是每名学生的数学成绩,故D错误.]2.(人教A版必修第二册P185练习T3改编)某校有男生3000人,女生2000人,学校将通过分层随机抽样的方法抽取100人的身高数据,若按男、女比例进行分层随机抽样,抽取到的学生平均身高为165cm,其中被抽取的男生平均身高为172cm,则被抽取的女生平均身高为()A.154.5cm B.158cmC.160.5cm D.159cmA[根据分层随机抽样原理,被抽取到的男生为60人,女生为40人,设被抽取到的女生平均身高为xcm,则60×172+40x100=165,解得x所以被抽取的女生平均身高为154.5cm.故选A.]3.(人教B版必修第二册P92习题5-1CT2改编)为比较甲、乙两名学生的数学素养,对课程标准中规定的六大数学核心素养进行指标测验,指标值满分为5分,分值高者为优,根据测验情况绘制了如图所示的六大数学核心素养指标雷达图,则下面叙述错误的是()A.甲的数据分析核心素养优于乙B.乙的数学运算核心素养优于数学抽象核心素养C.甲的六大数学核心素养指标值波动性比乙的小D.甲、乙在数学建模核心素养上的差距比在直观想象核心素养上的差距大D[对于A,甲的数据分析核心素养指标值为5,乙的为4,故A正确;对于B,乙的数学运算核心素养指标值为5,数学抽象核心素养指标值为3,故B正确;对于C,甲的六大数学核心素养指标值均为4或5,乙的六大数学核心素养指标值有3,4,5,故甲的波动性较小,故C正确;对于D,甲、乙在数学建模核心素养上的指标值差为1,甲、乙在直观想象核心素养上的指标值差为2,故D错误.故选D.]4.(人教A版必修第二册P198练习T1改编)从某小区随机抽取100户居民用户进行月用电量调查,发现他们的月用电量都在50~300kW·h之间,适当分组(每组为左闭右开区间)后绘制成如图所示的频率分布直方图.(1)直方图中x的值为________;(2)在被调查的用户中,月用电量落在区间[100,250)内的户数为________.(1)0.0046(2)72[(1)根据频率分布直方图中各小长方形的面积和为1,得(0.0024+0.0038+0.0060+x+0.0032)×50=1,解得x=0.0046.(2)月用电量落在区间[100,250)内的频率为f=(0.0038+0.0060+0.0046)×50=0.72,所以在被调查的用户中,月用电量落在区间[100,250)内的户数为100×0.72=72.]5.(2023·宁夏银川一中校考二模)某单位职工老年人有60人,中年人有100人,青年人有40人,为了了解职工的健康状况,用分层随机抽样的方法从中抽取10人进行体检,则应抽查的老年人的人数为()A.3B.4C.5D.6A[由题意可得抽查的老年人人数为:6060+100+40×6.(2024·山东烟台模拟)白鹤是国家一级重点保护鸟类.我国境内的白鹤每年在鄱阳湖的越冬地与西伯利亚的繁殖地之间迁徙,莫莫格湿地是其迁徙途中重要的停歇地.2022年春季,某研究小组为统计莫莫格湿地停歇的白鹤数量,从该湿地随机选取了200只白鹤并做上标记后放回,一段时间后又从该湿地随机选取了200只白鹤,其中有12只白鹤具有标记,据此估计该湿地内白鹤的数量大致为()A.2500B.3300C.4000D.4300B[设该湿地有白鹤x只,由题意,200x=12200⇒x≈33337.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是()A.4B.12C.18D.20AC[设丢失的数据为x,则这七个数据的平均数为31+x7若3<x<5,则中位数为x,此时31+x7+3=2x,解得x若x≥5,则中位数为5,此时31+x7+3=2×5,解得x综上所述,丢失的数据可能是4或18.]8.(多选)(2024·山东潍坊模拟)某地教育局为了解“双减”政策的落实情况,在辖区内高三年级在校学生中抽取100名学生,调查他们课后完成作业的时间,根据调查结果绘制如下频率分布直方图.根据此频率分布直方图,下列结论中正确的是()A.所抽取的学生中有25人在2小时至2.5小时之间完成作业B.该地高三年级学生完成作业的时间超过3小时的概率估计为35%C.估计该地高三年级学生平均做作业的时间超过2.7小时D.估计该地高三年级有一半以上的学生做作业的时间在2小时至3小时之间ABC[对于A,直方图中2小时至2.5小时之间的频率为2.5-2×0.5=0.25,故所抽取的学生中有100×0.25=25人在2小时至2.5小时之间完成作业,故A正确;对于B,由直方图中超过3小时的频率为0.5×(0.3+0.2+0.1+0.1)=0.35,所以B正确;对于C,由直方图可计算学生做作业的时间的平均数为:1.25×0.05+1.75×0.15+2.25×0.25+2.75×0.20+3.25×0.15+3.75×0.10+4.25×0.05+4.75×0.05=2.75>2.7,所以C正确;对于D,做作业的时间在2小时至3小时之间的频率为0.59.(2023·陕西商洛一模)某市商品房调查机构随机抽取n名市民,针对其居住的户型结构和是否满意进行了调查,如图1,被调查的所有市民中二居室住户共100户,所占比例为29,四居室住户占13.如图2,这是用分层随机抽样的方法从所有被调查的市民对户型是否满意的问卷中,A.n=450B.被调查的所有市民中四居室住户共有150户C.用分层随机抽样的方法抽取的二居室住户有20户D.用分层随机抽样的方法抽取的市民中对三居室满意的有10户D[因为被调查的所有市民中二居室住户共100户,所占比例为29,所以n=100÷29=450,四居室住户有450×13=150户,三居室住户有200户,故A,B正确;用分层随机抽样的方法抽取的二居室住户有100×0.2=20户,故C正确;用分层随机抽样的方法抽取的市民中对三居室满意的有200×10.(2023·山西临汾统考二模)现从某学校450名学生中用随机数法随机抽取30人参加一项活动.将这450名学生编号为001,002,…,449,450,要求从下表第2行第5列的数字开始向右读,则第5个被抽到的编号为________.162277943949544354821737932378873520964384263491648442

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论