高考数学一轮复习第2讲 用样本估计总体_第1页
高考数学一轮复习第2讲 用样本估计总体_第2页
高考数学一轮复习第2讲 用样本估计总体_第3页
高考数学一轮复习第2讲 用样本估计总体_第4页
高考数学一轮复习第2讲 用样本估计总体_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 / 22 第第 2 讲讲 用样本估计总体用样本估计总体 1用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤 求极差(即一组数据中 01 最大值与 02 最小值的差) 决定 03 组距与 04 组数. 将数据 05 分组. 列 06 频率分布表. 画 07 频率分布直方图. (2)频率分布折线图和总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的 08 中点,就得到频率分布折线图 总体密度曲线:随着 09 样本容量的增加,作图时 10 所分的组数增加,11 组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 (3)茎叶图 茎是指

2、 12 中间的一列数,叶是从茎的 13 旁边生长出来的数 2用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数 (2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数 (3)平均数: x 14x1x2xnn,反映了一组数据的平均水平 2 / 22 (4)标准差:是样本数据到平均数的一种平均距离,s 15 1n(x1 x)2(x2 x)2(xn x)2. (5)方差:s2 161n(x1 x)2(x2 x)2(xn x)2(xn是样本数据,n 是样本容量, x是样本平均数) 1频率分布直方图与众数、中位数与平均数的关

3、系 (1)最高的小长方形底边中点的横坐标即是众数 (2)中位数左边和右边的小长方形的面积和是相等的 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和 2标准差与方差的特点 反映了各个样本数据聚集于样本平均数周围的程度标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散 3平均数、方差的公式推广 (1)若数据 x1,x2,xn的平均数为 x,那么 mx1a,mx2a,mx3a,mxna 的平均数是 m xa. (2)若数据 x1,x2,xn的方差为 s2,则: 数据

4、x1a,x2a,xna的方差也为 s2; 数据 ax1,ax2,axn的方差为 a2s2. 1为评估一种农作物的种植效果,选了 n 块地作试验田这 n 块地的亩产量(单位:kg)分别为 x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) ax1,x2,xn的平均数 bx1,x2,xn的标准差 cx1,x2,xn的最大值 dx1,x2,xn的中位数 3 / 22 答案 b 解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差故选 b. 2(2020 云川贵百校联考)某课外小组的同学们从社会实践活动中调查

5、了 20户家庭某月的用电量,如下表所示: 用电量/度 120 140 160 180 200 户数 2 3 5 8 2 则这 20 户家庭该月用电量的众数和中位数分别是( ) a180,170 b160,180 c160,170 d180,160 答案 a 解析 用电量为 180 度的家庭最多,有 8 户,故这 20 户家庭该月用电量的众数是 180,排除 b,c;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是 160,180,故这 20 户家庭该月用电量的中位数是 170.故选 a. 3在样本频率分布直方图中,共有 9 个小长方形,若中间一个小长方形的面积等于其他 8 个长方形的面

6、积和的25,且样本容量为 140,则中间一组的频数为( ) a28 b40 c56 d60 答案 b 解析 设中间一个小长方形的面积为 x,其他 8 个长方形的面积和为52x,因此 x52x1,所以 x27.所以中间一组的频数为 1402740.故选 b. 4(2019 全国卷)演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评分中去掉 1 个最高分、1 个最低分,得到 7 个有效评分.7 个有效评分与 9个原始评分相比,不变的数字特征是( ) a中位数 b平均数 4 / 22 c方差 d极差 答案 a 解析 中位数是将 9个数据从小到大或从大到小排列后,处

7、于中间位置的数据,因而去掉 1个最高分和 1 个最低分,不变的是中位数,平均数、方差、极差均受影响故选 a. 5(2020 全国卷)设一组样本数据 x1,x2,xn的方差为 0.01,则数据10 x1,10 x2,10 xn的方差为( ) a0.01 b0.1 c1 d10 答案 c 解析 因为数据 axib(i1,2,n)的方差是数据 xi(i1,2,n)的方差的 a2倍,所以所求数据的方差为 1020.011.故选 c. 6对一批产品的长度(单位:毫米)进行抽样检测,样本容量为 200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间25,30)的为一等品,在区间20,25

8、)和30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为 . 答案 50 解析 根据题中的频率分布直方图可知,三等品的频率为 1(0.05000.06250.0375)50.25,因此该样本中三等品的件数为 2000.2550. 多角度探究突破 考向一 统计图表及应用 5 / 22 角度 1 扇形图 例 1 (2018 全国卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图: 则下面结论中不正确的是( ) a新农村建设后,种植收入减少 b新农村建设后,其他收入增加

9、了一倍以上 c新农村建设后,养殖收入增加了一倍 d新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 答案 a 解析 设新农村建设前的收入为 m,则新农村建设后的收入为 2m,新农村建设前种植收入为 0.6m,新农村建设后的种植收入为 0.74m,所以种植收入增加了,所以 a 不正确;新农村建设前其他收入为 0.04m,新农村建设后其他收入为 0.1m,故增加了一倍以上,所以 b 正确;新农村建设前,养殖收入为0.3m,新农村建设后为 0.6m,增加了一倍,所以 c 正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的 30%28%58%50%,所以超过了经济收入的一半,所

10、以 d正确故选 a. 角度 2 折线图 例 2 (多选)(2020 海南高考调研)如图所示的折线图是 2020 年 1 月 25 日至2020 年 2 月 12 日陕西省及西安市新冠肺炎累计确诊病例的折线图,则下列判断6 / 22 正确的是( ) a1月 31 日陕西省新冠肺炎累计确诊病例中西安市占比超过了13 b1 月 25 日至 2 月 12 日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势 c2月 2 日后到 2月 10 日陕西省新冠肺炎累计确诊病例增加了 97 例 d2 月 8 日到 2 月 10 日西安市新冠肺炎累计确诊病例的增长率大于 2 月 6日到 2 月 8日的增长率 答案 a

11、bc 解析 1 月 31 日陕西省新冠肺炎累计确诊病例共有 87 例,其中西安 32例,所以西安市所占比例为328713,故 a 正确;由折线图可知,1 月 25 日到 2 月12 日陕西省及西安市新冠肺炎累计确诊病例都呈递增趋势,故 b正确;2月 2日后到 2 月 10 日陕西省新冠肺炎累计确诊病例增加了 21311697 例,故 c 正确;2 月 8 日到 2 月 10 日西安市新冠肺炎累计确诊病例增加了988888544,2 月6 日到 2 月 8 日西安市新冠肺炎累计确诊病例增加了887474737,显然737544,故 d错误 角度 3 频率分布直方图 例 3 (1)(2020 天津

12、高考)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为 9 组:5.31,5.33),5.33,5.35),5.45,5.47),5.47,5.49,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在7 / 22 区间5.43,5.47)内的个数为( ) a10 b18 c20 d36 答案 b 解析 根据频率分布直方图可知,直径落在区间5.43,5.47)之间的频率为(6.25 5.00)0.02 0.225 , 则 直 径 落 在 区 间 5.43,5.47) 内 零 件 的 个 数 为800.22518.故选 b. (2)(多选)(2020 临沂模拟)在某次高

13、中学科竞赛中,4000 名考生的参赛成绩统计如图所示,60 分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有( ) a成绩在70,80分的考生人数最多 b不及格的考生人数为 1000人 c考生竞赛成绩的平均分约为 70.5分 d考生竞赛成绩的中位数为 75分 答案 abc 解析 根据频率分布直方图得,成绩出现在70,80的频率最大,故 a 正确;不及格考生数为 10(0.0100.015)40001000,故 b 正确;根据频率分8 / 22 布直方图估计考试的平均分为 450.1550.15650.2750.3850.15950.170.5,故 c 正确;0.10.

14、150.20.450.5,0.10.150.20.30.750.5,所以考生竞赛成绩的中位数为 700.50.450.31071.67,故 d 错误故选 abc. 常见统计图的特点 (1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系 (2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势 (3)准确理解频率分布直方图的数据特点 频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆; 频率分布直方图中各小长方形的面积之和为 1,这是解题的关键,常利用频率分布直方图估计总体分

15、布 1.(2020 葫芦岛模拟)书籍是人类的智慧结晶和进步阶梯,阅读是一个国家的文化根基和创造源泉.2014 年以来,“全民阅读”连续 6 年被写入政府工作报告某高中为了解学生假期自主阅读书籍类型,在全校范围内随机抽取了部分学生进行调查学生选择的书籍大致分为以下四类:a 历史类、b 文学类、c 科学类、d 哲学类根据调查的结果,将数据整理成如下的两幅不完整的统计图,其中 ab10. 根据上述信息,可知本次随机抽查的学生中选择 a历史类的人数为( ) a45 b30 c25 d22 答案 b 9 / 22 解析 由题可知,样本容量为30180.1120,所以选择 a 历史类的人数为1204230

16、1830.故选 b. 2(2020 汕头二模)新型冠状病毒疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式,为比较两种生产方式的效率,选取 80名工人,将他们随机分成两组,每组 40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式 第一种生产方式 40 名工人完成同一生产任务所用时间(单位:min)如表: 68 72 85 77 83 82 90 83 89 84 88 87 76 91 79 90 87 91 86 92 88 87 81 76 95 94 63 87 85 71 96 63 74 85 92 99 87 82 75 6

17、9 第二种生产方式 40 名工人完成同一生产任务所用时间(单位:min)如扇形图所示: (1)请填写第一种生产方式完成任务所用时间的频数分布表并作出频率分布直方图: 生产时间 60,70) 70,80) 80,90) 90,100 频数 (2)试从扇形图中估计第二种生产方式的平均数; 10 / 22 (3)根据频率分布图和扇形图判断哪种生产方式的效率更高?并说明理由 解 (1)第一种生产方式完成任务所用时间的频数分布表如下: 生产时间 60,70) 70,80) 80,90) 90,100 频数 4 8 18 10 频率分布直方图如下: (2)从扇形图中估计第二种生产方式的平均数为 650.2

18、5750.5850.2950.0575.5 min. (3)从频率分布直方图中估计第一种生产方式的平均数为 650.1750.2850.45950.2583.5 min, 从平均数的角度发现:用第一种生产方式的工人完成生产任务所需要的时间高于 80 分钟;用第二种生产方式的工人完成生产任务所需要的时间低于 80 分钟,因此第二种生产方式的效率更高 考向二 用样本估计总体 例 4 (1)(多选)为了了解某校高一年级 1600 名学生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是( ) a该校高一

19、年级学生 1 分钟仰卧起坐的次数的中位数为 26.25次 b该校高一年级学生 1 分钟仰卧起坐的次数的众数为 27.5 次 11 / 22 c该校高一年级学生 1 分钟仰卧起坐的次数超过 30 次的约有 320人 d该校高一年级学生 1 分钟仰卧起坐的次数少于 20 次的约有 32人 答案 abc 解析 由题图可知中位数是 26.25 次,众数是 27.5 次,1 分钟仰卧起坐的次数超过 30次的频率为 0.2,所以估计该校高一年级学生 1分钟仰卧起坐的次数超过 30 次的约有 320 人;1 分钟仰卧起坐的次数少于 20 次的频率为 0.1,所以该校高一年级学生 1分钟仰卧起坐的次数少于 2

20、0次的约有 160 人故 a,b,c正确,d错误,故选 abc. (2)(2020 香坊区校级二模)2020 年初新冠病毒疫情爆发,全国范围开展了“停课不停学”的线上教学活动哈六中数学组积极研讨网上教学策略:先采取甲、乙两套方案教学,并对分别采取两套方案教学的班级的 7次线上测试成绩进行统计如图所示: 请填写如表(要求写出计算过程) 平均数 方差 甲 乙 从下列三个不同的角度对这次方案选择的结果进行分析: a从平均数和方差相结合看(分析哪种方案的成绩更好); b从折线图上两种方案的走势看(分析哪种方案更有潜力) 解 由图象可得, x甲17(109111113115117119121)12 /

21、22 115, x乙17(121115109115113117115)115, 则 s2甲17(62422202224262)16, s2乙17(62026202222202)80711.43, 故表格第一行:115,16;第二行:115,约为 11.43. a.因为 x甲 x乙,s2甲s2乙,故乙方案更好 b由折线图可知甲走势稳定上升,故甲方案更好 众数、中位数、平均数、方差的意义及常用结论 (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小 (2)方差的简化计算公式:s2

22、1n(x21x22x2n)n x2,或写成 s21n(x21x22x2n) x2,即方差等于原始数据平方的平均数减去平均数的平方 3.某学校共有学生 2000 人,其中高一 800 人,高二、高三各600 人,学校对学生在暑假期间每天的读书时间做了调查统计,全体学生每天的读书时间的平均数为 x3 小时,方差为 s21.966,其中三个年级学生每天读书时间的平均数分别为 x12.7, x23.1, x33.3,又已知高一学生、高二学生每天读书时间的方差分别为 s211,s222,则高三学生每天读书时间的方差 s23 . 答案 3 解析 由题意可得,1.96680020001(2.73)26002

23、0002(3.13)26002000s23(3.33)2,解得 s233. 4(2020 南宁模拟)为了检测某种零件的一条生产线的生产过程,从生产线上随机抽取一批零件,根据其尺寸的数据得到如图所示的频率分布直方图若尺13 / 22 寸落在区间( x2s, x2s)之外,则认为该零件属于“不合格”的零件,其中x,s 分别为样本平均数和样本标准差,计算可得 s15(同一组中的数据用该组区间的中点值作代表) (1)求样本平均数的大小; (2)若一个零件的尺寸是 100 cm,试判断该零件是否属于“不合格”的零件 解 (1)x 35100.005 45100.010 55100.015 65100.0

24、3075100.02085100.01595100.00566.5. (2) x2s66.53096.5, x2s66.53036.5,10096.5,该零件属于“不合格”的零件 一、单项选择题 1如图,样本 a 和 b 分别取自两个不同的总体,它们的样本平均数分别为xa和 xb,样本标准差分别为 sa和 sb,则( ) 14 / 22 a. xa xb,sasb b xasb c. xa xb,sasb d xa xb,sasb 答案 b 解析 由图可得样本 a 的数据都在 10 及以下,样本 b 的数据都在 10 及以上,所以 xasb,故选b. 2在高一期中考试中,甲、乙两个班的数学成绩

25、统计如下表: 班级 人数 平均数 方差 甲 20 x甲 2 乙 30 x乙 3 其中 x甲 x乙,则两个班数学成绩的方差为( ) a3 b2 c2.6 d2.5 答案 c 解析 由题意可知两个班的数学成绩的平均数为 x x甲 x乙,则两个班数学成绩的方差为 s22020302( x甲 x)23020303( x乙 x)2202030230203032.6. 3(2020 河南省名校联考)如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过 21%的为( ) a腾讯与百度的访问量所占比例之和 15 / 22 b网易与搜狗的访问量所占比例之和 c淘宝与论坛的访问量所占比例之和 d新

26、浪与小说的访问量所占比例之和 答案 b 解析 由于网易与搜狗的访问量所占比例之和为 18%,不超过 21%,故选b. 4(2020 安庆模拟)某单位统计了本单位的职工一天行走步数(单位:百步)得到如图所示的频率分布直方图,估计该单位职工一天行走步数的平均值为(同一组中的数据用该组区间的中点值为代表)( ) a125 b125.6 c124 d126 答案 b 解析 由频率分布直方图,估计该单位职工一天行走步数的平均值为 x600.00220 800.00620 1000.00820 1200.01220 1400.010201600.008201800.002202000.00220125.6

27、.故选 b. 5(2020 威海一模)恩格尔系数是食品支出总额占个人消费支出总额的比重,其数值越小说明生活富裕程度越高统计改革开放 40 年来我国历年城镇和农村居民家庭恩格尔系数,绘制了如图的折线图根据该折线图,下列结论错误的是( ) 16 / 22 a城镇居民家庭生活富裕程度不低于农村居民家庭 b随着改革开放的不断深入,城镇和农村居民家庭生活富裕程度越来越高 c1996年开始城镇和农村居民家庭恩格尔系数都低于 50% d随着城乡一体化进程的推进,城镇和农村居民家庭生活富裕程度差别越来越小 答案 c 解析 由折线图可知,对于 a,因为城镇的恩格尔系数较小,故城镇居民家庭生活富裕程度不低于农村居

28、民,a 正确;对于 b,城镇和农村的恩格尔系数整体上都在下降,说明城镇和农村居民家庭生活富裕程度越来越高,b 正确;对于c,19962000 年我国农村居民家庭恩格尔系数高于 50%,c 错误;对于 d,结合图形得到城镇和农村家庭恩格尔系数之间的差距越来越小,说明城镇和农村家庭生活富裕程度差别越来越小,d正确故选 c. 6某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中 a 点表示十月的平均最高气温约为 15 ,b点表示四月的平均最低气温约为 5 .下面叙述不正确的是( ) a各月的平均最低气温都在 0 以上 b七月的平均温差比一月的平均温差大 17

29、 / 22 c三月和十一月的平均最高气温基本相同 d平均最高气温高于 20 的月份有 5个 答案 d 解析 由图形可得各月的平均最低气温都在 0 以上,a正确;七月的平均温差约为 10 ,而一月的平均温差约为 5 ,故 b正确;三月和十一月的平均最高气温都在 10 左右,基本相同,c正确;平均最高气温高于 20 的月份为六月、七月、八月,只有 3 个,d 错误 7某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图和 90 后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是( ) 注:90 后指 1990 年及以后出生,80 后指 19801989 年之间出

30、生,80 前指1979 年及以前出生 a互联网行业从业人员中 90后占一半以上 b互联网行业中从事技术岗位的人数超过总人数的 20% c互联网行业中从事运营岗位的人数 90后比 80 前多 d互联网行业中从事技术岗位的人数 90后比 80 后多 答案 d 解析 由题图易知互联网行业从业人员 90后占 56%,a正确;仅 90后从事技术岗位的人数占总人数的 0.22176,超过 20%,b 正确;90 后从事运营岗位的人数占总人数的 0.560.170.09520.03,c 正确;90 后从事技术岗位的人数占总人数的 0.22176s2甲,故甲更稳定 12已知 30 个数据的 60%分位数是 8.2,这 30 个数据从小到大排列后第 18个数据是 7.8,则第 19 个数据是 . 答案 8.6 解析 由 3060%18,设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论