




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章|
统计与成对数据的统计分析第一节随机抽样与用样本估计总体1.了解总体、样本、样本量的概念及数据的随机性.2.掌握简单随机抽样及分层随机抽样,能根据实际问题的特点,设计恰当的抽样方法,解决实际问题.3.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述.4.理解集中趋势参数、离散程度参数的统计含义;能用样本估计总体的取值规律;理解百分位数的统计含义.1.简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.除非特殊声明,所称的简单随机抽样指不放回简单随机抽样.(1)抽取方式:逐个不放回抽取;(2)特点:每个个体被抽到的概率相等;(3)常用方法:抽签法和
.随机数法2.分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行_________抽样,再把所有子总体中抽取的样本_________作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层_______都与层的大小成比例,那么称这种样本量的分配方式为比例分配.简单随机合在一起样本量3.作频率分布直方图的步骤(1)求_____
(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将_____分组;(4)列频率分布表;(5)画频率分布直方图.极差数据4.其他统计图表统计图表主要应用扇形图直观描述各类数据占总数的_____条形图和直方图直观描述不同类别或分组数据的频数和频率折线图描述数据随_____的变化趋势比例时间5.样本的数字特征(1)简单随机抽样和分层随机抽样在抽样过程中每个个体被抽取的机会相等,分层随机抽样中各层抽样时采用简单随机抽样.(2)利用分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,则应当调整各层容量,即先剔除各层中“多余”的个体.1.已知一组数据为20,30,40,50,50,60,70,80,则该组数据的平均数、中位数和众数的大小关系是
(
)A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.平均数=中位数=众数答案:D2.(人教A版必修第二册P197·T1改编)如图是60名学生参加数学竞赛的成绩(均为整数)的频率分布直方图,估计这次数学竞赛的及格率是
(
)A.75% B.25%C.15% D.40%答案:A3.某款具有社交属性的健身APP,致力于提供健身教学、跑步、骑行、交友及健身饮食指导、装备购买等一站式运动解决方案.可以让你随时随地进行锻炼,记录你每天的训练进程.不仅如此,它还可以根据不同人的体质,制定不同的健身计划.小明根据该APP记录的2021年1月至2021年11月期间每月跑步的里程(单位:十公里)数据整理并绘制了下面的折线图.根据该折线图,下列结论错误的是
(
)A.月跑步里程的最小值出现在2月B.月跑步里程逐月增加C.月跑步里程的中位数为5月份对应的里程数D.1月至5月的月跑步里程相对于6月至11月波动性更小解析:由折线图可知,月跑步里程的最小值出现在2月,故A正确;月跑步里程不是逐月增加的,故B不正确;月跑步里程数从小到大排列分别是:2月,8月,3月,4月,1月,5月,7月,6月,11月,9月,10月对应的里程数,故5月份对应的里程数为中位数,故C正确;由图可知,1月至5月的月跑步里程相对于6月至11月波动性更小,变化比较平稳,故D正确.答案:B4.(苏教版必修第二册P220·T2改编)某校高一年级有900名学生,其中女生400名.按男女比例用分层随机抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.答案:255.(人教A版必修第二册P202·例2改编)一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为__________,第86百分位数为________.6.(人教A版必修第二册P184·T3改编)某班级有50名同学,一次数学测试平均成绩是92分,如果30名男生的平均成绩为90分,那么20名女生的平均成绩为________分.层级一/基础点——自练通关(省时间)基础点(一)抽样方法
[题点全训]1.某班有男生36人,女生18人,用分层随机抽样的方法从该班全体学生中抽取一个容量为9的样本,则抽取的女生人数为
(
)A.6 B.4C.3 D.22.(2022·广州综合测试)某公司生产A,B,C三种不同型号的轿车,其产量之比为2∶3∶4,为检验该公司的产品质量,用分层随机抽样的方法抽取一个容量为n的样本,若样本中A种型号的轿车比B种型号的轿车少8辆,则n=
(
)A.96 B.72
C.48 D.363.总体由编号为1,2,…,99,100的100个个体组成.现用随机数法选取60个个体,利用电子表格软件产生的若干个1~100范围内的整数随机数的开始部分数据如下,则选出来的第5个个体的编号为______.8
44
2
17
8
31
57
4
55
688
77
74
47
7
21
76
33
50
63解析:生成的随机数中落在编号1~100范围内的有8,44,2,17,8(重复,舍弃),31……故选中的第5个个体的编号为31.答案:314.某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示.现在用分层随机抽样的方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1020小时,980小时,1030小时,估计这个企业生产的这批电子产品的平均使用寿命为________小时.解析:由分层随机抽样可知,第一分厂应抽取100×50%=50(件).由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命约为1020×50%+980×20%+1030×30%=1015(小时).答案:50
10152.已知一组样本数据由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a,b的值分别为
(
)A.10,11 B.9.5,10.5C.10.4,10.6 D.10.5,10.53.(2021·新高考Ⅰ卷改编)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,有以下结论:①两组样本数据的样本平均数相同;②两组样本数据的样本中位数相同;③两组样本数据的样本标准差相同;④两组样本数据的样本极差相同.其中正确结论的序号为________.基础点(三)统计图表的直观应用
[题点全训]1.某企业2021年12个月的收入与支出数据的折线图如下:已知:利润=收入-支出,根据该折线图,下列说法不正确的是
(
)A.该企业2021年1月至6月的总利润低于2021年7月至12月的总利润B.该企业2021年1月至6月的平均收入低于2021年7月至12月的平均收入C.该企业2021年8月至12月的支出持续增长D.该企业2021年11月份的月利润最大解析:因为图中的实线与虚线的相对高度表示当月利润.由折线统计图可知1月至6月的相对高度的总量要比7月至12月的相对高度总量少,故A正确;由折线统计图可知1月至6月的收入都普遍低于7月至12月的收入,故B正确;由折线统计图可知2021年8月至12月支出的图象是上升的,所以支出持续增长,故C正确;由折线统计图可知11月的相对高度比7月、8月都要小,故D错误.答案:D
2.某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并将收集的数据整理绘制成如图所示的两幅不完整的统计图.根据图中信息,下列说法不正确的是
(
)A.扇形图中D的占比最小B.条形图中A和C一样高C.无法计算扇形图中A的占比D.估计该校一半的学生选择结伴步行或家人接送答案:
C
3.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是
(
)A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:设新农村建设前的收入为M,则新农村建设后的收入为2M,新农村建设前种植收入为0.6M,新农村建设后种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.答案:A
[方法技巧]常见的能够反映实际情况的统计图有条形图、折线图、扇形图等.扇形图中每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比;折线图能够很直观地体现数据随时间的变化情况;条形图可以直观地体现各数据之间的数量关系;茎叶图可以直观展现各个数据,而且能够通过计算和分布情况体现各个数字特征.具体的应用中要能够准确掌握各个统计图的功能,同时要能够准确理解试题的环境含义.
层级二/重难点——逐一精研(补欠缺)重难点(一)统计图表中的数字特征的计算
[典例]统计局就某地居民的月收入(单位:元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2500,3000)内.(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层随机抽样的方法抽出100人做进一步分析,则月收入在[4000,4500)内的应抽取多少人?(2)估计该地居民月收入的中位数和众数;(3)假设同组中的数据用该组区间的中点值为代表,估计该地居民月收入的平均数.[解]
(1)因为(0.0002+0.0004+0.0003+0.0001)×500=0.5,所以2a×500=0.5,所以a=0.0005.又0.0005×500=0.25,所以月收入在[4000,4500)内的频率为0.25,所以月收入在[4000,4500)内的应抽取的人数为0.25×100=25.[针对训练]某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80]后得到如图所示的频率分布直方图.(1)求在这40名读书者中年龄分布在[40,70)的人数;(2)求这40名读书者的年龄的平均数和中位数.解:(1)由频率分布直方图知,年龄在[40,70)的频率为(0.020+0.030+0.025)×10=0.75.故这40名读书者中年龄分布在[40,70)的人数为40×0.75=30.(2)这40名读书者年龄的平均数为25×0.05+35×0.10+45×0.20+55×0.30+65×0.25+75×0.10=54.设中位数为x,则0.005×10+0.010×10+0.020×10+0.030×(x-50)=0.5,解得x=55.故这40名读书者年龄的中位数为55.重难点(二)用样本估计总体
[典例]
(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频率分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)y的分组[-0.20,0)[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数22453147[方法技巧]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[针对训练]某校开展了线上教学活动.数学组积极研讨网上教学策略:先采取甲、乙两套方案教学,并对分别采取两套方案教学的班级的7次线上测试成绩进行统计,如图所示.(1)请填写下表(要求写出计算过程).(2)从下列不同的角度对这次方案选择的结果进行分析:①从平均数和方差相结合看(分析哪种方案的成绩更好);②从折线图上两种方案的走势看(分析哪种方案更有潜力).
平均数方差甲
乙
2.(样本数字特征意义不清)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
(
)A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数解析:评估这种农作物亩产量稳定程度的指标是标准差.答案:B
解析:假设每月新增一组人,将其编号为1,2,3,4,…,则每个月接受调查的情况为:1月:1;2月:1,2;3月:2,3;4月:3,4
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 标准件企业管理制度
- 格力工程机管理制度
- 梅生物卫生管理制度
- 棋类俱乐部管理制度
- 模特社社团管理制度
- 母婴喂养室管理制度
- 比亚迪档案管理制度
- 民心网工作管理制度
- 水泥厂设备管理制度
- 江干区保洁管理制度
- 幼儿园教师考核评价量化表
- 北师版七年级数学下册期末复习课件2024版
- 医院反腐倡廉廉洁行医专题党课宣讲课件
- 2025版《VOCs废气处理设施安全检查表》(全)
- 企业环保知识培训课件
- 《PLC光分路器》课件
- 小额贷款公司数据安全管理制度
- 护理学基础无菌技术说课
- 燃气服务数据分类分级管理标准
- 商混站(商品混凝土公司)安全风险分级管控和隐患排查治理双体系方案全套资料汇编完整版
- GB/T 44570-2024塑料制品聚碳酸酯板材
评论
0/150
提交评论