版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二讲 统计、统计案例,知识回顾】 1.两种抽样方法的特点 分层抽样:按比例抽样 系统抽样:等距抽样,2.必记公式 数据x1,x2,x3,xn的数字特征公式 (1)平均数: =_. (2)方差:s2=_. (3)标准差:s=_,3.重要性质及结论 (1)频率分布直方图的三个结论 小长方形的面积=_=频率; 各小长方形的面积之和等于1; 小长方形的高=_,所有小长方形高的和为,2)回归直线方程:一组具有线性相关关系的数据 (x1,y1),(x2,y2),(xn,yn).其回归方程 =_,其 过样本点中心_. (3)独立性检验 K2= (其中n=a+b+c+d为样本容量,易错提醒】 1.忽视两个比
2、例关系:分层抽样中,易忽视每层抽取的个体的比例是相同的,即 . 2.频率分布直方图、茎叶图中的易错点:(1)易忽视频率分布直方图中纵轴表示的应为 .(2)在绘制茎叶图时,易遗漏重复出现的数据,重复出现的数据要重复记录,同时不要混淆茎叶图中茎与叶的含义,3.混淆概念致误:相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 4.对回归分析中样本点的认识错误:回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过 点,可能所有的样本数据点都不在直线上,考题回访】 1.(2016全国卷)某
3、旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15,B点表示四月的平均最低气温约为5.下面叙述不正确的是(,A.各月的平均最低气温都在0以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于20的月份有5个,解析】选D.根据雷达图可知全年最低气温都在0以上,故A正确;一月平均最高气温是6左右,平均最低气温2左右,七月平均最高气温22左右,平均最低气温13左右,所以七月的平均温差比一月的平均温差大,B正确;三月和十一月的平均最高气温都是10,三月和十一月的平均最高气温基本
4、相同,C正确;平均最高气温高于20的有七月和八月,故D错误,2.(2015全国卷)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图,以下结论不正确的是(,A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 【解析】选D.由柱形图得,从2006年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关,3.(2013全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小
5、学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是() A.简单随机抽样B.按性别分层抽样 C.按学段分层抽样D.系统抽样,解析】选C.因为男女生视力情况差异不大,而学段的视力情况有较大差异,所以应按学段分层抽样,热点考向一抽样方法 命题解读:主要考查抽样的三种方法,特别是系统抽样和分层抽样,以选择题、填空题为主,典例1】(1)(2016安阳一模)某工厂在12月份共生产了3600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生
6、产的产品数为() A.800 B.1 000 C.1 200 D.1 500,2)(2016绵阳一模)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则成绩在区间139,151上的运动员人数是_,解题导引】(1)由a,b,c构成等差数列,可求出抽样比,进而求解. (2)先将成绩分组,再找出区间139,151包含的运动员人数即可求解,规范解答】(1)选C.因为a,b,c成等差数列,所以2b=a+c,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总
7、数的三分之一,即为1 200双皮靴. (2)357=5,因此可将编号为135的35个数据分成7组,每组有5个数据,在区间139,151上共有20个数据,分在4个小组中,每组取一人,共取4人. 答案:4,规律方法】 两种抽样方法的注意点 (1)系统抽样 所分段数等于样本容量,即每段取一个. 第一段入样个体编号为a1,当每段含有n0个个体时,第k段入样个体编号为a1+(k-1)n0. 当总体不能分成整数段时,要先在总体中等可能剔除若干个体,2)分层抽样 适用于总体由差异明显的几部分组成的情况. 当总体容量为N,样本容量为n时,有下列关系式,题组过关】 1.(2016重庆一模)采用系统抽样方法从96
8、0人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为() A.7 B.9 C.10 D.15,解析】选C.抽取号码的间隔为 =30,从而区间451,750包含的段数为 =10,则编号落入区间451,750的人数为10人,即做问卷B的人数为10,2.(2016阳泉一模)学校高中部共有学生2 000名,高中部各年级男、女生人数如表,已知在高中部学生中随机抽取1名学生,抽到高三年级女生的概率是0.1
9、8,现用分层抽样的方法在高中部抽取50名学生,则应在高二年级抽取的学生人数为(,A.14 B.15 C.16 D.17,解析】选B.由已知得高三女生数x=2 0000.18=360. 故高三年级总共有360+340=700(人). 而高一年级共有373+327=700(人). 所以高二年级共有2 000-700-700=600(人). 设高二年级应抽取的学生数为n,则由分层抽样的特点 知, 解得n=15,加固训练】 1.总体由编号为01,02,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个
10、个体的编号为(,A.08 B.07 C.02 D.01,解析】选D.由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01,2.将参加夏令营的600名学生编号为:001,002,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A营区,从301到495在B营区,从496到600在C营区,则三个营区被抽中的人数依次为() A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9,解析】选B.依题意及系统抽样的意义可知,将这600名学生按编号依次分成5
11、0组,每一组各有12名学生,第k(kN*)组抽中的号码是3+12(k-1).令3+12(k-1) 300,得k ,因此A营区被抽中的人数是25;令3003+12(k-1)495,得 k42,因此B营区被抽中的人数是42-25=17.结合各选项知B正确,3.(2015福建高考)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_,解析】由题意知,男生人数=900-400=500,所以抽取比例为男生女生=500400=54,样本容量为45,所以抽取的男生人数为45 =25. 答案:25,热点考向二用样本估计总体 命
12、题解读:用样本估计总体是考查的重点,利用频率分布直方图去估计总体,利用茎叶图估计总体,利用样本的数字特征去估计总体,若单独命题,则以选择题、填空题为主,命题角度一数字特征和茎叶图的应用 【典例2】(2016枣庄一模)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为 , ,中位数分别为m甲,m乙,则(,A. ,m甲m乙 B. ,m甲m乙 D. ,m甲m乙,解题导引】先由茎叶图求出m甲和m乙,再计算 和,规范解答】选B.由茎叶图知m甲= =20,m乙= =29,所以m甲m乙; = (41+43+30+30+38+ 2
13、2+25+27+10+10+14+18+18+5+6+8)= , = (42+43+48+31+32+34+34+38+20+22+23+23+ 27+10+12+18)= ,所以,命题角度二频率分布直方图的应用 【典例3】(2016山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25), 25,27.5),27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是(,A.56 B.60 C.120 D.140 【解题导引】利
14、用频率乘以总体容量等于频数求解,规范解答】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的学生所占频率为2.5(0.16+0.08 +0.04)=0.7,所以每周自习时间不少于22.5小时的学生人数为2000.7=140,规律方法】 1.方差的计算与含义 (1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算. (2)含义:方差和标准差是描述一个样本和总体的波动大小的特征数,方差大说明波动大,2.与频率分布直方图有关问题的常见类型及解题策略 (1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其
15、他数据. (2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解,3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解,题组过关】 1.(2016太原一模)某公司10位员工的月工资(单位:元)为x1,x2,x10,其均值和方差分别为 和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为() A. ,s2+1002 B. +100,s2+1002 C. ,s2 D. +100,s2,解析】选D.利用样本的均值、方差公式求解. ,yi=xi+100,所以y1,y2,y10的均值为 +100,方差不变,2.(2016郑州一模)PM2.
16、5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是(,A.甲 B.乙 C.甲、乙相等 D.无法确定,解析】选A.从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小,加固训练】 (2016广州一模)某工厂36名工人的年龄数据如下表,1)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据. (2)计算(1)中样本的均值 和方差s2. (3)36名工
17、人中年龄在 -s与 +s之间有多少人?所占的百分比是多少?(精确到0.01,解析】(1)将36人编号为1,2,36, 由系统抽样的知识可知,36人分成9组,每组4人,其中第一组的工人年龄为44, 所以其编号为2,故所有样本数据的编号为4n-2, n=1,2,9. 其数据为:44,40,36,43,36,37,44,43,37,2) 由方差公式知,s2= (44-40)2+(40-40)2+(37-40)2= (3)因为s2= ,所以s= (3,4), 所以36名工人中年龄在 -s和 +s之间的人数等于在区间37,43内的人数,即40,40,41,39,共23人. 所以36名工人中年龄在 -s和
18、 +s之间的人数所占的 百分比为 63.89,热点考向三回归分析与独立性检验 命题解读:主要考查线性回归方程的求解及应用,独立性检验考查较少,以解答题为主,典例4】(2016全国卷)如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图. 注:年份代码1-7分别对应年份2008-2014,1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明. (2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量,附注: 参考数据: 参考公式:相关系数 回归方程 中斜率和截距的最小二乘估计公式 分别为,解题导引】(1)利用所给数据及公
19、式计算出回归系数r的值. (2)利用(1)的结论及所给数据计算,再求,求回归方程并进行预测,规范解答】(1)由折线图中的数据和附注中参考数据得,所以r 因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系,2)由 =1.331及(1)得 1.331-0.10340.92. 所以,y关于t的回归方程为 =0.92+0.10t. 将2016年对应的t=9代入回归方程得: =0.92+0.109=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨,规律方法】 1.求回归直线方程的关键及实际应用 (1)关键:正确理解计算 的公式和准确地计算. (2)实际应用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 介入手术室感染控制管理
- 杜甫抒怀诗课件
- 内外踝骨折的护理常规
- 金地合院案例创新产品
- 浙江省金兰教育合作组织2024-2025学年高一上学期期中英语试题 含解析
- 消费者投诉登记及处理记录
- 生物质气体化设施保养
- 计算机导论 教案 单元10 新一代信息技术基础
- 新人教版六年级扇形的认识
- 不同性别、年龄的体育保健与康复课件
- 2021年国家开放大学电大《企业战略管理》章节自测参考答案
- 大学生个人职业生涯规划书【6篇】
- GB/T 8812.2-2007硬质泡沫塑料弯曲性能的测定第2部分:弯曲强度和表观弯曲弹性模量的测定
- 机关办公室工作手册
- 肋骨骨折(查房)课件
- 财务会计制度模板(5篇)
- 小学语文人教六年级上册“走近鲁迅”群文阅读课件
- 建筑钢材购销合同范本(3篇)
- 小学科学教学模式的选择与运用课件
- (完整)严复生平介绍ppt
- DB31T 1169-2019 知识产权评议技术导则
评论
0/150
提交评论