第九篇统计与统计案例_第1页
第九篇统计与统计案例_第2页
第九篇统计与统计案例_第3页
第九篇统计与统计案例_第4页
第九篇统计与统计案例_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九篇统计与统计案例A第 1 讲随机抽样最新考纲1理解随机抽样的必要性和重要性2会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.知 识 梳 理1简单随机抽样(1)定义:从元素个数为 N 的总体中不放回地抽取容量为 n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到, 这种抽样方法叫做简单随机抽样(2)最常用的简单随机抽样的方法:抽签法和随机数表法2系统抽样的步骤假设要从容量为 N 的总体中抽取容量为 n 的样本(1)先将总体的 N 个个体编号;(2)确定分段间隔 k,对编号进行分段,当Nn(n 是样本容量)是整数时,取 kNn;当Nn不是整数时,可随机地从总体中

2、剔除余数,再确定分段间隔;(3)在第 1 段用简单随机抽样确定第一个个体编号 s(sk);(4)按照一定的规则抽取样本, 通常是将 s 加上间隔 k 得到第 2 个个体编号(sk),再加 k 得到第 3 个个体编号(s2k),依次进行下去,直到获取整个样本3分层抽样(1)分层抽样的定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样(2)分层抽样的应用范围:当总体由明显差异的几部分组成时,往往选用分层抽样辨 析 感 悟1对简单随机抽样的认识(1)(教材思考问题改编)在简单随机抽样中

3、, 某一个个体被抽到的可能性与第几次抽取有关,第一次抽到的可能性最大()(2)从 100 件玩具中随机拿出一件,放回后再拿出一件,连续拿 5 次,是简单随机抽样()2对系统抽样的理解(3)系统抽样适用于元素个数较多且分布均衡的总体()(4)要从 1 002 个学生中用系统抽样的方法选取一个容量为 20 的样本,需要剔除2 个学生,这样对被剔除者不公平()3对分层抽样的理解(5)分层抽样中,每个个体被抽到的可能性与层数及分层有关()(6)(2014郑州模拟改编)某校即将召开学生代表大会,现从高一、高二、高三共抽取 60 名代表,则可用分层抽样方法抽取()(7)(2013湖南卷改编)某学校有男、女

4、学生各 500 名为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异, 拟从全体学生中抽取 100 名学生进行调查,则宜采用的抽样方法是分层抽样()感悟提升两点提醒一是简单随机抽样(抽签法和随机数法)都是从总体中逐个地进行抽取,都是不放回抽样,如(2)二是三种抽样方法在抽样过程中每个个体被抽到的可能性都相等,如(1)、(4)、(5).考点一简单随机抽样【例 1】 下列抽取样本的方式是否属于简单随机抽样?(1)从无限多个个体中抽取 100 个个体作为样本(2)盒子里共有 80 个零件,从中选出 5 个零件进行质量检验在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里(3)从

5、20 件玩具中一次性抽取 3 件进行质量检验(4)某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛解(1)不是简单随机抽样由于被抽取的样本总体的个体数是无限的,而不是有限的(2)不是简单随机抽样由于它是放回抽样(3)不是简单随机抽样因为这是“一次性”抽取,而不是“逐个”抽取(4)不是简单随机抽样因为指定个子最高的 5 名同学是 56 名中特指的,不存在随机性,不是等可能抽样规律方法 (1)简单随机抽样需满足;抽取的个体数有限;逐个抽取;是不放回抽取;是等可能抽取(2)简单随机抽样常有抽签法(适用总体中个体数较少的情况)、随机数表法(适用于个体数较多的情况)【训练 1】 下列

6、抽样试验中,适合用抽签法的有()A从某厂生产的 5 000 件产品中抽取 600 件进行质量检验B从某厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验C从甲、乙两厂生产的两箱(每箱 18 件)产品中抽取 6 件进行质量检验D从某厂生产的 5 000 件产品中抽取 10 件进行质量检验答案B考点二系统抽样【例 2】 采用系统抽样方法从 960 人中抽取 32 人做问卷调查为此将他们随机编号为 1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32 人中,编号落入区间1,450的人做问卷 A,编号落入区间451,750的人做问卷 B,其余的人做问卷 C.则抽

7、到的人中,做问卷 B 的人数为()A7B9C10D15解析从 960 人中用系统抽样方法抽取 32 人,则每 30 人抽取一人,因为第一组抽到的号码为 9,则第二组抽到的号码为 39,第 n 组抽到的号码为 an930(n1)30n21,由 45130n21750,得23615n25710,所以 n16,17,25,共有 2516110 人,选 C.答案C规律方法 (1)系统抽样适用的条件是总体容量较大,样本容量也较大(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之

8、确定【训练 2】 (1)从编号为 150 的 50 枚最新研制的某种型号的导弹中随机抽取 5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取 5 枚导弹的编号可能是()A5,10,15,20,25B3,13,23,33,43C1,2,3,4,5D2,4,6,16,32(2)(2014临沂模拟)某班共有 52 人,现根据学生的学号,用系统抽样的方法,抽取一个容量为 4 的样本,已知 3 号、29 号、42 号同学在样本中,那么样本中还有一个同学的学号是()A10B11C12D16解析(1)间隔距离为 10,故可能编号是 3,13,23,33,43.(2)因为 29 号、4

9、2 号的号码差为 13,所以 31316,即另外一个同学的学号是16.答案(1)B(2)D考点三分层抽样【例 3】 (2014兰州模拟)某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人)篮球组书画组乐器组高一4530a高二151020学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取 30 人,结果篮球组被抽出 12 人,则 a 的值为_解析因为3045153010a20124515,所以解得 a30.答案30规律方法 进行分层抽样的相关计算时,常利用以下关系式巧解:(1)样本容量 n总体的个数 N该层抽取的个体数该层的个

10、体数;(2)总体中某两层的个体数之比样本中这两层抽取的个体数之比【训练 3】 (1)(2012江苏卷)某学校高一、高二、高三年级的学生人数之比为 33 4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,则应从高二年级抽取_名学生(2)某单位有职工 750 人,其中青年职工 350 人,中年职工 250 人,老年职工 150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为 7 人,则样本容量为_解析(1)高二年级学生人数占总数的3334310.样本容量为 50,则高二年级抽取:5031015(名)学生(2)由题意知,青年职工人数中年职工

11、人数老年职工人数350250150753.由样本中青年职工为 7 人得样本容量为 15.答案(1)15(2)151三种抽样方法的联系三种抽样方法的共同点都是等概率抽样, 即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为 n,总体的个体数为 N,则用这三种方法抽样时,每个个体被抽到的概率都是nN.2各种抽样方法的特点(1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性,个体间无固定间距(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始

12、部分抽样时,采用简单随机抽样(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样创新突破 8抽样方法与概率的交汇问题【典例】 (2012天津卷)某地区有小学 21 所,中学 14 所,大学 7 所,现采用分层抽样的方法从这些学校中抽取 6 所学校对学生进行视力调查(1)求应从小学、中学、大学中分别抽取的学校数目;(2)若从抽取的 6 所学校中随机抽取 2 所学校做进一步数据分析,列出所有可能的抽取结果;求抽取的 2 所学校均为小学的概率突破 1:确定分层抽样中的每层所占的比例突破 2:用列举法列出所有可能抽取的结果突破 3:利用古典概

13、型的计算公式计算解(1)由分层抽样的定义知,从小学中抽取的学校数目为 621211473;从中学中抽取的学校数目为 614211472;从大学中抽取的学校数目为67211471.则从小学、中学、大学分别抽取的学校数目为 3,2,1.(2)在抽取到的 6 所学校中,3 所小学分别记为 A1,A2,A3,2 所中学分别记为A4,A5,大学记为 A6,则抽取 2 所学校的所有可能结果为(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),(A3,A4),(A3,A5),(A3,A6),(A4,A5),(A4,A

14、6),(A5,A6),共 15 种从6所学校中抽取的2所学校均为小学(记为事件B)的所有可能结果为(A1, A2),(A1,A3),(A2,A3),共 3 种所以 P(B)31515.反思感悟 分层抽样与概率结合的题目多与实际问题紧密联系,计算量和阅读量都比较大,且一般会有图表,求解时容易造成失误,平时需注意多训练此类型的题目【自主体验】(2014潮州模拟)某公司有一批专业技术人员, 对他们进行年龄状况和接受教育程度(学历)的调查,其结果(人数分布)如下表:学历35 岁以下3550 岁50 岁以上本科803020研究生x20y(1)用分层抽样的方法在 3550 岁年龄段的专业技术人员中抽取一个

15、容量为 5 的样本,将该样本看成一个总体,从中任取 2 人,求至少有 1 人学历为研究生的概率;(2)在这个公司的专业技术人员中按年龄状况用分层抽样的方法抽取 N 个人,其中 35 岁以下 48 人,50 岁以上 10 人,再从这 N 个人中随机抽取出 1 人,此人的年龄为 50 岁以上的概率为539,求 x,y 的值解(1)用分层抽样的方法在 3550 岁中抽取一个容量为 5 的样本,设抽取学历为本科的人数为 m,3050m5,解得 m3.抽取的样本中有研究生 2 人,本科生 3 人,分别记作 S1,S2;B1,B2,B3.从中任取 2 人的所有等可能基本事件共有 10 个:(S1,B1),

16、(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3),其中至少有 1 人的学历为研究生的基本事件有 7 个:(S1,B1),(S1,B2),(S1,B3),(S2,B1)(S2,B2),(S2,B3),(S1,S2)从中任取 2 人,至少有 1 人学历为研究生的概率为710.(2)由题意,得10N539,解得 N78.3550 岁中被抽取的人数为 78481020,4880 x20501020y,解得 x40,y5.即 x,y 的值分别为 40,5.基础巩固题组(建议用时:40 分钟)一、选择题1某中学进

17、行了该学年度期末统一考试,该校为了了解高一年级 1 000 名学生的考试成绩,从中随机抽取了 100 名学生的成绩单,就这个问题来说,下面说法正确的是()A1 000 名学生是总体B每个学生是个体C1 000 名学生的成绩是一个个体D样本的容量是 100解析1 000 名学生的成绩是总体,其容量是 1 000,100 名学生的成绩组成样本,其容量是 100.答案D2(2013新课标全国卷)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大在下面的抽样方法中,最合理的抽样方法是

18、()A简单随机抽样B按性别分层抽样C按学段分层抽样D系统抽样解析因为男女生视力情况差异不大,而学段的视力情况有较大差异,所以应按学段分层抽样,故选 C.答案C3(2014东北三校联考)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为 357,现用分层抽样的方法抽出容量为 n 的样本,其中甲种产品有 18 件,则样本容量 n()A54B90C45D126解析依题意有3357n18,由此解得 n90,即样本容量为 90.答案B4(2013江西卷)总体由编号为 01,02,19,20 的 20 个个体组成利用下面的随机数表选取 5 个个体, 选取方法是从随机数表第 1 行的第 5 列和第 6 列数

19、字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为().7816657208026314070243699728019832049234493582003623486969387481A08B07C02D01解析由题意知前 5 个个体的编号为 08,02,14,07,01.答案D5 (2014石家庄模拟)某学校高三年级一班共有 60 名学生,现采用系统抽样的方法从中抽取 6 名学生做“早餐与健康”的调查,为此将学生编号为 1,2,60.选取的这 6 名学生的编号可能是()A1,2,3,4,5,6B6,16,26,36,46,56C1,2,4,8,16,32D3,9,13,27,3

20、6,54解析系统抽样是等间隔抽样答案B二、填空题6 (2014成都模拟)某课题组进行城市空气质量调查, 按地域把 24 个城市分成甲、乙、丙三组,对应城市数分别为 4,12,8.若用分层抽样抽取 6 个城市,则甲组中应抽取的城市数为_解析甲组中应抽取的城市数为62441.答案17某校高级职称教师 26 人,中级职称教师 104 人,其他教师若干人为了了解该校教师的工资收入情况, 按分层抽样从该校的所有教师中抽取 56 人进行调查,已知从其他教师中共抽取了 16 人,则该校共有教师_人解析设其他教师为 x 人,则5626104x16x,解得 x52,x26104182(人)答案1828(2014

21、青岛模拟)某班级有 50 名学生,现要采取系统抽样的方法在这 50 名学生中抽出 10 名学生,将这 50 名学生随机编号 150 号,并分组,第一组 15号,第二组 610 号,第十组 4650 号,若在第三组中抽得号码为 12 的学生,则在第八组中抽得号码为_的学生解析因为 12522,即第三组抽出的是第二个同学,所以每一组都相应抽出第二个同学,所以第 8 组中抽出的号码为 57237 号答案37三、解答题9某初级中学共有学生 2 000 名,各年级男、女生人数如下表:初一年级初二年级初三年级女生373xy男生377370z已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.1

22、9.(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名?解(1)x2 0000.19.x380.(2)初三年级人数为 yz2 000(373377380370)500,现用分层抽样的方法在全校抽取 48 名学生,应在初三年级抽取的人数为:482 00050012 名10某政府机关有在编人员 100 人,其中副处级以上干部 10 人,一般干部 70人,工人 20 人上级机关为了了解政府机构改革意见,要从中抽取一个容量为20 的样本,试确定用何种方法抽取,请具体实施抽取解用分层抽样方法抽取具体实施抽取如下:(1)2010015,1052,70514,20

23、54,从副处级以上干部中抽取 2 人,从一般干部中抽取 14 人,从工人中抽取 4 人(2)因副处级以上干部与工人的人数较少,他们分别按 110 编号与 120 编号,然后采用抽签法分别抽取 2 人和 4 人;对一般干部 70 人采用 00,01,02,69编号,然后用随机数表法抽取 14 人(3)将 2 人,4 人,14 人的编号汇合在一起就取得了容量为 20 的样本能力提升题组(建议用时:25 分钟)一、选择题1某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取, 若从一、 二、 三车间抽取的产品数分别为 a,b,c,且 a,b,

24、c 构成等差数列,则第二车间生产的产品数为()A800B1 000C1 200D1 500解析因为 a,b,c 成等差数列,所以 2bac,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占总数的三分之一,即为 1 200 双皮靴答案C2将参加夏令营的 600 名学生编号为:001,002,600,采用系统抽样方法抽取一个容量为 50 的样本,且随机抽得的号码为 003.这 600 名学生分住在三个营区,从 001 到 300 在第营区,从 301 到 495 在第营区,从 496 到 600 在第营区,三个营区被抽中的人数依次为()A26,16,8

25、B25,17,8C25,16,9D24,17,9解析由题意知间隔为6005012,故抽到的号码为 12k3(k0,1,49),列出不等式可解得:第营区抽 25 人,第营区抽 17 人,第营区抽 8 人答案B二、填空题3.200 名职工年龄分布如图所示,从中随机抽 40 名职工作样本,采用系统抽样方法,按 1200 编号为 40 组,分别为 15,610,196200,第 5 组抽取号码为 22,第 8 组抽取号码为_若采用分层抽样,40 岁以下年龄段应抽取_人解析将 1200 编号分为 40 组, 则每组的间隔为 5, 其中第 5 组抽取号码为 22,则第 8 组抽取的号码应为 223537;

26、由已知条件 200 名职工中 40 岁以下的职工人数为 20050%100,设在 40 岁以下年龄段中抽取 x 人,则40200 x100,解得 x20.答案3720三、解答题4某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100 名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20 至 40 岁401858大于 40 岁152742总计5545100(1)用分层抽样方法在收看新闻节目的观众中随机抽取 5 名,大于 40 岁的观众应该抽取几名?(2)在上述抽取的 5 名观众中任取 2 名,求恰有 1 名观众的年龄为 20 至 40 岁的概率解(1)应抽取大于 40 岁

27、的观众人数为274553553(名)(2)用分层抽样方法抽取的 5 名观众中,20 至 40 岁有 2 名(记为 Y1,Y2),大于 40岁有 3 名(记为 A1, A2, A3).5 名观众中任取 2 名, 共有 10 种不同取法: Y1Y2, Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,A1A2,A1A3,A2A3.设 A 表示随机事件“5 名观众中任取 2 名,恰有 1 名观众年龄为 20 至 40 岁”,则 A 中的基本事件有 6 种:Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,故所求概率为 P(A)61035.第 2 讲用样本估计总体最新考纲1了解分布

28、的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,体会他们各自的特点2理解样本数据标准差的意义和作用,会计算数据标准差3能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解样本估计总体的思想5会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知 识 梳 理知 识 梳 理1频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征(2)在频率分布直方图中,纵轴表示频率与组距

29、的比值,小长方形面积组距频率组距频率,这就是说,各个小长方形的面积等于相应各组的频率,显然,所有长方形的面积之和等于 1(3)频率分布折线图:把频率分布直方图中各个长方形上边的中点用线段连接起来,就得到频率分布折线图(4)设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布, 它可以用一条光滑曲线 yf(x)来描绘, 这条光滑曲线就叫做总体密度曲线2茎叶图的优点用茎叶图表示数据有两个突出的优点:一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,方便记录与表示3用样本的数字特征估计总体的数字特征(1)众数、

30、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数:n 个样本数据 x1,x2,xn的平均数 xx1x2x3xnn,则有nxx1x2xn(2)标准差设样本的元素为 x1,x2,xn,样本的平均数为 x,样本方差:s2(x1x)2(x2x)2(xnx)2n,样本标准差:s(x1x)2(x2x)2(xnx)2n辨 析 感 悟1对频率分布直方图的认识(1)在频率分布直方图中,小矩形的高表示频率()(2)频率分布直方图中各个长方形的面积之和为 1.()2对样本数字特征的

31、认识(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势()(4)一组数据的方差越大,说明这组数据的波动越大()(5)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次()(6)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数()(7)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的()(8)如图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 85,1.6.()(9)(2014广州调研改编)10 名工人某天生产同一零件,生产的件数分别是1

32、5,17,14,10,15,19,17,16,14,12, 则这一天 10 名工人生产的零件的中位数是 15.()感悟提升1作频率分布直方图的步骤(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图2两个防范一是在频率分布直方图中,小矩形的高表示频率/组距,而不是频率,如(1);二是利用频率分布直方图求众数、中位数和平均数时,应注意三点:最高的小长方形底边中点的横坐标即是众数; 中位数左边和右边的小长方形的面积和是相等的;平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考点一频率分布直方图的应

33、用【例 1】 某中学高一女生共有 450 人,为了了解高一女生的身高情况,随机抽取部分高一女生测量身高,所得数据整理后列出频率分布表如下:组别频数频率145.5149.580.16149.5153.560.12153.5157.5140.28157.5161.5100.20161.5165.580.16165.5169.5mn合计MN(1)求出表中字母 m,n,M,N 所对应的数值;(2)在给出的直角坐标系中画出频率分布直方图;(3)估计该校高一女生身高在 149.5165.5 cm 范围内有多少人?审题路线由频率分布表可以计算出 m,n,M,N 的值作频率分布直方图利用频率分布直方图求值解(

34、1)由题意 M80.1650,落在区间 165.5169.5 内数据频数 m50(8614108)4,频率为 n0.08,总频率 N1.00.(2)频率分布直方图如下图:(3)该所学校高一女生身高在 149.5165.5 cm 之间的比例为 0.120.280.200.160.76,则该校高一女生在此范围内的人数为 4500.76342(人)规律方法 解决频率分布直方图的问题,关键在于找出图中数据之间的联系这些数据中,比较明显的有组距、频率组距,间接的有频率、小长方形的面积,合理使用这些数据,再结合两个等量关系:小长方形面积组距频率组距频率,小长方形面积之和等于 1,即频率之和等于 1,就可以

35、解决直方图的有关问题【训练 1】 (2013辽宁卷)某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:20,40),40,60),60,80),80,100人若低于 60分的人数是 15 人,则该班的学生人数是()A45B50C55D60解析第一、第二小组的频率分别是 0.1,0.2,所以低于 60 分的频率是 0.3,设班级人数为 m,则15m0.3,m50.答案B考点二茎叶图的应用【例 2】 为了比较两种治疗失眠症的药(分别称为 A 药,B 药)的疗效,随机地选取 20 位患者服用 A 药,20 位患者服用 B 药,这 40 位患者在服用一段时间后,记录他们日平均增加

36、的睡眠时间(单位:h),试验的观测结果如下:服用 A 药的 20 位患者日平均增加的睡眠时间:061.22.71.52.81.82.22.33.23.5252.61.22.71.52.93.03.12.32.4服用 B 药的 20 位患者日平均增加的睡眠时间:321.71.90.80.92.41.22.61.31.4160.51.80.62.11.12.51.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成右面茎叶图,从茎叶图看,哪种药的疗效更好?解(1)设 A 药观测数据的平均数为xA,B 药观测数据的平均数为xB,则xA120(0.61.

37、22.71.52.81.82.22.33.23.52.52.61.22.71.52.93.03.12.32.4)2.3.xB120(3.21.71.90.80.92.41.22.61.31.41.60.51.80.62.11.12.51.22.70.5)1.6.则xAxB,因此 A 药的疗效更好(2)由观测结果绘制如下茎叶图:从茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎 2,3 上;B 药疗效的试验结果有710的叶集中在茎 0,1 上由上述可看出 A 药的疗效更好规律方法 茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的

38、数据要重复记录,不能遗漏,特别是“叶”的位置的数据【训练 2】 (2013重庆卷)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组乙组909x215y87424已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x,y 的值分别为()A2,5B5,5C5,8D8,8解 析由 茎 叶 图 及 已 知 得 x 5 , 又 乙 组 数 据 的 平 均 数 为 16.8 , 即91510y1824516.8,解得 y8.答案C考点三样本的数字特征【例 3】 甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根

39、据图和上面算得的结果,对两人的训练成绩作出评价解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10 分,13 分,12 分,14 分,16 分;乙:13 分,14 分,12 分,12 分,14 分.x甲1013121416513,x乙1314121214513,s2甲15(1013)2(1313)2(1213)2(1413)2(1613)24,s2乙15(1313)2(1413)2(1213)2(1213)2(1413)20.8.(2)由 s2甲s2乙可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高规律方法 平均数与方

40、差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小【训练 3】 将某选手的 9 个得分去掉 1 个最高分,去掉 1 个最低分,7 个剩余分数的平均分为 91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以 x 表示:则 7 个剩余分数的方差为()A.1169B.367C36D.6 77解析由题意知879490919090 x91791, 解得 x4.所以 s217(8791)2(9491)2(9091)2(9191)2(9091)2(9491)2(9191)217(16910

41、190)367.答案B1茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息, 必须在完成抽样后才能制作2众数、中位数、平均数的异同(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量(2)平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质(3)众数体现各数据出现的频率,当一组数据中有若干数据多次出现时,众数往往更能反映问题(4)中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也

42、可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势易错辨析 8统计图表识图不准致误【典例】 从某校高三年级随机抽取一个班,对该班 50 名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:若某高校 A 专业对视力的要求在 0.9 以上,则该班学生中能报 A 专业的人数为_解析该班学生视力在 0.9 以上的频率为(1.000.750.25)0.20.4, 故能报A 专业的人数为 0.45020.答案20易错警示解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9 以上”的含义理解有误防范措施 求解频率分布直方图中的

43、数据问题,最容易出现的问题就是把纵轴误以为是频率导致错误在频率分布直方图中,纵轴表示频率组距,我们用各个小矩形的面积表示该段数据的频率, 所以各组数据的频率等于小矩形的高对应的数据与小矩形的宽(样本数据的组距)的乘积【自主体验】(2013福建卷)某校从高一年级学生中随机抽取部分学生, 将他们的模块测试成绩分成 6 组:40,50),50,60),60,70),70,80),80,90),90,100加以统计,得到如图所示的频率分布直方图已知高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为()A588B480C450D120解析从频率分布直方图可以看出: 分数大

44、于或等于60分的频率为(0.0300.0250.0150.010)100.8,故频数为 6000.8480.答案B基础巩固题组(建议用时:40 分钟)一、选择题1 (2012 山 东 卷 ) 在 某 次 测 量 中 得 到 的 A 样 本 数 据 如 下 :82,84,84,86,86,86,88,88,88,88.若 B 样本数据恰好是 A 样本数据每个都加 2 后所得数据则 A,B 两样本的下列数字特征对应相同的是()A众数B平均数C中位数D标准差解析对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差, 众数、中位数、平均数都发生改变答案D2在样本频率分布直方图中,共有 11 个

45、小长方形,若中间一个小长方形的面积等于其他 10 个小长方形面积和的14,且样本容量为 160,则中间一组的频数为()A32B0.2C40D0.25解析由频率分布直方图的性质,可设中间一组的频率为 x,则 x4x1,x0.2,故中间一组的频数为 1600.232,选 A.答案A3 (2014潮州二模)有两位射击运动员在一次射击测试中各射靶 10 次,每次命中的环数如下:甲78795491074乙9578768677则下列判断正确的是()A甲射击的平均成绩比乙好B乙射击的平均成绩比甲好C甲比乙的射击成绩稳定D乙比甲的射击成绩稳定解析甲、乙的平均成绩分别为x甲7,x乙7,故排除 A,B 项;甲、乙

46、的成绩的方差分别为 s2甲110(77)2(87)2(77)2(97)2(57)2(47)2(97)2(107)2(77)2(47)24,s2乙110(97)2(57)2(77)2(87)2(77)2(67)2(87)2(67)2(77)2(77)21.2,则 s2甲s2乙,所以乙比甲的射击成绩稳定,故选 D.答案D4.(2014临沂一模)某中学高三从甲、乙两个班中各选出 7 名学生参加数学竞赛,他们取得的成绩(满分 100 分)的茎叶图如图,其中甲班学生成绩的众数是 85,乙班学生成绩的中位数是 83,则 xy 的值为()A7B8C9D10解析由茎叶图可知,甲班学生成绩的众数是 85,所以

47、x5.乙班学生成绩的中位数是 83,所以 y3,所以 xy538.答案B5甲、乙两人在一次射击比赛中各射靶 5 次,两人成绩的条形统计图如图所示,则()A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差解析由条形统计图知:甲射靶 5 次的成绩分别为:4,5,6,7,8;乙射靶 5 次的成绩分别为:5,5,5,6,9;所以x甲4567856;x乙5556956.所以x甲x乙故 A 不正确甲的成绩的中位数为 6,乙的成绩的中位数为 5,故 B 不正确s2甲15(46)2(56)2(66)2(76)2(86

48、)215102,s2乙15(56)2(56)2(56)2(66)2(96)21512125,因为 2125,所以 s2甲s2乙.故 C 正确甲的成绩的极差为:844,乙的成绩的极差为:954,故 D 不正确故选 C.答案C二、填空题6 在如图所示的茎叶图中, 甲、 乙两组数据的中位数分别是_, _.解析根据茎叶图所给数据,易知两组数据的中位数分别为 45,46.答案45467(2013湖北卷)从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 至 350 度之间,频率分布直方图如图所示(1)直方图中 x 的值为 _;(2)在这些用户中,用电量落在区间100,250内的户数为_

49、解析(1)根据频率和为 1,得(0.002 40.003 60.006 0 x0.002 40.0012)501,解得 x0.004 4.(2)(0.003 60.004 40.006 0)5010070.答案0.004 4708某人 5 次上班途中所花的时间(单位:分钟)分别为 x,y,10,11,9.已知这组数据的平均数为 10,方差为 2,则|xy|的值为_解析由题意可得:xy20,(x10)2(y10)28,设 x10t,y10t,|xy|2|t|4.答案4三、解答题9某校高一某班的某次数学测试成绩(满分为 100 分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此

50、解答下列问题:(1)求分数在50,60的频率及全班人数;(2)求分数在80,90之间的频数,并计算频率分布直方图中80,90间的矩形的高解(1)分数在50,60的频率为 0.008100.08.由茎叶图知,分数在50,60之间的频数为 2,所以全班人数为20.0825.(2)分数在80,90之间的频数为 25271024,频率分布直方图中80,90间的矩形的高为425100.016.10(2014大连模拟)从某校高三年级 800 名男生中随机抽取 50 名学生测量其身高,据测量,被测学生的身高全部在 155 cm 到 195 cm 之间将测量结果按如下方式分成 8 组:第一组155,160),

51、第二组160,165),第八组190,195,下图是按上述分组得到的频率分布直方图的一部分已知第一组与第八组的人数相同,第七组与第六组的人数差恰好为第八组与第七组的人数差求下列频率分布表中所标字母的值,并补充完成频率分布直方图频率分布表:分组频数频率频率/组距180,185)xyz185,190)mnp解由频率分布直方图可知前五组的频率和是(0.0080.0160.040.040.06)50.82,第八组的频率是 0.00850.04,所以第六、七组的频率和是 10.820.040.14,所以第八组的人数为 500.042,第六、七组的总人数为500.147.由已知得 xm7,mx2m,解得

52、x4,m3,所以 y0.08,n0.06,z0.016,p0.012.补充完成频率分布直方图如图所示能力提升题组(建议用时:25 分钟)一、选择题1(2014长春调研)如图是依据某城市年龄在 20 岁到 45 岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在30,35),35,40)、40,45的上网人数呈现递减的等差数列分布,则年龄在35,40)的网民出现的频率为()A0.04B0.06C0.2D0.3解析由频率分布直方图可知,年龄在20,25)的频率为 0.0150.05,25,30)的频率为 0.0750.35,又年龄在30,35),35,40),40,45的频率成等差数列分布,

53、所以年龄在35,40)的网民出现的频率为 0.2.答案C2 (2012陕西卷)从甲乙两个城市分别随机抽取 16 台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为 m甲,m乙,则()A.x甲m乙B.x甲x乙,m甲x乙,m甲m乙D.x甲x乙,m甲m乙解析x甲116(41433030382225271010141818568)34516,x乙116(42434831323434382022232327101218)45716.x甲x乙又m甲20,m乙29,m甲r0.05,表明有 95%的把握认为变量 x 与 Y 直线之间具有线性相

54、关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义4独立性检验(1)22 列联表:B合计An11n12n1n21n22n2合计n1n2n其中 n1n11n12,n2n21n22,n1n11n21,n2n12n22,nn11n21n12n22(2)2统计量:2n(n11n22n12n21)2n1n2n1n2.(3)两个临界值:3.841 与 6.635当23.841 时,有 95%的把握说事件 A 与 B 有关;当26.635 时,有 99%的把握说事件 A 与 B 有关;当23.841 时,认为事件 A 与 B 是无关的辨 析 感 悟1对变量间的相关关系的认识(1)(2014武汉调研改编

55、)A 项:正方体的棱长与体积是相关关系()B 项:日照时间与水稻的亩产量是相关关系()(2)(教材思考问题改编)相关关系与函数关系都是一种确定性的关系, 也是一种因果关系()(3)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系去表示()2对回归直线方程的理解(4)通过回归方程ybxa可以估计和观测变量的取值和变化趋势()(5)任何一组数据都对应着一个回归直线方程()(6)(2012湖南卷改编)设某大学的女生体重 y(单位: kg)与身高 x(单位: cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为y0.85x85.71,判断下

56、列命题的正误:y 与 x 具有正的线性相关关系()回归直线过样本点的中心(x,y)()若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg.()若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg.()3对独立性检验的认识(7)事件 X,Y 关系越密切,则由观测数据计算得到的 K2的观测值越大()(8)由独立性检验可知,有 99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有 99%的可能物理优秀()感悟提升1“相关关系与函数关系”的区别函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关

57、系如(2)2 三点提醒一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义如(5)二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值如(6)中的.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点, 不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释如(8).考点一两个变量间的相关关系【例 1】 (2013湖北卷)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并求得回

58、归直线方程,分别得到以下四个结论:y 与 x 负相关且y2.347x6.423;y 与 x 负相关且y3.476x5.648;y 与 x 正相关且y5.437x8.493;y 与 x 正相关且y4.326x4.578.其中一定不正确的结论的序号是()ABCD解析中, 回归方程中 x 的系数为正, 不是负相关; 方程中的 x 的系数为负,不是正相关,一定不正确答案D规律方法 在回归直线方程ybxa中,b代表 x 每增加一个单位,y 平均增加的单位数,一般来说,当回归系数b0 时,说明两个变量呈正相关关系;当回归系数b0 时,说明两个变量呈负相关关系【训练 1】 对变量 x,y 有观测数据(xi,

59、yi)(i1,2,10),得散点图(1);对变量 u,v 有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量 x 与 y 正相关,u 与 v 正相关B变量 x 与 y 正相关,u 与 v 负相关C变量 x 与 y 负相关,u 与 v 正相关D变量 x 与 y 负相关,u 与 v 负相关解析由图(1)可知,各点整体呈递减趋势,x 与 y 负相关;由图(2)可知,各点整体呈递增趋势,u 与 v 正相关答案C考点二线性回归方程及其应用【例 2】 (2013重庆卷)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单

60、位:千元)的数据资料,算得错误错误!i80,错误错误!i20,错误错误!iyi184,错误错误!2i720.(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程ybxa;(2)判断变量 x 与 y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄附:线性回归方程ybxa中,b错误错误!,aybx,其中x,y为样本平均值审题路线先确定x1n错误错误!i,y1n错误错误!i计算错误错误!2inx2计算b计算a得到线性回归方程由b的符号判断相关把 x7 代入线性回归方程求y.解(1)由题意知 n10,x1n错误错误!i80108,y1n错误错误!i20102,又

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论