专题六 第3讲 统计与统计案例_第1页
专题六 第3讲 统计与统计案例_第2页
专题六 第3讲 统计与统计案例_第3页
专题六 第3讲 统计与统计案例_第4页
专题六 第3讲 统计与统计案例_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3讲统计、统计案例自主学习导引真题感悟1.(2012福建)一支田径队有男女运动员98人,其中男运动员有56人,按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取的女运动员人数是 .解析利用分层抽样的特点,按比例抽样去分析.依题意,女运动员有98-56=42(人).设应抽取女运动员x人,根据分层抽样特x28点,得42=98,解得x=12.答案122.(2012湖北)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数234542则样本数据落在区间[10,40)的频率为A.0.35 B.0.45C.0.55 D.0.65解析根据频率的定义求解.由表知[10,40)的频数为2+3+4=9,9所以样本数据落在区间[10.40)的频率为20=0.45.答案B考题分析统计与统计案例部分的高考试题难度一般不大,考查的内容多为抽样方法,用样本估计总体、线性回归分析、独立性检验等,这类题目作为解答题出现时,往往与概率结合命题.网络构建厂简单随机抽样随机抽样—系统抽样「分层抽样—频率分布直方图总体估计—茎叶图「方差与标准差变量的相关性—线性回归方程1回归分析及厂回归分析的基本思想及其初步应用独立性检验」独立性检验高频考点突破考点一:抽样方法【例1】(2012中山模拟)某校共有学生2000名,各年级男、女学生人数如图表示,已知在全校学生中随机抽取1名,抽到高二级女生的概率是0.19,现用分层抽样的方法(按年级分层)在全校学生中抽取100人,则应在高三级中抽取的学生人数为.高一级高二级咼二级女生385xy男生375360z[审题导引]据题意求出字母的值,按照分层抽样的规则计算.[规范解答]据题意得x=2000X0.19=380,•••高三级的学生人数为y+z=2000-385-375-380-360=500,.•.在高三级中抽取的学生人数为500x£000=25.[答案]25【规律总结】抽样方法的选取注意分层抽样与系统抽样的计算方法,分层抽样是按比例抽样,比例的性质、方程的方法起主要作用;系统抽样首先是对总体分段的计算,注意分段时可能要排除一些个体,各段的间隔距离是一样的,但各段中抽取的个体就可有不同的规则,要根据这些规则通过计算确立抽取的个体.【变式训练】1.某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1〜50号,并分组,第一组1〜5号,第二组6〜10号,…,第十组46〜50号.若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生.解析由于组距为5,所以所抽号码为(8-3)X5+12=37.答案37考点二:用样本估计总体【例2】(1)(2012西城二模)下图是1、2两组各7名同学体重(单位:kg)数据的茎叶图•设1、2两组数据的平均数依次为1和2,标准差依次为S]和$2,那么

1组2组3 6 7 854 6 8160102723(注:标准差s='(兀1_X)s2=-[(58-61)2+(57-61)2+(56-61)2+(53s2=-[(58-61)2+(57-61)2+(56-61)2+(53-61)2+(61-61)2+(72-61)2+其中x为x1,x2,„,x的平均数)A.xA.x1>x2,S]>s2B.x]>x2,s]Vs2C.xC.x]Vx2,S]Vs2D.x]Vx2,s]>s2(2)(2012•余州模拟)某年级120名学生在一次百米测试中,成绩全部介于13秒与]8秒之间.将测试结果分成5组:[]3,]4),[]4,]5),[]5,]6),[]6,]7),[]7,]8],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1:3:7:6:3,那么成绩在[16,18啲学生人数是 .(70-(70-61)2]=299V,[审题导引](1)根据茎叶图中的数据分别计算丁1,72,s2,s2,然后比较大小;(2)根据直方图中各小矩形的面积和为1计算出成绩在[16,18]的频率,然后计算成绩在[16,18]的学生人数.[规范解答](1)由茎叶图知- 58+57+56+53+61+72+70x1= =61.

6+31+36+31+3+7+6+320,9所以成绩在[16,18]的学生人数为石X120=54.[答案](1)C(2)54【规律总结】用样本估计总体时应注意的问题理解在抽样具有代表性的前提下,可以用样本的频率分布估计总体的频率分布,用样本的特征数估计总体的特征数,这是统计的基本思想;反映样本数据分布的主要方式,一个是频率分布表,一个是频率分布直方图,要学会根据频率分布直方图估计总体的概率分布以及总体的特征数,特别是均值、众数和中位数;要掌握好样本均值和方差的实际意义,并在具体的应用问题中会根据计算样本数据的均值和方差对实际问题做出解释;茎叶图是表示样本数据分布的一种方法,其特点是保留了所有的原始数据,这是茎叶图的优势.【变式训练】2.(2012义乌模拟)在如图所示的茎叶图中,乙组数据的中位数是 ;若从甲、乙两组数据中分别去掉一个最大数和一个最小数后,两组数据的平均数中较大的一组是 组.甲乙07954551844647m93解析把乙组数据从小到大排,得79,84,84,84,86,87,93,故中位数是84,x=84,x=85,甲乙二x>x乙甲.答案84乙(2012杭州二模)将容量为n的样本中的数据分成6组,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n的值为A.70 B.60 C.50 D.40

解析据题意知2+解析据题意知2+3+42+3+4+6+4+127n•'•n=60.答案B考点三:线性回归分析【例3】某种设备的使用年限x和维修费用y(万元)有以下的统计数据,如表所示x3456y2.5344.5(1)画出上表数据的散点图;请根据上表提供的数据,求出y关于x的线性回归方程y=bx+a;估计使用年限为10年,维修费用是多少?[审题导引](1)根据对应值组成点的坐标,画出各点即可;直接套用求回归直线系数的公式,求出b,a;根据求出的回归直线方程,求当x=10时对应的y值,即使用年限为10年时,维修费用的估计值.[规范解答](1)作出散点图如图所示.和甘66.5,苧=32+42+52+62=86,x=4.5,y=3.5,66.5-466.5-4X4.5X3.586-4X4.5266.5-6386-81=0.7,a=-y-b-x=3.5-0.7X4.5=0.35,所以所求的回归方程为$=0.7x+0.35.(3)当x=10时,y=0.7X10+0.35=7.35,所以使用年限为10年,维修费用的估计值是7.35万元规律总结】求线性回归分析问题的方法

画出两个变量的散点图;求回归直线方程;用回归直线方程进行预报.其中求回归直线方程是关键.而求回归直线方程的最好方法是“最小二乘法",即对于线性回归模型y=a+bx来说,估计模型中的未知参数a和b的最好方法就是用最小二乘法,其计算公式为£(兀厂兀)(y厂y)b=i一i 〜好方法就是用最小二乘法,其计算公式为£(x--x)2i=1 i£nxiy£nxiyi-nx[易错提示]虽然由任何一组不完全相同的数据都可以求出回归直线方程,但只有具有线性相关关系的一组数据才能得到有意义的回归直线方程,求出的方程才具有实际价值.线性相关系数可以是正、负或零,线性相关系数为正时是正相关,为负时是负相关,反之也成立.变式训练】(2012・深圳模拟)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.TOC\o"1-5"\h\z零件数%(个) 10 20 30 40 50加工时间y(min) 62 75 81 89现发现表中有一个数据模糊看不清,请你推断出该数据的值为 .解析由表知丁=30,设模糊不清的数据为y,-1 307+y贝Uy=5(62+y+75+81+89)= 5—,Ty=0.67x+54.9,307+y即一=0.67X30+54.9,解得y=68.答案68考点四:独立性检验【例4】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下列联表.优秀非优秀总计甲班10乙班30合计1052已知在全部105人中随机抽取1人为优秀的概率为7・请完成上面的列联表.根据列联表中的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”?若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.2[审题导引]第(I)问由题易知成绩优秀的概率是7,则成绩优秀的学生数是30,成绩非优秀的学生数是75,据此即可以完成列联表;第(2)问按照独立性检验的原理进行判断;第(3)问列举基本事件个数和随机事件含有的基本事件个数,按照古典概型的概率公式进行计算.[规范解答](1)列联表如表所示优秀非优秀总计甲班104555乙班203050合计3075105(2)根据列联表中的数据,得到k丿驾為咒餘4"^6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y).所有的基本事件有(1,1),(1,2),„(6,6),共36个.事件A包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,故82P(A)=^=9-【规律总结】独立性检验的一般步骤根据样本数据列出2X2列联表,假设两个变量无关系;

5.(2012•南京模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2X2列联表,根据列联表的数据,可以有 %的把握认为该学校15至16周岁的男生的身高和体重之间有关系.招重不招重合计偏高415不偏高31215合计71320独立性检验临界值表:P(K2三k)00.0250.0100.0050.001k05.0246.6357.87910.828独立性检验随机变量K2值的计算公式:_ n(ad-bc)2K (a+b)(c+d)(a+c)(b+d)°解析k=2¥4X12;3X1"=5.934,根据临界值表可知有97.5%的把握认为5X15X7X13该学校15至16周岁的男生的身高和体重之间有关系.答案97.5名师押题高考【押题1】根据下面频率分布直方图(如图所示)估计样本数据的中位数、众数分别为A.12.5,12.5 B.13,12.5C.12.5,13 D.14,12.5解析中位数是位于中间的数,故中位数是13,众数是12.5,中位数把图形的面积一分为二.答案B[押题依据]高考要求考生能通过样本的分布估计总体的分布;根据样本的特征

数估计总体的特征数,考查考生的读图能力、概括能力,故押此题.【押题2】某高校从参加今年自主招生考试的学生中随机抽取50名学生的成绩作为样本,得频率分布表如下:组号分组频数频率第一组[230,235)0.16第二组[235,240)①0.24第三组[240,245)15②第四组[245,250)100.20第五组[250,255]50.10合计501.00写出表中位置①②处的数据;为了选拔更优秀的学生,高校决定在第三、四、五组中用分层抽样法抽取6名学生进行第二轮考核,分别求出第三、四、五组参加考核的人数;在(2)的前提下,高校决定在这6名学生中录取2名学生,求2人中至少有1人在第四组中的概率.解析(1)由题知位置①的数据是50X0.24=12,位置②的数据是50=0.30.(2)第三组参加考核的人数为3^X6=3;第四组参加考核的人数为30X6=2;第五组参加考核的人数为30X6=1.(3)设第三组的3名学生为A、B、C,第四组的2名学生为D、E,第五组的1名学生为F,则从这6名学生中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论