高三数学复习优秀课件《统计》_第1页
高三数学复习优秀课件《统计》_第2页
高三数学复习优秀课件《统计》_第3页
高三数学复习优秀课件《统计》_第4页
高三数学复习优秀课件《统计》_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计统计一词有三方而含义:一词有三方而含义:()()统计工作统计工作。指搜集、整理和分析客观事物总体。指搜集、整理和分析客观事物总体数量方面资料的工作过程,是统计的基础。数量方面资料的工作过程,是统计的基础。()()统计资料统计资料。统计工作所取得的各项数字资料及。统计工作所取得的各项数字资料及有关文字资料,一般反映在统计表、统计图、统计手有关文字资料,一般反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。册、统计年鉴、统计资料汇编和统计分析报告中。()()统计科学统计科学。研究如何搜集、整理和分析统计资。研究如何搜集、整理和分析统计资料的理论与方法。料的理论与方法。统计

2、工作、统计资料、统计科学三者之间的关系是:统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。概括,又是指导统计工作的原理、原则和方法。 统计的意义统计的意义 抽样抽样(sampling)又称)又称取样取样。从欲。从欲研究研究的的全部全部样品样品中抽取一部分样品单位。其基本要求中抽取一部分样品单位。其基本要求是要保证所是要保证所抽取抽取的样品单位对全部样品具有充的样品单位对全部

3、样品具有充分的代表性。抽样的分的代表性。抽样的目的目的是从被抽取样品单位是从被抽取样品单位的的分析分析、研究结果来、研究结果来估计估计和和推断推断全部样品全部样品特性特性,是是科学实验科学实验、质量检验质量检验、社会调查社会调查普遍采用的普遍采用的一种一种经济经济有效的有效的工作工作和研究和研究方法方法。3.假设某地区有高中生假设某地区有高中生2400人,初中生人,初中生10900人,小学生人,小学生11000人,此地教育部门为了了解人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要本地区中小学的近视情况及其形成原因,要从本地区的学生中抽取从本地区的学生中抽取1%的学生进行调查,的

4、学生进行调查,你认为应当怎样抽取样本?你认为应当怎样抽取样本?2. 2. 某校小礼堂举行心理讲座某校小礼堂举行心理讲座, ,有有500500人参加听人参加听课课, ,坐满小礼堂,现从中选取坐满小礼堂,现从中选取2525名同学了解有名同学了解有关情况关情况, ,选取怎样的抽样方式更为合适选取怎样的抽样方式更为合适. .1. 1. 从从1010台电冰箱中抽取台电冰箱中抽取3 3台进行质量检查;台进行质量检查;下列问题中,该怎样的抽样?下列问题中,该怎样的抽样?简单随机抽样简单随机抽样(Simple random sampling) 也称也称为为单纯随机抽样单纯随机抽样、纯随机抽样、纯随机抽样、SP

5、SSPS抽样抽样 ,是指从总体是指从总体N N个单位中任意抽取个单位中任意抽取n n个单位作为个单位作为样本样本, ,使每个可能的样本被抽中的概率相等使每个可能的样本被抽中的概率相等的一种抽样方式。的一种抽样方式。 简单随机抽样的具体作法有:简单随机抽样的具体作法有: 抽签法抽签法。将总体的全部单位逐一作签,搅拌均匀。将总体的全部单位逐一作签,搅拌均匀后进行抽取。后进行抽取。 随机数字表法随机数字表法。将总体所有单位编号,然后从随。将总体所有单位编号,然后从随机数字表中一个随机起点机数字表中一个随机起点( (任一排或一列任一排或一列) ),开始从左,开始从左向右或从右向左、向上或向下抽取,直到

6、达到所需的样向右或从右向左、向上或向下抽取,直到达到所需的样本容量为止。本容量为止。 简单随机抽样的必须有一个完整的抽样简单随机抽样的必须有一个完整的抽样框,即总体各单位的清单。总体太大时,制框,即总体各单位的清单。总体太大时,制作这样的抽样框工作量巨大,加之有许多情作这样的抽样框工作量巨大,加之有许多情况,使总体名单根本无法得到。故在大规模况,使总体名单根本无法得到。故在大规模社会调查中很少采用纯随机抽样。社会调查中很少采用纯随机抽样。 简单随机抽样最基本的抽样方法。分为重简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。复抽样和不重复抽样。 系统抽样系统抽样(Systematic s

7、ampling )也称为)也称为等距抽样、机械抽样、等距抽样、机械抽样、SYSSYS抽样,它是首先将总抽样,它是首先将总体中各单位按一定顺序排列体中各单位按一定顺序排列, ,根据样本容量要求根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。间隔抽取一个单位的一种抽样方式。 系统抽样的步骤:系统抽样的步骤:先将总体从先将总体从1 1N N相继编号,相继编号,并计算抽样距离并计算抽样距离K=N/nK=N/n。式中。式中N N为总体单位总数,为总体单位总数,n n为样本容量。然后在为样本容量。然后在1 1K K中抽一随

8、机数中抽一随机数k1,作,作为样本的第一个单位,接着取为样本的第一个单位,接着取k1K,K,k1+2K+2K,直至抽够直至抽够n n个单位为止。个单位为止。 说明说明(1 1)当总体容量)当总体容量N N较大时,采用系统抽样。较大时,采用系统抽样。(2 2)将总体分成均衡的若干部分指的是将总)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为抽样又称等距抽样,这时间隔一般为k k n nN N (3 3)预先制定的规则指的是:在第)预先制定的规则指的是:在第1 1段内采段内采用简单随机抽样确定一个起始编

9、号,在此编用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样号的基础上加上分段间隔的整倍数即为抽样编号。编号。当总体中的个体数正好能被样本容量整除,当总体中的个体数正好能被样本容量整除,可以用它们的比值作为进行系统抽样的间隔可以用它们的比值作为进行系统抽样的间隔如果不能整除,那应该怎么办,使在整个抽如果不能整除,那应该怎么办,使在整个抽样过程中,每个个体被抽取的概率相等?样过程中,每个个体被抽取的概率相等?(4)可用简单随机抽样,先从总体中剔除)可用简单随机抽样,先从总体中剔除余数部分的个体,使剩下的个体数能被样本余数部分的个体,使剩下的个体数能被样本容量整除,然后再

10、按照系统抽样方法往下进容量整除,然后再按照系统抽样方法往下进行行分层抽样分层抽样(stratified sampling)先将总体的)先将总体的单位按某种特征分为若干次级总体(层),单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯然后再从每一层内进行单纯随机抽样随机抽样,组成,组成一个一个样本样本。例如,一个单位的职工有例如,一个单位的职工有500人,其中不到人,其中不到35岁有岁有125人,人,35岁至岁至49岁的有岁的有280人,人,50岁以上的有岁以上的有95人人. 为了了解这个单位职工与身体状况有关的某项为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为指

11、标,要从中抽取一个容量为100的样本,由于职的样本,由于职工年龄与这项指标有关,应采用分层抽样方法进行工年龄与这项指标有关,应采用分层抽样方法进行抽取抽取.二、分层抽样的步骤:二、分层抽样的步骤:(1 1)分层分层:将总体按某种特征分成若干部分。:将总体按某种特征分成若干部分。(2 2)确定比例确定比例:计算各层的个体数与总体的:计算各层的个体数与总体的个体数的比。个体数的比。(3 3)确定)确定各层各层应应抽抽取的取的样本样本容量。容量。(4 4)在每一层进行抽样(各层分别按简单随)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),机抽样或系统抽样的方法抽取),综合综合每层抽每

12、层抽样,样,组成样本组成样本。练习练习:某校高一、高二和高三年级分别有学生:某校高一、高二和高三年级分别有学生10001000,800800,700700名,为了了解全校学生的名,为了了解全校学生的视力情况,从中抽取容量为视力情况,从中抽取容量为100100的样本,怎样的样本,怎样抽取较为合理?抽取较为合理? 应用分层抽样应遵循以下要求:应用分层抽样应遵循以下要求: (1 1)分层:将相似的个体归人一类,即为一层,)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。不遗漏的原则。 (2 2)分层抽样为

13、保证每个个体等可能入样,需)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比每层个体数量的比与这层个体数量与总体容量的比相等。相等。 三种抽样方法的比较三种抽样方法的比较类别类别各自特点各自特点相互联系相互联系适用范围适用范围简单随机简单随机抽样抽样系统系统抽样抽样分层分层抽样抽样从总体中从总体中逐个抽取逐个抽取将总体均分成将总体均分成几部分,按事几部分,按事先确定的规则先确定的规则在各部分抽取在各部分抽取将总体分成将总体分成几层,分层几层,分层进行抽取进行抽取在起始部分在起

14、始部分抽样时采用抽样时采用简单随机抽简单随机抽样样各层抽样时各层抽样时采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样总体中的总体中的个体数较个体数较少少总体中的总体中的个体数较个体数较多多总体由差总体由差异明显的异明显的几部分组几部分组成成共同点共同点: :(1 1)抽样过程中每个个体被)抽样过程中每个个体被抽到抽到的的可能性相等可能性相等(2 2)每次抽出个体后不再将它放回,即)每次抽出个体后不再将它放回,即不放回不放回抽样抽样 平均数平均数12111()niniXXXXXnn 样本中各数据与样本平均数的差的平样本中各数据与样本平均数的差的平方和的平均数叫做方和的平均数叫做样本方差样本

15、方差;样本方差的算;样本方差的算数平方根叫做数平方根叫做样本标准差样本标准差。方差和标准差方差和标准差 样本方差和样本标准差都是衡量一个样本样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。样本数据的波动就越大。 方差和标准差是测算离散趋势最重要、最方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的方的平均数,它是测算数值型数据离散程度的最重要的方法。最重要的方法。 众数(众数(Mode):是一组数据中

16、出现次数最):是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有多的数值,叫众数,有时众数在一组数中有好几个。用好几个。用M表示。简单的说,就是一组数表示。简单的说,就是一组数据中占比例最多的那个数。据中占比例最多的那个数。 众数众数中位数中位数(Median):将数据排序后,位置在):将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。大于该数值,一部分小于该数值。中位数的位置中位数的位置:当样本数为奇数时,中位数:当样本数为奇数时,中位数=第第(N+1)/2个数据个数据 ; 当样本数为偶数时,中位当样本

17、数为偶数时,中位数为第数为第N/2个数据与第个数据与第N/2+1个数据的算术平个数据的算术平均值。均值。 中位数中位数 我们称每个对象出现的次数为我们称每个对象出现的次数为频数频数,也,也称次数。称次数。 在一组依大小顺序排列的测量值中,当在一组依大小顺序排列的测量值中,当按一定的组距将其分组时出现在各组内的测按一定的组距将其分组时出现在各组内的测量值的数目,即落在各类别(分组)中的数量值的数目,即落在各类别(分组)中的数据个数。据个数。频数与频率频数与频率 一般我们称落在不同小组中的数据个数为该组一般我们称落在不同小组中的数据个数为该组的频数,频数与总数的比为的频数,频数与总数的比为频率频率

18、。 例如:例如: 在在10次掷硬币中,有次掷硬币中,有4次正面朝上,次正面朝上,我们说这我们说这10次试验中次试验中正面朝上正面朝上的频数是的频数是 ,频率是,频率是 。一一、求极差求极差,即数据中最大值与最小值的差;即数据中最大值与最小值的差;二、二、决定组距与组数决定组距与组数 :组数:组数=极差极差/组距;组距;三、三、将数据分组将数据分组,通常对组内数值所在区间;通常对组内数值所在区间;取取左闭右开左闭右开区间区间 , 最后一组取闭区间;最后一组取闭区间;四、四、列频率分布表列频率分布表(登记登记频数频数,计算计算频率频率);2.2.作频率分布直方图的步骤:作频率分布直方图的步骤:五、

19、五、画频率分布直方图画频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)。)。如:如:1212,1515,2424,2525,3131,3131,3636,3636,3737,3939,4444,4949,5050 所有的十位数:所有的十位数: 作为树枝的茎作为树枝的茎 所有的个位数:所有的个位数: 作为树枝的叶作为树枝的叶 1 1 枝节上的叶为枝节上的叶为_ 2 2 枝节上的叶为枝节上的叶为_ 3 3 枝节上的叶为枝节上的叶为 _ _ 4 4 枝节上的叶为枝节上的叶为_ 5 5 枝节上的叶为枝节上的叶为_ 2,54,51,1,6,6,7,94,903.茎叶图茎叶图12345叶:表示个位数字

20、叶:表示个位数字茎:表示十位数字茎:表示十位数字将所有两位数的将所有两位数的十位数字作为十位数字作为“茎茎”,个位数,个位数字作为字作为“叶叶”,茎相同者共用一茎相同者共用一个茎,茎按从小个茎,茎按从小到大的顺序从上到大的顺序从上向下列出,共茎向下列出,共茎的叶一般按从小的叶一般按从小到大(或从大到到大(或从大到小)的顺序同行小)的顺序同行列出列出.2545116679490分界线分界线例题分析: 1 1、甲、乙两篮球运动员上赛季每场比赛得分、甲、乙两篮球运动员上赛季每场比赛得分如下,试比较这两位运动员的得分水平。如下,试比较这两位运动员的得分水平。 甲:甲:1313,5151,2323,8

21、8,2626,3838,1616,3333, 1414,28, 3928, 39 乙:乙:4949,2424,1212,3131,5050,3131,4444,3636, 1515,3737,25, 36, 3925, 36, 39茎叶图茎叶图甲甲乙乙0123452 55 41 6 1 6 7 94 9 084 6 33 6 83 8 91叶就是从茎的旁边叶就是从茎的旁边生长出来的数,表生长出来的数,表示得分的个位数。示得分的个位数。 茎是指中间的茎是指中间的一列数,表示一列数,表示得分的十位数得分的十位数某赛季甲、乙两名篮球运动员每场比赛得分的原始记录某赛季甲、乙两名篮球运动员每场比赛得分的

22、原始记录如下:如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分乙运动员得分: 49, 24, 12, 31, 50,31,44,36,15,37,25,36,392、在样本数据较少时,用茎叶图表示数据的效果较、在样本数据较少时,用茎叶图表示数据的效果较 好。它不但可以保留所有信息,而且可以随时纪好。它不但可以保留所有信息,而且可以随时纪 录,这对数据的纪录和表示都能带来方便。录,这对数据的纪录和表示都能带来方便。 茎叶图的特点茎叶图的特点1、茎叶图不仅能够保留原始数据,而且能够展示、茎叶图不仅能够保留原始数据,而且能够展示 数据的分布

23、情况。数据的分布情况。3、但当样本数据较多时,茎叶图就显得不太方便。、但当样本数据较多时,茎叶图就显得不太方便。 因为每一个数据都要在茎叶图中占据一个空间,因为每一个数据都要在茎叶图中占据一个空间, 如果数据很多,枝叶就会很长。如果数据很多,枝叶就会很长。例一: 为了了解高一学生的体能情为了了解高一学生的体能情况况,某校抽取部分学生进行某校抽取部分学生进行一分钟跳绳次数次测试,将一分钟跳绳次数次测试,将所得数据整理后,画出频率所得数据整理后,画出频率分布直方图分布直方图(如图如图),图中从,图中从左到右各小长方形面积之比左到右各小长方形面积之比为为2:4:17:15:9:3,第二小组频数为第二

24、小组频数为12.(1)第二小组的频率是多少?)第二小组的频率是多少? 样本容量是多少?样本容量是多少?(2)若次数在)若次数在110以上(含以上(含110次)为达标,试估计该次)为达标,试估计该学校全体高一学生的达标率学校全体高一学生的达标率是多少?是多少?次数次数 90 100 110 120 130 140 150 0.0040.0080.0160.0120.200.0240.0280.0320.036频率频率/组距组距例二:例二: 下面一组数据是某生产车间下面一组数据是某生产车间30名工人某日加工零名工人某日加工零件的个数,请设计适当的茎叶图表示这组数据,件的个数,请设计适当的茎叶图表示

25、这组数据,并由图出发说明一下这个车间此日的生产情况。并由图出发说明一下这个车间此日的生产情况。 134 112 117 126 128 124 122 116 113 107 116 132 127 128 126 121 120 118 108 110 133 130 124 116 117 123 122 120 112 112 相关分析相关分析(correlation analysis),),是研究现象之间是否存在某种依存关系,并是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关及相关程

26、度,是研究随机变量之间的相关关系的一种统计方法。系的一种统计方法。 线性回归方程线性回归方程 变量的相关关系中最为简单的是线性相关变量的相关关系中最为简单的是线性相关关系关系,设随机变量设随机变量x与变量与变量y之间存在线性相关之间存在线性相关关系关系,则由试验数据得到的点则由试验数据得到的点(x,y)将散布在某一将散布在某一直线周围直线周围,因此因此,可以认为关于的回归函数的类可以认为关于的回归函数的类型为线性函数型为线性函数残差残差(residual)在在回归分析回归分析中,测定值与按中,测定值与按回归方程回归方程预预测的值之差,以测的值之差,以表示。残差表示。残差遵从遵从正态分布正态分布N(0,2)。研究两个变量间线性关系的程度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论