高二数学必修3《统计》课件_第1页
高二数学必修3《统计》课件_第2页
高二数学必修3《统计》课件_第3页
高二数学必修3《统计》课件_第4页
高二数学必修3《统计》课件_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学3(必修,统计,本章内容,本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测,总体,抽样,分析,估计,简单随机抽样,系 统 抽 样,分 层 抽 样,样 本 分 布,样 本 特 征 数,总 体 分 布,总 体 特 征 数,当总体容量大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计,这就是统计分析的基本过程而用样本估计总体就是统计思想的本质,要准确估计总体,必须合理地选择样本,我们学习的是最常用的三种抽样方法获取样本数据后,将其用频率分布表、频率直方图、频率折线图

2、或茎叶图表示后,蕴含于数据之中的规律得到直观的揭示运用样本的平均数可以对总体水平作出估计,用样本的极差、方差(标准差)可以估计总体的稳定程度,对两个变量的样本数据进行相关性分析,可发现存在于现实世界中的回归现象用最小二乘法研究回归现象,得到的线性回归方程可用于预测和估计,为决策提供依据,总之,统计的基本思想是从样本数据中发现统计规律,实现对总体的估计,2.1 抽样方法,1.简单随机抽样,抽签法,为了了解高一(1)班50名学生的视力状况,从中抽取10名学生进行检查如何抽取呢?通常使用抽签法,方法是:将50名学生从1到50进行编号,再制作到50的50个号签,把50个号签集中在一起并充分搅匀,最后随

3、机地从中抽10个号签对编号与抽中的号签的号码相一致的学生进行视力检查一般地,抽签法是从个体个数为 N的总体中抽取一个容量为k的样本的过程。其步骤为,说明,1.抽样公平性原则等概率随机性,2.抽签法适用与总体中个数N不大的情形,1.将总体中的所有个体编号(号码可以从到,2.将到 这 个号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作,3.将号签放在同一箱中,并搅拌均匀,4.从箱中每次抽出个号签,并记录其编号,连续抽取次,5.从总体中将与抽到的签的编号相一致的个体取出,2.1 抽样方法,2).随机数表法,下面我们用随机数表法求解本节开头的问题 ()对50个同学进行编号,编号分别为

4、01,02,03,50,在随机数表中随机地确定一个数作为开始,如第行第29列的数开始为便于说明,我们将附表中的第行至第行摘录如下,16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 3

5、4 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28,第29列,第行,从数开始向右读下去,每次读两位,凡不在01到50中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到,12,07,44,39,38,33,21,34,29,42,这10个号码,就是所要抽取的10个样本个体的号码,将总体中的N个个体编号时可以从0开始,例如当N=100时,编号可以是00,01,02,

6、,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表,当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等由此可见,用随机数表法抽取样本的步骤是,对总体中的个体进行编号(每个号码位数一致,在随机数表中任选一个数作为开始,从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止,根据选定的号码抽取样本,小结,1.抽样无放回,2.抽样公平性,3.抽签法,随机数表法简单的随机抽样,第四步将编号为 , +10, +20, , +610 的个体抽出,组成样本,第三步在第

7、一段000,001,002,009这十个编号中用简单随机抽样确定起始号码,因为624的10约为62,624不能被62整除,为了保证“等距”分段,应先剔除人,2.系统抽样,例 某单位在岗职工共624人,为了调查工人用于上班途中的时间,决定抽取10的工人进行调查如何采用系统抽样方法完成这一抽样,分析,第一步将624名职工用随机方式进行编号,解,第二步从总体中剔除人(剔除方法可用随机数表法),将剩下的620名职工重新编号(分别为000,001,002,619),并分成62段,系统抽样的步骤为,采用随机的方式将总体中的个体编号,将整个的编号按一定的间隔(设为k)分段,当 (N为总体中的个体数,n为样本

8、容量)是整数时,k= ;当 不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被 整除,这时k= ,并将剩下的总体重新编号,在第一段中用简单随机抽样确定起始的个体编号l,将编号为l , l +k,l +2k, l +(n-1)k的个体抽出,小结,1.适用与总体中个体无明显的层次差异,2.系统抽样等距抽样,3.分层抽样,例某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示,电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样,分析:因为总体中人数较多,所以不宜采用简单随机抽样又由于

9、持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥,解可用分层抽样方法,其总体容量为12000,很喜爱”占,喜爱”占,一般”占,不喜爱”占,因此,采用分层抽样的方法在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2435人、4567人、3926人和1072人中分别抽取12人、23人、20人和5人,一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样(stratified sampling),其中所分成的各个部分称为“层,分层抽样的步骤是,将

10、总体按一定标准分层,计算各层的个体数与总体的个体数的比,按各层个体数占总体的个体数的比确定各层应抽取的样本容量,在每一层进行抽样(可用简单随机抽样或系统抽样,说明,1.适用与总体中个体有明显的层次差异,层次 分明的特点,2.总体中个体数 N较大时,系统抽样,分层抽样 二者选其一,以上我们学习了三种抽样方法,这些抽样方法的特点及适用范围可归纳如下,例1下列问题中,采用怎样的抽样方法较为合理?()从台冰箱中抽取3台进行质量检查; ()某电影院有32排座位,每排有40个座位,座位号为140有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈; ()某学校有160名教职工,其中教

11、师120名,行政人员16名,后勤人员24名为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本,分析,总体容量比较小,用抽签法或随机数表法都很方便,总体容量比较大,用抽签法或随机数表法比较麻烦由于人员没有明显差异,且刚好排,每排人数相同,可用系统抽样,由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样方法,例2.假设要考察某公司生产的500克袋状牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽样本时,先将800袋牛奶按000,001,799进行编号,如果从随机表第8行第18列的数开始向右读,请你依次写出最先检测的5牛奶的编号 (下面摘取了一随

12、机数表的第7行至第9行,84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76,63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 62 58 79,73 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 06 13 42 99 66 02 79 54,1.现有以下两项调查:某装订厂平均每 小时大约装订图书362册,要求检验员每 小时抽取40册图书, 检查其装订质量状况; 某市

13、有大型、中型与小型的商店共1500 家, 三者数量之比为159为了调查全 市商店每日零售额情况,抽取其中15家进 行调查. 完成、这两项调查宜采用的 抽样方法依次是 ( ) A、简单随机抽样法,分层抽样法 B、分层抽样法,简单随机抽样法 C、分层抽样法,系统抽样法 D、系统抽样法,分层抽样法,D,2.要从已编号(160)的60枚最新 研制的某型导弹中随机抽取6枚来进 行发射试验, 用每部分选取的号码间 隔一样的系统抽样方法确定所选取 的6枚导弹的编号可能是 ( ) A5,10,15,20,25,30 B3,13,23,33,43,53 C1,2,3,4,5,6 D2,8,14,20,26,32

14、,B,3.某校有行政人员、教学人员和教辅 人员共200人,其中教学人员与教辅 人员的比为101,行政人员有24人, 现采取分层抽样容量为50的样本,那 么行政人员应抽取的人数为 ( ) A 3 B 4 C 6 D 8,C,教学人员和教辅人员应抽取的人数 分别为_和_,40,4,统计的基本思想方法,用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况,统计的核心问题,如何根据样本的情况对总体的情况作出一种推断. 这里包括两类问题,一类是如何从总体中抽取样本,另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断,用样本的有关情况去估计总

15、体的相应情况, 这种估计大体分为两类,一类是用样本频率分 布估计总体分布,一类是用样本的某种数字特 征(例如平均数、方差等)去估计总体的相应 数字特征,整体介绍,国际奥委会2003年6月29日决定,2008年北京奥运会举办的日期比原定日期推迟两周,改在8月8日至8月24日举行原因是7月末8月初北京地区得气温高于8月中下旬 下表是随机抽取的近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:C,怎样通过上表中的数据,分析比较两时间段的高温(33)状况呢,问题引入,知识新授,1.频数与频率,频数是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到频率,2.频率

16、分布表,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表,说明:样本频率分布与总体频率分布有什么关系? 通过样本的频数分布、频率分布可以 估计总体的频率分布,频率分布表,3.频率分布条形图,各长方形长条的宽度要相同. 相邻长条的间距要适当. 长方形长条的高度表示取各值的频率,一幅图胜过一千字,引例从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)试作出该样本的频率分布表,这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体.样本的频率分布表示形式有: 频率分布

17、表和频率分布直方图,S1 计算数据中最大值与最小值的差(极差),确定全距. S2 根据全距,决定组数和组距. S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数. S4 登记频数,计算频率,列出频率分布表,算法,1.频率分布表,S1 计算数据中最大值与最小值的差(极差),确定全距,极差18015129,全距30,取值区间150.5,180.5,组距和组数与数据的数量有关一般数据较多,分的组数也多;数据较少,分的组数也少当数据个数在50以内,分58组;当数据个数在50100之间,分812组应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有

18、数据,且每个数据只属于确定的一组在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来,S2 根据全距,决定组数和组距,组数10,组距3,S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数,4,8,8,11,22,19,14,7,4,3,0.04,0.08,0.08,0.11,0.22,0.19,0.14,0.07,0.04,0.03,4,12,20,31,53,72,86,93,97,100,100,1,练习,1.一个容

19、量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为( ) A2 B4 C6 D8,2.为了分析一次数学考试的情况,全班抽了50人,将分数分为5组第一组到第三组的频数分别是10,23,1,第四组的频率是0.08,那么落在第五组的频数是_,频率是_,全年级800人中分数落在第五组的约有_人,B,12,0.24,192,3.一个容量为20的样本数据,分组后组距与频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2。则样本在区间(10,50上的频率为( ) A.5% B.25% C.50% D.70,4.已知

20、样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为0.2的范围是( ) A.5.5-7.5 B.7.5-9.5 C.9.5-11.5 D.11.5-13.5,D,D,S1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵 轴表示“频率组距”; S2 把横轴分为若干段,每一线段对应一个组的组距, S3 以此线段为底作一矩形,它的高等于该组的频率/组距,这样得 出一系列的矩形,每个矩形的面积恰好是该组上的频率 这些矩形就构成了频率分布直方图 所有矩形的面积和为1,算法,2.频率分布直方图,177.5,身高cm,150.5,15

21、3.5,156.5,159.5,162.5,165.5,168.5,171.5,174.5,180.5,0.02,0.04,0.06,0.08,频率分布的条形图和频率分布直方图的区别,两者是不同的概念,横轴:两者表示内容相同,思考: 频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别,纵轴:两者表示的内容不相同,频率分布条形图的纵轴(长方形的高)表示频率,频率分布直方图的纵轴(长方形的高)表示频率与组距的比值.其相应组距上的频率等于该组距上长方形的面积,2.一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格,0.06,0.06,8,0.14,0.1

22、6,16,0.21,0.51,0.18,18,0.16,0.85,10,0.95,0.05,5,课堂小结,编制频率分布直方图的步骤,找最大值与最小值,决定组距与组数,决定分点,登记频数,计算频率,列表,画直方图,说明:(1)确定分点时,使分点比数据多一位小数,并且把第1小组的起点稍微再小一点,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组距=极差/组数,三、分组,通常对组内数值所在区间, 取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行,五、画出频率分布直方图(纵轴表示频率组距,频率分布直方图,应用

23、,1.求极差,2.决定组距与组数,3.将数据分组,4.列频率分布表,5.画频率分布直方图,小结,1.频率直方图中矩形条的面积= 组距=频率,2.频率分布表 频率直方图 后者更直观 形象地反映样本的分布规律,例 有同一型号的汽车100辆,为了解这种汽车每耗油1所行路程的情况,现从中随机抽出10辆在同一条件下进行耗油1所行路程试验,得到如下样本数据(单位:):13.7,12.7,14.4,13.8,13.3,12.5,13.5,13.6,13.1,13.4,并分组如下,1)完成上面频率分布表,2)根据上表在给定坐标系中画出频率分布直方图,并根据样本估计总体数据落在中的概率,3)据样本对总体的期望值

24、进行估计,10,10,1.甲、乙两种冬小麦试验品种连续5年的 平均单位面积产量如下(单位:,产量较高的是:_; 产量比较稳定的是:_,乙品种,甲品种,2. 在一次文艺比赛中,12名专业人员 和12名观众代表各组成一个评判小组, 给参赛选手打分,下面是两个评判组对 同一名选手的打分: 小组A:42 ,45 , 48 ,46 ,52 ,47 ,49 ,55 ,42 ,51 ,47 ,45; 小组B:55 ,36 ,70 ,66 ,75 ,49 ,46 ,68 ,42 ,62 ,58 ,47. 通过计算说明小组A、B哪个更像是由专 业人士组成的评判小组,A,3.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方 图(如下图),已知图中从左到右的前三个小组的频率分别是0.1,0.3,0.4.第一小组的频数是5,求第四小组的频率和参加这次测试的学生人数; (2) 在这次测试中,学生跳绳次数的中位数落在第几小组内,3) 参加这次测试跳绳次

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论