版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.本章回顾本章回顾 本章介绍了从总体中抽取样本的常用方法,并通过本章介绍了从总体中抽取样本的常用方法,并通过实例,研究了如何利用样本对总体的分布规律、整体实例,研究了如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测水平、稳定程度及相关关系等特性进行估计和预测总体总体抽样抽样分析分析估计估计简单随机抽样简单随机抽样 系系 统统 抽抽 样样 分分 层层 抽抽 样样 样样 本本 分分 布布样样 本本 特特 征征 数数 总总 体体 分分 布布 总总 体体 特特 征征 数数.说明:说明:1.抽样公平性原则抽样公平性原则等概率等概率随机性;随机性;2.抽签法适用与总体中个数抽
2、签法适用与总体中个数N不大的情形不大的情形.1.将总体中的所有个体编号(号码可以从到将总体中的所有个体编号(号码可以从到 );2.将到将到 这这 个号码写在形状、大小相同的号签上个号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作);(号签可以用小球、卡片、纸条等制作);3.将号签放在同一箱中,并搅拌均匀;将号签放在同一箱中,并搅拌均匀;4.从箱中每次抽出个号签,并记录其编号,连续抽从箱中每次抽出个号签,并记录其编号,连续抽取次;取次;5.从总体中将与抽到的签的编号相一致的个体取出从总体中将与抽到的签的编号相一致的个体取出.2.1 2.1 抽样方法抽样方法1.简单随机抽样简单随机
3、抽样()抽签法()抽签法.例题例题1 系统抽样(等距抽样)系统抽样(等距抽样) 例子例子. 为了解高一年级为了解高一年级500名同学的视力情况,试用系名同学的视力情况,试用系统抽样从中抽取统抽样从中抽取50名同学进行检查。名同学进行检查。S1:把:把500人从人从1到到500编号;编号;S3:在第一段:在第一段110号中用的号中用的 的方法的方法 抽取一个号码,比如抽取一个号码,比如3;S4:依次抽取:依次抽取 这这50个号码。个号码。这样就得到了一个容量为这样就得到了一个容量为50的样本。的样本。S2:计算分段间隔为:计算分段间隔为 k= 人。把编号从小人。把编号从小 到大依次分成到大依次分
4、成 段,每段段,每段 人;人;编号编号分段分段定首号定首号取余号取余号501050050=10.2.1 抽样方法(2).随机数表法:随机数表法:将总体中的将总体中的N个个体编号时可以从个个体编号时可以从0开始,例如当开始,例如当N=100时时,编号可以是编号可以是00,01,02, ,99.这样,总体中的所有个体均可用两位这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表数字号码表示,便于使用随机数表 当随机地选定开始的数后,读数的方向可以向右,也可以向当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:左、向上、向下等由此可
5、见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()在随机数表中任选一个数作为开始;()从选定的数开始按一定的方向读下去,得到的数码()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满的号码前面已经取出,也跳过;如此继续下去,直到取满为止;为止;()根据选定的号码抽取样本()根据选定的号码抽取样本.将总体中的将总体中的N个个体编号时可
6、以从个个体编号时可以从0开始,例如当开始,例如当N=100时时,编号可以是编号可以是00,01,02, ,99.这样,总体中的所有个体均可用两位这样,总体中的所有个体均可用两位数字号码表示,便于使用随机数表数字号码表示,便于使用随机数表 当随机地选定开始的数后,读数的方向可以向右,也可以向当随机地选定开始的数后,读数的方向可以向右,也可以向左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:左、向上、向下等由此可见,用随机数表法抽取样本的步骤是:()对总体中的个体进行编号(每个号码位数一致);()对总体中的个体进行编号(每个号码位数一致);()在随机数表中任选一个数作为开始;()在随机数表
7、中任选一个数作为开始;()从选定的数开始按一定的方向读下去,得到的数码()从选定的数开始按一定的方向读下去,得到的数码若不在编号中,则跳过;若在编号中,则取出;如果得到若不在编号中,则跳过;若在编号中,则取出;如果得到的号码前面已经取出,也跳过;如此继续下去,直到取满的号码前面已经取出,也跳过;如此继续下去,直到取满为止;为止;()根据选定的号码抽取样本()根据选定的号码抽取样本.例子:下面我们用随机数表法求解本节开头的问题下面我们用随机数表法求解本节开头的问题()对()对50个同学进行编号,编号分别为个同学进行编号,编号分别为01,02,03,50; ()在随机数表中随机地确定一个数作为开始
8、,如第行第()在随机数表中随机地确定一个数作为开始,如第行第29列的列的数开始为便于说明,我们将附表中的第行至第行摘录如下:数开始为便于说明,我们将附表中的第行至第行摘录如下: 16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44
9、39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28 第第29列列第行第行()从数开始向右读下去,每次读两位,凡不在()从数开始向右读下去,每次读两位,凡不在01到到50中的数跳过中的数跳过去不读,遇到已经读过的数也跳过去,便可依次得到去不读,遇到已经读过的数也跳过去,便可依次得到12,07,44,39,38,33,21,34,2
10、9,42这这10个号码,就是所要抽取的个号码,就是所要抽取的10个样本个体的号码个样本个体的号码.小结:小结:1.抽样无放回;抽样无放回;2.抽样公平性;抽样公平性;3.抽签法,随机数表法抽签法,随机数表法简单的随机抽样简单的随机抽样.系统抽样的步骤为:系统抽样的步骤为:()采用随机的方式将总体中的个体编号;()采用随机的方式将总体中的个体编号;()将整个的编号按一定的间隔(设为()将整个的编号按一定的间隔(设为k)分段,)分段,当当 (N为总体中的个体数,为总体中的个体数,n为样本容量)是整数为样本容量)是整数时,时,k= ;当;当 不是整数时,从总体中剔除一些个不是整数时,从总体中剔除一些
11、个体,使剩下的总体中个体的个数体,使剩下的总体中个体的个数能被能被 整除,这整除,这时时k= ,并将剩下的总体重新编号;,并将剩下的总体重新编号;()在第一段中用简单随机抽样确定起始的个体编()在第一段中用简单随机抽样确定起始的个体编号号l ;()将编号为()将编号为l l , l l +k,l l +2k, l l +(n-1)k的个的个体抽出体抽出NnNnNn1Nn2.系统抽样:系统抽样:.第四步将编号为第四步将编号为 , +10, +20, , +610 的个体抽出,组成样本的个体抽出,组成样本第三步在第一段第三步在第一段000,001,002,009这十这十个编号中用简单随机抽样确定起
12、始号码个编号中用简单随机抽样确定起始号码 ; 因为因为624的的10约为约为62,624不能被不能被62整除,为整除,为了保证了保证“等距等距”分段,应先剔除人分段,应先剔除人例;例; 某单位在岗职工共某单位在岗职工共624人,为了调查工人用于上班途人,为了调查工人用于上班途中的时间,决定抽取中的时间,决定抽取10的工人进行调查如何采用系统的工人进行调查如何采用系统抽样方法完成这一抽样?抽样方法完成这一抽样?0i分析分析:第一步将第一步将624名职工用随机方式进行编号;名职工用随机方式进行编号;解:解:第二步从总体中剔除人(剔除方法可用随机数第二步从总体中剔除人(剔除方法可用随机数表法),将剩
13、下的表法),将剩下的620名职工重新编号(分别为名职工重新编号(分别为000,001,002,619),并分成),并分成62段;段;0i0i0i0i.小结:小结:1.适用与总体中个体无明显的层次差异适用与总体中个体无明显的层次差异;2.系统抽样系统抽样等距抽样等距抽样. 一般地,当总体由差异明显的几个部分组成时,一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样然后按各部分在
14、总体中所占的比实施抽样,这种抽样方法叫方法叫分层抽样分层抽样(stratified sampling),其中所分),其中所分成的各个部分称为成的各个部分称为“层层”分层抽样的步骤是:分层抽样的步骤是:()将总体按一定标准分层;()将总体按一定标准分层;()计算各层的个体数与总体的个体数的()计算各层的个体数与总体的个体数的比;比;()按各层个体数占总体的个体数的比确定()按各层个体数占总体的个体数的比确定各层应抽取的样本容量;各层应抽取的样本容量;()在每一层进行抽样(可用简单随机抽样()在每一层进行抽样(可用简单随机抽样或系统抽样)或系统抽样).3.分层抽样分层抽样例某电视台在因特网上就观众
15、对某一节目的喜爱例某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为程度进行调查,参加调查的总人数为1200人,其中人,其中持各种态度的人数如下表所示:持各种态度的人数如下表所示:很喜爱喜爱一般不喜爱2435456739261072电视台为进一步了解观众的具体想法和意见,打算从电视台为进一步了解观众的具体想法和意见,打算从中抽取中抽取60人进行更为详细的调查,应怎样进行抽样?人进行更为详细的调查,应怎样进行抽样?分析:分析:因为总体中人数较多,所以不宜采用简单随机因为总体中人数较多,所以不宜采用简单随机抽样又由于持不同态度的人数差异较大,故也不宜抽样又由于持不同态度的人数
16、差异较大,故也不宜用系统抽样方法,而以分层抽样为妥用系统抽样方法,而以分层抽样为妥.说明:说明:1.适用与总体中个体有明显的层次差异,层次适用与总体中个体有明显的层次差异,层次分明的特点;分明的特点;2.总体中个体数总体中个体数 N较大时,系统抽样,分层抽样较大时,系统抽样,分层抽样二者选其一二者选其一.类别类别特点特点相互联系相互联系适用范围适用范围共同点共同点简单随简单随机抽样机抽样l从总体中逐个从总体中逐个抽取抽取l总体中总体中的个体个的个体个数较少数较少l抽样抽样过程中过程中每个个每个个体被抽体被抽到的可到的可能性相能性相同同系统系统抽样抽样l将总体平均分将总体平均分成几部分,按事成几
17、部分,按事先确定的规则分先确定的规则分别在各部分中抽别在各部分中抽取取l在起始部在起始部分抽样时,分抽样时,采用采用 简简 单随单随机抽样机抽样l总体中总体中的的 个体个体个数较多个数较多分层分层抽样抽样l将总体分成几将总体分成几层,按各层个体层,按各层个体数之比抽取数之比抽取l各层抽样时各层抽样时采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样l总体由总体由差差 异明异明显的显的 几几部分组成部分组成 以上我们学习了三种抽样方法,这些抽样方法以上我们学习了三种抽样方法,这些抽样方法的特点及适用范围可归纳如下:的特点及适用范围可归纳如下:.3.某校有行政人员、教学人员和教辅某校有行政人员、
18、教学人员和教辅人员共人员共200人,其中教学人员与教辅人,其中教学人员与教辅人员的比为人员的比为10 1,行政人员有,行政人员有24人,人,现采取分层抽样容量为现采取分层抽样容量为50的样本,那的样本,那么行政人员应抽取的人数为么行政人员应抽取的人数为 ( )A 3 B 4 C 6 D 8C教学人员和教辅人员应抽取的人数教学人员和教辅人员应抽取的人数分别为分别为_和和_.404.用样本估计总体用样本估计总体 1.作样本频率分布直方图的步骤作样本频率分布直方图的步骤:(1 1)求极差;)求极差;(2 2)决定组距与组数)决定组距与组数; (; (组数极差组数极差/ /组距组距) ) (3 3)将
19、数据分组;)将数据分组;(4 4)列频率分布表(分组,频数,频率);)列频率分布表(分组,频数,频率);(5 5)画频率分布直方图。)画频率分布直方图。.例子:例子: 2009年义乌小商品博览会共设国际标准展位年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取个。为了解展览期间成交状况,现从中抽取100展展位的成交额(万元),制成如下频率分布表和频率分布位的成交额(万元),制成如下频率分布表和频率分布直方图:直方图:频率频率/组距组距150 170 190 210 230 2500.0060.0100.0140.0180.0220.026万元万元0.040.050
20、.360.500.05.例子:例子: 2009年义乌小商品博览会共设国际标准展位年义乌小商品博览会共设国际标准展位5000个。为了解展览期间成交状况,现从中抽取若干展个。为了解展览期间成交状况,现从中抽取若干展位的成交额(万元),制成如下频率分布表和频率分布位的成交额(万元),制成如下频率分布表和频率分布直方图:直方图:频率频率/组距组距150 170 190 210 230 2500.0060.0100.0140.0180.0220.026万元万元0.040.050.360.500.05(1 1)众数;)众数;(2 2)中位数;)中位数;(3 3)平均数;)平均数;最高矩形区间中点最高矩形区
21、间中点面积相等(概率面积相等(概率0.5)区间中点与相应概率区间中点与相应概率之积的和之积的和.小结:小结:1.频率直方图中矩形条的面积频率直方图中矩形条的面积= 组距组距=频率;频率;2.频率分布表频率分布表 频率直方图频率直方图 后者更直观后者更直观形象地反映样本的分布规律形象地反映样本的分布规律.频率组距.2.3 总体特征数的估计1.平均数平均数12naaaan2.方差,标准差方差,标准差设一组样本数据设一组样本数据 ,其平均数为其平均数为 ,则称,则称12,nxxxx2211()niisxxn211()niisxxn为这个样本的方差,其算术平方根为这个样本的方差,其算术平方根 为样本的
22、标准差为样本的标准差,分别简称样本方差、样本标准差分别简称样本方差、样本标准差小结:小结:1.方差,标准差是用来刻画样本的稳定性;方差,标准差是用来刻画样本的稳定性;2.比较的标准比较的标准越小越好。越小越好。.例:甲、乙两种冬水稻试验品种连续例:甲、乙两种冬水稻试验品种连续5年的平均单位年的平均单位面积产量如下(单位:面积产量如下(单位:t/hm2 ),试根据这组数据),试根据这组数据估计哪一种水稻品种的产量比较稳定估计哪一种水稻品种的产量比较稳定品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8.2.4线性相关关系线性相关关系: 能用直线方程能用直线方程 ybxa近似表示的相关关系叫做近似表示的相关关系叫做线性相关关系线性相关关系.x1x2x3xnxy1y2y3yny线性回归方程线性回归方程:一般地一般地,设有设有n个观察数据如下:个观察数据如下:2221122()().()nnQybxaybxaybxa ybxa当当a,b使使取得最小值时取得最小值时,就称就称这这n对数据的对数据的线性回归方程线性回归方程,该方程所表该方程所表示的直线称为示的直线称为回归直线回归直线.为拟合为拟合._y25x81. 05x. 0y. 1的的估估计计值值为为时时,则则已已知知回回归
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《克龄蒙围绝经期》课件
- 物业工程部2024年度工作计划
- 小学体育教师教学计划
- 教师培训工作计划格式
- 幼儿园春季早教工作计划
- 经典幼儿园一日活动计划设计方案
- 医院年度安全生产工作计划医院安全生产的工作计划
- 初中八年级语文上册教学工作计划规划方案
- 四年级安全教育工作计划范例
- 疫情期间复学工作保障计划汇报
- 北京市西城区2023-2024学年七年级上学期期末数学试题
- 2024年江苏省环保集团招聘笔试参考题库含答案解析
- 【数字媒体艺术的应用国内外文献综述2500字】
- 【山姆会员店客户关系管理现状、问题及优化建议分析4900字(论文)】
- 《笔袋自己理》-小学一年级综合实践课件
- 《故都的秋》《荷塘月色》联读课件 统编版高中语文必修上册
- 电气基础知识考试题库(完整版)
- 计算机辅助设计AutoCAD绘图-课程教案
- 医药信息工程职业生涯规划书
- 《世说新语》两则《咏雪》、《陈太丘期友》
- 培训课程开发流程管理SOP(完整版)
评论
0/150
提交评论