




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
basic business statistics, 11e 2009 prentice-hall, inc.,chap 7-1,第7章 抽样和抽样分布,商务统计学(第5版),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-2,学习目标,在本章中你将学到: 区分不同的抽样方法 抽样分布的概念 计算样本平均数和样本比例相关的概率 中心极限定理的重要性,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-3,为什么需要样本?,选择样本比总体(人口普查)中的每一项要节省时间。 选择样本比总体中的每一项要节省费用。 分析样本要比分析整个总体容易且更加实际。,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-4,抽样过程从抽样架构开始,架构是对组成总体的一系列条目的列举。 架构是类似总体清单,目录或者地图的数据源。 如果架构里没有包括总体的某些部分,不准确或者有偏的结果可能产生。 使用不同的架构得到数据会得出不同的结论。,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-5,样本类型,样本,非概率样本,判断样本,概率样本,简单 随机样本,系统样本,分层样本,群样本,便利样本,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-6,样本类型:非概率样本,在非概率样本中,选中的条目不根据他们发生的概率。 在便利抽样中,条目的选择简单,便宜,且方便抽样。 在判断样本中,我们得到预先选好的专家就主题发表的意见。,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-7,样本类型:概率样本,在概率样本中, 样本中条目的选择基于已知的概率。,概率样本,简单 随机样本,系统样本,分层样本,群样本,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-8,概率样本:简单随机样本,架构里的每一个条目都有同等的机会被选中 抽样可以放回(选择了某一个条目之后再把它放回架构里,它再次被选中的概率仍然相同)或者不放回 (选择的某一个条目,不能放回架构中)。 样本通过随机数表或随机数产生器取得,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-9,使用随机数表选择简单随机样本,有850条目的总体抽样架构 条目名 条目号bev r. 001 ulan x. 002 . . . . . . . . joann p. 849 paul f. 850,随机数表(部分) 49280 88924 35779 00283 81163 07275 11100 02340 12860 74697 96644 89439 09893 23997 20048 49420 88872 08401,简单随机样本前5个条目 item # 492 item # 808 item # 892 - 不存在所以忽略 item # 435 item # 779 item # 002,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-10,取决于样本容量: n 架构中n个体分成含k个体的组: k=n/n 从第一组随机选择一个个体 接下来,每数到第k个数都依次选取,概率样本:系统样本,n = 40 n = 4 k = 10,第一组,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-11,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-12,概率样本:分层样本,根据一些常见的特征,把总体分成两个或两个以上的亚群体,即层(strata)。 在每个层中根据层容量相应选择简单随机样本。 分层选择的样本然后加以合并。 当抽样总体是选民时,根据种族或社会经济层次分层是常用的技术。,总体分成 4个层,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-13,概率样本: 群样本,总体分为若干个 “群样本,”每个群代表整个总体。 随机选择群样本 使用选中的群里的所有项目或者从群里面选取基于概率的样本。 群样本的通常应用是选举,其中选择特定选区并抽样。,总体分成16个群样本。,随机选择群样本抽样,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-14,概率样本:比较抽样方法,简单随机样本和系统样本 使用简单 可能不能很好的代表总体的潜在特性 分层样本 确保代表的个体覆盖整个总体 群样本 成本效率更高 有效性较低(需要更大的样本以取得同等程度的精确性),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-15,估计调查价值,调查的目的是什么? 调查是否基于概率样本? 覆盖误差 合适的架构? 无回复误差 跟随 测量误差 好的问题引出好的回复 抽样误差 一直存在,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-16,调查误差类型,覆盖误差或选择偏误 如果有些条目组没有被包括在架构里,没有机会被选到,就会产生。 无回复误差或偏误 不回复的人于回复的人可能是不同的。 抽样误差 随着样本的不同而不同,且是一直存在的。 测量误差 由于问题设计的缺陷,,回答的误差和受访者回复的努力 (“霍索恩效应”),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-17,调查误差类型,覆盖误差 无回复误差 抽样误差 测量误差,从架构中排出,跟踪无回复,随机样本,随着样本的不同而不同,不好的或者主要的问题,(续),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-18,抽样分布,抽样分布就是选出所有可能的样本情况下结果的分布 例如, 假设根据那么学院学生的平均成绩选择50个学生。 如果得到很多不同的50个学生的样本,将计算每个样本不同平均数。我们可以计算对于任意给定的50个学生的样本,我们对所有潜在的平均成绩感兴趣。,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-19,建立抽样分布,假设总体 总体容量n=4 随机样本变量, x, 是个体的年龄 x的观测值: 18, 20, 22, 24 (岁),a,b,c,d,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-20,.3,.2,.1,0,18 20 22 24 a b c d,均匀分布,p(x),x,(续),总体分布的概括度量:,建立抽样分布,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-21,16 个可能的样本 (有放回的抽样),现在考虑容量n=2的所有可能的样本,(续),建立抽样分布,16个样本平均数,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-22,所有样本平均数的抽样分布,18 19 20 21 22 23 24,0,.1,.2,.3,p(x),x,样本平均数的分布,16个样本平均数,_,建立抽样分布,(续),(不再是均匀分布),_,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-23,该抽样分布的概括度量:,建立抽样分布,(续),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-24,比较总体分布与样本平均数的分布,18 19 20 21 22 23 24,0,.1,.2,.3,p(x),x,18 20 22 24 a b c d,0,.1,.2,.3,总体 n = 4,p(x),x,_,样本平均数分布 n = 2,_,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-25,样本平均数抽样分布:平均数的标准差,同样总体相同容量的不同的 样本导致不同的 样本平均数 样本与 样本之间平均数的变动用平均数的标准差来度量: (这假设是有放回的抽样或者无限总体无放回的抽样) 注意平均数的标准差随着样本容量 增加而减少,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-26,样本平均数抽样分布:总体服从正态分布,总体服从正态分布,平均数 且标准差, 抽样分布 也服从正态分布 且,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-27,平均数抽样分布的z值,抽样分布的z值:,其中: = 样本平均数 = 总体平均数 = 总体标准差 n = 样本容量,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-28,总体正态分布,抽样分布也正态分布 (有同样的平均数),抽样分布特征,(也就是说 是无偏的 ),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-29,抽样分布特征,随着n增加, 减小,较大的样本容量,较小的 样本容量,(续),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-30,确定包括固定比例的样本平均数的区间,对于附近对称分布的包含95%的样本平均数区间当 = 368, = 15且n = 25. 因为区间包含95% 的样本平均数 ,5% 的样本平均数 将在区间之外 因为区间是对称的,2.5%将大于上边界且2.5%将小于上边界。 从 标准正态分布表, 2.5% (0.0250) 低于其的z值是 -1.96 且2.5% (0.0250) 高于其的z值是 1.96 。,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-31,确定包括固定比例的样本平均数的区间,计算区间的下边界 计算区间的上边界 样本容量为25的所有样本平均数中的95%位于 362.12和373.88之间,(续),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-32,样本平均数抽样分布:总体非正态分布,我们可以使用中心极限定理: 即使总体非正态分布, 总体的样本平均数 将近似正态分布只要样本容量足够的大. 抽样分布的特征 : 且,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-33,n,中心极限定理,随着样本容量变得足够的大 ,不管总体的分布如何,抽样分布趋近于正态分布,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-34,总体分布,抽样分布 (随着n的增加服从正态分布),集中趋势,变异程度,较大的样本容量,较小的 样本容量,样本平均数抽样分布:总体非正态分布,(续),抽样分布特征:,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-35,多大是足够的大?,对于大多数分布, n 30 将导致抽样分布近乎正态分布 对于完全对称分布, n 15 一般足够导致抽样分布近乎正态分布 对正态分布的总体,平均数的抽样分布总是服从正态分布,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-36,例子,假设总体的平均数 = 8 且标准差 = 3. 假设选中容量n = 36随机样本。 样本平均数介于7.8和8.2之间的概率是多少?,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-37,例子,结论: 即使总体非正态分布, 中心极限定理可以应用 (n 30) 因此抽样分布近乎正态分布 且平均数 = 8 且标准差,(续),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-38,例子,结论(续):,(续),z,7.8 8.2,-0.4 0.4,抽样分布,标准正态分布分布,.1554 +.1554,总体 分布,?,?,?,?,?,?,?,?,?,?,?,?,样本,标准化,x,basic business statistics, 11e 2009 prentice-hall, inc,chap 7-39,总体比例, = 有着某种特性的总体的比例 样本比例 ( p ) 提供的估计: 0 p 1 当n比较大时,p 近乎正态分布 (假设是有放回的抽样或者无限总体无放回的抽样),basic business statistics, 11e 2009 prentice-hall, inc,chap 7-40,p的抽样分布,近乎正态分布分布,如果: 其中 且,(其中 = 总体比例),抽样分布,p( ps),.3 .2 .1 0,0 . 2 .4 .6 8 1,p,basic business statistics, 11e 2009 prentice-hall, inc,chap 7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年两联频闪仪项目投资价值分析报告
- 2025至2030年VCD光头塑料配件项目投资价值分析报告
- 2025至2030年ABS线束项目投资价值分析报告
- 2025年食品级微细轻质碳酸钙项目可行性研究报告
- 2025年铬酸盐项目可行性研究报告
- 建筑工地劳务雇佣协议
- 电影及电视节目制作合作合同
- 融耀星辰小区前期物业服务合同
- 高校科研合作协议书
- 2025年油缸耳环轴承项目可行性研究报告
- 化学反应的限度和化学反应条件的控制 课件
- FZ/T 62033-2016超细纤维毛巾
- 精益六西格玛绿带
- 马克思个人介绍
- 2022年成都市武侯区社区工作者招聘考试笔试试题及答案解析
- 《中国近现代史》考研题库(浓缩300题)
- 中建施工现场CI规范说明PPT-共190详细
- 快乐女生课件-心理健康
- 青海省西宁市各县区乡镇行政村村庄村名居民村民委员会明细及行政区划代码
- 50道经典逻辑题
- 级配碎石回填方案
评论
0/150
提交评论