抽样及抽样分布_第1页
抽样及抽样分布_第2页
抽样及抽样分布_第3页
抽样及抽样分布_第4页
抽样及抽样分布_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样及抽样分布第1页,共22页,2022年,5月20日,14点30分,星期三1. 抽样及抽样估计的概念1.1 抽样即抽样调查,是指在总体中选取部分单位组成样本并收集样本单位的数据资料的过程。在抽样中不可能获得全部样本,在实践中则是仅抽取一部分样本或对小的有限总体进行有放回的抽样。 1.2 抽样估计是在抽样调查的基础上,利用样本的数据资料计算样本指标,以样本特征值对总体特征值做出具有一定可靠程度的估计和判断。第2页,共22页,2022年,5月20日,14点30分,星期三2.抽样误差2.1 抽样误差 2.2 与抽样误差有关的三个概念 (1)抽样实际误差:指某一次具体抽样中,样本指标值与总体参数真实

2、值之间的偏差。 (2)抽样平均误差:是指所有可能的样本指标与总体指标之间的平均差异程度,即样本估计值的标准差。 (3)抽样极限/允许误差:又称置信区间,是指一定概率下抽样误差的可能范围,说明样本估计量在总体参数周围变动的范围,记作。 抽样误差是指不包括登记性误差和系统性误差在内的随机误差,它衡量了抽样估计的精确度。第3页,共22页,2022年,5月20日,14点30分,星期三 3. 无偏估计 在统计上,如果所有可能样本的某一统计数的平均数等于总体的相应参数,则称该统计数为总体相应参数的无偏估计值。第4页,共22页,2022年,5月20日,14点30分,星期三总体标准差已知时的平均数的分布因为从

3、原总体中可抽出很多含量为n的样本,由这些样本算出的平均数有大有小第5页,共22页,2022年,5月20日,14点30分,星期三 设有一N=3的近似正态总体,具有变量3,4,5,根据平均数,方差和标准差的计算公式可求的 =4, =0.6667, =0.8165.现以n=2作独立的有放回抽样,总共可得 = 9个样本,其抽样结果列于表: 第6页,共22页,2022年,5月20日,14点30分,星期三 第7页,共22页,2022年,5月20日,14点30分,星期三 由表中资料可求出:样本平均数 的平均数 =36/9=4= 样本方差 的平均数 =6/9=0.6667= 样本标准差 的平均数 =5.656

4、8/9=0.6285第8页,共22页,2022年,5月20日,14点30分,星期三 根据上述计算结果可得:样本平均数是总体平均数的无偏估计值;样本方差是总体方差的无偏估计值;样本标准差不是总体标准差的无偏估计值。第9页,共22页,2022年,5月20日,14点30分,星期三 4. 样本平均数的分布 将上述试验所得的9个样本平均数整理成次数分布表: 第10页,共22页,2022年,5月20日,14点30分,星期三 样本平均数的分布与其它分布一样,有两个重要参数,一个是样本平均数的平均数,记作 另一个是样本平均数的标准差,记作 , 第11页,共22页,2022年,5月20日,14点30分,星期三

5、由以上抽样试验,可得出样本平均数分布有以下基本性质:样本平均数分布的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量。第12页,共22页,2022年,5月20日,14点30分,星期三 实际抽样推断中采用的公式 重复简单随机抽样: 不重复简单随机抽样: 其中, 为总体方差; 为不重复抽样的修正因子。 第13页,共22页,2022年,5月20日,14点30分,星期三5.抽样分布的概念和种类5.1 概念 精确分布小样本分布:大多数是在正态分布总体条件下得到的,但应用不广泛5.2 种类渐近分布大样本分布:样本容量无限增 大时统计量的极限分布,可看作是抽样 分布的一种近似 抽样分布是样

6、本统计量的概率分布。从一个总体中随机抽取容量相等的样本,根据样本资料计算某一统计量所有可能的概率分布,称为这个统计量的抽样分布。第14页,共22页,2022年,5月20日,14点30分,星期三6. 常见的抽样分布 6.1 t分布 前面在计算样本平均数分布概率时,需要总体方差为已知,或者总体方差未知但样本容量较大,用样本方差估计总体方差。但实际研究中,经常遇到总体方差未知且样本容量不大的情况,如果仍用样本方差来估计,此时标准离差 就不正态分布了, 而是服从自由度为 的t分布。 第15页,共22页,2022年,5月20日,14点30分,星期三 式中 为样本平均数的标准误, 为 的估计值。第16页,

7、共22页,2022年,5月20日,14点30分,星期三t分布的密度函数曲线的特点:第17页,共22页,2022年,5月20日,14点30分,星期三 t分布表怎么查 第一,要知道自己的实验的自由度。第二,要确定下自己的置信度。比如置信度在95%,自由度为6的一组数据,查阅t分布表的时候就是查阅=0.05(双侧),n=6的一个数字。 第18页,共22页,2022年,5月20日,14点30分,星期三 6.2 分布 设 是独立同分布的随机变量,且每个随机变量都服从标准正态分布,即 N(0,1),则随机变量 = 的分布称为自由度为 的 分布, 记作: ( ) 当 时, 分布趋近于正态分布,即 ( )N( n ,2 n )。 第19页,共22页,2022年,5月20日,14点30分,星期三定理:6.3 两个样本方差比的分布F分布第20页,共22页,2022年,5月20日,14点30分,星期三F分布的密度函数曲线的特点:第21页,共22页,2022年,5月20日,14点30分,星期三查F表表中横向为大方差数据的自由度;纵向为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论