统计学-第五章 抽样调查与参数估计.ppt_第1页
统计学-第五章 抽样调查与参数估计.ppt_第2页
统计学-第五章 抽样调查与参数估计.ppt_第3页
统计学-第五章 抽样调查与参数估计.ppt_第4页
统计学-第五章 抽样调查与参数估计.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章抽样调查和参数估计,主要内容,抽样调查的基本原则和抽样组织形式的参数估计,总体参数区间估计的样本容量的确定,参数估计在统计方法中的地位,方差分析,统计方法,第1节抽样调查和抽样组织形式,1。抽样调查的特点,1 .根据随机原则取样。从样本数据推断总体数量特征。推断结果不可避免地会导致抽样误差,但它们是可以估计的,抽样调查的作用和优势,1。调查一些不可能也没有必要进行全面调查的现象。补充和修改综合调查数据。具有较强的经济性、及时性、准确性和灵活性。基本概念,1 .总体和样本总体:整个研究由几个个体组成,即总体单位。样本:从人群中随机选择的个体的集合。大样本和小样本(2)参数和统计参数:描述总

2、体特征的指标;常数,通常是未知的,需要通过样本数据来估计。统计:样本指数;不确定且不唯一;是一个随机变量。常用参数及统计,(3)抽样箱抽样箱:抽样的依据为全部人口中所有单位的名单,(4)重复抽样和不重复抽样,抽样调查的工作步骤,1。设计调查方案(如何以及花费多少)2。取样3。调查(收集数据)4。计算统计数据5。推断总体数量特征或方差分析,假设检验,3 (1)简单随机抽样(2)分层(类)抽样(3)系统抽样(机械抽样)(4)整群抽样(5)多阶段抽样,第2节抽样分布,1。分布总体分布样本分布抽样误差,2。抽样误差,当一个容量为n的样本被重复抽样时,由所有可能的统计值形成的相对频率分布称为抽样分布。抽

3、样分布实际上是一种理论分布。抽样分布提供了长期稳定的样本统计信息,是推断的理论基础和重要依据。让我们设置一个由四名学生组成的统计总体,他们在某一科目上的分数分别为60、70、80和90。总月薪的均值、方差和分布如下:均值(平均分数)方差,从4个人中随机抽取2个人(重复抽样,考虑顺序),有12个可能的样本,样本的平均数量如下表所示。样本均值的抽样分布、结论、1。如果总体服从正态分布,样本均值服从正态分布。2.如果总体是非正态分布,如果样本量足够大,样本均值近似服从正态分布;3.如果总体为正态分布,样本量相对较小,样本均值的标准化随机变量服从自由度为n-1的t分布。4.当样本量足够大时,样本比例近

4、似服从正态分布。2.抽样平均误差。样本指数的标准差称为样本平均误差,它反映了所有可能样本的估计值与总体参数之间的平均差异。实际上,不可能用上述公式计算出如下计算公式:(1)样本均值的抽样平均误差,(2)样本比例的抽样平均误差,(2)如果总体标准差和总体比例p未知,则:1。使用过去人口,p;2.使用样本的标准差和比例,即标准差和比例;1.用于估计总体参数的统计量称为估计量的评估标准:1 .无偏性:估计量的数学期望等于估计的总体参数。有效性:估计量的方差越小,估计越有效。一致性:随着样本量的增加,估计值越来越接近估计总体的参数。第二,参数估计的方法点估计的区间估计,第三,人口参数的区间估计(一)人

5、口均值的区间估计大样本:置信区间点下1-置信水平:样本均值,抽样平均误差,Z值示例:75页,正态分布,置信水平F(Z) Z值95% 1.96 95.45% 2 90%全校共有教职工2000人,其中50人采用重复抽样的方法随机抽取。样本数据如下:875 630 345 210 670 231 78 309 189 77 123 99 167 198 890 276 89 438 112。尝试用95%的置信水平来估计学校中每个教师的所得税置信区间。解决方案:1 .样本平均值=(875 630 345 73)=254.5 2。样本标准偏差3。采样平均误差4。该校教职工缴纳个人所得税的平均置信区间为:

6、196.24元至312.76元。(2)总体比例的区间估计大样本:1置信水平下的置信区间尝试用90%置信水平来估计该节目收视率的置信区间。解决方案:如果样本收视率为p=44/200=22%,置信水平为90%,那么平均抽样误差为Z=1.64,节目收视率在90%置信水平下的置信区间为:(22%-1.64*0.029,22% 1.64*0.029),即17.2%-29%。所需耐用小时数的允许误差范围是10.5小时,因此请尝试估计这些组件的平均耐用小时数。要求是:1.试着按间隔估计这些部件的平均耐用时间,耐用时间的允许误差范围是10.5小时。2.尽量用区间来估计这些产品的合格率,合格率的允许误差范围不应

7、超过5%。极限误差(许用误差,误差范围),抽样极限误差是指在一定概率下总体指标与样本指标之间差异的最大可能范围,也称许用误差。在某些情况下,Z值越大,总体指标与样本指标之间的差异越大,概率也相应增加;反之亦然,达拉斯到礼堂的抽样极限误差是一个可能的范围而不是一个完全确定的范围,这与概率密切相关。1.对这些部件的平均耐用时间进行区间估计。解决方法是:(1)计算样本统计量;(2)计算置信上限和置信下限。据估计,这些组件的平均耐用时间在1045到1066小时之间,置信度为95.45%。2.这些组件合格率的区间估计,解决方案:计算样本统计数据,计算置信上限和置信下限:根据正态分布表,置信度为92%;估

8、计结论:该批产品合格率在86%-96%之间,置信度为92%。第5节样本量的确定,1。必要样本量及其影响因素。必要样本量的计算。应注意的问题,必要的样本量:1。影响必要样本量的因素,1。整体上各单元分值的变化程度:2。采样误差范围:3。置信度:Z 4。抽样方法:重复和不重复。5.抽样组织形式:纯随机、等距、分类等。2。必要样本量的计算,调查平均值时的计算公式,得到它,得到它,重复抽样等。因此,重复抽样,而不是重复抽样,例5-10,一个省应该调查从事某一行业的农村劳动力的平均年收入(约16000人),根据五年的统计数据可知,该行业农村劳动力人均年收入的标准差为200元,如果预定允许误差不超过20元,则采用重复抽样。应该选择多少人来确保估计误差不超过允许误差,概率为95.45%?解决方案:如果已知的置信水平是95.45%,那么=2,=200,=20。根据公式,样本量为:例5-11。调查城市老年人口比例,要求估计允许误差不超过5%,置信水平为95%。应该取多少样本?解决方案:样本大小应为、3。应注意的问题:1 .应该非常仔细地考虑误差范围。因为误差范围越小,就意味着估计结果的精度越高,所以样本量应该加大,但它们不会成比例地变化。2.在多主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论