第四章 概率 概率分布和抽样分布_第1页
第四章 概率 概率分布和抽样分布_第2页
第四章 概率 概率分布和抽样分布_第3页
第四章 概率 概率分布和抽样分布_第4页
第四章 概率 概率分布和抽样分布_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章概率、概率分布和抽样分布STAT本章重点1、抽样调查的基本概念;2、大数定律和中心极限定理3、抽样误差本章难点1、一般正态分布

标准正态分布;2、抽样误差的计算。第四章概率、概率分布和抽样分布STAT第一节抽样调查的基本概念一、抽样调查的概念和特点(一)概念按随机原则从总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量特征的一种方法。(二)特点1、随机抽取样本单位2、推断总体数量特征3、抽样调查结果有可控性误差第四章概率、概率分布和抽样分布STAT二、抽样调查的应用范围和作用(一)抽样调查的应用范围

1、用于不可能进行全面调查的现象2、用于进行全面调查就会失去现实意义的现象3、用于经济上不允许或精度上不必要进行全面调查的现象4、用于时效性要求较强的调查

(二)作用1、经济性好2、准确性高3、速度快4、可以取得比较详细的统计资料5、可以对全面调查的资料进行订正第四章概率、概率分布和抽样分布STAT三、全及总体与样本总体(一)总体:被观察(研究)的全体。N:总体单位数(二)样本:按随机原则从总体中抽取的部分单位。1、随机原则:机会面前、人人平等。每个样本都有同等被抽可能2、n:样本容量(样本可能数目)3、n>30:大样本;n≤30:小样本(也有认为n>50为大样本)(三)抽样框:包括所有抽样单位的名单框架。1、名单抽样框2、区域抽样框3、时间表抽样框第四章概率、概率分布和抽样分布STAT四、总体参数与样本统计量[例]某进出口公司拟进口10万台微型计算器,按规定,使用寿命小于4000小时即为次品,且次品率高于1%就不接受这批产品。现随机从中抽取1000台进行检验。1、总体参数:总体指标;2、样本统计量:样本指标第四章概率、概率分布和抽样分布STAT五、抽样方法(一)重复抽样(回置抽样、有放回的抽样)

样本可能数目:M=Nn(二)不重复抽样(不回置抽样、不放回抽样)

M=

N!/(N–n)!第四章概率、概率分布和抽样分布STAT

第四节大数定律和中心极限定理一、抽样分布1、总体分布:总体某一变量的取值及其出现概率所形成的分布[例]总体三人(A、B、C)的年龄为1,2,3。N=3第四章概率、概率分布和抽样分布STAT2、抽样分布样本统计量的取值及其出现概率的分布。[例]N=3n=2,计算样本平均年龄第四节大数定律和中心极限定理

STAT一、大数定律及其意义是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称

(一)独立同分布大数定律

(二)贝努力大数定律第四节大数定律和中心极限定理STAT二、中心极限定理中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。

(一)独立同分布中心极限定理(也称为列维-林德伯格定理)。设是独立同分布的随机变量序列,且存在有限的数学期望和方差,那么当时:或

第四节大数定律和中心极限定理STAT中心极限定理论证了如下几点:①如果总体服从正态分布,样本均值也同样服从正态分布。②如果总体很大,但不服从正态分布,只要样本容量足够大,或就会趋近于正态分布。③样本均值的数学期望等于总体均值,即。④样本均值的方差为:重复抽样时,

不重复抽样时,

第五章参数估计STAT第二节点估计和区间估计一、估计量与估计值1、待估参数:待估的总体指标;2、估计量:作为估计依据的样本指标

3、估计值:估计量的具体取值。[例]1000只灯泡的使用寿命及标准差均未知,今随机取得4只灯泡,测得寿命为1502,1453,1367,1650(小时),试估计总体平均使用寿命及其标准差。解:第五章参数估计STAT第二节参数估计的基本方法一、估计量与估计值1、待估参数:待估的总体指标;2、估计量:作为估计依据的样本指标

3、估计值:估计量的具体取值。[例]1000只灯泡的使用寿命及标准差均未知,今随机取得4只灯泡,测得寿命为1502,1453,1367,1650(小时),试估计总体平均使用寿命及其标准差。解:第五章参数估计STAT

二、点估计三、估计量的优良标准第五章参数估计STAT2、有效性:对无偏估计量,方差越小越有效。3、一致性(大样本有益性)第五章参数估计三、区间估计(一)含义区间估计就是根据样本估计量以一定的置信度推断总体参数所在的区间范围。(二)总体均值的区间估计第五章参数估计STAT四、参数估计的基本原理※(一)正态分布频率身高1401501601701801900.50.40.30.20.1第五章参数估计STAT调整:“频率密度”(频率/组距)“频率”;

直方或折线覆盖下的面积=1频率密度身高1401501601701801900.050.040.030.020.01P{150

X

180}=0.90=相应直方的面积第五章参数估计STAT组数n∞,折线曲线。频密身高1401501601701801900.050.040.030.020.01第五章参数估计STAT注:参数、不同分布的位置与形状不同。第五章参数估计STAT4=x1x2=8-Z0Z第五章参数估计STAT162

170178-z/2

0

z/2第五章参数估计STAT154

170186-z/2

0

z/2第五章参数估计STAT(二)抽样误差的计算※1、概念(1)定义:样本指标与总体指标之间的差距(离差)。(2)实际抽样误差:某次抽样结果与总体指标之间的误差。第五章参数估计STAT(3)抽样平均误差()定义:所有实际抽样误差的平均数。A:抽样平均数的抽样平均误差B:抽样成数的抽样平均误差第五章参数估计STAT2、抽样平均误差的计算(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论