参数统计估计_第1页
参数统计估计_第2页
参数统计估计_第3页
参数统计估计_第4页
参数统计估计_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章 参数统计估计什么是抽样统计估计?什么是抽样统计估计? The purpose of Statistics inference is to obtain information about a population from information contained in sample. 例例1 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。120个个样本样本测试平均里程:36,500公里推断新轮胎新轮胎平均寿命平均寿命:36,500公里400个样本 支持人数:160推断支持该候选人的选民支持该候选人的选民占全部选民的比例:占全部选民的比例:160/400=40%例例2:某党派想支

2、持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财力的限制: 抽样估计方法主要用在下列两种情况抽样估计方法主要用在下列两种情况: 注意:注意: 抽样估计只得到对总体特征的近似测度,因此,抽样估计还必须同时考察所得结果的“可能范围可能范围” 与“可靠程度可靠程度”。 1、对所考查的总体不可能进行全部测度; 2、从理论上理论上说可以对所考查的总体进行全部测度,但实践上实践上由于人力、财力、时间等方面的原因,无法(不划算)进行全部测度。第一节 点估计1.用样本的估计量直接作为

3、总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.缺点:没有给出估计值接近总体参数程度的信息3.点估计的方法:1.矩估计法(重点)2.最大似然法3.顺序统计量法4.最小二乘法等点估计:矩估计方法两个概念:K阶原点距:K阶中心距:举例: 即为均值; kikxn()kikxxn11022续点估计:矩估计方法在点估计中,我们用样本统计值作为总体参数的估计值。即以 作为总体均值的点估计值,以样本比例 p 作为总体的比例P点估计值。矩估计方法:一个例子例:圣安德鲁大学每年接受900份入学申请,申请表含学生学术能力测试成绩、学生是否希望学校提供住宿

4、等信息。招生主管希望知道申请学生学术能力测试的平均成绩及希望由学校提供住宿的学生的比例。本例中,我们有三种方法可以得到相关信息:对900名申请者作普查;用随机数表选取容量为30的随机样本。对总体研究可以得到以下总体参数:抽样而得的样本数据 RandomNo. Number Applicant SAT Score On-Campus 1 744 Connie Reyman 1025 Yes 2 436 William Fox 950 Yes 3 865 Fabian Avante 1090 No 4 790 Eric Paxton 1120 Yes 5 835 Winona Wheeler 10

5、15 No . . . . . 30 685 Kevin Cossack 965 No 点估计 作为作为 的点估计的点估计 s 作为作为 的点估计的点估计 作为作为 p 的点估计的点估计 上述估计总体参数的过程被称为点估计点估计(point estimation); 样本均值(标准差/比例)称为总体均值(标准差/比例)的点估计量点估计量(point estimator); 样本均值(标准差/比例)的具体数值称为总体均值(标准差/比例)的点估计值点估计值(point estimate)。 由于点估计量是由样本测算的,因此也称为样本样本统计量。统计量。补充:点估计的两种方法 点估计也叫定值估计,就

6、是直接以一个样本估计量 来估计总体参数.其常用的估计方法有以下两种:矩估计法矩估计法极大似然估计法极大似然估计法 (一)矩估计法 1、基本思想 由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛于总体矩。因此,只要总体X的k阶原点矩存在,就可以用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。按矩估计法,样本均值 是总体均值的点估计量,样本方差s2是总体方差 2的点估计量,样本比例p是总体比例P的点估计量。x2、计算公式(m为样本中具有某中属性的单位数)nmppxxnsxxnsxnxniiniinii)(1)(111212221 (二

7、)极大似然估计法1、基本思想 设总体分布的函数形式已知,但有未知参数 , 可以取很多值,在的一切可能取值中选一个使样本观察值出现的频率为最大的值作为的估计值,记作 ,并称为 的极大似然估计值。这种求估计值的方法称为极大似然估计法。2、概念 设总体X的概率密度函数为 f(x; ) ,其中为待估计参数。 对于从总体中取得的样本观察值x1,x2,xn,其联合密度函数为 ,它是参数 的函数,我们称之为的似然函数,记为L(): 极大似然估计法就是寻求使得函数L()达到极大的作为该参数的估计量,记为 ,并称 为参数的极大似然估计(记为MLE)。用微分法解出似然方程,就得到的极大似然估计。),(1niixf

8、);()(1niixfL 用样本统计量样本统计量(sample statistics)可以作为其对应的总体的点估计量点估计量(point estimator)。 但要估计总体的某一指标,并非只能用一个样本指标,而可能有多个指标可供选择,即对同一总体参数,可能会有不同的估计量。点估计量的性质:估计量优劣的衡量点估计量的性质:估计量优劣的衡量 作为一个一个好的点估计量好的点估计量,统计量必须具有如下性质: 无偏性、有效性、一致性无偏性、有效性、一致性1、无偏性 是指样本估计量的均值应等于被估计总体参数的真值,即)(E3、一致性、一致性 也称相合性,是指随着样本容量的增大,估计量越来越接近被估计的总

9、体参数第二节第二节 区间估计区间估计x (一)样本平均数的抽样分布(一)样本平均数的抽样分布 (Sampling Distribution of ) 考察样本均值的概率分布形式样本均值的概率分布形式。分两种况: 1)总体分布已知且为正态分布总体分布已知且为正态分布; 2)总体分布未知;总体分布未知; 1、样本均值抽样分布的形状、样本均值抽样分布的形状(1)当总体分布已知且为正态分布或接近正态分布时,则无论样本容量大小如何,样本均值则无论样本容量大小如何,样本均值都为正态分布都为正态分布。 (2)当总体分布未知时,需要用到Central limit Theorem) 对容量为对容量为n 的简单随

10、机样本,样本均值的分布的简单随机样本,样本均值的分布随样本容量的增大而趋于随样本容量的增大而趋于正态分布正态分布。 经验上验证经验上验证,当样本容量等于或大于30时,无论总体的分布如何,样本均值的分布则非常接近正态分布。 因此统计上常称容量在30(含30)以上的样本为大样本大样本(large-sample-size)。)(xE可证明在简单随机抽样中 2、样本均值抽样分布的数值特征、样本均值抽样分布的数值特征 n=样本容量; N=总体单位个数可以证明可以证明样本均值的标准差样本均值的标准差:1)(NnN有限总体:无限总体:称为有限总体修正因子有限总体修正因子(finite population

11、correction factor)。 由于样本标准差样本标准差与总体标准差总体标准差及样本容量样本容量有关:nx 4、样本容量与样本均值分布的关系、样本容量与样本均值分布的关系因此,样本容量增大,样本均值标准差变小样本容量增大,样本均值标准差变小,从而使样本分布峰度变高,于是在相同区间内,概率分布线下的面积变大,提高了样本均值落在该区间的可能性。 注意注意: 1、所有可能的样本均值的平均数等于总体均值,而与样本容量无关。 2、点估计往往是在总体方差已知的情况下进行的。 在经济与商务的许多场合,需要用样本比例p对总体比例P进行统计推断。 (二二)样本比例的抽样分布样本比例的抽样分布(Sampl

12、ing Distribution of p) 样本比例抽样分布的相关信息样本比例抽样分布的相关信息: p的:期望值、标准差、抽样分布形状 样本比例的抽样分布样本比例的抽样分布是样本比例所有可能值的是样本比例所有可能值的概率分布。概率分布。 The sampling distribution of p is the probability distribution of all possible values of the sample proportion p. 1、期望值、期望值(Expected value of p):):E (p)=P有限总体:有限总体:无限总体无限总体 2、标准差、标

13、准差(Standard deviation of p):): 3、样本比例抽样分布的形状、样本比例抽样分布的形状(Form of the sampling distribution of p) 根据中心极限定理中心极限定理有:当样本容量增大时当样本容量增大时(大样本),样本比例抽样分布趋向于以样本(大样本),样本比例抽样分布趋向于以样本期望值为中心、以样本方差为方差的正态分布期望值为中心、以样本方差为方差的正态分布。 一、抽样误差(一、抽样误差(Sampling Error) 一个样本可以得到总体参数的一个点估计,该点估计值与总体参数真值之间的差异,即为抽样误抽样误差差。有三个相互联系的概念:

14、 (一)实际抽样误差:(一)实际抽样误差: 二二 抽样误差与区间估计抽样误差与区间估计)( (二)抽样平均误差:(二)抽样平均误差: 所有可能样本估计值与相应总体参数的平均差异程度: (三(三)抽样极限误差抽样极限误差注意注意: 1、统计学上往往用、统计学上往往用抽样极限误差抽样极限误差来测度抽来测度抽样误差的大小或者说测度点估计的精度。样误差的大小或者说测度点估计的精度。 原因:原因:总体参数值往往并不知道,因此,实际抽样误差与抽样平均误差也往往无法求出,但在抽样分布大体知道的情况下,抽样极限误差是可以估计出来的。 一定概率下抽样误差的可能范围(也称允许误差): 2、抽样极限误差的估计总是要

15、和一定的概率保、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。证程度联系在一起的。 原因:原因:样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。 因此,在进行抽样估计时,既需要考虑抽样误在进行抽样估计时,既需要考虑抽样误差的差的可能范围可能范围,同时还需考虑落到这一范围的,同时还需考虑落到这一范围的概率概率大小大小。 前者是估计的准确度估计的准确度问题,后者是估计的可靠估计的可靠性性问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。 点估计点估计是通过样本估计量的

16、某一次估计值来推断总体参数的可能取值; 区间估计区间估计则是根据样本估计量以一定的可靠程度推断总体参数所在的区间范围。 如果抽样分布已知如果抽样分布已知,则在点估计中,可以知道抽样的点估计值与总体参数的离差在某一给定范围内的概率大小,即以一定的可靠程度知道以下抽样极限误差: 二、区间估计(二、区间估计(Interval Estimation) 因此,容易得到在抽样中,总体参数将以同样 的可能性(概率)存在于下面的区间内: 一般地,设总体参数为, L、 U为由样本确定的两个统计量值,对于给定的(0 =30),不论总体分布形式如何,均可用上述方法进行总体均值的区间估计,这时,如果总体方差未知,则直

17、接用样本方差代替。 注意:注意:总体均值的区间估计(例题分析)25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值的区间估计(例题分析)总体均值的区间估计(例题分析)36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计(例

18、题分析) 2、小样本下总体方差未知时,正态分布总体、小样本下总体方差未知时,正态分布总体均值的区间估计均值的区间估计 如果是小样本,但总体为正态分布,在总体方差未知如果是小样本,但总体为正态分布,在总体方差未知而需用样本方差代替时,则下式而需用样本方差代替时,则下式服从自由度为服从自由度为n-1n-1的的t t分布分布。00.050.10.150.20.250.30.350.40.45-3-2.4-1.8-1.2-0.600.61.21.82.43Zt 注意:注意: 如果小样本下总体分布非正态,则无法进行区间估计,唯一的解决方法就是增大样本。从而可得置信度为1- 时总体均值的置信区间:或 于是,给定置信度为1- ,可由t分布表查得临界值t /2(n-1),使得总体均值的区间估计(例题分析)16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计(例题分析)总体均值区间估计程序总体均值区间估计程序n=30?知否?nzx2用s代替nszx2总体是否接近正太分布?知否?nzx2用s代替nstx2增大样本容量至n=30yesNoyesNoyesyesNoNo 在大样本下大样本下,样本比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论