比估计与回归估计_第1页
比估计与回归估计_第2页
比估计与回归估计_第3页
比估计与回归估计_第4页
比估计与回归估计_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 比估计与回归估计比估计与回归估计侯天宇侯天宇1.1 引言 1.比估计与回归估计的使用条件:(1)调查主要指标与辅助变量间有正线性相关关系正线性相关关系; 比估计与回归估计的使用效果的好坏取决于辅助变量的选择,要尽可能选择与调查指标相关程度的大小。 (如果辅助变量与调查主要指标间有负线性相关关系,则要采取乘积估计。)(2)适用面广,可以用于简单随机抽样,也可用于分层随机抽样等;(3)估计 或Y时 ,一般要求辅助变量的总体总量或均值是已知的。Y简单估计:在没有其他相关辅助变量信息可以利用的情况下,用样本特征直接估计总体特征,且样本特征与欲估的总体特征除了写法之分外,完全同形同构,简单

2、易记,因此有简单线性估计。身不属于比率估计量。,它本比率估计量的核心成分是简单估计量,是构成R1.2 比估计一、简单随机抽样下的比估计:一、简单随机抽样下的比估计:1.比估计定义:比估计定义: 比率:(1)R的比率估计量:XYXYR均值之比率:总体的两个指标总量或称为比率估计量。则xyR .是样本两个指标的均值,对于简单随机抽样,若xy(2)2.比估计的性质:比估计的性质:对于简单随机抽样,(1)比估计是有偏的,但当n大时,(2)XRNXRYXXRYXRyYYRR),(已知的比估计量:及RRE)()2(1)2(11)(1)()(22222222122xyxyxxyyNiiiSRSSRSXnfS

3、RRSSXnfNRXYXnfRVRMSE证明:RREnXXRYXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大时,当)()()()(大时,当0) 1 ( 11)()(111001)()()()()2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(则,对每个总体单元,令)()(又)()()2(1)2(11)()(2)(11)()(11)(1)()(2222222212222122122xyxyxx

4、yyNiiiiiNiiiNiiiSRSSRSXnfSRRSSXnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE3.比估计的方差估计:比估计的方差估计: (1)该估计是有偏的,但具有渐近无偏性。)2(11)(1)()(2222122xxyyNiiiSRRSSXnfNRXYXnfRVRMSE)2(11)(1)(的渐近无偏估计为:)(已知时,当22221221xxyyniiisRsRsXnfnxRyXnfRvRVX1)(12NRXYNiii其中估计可用niiixRyn12)(11(2)例:某小区有1920户,从中随机抽取了70户,调查各户的住房面积(单位:平方米)和家庭

5、人口,得数据: 试对人均住房面积作点估计和置信度为95%的区间估计。5 .7264,1110, 7 .52940260, 4 .182170170127012701701iiiiiiiiiiixyxyxy)2(111)(22221221xxyyniiisRsRsxnfnxRyxnfRvRVX)()(的渐近无偏估计为:未知时,当 解:01. 72604 .1821701701iiiixyR085. 011)(1222nxRyxnfRvRVniii)()(的渐近无偏估计为:92.56372)(7012270170127012iiiiiiiiiixRxyRyxRy58. 744. 6%952121,

6、)(,)(的置信区间为:的置信度为RvuRRvuRR3.估计估计R时样本量的确定:时样本量的确定:22222/100022222/122222/12/112222,其中11解得:)()Y(11,其中1)(大时,当,的绝对误差限为1的置信度为如果dXSnNnndXNSdXSnRVdRXNSSXnfRVndRdddNiiidd估计。未知时,也可由)(11由的样本,抽一个容量为也可以通过试点调查时计,可以通过以往的资料估122,2xXxRynsnSniiidd4.估计估计 时样本量的确定:时样本量的确定:2222/10002222/12222/12/11222,其中11解得:)()Y(11,其中1)

7、(大时,当,的绝对误差限为1如果置信度为dSnNnnNdSdSnYVdRXNSSnfYVnddddRNiiiddRRY例:某公司有1000名职工,为了估计职工今年与去年病假工时的比率,要抽一个容量为n的简单随机样本进行调查。先随机抽了10人作试点调查,数据如下:编号去年病假工时今年病假工时1121322425315154303253236626247101281516902101412希望以置信度95%,使估计R的绝对误差不超过0.01,应抽容量为多大的样本?已知公司职工去年病假工时为16300。解:05. 1178187101101iiiixyR4245,4066,4463178,18710

8、110121012101101iiiiiiiiiiixyxyxy由试点调查的数据得:5222/1210122701221011012101210603. 296. 101. 03 .1610001630016300474. 3)(91265.312)(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd例:审计员想把一个医院的财产的现在价值与记录价值作一比较。从计算机存储的记录里查到,医院的财产有2100项,共计价值950000元。为了估计现在的价值,拟在2100项目中随机抽取n项。因为没有信息可用来确定n,先随

9、机抽了15项,获得数据整理如下: 试确定n,使估计量的绝对误差不超过500元(置信度为95%)。表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .24215115121511512151解:表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .2421511512151151215198. 00 .2425 .237151151iiiixyR406210050415041504)21005

10、00(4444. 796. 100222222/10NnnndSnd4444. 7)(1412218.1042)(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy4.比估计与简单估计的比较:比估计与简单估计的比较:单估计更精确。,即比估计较相应的简21,则特别若2/2/20)2(1)2(11)()()得:2()1(1)(的方差为:的简单估计)2()2(1)(的方差为:的比估计足够大时,当)1(2222222222yxyxyxyxxyxxyxyyRyxyxyRRCCCCYSXSSRSSRSSRnfSRSSRSnfSnfyVyVSnfyVyYSRSS

11、RSnfyVyYn5.消除比估计偏倚的方法:消除比估计偏倚的方法: 小样本时,比估计的偏倚不能忽略。 有偏估计成为无偏估计的方法:(1)无偏的比率型估计量(2)改变抽样方法二、分层随机抽样下的比估计二、分层随机抽样下的比估计 在大样本时, 1. 分别比估计:分别比估计:若 各层的样本量比较大时,各层可分别进行比估计,再进行加权平均,所得估计量称为分别比估计。 LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhstLhhhhLhRhhLhhhstSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)()()(方差2

12、. 联合比估计:联合比估计:若 某些层的样本量比较小时,可以采用联合比估计。对两个指标先求总体均值或总和的分层估计,然后用它们构造比估计,所得估计量称为联合比估计。 LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1)(方差3. 分别比估计与联合比估计的比较:分别比估计与联合比估计的比较:1.3 回归估计Linear regression 估计精度就比较高。为常数)。这时,用比(可以认为又比较大,相关系数的回归直线通过原点,关于如果。估计其实质是用,已知计量:简单随机抽样中的比估aaxyxyXYxyXXxyYiiiiR)(的特征数呢?的信息来估计调查指

13、标如何利用辅助指标,的回归直线不通过原点关于如果yxxyii1.简单随机抽样中的回归估计量:简单随机抽样中的回归估计量:对于简单随机抽样,总体均值和总体总和的回归估计量分别为:lrlrYNYXxXbyY)(已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性质:记为以后)(的回归估计为时,当)(的回归值时,事先给定常数)若(据结构:具有一元线性回归的数与假定1000YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性质)(即回归估计为比估计)(时,当计)(即回归估计为差估(时,当计)(即回归估计为简单估时,当)(的回归估计

14、为时,事先给定常数若110:00000)()(:性质22002212xxyylrSSSnfyV)的无偏估计。()是()(性质:)()()()(去估计均值的回归估计就是用样本或者说:(,其中(换个角度:证明:)()(:性质lrxxyylrxxyyNiiiNiiiZlriiiniiniiilrxxyylryVsssnfyvSSSnfXXYYNnfYXXYNnfSnfyVYzYxXyzzznxXynxXyySSSnfyVi22002220022102102011002200221211111111)1)(1)212,即总体残差方差。1)(1)1(的相关系数。与为数,的(有限)总体回归系关于为其中)1

15、(1)(且)达到最小值,(时,)()(当的最佳值)定理:(12122222min212100NiiNiiiyylrlrxxyNiiNiiieNEYYNSxyxyBSnfyVyVBSSXXXXYY证明:)()(时,当)(得)(令)()(22min2020220022002110, 021ylrxxylrxxylrxxyylrSnfyVBSSdyVdBSSdydVSSSnfyV)(21)(2121211,1122212212222121yxyyxxyyniiiniieelrylrlrlrlrniiniiiiiiiibssnnlblnxxbyynyynssnfyvnSnfyVyMSEnYyEnxXb

16、yyYxxxxyybBBxyxy)()()(其中样本残差)(大时性质:当)()()(大时,性质:当)(大时,性质:当)(的回归估计为:)()(一般是未知的,本回归系数。根据样本计算时,为样)若(据结构:具有一元线性回归的数与假定例:总体由75308个农场组成,设yi为第i个农场养牛的头数, xi为第i个农场的面积。已知农场平均面积为31.25英亩,选取一个样本容量为2055的简单随机样本。经计算得: 试估计每个农场平均养牛头数及标准差。763.10073375525.35717915.27410065.30,53.12xxxyyylllxy解:355. 0 xxxyllb74.12)65.30

17、25.31(355. 053.12)(xXbyylr187.0)()(035.0)(2111)(2lrlrxyyyelryvysbllnnfsnfyv标准差为二、分层随机抽样下的回归估计二、分层随机抽样下的回归估计 在大样本时, 1. 分别回归估计:分别回归估计:若各层的样本量比较大时,各层可分别进行回归估计,再进行加权平均,所得估计量称为分别回归估计。 LhehhhhlrshLhhyhhhhLhlrhhLhhhlrshLhhhhhhLhlrhhLhhhlrssnfWYvSnfWyVWYVWYVxXyWyWYWY122122212121111:11)()(:)()(未知时,当方差的样本估计)(

18、)(未知时,当方差2. 联合回归估计:联合回归估计:若 某些层的样本量比较小时,可以采用联合比估计。对两个指标先求总体均值或总和的分层估计,然后用它们构造回归估计,所得估计量称为联合回归估计。 LhxhcxyhcyhhhhlrclrcLhxhhhhLhxyhhhhcststlrcSBSBSnfWyVyVSnfWSnfWBxXyy1222212212)2(111:)()()达到最小,即(时,取当当回归系数未知时,方差LhxhcxyhcyhhhhlrcLhxhhhhLhxyhhhhcsbsbsnfWyvsnfWsnfWb1222212212)2(111)(时,取当3. 分别回归估计与联合回归估计的

19、比较:分别回归估计与联合回归估计的比较:1.3 等概率整群抽样估计11niiniiyyM11niittniiyYM yMM2221122()()11( )11NNiiiiiiiiYYMMYYffV ynMNnMN222221()(1)( )( )( )1NiiitiYYMNfV YM V yN M V ynN估计量的方差分别是:21222222111()1( )111(2)1niiiinnniiiiiiiiyyMfv ynmnfyyMyM ynmn)(yV与 的样本估计分别是:)(YV22122222111()(1)( )1(1)1(2)1niiinnniiiiiiiyyMNfv YnnNfy

20、yMyM ynn例:某县有33个乡,726个村,该年度某种作物总种植面积30525亩,现采用等概抽样随机抽出10个乡,要求估计全县总产量,计算抽样误差。 调查资料如下:样本乡编号村庄数 Mi作物总产量(乡) yi(万公斤)种植面积(乡) xi(亩)iiiMyy 123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合计 209 257.1 8940 分别采用几种方法估计1 无

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论