版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章 比估计与回归估计5.1 比估计比估计一、使用比估计的两种情况一、使用比估计的两种情况即即之之比比值值均均值值)体体的的两两个个指指标标总总量量(或或所所需需估估计计的的目目标标值值是是总总,1.1.比值比值( (或比率或比率) )XYXYR 例例: :绝对贫困绝对贫困以上以上勉强度日勉强度日小康小康富裕富裕最富裕最富裕以下以下消费性总支出金额消费性总支出金额食品支出金额食品支出金额恩格尔系数恩格尔系数所占的比例。即:所占的比例。即:性总支出金额中性总支出金额中指食品支出金额在消费指食品支出金额在消费恩格尔系数恩格尔系数6 . 06 . 05 . 05 . 04 . 04 . 03 .
2、03 . 0: XYR金金额额平平均均每每户户消消费费性性总总支支出出平平均均每每户户食食品品支支出出额额尔尔系系数数一一个个国国家家或或地地区区的的恩恩格格 城乡居民家庭人均收入及恩格尔系数年份城镇居民家庭人均可支配收入(元)农村居民家庭人均纯收入(元)城镇居民家庭恩格尔系数 (%)农村居民家庭恩格尔系数(%)1978343.4133.657.567.71980477.6191.356.961.81985739.1397.653.357.819901510.2686.354.258.819954283.01577.750.158.620006280.02253.439.449.1200168
3、59.62366.438.247.720027702.82475.637.746.220038472.22622.237.145.620049421.62936.437.747.2200510493.03254.936.745.5200611759.53587.035.843.0元元以以上上)(元元)(元元)(元元)(:的的每每盒盒最最高高价价格格范范围围是是若若会会购购买买,您您所所能能承承受受)不不会会()会会(,您您会会不不会会购购买买?假假如如市市场场上上有有奶奶酪酪出出售售1141093862541.221.1,其他元高价格范围是人会购买且能承受的最,第,其他人会购买奶酪,第人,设总
4、体有元者所占的比例。能承受的最高价格在要估计会购买的人中,05410154iYiXNii 例例: “: “筛选性筛选性”问题问题XYXYRNiiNii 11因此,要估计的是因此,要估计的是 例例:1802:1802年,法国的年,法国的LaplaceLaplace受政府委托进行法受政府委托进行法国人口的估计与推算。推算方法如下:国人口的估计与推算。推算方法如下:已知)已知)总体的出生人口数总体的出生人口数总体的人口总数总体的人口总数(XYR 2.2.利用辅助变量的信息改进估计的精度利用辅助变量的信息改进估计的精度35.28 样样本本的的出出生生人人口口总总数数样样本本的的人人口口数数RRXY 即
5、总体的人口总数即总体的人口总数已知已知的比估计量:的比估计量:XXRYYR, 利用辅助变量的信息改进估计的精度利用辅助变量的信息改进估计的精度XRYXYR ,因此,因此已知已知的比估计量:的比估计量:XXRYYR, 已知已知的比估计量:的比估计量:XXRYYR, XYR 比比值值估估计计量量已知已知的比估计量:的比估计量:XXRYYR, 计计估估比比 比估计的使用条件:比估计的使用条件:(1)调查变量与辅助变量间有正线性相关关系,且大致呈正比例; (如果辅助变量与调查变量间有负线性相关关系,则要采取乘积估计。)(2)估计 或Y时 ,一般要求辅助变量的总体总量或均值是已知的。(3)适用面广,可以
6、用于简单随机抽样,也可用于分层随机抽样、整群抽样、多阶抽样等;Y二、简单随机抽样下的比估计二、简单随机抽样下的比估计1.1.比值估计量:比值估计量:XYR xy 对对于于简简单单随随机机抽抽样样Xxy XRYR 的比估计量:的比估计量:及及YY . 2xyR 对对于于简简单单随随机机抽抽样样XxyXRYR 2.2.比估计的性质:比估计的性质: 对于简单随机抽样RREnxyR )() 1 (大时,大时,是有偏的。但当是有偏的。但当1)(1)()()2(122 NRXYXnfRVRMSENiii)2(1)2(122222222xyxyxxyySRSSRSXnfSRRSSXnf 证明:RREnXXR
7、YXxRyEXxRyExxRyERREXxnxxRyRxyRR)(大时,当)()()()(大时,当0) 1 ( 11)()(111001)()()()()2(122122222222222NRXYXnfRMSERVNRXYnfSnfgVGgEgEgExRyExRygXRYGNiRXYGXxRyERRERMSERMSERVRRERERENiiiNiiigiii)()()()()()()(则,对每个总体单元,令)()(又)()()2(1)2(11)()(2)(11)()(11)(1)()(2222222212222122122xyxyxxyyNiiiiiNiiiNiiiSRSSRSXnfSRRSS
8、XnfNXXRXXYYRYYXnfNXRRXYYXnfNRXYXnfRVRMSE(3)比估计的方差估计1)(1)()(122NRXYXnfRVRMSENiii)2(1)(22221xxyysRsRsXnfRvRVX )(的的渐渐近近无无偏偏估估计计为为已已知知时时,当当 NiiiRXYN12)(11估计估计可用可用 niiixRyn12)(11)2(12222xxyySRRSSXnf 11122 nxRyXnfniii)()2(111)(22221221xxyyniiisRsRsxnfnxRyxnfRvRVXxX )()(的渐近无偏估计为的渐近无偏估计为,则,则代替代替未知时,用未知时,用当当
9、例:某小区有例:某小区有19201920户,从中随机抽取了户,从中随机抽取了7070户,户,调查各户的住房面积(单位:平方米)和家调查各户的住房面积(单位:平方米)和家庭人口,得数据:庭人口,得数据: 试对人均住房面积作点估计和置信度为试对人均住房面积作点估计和置信度为95%95%的的区间估计。区间估计。7264.5xy1110 x52940.7,y260 x1821.4,y701iii701i2i701i2i701ii701ii 解:解:01. 72604 .1821701701 iiiixyR085. 011)(1222 nxRyxnfRvRVniii)()(的渐近无偏估计为:的渐近无偏估
10、计为:92.56372)(7012270170127012 iiiiiiiiiixRxyRyxRy 58. 744. 6%952121,)(,)(的置信区间为:的置信区间为:的置信度为的置信度为 RvuRRvuRR 3.3.比估计与简单估计的比较比估计与简单估计的比较21)()2(ySnfyVyY 的方差为:的方差为:的简单估计的简单估计)2(1)() 1 (222xyxyRRSRSSRSnfyVyYn 的的方方差差为为:的的比比估估计计足足够够大大时时,当当02(12(11)()(21222222)得:)得:()(xyxxyxyyRSRSSRnfSRSSRSnfSnfyVyV 单估计更精确。
11、单估计更精确。,即比估计较相应的简,即比估计较相应的简,则,则特别若特别若212/2/2 yxyxyxyxCCCCYSXSSRS 4.估计R时样本量的确定:VXSnNnnVXNSVXSnRxyNSSXnfRVnVRdddNiiidd2200022221222211111,,其中解得:)(,其中)(大时,当的方差上限为如果估计。未知时,也可由)(由的样本,抽一个容量为也可以通过试点调查时计,可以通过以往的资料估,xXxRynsnSniiidd122211估计估计 时样本量的确定:时样本量的确定:2222/10002222/12222/12/1122211111,1dSnNnnNdSdSnYVdR
12、xyNSSnfYVnddddRNiiiddR,其中解得:)()(,其中)(大时,当的绝对误差限为如果置信度为Y例:某公司有1000名职工,为了估计职工今年与去年病假工时的比率,要抽一个容量为n的简单随机样本进行调查。先随机抽了10人作试点调查,数据如下:编号去年病假工时今年病假工时1121322425315154303253236626247101281516902101412希望以置信度95%,使估计R的绝对误差不超过0.01,应抽容量为多大的样本?已知公司职工去年病假工时为16300。解:05. 1178187101101iiiixyR4245,4066,4463178,187101101
13、21012101101iiiiiiiiiiixyxyxy由试点调查的数据得:5222/1210122701221011012101210603. 296. 101. 03 .1610001630016300474. 3)(91265.312)(dVXXxRysxRxyRyxRyiiidiiiiiiiiii,已知334100050215021,50200220NnnnVXSnd例:审计员想估计一个医院的财产的现在价值。从计算机存储的记录里查到,医院的财产有2100项,共计价值950000元。为了估计现在的价值,拟在2100项目中随机抽取n项。因为没有信息可用来确定n,先随机抽了15项,获得数据整
14、理如下: 试确定n,使估计量的绝对误差不超过500元(置信度为95%)。表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .24215115121511512151解:表示现在的价值。值,表示从计算机查到的价其中iiiiiiiiiiiiiyxyxyyxx27.4560,19.4522, 5 .23754.4706, 0 .2421511512151151215198. 00 .2425 .237151151iiiixyR406210050415041504)2100500(4444. 796
15、. 100222222/10NnnndSnd4444. 7)(1412218.1042)(151221512215115121512iiidiiiiiiiiiixRysxRxyRyxRy三、分层随机抽样下的比估计三、分层随机抽样下的比估计 在大样本时, 1. 分别比估计:分别比估计:若 各层的样本量比较大时,各层可分别进行比估计,再进行加权平均,所得估计量称为分别比估计。 LhxhhxyhhyhhhhLhhNihihhihhhLhRhhLhhhRsLhhhhLhRhhLhhhRsSRSRSnfWNXRYnfWyVWYVWYVXRWyWYWYh1222211221212111)2(11)(1)(
16、)()(方差2. 联合比估计:联合比估计:若 某些层的样本量比较小时,可以采用联合比估计。对两个指标先求总体均值或总和的分层估计,然后用它们构造比估计,所得估计量称为联合比估计。 LhxhxyhyhhhhRcststcRcSRRSSnfWyVXxyXRy12222)2(1)(方差5.2 回归估计Linear regression 估计精度就比较高。为常数)。这时,用比(可以认为又比较大,相关系数的回归直线通过原点,关于如果。估计其实质是用,已知的比估计量:简单随机抽样中aaxyxyXYxyXXxyYYiiiiR)(的特征数呢?的信息来估计调查指标如何利用辅助指标,的回归直线不通过原点关于如果y
17、xxyii1.简单随机抽样中的回归估计量:简单随机抽样中的回归估计量:对于简单随机抽样,总体均值和总体总和的回归估计量分别为:lrlrYNYXxXbyY)(已知,其中YYEyYxXyYYXxxxyyyxyxylrlrlrlriiiiiiiii)(性质:记为以后)(的回归估计为时,当)(的回归值时,事先给定常数)若(据结构:具有一元线性回归的数与假定1000YYEXRXxyxXxyyyxyRxXyyyyxXyyYlrlrlrlrlr)(:性质)(即回归估计为比估计)(时,当计)(即回归估计为差估(时,当计)(即回归估计为简单估时,当)(的回归估计为时,事先给定常数若110:00000)()(:性
18、质22002212xxyylrSSSnfyV)的无偏估计。()是()(性质:)()()()(去估计均值的回归估计就是用样本或者说:(,其中(换个角度:证明:)()(:性质lrxxyylrxxyyNiiiNiiiZlriiiniiniiilrxxyylryVsssnfyvSSSnfXXYYNnfYXXYNnfSnfyVYzYxXyzzznxXynxXyySSSnfyVi22002220022102102011002200221211111111)1)(1)212,即总体残差方差。)(的相关系数。与为数,的(有限)总体回归系关于为其中)()(且)达到最小值,(时,)()(当的最佳值)定理:(Nii
19、NiiiyylrlrxxyNiiNiiieNEYYNSxyxyBSnfyVyVBSSXXXXYY12122222min2121001)(1111证明:)()(时,当)(得)(令)()(22min2020220022002110, 021ylrxxylrxxylrxxyylrSnfyVBSSdyVdBSSdydVSSSnfyV)(21)(2121211,1122212212222121yxyyxxyyniiiniieelrylrlrlrlrniiniiiiiiiibssnnlblnxxbyynyynssnfyvnSnfyVyMSEnYyEnxXbyyYxxxxyybBBxyxy)()()(其中样本残差)(大时性质:当)()()(大时,性质:当)(大时,性质:当)(的回归估计为:)()(一般是未知的,本回归系数。根据样本计算时,为样)若(据结构:具有一元线性回归的数与假定例:例:总体由75308个农场组成,设yi为第i个农场养牛的头数, xi为第i个农场的面积。已知农场平均面积为31.25英亩,选取一个样本容量为2055的简单随机样本。经计算得: 试估计每个农场平均养牛头数及标准差。763.1007
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 购买第三方服务合同类型
- 会计工作计划范文格式2024工作计划模板
- 学校教学计划锦集
- 五年级语文教研工作计划
- 五年级科学下册教学计划例文
- 秋教务工作计划例文
- 2024年住房和城乡建设局上半年总结及下半年计划
- 计划生育业务评估实施方案
- 2021律师常理会工作计划
- 高二语文教师教学工作计划
- 语言描写优秀课件
- 中压交联电缆电缆正、负和零序计算
- 《物流系统规划与设计》课程教学大纲
- 洁净空调系统验证方案
- 护理质控分析整改措施(共5篇)
- 金属矿山安全教育课件
- 区块链金融课件
- DBJ61-T 112-2021 高延性混凝土应用技术规程-(高清版)
- 2023年高考数学求定义域专题练习(附答案)
- 益生菌概述课件
- 带状疱疹的护理查房课件
评论
0/150
提交评论