抽样调查2(共8页)_第1页
抽样调查2(共8页)_第2页
抽样调查2(共8页)_第3页
抽样调查2(共8页)_第4页
抽样调查2(共8页)_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实 验(实训)报 告项 目 名 称 简单(jindn)随机抽样(三),分层抽样 所属(sush)课程名称 抽样调查(chu yn dio ch) 项 目 类 型 综合性实验 实验(实训)日期 2015年 5月 13日 班 级 14应用统计C 学 号 姓 名 指导教师 罗 季 浙江财经大学教务处制实验(shyn)名称: 简单(jindn)随机抽样(三),分层抽样实验(shyn)目的: 编写R程序解决简单随机抽样及分层抽样中的统计问题实验要求: 解题,编写R程序,实现.调查某个地区的养牛头数,以村作为抽样单元。根据村的海拔高度和人口密度划分成四层,每层取10个村作为样本单元,经过调查获得下列数据层

2、村总数样本村养牛头数1 2 3 4 5 6 7 8 9 10 12341411470525581499743 84 98 0 10 44 0 124 13 050 147 62 87 84 158 170 104 56 160228 262 110 232 139 178 334 0 63 22017 34 25 34 36 0 25 7 15 31 要求:估计该地区养牛总头数及其估计量的变异系数。求分层随机抽样的设计效应。若样本量不变采用Neyman分配可以减少方差多少?某乡欲估计今年的小麦总产量,全县共实验过程:一,(1)N1-1411N2-4705N3-2558N4-14997y1-c(

3、43,84,98,0,10,44,0,124,13,0)y2-c(50,147,62,87,84,158,170,104,56,160) y3-c(228,262,110,232,139,178,334,0,63,220)y4-c(17,34,25,34,36,0,25,7,15,31) N-N1+N2+N3+N4W1-N1/NW2-N2/NW3-N3/NW4-N4/Nybar1-mean(y1)ybar2-mean(y2)ybar3-mean(y3)ybar4-mean(y4)ybar-W1*ybar1+W2*ybar2+W3*ybar3+W4*ybar4Y-N*ybarY1 1353572

4、VY-(N1*(N1-n)*var(y1)/n+(N2*(N2-n)*var(y2)/n+(N3*(N3-n)*var(y3)/n+(N4*(N4-n)*var(y4)/nSY-sqrt(VY)/YSY1 0.09098019估计(gj)该地区养牛总头数1353572及其估计量的变异系数0.09098019(2)N1-1411N2-4705N3-2558N4-14997y1-c(43,84,98,0,10,44,0,124,13,0)y2-c(50,147,62,87,84,158,170,104,56,160) y3-c(228,262,110,232,139,178,334,0,63,22

5、0)y4-c(17,34,25,34,36,0,25,7,15,31) N-N1+N2+N3+N4W1-N1/NW2-N2/NW3-N3/NW4-N4/Nybar1-mean(y1)ybar2-mean(y2)ybar3-mean(y3)ybar4-mean(y4)ybar-W1*ybar1+W2*ybar2+W3*ybar3+W4*ybar4vybar-(W12*var(y1)+W22*var(y2)+W32*var(y3)+W42*var(y4)/10-(W1*var(y1)+W2*var(y2)+W3*var(y3)+W4*var(y4)/Nvsrs=(N-10)/(10*(N-1)*(

6、W12*var(y1)+W22*var(y2)+W32*var(y3)+W42*var(y4)-(W12*var(y1)+W22*var(y2)+W32*var(y3)+W42*var(y4)/10+W1*ybar2+W2*ybar2+W3*ybar2+W4*ybar2-ybar2+vyabr)deff-vybar/vsrsdeff1 1.011586 (3)y1-c(43,84,98,0,10,44,0,124,13,0) y2-c(50,147,62,87,84,158,170,104,56,160) y3-c(228,262,110,232,139,178,334,0,63,220) y

7、4-c(17,34,25,34,36,0,25,7,15,31) N1-1411 N2-4705 N3-2558 N4-14997 N-N1+N2+N3+N4n-40n1-n*N1*sd(y1)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4)n2-n*N2*sd(y2)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4)n3-n*N3*sd(y3)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd(y4) n4-n*N4*sd(y4)/(N1*sd(y1)+N2*sd(y2)+N3*sd(y3)+N4*sd

8、(y4) w1-N1/N w2-N2/N w3-N3/N w4-N4/Nybar1-mean(y1) ybar2-mean(y2) ybar3-mean(y3) ybar4-mean(y4) ybar-w1*ybar1+w2*ybar2+w3*ybar3+w4*ybar4Y-N*ybar v-(w12*var(y1)/4+w22*var(y2)/12+w32*var(y3)/14+w42*var(y4)/10)-(1/N)*(w1*var(y1)+w2*var(y2)+w3*var(y3)+w4*var(y4)v1 23.40882第一(dy)小题的方差是vybar-(W12*var(y1)+

9、W22*var(y2)+W32*var(y3)+W42*var(y4)/10-(W1*var(y1)+W2*var(y2)+W3*var(y3)+W4*var(y4)/NVbar1 27.065952,方差可以(ky)减少:27.06595-23.40882=3.65713第二(d r)题有123个村,按简单随机抽样抽取13个村作为样本,取得资料如下:样本村去年的小麦产量(百斤)今年的小麦产量(百斤)12345678910111213550720150010206209809281200135017506707291530610780160010306001050977144015702210

10、9808651710若已知去年(qnin)的小麦总产量为128200(百斤),采用比估计法估计今年(jnnin)的小麦总产量和置信度为95%的置信区间;采用回归估计(gj)法估计今年的小麦总产量和置信度为95%的置信区间;比较两种估计方法的精确度。Q-function(Yr,sd,alpha)u-qnorm(1-alpha/2)q1-Yr-u*sdq2-Yr+u*sdQ-c(q1,q2)x-c(550,720,1500,1020,620,980,928,1200,1350,1750,670,729,1530)y-c(610,780,1600,1030,600,1050,977,1440,157

11、0,2210,980,865,1710)xbar-mean(x)ybar-mean(y)N-123n-13X-128200varx-var(x)vary-var(y)R-ybar/xbarYrbar-R*Xsxy-cov(x,y)f-n/Nvaryrbar-(1-f)*(varx+R2*vary-2*R*sxy)/nvarYrbar-N2*varyrbarsd-sqrt(varYrbar)alpha-0.05u-qnorm(1-alpha/2)C-Q (Yrbar,sd,alpha)1 133950.5 157937.0总量估计量为145943.8,置信区间为133950.5 157937.0

12、(2)Q-function(Yr,sd,alpha)u-qnorm(1-alpha/2)q1-Yr-u*sdq2-Yr+u*sdQ-c(q1,q2)x-c(550,720,1500,1020,620,980,928,1200,1350,1750,670,729,1530)y-c(610,780,1600,1030,600,1050,977,1440,1570,2210,980,865,1710)N-123n-13f-n/NX-128200 xbar-mean(x)ybar-mean(y)Xbar-X/Nvarx-var(x)vary-var(y)sxy-cov(x,y)a-sxy/varxyl

13、r-ybar+a*(Xbar-xbar)Ylr-N*ylrse-sqrt(n-1)*(vary-a*sxy)/(n-2)vYlr-N2*(1-f)*se2/nsd-sqrt(vYlr)alpha-0.05u-qnorm(1-alpha/2)C-Q(Ylr,sd,alpha) 1 138552.4 153337.8,置信区间为138552.4 153337.8(3)比估计(gj):Yrbar= 145943.8,sd= 6119.111回归估计:Ylbar=145945.1,sd= 3771.863回归估计(gj)比比估计精度更高。某县欲调查某种农作物的产量,由于平原和山区的产量有差别,故拟划分

14、平原和山区两层采用分层抽样。同时当年产量与去年产量之间有相关关系,故还计划采用比估计(gj)方法。已知平原共有120个村,去年总产量为24500(百斤),山区共有180个村,去年总产为21200(百斤)。现从平原用简单随机抽样抽取6个村,从山区抽取9个村,两年的产量资料如下: 平原 山区样本去年产量(百斤)当年产量(百斤)123456 2041438225627519821016075280300190样本去年产量(百斤)当年产量(百斤)123456789137189119631031071596387150200125601101001807590 试用分别比估计与联合比估计分别估计当年(d

15、ngnin)的总产量,给出估计量的标准误,并对上述两种结果进行比较和分析。第三(d sn)题x1-c(204,143,82,256,275,198)x2-c(137,189,119,63,103,107,159,63,87)y1-c(210,160,75,280,300,190)y2-c(150,200,125,60,110,100,180,75,90)N1-120X1-24500n1-6f1-n1/N1N2-180X2-21200n2-9f2-n2/N2xbar1-mean(x1)xbar2-mean(x2)ybar1-mean(y1)ybar2-mean(y2)R1-ybar1/xbar1

16、R2-ybar2/xbar2varx1-var(x1)varx2-var(x2)vary1-var(y1)vary2-var(y2)sxy1-cov(x1,y1)sxy2-cov(x2,y2)Yrs-sum(ybar1*X1/xbar1,ybar2*X2/xbar2)a-N12*(1-f1)*(vary1+R12*varx1-2*R1*sxy1)/n1b-N22*(1-f2)*(vary2+R22*varx2-2*R2*sxy2)/n2vyrs-sum(a,b)sd-sqrt(vyrs)1 751.4072得到(d do)当年总产量的估计量Yrs为48206.45,估计量的标准差为751.40

17、72(2)x1-c(204,143,82,256,275,198)x2-c(137,189,119,63,103,107,159,63,87)y1-c(210,160,75,280,300,190)y2-c(150,200,125,60,110,100,180,75,90)N1-120X1-24500n1-6f1-n1/N1N2-180X2-21200n2-9f2-n2/N2X-sum(X1,X2)xbar1-mean(x1)xbar2-mean(x2)ybar1-mean(y1)ybar2-mean(y2)varx1-var(x1)varx2-var(x2)vary1-var(y1)vary2-var(y2)sxy1-cov(x1,y1)sxy2-cov(x2,y2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论