抽样技术课后习题参考答案金勇进_第1页
抽样技术课后习题参考答案金勇进_第2页
抽样技术课后习题参考答案金勇进_第3页
抽样技术课后习题参考答案金勇进_第4页
抽样技术课后习题参考答案金勇进_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章习题2.1 判断下列抽样方法是否是等概的:(1)总体编号 164,在 099中产生随机数 r,若 r=0 或 r64 则舍弃重抽。(2)总体编号 164,在 099 中产生随机数 r,r 处以 64的余数作为抽中的数,若余数 为 0 则抽中 64.(3)总体 2000021000,从 11000中产生随机数 r。然后用 r+19999 作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以 随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三, 当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。因此( 1)中只有 1

2、64 是可能被抽中的,故不是等概的。 (2)不是等概的【原因】 (3)是等概的。206. 试估计该市居民用电量2.2 抽样理论和数理统计中关于样本均值 y 的定义和性质有哪些不同?的 95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?抽样理论概率统计定 义1.期望 E ynnCNCN1yi Piyi 1nYi 1 i 1 CN1 n1 n1.期望 E y E 1yi1 E yin i 1n i 1性 质2. 方差V yCNn2y i Ey i Pi i122. 方差 V y E yi解析:抽样理论和数理统计中关于样本均值的定义和性质的不同2.3 为了合理调配电力资源, 某市

3、欲了解 50000 户居民的日用电量, 从中简单随机抽取了300 户进行,现得到其日用电平均值 y 9.5 (千瓦时), s2解:由已知可得, N=50000,n=300, y 9.5,s2 206该市居民用电量的 95%置信区间为 N y z V(y)=4750001.96*41308.19 2即为( 394035.95,555964.05)由相对误差公式 u 2 v(y) 10%y可得1.96 * 1 n 50000 * 206 9.5*10%即 n 862欲使相对误差限不超过 10%,则样本量至少应为 8622.4 某大学 10000 名本科生,现欲估计爱暑假期间参加了各类英语培训的学生

4、所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。解析:由已知得:N 10000 n 200 p0.35 fn 0.02 N又有:E(p) E(p) p0.35V(p)1fp(1 p) 0.0012n1该大学所有本科学生中暑假参加培训班的比例 95%的置信区间为: E(P) Z V(P)2代入数据计算得:该区间为 0.2843 ,0.41572.5 研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20 的样本,调查结果列于下表:编号文化支出编号文化支出120011150215012

5、1603170131804150141305160151006130161807140171008100181809110191701024020120估计该小区平均的文化支出Y, 并给出置信水平 95%的置信区间解析:由已知得: N 200 n 20根据表中数据计算得:20yi144.520 i 1 iy该小区平均文化支出 Y 的 95%置信区间为: yz V(y) 即是:132.544 ,156.4562故估计该小区平均的文化支出 Y =144.5, 置信水平 95%的置信区间为132.544 ,156.456 。2.6 某地区 350个乡为了获得粮食总产量的估计,调查了 50 个乡当年的

6、粮食产量,得到y =1120(吨), S2 25600 ,据此估计该地区今年的粮食总产量,并给出置信水平 95%的 置信水平 95%的置信区间为: y z 1 f s 代入数据得:置信区间。 解析:由题意知: y =1120n 50N 3500.1429 S2 25600s 1602n置信水平 95%的置信区间为: 1079.872 ,1160.872*3502.7 某次关于 1000 个家庭人均住房面积的调查中, 委托方要求绝对误差限为 2 平方千米,置信水平 95%,现根据以前的调查结果,认为总体方差 S2 68 ,是确定简单随机抽样所需的样本量。若预计有效回答率为70%,则样本量最终为多

7、少 ?解析:简单随机抽样所需的样本量n122NZ 2S222 2 2Nd2 Z S22n2n12 70%由题意知: N 1000 dS2681.96代入并计算得: n1 61.3036 61n2n170%87.142 87故知:简单随机抽样所需的样本量为 61,若预计有效回答率为 70%,则样本量最终为 872.8 某地区对本地 100 家化肥生产企业的尿素产量进行调查,一直去年的总产量为 2135 吨,抽取 10 个企业调查今年的产量,得到 y 25,这些企业去年的平均产量为 x 22。 试估计今年该地区化肥总产量。XX2135 21.35解析:由题可知 x 22 ,N100, y 25Yy

8、 25X 21.35 24.26则,该地区化肥产量均值Y 的比率估计量为x 24该地区化肥产量总值Y的比率估计量为Y? NY?R 100* 24.26 2426所以,今年该地区化肥总产量的估计值为 2426 吨。2.9 如果在解决习题 2.5 的问题时可以得到这些家庭月总支出,得到如下表: 单位:元编号文化支出总支出编号文化支出总支出120023001115016002150170012160170031702000131802000415015001413014005160170015150160061301400161001200714015001718019008100120018100

9、110091101200191701800101401500201201300全部家庭的总支出平均为 1600 元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。x1 n 1x i( 2300 17001300) 1580解析:由题可知n i 1 20y 144.5又yR X xy 1600* 114548.05 146.329故平均文化支出的 95%的置信区间为代入数据得( 146.329 1.96*1.892 ) 即为142.621,150.0372.10 某养牛场购进了 120头肉牛,购进时平均体重 100千克。现从中抽取 10 头,记录重

10、 量,3 个月后再次测量,结果如下:单位:千克解:由题可知,xi11(95ni110105) 102.6故有0146.333106.9331.368编号原重量现重量1951502971553871404120180511017561151857103165810216099215010105170用回归估计法计算 120 头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较所以总体均值 Y 的回归估计量为其方差估计为:V?(ylr ) 1 f (S202Sx2 2 0Sxy)n1 10= 120 (212.222 1.3682 * 106.933 2* 1.368* 146.333

11、) 10=1.097而 V?(y) 1 f S21 10= 1 120* 212.22210=19.454 显然V?( ylr ) V?(y) 所以,回归估计的结果要优于简单估 第三单元习题答案(仅供参考)1 解:( 1)不合适(2)不合适(3)合适(4)不合适2将 800名同学平均分成 8 组,在每一组中抽取一名“幸运星” 3根据表中调查数据,经计算,可得下表:hnhNhWhfhy?hNhy?hsh21102560.30330.039111.22867.294.42104200.49760.023825.510710302.53101680.19910.0595203360355.6总计30

12、844116937.2?Yst =N1 3h=1 Nhy?h=20.12hshV(y?st )=Lh=1 Wn2hhs2h- hL=1nh =9.7681-0.2962 =9.4719V(y?st )=3.0777( 2)置信区间为 95%相对误差为 10%,则有按比例分配的总量:n=V+NhL=1hL=W1V+ V h=1=185.4407185n 1 =nW1 =56, n2 =92,n 3 =37按内曼分配: n=V(+N1h=1hLW=1hWshh)s2h2=175n 1 =33, n 2 =99, n3 =434根据调查数据可知:hWhPh10.180.920.210.93330.1

13、40.940.080.86750.160.93360.220.967Pst =hL=1 WhPh =0.924根据各层层权 Wh及抽样比 fh的结果,可得V?(Pst )= 12 h4=1 Nh2(1 - fh ) p n q n =0.000396981Nn h -1?V(Pst )=1.99% 估计量的标准差为 1.99%,比例为 9.24% 按比例分配: n=2663 n1=479,n2=559,n3=373,n4=240,n5=426,n6=586 内曼分配: n=2565 n1=536,n2=520,n3=417,n4=304,n5=396,n6=392 5解:由题意,有?Y=hL=

14、1 y?Wn =75.79购买冷冻食品的平均支出为 75.79 元又 n=Lh=1 n又由 V(y?)=- Wh )sh2V(y?)=53.8086 V(y?)=7.335495%的置信区间为 60.63 ,90.95 。7解:(1)对(2)错(3)错(4)错(5)对128解:(1)差错率的估计值 y?=1 70%+2 30%=0.02743 57估计的方差 v(y?)=Lh=1 Wh2 h sh2 =3.1967 10 -4nh标准差为 S(y?)=0.0179 。(2)用事后分层的公式计算差错率为 y?=hL=1 Wh(m1 im=1h yhi ) =0.03估计的方差为; v(y?)=h

15、 WhSh-1 h Wh Sh2=2.572610-4 m h N h9解:( 1)所有可能的样本为:第一层第二层x1y1x2y23,50,38,156,93,100,68,256,155,103,615,259,152)用分别比估计,有 r 1 =0.4 ,r 2 =0.65 ,所以用分别比估计可计算得 ?Y=6.4用联合比估计,有 r1 =0.5 ,r 2=0.625 ,所以用联合比估计可计算得 ?Y=6.5 。 第四章习题4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有 4000户,划分为 400 个群,每群10户,现随机抽取 4 个群,取得资料如下表所示:群各户订报数 yij11,

16、2,1,3,3,2,1,4,1,11921,3,2,2,3,1,4,1,1,22032,1,1,1,1,3,2,1,3,11641,1,3,2,1,5,1,2,3,120试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差 解:由题意得到 N 400,n 4,M 10 , f n 4 0.01N 400? 1 n 19 20 16 20故 Y yyi1.875 (份)Mn i 1 10 4y M y 10 1.875 18.75 (份)Y? M N y 10 400 7500 (份)于是由以上的计算结果得到平均每户的订报份数为 1.875 ,估计量方差为 0.00391875 。该辖区总

17、的订阅份数为 7500,估计量方差为 62700。4.2 某工业系统准备实行一项改革措施。该系统共有 87 个单位,现采用整群抽样,用简 单随机抽样抽取 15 个单位做样本,征求入选单位中每个工人对政策改革措施的意 见,结果如下:单位总人数赞成人数15142262533494047345510163648317653884930973541061451158511252291365461449371555421) 估计该系统同意这一改革人数的比例,并计算估计标准误差2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差 不超过 8%,则应抽取多少个单位做样本 ?解:题目已

18、知 N 87, n 15, f n 15N 87 1)由已知估计同意改革的比例 此估计量的标准差为4.3 某集团的财务处共有 48 个抽屉,里面装有各种费用支出的票据。 财务人员欲估计办 公费用支出的数额,随机抽取了其中的 10 个抽屉,经过清点,整理出办公费用的票 据,得到下表资料:抽屉编号票据数 M i费用额( yi ,百元)1428322762338454631125729661258724758145893267104180要求以 95%的置信度估计该集团办公费用总支出额度置信区间(=0.05解:已知 N=48, n=10, f= n10n, 由题意得nyi 736 ,M i 365N

19、48i1 i 1则办公费用的总支出的估计为Y?Nn48 yi736 3532.8 (元)ni1i 10群总和均值 y1nyi173673.6(元)ni11021048= 182.43590.4 9= 72765.44v(Y?) =269.7507则 Y?的置信度为 95%的置信区间为 3532.8 1.96 269.7507 ,即 3004.089 , 4061.511. (148) (83 73.6)2(62273.6) 22. (80 73.6)2= 1094.4 为了便于管理,将某林区划分为 386 个小区域。现采用简单随机抽样方法,从中抽出 20 个小区域,测量树的高度,得到如下资料:

20、区域编号数目株数Mi平均高度 yi (尺)区域编号数目株数Mi平均高度 yi (尺)1426.211606.32515.812526.73496.713615.94554.914496.15475.215576.06586.916634.97434.317455.38595.218466.79485.719626.110416.120587.0估计整个林区树的平均高度及 95%的置信区间20 , fn 20N 3860.0518nMi yii16180.85.909nMi1046i-1解:由已知得 N 386, n?整体的平均高度 Y? yn? 1 f(yi Mi y)2方差估计值 v(Y?)

21、 v(y) 1 f2 i 1 nM 2 n 1?标准方差 s(Y) v(Y) 0.02706 0.1644在置信度 95%下,该林区的树木的平均高度的置信区间为4.5 某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍 200间,每间 6 人。学生会的同学运用两阶段抽样法设计了抽样方案,从 200间宿 舍中抽取了 10间样本宿舍,在每间样本宿舍中抽取 3位同学进行访问, 两个阶段的 抽样都是简单随机抽样,调查结果如下表:样本宿舍拍照人数样本宿舍拍照人数126120703181429151100试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。解:题目已知 N 200,

22、n 10,M6,m3, f1n100.05 , f 2m0.51N200 2M在置信度 95%下, p 的置信区间为(p? t / 2 v(p?)=(0.3 1.96 0.0758) (0.151432,0.448568)4.6 上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查, 宿舍间的标准差为 S1=326 元,宿舍内同学之间的标准差为 S2 =188 元。以一位同学 进行调查来计算,调查每个宿舍的时间 c1 为 1 分钟,为了调查需要做各方面的准备 及数据计算等工作,所花费的时间为 c0是 4小时,如果总时间控制在 8小时以内, 则最优的样本宿舍和样本学生是多少?

23、解:由已知条件得到以下信息:S1 326 (元) S2 188 (元) c1 10 (分钟) c2 1(分钟) c0 4 60 240 (分钟) 由此得到222 S2235344S12 106276 , S22 35344 , S2u S1 2 106276 100385.3312u 1 M 6因而取最优的 m 2 ,进一步计算 nopt 由于总时间的限制 C 480 ,由关系式C c0 c1n c2nm 得到 480 240 10n opt 2nopt计算方程得到 nopt 20 ,因而取 n 20 则最优的样本宿舍数为 20 间,最优样本学生数为 2。4.7 某居委会欲了解居民健身活动情况

24、, 如果一直该居委会有 500名居民,居住在 10 个 单元中。现先抽取 4 个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽 样都是简单随机抽样, 调查了样本居民每天用于健身锻炼的时间结果如下 (以 10 分 钟为 1 个单位):试估计居民平均每天用于锻炼的时间,并给出估计的标准差。( 1) 简单估计( 2) 比率估计量( 3) 对两种估计方法及结果进行评价。 解:(1)简单估计= 10 (324=1650 ,Y?uu3.7545 3.4 36 4.5 54 4.17)?则Y?u1650M05003.3,又 Y?1niY?i1660 165 ,所以 v(Y?u )N2 (1 f1)i2

25、N n Mi2(1 f2i )s2ini1mi单元 i居民人数 M i样本量 mi健身锻炼时间 yij13244,2,3,624552,2,4,3,633643,2,5,845464,3,6,2,4,6分别计算所以, v(Yu )1M0N2 (1 f1)i 10.11556(Y?iY?u)2n12 N n Mi 2(1 f ni1mi0.046285 0.162v(Y?u ) 0.402?所以标准差 s(Y?u )其中 Y?RY?RMM i yii1nMii1?3) 简单估计标准差 s(Y?u ) 0.402 ,比率估计标准差 s( y?R) 0.2647比率估计更好第五章不等概抽样习题答案5

26、.1 解:分析题目可知“代码法”与“拉希里法”都是 PPS抽样(放回的与规模大小成比例的 不等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行 改进:即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽 到规定的样本量且所有样本党员不重复:1)代码法:由 Zi =M0N i 可假设M 0 =1000000,则Mi = Zi M0列成数据表为: Mii1PSUMi累计 Mi代码111011011102185561866611118666362999816651866781665478216159881816661598815752452351261599

27、822351266739833091092351273091097765803856893091103856898389814246703856904246709407724654424246714654421022876488318465443488318113721492039488319492039122497151701049204051701013406545576645170115576641414804572468557665572468155577578045572469578045167078464882957804664882917696357184646488307184

28、64183465075311471846575311419694928226067531158226062036590859296822607859296213385389304985929789304922169599100088930509100082390669190749100099190742421795940869919075940869255918510000549408701000054我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数 为 444703, 615432 , 791937 , 921813 , 738207 , 176266 , 405

29、706 935470 916904, 57891 按照范围我们可以知道抽取的PSU9, PSU16, PSU19, PSU24,PSU18, PSU2, PSU8 PSU24 PSU23 PSU2, 我们看到第 2 组和 24 组重复抽取了, 故进行重新抽取,抽到 4 组和 6 组; 综上所述,抽取的样本为 2,4,6,8,9,16,18,19,23,24 组(2)拉希里法: M =78216,N=25,在 1, 25 和1, 78216 中分别产生( n,m):13,38678),M13 =40654 38678, 入样;8, 57764),M8 =3898157764,舍弃,重抽;23,1

30、3365),M23 =906613365,舍弃,重抽;19,38734),M19 =69492 38734,入样;以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为:2,3,5,6,7,12 ,13,16, 19,24 组5.2 解:由数据可得:Mit 1= y1j =20, t 2 j1M2y2jj125,t 3=38, t 4 =24, t 5=21;结合 t 值数据,我们可以推得 Z 的值Z1=M1M05250.2,Z 2=0.16,Z3=0.32,Z4=0.2,Z5=0.12,由公式4ZiZj 1 Zi Zj样本1,20.2737691,30.2174051,40.28307

31、91,50.2438262,30.1662512,40.2131422,50.2438263,40.6039033,50.535464,50.243826ij1 2Zi 1 2Z j 1NZii 1 1 2Z i5.3 解:设: M 0 =1,则有: M i Z i ,得到下表:i累计M i 1000代码10.104104104110420.19219229610529630.13813843429743440.0626249643549650.0525254849754860.14714769554969570.0898978469678480.0383882278582290.057578

32、79823879100.1211211000880100011000先在 1,1000 中产生第一个随机数为 731,再在 1,1000 里面产生第二个随机数为 103, 最后在1,1000 中产生第三个随机数为 982,则它们所对应的第 7、1、10 号单元被抽中。5.4 解:利用汉森 - 赫维茨估计量对总体总值进行估计:YHH1 n yii 1 Ziv Y HH11yiZiYHH1 32016 03.12308 2217.0061200.0622217.006290 2217.006 0.121110370.3 79254.7 32287.96 320 120 290 2217.0060.

33、138 0.062 0.121=20318.85.5解:由题可知6X0XiX i =2+9+3+2+1+6=23 i1i指标值 Xi包含概率 i120.17390.087290.78260.3913330.26090.1304420.17390.087510.0870.0435660.52170.2609由得下表:iXi nX0由上表显然有 Zi 1/2 ,于是我们可以采用布鲁尔方法:经计算可得下表:样本1,20.00681,30.01531,40.00971,50.00461,60.03972,30.16072,40.10462,50.05122,60.36133,40.01533,50.0

34、0743,60.0624,50.00464,60.03975,60.01912Y =11.5附注:(2)样本1,20.03401.26131,30.01330.21741,40.00760.1741,50.00380.13051,60.02270.34792,30.0510.52172,40.0340.47832,50.0170.43482,60.10210.65223,40.01130.21743,50.00570.17393,60.0340.39134,50.00380.13054,60.02270.34795,60.01130.3044验证:另外: 代入数据,经计算得到:5.6 解:i1

35、1071.432951.83531.6742125422平均63.61.78i11050101.43294591.8352551.67421022542042由题可计算出 :(1)Y6S2N1N 1i 1 Yi7 18.49 5 5.76 3 0 1 36 2 3618所以有: V y 1 f S2 =10.0625 n由以上计算结果可以看出: V Y R V Y HHV Y ,比估计在样本量很小的情况下即使是最小的方差也远比另外两种估计的方差大, 好。而简单估计又比 PPS汉森- 赫维茨估计略nm5.7 解:已知 n=2 m=5yiji1 j 1340 设公司总人数为 M 0(2) 由定义有

36、: 所以得到下表:i15.14825.741.4326.4832.41.836.01230.061.6747.236257.2362所以有下表:i1129651.844.61.4321846.873.8725.71.831717.268.6885.31.6742041.281.6486.3252041.281.6486.32(3)结合题目已知条件,我们选择的包含概率与 Xi 成正比:i17/181025.718.4925/18932.45.7633/18530041/182363652/1843636i Zi P (第 i 项被选中)VYN2Zi Y HH Y i1254.71由于这个样本是自

37、加权的,所以有:Y M 0yij M 0 340 34M 0 (分钟)nm i 1 j 1 10y Y 34 (分钟)M0所以该公司职工上班交通平均所需时间为 34 分钟s y y 15.62 (分钟)5.8 说明 : y6 2561解:由题可知: YHHn 101 n Yi1 10 yini 1Zi 10i1Zi1 10186 yi10 i 1 i495299.4 (吨)所以,全集团季度总运量为 495299.4 吨.V YHH 的一个无偏估计为因为 ?t /2=2.306所以?t / 2 95183360 =22497.8所以置信度 95%的置信区间为 472894.6 , 517890.

38、2第6章第 2 题证明:将总体平方和按照全部可能的系统样本进行分解,可以得到k n _22 (N 1)S2(yrj Y)2 *r1j1kn(yrjr1j1_ k n _ _22 yr)2 + (Yr Y)2 r1j1k _n (y rr1yr)nkk(yrr1_ k n2Y)2 +(yrjr1j1yr)根据V ( y sy )的定义,且 nk N ,有令 Swsy1 k(nkn1) r(yrj1j1yr)则有V(ysy) (NN1)S_ k n k(nN 1) Sw2sy证明:在样本量相同的情况下立即可得到当且仅当 Sw2sy S2 时,系统抽样优于简单随机抽样第3题解: k5.7 ,k 取最

39、接近于 5.7 而不大于 5.7 的整数 5,则将该班同学40 n7编号 140,随机起点 r=5 ,则该样本单元序号为 5,10,15,20,25,30,35。 N 35, n 7, k N 5。nSethi 对称系统抽样: r 5 ,入样单元为 :5 ,6,10,16,15,26,20 Singh 对称系统抽样:由于 n 为奇数,则从两个断点开始分层,最后中间的半层 取中间位置的单元, r 5 ,入样单元为: 5,31, 10,26,15,21,18第4题解:由题, N=360,k=8,则 n=N/k=451 第 45 r 1 j号住户的户主为汉族取 Yrj ,rj 0第 45 r 1 j

40、号住户的户主不为汉族r 1,2,L ,8 , j 1,2,L ,45 , 则可能样本如下表:jr145样本 均值样本内方差10.150.13564320.280.21890130.220.17226840.220.17226850.260.20670060.200.16003670.220.17226880.220.172268由上表可得:总体均值 Y 0.1972总体方差 S1 2451rYrj2Y 0.1588j1平均样本内方差 S?r 20.1769则: V ysy N 1S2 k(n 1)S?r2 0sy N N ?r运用简单随机抽样: n=45, f 45 0.125, V ysys

41、 1 f S2 0.0031360 sys n显然: V ysys V ysy ,说明等距样本的精确度较简单随机样本的精确度要高。第 5 题 答:欲估计汉族所占比例,选择第种系统抽样的方法好。按照题给条件排序,在户 口册中每 5人中抽 1 人,且平均每户有 5口人,分布较均匀,且如此抽样,每户 人家基本均有 1 人入样。男性所占比例与孩子所占比例。采用简单随机抽样的方法较合适,因为按题条件 排序后,采用等距抽样,若抽得初始单元为 1,则男生比例为 1,孩子比例为 0, 如此,则有较大误差。第6题解:取 Yrj =1,若总体中第 r 群 第j个单元具有所研究的特 征0,若总体中第 r群 第j个单

42、元不具有所研究的 特征y sy ,即对总体比例的估计可化成对总n体均值的估计。 估计男性所占比例:则,取1,第r群第j个单元为男性0,其他则总体比例 P 的简单估计量为 P=P=1 yrj n j 112345678910群 平均群差 S2r111100100010.50.200011011100.50.300100001000.20.411010010010.50.500111111100.70.Yrj =由题意,系统抽样 K=5 ,n=10,则所有可能样本如下表:总体均值 Y1 5 101Yrj0.48Nr1j11 5 10 _总体方差 S21(Yrj Y)2 0.2547 ,N 1r 1

43、 j 115平均群内方差 S.r2 1 Sr2j 0.24895j1以行为“系统样本”的系统抽样: k=5,n=10V(ysy) N 1S2 k(n 1) Sw2sy N 1S2 k(n 1) S.r2 0.02559 0.0256 简单随 sy N N wsy N N .r机抽样: n=10,f=20%=0.2V(ysy ) V(y) ,说明简单随机抽样精度较高 估计孩子所占比例:取 Yrj =1,第r 群第j个单元为小孩0,其他由题意,系统抽样: k=5, n=10,则所有可能样本如下表:12345678910群 平均群差 S2r100001000100.20.200000011000.2

44、0.311100110010.60.411111110100.80.511011001100.60._ 1 5 10 总体均值 YYrj 0.48N r 1j 11 5 10 _总体方差 S21(Yrj Y)2 0.2547N 1r 1 j 115平均群内方差 S.r2 1 Sr2j 0.2134.r 5 j 1 rj 以行为“系统样本”的系统抽样: k=5,n=10 简单随机抽样: n=10, f=20%=0.2V(ysy ) V(y) ,说明简单随机抽样精度较高 估计具体某种职业的住户人员的比例:取1,满足条件0,不满足条件由题意,系统抽样 K=5 ,n=10,则所有可能样本如下表:123

45、45678910群 平均群差 S2r111100000010.40.211100000010.40.311100000010.40.411100000010.40.511000000010.30._ 1 5 10 总体均值 YYrj 0.38Nr1j15 10总体方差 S N 1r 1 j 1 (YrjY)20.240415平均群内方差 S.r2 1 Sr2j 0.265j1以行为“系统样本”的系统抽样: k=5,n=10简单随机抽样: n=10, f=20%=0.2V(ysy ) V ( y) ,说明系统抽样精度较高 第7题解:由题, N=15, n=3,直线等距抽样 k= N =5, 则所有可能样本如下: n总体方差 S2N1i 1(Yi1 i 1Y)220r可能样本样本均值样本方差116116252271272533813825449149255510151025总体均值 YN1NiYi1815平均样本方差 S.r2 51i 1Sr2i 25则以直线等距抽样:简单随机抽样: n=3, f= n =1/5=0.2NV(ysy ) V ( y) ,说

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论