《抽样技术》第四版习题答案_第1页
《抽样技术》第四版习题答案_第2页
《抽样技术》第四版习题答案_第3页
《抽样技术》第四版习题答案_第4页
《抽样技术》第四版习题答案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.1解:(1 )这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为164的这些单元中每一个单元被抽到的概率都是O100(2 )这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中2 一 , ,、,的编号为135以及编号为64的这36个单兀中每个单兀的入样概率都是*,而尚未被100 11抽中的编号为3663的每个单元的入样概率都是。10020 000(3)这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为一一 1 21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。1 000解:项目相同之处/、同之处定义都是根据从一个总体 中抽样得到

2、的样本,然 后定义样本均值为_1 1y 一 yi。n坦抽样理论中样本是从有限总体中按放回的抽样方法得到的,样本中的样本点不会重复; 而数理统计中的样本 是从无限总体中利用有放回的抽样方法得到的,样本点后可能是重复的。性质(1)样本均值的期望都 等于总体均值,也 就是抽样理论和数 理统计中的样本均 值都是无偏情计。(2)不论总体原来是何 种分布,在样本量 足够大的条件下, 样本均值近似服从 正态分布。(1)抽样理论中,各个样本之间是不独立的;而数理统 计中的各个样本之间是相互独立的。(2)抽样理论中的样本均值的方差为1 - f 291_ - 2V y S ,其中 S2 Y Y 。nN -1V)

3、.、,._199在数理统计中,V(y) = -CT ,其中仃为总体的n力差。解:首先估计该市居民日用电量的95%勺置信区间。根据中心极限定理可知,在大y - Yy - E y_样本的条件下,近似服从标准正态分布, Y的1 -a =95%的置信区V y,v y间为 y -za2/V(y , y + z*2 W =y -1.96WTTi,y +1.96而7r。 TOC o 1-5 h z 1-f_2._22一而V (y )= S中总体的方差S是未知的,用样本方差s来代替,置信区间 n为 卜1.96 匹Ts,y +1.96+/上fs I. n: n由题意知道,y =9.5,s2 =206 ,而且样本

4、量为 n =300, N =50 000,代入可以求得_1 - f 2 1 -300 50 000、v(y) =s =X206 = 0.682 5 。将它们代入上面的式子可得该市居民 HYPERLINK l bookmark68 o Current Document n300日用电量的95%置信区间为一7.8808,11.1192。下一步计算样本量。绝对误差限d和相对误差限r的关系为d = rY。根据置信区间的求解方法可知I 卜丫|I,丫 根据正态分布的分位数可以知道p 口小3,所以v(y)=!W(y)!”,1也就是1 n把 y =9.5,s2 =206,r =10%, N =50 000 代

5、入上式可得,n = 861.75之 862。所以样 本量至少为862。2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P的估计值p一、,1 - f N_ ri、 1 P-P,i,r, 的方差V(p ) = 1-Jp(1-P ),利用中心极限定理可得P在大样本的条件下近n N -1V p似服从标准正态分布。在本题中,样本量足够大,从而可得P的1-口 =95%的置信区间为p-z/vfp p+zW(P而这里的 V(p)是未知的,我们使用它的估计值A1 一 fV( p)= v( p尸 一-p(1 _ p)= 9.652m 10”。所以总体比例P的1 a = 95%的置信区间 可以写

6、为-p%2Mp i p十方2 Jv(p )1将p =0.35,n=200, N =10 000代入可得置 信区间为 一0.284 4,0.415 6。解:利用得到的样本,计算得到样本均值为y = 2 890 / 20 =144.5 ,从而估计小区的平均文化支出为144.5元。总体均值Y的1 a =95% 的置信区间为y-z/Mfjy+zeWTy斗 用v(y)=1nfs2来估计样本均值的方差 v(y”21 - f 210.1计 算 得至 US2=826.025 6 ,贝 Uv(y)=S2=父8 26. 0=25 6 ,37.172n 20Za2 W(1)T.96父137.172 =11.95,代

7、入数值后计算可得总体均值的95%的置信区间为132.55,156.451。解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量Y的估计值为Y =350y =350父1 120=3.92父105 (吨)。A N2 1 - fV Y )n总体总值估计值的方差为f =2,方2 =1.96 代入 N -S2,总体总值的1a 9 95%的置信区间,把 Y = 3.92 105,S2 = 25 600,n = 50, N =350,可得粮食总产量的1 -a = 95%的置信区间为377 629,406 37110解:首先计算简单随机抽样条件下所需要的样本量,把N =1 000,d

8、 =2,1=95%, S2 =68 带入公式 n = 1.上N z-./2 S最后可得n0 =61.3 %62。如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为n =n0/70% =88.57 生89。解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为 X =213 5。利用去年的化肥总产量,今年的化肥 总产量的估计值为 Yr = RX=x=2 426.14吨。x1 - f 22.9解:本题中,简单估计量的方差的估计值为v(y尸 s =

9、37.17。n利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为X。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。文化支出的比率估计量为 yR =RX =2X ,通过计算得到=2 890/20=144.5 ,而 x_: y 1445_x = 1580 ,则R = y= 00915 ,文化支出的比率估计量的值为yR =146.3 (元)。x 1580 x现在考虑 比率估计量的 方差,在样本量较大的条件下, 1 - f _ 2 _ 2 _ 2V(yR谆MSE(yR谆 (S -2RPS,Sx +

10、 R Sx通过计算可以得到两个变量的样n八2 2 4_本万差为 s =826,Sx = 9.958 10 Y和X之间的相关系数的估计值为P = 0.974,代入上面的公式,可以得到比率估计量的方差的估计值为v i yR )= 1.94。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的1a 9 95%的置信区间为yR ),yR +aJv(yR )= yR-1.96&(京),yR + 1.961v(yR把具体的数值代入可得置信区间为143.57,149.031。,-,-)V yR f vl yRLR194接下来比较比估计和简单估计的效率,定9= = 0.052 ,这是比估V(y)

11、v(y) 37.17计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。解:利用简单估计量可得 y =Z yi/n =1 630/10 = 163,样本方差为s2 = 212.222,1 - f 2 1-10/120N =120,样本均值的方差估计值为 v y =s2=父212.222= 19.453 7。n10利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为P = 0.971 ,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原

12、重量为辅助变量。回归估计量的精度最高的回归系数P的估计值为P = P= 0.9711468 = 1.368 0Sx10.341现在可以得到肉牛现重量的回归估计量为ylr = y +P J X _ x l,代入数值可以得到ylr =159.44。回归估计量ylr的方差为 Vylr 1定MSE,ylr】定LfS2(1 P2),方差的估计值为 nr-)i_f / v ylr 1=s 1 P =1.112,11nL 显然_- y 1-f of A 2 )v ylr 1=s 1P ,代入相应的数值,11nL 有v.ylr :v(y卜在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量 的精度要

13、好于简单估计量。解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中 最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。 这样才能使得最后获得的样本有很好的代表性。对几种分层方法的判断如下:(1)选择性别作为分层变量,是不合适的。首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性的抽样

14、框,这样会更加麻烦,也会使抽样会变得更加复杂。(2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查 研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革的态度差异比较小,因为他们属于相同的阶层, 而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的要求。 所以,按照职称进行分层是合理的。(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机 抽样,

15、有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简单随机抽样更加方便实施。解:设计的方案如下:第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证每个新生的入样概率相等,因为每个专业的人数比例未知,8个人的样本量无法在每个层之间进行分配。所以采取如下方法:对所有的新生按照专业的先后顺序进行编号,使得每个专业的人的编号在一起, 然后随机选取出一个号码,然后选取出这个号码所在的专业,选取出 这个专业,再在这个专业的所有新生中按照简单随机抽样的方法选取出 保证每个人入选的概率

16、是相等的。第二种方案:也可以按照性别进行分类,对他们进行编号,为 号都在一起,女生的编号也都在一起,然后随机选取出一个号码, 性别,然后从这个性别的所有人中按照简单随机抽样的方法选取出 证所有的新生的入样概率是相同的。8个人。这样就可以1800,使得男生的编 然后看这个号码所对应的8个新生。这样就可以保第三种方案:随机地把所有的人分成 8组,而且使得每组的人都是 100个人,这样分组完成后,每个组的新生进行编号为1100,然后随机抽取出一个号码,再从所有的小组中抽取出号码所对应的新生,从而抽取出8个人。解:(1)首先计算出每层的简单估计量,分别为 y1 =11.2, y2 =25.5,y3=2

17、0,其= 0.3033,W4=0.497 6,W3 = 0.1991中,M =256,心=420, N3 =168,N =844 ,则每个层的层权分别为;yst =2 Wh yh ,代入数则利用分层随机抽样得到该小区居民购买彩票的平均支出的估计量 值可以得到 yst = Wh yh =20.07。_3 c1_ f购买彩票的平均支出的的估计值的方差为V , ys= Wh2Lhs;,此方差的估计值h 拆1 - fK 0 -为 v yst ;=whh 1二fhs2 ,根据数据计算可以得到每层的样本方差分别为:nh2_2 2S1 =94.4,S2 =302.5,8 =355.556其中=电=% =10

18、,代入数值可以求得方差的估计值为v yst=9.473 1 ,则估计的标准差为s i yst =tv1 yst ) = ,9.4731 =3.08。rY(2)由区间估计可知相对误差限满足Pyst -Y- r Y所以zd2, v(yst 产_ QrYzO(2J样本均值的方差为 V(yst )= W;js2= W-1-L WhS2 ,从而可以得 hj 询 n N到在置信度为0(, 相对误差限为r条件下的样本量为 Wh2S2 -h W2S2 -hn =2。V ystTTWhS2rYzWhS;对于比例分配而言,有Wh =h成立,那么、WhSh1 一 一 2NWhSh的估计值和数值1 a =95%,r

19、=10%代入后可以计算得到样本量为n =186 ,相应的在各层的样本量分别为 n1 = 56.4 定 57,n2 = 92.6 上 93,n3 = 186 n1 n2 = 36。按照内曼分配时,样本量在各层的分配满足h =WhSh/Z W1sl ,这时样本量的计2_, _、W1sh一 口一算公式变为n=z,把相应的数值代入后可得n = 175,在各层中-21丫 Z:2: WhS2的分配情况如下:n1 = 33,n2 = 87, n3 = 186 n1 n2 = 66。3.4 解:(1)首先计算得到每层中在家吃年夜饭的样本比例为p =0.9, P2 = 0.933 3, P3 = 0.9, p4

20、=0.866 7, P5 = 0.933 3, p6 = 0.966 7,那么根据每一6层的层权,计算得到该市居民在家吃年夜饭的样本比例为pst=z Whph =92.4%。h 1每一层中在家吃年夜饭 的样本比例的 方差为V ph 二 j 工Ph 1-Ph = Nh nh R JR ,则该市居民在家吃年夜饭的比例 nh Nh -1Nh -1nh壬 4 A621、6 N2 Nh -nh的万差,在 心1之M的条件下,V(psJ = Wh2V(ph) = 1h-hdN hdNh -1PhPh 仁 Wh2。- fh二PJ,而其中每层的吃年夜饭的样本比例的方差的估计nhhinh值为v(ph户匕fhL p

21、h(1 _ ph户Nh -nh ph(1- ph),则样本比例的方差的估计值 nh nh -1Nhnh -122为 v Pst )=,Wh v Ph :尸,Wh 1 - fhPh 1 - Phnh - 1把相应的数值代入计算可得方差的估计彳1为v(pst )=3.9601父10工,从而可以得到该估计值的标准差为s( pst )=0.019 9。(2)利用上题的结果, Wh2S2-h Wh2Sh,hn =1 一 221 一 2V PstN” WhShrP Z- 2WhSh差是S2 =-NPh(1Ph ),在Nh1忠Nh的条件下,近似有 S2 =R(1 Ph )。Nh -1一 _ 2比例分配的条件

22、下,有WhSh2,一Wh 二环成立,那么n =,把相应的212rP z- 丁 WhS2估计值和数值代入可以求得最终的样本量应该是n = 266 3 ,样本量在各层的 分配是 n1 =479. 34 47r9,= 559生 23 n5=9,37 2. ,83n4 =3739.67 % 240 ,n5 =426.08 %426,n6 =585.86 %586。2、W1sh内曼分配条件下,sh =WhSh/ WhSh ,则n =,代入相rP Z: 2 2WhS2N应的估计值和数值可以计算得到样本量为n = 256 5 ,在各层中样本量的分配为 n1 =536, n2 =520,n3 =417,n4

23、= 304,n5 = 396,n6 = 392。解:总体总共分为 10个层,每个层中的样本均值已经知道,层权也得到,从而可10以计算得到该开发区居民购买冷冻食品的平均支出的估计值为Vst = Whyh = 75.79。h 1下一步计算平均支出的 95%的置信区间,首先计算购买冷冻食品的平均支出的估计值的-10 o1- f.方差,其中V . yst = Wh21一fhS;,但是每层的方差是未知,则样本平均支出的方差的hdnh_101 _ f样比可以忽略,计算可以得到_10v yst 八Wh2h 1口 s2亡59.825 4。则这个开发区的居民nh估计彳1为v. yst = Wh25s2 ,每个层

24、的样本标准差已知,题目中已经注明各层的抽 h+nh购买冷冻食品的平均支出1-a =95%置信区间为y-1.96(st ,y+i.96?st代入数值后,可得最终的置信区间为60.63,90,951。解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到3总体的比例为P = WhR =0.28 ,则样本量为100的简单随机样本的样本比例的方差为 h1 - f _2,一一一1 2 . _2 NV(p) = S2 ,不考虑有限总体校正系数, V( ph S2,其中S2 =P(1-P),nnN -1在N -1定N的条件下,通过简单随机抽样得到的样本比例的方差为1 - f 2 1_3V p

25、 =S2P 1 -P =2.016 10n n2 1 - fh 2通过分层抽样得到的样本比例的方差为V( pst ) = Wh h Sh ,但是因为不考虑有nh限总体校正系数,而且抽样方式是比例抽样,所以有 =四=6h =曳成立,样本比例的Nn2方差近似为V(pG=Whh=-ZWhS;。对于每一层,分别有Sh2=-NPh(1-Ph),n nNh -1在Nh -1定Nh的条件下,近似的有 S = Ph(1 Ph )成立,有S2 =0.09,S2 -0.16, S3 -0.24、W1S,、 ,八 八样本量应该满足n=v,同时这里要求分层随机抽样得到的估计的方差和简单抽样的方差是相同的,V(pst

26、)=V(p),层权分别为 W,=0.2,W2=0.3,W3=0.5,代入数值,可以计算得到最终的样本量为n =E WhS1 = 一0.186 a 9 92.26之93。V pst2.016 10“3.7解:事后分层得到的总体均值的估计量和估计量的方差分别为E ypst =Y,E Var ?。盘 TOC o 1-5 h z 1-f-21 -21 - f 2工 WhS2 +-2Z (1 -叫 封,估计量的方差的估计值v ypst )= Z W1s2 + HYPERLINK l bookmark92 o Current Document nnn1221 -W 6 n对于几种说法的判断如下:(1)事后

27、分层比简单随机抽样产生更加精确的结果,这个说法是错误的。从事后分层得到估计量的方差的估计值来看,它的方差不一定比简单随机抽样的要小,而且从事后分层得到的样本是利用简单随机抽样的方法得到的,只是在计算估计量和估计量的方差时是按照分层随机抽样来处理,而且事后分层要求层权是已知的,但是当层权未知从而利用样本来估计层权时,就会产生偏差,事后分层不见得比简单随机抽样产生更精确的结果。(2)事后分层比按比例分配产生更精确的结果,这个说法是错误的。从事后分层得到的估计量的方差的估计值可以看出,它的第一项就是按照比例分层抽样得到的估计量方差的估计值,公式中的第二项表示的是按事后分层时各层样本量与按照比例分层时

28、各层样本量发 生偏差所引起的方差的增量。(3)事后分层的最优分配产生更精确的结果,这种说法是错误的。事后分层在样本量足够大的条件下是与比例分层相当的,但是在一般条件下,事后分层的精度仍然低于比例分层的,那么事后分层的精度也会高于最优分配的精度。(4)在抽样时不能得到分层变量,这个说法是正确的。事后分层在抽样时,是利用简单随机抽样的方法, 在抽样时不涉及按照变量进行分层,至于按变量进行分层, 是在抽样完成后,然后根据具体的变量来对样本进行分层。(5)它的估计量的方差与真正按照比例分层随机抽样的方差差不多,只有在样本量足 够大的条件下才成立。在样本量足够大的条件下,从事后分层的方差的计算公式可以看

29、出, 它的第二项会趋于 0,这时事后分层的估计量的方差和分层随机抽样的方差差不多。3.8解:(1)根据简单随机抽样的公式,登记原始凭证的差错率的估计值为p =1003% ,在考虑到f上0,N之N -1的条件下,登记的原始凭证的差错率的估计量的方差近似S2.3 , n N -1 TOC o 1-5 h z 114则估计量的万差的估计值为v( p) = p(1p),计算得v(p) = p(1p)=2.9M10 ,则原始凭证的差错率的估计的标准差为s(p ) = Jv(p) = 1.71父10。(2)这里,每个层的层权是事先知道的,那么利用事后分层来计算登记原始凭证的差 HYPERLINK l bo

30、okmark83 o Current Document 21错率的估计值为 ppst = Whph =2.68% ,在这里 口=一 = 2.33%, p2 =3.51%。hm43, r,、“,1 - f利用事后分层得到的原始凭证的差错率的估计量的方差的估计值为v( ppst)=J-fnc 11W Whs2+2 (1 -W, )s2,在不考虑有限校正系数的条件下,又可以写为V ppst )= HYPERLINK l bookmark176 o Current Document nn HYPERLINK l bookmark94 o Current Document W Whph(1-ph)+;工

31、(1-Wh)n-ph(1- ph ),其中W1=0.7,W2=0.3,n, -1n% 一1n =43,02 =57,可以得到v(ppst )=2.689 5黑10”,则相应的标准差为 s( ppst产3.9解:(1)所有可能的样本的数量为C; mC; =9 ,所有的样本如下:3,0,5,3 , 8,6,15,9厂3,0,5,3 , 8,6, 25,15 ),13,0,5,3 , 25,15 , 15,9),3,0,10,6 , 8,6,15,9:):3,0,10,6 , 8,6, 25,15 ,:3,0,10,6 , 25,15 , 15,9 :,,1 5,3,10,6 , 8,6,15,9V

32、:5,3,10,6 , 8,6, 25,155,3,10,6 , 25,15 , 15,9 ? 我们用9个样本中的一个来计算, 假定抽中的样本为(5,3),(10,6),(8,6),(25,15)。首先按照分别比估计来估计Y ,首先可以得到分层后的辅助变量的总体均值分别为X1 =6,X2 =16。在这个样本中,经计算得到X =7.5,X2 =16.5, y1 = 4.5, y2 = 10.5 , TOC o 1-5 h z AAR1 =0.6, R2 =0.64 ,而且W1 =W2 =0.5 ,则根据分别比估计可得Y的估计值为yRs =_上 _W Wh yRh =L Wh RhXh =6.89

33、1。利用联合比估计时,首先计算得到辅助变量的总体均值X =11,然后利用样本得到的_上主要变量和辅助变量的样本均值为yst=7.5,xst =12, Rc =7.5/12 = 0.625 ,则利用联合比一估计得到的Y的估计值为yRC = Rc X =6.875。在计算分别比估计和联合比估计的偏差,这里的方法是利用所有可能的样本,然后计算出比估计和联合估计的估计值,按照与上面相同的计算方法,计算得到其他样本时比估计和联合估计值(按照上面的样本的排列顺序)为:yRS1 -6.342, yRC1 -6.387, yRS2 -6.216, yRC2 -6.439, yRS3 -5.925, yRC3

34、-6.188,yRS4 =6.602, yRC4 = 6.243, yRS5 =6.476 yRC5 = 6.457, y. =6.185, yRC6 =6.227,yRS7 =7.017, yRC7 = 6.947, yRS8 =6.6, yRZZ 6 6.6, yRS9 = 6.891,yRC9 = 6.875_分别计算可得E yRS=-i9 h myRSh =6.473, E yRC1 9 -=Z yRCh =6.485 ,而且可以9hi_计算得到var I yRC= 0.076, var. yRS =0.121。总体的实际均值为 Y = 39/6 = 6.5。则分别比估计和联合比估计的

35、偏差分别为E yRs-Y -6.473 -6.5-0.027, E I yE 1 yRC |-Y_ = 0.0150.021 313,第 6 号单元入样;把单元6去掉,剩余的24个单元,maxZi仍旧等于0.078 216 ,在1,24和1, 0.078 216中分别产生随机数(10, 0.031 543),乙0 =0.022 876V(ysrs)。其中“系统样本”“系统样本”的单元组成“系统样本”“系统样本”随机起点号码r中男性总数ar中男性比例Pr1M M M F f M F F f M50.52F F F M M F m m M F50.53f f m F F f f M F f20.2

36、4m m f m f f m F f M50.55f f M m m M M m m F70.7(2)估计孩子所占比例。已知总体容量 N=50,孩子总数 A=24,孩子所占比例 P=A/N=0.48o1 - n- f 2 N 1简单随机抽样:V(ysrs)=-n S =-n g Np(1-p) = 0.020 41 卜21 k2系统抽样:V(ysy)二厂5-)(p产)= 0.057 6 I 1I 1则 V(ysy) AV(ysrs)。(3)估计职业住户中人员所占比例。已知总体容量 N=50,职业住户总数 A=19,职业住户所占比例 P=A/N=0.38。n,-1 1 -f 2 N 1简单随机抽

37、样:V(ysrs) = -S2 =N nI NP(1 -P) =0.019231k21 k2系统抽样:V(ysy) = kr(_;-_) =kr=1(pr-p) =0.0016则 V (y sy) v(N)(n1 1)(n2 1)(n1 - m)(n2 - m)2_(m 1) (m 2)定4 (人)其95%的置信区间为:N -1.96 ;v(N1) =20 -1.96 4 =12,28(2)由题意知:ni=16, n2=19, m=11,该地区渔民总数为 JR11)(n21)-1(16 1)(19 1)1111之28 (人)其抽样的标准误为:s() - .:V()其95%的置信区间为:(n11

38、)(% 1)(n1 m)(n2 -m)(m 1)2(m 2)之3 (人)N _1.963v(N) =28 -1.96 3 =22,34(3)计算这些估计时的前提假设:总体是封闭的 一一两次抽样间没有渔民进入或离开该地区,即对每次抽样而言,N是相同的。这要求渔民在两次抽样间不能离开该地区,其他渔民也不能进入,但这在实际中是很难做到的。每个样本都是来自总体的简单随机抽样,即该地区每个渔民都有同样的机会被找到。在实际中由于渔民所在地和作业时间的不同,不可能每一个渔民在调查时都能被找到,比如某些住在偏僻位置的渔民被找到的机会就会小些。两个样本是独立的,即渔民第一次被找到的概率跟第二次能否被找到的概率没

39、有关系。不会丢失第一次被找到的渔民资料,即第一次被找到的渔民,在第二次被找到时可识别。 N近似服从正态分布。解:(1)如果NCRSR和BDMP登记体系是两个独立的系统, 也就是两个系统在登记病 人时是独立进行的,病人出现在 NCRSR中的概率与出现在 BDMP中的概率无关,那么作 者的认识就是正确的。第一,满足总体是封闭的假设,NCRSR和BDMP登记系统都是针对全国人口进行登记,而且是在同一段时间范围内进行,因此总体单元数是一样的。第二,满足标识不丢失的假设, 先天性风疹综合征在出生时就会被确定出,不会因为以后是否恢复而被更改。第三,可能不满足每个样本都是来自总体的简单随机样本。简单随机样本

40、要求每个样本入样概率相同,从全国范围看,这一假设不一定能满足。 比如由于抽样框的原因, 偏远地区 或者欠发达地区的人群被登记的概率会低于中心地区或者发达地区。(2)由公式(7.21)得每年的N如下表:年份NCRSR( n1)BDMP( n2)两者均有(m)N19704515224419712330951972206248197322133801974126145197522911141976157242197713833119781892621979391121591980124132198140041982112035198330031984300319851001(3)累计所有年份的数据,

41、得至ij nio=263, n20=93, m0=19,由公式(7.21)得到19701985年间 先天性风疹综合征的总病例数为:甫0=(-10+1)(3 +1)-263 +-9”1).三1 240 (人) m0 119 - 1累计(2)的估计结果得到1970-1985年间先天性风疹综合征的总病例数为998人。从结果上看,我们认为(3)的计算结果更可信,因为(3)的样本量足够大。(4)直观上由下图发现先天性风疹综合征的患病人数是在下降。第8章解:(1)原假设:患有妇科疾病与是否遭受配偶性虐待相互独立。在原假设成立 条件下,各单元格的期望频数为:nc 17 20E(nn)= =2.881 4n1

42、18E(n12)=2 J7 98 -14.118 6n118ES1)3 nEg 3 n101 20=17.1186118101 9883.881 4(2)2 = v所有单元格(观测频数一期望频数)期望频数2=12.7917P( 2 . 1 2.7 9 1-7 )0. 0 03 48118如果显著性水平0( =0.05,拒绝原假设,即认为妇科疾病与是否遭受配偶性虐待不独. o(3)应用传统的卡方检验方法的前提是样本中各观测值的权数相等。本题中样本由于存 在无回答情形,各观测值的权数不一定相等,因此传统的卡方检验方法不合适。Nv (Xi -Xu)(yi - Yu)解:设总体相关系数为P = ,其中

43、Sx , Sy为总体标准差。(N -1)SxSyyN(Xi -元)(yi - yu)2:22. ._2(X -Xu)、(yi - yu)(x (x -Xu)(yi -%)% (x -Xu)(yi - yu)i =1N (x -Xu)2i =1i WNv (yi - yu)2i=1(x -Xu)(yi - yu)N XV - NXupu i 1N-(Xi - % ) i 1N- 2 2X - Nxui 1所以2(2) Rtx2N xy -i 1N、Xi2 -i 1:2 X-yiNr x)2NrR2txty(tXy -N)2=Bix)2n ty2(ty),这里tx-N=工 Xi。i =1 TOC

44、o 1-5 h z 、WiX尸 w、y i工s i工s2WiXiyi :i.sWi(3)R2 =2一9茶WiXi)Wiyi)2 i :s2 i 5sWiXi -Wiyi -i.sV Wii.sXWii.si.s9.1解:首先计算每套子样本中的居民家庭平均年总收入,结果如下表所示:子样本12345平均收入17.818.719.31919用a ( j=1, 2, 3, 4, 5)表示每套子样本中的居民家庭平均年总收入,则 TOC o 1-5 h z 二-“=18.765j J从而?1 I15? 2V 甲=I? 0. -0-=0.066 65*5-1)j 工 j 1)的95%置信区间为:? -t1_

45、-.2 k -1 , v 3 ); =18.76 一2.776 0.066 6 - 18.575,18.945 19.2解:要估计的比率是 R = x/y ,其中,X和Y分别是该地区的劳动人口数和失业人数。由于每层的权重一样,故R的估计为:43.一 .一 yjI? = j- =359/3 643=0.09 854 516 43、xj i 3 j 3现采用刀切法估计失业率R的方差,将每个层视为一组,从而有y y2jy3j、y4jj 1j 1j 13、 X2j j=13X3j j 13 V X4jj=1=271/2 681=0.1 010 8173. %jj 1二.x1 j j 13、:y3jj

46、133J . 丫句=259/2 691=0.09 624 6753一二:X3jV X4j3 %jj 1、X1j j 43y2j j 13X2j j 43 y4j=276/2 777=0.09 938 7833V X4jj 1%=3、yjj 13y2j j 133y3j=271/2 780=0.09 748 2013、X1j、X2j、 X3j因此有F?=4月-(4 -1 )R1)= 0.090 936R2=4月-(4 -1 )R2)= 0.105 44R3= 4F?-(4-1 弭3)= 0.096 017R4 =4目-(41)R(4)=0.101 735根据刀切法,估计该区的人口出生率为:F1=1 总R2甩 总=0.098 5324R的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论