抽样技术课后习题答案_第1页
抽样技术课后习题答案_第2页
抽样技术课后习题答案_第3页
抽样技术课后习题答案_第4页
抽样技术课后习题答案_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章习题

2.1判断下列抽样方法是否是等概的:

(1)总体编号1〜64,在0~99中产生随机数r,若r=0或r>64则舍弃重抽。

(2)总体编号1〜64,在0〜99中产生随机数r,r处以64的余数作为抽中的数,若余数为0

则抽中64.

(3)总体20000〜21000,从1〜1000中产生随机数r。然后用r+19999作为被抽选的数。

解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机

原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的.第三,当用样

本对总体目标进行估计时,要考虑到该样本被抽中的概率。

因此(1)中只有1〜64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)

是等概的。

2.2抽样理论和数理统计中关于样本均值y的定义和性质有哪些不同?

解析:抽样理论和数理统计中关于样本均值的定义和性质的不同

抽样理论概率统计

1n

y=-Ey,

定义n,=i

几2

1.期望£(y)=方⑴*)=方G)/=亍i.期望喇=:辛&)

i=li=l5

2=-[n/z]=/z

2.方差厂药(J不)

n

/=1

2.方差V(y)=E[匕一〃]2

C",2

性质

i=\5

L«/=)J

4S2

n12

2

=-£:(y.-A)

nn

2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300

户进行,现得到其日用电平均值7=9.5(千瓦时),s2=206.试估计该市居民用电量的95%

置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少?

解:由已知可得,N=50000,n=300,y=9.5,s2=206

]300

2

V(y)=v(Ny)=N上£$2=5000C?—迎理*206=170636666(

n300

Vv(^)=71706366666=4130819

该市居民用电量的95%置信区间为

[[Ny±7^00]-1475000+1.96*41308.19]

2

即为(394035.95,555964.05)

由相对误差公式W10%

y

可得1.96*^1-n50000*206<9.5*10%

即n2862

欲使相对误差限不超过10%,则样本量至少应为862

2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。

随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训

班的比例的95%置信区间。

解析:由已知得:N=10000〃=200〃=0.35/=—=0.02

N

又有:E(i)=E(〃)=p=0.35V(p)=^^p(l-/?)=0.0012

n-\

该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:[E(5)土

~2

代入数据计算得:该区间为[0.2843,0.4157]

2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取

一个容量为20的样本,调查结果列于下表:

编号文化支出编号文化支出

120011150

215012160

317013180

415014130

516015100

613016180

714017100

810018180

911019170

1024020120

估计该小区平均的文化支出手,并给出置信水平95%的置信区间。

解析:由已知得:N=2(X)〃=20

_120

根据表中数据计算得:y=」-£y=144.5

20金

52=—!—yfv.-y)2=827.06842

20-1

V(y)=-(l-—)52=37.21808”(1)=6.1()01

nN'

该小区平均文化支出歹的95%置信区间为:口土Zq即是:[132.544,156.456]

2

故估计该小区平均的文化支出歹=144.5,置信水平95%的置信区间为[132.544,156.456]。

2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到

亍=1120(吨),§2=2560,据此估计该地区今年的粮食总产量,并给出置信水平95%的

置信区间。

解析:由题意知:亍=1120/=—=^-=0.1429§2=2560ns=160

7N350

置信水平95%的置信区间为:丘土z.J匕/s]代入数据得:

2Vn

置信水平95%的置信区间为:[1079.872,1160.872]

2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置

信水平95%,现根据以前的调查结果,认为总体方差整=68,是确定简单随机抽样所需的

样本量。若预计有效回答率为70%,则样本量最终为多少?

NZ,:S2

解析:简单随机抽样所需的样本量々=——一〃2=—j

Nd'zW〜70%

Za=1.96

由题意知:N=1000d=2S2=681

ACAAi”,=q=87.142。87

代入并计算得:々=61.3036。61-70%

故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为87

2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,

抽取10个企业调查今年的产量,得到丁=25,这些企业去年的平均产量为x=22。试估计

今年该地区化肥总产量。

解析:由题可知友=22,N100y=25

——y25

Y=X-==21.35—=24.26

则,该地区化肥产量均值「的比率估计量为X'24

A▲

该地区化肥产量总值Y的比率估计量为Y=NYR=100*24.26=2426

所以,今年该地区化肥总产量的估计值为2426吨。

2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:

单位:元

编号文化支出总支出编号文化支出总支出

12002300111501600

21501700121601700

31702000131802000

41501500141301400

51601700151501600

61301400161001200

71401500171801900

81001200181001100

91101200191701800

101401500201201300

全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%

的置信区间,并比较比估计和简单估计的效率。

1n1

又=—Zxi=—(2300+1700+…+1300=1580

11

解析:由题可知i=i20

9=144.5

1445

我=r=上---二0.091

X1580

NR=又g=1600144.5

=146.329

又X1580

一»=826053

58

1n

22

Sv=—5—¥(%,-x)=8831579

故平均文化支出的95%的置信区间为

①-⑻-2Asyx+R":),]R+Z「/2j一S一2双£+」S二)]

代入数据得(146.329+1.96*1.892)

即为[142.621,150.037]

2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,

3个月后再次测量,结果如下:

单位:千克

编号原重量现重量

195150

297155

387140

4120180

5110175

6115185

7103165

8102160

992150

10105170

用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行

比较。

1n1

解:由题可知,X=-Vx.=—(95+---+105)=1026

n白10

y=-yyi=—(150+---170)=163

10

1〃1

八百45丁⑼。72222

1〃I

邑,=—(%一刃(工]君=x*1317=146333

〃一1仁9

1fl1

22

Sv=—5—y(x,.-x)=±*9264=106933

〃一1片9

146333

故有功1.368

106933

所以总体均值F■的回归估计量为

y/r=y+/^(X-x)=163+1.368*(100-1026)=159443

其方差估计为:

—2£。5孙,)

i-12"

=^20(212222+1.36^*106933-2*1.368*146333

=1.097

而R(y)=匕/S?

n

1-10/

=——d2Q*212222

10

=19.454

显然之见)<0(历

所以,回归估计的结果要优于简单估

第三单元习题答案(仅供参考)

1解:⑴不合适

(2)不合适

(3)合适

(4)不合适

2.将800名同学平均分成8组,在每一级中抽取一名“幸运星”。

3.根据表中调查数据,经计算,可得下表:

h

NWhfhNySh

nhhYhhh

1102560.30330.039111.22867.294.4

2104200.49760.023825.510710302.5

3101680.19910.0595203360355.6

总计30844116937.2

a1一〜

•••Yst不ELNhyh=20.i

八加立匕等X匕警

=9.7681-0.2962

=9.4719

Jv(^)=3.0777

(2)置信区间为95%相对误差为10%,则有

按比例分配的总量:n=%=[WhS:=185.4407%85

V+丁匕VM

:•n1=nW1=56,n2=92,n3=37

按内曼分配:=175

:.n『33,n2=99,n3=43

4.根据调查数据可知:

h

Wh

10.180.9

20.210.933

30.140.9

40.080.867

50.160.933

60.220.967

Pst=E匕WhPh=0.924

根据各层层权Wh及抽样比fh的结果,可得

V(Pst)=^Zi=1N^l-fh)-^^=0.000396981

•••JV(&)=L99%

;估计量的标准差为1.99%,比例为9.24%

按比例分配:n=2663

A111=479,112=559,113=373,n4=240,n5=426,n6=586

内曼分配:n=2565

:.111=536,n2=520,n3=417,n4=304,115=396,n6=392

5.解:由题意,有

Y=Z匕yWn=75.79

・•,购买冷冻食品的平均支出为75.79元

又由V⑦_Wh)s2

又n=E匕nh/Wh

.,•V(y)=53.8086

Jv(y)=7.3354

•••95%的置信区间为[60.63,90.95]o

7.解:(1)对

(2)错

(3)错

(4)错

(5)对

12

8.解:(1)差错率的估计值齐一X70%+—X30%=0.027

」4357

估计的方差v(y)笈匕於3.1967X10一4

标准差为S(%=0.0179。

⑵用事后分层的公式计算差错率为y=Xj;=iWh(±2鬻yhi)=o.o3

mh

估计的方差为;V(9)=Xh据\EhWhS烂2.5726X10-4

9.解:(1)所有可能的样本为:

第一层第二层

X1X2

%y2

3,50,38,156,9

3,100,68,256,15

5,103,615,259,15

(2)用分别比估计,有ri=0.4,「2=0.65,所以用分别比估计可计算得丫=6.4。

用联合比估计,有r1=0.5,「2=0.625,所以用联合比估计可计算得丫=6.5。

第四章习题

4.1邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群

10户,现随机抽取4个群,取得资料如下表所示:

群各户订报数X)X-

11,2,1,3,3,2,1,4,1,119

21,3,2,2,3,1,4,1,1,220

32,1,1,1,1,3,2,1,3,116

41,1,3,2,1,5,1,2,3,120

试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。

ri4

解:由题意得到N=400,〃=4,M=\0,=0.01

N400

19+20+16+20

=1.875(份)

10x4

歹="j=10xl.875=18.75(份)

f=M-^•^=10x400=7500(份)

nMnMn-\~^

1-0,01(19-18.75)2+…+(2()-18.75产

-4xl024-1

=0.00391875

v(r)=/V2M2vG)=4002xlO2x0.00391875=62700

于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875,

该辖区总的订阅份数为7500,估计量方差为62700o

4.2某工业系统准备实行一项改革措施。该系统共有87个单位,现采用整群抽样,用简单

随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结

果如下:

单位总人数赞成人数

15142

26253

34940

47345

510163

64831

76538

84930

97354

106145

115851

125229

136546

144937

155542

(1)估计该系统同意这一改革人数的比例,并计算估计标准误差。

(2)在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不

超过8%,则应抽取多少个单位做样本?

n15

解:题目已知N=87,n=15,f=—=—

N87

1)由已知估计同意改革的比例

n

二i=l

p=-需。.709

i=l

60.733

M=-YMi=

11_f1〃

V{p}=——L--y(y,-M)2=0.008687

Mnn-\~^

此估计量的标准差为

5(p)=Ji而=A/0.008687=0.9321

4.3某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员欲估计办公

费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,

得到下表资料:

抽屉编号票据数费用额(%,百元)

14283

22762

33845

463112

57296

61258

72475

81458

93267

104180

要求以95%的置信度估计该集团办公费用总支出额度置信区间(a=0.05)。

解:已知N=48,n=10,f=—=、,由题意得X%=736,=365,

N48MM

则办公费用的总支出的估计为丫〜=—NI='48x736=35328(元)

〃M10

1"1

群总和均值了=上£弘=」-x736=73.6(元)

10

Z(y-9尸

道)二V(17)i=l

nn-\

4又2*ri

22

I48(83—73.6)2+(62-73.6)+...+(80-73.6)

x

109

1

182.4x-x3590.4

9

72765.44

7^(/)=269.7507

则户的置信度为95%的置信区间为3532.8±1.96x269.7507,即[3004.089,4061.5111,

4.4为了便于管理,将某林区划分为386个小区域。现采用简单随机抽样方法,从中抽出

20个小区域,测量树的高度,得到如下资料:

数目株数数目株数

平均高度目平均高度反

区域编号区域编号

Mi

(尺)(尺)

1426.211606.3

2515.812526.7

3496.713615.9

4554.914496.1

5475.215576.0

6586.916634.9

7434.317455.3

8595.218466.7

9485.719626.1

10416.120587.0

估计整个林区树的平均高度及95%的置信区间。

解:由已知得N=386,n=20,/-=-=—=0.0518

N386

工根为

整体的平均高度q=Q=上-----="丝=5.909

£区1046

i-i

1a

=52.3

方差估计值v(r)=v(^)=上------------

nM2n-\

=0.02706

_±_/白

标准方差5(F)=Vv(F)=Vo.02706=0.1644

在置信度95%下,该林区的树木的平均高度的置信区间为

(Ytt^-5(Y))=(5.909±1.96x0.1644)=(5.5868,6.2312)

4.5某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200

间,每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽

取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是

简单随机抽样,调查结果如下表:

样本宿舍拍照人数样本宿舍拍照人数

1261

2070

3181

4291

51100

试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。

M10

解:题目已知N=200,n=10,M=6,7/7=3,f.=2i_^_o.O5,f.=—=0.5

1N=200=2M

n

i=I

P—=0.3

nm10x3

1]_f1n

v(p)=—•-------Y(yi-p.fn)=0.005747

m-n

s(p)="而=Vo.005747=0.0758

在置信度95%下,p的置信区间为

(p±t.2后面>=(03土L96x0.0758)=(0.1514320.44856&

4.6上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿

舍间的标准差为5=326元,宿舍内同学之间的标准差为$2=188元。以一位同学进行

调查来计算,调查每个宿舍的时间%为1分钟,为了调查需要做各方面的准备及数据

计算等工作,所花费的时间为C。是4小时,如果总时间控制在8小时以内,则最优的

样本宿舍和样本学生是多少?

解:由已知条件得到以下信息:

S1=326(元)$2=188(元)5=10(分钟)C2=l(分钟)c0=4x60=240(分

钟)

由此得到

c、,S335344

S?=106276,S;=35344,=5,一一=106276-=100385.33

12u1M6

因而取最优的m=2,进一步计算n°pt

由于总时间的限制C=480,由关系式

C=c()+CIii+c2nm得到480=240+10nopt+2nop(

计算方程得到%=20,因而取n=20

则最优的样本宿舍数为20间,最优样本学生数为2o

4.7某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住在10个单

元中。现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都

是简单随机抽样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1

个单位):

单元i居民人数M,样本量叫健身锻炼时间y,7

13244,2,3,6

24552,2,4,3,6

33643,2,5,8

45464,3,6,2,4,6

试估计居民平均每天用于锻炼的时间,并给出估计的标准差。

(1)简单估计量

(2)比率估计量

(3)对两种估计方法及结果进行评价。

解:(1)简单估计

=—x(32x3.75+45x3.4+36x4.5+54x4.17)

=1650,

Y_1650_

则用u3.3,

初一500—

=—x660=165,

4

n八

2xy(K-y)222

所以vR)=N"l-力沙’,二汽MjQ-fQ丁

n«-1n/=|

分别计算

n人

2("匕)21

22

月----------=ix[(l20-165)+(153-165)2+062-165)2+(225-165)]

H-13

5778_

1926

3

405o4

32o2x(l-—)x2.92452x(l-—)x2.8362x(l-—)x7

寸Mil-启凡,232,45,36

i=l㈣454

6

54?2x(l-)x2.2

+---------------=462848

6

房「1N2(l—九)[“一工/—%)%2

斫“v(/)=----------------;---+—2------------

所以,Monn-\n(=1m,

=0.1155&0.04628况0.162

三I~~

所以标准差s(匕)=加(匕)=0.402

(2)比率估计

32x3.75+45x3.4+36x4.5+54x4.17

i=l=3.9532

±M,.32+45+36+54

i=i

京)"

2

度R)=

nn-\

二Y

其中心=-ci=l

M。

1=1

2)=四=0.0715

MJ

s(工)="&)=70.0715=0.2647

(3)•.•简单估计标准差s(%)=0402,比率估计标准差s(N)=0.2647

比率估计更好

第五章不等概抽样习题答案

5.1解:

分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小成比例的不

等概抽样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:

即采用重抽法抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样

本量且所有样本党员不重复:

MM

(1)代码法:由Zj=——可假设Mo=lOOOOOO,则Mi=ZiM0列成数据表为:

NAN011°

M。ZM]

i=l

PSU代码

M,累计Mj

11101101-110

21855618666111〜18666

3629998166518667〜81665

47821615988181666〜159881

575245235126159982〜235126

673983309109235127〜309109

776580385689309110〜385689

838981424670385690〜424670

940772465442424671〜465442

1022876488318465443〜488318

113721492039488319〜492039

1224971517010492040〜517010

1340654557664517011〜557664

1414804572468557665〜572468

155577578045572469〜578045

1670784

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论