




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章习题
2.1判断下列抽样方法是否是等概的:
(1)总体编号广64,在0〜99中产生随机数r,若厂0或r>64则舍弃重抽。
(2)总体编号「64,在0〜99中产生随机数r,r处以64的余数作为抽中的数,若余数为0则抽
中64.
(3)总体20000〜21000,从广1000中产生随机数r。然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽
取样本。第二,每个单元被抽中的概率是己知的,或者是可以计算的。第三,当用样本对总体目标
进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有广64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等
概的。
2.2抽样理论和数理统计中关于样本均值丫的定义和性质有哪些不同?
解析:油样理论和数理统计中关于样本均值的定义和性质的不同
抽样理论概率统计
定
义
1•期望E(y)=*(i)稣)=$>(g=丫1.期望E(y)=E,汽/
i=li=l51=1/nia]
性22.方差心)=由
质2.方差咐£E(厂瓯1%
2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进
行,现得到其日用电平均值7=9.5(千瓦时),S?=206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?
解:由己知可得,N=50000,n=300,y=9.5,52=206
该市居民用电量的95%置信区间为
[[Ny±ZgJvG)]=[475000±l.96*41308.19]
2
即为(394035.95,555964.05)
由相对误差公式上竺"®W10%
y
50000
可得1.96*/一"*206<9,5*10%
即n》862
欲使相对误差限不超过10%,则样本量至少应为862
2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽
取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%
置信区间。
解析:由已知得:7V=10000〃=200p=0.35/=—=0.02
N
又有:E(p)=E(p)=p=035V(p)=p(\-p}=0.0012
n-i
该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:[E(方)土Zg赤石]
2
代入数据计算得:该区间为[0.2843,0.4157]
2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容
量为20的样本,调查结果列于下表:
编号文化支出编号文化支出
120011150
215012160
317013180
415014130
516015100
613016180
7•14017100
810018180
911019170
1024020120
估计该小区平均的文化支出),并给出置信水平95%的置信区间。
解析:由已知得:N=200n=20
_120
根据表中数据计算得:y=—fyi=144.5
20G
该小区平均文化支出》的95%置信区间为:丘土ZqM歹]即是:[132.544,156.456]
2
故估计该小区平均的文化支出歹=144.5,置信水平95%的置信区间为「132.544,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到亍=1120
(吨),52=25600,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:亍=1120/=—=—=0.142952=25600=>s=160
N350
置信水平95%的置信区间为:口土2八三2]代入数据得:
2Vn
置信水平95%的置信区间为:[1079.872,1160.8721*350
2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水
平95%,现根据以前的调查结果,认为总体方差S?=68,是确定简单随机抽样所需的样本量。若
预订有效回答率为70%,则样本量最终为多少?
22
NZaSn
解析:简单随机抽样所需的样本量%2,«2=—
Nd2+Z^S270%
2
Za=L96
由题意知:N=1000d=2S=682
%==87.142«87
代入并计算得:4=6A113036”61-70%
故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%则样本量最终为87
2.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取
10个企业调查今年的产量,得到y二25,这些企业去年的平均产量为1=22。试估计今年该地区化
肥总产量。
-=X=2135=2135_
解析:由题可知夭=22,一N-10「.”25
——y25
_y-XX-21.35--24.26
则,该地区化肥产量均值「的比率估计量为X24
该地区化肥产量总值Y的比率估计量为0=尼=100*24.26=2426
所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:
单位:元
编号文化支出总支出编号文化支出总支出
12002300111501600
21501700121601700
31702000131802000
41501500141301400
51601700151501600
61301400161001200
71401500171801900
81001200181001100
91101200191701800
101401500201201300
全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置
信区间,并比较比估计和简单估计的效率。
1n1
x=-yxj=—(2300+1700+---+1300)=1580
11
解析:由题可知i=i20
%=X_v'=16001*4H45^=146.329
又"x158()
故平均文化支出的95%的置信区间为
代入数据得(146.329±1.96*1.892)
即为[142.621,150.037]
2.10某养牛场购进了120头肉牛,购进时平均体重100千克。现从中抽取10头,记录重量,3个
月后再次测量,结果如下:
单位:千克
编号原重量现重量
195150
297155
387140
4120180
5110175
6115185
7103165
8102160
992150
10105170
用回归估计法计算120头牛现在的平均重量,计算其方差的估计,并和简单估计的结果进行比较。
解:由题可知,x=-yxj=—(95+-+105)=102.6
10
S146.333
故有色=宜==1.368
106.933
所以总体均值「的回归估计量为
其方差估计为:
R(%)=US2+&2S「_2&S.V)
n
.10
1----
=产(212.222+1.3682*106.933-2*1.368*146.333)
=1.097
而0(y)=ds2
n
1-%20
=—j2*212.222
10
=19.454
显然一汽)<旧(加
所以,回归估计的结果要优于简单估
第三单元习题答案(仅供参考)
1解:(1)不合适
(2)不合适
(3)合适
(4)不合适
2.将800名同学平均分成8组,在每一组中抽取一名“幸运星二
3.艰据表中调查数据,经计算,可得下表:
h
NfhNh%]
hwhYhSh
1102560.30330.039111.22867.294.4
2104200.49760.023825.510710302.5
3101680.19910.0595203360355.6
总计30844116937.2
±13
Y
•••SFNSh=1Nhyh=20.1
AyLW褊L
=Whsg
v(Yst)-Zh=iF_2h=inr
=9.7681-0.2962
=9.4719
・•・Jv(yst)=3.0777
(2)置信区间为95%相对误差为10%,则有
SLiWhsg
攸匚匕1列力仇:tl'WH、堇:n=NL=l«b.44U7y
V+&h=l
•e*nl=nWl=56,n2=92,n3=37
Q;=]WhsR)2
按内空分配:=l/b
吸+屹—LWhsH
Anl=33,n2=99,。3二43
4.根据调查数据可知:
h
whPh
10.180.9
20.210.933
30.140.9
40.080.867
50.160.933
60.220.967
Pst=]WhPh=O.924
根据各层层权Wh及抽样比fh的结果,可得
v(Pst)二技LN^l-fh);篝0.000396981
:.W、Pst)=1.99%
:・估计量的标准差为1.99%,比例为9.24%
按比例分配:n=2663
Anl=479,n2=559,n3=373,n4=240,n5=426,n6=586
内曼分配:n=2565
An1=536,n2=520,n3=417,n4=304,n5=396,n6=392
5.解:由题意,有
丫二£:=iyw『75.79
・•・购买冷冻食品的平均支出为75.79元
又由v(y)=F£:=iWhsR+£;=i(l-Wh)sR
又n=£:inh/Wh
AV(y)=53.8086
⑺=7.3354
・,・95%的置信区间为[60.63,90.95]。
7.解:(1)对
(2)错
(3)错
(4)错
(5)对
12
8.解:(1)差错率的估计值火石X70%+为X30%=0.027
.1-f.
估计的方差v(y)=?h="匕不^群3.1967X10-4
标准差为S(y)=0.0179。
i1m
(2)用事后分层的公式计算差错率为齐Eh=】Wh(端二%»0.。3
W2s21
估计的方差为;V(y)Nh章"WhWhS2.5726X10-4
9.解:(1)所有可能的样本为:
第一层第二层
X1Y1X2V2
3,50,38,156,9
3,100,68,256,15
5,103,615,259,15
(2)用分别比估计,有门二0.4,「2=0.65,所以用分别比估计可计算得丫=6.4。
用联合比估计,有门=0.5,=2=0.625,所以用联合比估计可计算得丫=6.5。
第四章习题
4.1邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,
现随机抽取4个群,取得资料如下表所示:
群各户订报数为
11,2,1,3,3,2,1,4,1,119
21,3,2,2,3,1,4,1,1,220
32,1,1,1,1,3,2,1,3,116
41,1,3,2,1,5,1,2,3,120
试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。
解:由题意得到N=400,〃=4,M=10»/=—==0.01
N400
19+20+16+20
故彳=亍=1.875(份)
10x4
y=M-j=10xl.875=18.75(份)
r=A/^y=10x400=7500(份)
于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。该辖区
总的订阅份数为7500,估计量方差为62700。
4.2某工业系统准备实行一项改革措旎。该系统共有87个单位,现采用整群抽样,用简单随机抽
样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意见,结果如下:
单位总人数赞成人数
15142
26253
34940
47345
510163
64831
76538
84930
97354
106145
115851
125229
136546
144937
155542
(1)估计该系统同意这一改革人数的比例,并计算估计标准误差。
(2)在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,
则应抽取多少个单位做样本?
解:题目已知N=87,w=15,f=—=—
"N87
1)由已知估计同意改革的比例
此估计量的标准差为
4.3某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。财务人员欲估计办公费用支
出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票据,得到下表资料:
抽屉编号票据数Mj费用额(以,百元)
14283
22762
33845
463112
57296
61258
72475
81458
93267
104180
要求以95%的置信度估计该集团办公费用总支出额度置信区间(a=0.05)o
*,由题意得£%=736,名%=365,
解:已知N=48,n=10,
48
则办公费用的总支出的估计为?=四5>=—x736=3532.8(元)
〃i=\10
1”1
群总和均值》二一£M=—x736=73.6(元)
10
422次”—1°、
u48(83—73.6)2+(62—73.6)2+...+(80—73.6)2
--10*9-
=182.4x1x3590.4
9
=72765.44
;269.7507
则Y的置信度为95%的置信区间为3532.8±1.96x269.7507,即[3004.089,4061.511].
4.4为了便于管理,将某林区划分为386个小区域。现采用简单随机油样方法,从中抽出20个小
区域,测量树的高度,得到如下资料:
数目株数平均高度数目株数平均高度
区域编号区域编号
%(尺)跖歹,(尺)
1426.211606.3
2515.812526.7
3496.713615.9
4554.914496.1
5475.215576.0
6586.916634.9
7434.317455.3
8595.218466.7
9485.719626.1
10416.120587.0
估计整个林区树的平均高度及95%的置信区间。
解:由已知得N=386,n=20,/=—=—=0.0518
N386
n
4ZM%
整体的平均高度〒=9=上——=61808=5909
i-l
2।歹产
方差估计值后户用二鼎―丁一
AIA
标准方差5(F)=Vv(F)=Vo.02706=0.1644
在置信度95%下,该林区的树木的平均高度的置信区间为
4.5某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。全校共有女生宿舍200间,
每间6人。学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样
本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,调
查结果如下表:
样本宿舍拍照人数样本宿舍拍照人数
1261
2070
3181
4291
51100
试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。
解:题目已知N=200,«=1O,M=6,m=3,/.=—=—=0.05,/=—=0.5
1N2002M
在置信度95%下,p的置信区间为
(力士J/2心而);(03±1.96x0.0758)=(0.151432,0.448568)
4.6上题中,学生会对女生勤工助学月收入的一项调查中,根据以往同类问题的调查,宿舍间的
标准差为S/326元,宿舍内同学之间的标准差为§2二188元。以一位同学进行调查来计算,调
查每个宿舍的时间g为1分钟,为了调查需要做各方面的准备及数据计算等工作,所花费的
时间为c0是4小时,如果总时间控制在8小时以内,则最优的样本宿舍和样本学生是多少?
解:由已知条件得到以下信息:
S]=326(元)S2=188(元)C)=10(分钟)c2=1(分钟)co=4x6O=24O(分钟)
由此得到
S?=106276,S;=35344,=S,-^-=106276-^1=100385.33
u'M6
因而取最优的m=2,进一步计算n。以
由于总时间的限制C=480,由关系式
C=c0+c1n+c2nm得到480=240+10110?(+2nopl
计算方程得到%,=20,因而取n=20
则最优的样本宿舍数为20间,最优样本学生数为2。
4.7某居委会欲了解居民健身活动情况,如果一直该居委会有500名居民,居住在10个单元中。
现先抽取4个单元,然后再样本单元中分别抽出若干居民,两个阶段的抽样都是简单随机抽
样,调查了样本居民每天用于健身锻炼的时间结果如下(以10分钟为1个单位):
单元,居民人数样本量犯健身锻炼时间为
13244,2,3,6
24552,2,4,3,6
33643,2,5,8
45464,3,6,2,4,6
试估计居民平均每天用于锻炼的时间,并给出估计的标准差。
(1)简单估计量
(2)比率估计量
(3)对两种估计方法及结果进行评价。
解:(1)简单估计
=^x(32x3.75+45x3.4+36x4.5+54x4.17)
二1650,
研LA翳=33,
A1HA1
又工=-Yy;-=-x660=165,
y4
所以v&u)=N2(i")3上必
nn—\ni=l"
分别计算
“A
12(1一力)一工)一%)%2
所以,W匕)一而;「二—最
=0.11556+0.046285«0.162
A/A
所以标准差s(匕)=6(匕)=0.402
(2)比率估计
抡Y'叫%
其中小务二^一
i=l
人
⑶•.,简单估计标准差S(吃)=0.402,比率估计标准差s(%)=0.2647
二.比率估计更好
第五章不等概抽样习题答案
5.1解:
分析题目可知“代码法”与“拉希里法”都是PPS抽样(放回的与规模大小成比例的不等概抽
样)的实施方法,而此题需要用此两种方法进行不放回抽样,故需进一步进行改进:即采用重抽法
抽取,如果抽到重复单元,则放弃此样本单元,重新抽取,直到抽到规定的样本量且所有样本党员
不重复:
(1)代码法:由Zi=丛=4仁可假设Mo=1000000,则=列成数据表为:
M。、
i=l
PSU代码
Mj累计比
11101101-110
21855618666111〜18666
629998166518667〜
3
81665
7821615988181666〜
4
159881
75245235126159982〜
5
235126
73983309109235127〜
6
309109
76580385689309110-
7
385689
38981424670385690〜
8
424670
40772465442424671-
9
465442
22876488318465443〜
10
488318
3721492039488319〜
11
492039
24971517010492040〜
12
517010
40654557664517011〜
13
557664
14804572468557665〜
14
572468
5577578045572469〜
15
578045
70784648829578046〜
16
648829
69635718464648830〜
17
718464
34650753114718465〜
18
753114
69492822606753115〜
19
822606
36590859296822607〜
20
859296
33853893049859297〜
21
893049
16959910008893050〜
22
910008
9066919074910009〜
23
919074
21795940869919075〜
24
940869
591851000054940870〜
25
1000054
我们看到抽取的范围比较大,所以我们利用计算机中的随机数表来抽取,第一个随机数为444703,
615432,791937,921813,738207,176266,405706935470,916904,57891
按照范围我们可以知道抽取的PSU9,PSU16,PSU19,PSU24,PSU18,PSU2,PSU8
PSU24PSU23PSU2,我们看到第2组和24组重复抽取了,故进行重新抽取,抽到4组和6组;
综上所述,抽取的样本为2,4,6,8,9,16,18,19,23,24组
(2)拉希里法:Mx=78216,N=25,在[1,25]和[1,78216]中分别产生(n,m):
(13.38678),%3=40654238678,入样:
(8;57764),M8=3898X57764,舍弃,重抽;
(23,13365),M23=9066<13365,舍弃,重抽;
(19,38734),M19=69492>38734,入样;
以此类推,当得到重复入样情况时,同上重新抽取,得到抽取结果为:
2,3,5,6,7,12,13,16,19,24组
5.2解:
由数据可得:
3二X%广20,t2=^y27=25,t3=38,t4=24,t5=21;
J=I〜
结合t值数据,我们可以推得Z的值
MS
Z,=—L=—=0.2,Z=0.16,Z=0.32,Z=0.2,Z=0.12,
12345
Mo253
4Z,.Z/1-Z,.-Z,)
由公式啊
(1-2Z,X1-2Z.]
样本
1,20.273769
1,30.217405
1,40.283079
1,50.243826
2,30.166251
2,40.213142
2,50.243826
3,40.603903
3,50.53546
4,50.243826
5.3解:
设:M>=L则有:Mi=Z,.,得到下表:
j累计代码
MxlOOO
10.1041041041—104
20.192192296105—296
30.138138434297—434
40.06262496435—496
50.05252548497—548
60.147147695
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代物流管理专业(智能配送与流程管控)人才培养方案
- 黑龙江省双鸭山市宝清县2025年三年级数学第二学期期末质量检测试题含解析
- 黑龙江省哈尔滨市风华中学2025届学业水平考试化学试题含解析
- 衡水中学高三文科综合地理试题(五)
- 黑龙江省龙东高中十校联盟2025年高三下学期适应性试卷语文试题(含答案)
- 众泰用车知识
- 四年级下信息技术教学设计(A)-有益运动保健康-泰山版
- 2024年一月份跨境保健品代理合同中的数字孪生工厂数据共享
- 婴幼儿心理咨询技巧试题及答案
- 2024年福建三支一扶考试适应性分析与试题及答案
- 2025年国家公务员录用考试公共基础知识预测押题试卷及答案(共七套)
- 2025-2030中国儿童服装行业市场发展分析及投资前景预测研究报告
- 部编版语文教材培训讲座-口语交际
- 2025年全国中小学生安全教育日专题
- 2025年工程力学笔试试题及答案
- 2025年电子设备装接工岗位职业技能资格证考试题(附答案)
- 2025年河南航空港发展投资集团有限公司社会招聘45人笔试参考题库附带答案详解
- DB37T 5157-2020 住宅工程质量常见问题防控技术标准
- GB_T 37851-2019 玻璃容器 小口瓶标准公差(高清版)
- 电度表检验报告格式(共4页)
- 烟气超低排放改造和增设脱硝项目资金申请报告写作模板定制
评论
0/150
提交评论