抽样调查习题_第1页
抽样调查习题_第2页
抽样调查习题_第3页
抽样调查习题_第4页
抽样调查习题_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于标准差与抽样平均误差的关系标准差公式:1 .总体的标准差:方差8A2=(xi-x)A2+(x2-x)A2+.(xn-x)A2/n(用N表75更好)(x为平均数)标准差=sqrt(xi-x)A2+(x2-x2+.(xn-x)A2/n)2 .对样本而言:方差sA2=(xi-x)A2+(x2-x)A2+.(xn-x)A2/(n-1)(x为平均数)3 .样本标准差=sqrt(xi-x2+(x2-x2+.(xn-x)A2/(n-1)备注:如是总体,标准差公式根号内除以n如是样本,标准差公式根号内除以(n-1)因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)抽样平均误差(Samplingav

2、erageerror)什么是抽样平均误差抽样平均误差是抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。由于从一个总体可能抽取之个样本,因此抽样指标(如平均数、抽样成数等),就有多个不同的数值,因而对全及指标(如总体平均数、总体成数等)的离差也就有大有小,这就必需用一个指标来衡量抽样误差的一般水平。抽样平均数的平均数等于总体平均数,抽样成数的平均数等于总体总数,因而抽样平均数(或抽样成数)的标准差实际上反映了抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均差异程度。抽样平均误差的计算:(一)样本平均数的平均误差以仙x表示样本平均数

3、的平均误差,表示总体的标准差。根据定义:/=E(x-xf1、当抽样方式为重复抽样时,样本标志值1,”一工门是相互独立的,样本变量x与总体变量X同分布。所以得:2仃让工=n(1)它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。例1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少?»6+8+10+12+14解:根据题意可得:->(件)旧X-X)2西疗=r=二=7$总体标准差“Ns”5(件)抽样平均误差2(件)2、当抽样方式为不重复抽

4、样时,样本标志值11,工如一、不是相互独立的,根据数理统计知识所a2Nn(2)出史=(3)当总体单位数N很大时,这个公式可近似表示为:与重复抽样相比,不重复抽样平均误差是在重复抽样平均误差的基础上,再乘以,(N-")/(N_1),而_总是小于1,所以不重复抽样的平均误差也总是小于重复抽样的平均误差。如前例,若改用不重复抽样方法,则抽样平均误差为:a2N-n不N-18/5-2l=V12(51-)=1-732(件)在计算抽样平均误差时,通常得不到总体标准差的数值,一般可以用样本标准差来代替总体标准差。(二)抽样成数的平均误差总体成数P可以表现为总体是非标志的平均数。即E(X)=P,它的标

5、准差根据样本平均误差和总体标准差的关系、可以得到样本成数的平均误差的计算公式。1、在重复抽样下77P(l-P)(4)2、在不重复抽样下(5)当总体单位数N很大时,可近似地写成:(6)当总体成数未知时,可以用样本成数来代替。例2:某企业生产的士近,按正常生产经验,合格率为90%现从5000件产品中抽取50件进行检验,石格率的抽样平均误差。解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:IP(l-P)/0.9X0.1内=在不重复抽样条件下,合格率的抽样平均误差为:抽样调查练习题一、填空题1 .抽样调查是遵循随机的原则抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。2 .

6、采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2),(N-n+1)。3 .只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。4 .参数估计有两种形式:一是点估计,二是区间估计。5 .判别估计量优良性的三个准则是:无偏性、一致性和有效性。6 .我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。7 .常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。8 .对于简单随机重复抽样,若其他条件不变,则当极限误差范围A缩小一半,抽样单位数必须为原来的4倍。若A扩大一倍,

7、则抽样单位数为原来的1/4。9.如果总体平均数落在区间9601040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.,抽样平均误差是20.41。(t=)x-xxx10.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量需要的样本容量多。二、判断题1 .抽样误差是抽样调查中无法避免的误差。(,)2 .抽样误差的产生是由于破坏了随机原则所造成的。(X)少,整群抽样比个体抽样t2二.-:2x222tN-n二2.22Nxt二x3 .重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。(,)4 .在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增

8、大到9倍。(,)5 .抽样调查所遵循的基本原则是可靠性原则。(X)6 .样本指标是一个客观存在的常数。(X)7 .全面调查只有登记性误差而没有代表性误差,抽样调查只有代表性误差而没有登记性误差。(X)8 .抽样平均误差就是抽样平均数的标准差。(X)三、单项选择题1 .用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C)A.2倍B.3倍C.4倍D.5倍2 .事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D)A.分层抽样B.简单随机抽样C.整群抽样D.等距抽样3 .计算抽样平均误差时,若有多个样本标准差的

9、资料,应选哪个来计算(B)A.最小一个B.最大一个C.4 .抽样误差是指(D)A.计算过程中产生的误差B.C.调查中产生的系统性误差D.5 .抽样成数是一个(A)A.结构相对数B.比例相对数6 .成数和成数方差的关系是(C)A.成数越接近于0,成数方差越大C.成数越接近于0.5,成数方差越大中间一个D.平均值调查中产生的登记性误差随机性的代表性误差C.比较相对数D.强度相对数B.成数越接近于1,成数方差越大D.成数越接近于0.25,成数方差越大t=7 .整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)A.全面调查B.非全面调查C.一次性调查D.经常性调查8 .对400名大学生抽取19%进

10、行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)20%80%00.0458876t2N2N2t22人A.4%B.4.13%C.9.18%D.8.26%9 .根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(A)A.甲产品大B.乙产品大C.相等D.无法判断10 .抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)A.甲企业较大B.乙企业较大C.不能作出结论D.相同四、多项选择题抽样调查中的抽样误差是(AB

11、CDE)A.是不可避免要产生的B.是可以通过改进调查方法来避免的C.是可以计算出来的D.只能在调查结果之后才能计算E.其大小是可以控制的11 重复抽样的特点是(AC)A.各次抽选相互影响B.各次抽选互不影响C.每次抽选时,总体单位数始终不变D每次抽选时,总体单位数逐渐减少E.各单位被抽中的机会在各次抽选中相等3.抽样调查所需的样本容量取决于(ABE)xA.总体中各单位标志间的变异程度B.允许误差C.样本个数D.置信度E.抽样方法12 分层抽样误差的大小取决于(BCD)A.各组样本容量占总体比重的分配状况B.各组间的标志变异程度C.样本容量的大小D.各组内标志值的变异程度E.总体标志值的变异程度

12、五、名词解释1 .抽样推断2 .抽样误差3 .重复抽样与不重复抽样4 .区间估计六、计算题1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(1)试以0.95的置信度估计该公司工人的月平均工资所在范围。(2)试以0.9545的置信度估计月收入在2000元及以上工人所占比重。月收入1800190019502000205021002200250016500工人数67910987460af1080013300175502000018450168001540010000122300离差-238.33-138.33-88.33-38.3311.6761.67161.6

13、7461.67193.36离差平方56801.1919135.197802.191469.19136.193803.1926137.19213139.19328423.51-qxfx二'、f122300=2038.33602x-x60x162683333(164.66f60=164.6627113.8960=21.26离差平方乘权数340807.13133946.32170219.7014691.891225.7030425.51182960.32852556.761626833.33x-t.-x<X<xtLx2038.33-1.9621.262038.331.9621.2

14、62038.33-41.672038.3341.671996.662080.00(2)N=3000,n(s笠000)=38n(s<2000)=22P=38/60=0.633,8=sqrt(pq)=(0.232)A0.5=0.482wx=8k0.5=0.0622x-tx<XWx+th0.6333-2*0.06220.6333+2*0.0622,即0.50890.7577乘以3000,则估计人数在:15262273之间1-NORMDIST(2000,2038,21.26,TRUE)=2 .对一批产品按不重复抽样方法抽选200件,其中废品8件。又知道抽样总体是成品总量的1/20,当概率为

15、95.45%时,可否认为这一批成品的废品率低于5%?3 .某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?P=93%p(1-p)=0.93X(1-0.93)=0.06512tp(1-p)2_2320.06512(0.03)0.58590.0009=66(件)651件4.某企业对职工用于某类消费的支出进行了等比例分层抽样,调查结果如下:职工人数(人)调查人数(人)平均支出(元)标准差(元)青年职,240012023060中老年职工16008014047要求

16、以95.45%的置信度估计该企业职工平均支出和总支出的置信区间。样本平均数组间方差、'AiXi一i1X二-n12023080140一典.19412080200.2、ni"12060804010400”5=52n12080200抽样平均误差52,0.26=0.51,200区间估计xAx至x+AX=194-2x0.51-194+2x0.51192.98195.02在95.4既的把握程度保证下,该企业职工的平均支出在192.98元和195.02元之间.5.有一连续生产企业,一昼夜中每小时抽寿命为160小时,样本平均数的群间方差为均使用寿命。5分钟产品进行全面调查,测得该产品的平均使

17、用62小时,试以95.45%的把握推断全天产品的平rxi全样本平均数=x-i-=160小时)rs2N-n、2£仅收2或62/(x-x)xR、.2R-r二62(小时)rIR-1/224<288-1J:62288-24、:-=、2.5833父0.9197=1.54(小时)区间估计x-x至x:x=160-21.5416021.54156.92163.04在95.45%的把握程度的保证下,该批电子元件的平均使用寿命在156.92小时与163.04、时之间.n=24,N=24/(5/60)=2886.设“托福”的考分服从平均数580分,标准差为100分的正态分布,问当随机抽取20人进行调查,样本白平均数介于550分至610分的概率是多少?样本的平均分数等于和超过600分的概率是多少?2222t2。2t21002n=2-20=2x580-550220580-5501002=1.8=1.3416当t=1.3416查概率表得到的概率为82%。也就是样本平均数介于550分至610分的概率为82%。整个置信区间长度为60分,其概率为82%,由于考分平均数580分并成正态分布,因此我们可以1,、一这样考虑,超过600分的区间为(60061010分,是整个区间60分的-,也

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论