




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、l1、抽样调查的概念l抽样调查是按照随机性原则,从研究总体中抽取一部分单位进行调查(或观察),用这一部分单位的数量特征(值)去推断研究总体的特征(值),从而达到认识总体的目的,也称为随机抽样调查或概率抽样调查。l1、 抽样调查是一种非全面调查l2、 按随机原则抽取单位l3、 从数量上推断总体l4、抽样调查会产生调查误差,但这种误差可以预防和控制。(1)不能作全面调查的时候使用(如破坏性实验)。(2) 理论上可以全面调查,但实际很难实现。(3)节省人力、费用和时间的考虑。(4)与全面调查相比可以调查更多的项目。(5)提高调查质量和数字的准确性,修正和补充全面调查资料。 调查误差(抽样误差和工作误
2、差)l1、几个基本概念l(1)全及总体和抽样总体l总体:研究对象的全体。总体单位数N。l样本:从总体中抽取部分单位的集合体。l样本容量:样本中所包含的单位数n。l样本个数:从总体中可能抽取的样本的数量。l抽样比:样本容量与总体单位数之比。l全及指标:是根据总体各单位标志值计算的反映总体特征的指标。它是个确定值,在抽样中也称为参数(即总体的数量特征)。l主要有:全及平均数X,全及成数PN1/N;全及方差2及标准差 。l抽样(样本)指标,是按样本中各单位的标志值计算的反映样本特征的指标。它是一个随机变量,在抽样中也称为统计量,在进行统计推算的时候它又是总体参数的估计量。l主要有:样本平均数x,样本
3、成数:pn1/n,样本方差s2及标准差s:l重复抽样:每次都从N个总体单位中抽取样本(始终有N个候选单位),同一单位有多次重复中选的可能。(放回抽样)l样本数目:l考虑顺序:l不考虑顺序:nnNNBnnNnNCD1l不重复抽样:每个单位只能被抽中一次。即它的候选单位是递减的:N,N1,N2,Nn1。l样本数目:l考虑顺序:l不考虑顺序:!(!()()()n-NNnN)n-N3-N2-N1-NNA1)!nN( !n!Nn1)n-N- - -2-N1-NNnNC!()(l例有4名工人,每人每月产量分别是40,50,70,80,现随机从其中抽取两人,l测算考虑顺序的样本个数。重复抽样考虑顺序样本数:
4、42=16,不重复抽样考虑顺序样本数:43=12。l抽样方案设计的基本原则l1、随机性原则l2、实现最大抽样效果原则精度费用1009050100简单随机抽样简单随机抽样和系统抽样和系统抽样l分层抽样和整群抽样分层抽样和整群抽样l 多阶段抽样多阶段抽样l l简单随机抽样:l在总体各单位都有同等被抽取可能性的假设条件下进行的在总体各单位都有同等被抽取可能性的假设条件下进行的抽样。抽样。l抽样方法又分为直接抽选法、抽签法、随机数码表法,抽样方法又分为直接抽选法、抽签法、随机数码表法,l系统抽样,也称机械抽样、等距抽样l 是将总体各单位按某种标志排序,按相等的间隔抽取样本是将总体各单位按某种标志排序,
5、按相等的间隔抽取样本 单位的抽样单位的抽样l有关标志排队 随机起点等距抽样l无关标志排队 半距起点等距抽样l 对称等距抽样l分层抽样,也称类型抽样l是将总体按某种标志分成若干层(类型组),之后在每是将总体按某种标志分成若干层(类型组),之后在每层中按随机原则抽取样本单位。层中按随机原则抽取样本单位。l类型比例抽样:l类型适宜抽样:l整群抽样:l将总体分成若干群,再按随机原则抽取部分群,所抽取将总体分成若干群,再按随机原则抽取部分群,所抽取的群内所有单位作为样本单位的抽样方法。的群内所有单位作为样本单位的抽样方法。 群内方差 群间方差nnNNiinniiiiNNinRNRNiiiiinl多阶段抽
6、样是指在抽选样本时,并不是一次直接从总体中抽取,而是分两个或两个以上的阶段来进行。l l适用条件:l1、调查范围广泛,没有合适的抽样框或者范围太大。l2、相对节约人力和物力。l3、可以利用现成的行政区划、组织系统作为划分阶段的依据。 l抽样(实际)误差是指样本指标与总体指标之间数量上的差别。l抽样平均误差是指所有可能出现的样本指标的标准差,所有可能出现的样本指标与总体指标的平均离差。l影响抽样平均误差的因素21)(Xxikxl1.全及总体标志的变异程度与抽样误差成正比.l2.样本容量与抽样误差成反比.l3.抽样的组织方式与抽样方法对误差的影响。l重复抽样比不重复抽样的抽样平均误差大;l简单随机
7、抽样、整群抽样比类型抽样、机械抽样的抽样平均误差大。 )(不重复抽样:重复抽样:抽样平均数的平均误差Nnnxnx12)()(不重复抽样:)(重复抽样:抽样成数的平均误差:NnnPppnPpp111l1、用过去调查取得的资料。l2、用样本方差资料代替总体方差资料。l3、利用小规模调查的资料。l4、用估计的资料。l1、简单随机抽样)(不重复抽样:重复抽样:抽样平均数的平均误差Nnnxnx12)()(不重复抽样:)(重复抽样:抽样成数的平均误差:NnnPppnPpp111l例:从2500件电子元件中随机抽取4%的元件做样本,抽出的样本里有件耐用时间不合格,计算该电子产品的不合格率的抽样平均误差。l解
8、:首先确定样本元件的不合格率,即抽样成数。样本容量样本元件中的不合格数P%5%425005%.)().(.2.18%1005%)(15%NnnPppnPpp142250010011000501050111)(不重复抽样:重复抽样:抽样成数的平均误差:)()(kiiiiNnn)p(ppn)p(ppn)p(pn)p(p1111111)(不重复抽样:重复抽样:抽样成数的平均误差:,1,2222)(不重复抽样:重复抽样:抽样平均数的平均误差Nnnxnninxiiiil例:某乡共有农户4000户,用类型抽样的方法按10%抽取样本, 情况资料见表:推断全乡抽样平均每户收入和抽样方差。农户总数样本数样本平均
9、收入抽样标准差粮食作物区技术作物区250015002501503600540052754000400l解:根据资料,,2.92-1,3.08x3799.37540004004003799.375Nnnx4003799.375nxnnx4001507525052nniiiii22ii)()(不重复抽样重复抽样:抽样平均数的平均误差14275222400150540025036002l一般认为,无关标志排队等距抽样近似于简单随机抽样,因此一般按简单随机抽样方法计算抽样误差。l有关标志排队等距抽样可以看作类型抽样,因此按类型抽样方法计算抽样平均误差。l整群抽样采用的都是不重复抽样,l计算时要使用修正
10、系数l平均数抽样平均误差:l成数抽样平均误差:22(1)(),bxibbsrrRxxSSr为群间方差。r)pp(S)Rr(rsnippp221)RrR(1l例:某工厂生产某种灯泡,在连续生产720小时中,每隔24小时抽取1小时的全部产品加以检查。根据抽样资料计算,灯泡平均使用寿命为1200小时,群间方差为60小时,计算样本平均数的抽样误差。l 3841113072060120072030306022.)()(r ,R,S,xRrrSxbb解:根据资料l应用样本统计量作为估计量去估计总体参数,称为参数估计。l如果在估计中,直接用估计量作为固定的数值对参数作出估计即为点估计。l如果在估计中要对参数
11、做出带有某种可靠性的估计并给出对应于这一可靠性或置信度的区间,即为区间估计。ppxxppxxpxpPpxXxPpPXxXPpXx经过变换,有,l抽样误差范围与抽样平均误差之间的关系是:n)P(PppnxxPpXxppxxt,tttPptXx1围,度来衡量的相对误差范是以抽样平均误差为尺计上称为置信度。称为概率度,在数理统l正态分布曲线由正态概率密度函数给出:l当=0,=1时,正态分布称为标准正态分布,N(0,1)。dtetxXtxPtFtttxx2221)(xx+3x-3x+2x+x-x-268.27%95.45%99.73%x频率l1)确定概率保证和概率度t。l2)抽取一个样本容量为n的样本
12、。l3)计算样本平均数和标准差。在有限总体不重复抽样时,标准差修正为:l4)构造置信区间:Nn1nppxxpPpxXxl也就是说:l如果从正态总体抽取一个容量为n的简单随机样本,并构造区间: l我们有F(t) 的把握说,这个区间包含总体平均数X。l ppxxpPpxXxl1)对于样本取自总体方差已知的非正态分布,当样本容量足够大时,仍然用上述区间作为总体平均数的置信区间。l2)当总体方差2未知时,用样本方差s2代替。l例题:l某工业企业报告期生产某种橡胶轮胎10000个,从中抽取05%进行耐磨性能检验,结果得到样本的平均磨损量为5775毫克,平均磨损量的样本方差为50000,根据有关规定,在规
13、定时间内的磨损量低于6000毫克为正品。试以95%的概率保证估计全部产品的平均磨损率。l已知毫克之间。毫克至在胎的平均磨损量的概率保证推断该批轮即:以总体平均磨损量为抽样的极限误差平均磨损量的平均误差查正态分布概率表得为大样本,样本容量985836025713959861577598616231961623196195500005775305050100002.%.xX.t.t%,)t (F,S,x,%.nxxxnxl确定原则:保证预期精确程度和可靠程度,确定恰当的必要样本数目。 l依据:l1、可靠程度和精确程度。l2、总体标志变异程度。l3、抽样组织方法。l1、简单随机抽样22222212p
14、x2)p(pttn2xnxxnnttt位:抽样成数的必要抽样单两端平方移项:样单位:抽样平均指标的必要抽重复抽样:)p(ptN)p(pNttNNtNnnxxpx2nn)-1tt1122222222位:抽样成数的必要抽样单两端平方移项:(样单位:抽样平均指标的必要抽不重复抽样:l2、类型抽样l3、整群抽样)p(ptNN)p(pttNNt)p(pttp2x22px22nnnn11122222222位:抽样成数的必要抽样单样单位:抽样平均指标的必要抽不重复抽样:位:抽样成数的必要抽样单样单位:抽样平均指标的必要抽重复抽样:22222222bp2bbx2bStRRStStRRStrr数:不重复抽样必要
15、抽样群l例:某车间加工螺杆10000件,为确定其直径是否合格,决定从中抽取部分进行测量。为使直径的测量误差不超过0.1(可靠度取99%),按过去经验生产该螺杆的标准差为0.8,问至少应抽取多少件测量才可满足上述要求?l解:这里已知N=10000件, =0.1,s=0.8lF(t)=0.99,查正态概率表可得t=2.58。l按重复抽样计算时l同时,以前加工螺杆的合格品率为98%,今要检验该批螺杆的合格率,为使合格率的测量误差不超过1%(可靠度95%),问抽取多少件检验才能满足要求?lF(t)=0.95, t=1.96 , =0.01,p=0.98,l按重复抽样计算时x4261.08.058.22
16、22222xxtnp753010980198096112222.).(.)P(Ptnppl假设检验:根据一定的随机样本信息,判断总体未知参数作出的假设是否可信 的统计分析方法。l基本思想:为了判断总体的某个特征,先对总体特征作出一定的假设,在从总体中抽取一定容量的样本,计算和分析样本数居,对原假设作出接受或拒绝的决策。;XXH,XXXXH)(;XXH,XXXXH (2);XXH,XXH (1):0:0:0010001000103)(:)(:l假设检验决策结果决策 假设真实不真实不否定正确犯第二类错误(取伪错误)否定犯第一类错误(弃真错误)正确 l第一步:建立假设。l要求:原假设必须包含等号在内
17、,备择假设可在不等、大于、小于三者任选。l检验结果只有两种可能:接受原假设就必须拒绝备择假设;拒绝原假设,就必须接受备择假设(发生错误的概率 )。l第二步:选择显著水平 。l第三步:寻找检验H0的统计量,确定其分布,计算统计量。l第四步:用检验统计量值与临界值比较,若统计量值落在否定域内,说明原假设与样本描述的情况有显著差异,则拒绝原假设,(犯错误的概率为 );如果统计量落在接受域,则接受原假设。l第五步:做出决策。l(一)、方差已知时,对一个正态总体均值的检验。l(1)l检验统计量为,:010XX:HXXH 022l1-l ),(10NnXxZ0接受域拒绝域拒绝域l例:某公司出口鱼罐头,标准
18、规格是每罐250克,根据以往经验,标准差为3克。现从一批产品中抽取100罐检验,其平均重量为251克,假定重量服从正态分布,规定显著水平为0.05,问该批产品是否合乎出口标准。l1)建立假设: lH0:X =X0=250 ,H1:X X0 =250l2)计算统计量3331003250251103250.nXxZ),(NnXxZ),(NX00l确定显著水平。 =0.05,l双侧检验临界值:l现z=3.33,远远大于临界值1.96,故否定原假设。即该批罐头重量不符合标准。96.12Zl也可以通过求X的置信区间来检验假设,如果求出的区间包含X ,就接受原假设,否则就拒绝。l如上题的置信区间为:l由于
19、X =250未包含在区间内,否定原假设。).,.(xn.5825142250961正态分布010010XX:HXXXX:HXXH 0;或,;:lZll接受域l拒绝域l例:某厂生产一种产品,原月产量服从平均值X=75,方差 =14的正态分布,设备更新后,为了考察产量是否提高,抽查了6个月产量,求得平均产量为78,假设方差不变,在显著性水平=0.05的情况下,月产量是否有显著提高?l解:假设275X:H75XXH 010;:明显提高。则设备更新后月产量有,故否定原假设因为,临界值显著性水平检验统计量:,00.056/147578H1.645Z1.645Z0.051.964Z010010XX:HXX
20、XX:HXXH 0;或,;:l-Zll接受域l拒绝域l如果检验统计量来自大样本,则按照中心极限定理,不论总体分布是否已知,是否正态,均可用Z统计量来近似。l检验统计量n/SXx0t。,则拒绝域为(分布表可得临界值,查)若()。,则拒绝域为分布表可得临界值,查)若()。,则拒绝域为(分布表可得临界值,查)若(:tttXXH3t,ttXXH2tt-,ttXXH1010101222l例:某食品厂每罐罐头标准重量为500克。现随机抽10罐来检查机器工作情况,10罐的重量为(单位:克):l495、510、505、498、503、492、502、512、497、506l假定重量服从近似正态分布,试问这段时
21、间机器工作是否正常(给定显著水平5%)。l建立假设: H0:=500 ,H1:500,l由样本计算:l查表l计算检验统计量:l由于t=0.972.26,因此,不能拒绝原假设,即机器没有发生异常。50. 6,502sx2621102.)(t97. 01050. 6|500502|500|nsxtl对总体成数的假设检验必须在大样本条件下进行,所以应当进行Z检验。l检验统计量为样本成数)(P(Zn/P1PPP0受原假设,拒绝原假设,否则接,则当若受原假设。,拒绝原假设,否则接,则当若受原假设。,拒绝原假设,否则接,则当若,:-ZZHZZHZZH0020PP1PP1PP1l不同的样本容量有不同的t分布,即:对每一个可能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论