抽样原理与方法_第1页
抽样原理与方法_第2页
抽样原理与方法_第3页
抽样原理与方法_第4页
抽样原理与方法_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计学第九章抽 样 原 理 与 方 法 主要内容容抽样误差差的估计计样本容量量的确定定抽样的基基本方法法抽样方案案的制定定1抽样误差差的估计计假设有一一正态总总体,对对其进行行k次抽样,每个样样本包含含n个观测值值,则可可得到样样本1、样本2、样本k。这k个样本的的平均数数可能各各不相同同,且其其中某个个样本的的平均数数刚好等等于总体体平均数数的几率率也很小小。样本统计计数与总总体参数数的差别别主要由由“抽样误差差”所引起。抽样误误差与总总体参数数的估计计有着密密切关系系。样本平均均数的标标准误和和置信区区间从理论上上说,各各样本平平均数的的平均数数是对总总体平均均数的最最好估计计值,即即

2、:且容量为为n的样本平平均数的的方差等等于总体体方差的的1/n,即:样本平均均数的标标准误和和置信区区间在实际工工作中,从总体体中抽出出多个样样本计算算均值和和标准误误往往是是不现实实的。故故常采用用一个样样本的标标准差来来估计平平均数的的标准误误,即:样本平均均数的标标准误和和置信区区间则总体平平均数在在(1-)置信水水平上的的置信区区间为:样本频率率的标准准误和置置信区间间对于以频频率表示示的资料料,当资资料的观观测值个个数相当当大时,其分布布也接近近正态分分布,其其标准误误的计算算公式为为:样本频率率的标准准误和置置信区间间则总体频频率在(1-)置信水水平上的的置信区区间为:2平均数资资

3、料样本本容量的的确定确定样本本容量前前,必须须先明确确能够接接受误差差的范围围,并了了解两类类错误的的概率和和变量标标准差的的大小,并根据据试验和和经验作作出估计计。平均数资资料样本本容量的的确定在L(置信半半径)的的计算公公式中,s一般根据据前人经经验或小小型试验验取得;n一般取无无穷大,则t0.051.962。可得:若计算所所得n30,则将dfn-1带入,直直到计算算出的n为稳定数数值为止止。例题1某果园内内果树的的平均果果实产量量标准差差s为10kg。若以95的可靠靠性估计计果树产产量,要要求误差差不超过过2kg,问应抽抽取多少少果树做做样本?例题2条件同例例题1,若要求求估计误误差不超

4、超过5kg,问应抽抽取多少少果树做做样本?频率资料料样本容容量的确确定对于以频频率表示示统计结结果的资资料,其其样本容容量的计计算公式式改变为为:其中L的单位应应与p、q一致。例题3某医生的的按摩疗疗法预计计对患者者的治愈愈率为75,若允允许的误误差为5,则应应调查多多少位患患者才能能验证这这一结论论(0.05)?成对资料料和非成成对资料料样本容容量的确确定成对资料料样本容容量的确确定对于成对对资料中中样本容容量的计计算,相相应的公公式为:其中:为为试试验所得得各对间间差异的的方差;为各对间间差异平平均数。例题4某药物试试验以大大鼠为对对象,治治疗前后后大鼠体体重差异异标准差差一般在在20g左

5、右。若若要使治治疗前后后对大鼠鼠体重差差异的估估计精确确到5g,则需要要多少只只大鼠做做试验(0.05) ?成对资料料和非成成对资料料样本容容量的确确定非成对资资料样本本容量的的确定对于非成成对试验验,相应应的公式式为:其中:为为试验各各组间差差异的方方差为各组平平均数的的差异值值。若计算所所得n16,则将df2(n-1)带入,直到计算算出的n为稳定数数值为止止。例题5某科学家家对一定定年龄女女童的体体重差异异进行了了测量,结果显显示其差差异的标标准差为为1.5kg。若要使使测量结结果的误误差为0.2kg,则应对对多少组组女童进进行调查查?(组)补充:两两样本频频率比较较时样本本容量的的确定两

6、样本频频率比较较时,样样本容量量的计算算公式为为:其中:为合并百百分率;。例题7对两个食食品厂进进行抽查查后,发发现甲厂厂产品合合格率为为95,乙厂厂为91,若要要推断两两厂间食食品的合合格率是是否确实实相差4,取=0.05时至少要要检验多多少批食食品?3抽样的基基本方法法抽样调查查是从总总体中抽抽取一定定数量的的观察单单位组成成样本。其目的的就是由由样本指指标来推推断总体体的特征征。抽样样方法正正确与否否,关系系到样本本是否具具有代表表性,也也直接影影响到由由样本所所得估计计值的准准确性。根据研究究情况的的不同,抽样方方法可分分为:随机抽样样、顺序序抽样、典型抽抽样。随机抽样样随机抽样样要求

7、在在进行抽抽样的过过程中,应该使使总体内内所有个个体均有有同等机会被抽抽取。由于抽样样的随机机性,可可正确地地估计试试验误差差,从而而得出科科学合理理的结论论。随机抽样样可分为为:简单单随机抽抽样、分分层随机机抽样、整体抽抽样、双双重抽样样。随机抽样样简单随机机抽样是最简单单、最常常用的抽抽样方法法,要求求被抽总总体内每每一个体体被抽的的机会均均等。即即采用随随机的方方法直接接从总体体中抽出出若干抽抽样单位位构成样样本。随机抽样样简单随机机抽样的的方法将总体内内所有抽抽样单位位全部编编号,采采用随机机方法确确定被抽抽单位编编号,构构成样本本。随机抽样样简单随机机抽样的的注意事事项简单随机机抽样

8、适适用于个个体间差差异较小小、所需需抽取的的样本单单位数较较小的情情况。对对于那些些具有某某种趋向向或差异异明显和和点片式式差异的的总体不不宜使用用简单随随机抽样样。随机抽样样分层随机机抽样是一种混混合抽样样,特点点在于将将总体按按变异原原因或程程度划分分成若干干区层,然后再再用简单单随机抽抽样方法法,从各各区层按按照一定定的抽样样分数(即一个个样本所所包括抽抽样单位位数与其其总体所所包括的的抽样单单位数的的比值)抽选抽抽样单位位。随机抽样样分层随机机抽样的的方法分层随机机抽样具具体可分分两步:1、将总体体按变异异原因与与程度划划分成若若干区层层,使区区层内变变异尽可可能小或或变异原原因相同同

9、,而区区层间的的变异比比较大或或变异原原因不同同;2、在每个个区层按按一定的的抽样分分数独立立随机抽抽样。确定各区区层应抽抽选的抽抽样单位位数有三三种方法法:1、相等配配置;2、比例配配置;3、最优配配置。随机抽样样分层随机机抽样的的优点:在总体内内各抽样样单位间间的差异异比较明明显的情情况下,若将总总体分为为几个比比较同质质的区层层,就能能提高抽抽样精度度。分层随机机抽样同同时运用用了随机机和分层层局部控控制原理理,不仅仅降低了了抽样误误差,也也可以运运用统计计方法来来估算抽抽样误差差。随机抽样样整体抽样样把总体分分成若干干群,以以群为单单位,进进行随机机抽样,对抽到到的样本本全面调调查。其

10、特点在在于以“群”为抽样单单位,“群”间的差异异越小,被抽的的“群”越多,抽抽样误差差越小。与简单随随机抽样样相比较较,在相相等的抽抽样分数数下,它它减少了了所抽查查单位的的数目,同时增增大了每每个调查查单位。随机抽样样整体抽样样的方法法将变异程程度相近近或变异异原因相相同的抽抽样单位位组成群群,再以以随机抽抽样的方方式抽出出其中的的群进行行调查。随机抽样样整体抽样样的优缺缺点整体抽样样的优点点在于:1、由于一一个群只只要一个个编号,因而减减少了抽抽样单位位编号数数,且因因调查单单位数减减少,工工作方便便;2、与随机机抽样相相比较,它常常常提供较较为准确确的总体体估计值值,特别别是对于于不均匀

11、匀分布的的研究对对象;3、只要各各群抽选选单位相相等,整整体抽样样也可提提供总体体平均数数的无偏偏估计。整体抽样样的缺点点在于:当样本本含量一一定时,其抽样误差差一般大大于简单单随机抽抽样,这是因因为样本本观察单单位并非非广泛地地散布在在总体中中。随机抽样样双重抽样样当要研究究的性状状不容易易观察测测定时,为了简简易调查查目标性性状,可可以设法法找出另另一种易易于观察察测定且且节省时时间和经经费的性性状,利利用这两两种性状状客观存存在的关关系,通通过测定定后一性性状结果果从而推推算前一一种性状状的测定定结果。前一性性状一般般称为复杂性状状或直接接性状,后一性性状称为为简单性状状或间接接性状。随

12、机抽样样双重抽样样的方法法针对所研研究的复复杂性状状的特性性,首先先找出与与之相关关联的简简单性状状。再通通过对该该简单性性状的测测量或调调查,推推算出复复杂性状状。在实际运运用中,双重抽抽样可以以推广为为多重抽抽样。随机抽样样双重抽样样的优点点对于复杂杂性状的的调查研研究可以以通过仅仅测定少少量抽样样单位而而获得相相应于大大量抽样样单位的的精确度度。当复杂性性状必须须通过破破坏性测测定才能能调查时时,则仅仅有这种种双重抽抽样方法法可用。顺序抽样样按某种既既定顺序序从总体体(有限限总体)中抽取取一定数数量的个个体构成成样本。具体方法法是,将将总体的的观察单单位按某某一顺序序号分成成n个部分,再

13、从第第一部分分随机抽抽取第k号观察单单位,依依次用相相等间隔隔,从每每一部分分各抽取取一个观观察单位位组成样样本。顺序抽样样顺序抽样样的优点点可避免抽抽样时受受人们主主观偏见见的影响响,且简简便易行行。容易得到到一个按按比例分分配的样样本。样本观察察单位在在总体分分布均匀匀,故其其抽样误误差一般般小于简简单随机机抽样,能得到到较准确确的结果果。顺序抽样样顺序抽样样的缺点点如果总体体内存在在周期性性变异或或单调增增(减)趋势时时,则很很可能会会得到一一个偏差差很大的的样本,产生明明显的系系统误差差。顺序抽样样得到的的样本并并不是彼彼此独立立的,因因此,对对抽样误误差的估估计只是是近似的的。通过过

14、顺序抽抽样的方方法,不不能计算算抽样误误差、估估计总体体平均数数的置信信区间。典型抽样样根据初步步资料或或经验判判断,有有意识、有目的的地选取取一个典典型群体体作为代代表(即即样本)进行调调查记载载,以估估计整个个总体。典型样本本代表着着总体的的绝大多多数,如如果选择择合适,可得到到可靠的的结果,尤其从从容量很很大的总总体中选选取较小小数量的的抽样单单位时,往往采采用这种种方法。这种抽样样方法完完全依赖赖于调查查工作者者的经验验和技能能,结果果很不稳稳定,也也无法估估计抽样样误差。典型抽样样典型抽样样的优点点典型样本本代表着着总体的的绝大多多数,如如果选择择合适,可得到到可靠的的结果,尤其从从

15、容量很很大的总总体中选选取较小小数量的的抽样单单位时,往往采采用这种种方法。典型抽样样的缺点点抽样方法法完全依依赖于调调查工作作者的经经验和技技能,结结果很不不稳定,也无法法估计抽抽样误差差。4抽样调查查的目的的和指标标要求在制订抽抽样方案案时,首首先应弄弄清抽样样目的及及要解决决的问题题,要有有具体的的目的和和指标。是要了了解总体体的平均均数,还还是要了了解事物物间的相相应联系系,这些些问题要要通过具具体的指指标(即即性状)来体现现。确定调查查对象调查对象象指我们们所要研研究的总总体,即即根据调调查目的的确定的的观察对对象;而而观察单单位是指指组成调调查对象象的各个个单位或或个体。一般来说说

16、,总体体大,抽抽样单位位可大一一些,总总体小,抽样单单位可小小一些。抽样单单位的大大小应视视具体问问题的性性质及费费用等来来确定。确定抽样样调查的的方法抽样方案案中采用用何种方方法是制制定抽样样方案的的关键。抽样方方法应根根据具体体调查研研究的目目的和对对象,结结合各种种抽样方方法的特特点,并并考虑抽抽样费用用、工作作难易和和估计值值的精确确度等综综合因素素作出决决定。一般来讲讲,精确度要要求高的,尽量量采用分分层随机机抽样、整体抽抽样和顺顺序抽样样;要求计算算抽样误误差时,就必必须采用用随机抽抽样;要求费用用低廉,抽样易易于进行行时,采用用顺序抽抽样、典典型抽样样、整体体抽样。确定抽样样调查

17、的的方法两次抽样样法第一次抽抽样先做做小型的的初步调调查,以以摸清总总体的概概况为主主,确定定抽样的的初级单单位是什什么。然然后再确确定次级级抽样单单位是什什么。在第一次次抽样的的基础上上作出第第二次抽抽样调查查方案,确定第第二次抽抽样的样样本容量量、抽样样方法以以及作出出测量单单位和方方法的具具体规定定,达到到两次抽抽样的最最优配置置。确定样本本容量和和抽样分分数一般地讲讲,样本本容量与与精确度度有关,样本容容量越大大,精确确度越高高。但样样本容量量的增加加势必引引起人、财、物物耗费的的增加和和时间的的延长,因此样样本容量量的大小小应适当当。样本容量量与置信信概率也也有关,置信概概率要求求高的,样本容容量应适适当大些些,否则则样本容容量可适适当小些些。要求求抽样误误差小的的,样本本容量应应大些,否则样样本容量量可适当当小些。在一定容容量的总总体中,抽样分分数与样样本容量量成正比比。一般般地讲,抽样分分数应在在样本容容量确定定后再确确定。这这样可以以根据样样本容量量,适当当考虑总总体容量量来确定定抽样分分数。总体单位位编号对总体单单位编号号就是将将总体的的所有抽抽样单位位依其所所处的自自然位置置或某种种特征编编排号码码。编号号方法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论