田间试验抽样调查_第1页
田间试验抽样调查_第2页
田间试验抽样调查_第3页
田间试验抽样调查_第4页
田间试验抽样调查_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十五章抽样调查第一节抽样调查方案第二节常用抽样方法的统计分析第三节样本容量的估计第一节抽样调查方案一、抽样单位二、抽样方法三、样本容量四、确定抽样方案的一些因素一、抽样单位抽样分数(samplingfraction):指一个样本所包含的抽样单位数占其总体单位数的成数。田间抽样调查的抽样单位(sampleunit)是随调查研究目的、作物种类、病虫害种类、生育时期、播种方法等因素而不同的,可以是一种自然的单位,也可以是若干个自然单位归并成的单位,还可以用人为确定的大小、范围或数量作为一个抽样单位。

常用的抽样单位举例如下:

(1)面积如0.5平方米或每平方米内的产量、株数、害虫头数等。

(2)长度如1~2行若干长度内的产量、株数,若干长度内植株上的害虫头数等。(3)株穴如棉花连续10株的结铃数,水稻连续20穴的苗数、分蘖数、结实粒数等。

(4)器官如稻、麦千粒重,大豆百粒重,每100个棉铃中红铃虫头数,每张叶片的病斑数等。(5)时间如单位时间内见到的虫子头数,每天开始开花的株数等。(6)器械如一捕虫网的虫数,一只诱蛾灯下的虫数,每一个显微镜视野内的细菌数、孢子数、花粉发芽粒数等。(7)容量或重量如每升或每公斤种子内的混杂种子数,每升或每公斤种子内的害虫头数等。(8)其他如一个田块、一个农场等概念性的单位。二、抽样方法基本的抽样方法(samplingmethod)有以下三类:1.顺序抽样(systematicsampling)也称机械抽样或系统抽样,按照某种既定的顺序抽取一定数量的抽样单位组成样本。

2.典型抽样(typicalsampling)也称代表性抽样,按调查研究目的从总体内有意识地选取一定数量有代表性的抽样单位,至少要求所选取的单位能代表总体的大多数。3.随机抽样(randomsampling)也称等概率抽样,在抽取抽样单位时,总体内各单位应均有同等机会被抽取。

常用的顺序抽样方式三、样本容量样本容量(或样本含量samplesize):指样本所包括的抽样单位数。样本容量的大小与所获抽样调查结果的准确度和精确度密切有关。

四、确定抽样方案的一些因素设计抽样方案时须考虑以下几方面:(1)所要求的准确度与精确度,要求高时样本容量应大。(2)是否需估计置信限或作统计推论,一般随机抽样有合理的试验误差估计,可以做统计推论。而其他抽样方法往往缺乏合理的误差估计,统计分析有局限性。(3)与与人人力力、、物物力力、、时时间间等等条条件件相相适适应应,,抽抽样样单单位位大大、、样样本本容容量量大大、、进进行行总总体体编编号号等等都都是是较较费费事事的的,,必必须须权权衡衡需需要要与与可可能能,,在在保保证证一一定定精精确确性性的的情情况况下下,,尽尽量量减减低低消消耗耗。。(4)注注意意到到调调查查研研究究对对象象的的特特点点。。第二二节节常常用用抽抽样样方方法法的的统统计计分分析析一、、简简单单顺顺序序抽抽样样及及简简单单典典型型抽抽样样法法二、、简简单单随随机机抽抽样样法法三、、分分层层随随机机抽抽样样法法四、、整整群群抽抽样样法法五、、分分级级随随机机抽抽样样法法六、、双双重重随随机机抽抽样样法法七、、序序贯贯抽抽样样法法一、、简简单单顺顺序序抽抽样样及及简简单单典典型型抽抽样样法法简单单顺顺序序抽抽样样(simplesystematicsampling)::通常常只只计计算算平平均均数数作作为为总总体体的的估估计计值值。。计算算平平均均数数的的公公式式为为::[例例15.1]设设成成熟熟期期对对水水稻稻汕汕优优2号号大大田田测测产产,,该该田田块块约约5亩亩,,生生长长较较均均匀匀。。采采用用棋棋盘盘式式抽抽样样,,10个个点点,,每每点点由由12行行间间距距计计算算平平均均行行距距。。其其中中任任选选二二行行测测查查2m长长度度内内的的穴穴数数及及有有效效穗穗数数。。再再在在其其中中拔拔连连续续5穴穴,,将将稻稻穗穗分分成成大大、、中中、、小小三三级级,,按按比比例例选选取取20穗穗,,结结合合考考查查其其他他性性状状计计数数每每穗穗总总粒粒数数及及空空瘪瘪粒粒数数,,从从而而算算出出结结实实粒粒数数。。每每点点其其余余稻稻穗穗脱脱粒粒,,称称取取千千粒粒重重。。将将10点点数数据据汇汇总总后后求求得得每每亩亩平平均均穴穴数数4.2万万,,每每穴穴平平均均有效穗穗数9.2个,,每穗穗平均均结实实粒数数53.7粒,,平均均千粒粒重25.2克克。计计算平平均数数的公公式为为。本本例中中土地地利用用系数数定为为98%,,则估估计每每亩产产量为为:=513.75(kg/亩亩)简单典典型抽抽样法法的分分析同同样只只计算算。。二、简简单随随机抽抽样法法简单随随机抽抽样(simplerandomsampling):每个个抽样样单位位具有有相同同概率率被抽抽入样样本。。总体体编号号方法法及随随机抽抽取方方法依依调查查对象象而定定。[例15.2]设设在在一休休闲地地上调调查小小地蚕蚕虫口口密度度每测测框为为1m2,,随机机取30点点,调调查结结果列列在表表15.1。表15.130个单单位的的小地地蚕幼幼虫头头数每m2内幼虫头数(y)0123456789101112Σ单位数(个)123844222100130fy02624162012141690012131fy20212726410072981288100144773(头/㎡)(头/㎡)(头/㎡)即该田田块小小地蚕蚕幼虫虫约为为3.38~5.34(头/㎡),折折合每每亩2253.4~~3560.2头,,这个个估计计的可可靠性性为95%。以上将将所调调查研研究的的总体体看为为面积积甚大大的一一个无无限总总体进进行分分析,,设若若该30个个单位位从336㎡的一块块田中中抽出出,这这时调调查研研究的的总体体实为为一有有限总总体,,有限限总体体的两两个参参数为为:平均数数(15·1)(头/㎡)标准差差N为总体体内单单位数数,即即总体体容量量。样本估估计值值仍为为及,,但估估计抽抽样误误差时时应考考虑到到抽样样分数数的影影响。。(15·3)(15·2)本例中中(头/㎡)该有限限总体体平均均数的的95%置置信限限为::(头/㎡)即3.42~5.30(头/㎡),折折合每每亩2280.0~~3533.4头。。三、分分层随随机抽抽样法法分层随随机抽抽样法法(stratifiedrandomsampling):从各个个层次次或段段落分分别进进行随随机抽抽样或或顺序序抽样样。分层随随机抽抽样有有三个个步骤骤:(1))将所所调查查的总总体按按变异异情况况分为为相对对同质质的若若干部部分、、地段段等称称为区区层,,各区区层可可以相相等,,也可可以不不等。。(2))独立立地从从每一一区层层按所所定样样本容容量进进行随随机抽抽样。。各区区层所所抽单单位数数可以以相同同,也也可以以不同同。抽样单单位总总数在在各区区层的的分配配有::①比例配配置法法:指各各区层层大小小不同同时按按区层层在总总体中中的比比例确确定抽抽样单单位数数,若若各区区层大大小相相同,,比例例配置置结果果实际际即为为相等等配置置;②最优配配置法法:指根根据各各区层层的大大小、、变异异程度度以及及抽取取一个个单位位的费费用综综合权权衡,,确定定出抽抽样误误差小小、费费用低低的配配置方方案。。(3))根据据各区区层的的估计计值,,采用用加权权法估估计总总体参参数。。总平均均数::(15·4)总标准准误::若各区区层总总体方方差相相同,,则(15·55)(15·6)若各区区层抽抽样单单位数数按区区层比比例配配置,,则(15·7)其中(15·8)四、整整群抽抽样法法整群随随机抽抽样法法(randomgroupsampling):被抽抽取的的整群群中各各抽样样单位位都进进行调调查,,按群群计算算平均均数及及标准准差,,并估估计其其置信信限。。[例15.4]设设某某农场场调查查水稻稻螟害害发生生情况况,在在全场场100个个条田田中随随机抽抽取9条做做调查查,每每田块块采用用平行行线式式取10点点,每每点连连续查查20穴,,经初初步整整理后后将结结果列列于15.2。。某农场场螟害害率抽抽样调调查结结果田块123456789调查茎秆数198020622154251223152098242118672248螟害茎秆数178211335345212238460119298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25这资料料以条条田为为抽样样单位位进行行分析析。全场100条田田平均均螟害害率95%的可可能在在9.01~14.91%范范围内内。本例的的总体体实际际上是是一个个N=100的的有限限总体体,故故更确确切地地应为为:即9.15~14.77(%)间间。此外,,本例例是百百分数数资料料,如如果田田块间间的差差异不不大,,可以以采用用百分分数资资料的的分析析方法法,即即由总总调查查茎秆秆数和和总螟螟害茎茎秆数数求出出总螟螟害率率,得这样,即11.69~~12.59(%)。。这个区区间比前前面所估估小得多多,这是是因为前前面以田田块为抽抽样单位位,而不不是以茎秆为单单位,除除了有茎茎秆受害害与否的的随机误误差外,,还包含含有田块块间的差差异,所所以此处处不宜采采用百分分数的误误差估计计方法。。五、分级级随机抽抽样法巢式随机机抽样法法(nestedrandomsampling):最简单单的是二二级随机机抽样。。例如全全区的棉棉花结铃铃数,可可以在区区内随机机抽取几几个乡,,乡内随随机抽取取若干户户进行调调查。这这时,乡乡为初级级抽样单单位,户户为次级级抽样单单位。又例如研研究农药药在叶面面上的残残留量,,第一步步随机抽抽取单株株,第二二步在单单株上随随机抽取取叶片,,分别作作为初级级和次数数抽样单单位。表15.3某某农药药残留量量分析结结果及其其方差分分析植株各叶片内的残留量(单位数)合计平均13.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30变异来源自由度均方所估计的方差分量F植株间3MSB=0.2961*44.9F0.05(3,12)=3.49株内叶片间12MSA=0.0066巢式随机机抽样数数据可以以应用方方差分析析法算出出各阶段段的抽样样误差,,从而估估计平均均数的标标准误。。二级抽抽样的公公式如下下:(15··13))其中,k=初级抽抽样单位位数,n=次级抽抽样单位位数。(15··14))、分分别为次次级和初初级抽样样误差的的估计值值。二级抽样样的数据据按单向向分组的的组次数数相等(也可能能不相等等)的随随机模型型进行方方差分析析。例题题中k=4,n=4,方方差分析析结果F=0.2961/0.0066=44.9,说明明植株间间的误差差显著大大于株内内叶片间间的误差差。这二个阶阶段的抽抽样误差差是不同同的,应应该分别别估计。。但此处处若将kn=4×4=16张叶片片直接计计算其方方差则为为0.0645。比扣扣除株间间误差后后剩余的的株内叶叶片间误误差0.0066大得得多。[例15.5]表表15.3数据据的分析析结果::(单位)(单位)2(单位)(单位)此处DF=3,因因由均方MSB计算。若只从1个初级级单位估估计置信信限,如如以株为为单位作作估计,则::(单位)2(单位)(单位))由一株四四张叶片片估计,,比四株株16张张叶片估估计,误误差要大得多多。若每株只只取一张张叶片,,四株共共取4张张叶片,,则(单位)所以,同同样测定定4张叶叶片,从从1株上上取与从从4株上上取,抽样误差差是不同同的,今今后对此此材料抽抽样测定定时,应应多取植株,,每株上上可以少少取一些些叶片。。三级抽样样时的情情况为::、、、依依次为三三级、二二级及一一级抽样样单位的的抽样误误差,分分别抽取取n、k、、l个不同级级别的抽抽样单位位,则所所获样本本平均数数的抽样样误差为为获得后,,其总体体平均数数的置信信区间的的计算方方法与前前相同。。(15··15)六、双重重随机抽抽样法双重抽样样法(doublesampling):亦称相关关抽样法法。若所所要调查查的性状状y是不易观观察测定定,甚至至对观察察材料要要破坏后后方能测测定的,,而试验验又不容容许将材材料破坏坏,这时时可以利利用和所所要调查查的性状状有密切切相关关关系的另另一便于于测定的的性状x进行间接接的抽样样调查,,按确定定的相关关关系从从x的调查结结果推算算y的结果。。1.做一一次随机机抽样,,调查y和x两种性状状,从中中求出y依x的回归方方程。这这个样本本容量n不一定很很大,但但希望x和y有较大的的幅度。2.对总总体进行行x的抽样调调查,设设样本容容量为m,按以上上建立的的回归关关系从推推算的标准误误的近似式式:(15··16))采用双重重抽样法法,必须须注意y和x两性状间间不但要要有显著著相关,,而且须须有高程程度显著著相关,,才能获获得比较较准确的的结果,,所以在在建立回回归方程程时要检检验其相相关系数数的大小小及显著著性。七、序贯贯抽样法法序贯抽样样法(sequentialsampling):根据逐个个抽样单单位调查查累积的的信息,,在抽样样过程中中当机确确定样本本容量。。序贯抽样样法的基基本步骤骤:(1)确确定作作为“推推断”所所依据的的两个标标准,P0与P1,此处P0=0.50(即即50%)、P1=0.75(即即75%)分别别代表不不符控制制要求(必须治治虫)及及符合控控制要求求(不必必打药)的两个个界限。。(2)确确定““推断””的可靠靠程度的的两个概概率标准准与,,表表示总总体百分分数P<P0而误以为为P<P1的险,表表示总体体P>P1而误以为为P<P0的风险。。(3)估估计总总体分布布类型,,计算出出两条平平行的控控制线。。当总体体为二项项式分布布时。两两条控制制线为下下式:(15··17)(4)将将(15··17)的计算结结果画成成序贯抽抽样控制制图。横横坐标为为m,纵坐标标为h。(5)进进行实实际抽样样调查,,将逐个个抽样单单位测定定的累计计数m及h(完好穗穗数)在在坐标图图上标记记。(6)有有时总总体P可能在P0与P1之间,需需预先计计算一个个推断所所需最大大样本容容量E(m)。当总体属属二项式分分布时::[例15.7]设按按上述方方法对玉玉米完好好穗率进进行调查查,以确确定是否否需要继继续用药药。此时时确定P0=0.50,即即完好穗穗率低于于50%一定要要防治;;P1=0.75,即即完好穗穗高于75%不不再防治治。=0.10,即应应该防治治而误以以为不需需防治的的风险允允许为0.10;=0.10,即不不需防治治(15··18))而误以为为要防治治的风险险允许为为0.10;玉玉米完好好穗率总总体分布布估计为为二项式式分布。。由(15·17)计得得ha和hr的截距及及斜率分分别为::ha截距hr截距斜率因而两条条控制线线为:由(15·18)得::说明推断断所需最最大样本本容量为为测定18株。。将计算结结果画成成图15.2中中两条回回归线。。经田间逐逐穗实际际测查结结果列于于表15.4。。图15.2玉米完好穗率序贯抽样控制图测查至m=18时时,h=9,,超出界界外,抽抽样停止止,因h<ha(ha=-2.00+0.631××18=9.36),,故推论论为总体体完好穗穗率在50%以以下,所所以需要要防治。。本例恰好好抽样至至E(m)=18时才作作出推断断,这是是因为总总体完好好穗率与与“推断断”所依依据的两两个标准准P0,P1很相近,,如果相相差较大大,则测测查穗数数m小于18,便能能作出推推断。累计测查穗数(m)123456789101112131415161718累计完好穗数(h)012234556667778899表15.4玉玉米完完好穗数数序贯抽抽样结果果设若将及及均均定定为0.05,,P0及P1不变,则则:ha=-2.68+0.631mhr=2.68+0.631mE(m)=30.85两条平行行线的间间距增宽宽了,推推断所需需最大样样本容量量也增加加了。又设若将将、、均定定为0.05,,P0=0.50,P1=0.60,则则ha=-7.26+0.550mhr=7.26+0.550mE(m)=213.08两条平行行线的间间距更宽宽了,推推断所需需最大样样本容量量也更大大了。这里说明明序贯抽抽样法中中有效确确定、、、、P0、P1值对提高高工作效效率是很很重要的的。这需需要依据据专业知知识确定定。上例因估估计总体体是二项项式分布布。如果果总体不不是二项项式分布布而属泊泊松(Poisson)分布则则:(15··19))(15··19)中ln为自然然对数的的符号,,与为““推断””所依据据的两个个标准。。例如每每公斤种种子含某某种杂草草种子在在一粒以以下便调调进,若若在三粒粒以上便便拒绝,,这时因因每公斤斤种子中中含某种种杂草种种子数是是泊松分分布,=1,,=3。设若若=0.1,=0.1,则::ha截距hr截距斜率“推断””所需平平均样本本容量,,b<b0及b>b1时不同。。(15··20))此处:说明平均均抽取2个抽样样单位即即可获得得推断。。若实践践中抽样样至3××1.95=6个抽样样单位尚尚无结果果,则可可停止抽抽样。计计取这6个抽样样单位的的平均数数,,若偏偏向向则则推断为为可调进进,若偏偏向向b,则推断断为拒绝绝调进。图15.3杂草种子容量序贯抽样控制图第三节样样本本容量的的估计一、简单单一级抽抽样样本本容量的的估计二、分层层抽样样样本容量量的估计计三、二级级或多级级抽样样样本容量量的估计计四、抽样样单位大大小与样样本容量量的相互互决定一、简单单一级抽抽样样本本容量的的估计简单一级级抽样主主要指简简单随机机抽样。。在估计计其样本本容量时时,首先先要对调调查对象象的标准准差做出出估计,,并提出出预定准准确度和和置信系系数的要要求,然然后据此此以确定定样本容容量。因为其中n'为待定的的样本容容量。经变项,,得:(15··21))(15··21)中代表预定定的准确确度要求求,即指指要求所所得的样样本平均均数与总总体平均均数相差差不超过过给定的的量。若s估计值来来自大样样本,则则95%置信信系数下下t≈2,所以,(15··22))有时没有大大样本的s值可借用,,这时可通通过平均全全距(或平平均极差))估计s值,式中为为k个容量为n的小样本极极差的平均均值,c为折算系数数(表15.6),t由(表15.6)中的自由度度估计值()及置信系数数决定。(15·24)(15·23)若总体属有有限性时,,估计的抽抽样误差应应按(15·3)用用抽样分数数作矫正,,因而(15·21)将变为为:变项合并后后:(15·25)如果N很大时,可可计算其近近似值,,即(15·21):如n0/N比数不大,,可采用n0为近似值,,否则须计计算值:抽样单位数数()是随变异异程度(s2)和置信概率率()两者的增加加而增加,,同时随容容许误差(d)数值的减减少(15·26)而增加的。二、分层抽抽样样本容容量的估计计1.比例配置法法若各区层比比例为,则当总样本本容量为时,各区层层样本容量量可按进行分配,,因此只要要估计出,,便便可确定各各区层的。。因为,,则。。若令,,则称V为一定置信信系数下的的样本必需需方差。得比例配置置法的分层层抽样样本本容量的近近似公式为为:(15·27)(15·28)若抽样分数数极小,则则≈。2.最优配置法法其基本出发发点是区层层大、误差差大的应安安排较多抽抽样单位,,区层小、、误差小的的可少安排排抽样单位位。Neyman证实若若按区层大大小与区层层标准差乘乘积分配抽抽样单位可可使样本平平均数具有有最小方差差,因而称称之为最优优配置。各区层抽样样单位数::(15·29)最优配置法法分层抽样样样本容量量估计的近近似公式为为:(15·30)(15·31)抽样分数极极小时,≈≈。。三、二级或或多级抽样样样本容量量的估计设第二级和和第一级抽抽样误差的的估计值为为及,,待定的抽样样方案中第第一级样本本容量为,,第二二级样本容容量为,,则所待待抽取的样样本平均数数标准误将将为:(15·32)所以,(15·33)(15·34)在能假定较较大时,可可用作近似似估计。否否则需用假假定自由度度下的t值。设抽取第一一级单位(植株)的的费用为CB,抽取第二二级单位(叶片)的的费用为CA,则抽取单单位的费用用为:(15·35)若将(15·32)与(15·35)相乘,则:(15·36)当最最小时,,其微分::得:此时为为最佳第二二级抽样单单位数。3级抽样时时,可根据据3级抽样样试验进行行3级巢式式数据方差差分析,从从而估计出出一、二、、三3级抽抽样误差为、、、,,(15·37)(15·38)通过,推导出、、、间的关系式式。若(15·39)求为为最小小值时的解解:(15·40)(15·41)求出及及后后,再代代入中中解解出。四、抽样单单位大小与与样本容量量的相互决决定一些抽样方方案中抽样样单位是定定性的,例例如种子含含油量的测测定,另一一些抽样方方案中,抽抽样单位是是定量的,,例如测定定田间穗数数。抽样方案中中便须权衡衡用大抽样样单位少样样本容量合合适,还是是用小抽样样单位大样样本容量合合适,何者者精确度高高、花费少少。这时便须考考虑抽样单单位大小与与样本容量量的相互决决定问题。[例15.14]研研究田间间麦穗数抽抽样调查中中抽样单位位大小与样样本容量的的抽样误差差,在3块块大小相同同的田内进进行调查,,每块田分分为16小小块,每小小块中随机机定1样点点,每样点点调查1m行长,1行的穗数数,顺序查查平行6行行,按次序序记录。所所获数据共共有3×16=48个样点,,48×6个每m穗穗数记录。。这里将3块田看为为3个相等等的区层,,每区层中中样点看作作为一级抽抽样单位,,每样点内内1行看为为1个二级级抽样单位位,抽样单单位大小为为1行。若将相邻2行依次合合并,二级级抽样单位位大小为2行。若将将相邻3行行分别合并并,则二级级抽样单位位大小为3行。因此此同一组数数据可以用用以估计一一级单位的的抽样误差差,不同大大小二级单单位的抽样样误差,以以这些误差差估计值为为依据,可可制订今后后麦田穗数数调查的抽抽样方案。。变异来源DFSSMSEMS方差估计值

田块间3-1=218589.789294.89

田块内样点间3(16-1)=45107403.442386.74*

样点内二级单位间(1行)3×16(6-1)=240211374.78880.73

3×16(3-1)=96114597.671193.73*

3×16×3(2-1)=1449677

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论