十一章抽样法_第1页
十一章抽样法_第2页
十一章抽样法_第3页
十一章抽样法_第4页
十一章抽样法_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章抽样法

1第一节抽抽样样法的意意义和作作用一、抽样样法的特特点抽样法在在统计调调查和统统计分析析中都有有广泛的的应用。。抽样法是是按照随随机原则则从全部部研究对对象中抽抽取一部部分单位位进行观观察,并并依据所所获得的的数据对对全部研研究对象象的数量量特征做做出具有有一定可可靠性的的估计判判断,从从而达到到对全部部研究对对象的认认识的一一种统计计方法。。2抽样法的的基本特特点:(1)根根据部分实际际资料对全部总总体的数数量特征征作出估估计。通过抽样样调查,,取得部部分单位位的实际际材料,,据以计计算抽样样的综合合指标,,然后对对于总体体的规模模、水平平、结构构指标作作出估计计。3(2)按按随机的原原则从全部总总体中抽抽选样本本单位。。(3)抽抽样推断断的抽样误差差可以事先先计算并并反加以以控制。。抽样推断断是以部部分资料料推算全全体,虽虽然存在在一定的的抽样误误差,但但它可以以事先通通过一定定资料加加以计算算,并且且能够采采取一定定的组织织措施来来控制这这个误差差范围,,保证抽抽样准断断的结果果达到一一定的可可靠程度度。4二、抽样样法的作作用第一,对对某些不不可能进进行全面面调查而而又要了了解其全全面情况况的社会会经济现现象,必必须应用用抽样法法。如,工业业生产中中检验某某些产品品的质量量时,常常常具有有破坏性性。如轮轮胎的里里程检验验、灯泡泡的寿命命检验,,纱布的的强力检检验、炮炮弹的杀杀伤力检检验等。。有些现象象的总体体过大,,单位过过于分散散,进行行全面调调查实际际上是不不可能的的,例如如要检验验水库的的鱼苗数数,森林林的木材材积蓄丝丝等。5第二,对对某些社社会经济济现象虽虽然可以以进行全全面调查查.但抽抽样法仍仍然有其其独到的的作用,,例如::抽样调查查可以节节省人力力、费用用,提高高调查的的经济效效果。抽样调查查可以节节省时间间,提高高调查的的时效性性。抽样调查查由于调调查单位位少,调调查队伍伍经过专专门训练练,可以以增加调调查项目目,取得得比较详详细的资资料,并并且提高高资料的的准确性性。6第三,抽抽样调查查和全面面调查同同时进行行,可以以发挥相相互补充充和检查查质量的的作用。。第四,抽抽样法可可以用于于工业生生产过程程的质量量控制。。第五,利利用抽样样法原理理,还可可以对于于某种总总体的假假设进行行检验,,来判断断这种假假设的真真伪,决决定行动动的取舍舍。7三、抽样样法的理理论基础础(一)大大数法则则就数量关关系来说说,抽样样推断是是建立在在概率论论的大数数法则基基础上,,大数法法则的一一系列定定理为抽抽样推断断提供了了数学依依据。8大数法则则即关于于大量的的随机现现象具有有稳定性性质的法法则。它它说明如如果被研研究的总总体是由由大量的相相互独立立的随机因素素所构成成,而且且每个因因素对总总体的影影响都相对地小小,那么对对这些大大量因素素加以综综合平均均的结果果,因素素的个别别影响将将相互抵抵消,而而显现出出它们共同作用用的倾向向,使总体体具有稳稳定的性性质。9联系到抽抽样推断断来看,,大数法法则证明明:如果果随机变变量总体体存在着着有限的的平均数数和方差差,则对对于充分分大的抽抽样单位位数n,,可以几几乎趋近近于l的的概率,,来期望望抽样平平均数与与总体平平均数的的绝对离离差为任任意小,,即对于于任意的的正数。。有:10(二)中中心极限限定理大数法则则论证了了抽样平均均数趋近于总总体平均均数的趋趋势,这这为抽样样推断提提供了重重要的依依据。但但是,抽抽样平均均数和总总体平均均数的离离差究竟竟有多大大?离差差不超过过一定范范围的概概率究竞竞有多少少?这个个离差的的分市怎怎样?大大数法则则并没有有在这方方面给出出什么信信息。这个问题题要利用用另一重重要的定定理,即即中心极限限定理来研究。。中心极极限定理理证明::如果总总体变量量存在有有限的平平均数和和方差,,那么不不论这个个总体变变量的分分布如何何,随着着抽样单单位数n的增加加,抽样样平均数数的分布布便趋近近于正态分布布。11INTRODUCTIONTOINFERENTIALSTATISTICSStatisticalinferenceistheprocessofmakinggeneralizationaboutapopulationfromasample.Sincemostofthecharacteristicsofapopulationcanbedescribedbyparameters,,inferentialstatisticsprimarilydealswiththeestimationofanunknownpopulationparameterfromthecorrespondingsamplestatistic.withtheverificationwhetherabelieforhypothesisaboutaparameterissupportedbythesampleevidence.EstimationHypothesistesting(E.g..:Weestimateprobabilitymeasuresfromrelativefrequencies.)(E.g..:Webelievethattheprobabilityofaneventis0..2andusingjustasamplewewanttofindoutwhetherthisisareasonableassumption.))12Ex1:Supposeweareinterestedinthefollowingpopulation:X={1,2,,3,4,5)).Sincethisisaverysmallpopulation(Nx=5),itiseasytoobservethewholepopulation,toillustrateitwitharelativefrequencyhistogramandtofindtheparameters,likethepopulationmeanandthepopulationvariance.and(Checkthedetails.))Thekeyconceptbehindthesestatisticalproceduresistheprobabilitydistribution,,calledsamplingdistribution,,ofasamplestatistic.Asummaryofallpossiblevaluesofastatisticalongwiththecorrespondingprobabilities..131234512345Thoughthesecalculationswerereallysimple,assumethat,,forsomereason,wedonotobservethewholepopulation,,butdrawallpossiblesamplesofsizetwo(n=2))withreplacement.Thereare25possiblesamples.Theyareshowninthefirstrowandfirstcolumnofthetablebelow.1stdraw(x1)2nddraw(x2)1.0Computethesamplemeanfromeachofthesesamples.(E.g.:Ifx1=1andx2=4,,x-baris2..5.))2.53.01.52.02.53.03.52.02.53.03.54.03.03.54.04.53.01.54.04.55.0Thesesamplemeanvaluesformasecondpopulation,X-bar1.(Checkthedetails.))14Repeatpartbassumingthistimethatsamplingiswithoutreplacement.123451-1.52.02.53.021.5-2.53.03.532.02.5-3.54.042.53.03.5-4.553.03.54.04.5-1stdraw(x1)2nddraw(x2)Thesesamplemeanvaluesformathirdpopulation,X-bar2.(Sincesamplesaredrawnwithoutreplacement,thesamenumbercannotturnuptwice..)15ComparetheX,X-bar1andX-bar2populationstoeachother.XX-bar1X-bar2Size(N)52520Mean(μ)333Variance(σ2)210.75X-bar1andX-bar2arelargerpopulationsthanX.X,X-bar1andX-bar2havethesamemean..XhasthebiggestvarianceandX-bar2hasthesmallest.

TheseresultssuggestthatItiseasierto‘‘guess’X-bar2thanX-bar1orX.16Apartfromtheirmeansandvariances,,theX-bar1andX-bar2populationscanalsobecharacterizedbytheirshapes.Notehowever,,thatand(TheserelationshipsbetweenthevariancesofX,X-bar1andX-bar2arevalidingeneral.))TheserelativefrequencyhistogramsaregraphicalrepresentationsoftheX-bar1andX-bar2samplingdistributions.Apparently,bothsamplingdistributionsaresymmetricalaroundµ=3.Nevertheless,,theyaredifferentfromeachother,,andbothofthemaredifferentfromthedistributionofX.17Howtotakeasample?Inthisexampletheoriginalpopulation,,X,isverysmall,,sowecouldeasilycalculatethepopulationmean,μx.Therewasnorealneedtodrawsamples.Inpractice,however,thetargetpopulationisusuallymuchlarger.Thepopulationaboutwhichwewanttodrawinferences.Sinceitmightbeimpossibleorimpracticaltoobservethewholepopulation,,wedrawasample..Itisnotnecessarilythesamethanthesampledpopulation,i..e.thepopulationfromwhichweactuallytakethesample..Thesamplemustberepresentative,,i..e.itmusthavesimilarattributesthanthepopulationitself.InordertoobtainreliableinformationfromasampleThetargetandsampledpopulationsshouldbeverysimilar,,orthesameifpossible.18Evenasmallsampleislikelytogiveusfairlyaccurateinformationaboutthepopulation.(E.g.thesamplemeancanbeexpectedtobeclosetothepopulationmean..)Ifthesampleitemsareselectedrandomly,thesampleislikea‘scaled--down’versionofthepopulation,unlessweareveryunlucky.Ifthesampleisnotrandomlyselected,itislikelytoproducemisleading,biasedresults,evenifthesampleisrelativelylarge.(E.g..Ifwewereattemptingtoestimatemeanearnings,butwefailedtosamplepeopleinmoreaffluentsuburbs,thesamplemeanwouldalmostcertainlyunderestimatethetruepopulationmean.)19ThisexamplesuggeststhatIfweintendtouseasamplestatisticforstatisticalinference,firstwehavetostudyitssamplingdistribution..(Ex1)Westudiedallpossiblesamplesofsize2drawnwithreplacement.Therewere25differentsamples.Ifweselectonlyoneofthem,butmakesurethatallthesesampleshavethesamechanceofbeingselected,thensamplingisassuredtobesimplerandomsampling.Ifwedrawjustonesampleandithappenstobex1=1andx2=3,,x-baris2..SincethetruemeanofXis3,theerroris1.Thisisasamplingerror.Samplestatistics,likee.g..X-bar,arerandomvariablessincetheiractualvaluesvarydependingonwhichparticularsampleisselected.The25possiblesamplesofsize2had9differentsamplemeanvalues:1.0,,1..5,2.0,2.5,,3..0,3.5,4.0,,4..5and5.0.SAMPLINGDISTRIBUTIONS20TheresultsfromEx1canbegeneralizedasfollows..Thesamplingdistributionofthesamplemeanscalculatedfromrandomsamplesofthesamesizehavethefollowingcharacteristics:

1)i.e..theexpectedvalueofthesamplemeanisthemeanofthesampledpopulation.Thesamplemeanfromarandomsampleisourbestguessofthetruepopulationmean..

2)grantedthatsamplingiswithreplacement,orfromarelativelylarge,,maybeinfinite,population.(Thepopulationisconsideredtobelargecomparedtothesampleifn/N<0.10,i.e.nislessthan10%%ofN.)OtherwiseFinitepopulationcorrectionfactor.Likeprobabilitydistributionsingeneral,asamplingdistributioncanbedescribedbyitsthreeimportantproperties:mean,standarddeviationandshape.21Asfortheshapeofthesamplingdistributionofthesamplemean,itdependsonthedistributionofthesampledpopulationandonthesamplesize.Thestandarddeviationofthesamplemean((oranyotherstatistic)iscalledstandarderror.Sincethemeanofthesamplemeanisμ,thestandarddeviationofthesamplemeanmeasurestheaveragedistancebetweenthesamplemeanandthepopulationmean.Namely::3)Ifthepopulation((X)isnormallydistributed,,X-barisalsonormallydistributed,,regardlessofthesamplesize.Ifthepopulation((X)isnotnormallydistributed,orwedonotknowwhetheritisnormal,wecanrelyontheCentralLimitTheorem((CLT)::Ifthesamplesizeislarge((sayn30),,X-barisapproximatelynormallydistributed,regardlessoftheshapeofthepopulation..Themorebell-shapedthepopulationor/andthelargerthesamplesize,,thebetterthisapproximationis.22Ex2:Anautomaticmachineinamanufacturingprocessisoperatingproperlyifthelengthsofanimportsub-componentarenormallydistributed,withmeanμ=117cmandstandarddeviationσ=2..1cm.Findtheprobabilitythatonerandomlyselectedunithasalengthofgreaterthan120cm.Findtheprobabilitythatifthreeunitsarerandomlyselected,theirmeanlengthexceeds120cm..Xi.e..X:N(117,2.1))nSinceXisnormallydistributed,X-barisalsonormal,andX-bar:N(117,1.212)23Theprobabilityofrandomlyselectingoneunitlongerthan120cmis7.64%,whiletheprobabilityofselectingthreeunitswithanaveragelengthofgreaterthan120cmisonly0.68%.

24第二节总总体体和样本本1、全及及总体和和抽样总总体2、全及及指标和和抽样指指标3、样本本容量和和样本个个数251、全及及总体和和抽样总总体全及总体体是所要研究究的对象,,又称母母体,简简称总体体,它是是指所要要认识的的,具有有某种共共同性质质的许多多单位的的集合体体。全及总体体单位数数(N)一般很很大。26抽样总体体(又称称子样))抽样总体体则是所要观察察的对象。。简称样本、子子样,是从全全及总体体中随机机抽取出出来,代代表全及及总体的的那部分分单位的的集合体体。样本的单单位数((n)总是有有限的。。全及总体体和抽样样总体两两者是既既有区别别而又有有联系的的不同范范畴。27样本容量量抽样总体体的单位位数,通通常用小小写英文文字母n来表示。。随着样本本容量的的增大,,样本对对总体的的代表性性越来越越高,并并且当样样本单位位数足够够多时,,样本平平均数愈愈接近总总体平均均数。28样本的特特点在一次抽抽样调查查中,全及总体体是唯一确定的,,样本是不确定定的,具具有随机性。一个全及及总体可可能抽出出很多个个样本,,可能样样本的个个数与样样本容量量和抽样样方法有有关。29如:N=4n=2(考虑顺顺序)重重置抽样样时:样样本个个数=16若改变样本本单位数数,取n==3,,则,样本本个数==4×4×4==64应用数学学排列计计算公式式:N个元素素中任取取n个元元素组成成的可重重复排列列30如:N=4n=2(考虑顺顺序)不不重置抽抽样时:样样本个数数=12若改变样本本单位数数,取n==3,,则样样本个数数=4××3×2=24应用数学学排列计计算公式式:N个元素素中任取取n个元元素组成成的不可可重复排排列31如:N=4n=2(不考虑虑顺序))不重置置抽样时:样样本个数数=6若改变样本本单位数数,取n==3,,则样样本个数数=(4×3××2)//(3×2))=4应用数学学组合计计算公式式:N个元素素中任取取n个元元素组成成的不可可重复排排列32如:N=4n=2(不考虑虑顺序))重置抽抽样时:样样本个数数=10若改变样本本单位数数,取n==3,,则样样本个数数=(6×5××4)//(3××2)=20应用数学学排列组组合计算算公式::N个元素素中任取取n个元元素组成成的不可可重复排排列33判断题从全部总总体单位位中按照照随机原原则抽取取部分单单位组成成样本,,只可能能组成一一个样本本。())答案:××一个全及及总体可可能抽出出很多个个样本34判断题在抽样推推断中,,作为推推断的总总体和作作为观察察对象的的样本都都是确定定的、唯唯一的。。())答案:×总体唯一一,样本本不唯一一352.参数数和统计计量(全及指指标和抽抽样指标标)参数(全全及指标标)(parameter))根据全及及总体各各个单位位的标志志值或标标志属性性计算的的,反映映总体某某种属性性或特征征的综合合指标称称为全及及指标。。全及指标标值具有有唯一性性。常用的全全及指标标有总体平均均数())(或总体成数数P)、总体标准准差σ(或总体方差差σ2)。36不同性质质的总体体,需要要计算不不同的全全及指标标。对于变量量总体,,由于各各单位的的标志可可以用数数量来表表示,所所以可以以计算总总体平均均数。37对于属性性总体,,由于各各单位的的标志不不可以用用数量来来表示,,只能计计算比重重结构指指标,称称为总体体成数。。用大写写英文字字母P来来表示,,它说明明总体中中具有某某种标志志表现的的单位数数在总体体中所占占的比重重。设总体N个单位位中,有有N1个单位具具有某种种标志表表现的,,N0个单位不不具有某某种标志志表现,,N1+N0=N,P为总体体中具有有某种标标志表现现的单位位数所占占的比重重,Q为为不具有有某种标标志表现现的单位位数所占占的比重重,则总总体成数数为38此外,全全及指标标还有总总体标准准差和总总体方差差,它们们都是测测度总体体标志值值离散程程度的指指标。39●统计量((抽样指指标)由抽样总总体各单单位标志志值计算算出来反反映样本本特征,,用来估估计全及及指标的的综合指指标称为为统计量量(抽样样指标))。40统计量的的特点统计量((抽样指指标)是是随机变变量,取取值不唯唯一。统计量是是样本变变量的函函数,用用来估计计总体参参数,因因此与总总体参数数相对应应。41统计量的的计算统计量有有样本平均均数(或或抽样成成数)样本标准准差(或样本本方差))42成数(P)具有某种种性质的的单位数数占总体体单位数数的比重。成数是((0,1)分布布的平均数43如:某一批产产品的合合格率是是90%%,这里里的合格格率即是是成数==0.9。合格率==合格品品数量//产产品总数数量44成数方差差())成数方差差:成数标准准差的平平方某一批产产品的合合格率是是90%%,则合合格率的的方差为为:p==90%==0.945第三节抽抽样样估计的的一般原原理一、抽样样估计的的优良标标准由于抽样样指标作作为统计计量,它它是一个个随机变变量,随随着抽取取的样本本不同,,便有不不同估计计值。因因此要判判断一种种估计量量的好坏坏,仅从从某一次次试验的的结果来来衡量是是不可能能的,而而应该从从多次重重复试验验中,看看这种估估计量是是否在某某种意义义上说最最接近于于被估计计参数的的真值。。一般地说说,用抽抽样指标标估计总总体指标标应该有有三个要要求。满满足了这这个要求求的,就就可以认认为是合合理的估估计或优优良的估估计。46(一)无偏偏性用抽样指指标估计计总体指指标要求求抽样指指标的平平均数等等于被估估计的总总体指标标。就是是说,虽虽然每一一次的抽抽样指标标和未知知的总体体指标可可能不相相同,但但在多次反复复的估计计中各个抽样样指标的的平均数数应该等等于总体体指标,,即抽样样指标的的估计平平均说来来是没有有偏误的的。抽样平均均数是无无偏估计计量,即即抽样平平均数的的平均数数等于总总体平均均数。47(二)一致致性用抽样指指标估计计总体指指标要求求当样本的的单位数数充分大大时,抽样指指标也充充分地靠靠近总体体指标。。换句话话说,随随着样本本的单位位数n的无限增增大,抽抽样指标标和未知知的总体体指标之之间的绝绝对离差差为任意意小的可可能性也也趋于必必然性。。48

49(三)有效效性用抽样指指标估计计总体要要求作为为优良估计计量的方方差应该该比其他他估计量量的方差差小,即用抽抽样平均均数和总总体某一一变量来来估计总总体平均均数,虽虽然两者者都是无无偏的估估计量,,而且在在每一次次的估计计中两种种估计量量和总体体平均数数都可能能有离差差,但样样本平均均数更靠靠近在总总体平均均数的周周围,平平均说来来它的离离差比较较小,所所以对比比来说,,抽样平平均数是是更为优优良的估估计量。。样本平均均数作为为估计量量的有效效性,我我们在下下面讲抽抽样平均均误差计计算时再再加以说说明。50二、抽样样误差抽样误差差是指由由于随机机抽样的的偶然因因素使样样本不足足以代表表总体,,而引起起抽样指标标和全及及指标之之间的绝绝对离差差。也称为为随机误误差。它不包括括登记误误差,也也不包括括系统性性误差。。51抽样中,,误差的的来源有有许多方方面。其中一类类是登记记性误差差,即在在调查过过程中由由于主客客观原因因而引起起登记上上的差错错所造成成的误差差。另一类是是代表性性的误差差,即样样本各单单位的结结构情况况不足以以代表总总体特征征者。代代表性误误差的发发生,有有以下两两种情况况:一种种是由于于违反抽抽样调查查的随机机原则,,如有意意地多选选较好的的单位或或较坏的的单位进进行调查查,这样样,所据据以计算算的抽样样指标必必然出现现偏高或或偏低现现象,造造成系统统性的误误差。52系统性的的误差和和登记性性的误差差都是抽抽样工作作中的组组织问题题,应该该采取措措施预防防发生或或把它减减少到最最小限度度。另一种情情形,即即使遵守守随机原原则,由由于被抽抽选的样样本有各各种各样样,只要要被抽中中的样本本其内部部各单位位被研究究标志的的构成比比例和总总体有所所出入,,就会出出现或大大或小的的偶然性性的代表表性误差差。这种种偶然性性的代表表性误差是是无法消消除的,,是抽样样误差。。53三种误差差的区别别:抽样误差差:抽样样指标和和全及指指标之间间的绝对对离差,,不可避免免,可以以控制。登记误差差:由于于观察、、测量、、登记、、计算造造成的误误差,可以避免免。系统性误误差:由由于有意意识选取取调查单单位造成成的系统统偏差。。理论上上可以避免免。54单选题抽样误差差是指(())。A.在在调查过过程中由由于观察察、测量量等差错错所引起起的误差差

B..在调查查中违反反随机原原则出现现的系统统误差C.随随机抽样样而产生生的代表表性误差差

D..人为原原因所造造成的误误差答案:C55影响抽样样误差的的因素总体各单单位标志志值的差差异程度度在其他条条件不变变的情况况下,总总体标志志的变异异程度愈愈小则抽抽样误差差也愈小小。样本的单单位数在其他条条件不变变的情况况下,抽抽样单位位数愈多多,抽样样误差就就愈小;;反之抽抽样单位位数少了了,则抽抽样误差差就要增增大。56抽样调查查的组织织形式这是因为为不同的的抽样组组织所抽抽出的样样本对于于总体的的代表性性不相同同。我们们常常利利用不同同的抽样样误差作作出判断断各种抽抽样组织织估计有有效性的的比较标标准。571、抽样平均均误差μμ反映抽样样误差一一般水平平的指标标。实质质含义是是指抽样平均均数(或或成数))的标准准差,反映了抽抽样指标标与总体体指标的的平均离离差程度度。58单选题抽样平均均误差是是())。。A.全及及总体的的标准差差B.样本本的标准准差C.抽样样指标的的标准差差D.抽样样误差的的平均差差答案:C59抽样平均均误差μμ的作用用作用:说说明样本指标标代表性性的大小小。平均误误差μ大,说明样样本指标标对总体指指标的代代表性低低;反之则则说明样样本指标标对总体体指标代代表性高高。60判断题抽样平均均均误差差反映抽抽样的可可能误差差范围,,实际上上每次的的抽样误误差可能能大于抽抽样平均均误差,,也可能能小于抽抽样平均均误差。。())答案:√√61抽样平均均误差的的计算:重置抽样样不重置抽抽样平均数成数成数平均数①②③④62如:某乡粮食食亩产量量的标准准差87。若按重置置抽样计计算,其其抽样平平均误差差为63如:已知秧苗苗成活率率….如果改为为:从100亩亩地中随随机抽取取10亩亩地进行行测试,,秧苗成成活率为为92%%,则按按不重置置抽样计计算,其其抽样平平均误差差为:64抽样平均均误差的的应用在抽样推推断中,,抽样平均均误差用于计算算极限误差差Δ652、抽样极限限误差ΔΔ用绝对值值形式表表示的样样本指标标与总体体指标偏偏差的可可允许的的最大范范围。也称为允许误差差。由抽样指指标变动动可允许许的上限限或下限限与总体体指标之之差的绝绝对值求求得。66抽样极限限误差((Δ)的的计算方方法平均数的的抽样极极限误差差成数的抽抽样极限限误差67估计区间间估计区间间(置信信区间)):根据抽抽样平均均数和抽抽样极限限误差确确定的总总体指标标取值范范围。总体平均均数的估估计区间间总体成数数的估计计区间68···69如:从某工厂厂工人中中随机抽抽取100人,,计算平平均工资资为1500元元,若要要求抽样样允许误误差最大大值为160元元,则该该厂工人人的总平平均工资资取值范范围在1340—1660元元之间。。即70两种抽样样误差的的关系抽样平均均误差具具有较强强的客观性,抽取的的样本一一旦确定定,抽样样平均误误差也就就随之确确定。它它由样本单位位数、总体标准准差、总体单位位数确定。抽样极限限误差具具有较强强的主观性,人们可可以根据据工作需需要、历历史经验验规定抽抽样允许许误差的的范围,,以保证证抽样的的有效性性。71概率度((t)基于理论论上的要要求,抽抽样极限限误差需需要以抽抽样平均均误差为为标准单单位来衡衡量。即即用抽样样极限误误差△除以抽样平均均误差μ,得出相相对的误误差程度度t倍。。t称为抽抽样误差差的概率度。于是有有:72Δ、μ、、t三者之间间的关系系Δ=tμ确定μ和t确定Δ根据抽样样平均数数和Δ就能估计计总体平平均数的的取值区区间Δ,μ,,t相互制约约。μ确定后后,Δ与t成正比关关系7374单选题反映样本本指标与与总体指指标之间间的平均均误差程程度的指指标是(())。A.抽样样误差系系数B.概率率度C.抽样样平均误误差D.抽样样极限误误差答案:C75填空题如果总体体平均数数落在区区间内的的概率保保证程度度是95.45%,则则抽样极极限误差差等于,抽样平平均误差差等于。答案:2μμ76四、抽样样估计方方法抽样估计计就是利利用实际际调查计计算的样本指标标值来估估计相应应的总体体指标数数值。抽样估计计有点估计和区间估计计两种。77点估计根据总体体指标的的结构形形式设计计样本指指标作为为总体参参数的估估计量,,并以样本指标标的实际际值直接作为相应应总体参参数的估估计值。78点估计的的基本特特点:简单易行行,原理理直观。。没有表明明抽样误误差和误误差在一一定区间间的概率率保证程程度。79抽样估计计的置信信度F(t))表明抽样样指标和和总体指指标的误误差不超超过一定定范围的的概率有有多大。。即抽样估计计的可靠靠性有多大。。也称为概率保证证程度。它是t的的函数。。0≤t≤≤5,,0≤≤F(t))≤1,F(t))是增函函数。80如:t=1F((1)==0.6827=68.27%t=1时时全及指指标落在在估计区区间的可可能性有有68..27%%t=2F((2)==0.9545=95.45%t=1..96F((1.96)==0.95=95%81判断题抽样估计计置信度度就是表表明抽样样指标和和总体指指标的误误差不超超过一定定范围的的概率保保证程度度。())答案:√√82单选题在一定的的抽样平平均误差差条件下下())。。A.扩扩大极限限误差范范围,可可以提高高推断的的可靠程程度B.扩扩大极限限误差范范围,会会降低推推断的可可靠程度度

C..缩小小极限误误差范围围,可以以提高推推断的可可靠程度度

D..缩小小极限误误差范围围,不改改变推断断的可靠靠程度答案:A扩大极限限误差范范围,估估计区间间扩大,,总体指指标落在在该区间间内的可可能性越越大,即即推断的的可靠程程度越高高。83单选题在其它条条件不变变的情况况下,提提高估计计的概率率保证程程度,其其估计的的精确程程度())。A.随之之扩大B.随之之缩小C.保保持不变变D.无无法确定定答案:B**原因84*原因精确度指指抽样指指标与总总体指标标偏离的的相对程程度,概率保证证程度提提高,即即F(t)增大大,则t增大。。在其它条条件不变变的情况况下,t增大大,抽样样极限误误差Δ增增大,因因此抽样样估计的的精确度度减小。。85判断题在其它条条件不变变的情况况下,提提高抽样样估计的的可靠程程度,可可以提高高抽样估估计的精精确度。。())答案:××86F(t))、t、ΔΔ、μ之之间的关关系F(t))与t具具有1——1对应应的关系系,所以以已知概概率保证证程度F(t))就可以以求出概概率度t;若若已知t就可以以知道F(t))。样本确定定μ给定F(t))tΔ=tμΔ/μ=t给定ΔF(t))87填空题如果总体体平均数数落在区区间内的的概率保保证程度度是95.45%,则则抽样极极限误差差等于,抽样平平均误差差等于。答案:2μμF(t))=95.45t=2ΔΔ==tμ==2μ88总体参数数区间估估计根据给定定的概率率保证程程度的要要求,利用实实际抽样样资料,,指出被被估计值值的上限限和下限限,即指出总体体参数可可能存在在的区间间范围。89参数区间间估计基基本特点点指出总体体被估计计值的上上限和下下限,即即指出总总体参数数可能存存在的区区间范围围,而不是直接接给出总总体参数数的估计计值。同时指出出总体参数数落在估估计区间间内的可可能性有有多大。90总体参数数区间三三个要素素必须同时时具备::估计值、、抽样误误差范围围、概率率保证程程度。估计值::一般为样样本平均均数或样本成成数p抽样误差差范围::Δ概率保证证程度::F(t))91填空题总体参数数区间估估计必须须具备的的三个要要素是::估计值值、、。答案:抽样误差差范围、、概率保保证程度度92区间估计计的步骤骤区间估计计根据给给定的条条件不同同,有两两种估计计方法::⑴给出允许许误差((Δ),,求概率率保证程程度F(t))。⑵给出概率率保证程程度F(t)),求估计区间间。93⑴给出出Δ,求求F(t)①抽取样本本,计算算样本指指标(样样本平均均数、样样本方差差、抽样样平均误误差);;②根据给定定的抽样样误差———允许许误差ΔΔ计算估估计区间间的上、、下限;;③求出概率率度t,,F(t),对对总体参参数作区区间估计计。94⑵给出出概率保保证程度度F(t),求求估计区区间。①抽取样本本,计算算样本指指标(样样本平均均数、样样本方差差、抽样样平均误误差);;②根据给定定的F(t)),查表表求出t;③求出抽样样极限误误差Δ和和估计区区间的上上、下限限,对总总体参数数作区间间估计。。95区间估计计注意首先确定定被估计计总体指指标的种种类,是平均数数还是成成数;其次取定定抽样方方法,是是重置抽样样还是不不重置抽抽样;然后再根根据给定定的样本本资料和和抽样条条件(给定概率率保证程程度还是是给定抽抽样极限限误差),确定定计算步步骤,进进行计算算。96练习1某学校进进行一次次英语测测验,为为了解学学生的考考试情况况,随机机抽选部部分学生生进行调调查,所所得资料料如下::试以95.45%的可可靠性估估计该校校学生英英语考试试的平均成绩绩的范围及及该校学学生成绩绩在80分以上上的学生生所占的比比重的范围。97解:(1)估估计该校学生生英语考考试的平平均成绩绩的范围围:分析:考试成绩绩是平均数,应选用用关于的的抽样计计算公式式;资料料没有给出总体单位位数N,抽样方方法应选选用重置抽样样。当资料中中没有指指出抽样样方法,,同时也也没有给给出总体体单位数数N时,,默认为为重置抽抽样。9899①计算样本本指标样本平均均成绩样本标准准差S=抽样平均均误差100②根据给定定的F((t),,查表求求tF(t))=95.45%查查表表t==2③求出抽样样极限误误差Δ和和估计区区间的上上、下限限

估计区间间下限::76.6--2.2754=74.32估计区间间上限::76.6++2.2754=78.89101可以95.45%的概概率保证证程度估估计该校学生生考试平平均成绩绩的区间间范围是是:74.32≤≤≤78..89102(2)估估计该校校学生成成绩在80分以以上的学学生所占占的比重重的范围围分析:学生所占占比重是成数,应选用用关于P的抽样样计算公公式;抽抽样方法法仍为重置抽样样。103①计算样本本指标样本成数数抽样平均均误差104②根据给定定的F((t),,查表求求tF(t))=95.45%查查表表t==2③求出抽样样极限误误差Δ和和估计区区间的上上、下限限=2×0.04996=0..09992估计区间间下限::0.48-0..09992==0.3801估计区间间上限::0.48+0..09992==0.5799105以95..45%%概率保保证程度度估计,,该校学学生成绩绩在80分以上上的学生生所占的的比重的的范围在在38.01%--57..99%%之间。。106总结在简单抽抽样条件件下进行行区间估估计的例例题。从从上面的的解法中中,我们们可以总总结出这这一类计计算题的的基本做做法:先计算出出样本指指标,然后根据据所给条条件(重重置抽样样或不重重置抽样样)进行行抽样平平均误差差的计算算,抽样样极限误误差的计计算,最后根据据样本指指标和极极限误差差进行区区间估计计。107练习2从某年级级学生中中按简单单随机抽抽样方式式抽取40名学学生,对对公共理理论课的的考试成成绩进行行检查,,得知其其平均分分数为78.56分,,样本标标准差为为12..13分分,试以以95..45%%的概率率保证程程度推断断全年级级学生考考试成绩绩的区间间范围。。如果其其它条件件不变,,将允许许误差缩缩小一半半,应抽抽取多少少名学生生?108解:n==40xx==78..56S==12..13t==2(1)109110第四节抽抽样样组织形形式常用的抽抽样组织织形式有有:简单单随机抽抽样、类类型抽样样、等距距抽样、、整群抽抽样和阶阶段抽样样等。111一、简单单随机抽抽样1、含义义:按随机原原则直接接从总体体N个单单位中抽取n个单位作作为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论