版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章简单随机抽样第二章简单随机抽样1第二章简单随机抽样1、简单估计量2、比率估计量3、回归估计量第二章简单随机抽样1、简单估计量2例:从某个总体抽取一个n=50的独立同分布样本,样本数据如下:5676016657323669374626192792876905205023124525625575743508758342035939801722877532592768766923718876413994429274429181117841640521058797746153644476(1)计算样本均值与样本方差。(2)若用估计总体均值μ,按数理统计结果,是否无偏,并写出它的方差表达式。(3)根据上述样本数据,如何估计?(4)假定的分布是近似正态的,试分别给出总体均值μ的置信度为95%的近似置信区间。例:从某个总体抽取一个n=50的独立同分布样本,样本数据如下3(1)计算样本均值与样本方差。(2)若用估计总体均值μ,按数理统计结果,是否无偏,并写出它的方差表达式。
(3)根据上述样本数据,如何估计?(1)计算样本均值与样本方差。4(4)假定的分布是近似正态的,试分别给出总体均值μ的置信度为95%的近似置信区间。(4)假定的分布是近似正态的,试分别给出总体均值μ的置信度为5概述一、简单随机抽样(或单纯随机抽样)本书一般局限于不放回随机抽样二、实施方法三、地位、作用是其他抽样方法基础概述一、简单随机抽样(或单纯随机抽样)62.1定义与符号定义2.1从总体的N个单元中,一次整批抽取n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样.定义2.2从总体的N个单元中,逐个不放回抽取单元,每次抽取到尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止,这样所得的n个单元组成一个简单随机样本.2.1定义与符号定义2.1从总体的N个单元中,一次整批抽取7定义2.3按照从总体的N个单元中抽取n个单元的所有可能不同组合构造所有可能的个样本,从中随机抽取一个样本,使每个样本被抽到的概率都等于1/,这种抽样称为简单随机抽样。注意:定义2.1与定义2.3是等价的。三个定义之间的联系定义2.3按照从总体的N个单元中抽取n个单元的所有可能不同8简单随机抽样的具体实施方法常用的有抽签法和随机数法两种。(一)抽签法抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样本。抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到等概率。因此,实际工作中常常使用随机数法。简单随机抽样的具体实施方法9(二)随机数法随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n比较大时。(二)随机数法101、随机数表及其使用方法随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。在编制时,使用一种特制的电器或用计算机,将0至9的10个数字随机地自动摇出,每个摇出的数字就是一个随机数字。为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。根据不同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。1、随机数表及其使用方法11目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,1955年出版的100万数字随机数表,它按五位一组排列,共有20万组;肯德尔和史密斯编制,1938年出版的10万数字随机数表,它也按五位一组排列,共有25000组。我国常用的是中国科学院数学研究所概率统计室编印的《常用数理统计表》中的随机数表。目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,12简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。②设总体容量为N,若N的位数为r,则一定要从r位数中抽取。遇到1至N的数可直接使用;遇到其它的数不能直接使用。简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:13③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。可从起点开始向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,中途不能变更。④在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的14随机数表法一般分下述几步:第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字(或距落点最近的数字)为奇数,则确定起点在第1页;否则,起点在第二页。第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点的行数。由于每页只有50行,所以当落点处的两位数大于50时,则取其减去50的差数为行数。为保证等概性,当落点处的数为“00”时,则行数应取作50。然后依同样的方法再确定起点的列数。随机数表法一般分下述几步:第一步:确定起点页码,如用笔尖在随15第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或向右),每次取一个r位数。通常,若所需抽的数是一位数或两位数(即r=1或2),则由起点开始,依次向右抽取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移10位(或r位),再从第一行开始向下继续抽取,直到取足所需的n个r位数为止,以这n个r位数所对应的总体单元组成样本。第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或162、随机数骰子及其使用方法随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上刻有0-9的数字各2个。每盒骰子由盒体、盒盖、泡沫塑料垫及若干个(通常是3-6个)不同颜色的骰子组成。使用随机数骰子时可以像普通骰子那样用投掷的方法。但正规的方法是将一个或n个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打开盒子,读出骰子表示的数字。一个骰子一次产生一个0-9的随机数。要产生一个m位数字的随机数,就需要同时使用m个骰子(事先规定好每种颜色所代表的位数,例如红色表示百位数,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用m次(规定第一次产生的数字为最高位数,最后一次产生的数字为最末位即个位数字等)。特别规定m个骰子的数字(或一个骰子m次产生的数字)都为0时,表示10m。2、随机数骰子及其使用方法随机数骰子是由均匀材料制成的正二十17也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽样效果。表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机抽样。也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也18简单随机抽样的方法评估简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估计效率的标准,同时,从理论上讲简单随机抽样在各种抽样技术中是贯彻随机原则最好的一种,并且数学性质很简单,是等概率抽样的特殊类型。简单随机抽样的方法评估简单随机抽样对总体不加任何限制,等概19另一方面,因为是等概率抽取样本,所以要求总体在所研究的主要标志上同质性或齐性(共性)较好,也即总体要比较均匀;要求样本容量要比较大,以保证样本对总体具有充分的代表性。但是,在社会经济现象中,这种均匀总体是很少见的。因此,实际工作中很少单纯使用简单随机抽样方法。另一方面,因为是等概率抽取样本,所以要求总体在所研究的主要标20再者,因为直接从总体中抽取样本,未能充分利用关于总体的各种其它已知信息,以有效地提高样本的代表性,并进而提高抽样的估计效率。再者,因为直接从总体中抽取样本,未能充分利用关于总体的各种其21此外,简单随机抽样要求在抽样前编制出抽样框,并对每一个总体抽样单元进行编号,而且当总体抽样单元的分布比较分散时,样本也可能会比较分散,这些都会给简单随机抽样方法的运用造成许多的不便,甚至在某些情况下干脆无法使用。因此,在此基础上研究其它抽样技术显得更加重要。此外,简单随机抽样要求在抽样前编制出抽样框,并对每一个总体抽22符号的表示总体均值总体总值(总体总量)总体比例总体比率(总体比值)符号的表示总体均值23简单随机抽样课件24简单随机抽样课件252.2简单估计量及其性质2.2.1简单估计量的性质引理2.1从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元入样的概率为,两个特定单元都入样的概率为。2.2简单估计量及其性质2.2.1简单估计量的性质26简单随机抽样课件27一、总体均值的估计1.简单估计及其无偏性:一、总体均值的估计28定理2.1对于简单随机抽样,作为的简单估计,是无偏的。注意定理可以表示成更简洁的形式:定理2.1对于简单随机抽样,作为的简单估计,29证明1:(定义法)简单随机抽样课件30证明2:(对称性论证法)证明2:(对称性论证法)31证明3:从总体规模为N的总体中抽取一个容量为n的简单随机样本。若对总体中每个单元,如引理2.2引进随机变量即可完成证明。参见34页。证明3:从总体规模为N的总体中抽取一个容量为n的简单随机样本32简单随机抽样课件33估计量的方差在抽样推断中,有时往往只计算出估计量的值,而不大注意估计量的误差(方差或标准差)。但是,总体均值的估计量通常与总体均值的真值间不完全一致,即存在误差,而且所有可能的样本均值相对于总体均值的误差大小也是不一致的。联合国统计局编的《抽样调查理论基础》一书指出:“从研究大多数国家的抽样实践中,可以看出:虽然计算估计量的标准差,至少对关键性的几个估计量计算其标准差来说,仅需增加很少的额外开支或负担,但是他们并不意识到确定估计量的标准差的重要意义。这是否因为统计人员无意识地忽视了估计量的不精确性所产生的严峻的现实呢?计算标准差,并且把他们与估计量一起列出来,应该成为实际工作的一个常规。”估计量的方差在抽样推断中,有时往往只计算出估计量的值,而不342.2.2简单估计量方差与协方差2.2.2简单估计量方差与协方差351、简单估计量的方差1、简单估计量的方差36证明:方法一:根据方差的定义和性质,显然有
=证明:方法一:根据方差的定义和性质,显然有37根据前面定理2.1证明的方法二中使用过的对称性证明方法,即知:==根据前面定理2.1证明的方法二中使用过的对称性证明方法,即知38故=
===故=39证明2:仿照前面定理2.1之证明3引进随机变量,且运用引理2.2的结论就可完成证明。参见36页。证明2:仿照前面定理2.1之证明3引进随机变量,且运用引理40推论2.4对于简单随机抽样,的方差为:推论2.4对于简单随机抽样,的方差为:41
422、两个估计量的协方差2、两个估计量的协方差43证明1:根据定义,采用对称证明法。参见40页。证明1:根据定义,采用对称证明法。参见40页。44简单随机抽样课件45简单随机抽样课件462.2.3方差与协方差的估计2.2.3方差与协方差的估计47证明:只需证由定义由对称论证法简单随机抽样课件48简单随机抽样课件49简单随机抽样课件50区间估计区间估计51在获得各种总体特征的简单估计量的方差估计后,由于这些简单估计量均以样本均值为核心构建,根据中心极限定理它们都接近正态分布核心估计量样本均值分布近似服从正态分布。于是,可按照数理统计中有关正态分布总体特征的区间估计步骤进行估计,首先根据样本调查值计算出和,然后用作为的近似在获得各种总体特征的简单估计量的方差估计后,由于这些简单估计52简单随机抽样课件53例子1`1例子1`154简单随机抽样课件55例:在某地区10000户家庭中,按简单随机抽样抽取400户,调查一个月的伙食费(单位:元)。经计算:(1)试估计该地区平均每户每月的伙食费,并估计其标准差。(忽略f)(2)给出置信度为95%时该地区平均每户每月伙食费的近似置信区间。例:在某地区10000户家庭中,按简单随机抽样抽取400户,56解:(1)
(2)解:57例:某地区性专业杂志目前拥有8000家订户,从中按简单随机抽样抽取了484户,这484户的年均收入为30500元,标准差为7040元。试求该杂志订户的年均收入的置信度为95%的近似置信区间。解:例:某地区性专业杂志目前拥有8000家订户,从中按简单随582.3比率估计量及其性质2.3比率估计量及其性质59一、使用比估计的两种情况1.比值(或比率)一、使用比估计的两种情况1.比值(或比率)60
例:例:61
例:“筛选性”问题例:“筛选性”问题62
例:1802年,法国的Laplace受政府委托进行法国人口的估计与推算。推算方法如下:
2.利用辅助变量的信息改进估计的精度例:1802年,法国的Laplace受政府委托进行法国人口63利用辅助变量的信息改进估计的精度利用辅助变量的信息改进估计的精度64二、简单随机抽样下的比估计1.比的简单估计量:二、简单随机抽样下的比估计652.性质:
对于简单随机抽样2.性质:66证明:证明:67简单随机抽样课件68简单随机抽样课件69简单随机抽样课件70(3)比率估计量的方差估计(3)比率估计量的方差估计71简单随机抽样课件72比率估计量的方差估计值
比率估计量的方差估计值73比率估计量的方差估计值
比率估计量的方差估计值74例:某小区有1920户,从中随机抽取了70户,调查各户的住房面积(单位:平方米)和家庭人口,得数据:
试对人均住房面积作点估计和置信度为95%的区间估计。例:某小区有1920户,从中随机抽取了70户,调查各户的住房75
解:解:763.比率估计量与简单估计量的比较3.比率估计量与简单估计量的比较77回归估计
Linearregression
回归估计
Linearregression781.简单随机抽样中的回归估计量:对于简单随机抽样,总体均值和总体总值的回归估计量分别为:1.简单随机抽样中的回归估计量:79简单随机抽样课件80简单随机抽样课件81简单随机抽样课件82证明:证明:83简单随机抽样课件84例:总体由75308个农场组成,设yi为第i个农场养牛的头数,xi为第i个农场的面积。已知农场平均面积为31.25英亩,选取一个样本容量为2055的简单随机样本。经计算得:
试估计每个农场平均养牛头数及标准差。例:总体由75308个农场组成,设yi为第i个农场养牛的头数85解:解:862.5简单随机抽样的实施一、样本容量的确定的原则与主要因素
简单随机抽样的费用:若CT,C0定,则最大的n就确定了。
2.5简单随机抽样的实施一、样本容量的确定的原则与主要因87精度常见的表示方法:精度常见的表示方法:881.估计R时样本量的确定:1.估计R时样本量的确定:89例:某公司有1000名职工,为了估计职工今年与去年病假工时的比率,要抽一个容量为n的简单随机样本进行调查。先随机抽了10人作试点调查,数据如下:例:某公司有1000名职工,为了估计职工今年与去年病假工时的90希望以置信度95%,使估计R的绝对误差不超过0.01,应抽容量为多大的样本?已知公司职工去年病假工时为16300。解:希望以置信度95%,使估计R的绝对误差不超过0.01,应抽容91简单随机抽样课件92例:审计员想把一个医院的财产的现在价值与记录价值作一比较。从计算机存储的记录里查到,医院的财产有2100项,共计价值950000元。为了估计现在的价值,拟在2100项目中随机抽取n项。因为没有信息可用来确定n,先随机抽了15项,获得数据整理如下:试确定n,使估计量的绝对误差不超过500元(置信度为95%)。例:审计员想把一个医院的财产的现在价值与记录价值作一比较。从93解:解:94简单随机抽样课件95二、估计总体均值或总量时样本量的确定方法先对总体均值的情形讨论。1.精度要求:置信度1-α的绝对误差限为d,即
二、估计总体均值或总量时样本量的确定方法96则估计总体均值时样本量这样确定:则估计总体均值时样本量这样确定:972.精度要求:置信度1-α的相对误差限为r,即
则估计总体均值时样本量这样确定:
2.精度要求:置信度1-α的相对误差限为r,即98简单随机抽样课件99例1:若要求估计职工的平均收入的绝对误差在20元之内,置信度为95%,N=4328,,则样本量应该是多少?解:例1:若要求估计职工的平均收入的绝对误差在20元之内,置信度100例2:在某地区10000户家庭中,按单纯随机抽样抽取400户,调查一个月的伙食费(单位:元)。经计算:利用这次抽样结果,现在若要再进行一次简单随机抽样,分别要求如下时,样本量各为多少?(1)要求d=50(置信度为0.95);(2)要求r=0.05(置信度为0.95)。例2:在某地区10000户家庭中,按单纯随机抽样抽取400户101解:解:1022.设计效应(designeffect):2.设计效应(designeffect):103第二章简单随机抽样第二章简单随机抽样104第二章简单随机抽样1、简单估计量2、比率估计量3、回归估计量第二章简单随机抽样1、简单估计量105例:从某个总体抽取一个n=50的独立同分布样本,样本数据如下:5676016657323669374626192792876905205023124525625575743508758342035939801722877532592768766923718876413994429274429181117841640521058797746153644476(1)计算样本均值与样本方差。(2)若用估计总体均值μ,按数理统计结果,是否无偏,并写出它的方差表达式。(3)根据上述样本数据,如何估计?(4)假定的分布是近似正态的,试分别给出总体均值μ的置信度为95%的近似置信区间。例:从某个总体抽取一个n=50的独立同分布样本,样本数据如下106(1)计算样本均值与样本方差。(2)若用估计总体均值μ,按数理统计结果,是否无偏,并写出它的方差表达式。
(3)根据上述样本数据,如何估计?(1)计算样本均值与样本方差。107(4)假定的分布是近似正态的,试分别给出总体均值μ的置信度为95%的近似置信区间。(4)假定的分布是近似正态的,试分别给出总体均值μ的置信度为108概述一、简单随机抽样(或单纯随机抽样)本书一般局限于不放回随机抽样二、实施方法三、地位、作用是其他抽样方法基础概述一、简单随机抽样(或单纯随机抽样)1092.1定义与符号定义2.1从总体的N个单元中,一次整批抽取n个单元,使任何一个单元被抽中的概率都相等,任何n个不同单元组成的组合被抽中的概率也都相等,这种抽样称为简单随机抽样.定义2.2从总体的N个单元中,逐个不放回抽取单元,每次抽取到尚未入样的任何一个单元的概率都相等,直到抽足n个单元为止,这样所得的n个单元组成一个简单随机样本.2.1定义与符号定义2.1从总体的N个单元中,一次整批抽取110定义2.3按照从总体的N个单元中抽取n个单元的所有可能不同组合构造所有可能的个样本,从中随机抽取一个样本,使每个样本被抽到的概率都等于1/,这种抽样称为简单随机抽样。注意:定义2.1与定义2.3是等价的。三个定义之间的联系定义2.3按照从总体的N个单元中抽取n个单元的所有可能不同111简单随机抽样的具体实施方法常用的有抽签法和随机数法两种。(一)抽签法抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以是一次抽取n个号签,也可以一次抽一个号签,连续抽n次),与抽中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样本。抽签法在技术上十分简单,但在实际应用中,对总体各单元编号并制作号签的工作量可能会很繁重,尤其是当总体容量比较大时,抽签法并不是很方便,而且也往往难以保证做到等概率。因此,实际工作中常常使用随机数法。简单随机抽样的具体实施方法112(二)随机数法随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。由于计算机产生的随机数实际上是伪随机数,不是真正的随机数,特别是直接采用一般现成程序时,产生的随机数往往不能保证其随机性。因此,一般使用随机数表,或用随机数骰子产生的随机数,特别在n比较大时。(二)随机数法1131、随机数表及其使用方法随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。在编制时,使用一种特制的电器或用计算机,将0至9的10个数字随机地自动摇出,每个摇出的数字就是一个随机数字。为使用方便,可依其出现的次序,按行或按列分成几位一组进行排列。根据不同的需要,它们所含数字的多少以及分位和排列的方式尽可以不同。1、随机数表及其使用方法114目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,1955年出版的100万数字随机数表,它按五位一组排列,共有20万组;肯德尔和史密斯编制,1938年出版的10万数字随机数表,它也按五位一组排列,共有25000组。我国常用的是中国科学院数学研究所概率统计室编印的《常用数理统计表》中的随机数表。目前,世界上已编有许多种随机数表。其中较大的有兰德公司编制,115简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:①每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。②设总体容量为N,若N的位数为r,则一定要从r位数中抽取。遇到1至N的数可直接使用;遇到其它的数不能直接使用。简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:116③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。可从起点开始向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,中途不能变更。④在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。③当r≥2时,可从含有起点数字左边的r位数开始,也可从右边的117随机数表法一般分下述几步:第一步:确定起点页码,如用笔尖在随机数表上随机指定一点,若落点数字(或距落点最近的数字)为奇数,则确定起点在第1页;否则,起点在第二页。第二步:确定起点的行数与列数,先在表上随机指定一点,由落点处的两位数确定起点的行数。由于每页只有50行,所以当落点处的两位数大于50时,则取其减去50的差数为行数。为保证等概性,当落点处的数为“00”时,则行数应取作50。然后依同样的方法再确定起点的列数。随机数表法一般分下述几步:第一步:确定起点页码,如用笔尖在随118第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或向右),每次取一个r位数。通常,若所需抽的数是一位数或两位数(即r=1或2),则由起点开始,依次向右抽取较方便,达到该行右端时,从下一行左端开始继续向右抽取;若所需抽的数是三位及以上(即r≥3)则由起点开始依次向下抽取较方便,达到最后一行时,向右移10位(或r位),再从第一行开始向下继续抽取,直到取足所需的n个r位数为止,以这n个r位数所对应的总体单元组成样本。第三步:确定所抽样本单元的号码。从上述确定的起点开始向下(或1192、随机数骰子及其使用方法随机数骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上刻有0-9的数字各2个。每盒骰子由盒体、盒盖、泡沫塑料垫及若干个(通常是3-6个)不同颜色的骰子组成。使用随机数骰子时可以像普通骰子那样用投掷的方法。但正规的方法是将一个或n个骰子放在盒中,拿去泡沫塑料垫,水平地摇动盒子,使骰子充分旋转,最后打开盒子,读出骰子表示的数字。一个骰子一次产生一个0-9的随机数。要产生一个m位数字的随机数,就需要同时使用m个骰子(事先规定好每种颜色所代表的位数,例如红色表示百位数,蓝色表示十位数,黄色表示个位数等),或将一个骰子使用m次(规定第一次产生的数字为最高位数,最后一次产生的数字为最末位即个位数字等)。特别规定m个骰子的数字(或一个骰子m次产生的数字)都为0时,表示10m。2、随机数骰子及其使用方法随机数骰子是由均匀材料制成的正二十120也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也可以达到预期的抽样效果。表面上看,这种想法似乎有一定道理,但实际试验的结果证明随意抽样不等于随机抽样。也许有人会认为,在抽样时不用随机数表,而采取随意抽选的办法也121简单随机抽样的方法评估简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估计效率的标准,同时,从理论上讲简单随机抽样在各种抽样技术中是贯彻随机原则最好的一种,并且数学性质很简单,是等概率抽样的特殊类型。简单随机抽样的方法评估简单随机抽样对总体不加任何限制,等概122另一方面,因为是等概率抽取样本,所以要求总体在所研究的主要标志上同质性或齐性(共性)较好,也即总体要比较均匀;要求样本容量要比较大,以保证样本对总体具有充分的代表性。但是,在社会经济现象中,这种均匀总体是很少见的。因此,实际工作中很少单纯使用简单随机抽样方法。另一方面,因为是等概率抽取样本,所以要求总体在所研究的主要标123再者,因为直接从总体中抽取样本,未能充分利用关于总体的各种其它已知信息,以有效地提高样本的代表性,并进而提高抽样的估计效率。再者,因为直接从总体中抽取样本,未能充分利用关于总体的各种其124此外,简单随机抽样要求在抽样前编制出抽样框,并对每一个总体抽样单元进行编号,而且当总体抽样单元的分布比较分散时,样本也可能会比较分散,这些都会给简单随机抽样方法的运用造成许多的不便,甚至在某些情况下干脆无法使用。因此,在此基础上研究其它抽样技术显得更加重要。此外,简单随机抽样要求在抽样前编制出抽样框,并对每一个总体抽125符号的表示总体均值总体总值(总体总量)总体比例总体比率(总体比值)符号的表示总体均值126简单随机抽样课件127简单随机抽样课件1282.2简单估计量及其性质2.2.1简单估计量的性质引理2.1从大小为N的总体中抽取一个样本量为n的简单随机样本,则总体中每个特定单元入样的概率为,两个特定单元都入样的概率为。2.2简单估计量及其性质2.2.1简单估计量的性质129简单随机抽样课件130一、总体均值的估计1.简单估计及其无偏性:一、总体均值的估计131定理2.1对于简单随机抽样,作为的简单估计,是无偏的。注意定理可以表示成更简洁的形式:定理2.1对于简单随机抽样,作为的简单估计,132证明1:(定义法)简单随机抽样课件133证明2:(对称性论证法)证明2:(对称性论证法)134证明3:从总体规模为N的总体中抽取一个容量为n的简单随机样本。若对总体中每个单元,如引理2.2引进随机变量即可完成证明。参见34页。证明3:从总体规模为N的总体中抽取一个容量为n的简单随机样本135简单随机抽样课件136估计量的方差在抽样推断中,有时往往只计算出估计量的值,而不大注意估计量的误差(方差或标准差)。但是,总体均值的估计量通常与总体均值的真值间不完全一致,即存在误差,而且所有可能的样本均值相对于总体均值的误差大小也是不一致的。联合国统计局编的《抽样调查理论基础》一书指出:“从研究大多数国家的抽样实践中,可以看出:虽然计算估计量的标准差,至少对关键性的几个估计量计算其标准差来说,仅需增加很少的额外开支或负担,但是他们并不意识到确定估计量的标准差的重要意义。这是否因为统计人员无意识地忽视了估计量的不精确性所产生的严峻的现实呢?计算标准差,并且把他们与估计量一起列出来,应该成为实际工作的一个常规。”估计量的方差在抽样推断中,有时往往只计算出估计量的值,而不1372.2.2简单估计量方差与协方差2.2.2简单估计量方差与协方差1381、简单估计量的方差1、简单估计量的方差139证明:方法一:根据方差的定义和性质,显然有
=证明:方法一:根据方差的定义和性质,显然有140根据前面定理2.1证明的方法二中使用过的对称性证明方法,即知:==根据前面定理2.1证明的方法二中使用过的对称性证明方法,即知141故=
===故=142证明2:仿照前面定理2.1之证明3引进随机变量,且运用引理2.2的结论就可完成证明。参见36页。证明2:仿照前面定理2.1之证明3引进随机变量,且运用引理143推论2.4对于简单随机抽样,的方差为:推论2.4对于简单随机抽样,的方差为:144
1452、两个估计量的协方差2、两个估计量的协方差146证明1:根据定义,采用对称证明法。参见40页。证明1:根据定义,采用对称证明法。参见40页。147简单随机抽样课件148简单随机抽样课件1492.2.3方差与协方差的估计2.2.3方差与协方差的估计150证明:只需证由定义由对称论证法简单随机抽样课件151简单随机抽样课件152简单随机抽样课件153区间估计区间估计154在获得各种总体特征的简单估计量的方差估计后,由于这些简单估计量均以样本均值为核心构建,根据中心极限定理它们都接近正态分布核心估计量样本均值分布近似服从正态分布。于是,可按照数理统计中有关正态分布总体特征的区间估计步骤进行估计,首先根据样本调查值计算出和,然后用作为的近似在获得各种总体特征的简单估计量的方差估计后,由于这些简单估计155简单随机抽样课件156例子1`1例子1`1157简单随机抽样课件158例:在某地区10000户家庭中,按简单随机抽样抽取400户,调查一个月的伙食费(单位:元)。经计算:(1)试估计该地区平均每户每月的伙食费,并估计其标准差。(忽略f)(2)给出置信度为95%时该地区平均每户每月伙食费的近似置信区间。例:在某地区10000户家庭中,按简单随机抽样抽取400户,159解:(1)
(2)解:160例:某地区性专业杂志目前拥有8000家订户,从中按简单随机抽样抽取了484户,这484户的年均收入为30500元,标准差为7040元。试求该杂志订户的年均收入的置信度为95%的近似置信区间。解:例:某地区性专业杂志目前拥有8000家订户,从中按简单随1612.3比率估计量及其性质2.3比率估计量及其性质162一、使用比估计的两种情况1.比值(或比率)一、使用比估计的两种情况1.比值(或比率)163
例:例:164
例:“筛选性”问题例:“筛选性”问题165
例:1802年,法国的Laplace受政府委托进行法国人口的估计与推算。推算方法如下:
2.利用辅助变量的信息改进估计的精度例:1802年,法国的Laplace受政府委托进行法国人口166利用辅助变量的信息改进估计的精度利用辅助变量的信息改进估计的精度167二、简单随机抽样下的比估计1.比的简单估计量:二、简单随机抽样下的比估计1682.性质:
对于简单随机抽样2.性质:169证明:证明:170简单随机抽样课件171简单随机抽样课件172简单随机抽样课件173(3)比率估计量的方差估计(3)比率估计量的方差估计174简单随机抽样课件175比率估计量的方差估计值
比率估计量的方差估计值176比率估计量的方差估计值
比率估计量的方差估计值177例:某小区有1920户,从中随机抽取了70户,调查各户的住房面积(单位:平方米)和家庭人口,得数据:
试对人均住房面积作点
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024八宝山殡仪馆鲜花及鲜花制品定制与配送合同3篇
- 2024年度蔬菜销售代理合同2篇
- 2024年度房地产交易资金监管协议3篇
- 2024年度汽车租赁合同(含车辆美容保养)3篇
- 2024年度科研机构创新能力建设专项资金借款合同3篇
- 2024年度物业管理公司合同管理制度3篇
- 2024年标准商品购销详细协议版B版
- 2024年度融资担保与国际贸易结算担保合同3篇
- 2024年度快递运输车辆租赁合同2篇
- 2024年度仓储租赁合同:商品仓储服务合同3篇
- 煤矿公司掘进巷道贯通管理办法
- 技工学校毕业生登记表
- 降低故障工单回复不合格率
- 可涂色简笔画打印(共20页)
- 灯光架介绍及使用说明
- 十一学校行动纲要
- GB 1886.6-2016 食品安全国家标准 食品添加剂 硫酸钙(高清版)
- 关于房屋征收及土地收储过程中的税收政策(仅供参考)
- 唯一住房补贴申请书(共2页)
- 单面多轴钻孔组合机床动力滑台液压系统课程设计
- 中医养生脾胃为先PPT文档
评论
0/150
提交评论