




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、浙江财经大学浙江财经大学2022-2-111第四章抽样估计第四章抽样估计 浙江财经大学浙江财经大学2022-2-112(1 1)理解抽样分布的含义及总体分布、样本分布和抽样分)理解抽样分布的含义及总体分布、样本分布和抽样分布三者的关系,掌握常用的抽样分布定理;布三者的关系,掌握常用的抽样分布定理;(2 2)正确理解抽样误差的含义及三种表现形式之间的关系,)正确理解抽样误差的含义及三种表现形式之间的关系,深刻领会抽样极限误差、抽样概率度与抽样标准误三者之间深刻领会抽样极限误差、抽样概率度与抽样标准误三者之间的关系;的关系;(3 3)了解优良估计的评价标准,掌握区间估计的基本原理;)了解优良估计的
2、评价标准,掌握区间估计的基本原理;(4 4)掌握各种抽样组织下总体均值、总体成数的区间估计,)掌握各种抽样组织下总体均值、总体成数的区间估计,尤其是掌握各自不同的抽样标准误公式及相应的估计方法;尤其是掌握各自不同的抽样标准误公式及相应的估计方法;(5 5)掌握确定样本容量的一般方法。)掌握确定样本容量的一般方法。浙江财经大学浙江财经大学2022-2-113第一节第一节 抽样分布抽样分布第二节第二节 抽样误差抽样误差第三节第三节 参数估计方法参数估计方法第四节第四节 各种抽样组织形式的参数估计各种抽样组织形式的参数估计浙江财经大学浙江财经大学2022-2-114第一节第一节 抽样分布抽样分布浙江
3、财经大学浙江财经大学2022-2-1151 1、抽样分布的基本问题、抽样分布的基本问题 抽样估计是以样本观测结果去估计未知的总体抽样估计是以样本观测结果去估计未知的总体数量特征。数量特征。 如何根据概率抽样的样本去估计总体的理论如何根据概率抽样的样本去估计总体的理论与方法,首先要明确总体分布、样本分布与抽样与方法,首先要明确总体分布、样本分布与抽样分布三者关系。分布三者关系。 浙江财经大学浙江财经大学2022-2-116(1 1)总体分布及其特征)总体分布及其特征 总体分布就是总体中所有个体关于某个变量总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。(标志)的取值所形成的分布
4、。 假设假设X X为总体随机变量,那么总体分布就是指为总体随机变量,那么总体分布就是指X X的分布。的分布。 反映总体分布特征的指标叫做总体参数,一般用反映总体分布特征的指标叫做总体参数,一般用 来表示。常用的总体参数有两个:总体均值和总来表示。常用的总体参数有两个:总体均值和总体方差或标准差。体方差或标准差。浙江财经大学浙江财经大学2022-2-117 假设有限总体的容量为假设有限总体的容量为N,第,第i个个体变量值为个个体变量值为 ,均值为,均值为 ,方差为方差为 ,那么就有:,那么就有:NiXi, 3 , 2 , 1X2SNXXNXXSi22 对于是非变量,如果两类变量个数分别为对于是非
5、变量,如果两类变量个数分别为 和和 , 个变量值为个变量值为1, 个变量值为个变量值为0,令,令 , 。那么就有:。那么就有:0N1NNNN011N0NNNp1NNQ0PXP)1 (2PPPQSP浙江财经大学浙江财经大学2022-2-118(2 2)样本分布及其特征)样本分布及其特征 样本分布就是样本中所有个体关于某个变量样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。(标志)的取值所形成的分布。 反映样本分布特征的指标叫做样本统计量,反映样本分布特征的指标叫做样本统计量,一般用一般用T T来表示。常用的样本统计量也有两个:来表示。常用的样本统计量也有两个:样本均值和样本方差
6、,即:样本均值和样本方差,即: 假设假设 为总体随机变量为总体随机变量X X在样本中的体现,那在样本中的体现,那么样本分布就是指么样本分布就是指 的分布,或者说是关于的分布,或者说是关于n n个个观测值的分布。观测值的分布。xx浙江财经大学浙江财经大学2022-2-119nxx122nxxsi 对于是非变量,如果两类变量个数分别为对于是非变量,如果两类变量个数分别为 和和 , 个变量值为个变量值为1, 个变量值为个变量值为0,令,令 , 。那么就有:。那么就有:0n1nnnn011n0nnnp1nnq0pxppqnnsp12浙江财经大学浙江财经大学2022-2-1110(3 3)抽样分布及其特
7、征)抽样分布及其特征A.A.概念及影响因素概念及影响因素P93-94P93-94B.B.抽样分布形式抽样分布形式样本均值的抽样分布、样本样本均值的抽样分布、样本成数的抽样分布成数的抽样分布C.C.抽样分布特征抽样分布特征P96P96浙江财经大学浙江财经大学2022-2-11112 2、常用的抽样分布定理、常用的抽样分布定理A A、正态分布的再生定理、正态分布的再生定理P96P96B B、中心极限定理、中心极限定理P97 P97 (1 1)样本均值的抽样分布定理)样本均值的抽样分布定理C C、t t分布定理分布定理P97 P97 (2 2)样本成数的抽样分布定理)样本成数的抽样分布定理A A、二
8、项分布定理、二项分布定理P97P97B B、超几何分布定理、超几何分布定理P97P97C C、中心极限定理、中心极限定理P97P9798 98 浙江财经大学浙江财经大学2022-2-1112第二节第二节 抽样误差抽样误差浙江财经大学浙江财经大学2022-2-1113一、抽样中的误差构成一、抽样中的误差构成 一般地,抽样中的总误差可以简单地分为两类:一类一般地,抽样中的总误差可以简单地分为两类:一类是抽样误差,另一类是非抽样误差。它们之间的关系可表是抽样误差,另一类是非抽样误差。它们之间的关系可表现为如下图:现为如下图:总误差总误差非抽样误差非抽样误差抽样误差抽样误差抽样中的总误差可表现为如下关
9、系式:抽样中的总误差可表现为如下关系式:222非抽样误差抽样误差总误差浙江财经大学浙江财经大学2022-2-1114二、抽样误差的表现形式二、抽样误差的表现形式 抽样误差的表现形式一般有三种:抽样实际误差、抽抽样误差的表现形式一般有三种:抽样实际误差、抽样标准误和抽样极限误差。样标准误和抽样极限误差。 1 1、抽样实际误差、抽样实际误差 2 2、抽样标准误、抽样标准误 抽样标准误是衡量抽样误差大小的核心指标,是对总体抽样标准误是衡量抽样误差大小的核心指标,是对总体参数做出区间估计的一个重要因素,狭义上所指的抽样误差参数做出区间估计的一个重要因素,狭义上所指的抽样误差就是抽样标准误,即抽样平均误
10、差就是抽样标准误,即抽样平均误差。 抽样实际误差是指样本估计值与总体参数之间的离差,抽样实际误差是指样本估计值与总体参数之间的离差,表现为表现为 。即。即 和和 。该误差无法计算。该误差无法计算。Xx Pp 抽样标准误就是抽样分布方差的平方根,即抽样分布的抽样标准误就是抽样分布方差的平方根,即抽样分布的标准差或样本统计量的标准差,表示为标准差或样本统计量的标准差,表示为 。)()(vSE浙江财经大学浙江财经大学2022-2-1115 3 3、抽样极限误差、抽样极限误差 抽样极限误差是指以样本估计总体所允许的最大误差范抽样极限误差是指以样本估计总体所允许的最大误差范围,也就是在一次抽样估计时,估
11、计量所允许取的最高值或围,也就是在一次抽样估计时,估计量所允许取的最高值或最低值与总体参数之间的绝对离差,通常用最低值与总体参数之间的绝对离差,通常用 来表示,即来表示,即 , 与与 之比被称为抽样估计相对允许误差,一般表之比被称为抽样估计相对允许误差,一般表示为示为 ,1-1- 被称为抽样估计精度。被称为抽样估计精度。 抽样极限误差如何确定?它取决于两个因素:一是抽样抽样极限误差如何确定?它取决于两个因素:一是抽样标准误;二是概率保证程度,也称为置信水平,通常表示为标准误;二是概率保证程度,也称为置信水平,通常表示为 ,其中,其中 就是显著水平。就是显著水平。1 抽样极限误差与抽样标准误之比
12、的系数称为概率度,抽样极限误差与抽样标准误之比的系数称为概率度,在正态分布下,抽样概率度用在正态分布下,抽样概率度用 来表示,即来表示,即 2Z)(2SEZ或或)(2SEZ浙江财经大学浙江财经大学2022-2-1116第三节第三节 参数估计方法参数估计方法浙江财经大学浙江财经大学2022-2-1117一、统计量的评价标准一、统计量的评价标准 在估计总体参数时,一个重要的问题是估计量的选择。在估计总体参数时,一个重要的问题是估计量的选择。估计量就是用以估计总体参数的量,或者说是根据样本结估计量就是用以估计总体参数的量,或者说是根据样本结果来估计总体参数的规则或形式。果来估计总体参数的规则或形式。
13、 评价估计量的标准有四个:无偏性、一致性、有效性评价估计量的标准有四个:无偏性、一致性、有效性和充分性。和充分性。二、参数估计方法二、参数估计方法 1 1、点估计、点估计 点估计也称定值估计,就是以样本观测数据为依据,点估计也称定值估计,就是以样本观测数据为依据,对总体参数做出确定值的估计,也就是用一个样本的具体对总体参数做出确定值的估计,也就是用一个样本的具体统计值去估计总体的未知参数。如:统计值去估计总体的未知参数。如: Xx Pp、浙江财经大学浙江财经大学2022-2-1118 2 2、区间估计、区间估计 区间估计就是用一个具有一定可靠程度的区间范围来区间估计就是用一个具有一定可靠程度的
14、区间范围来估计总体参数,即对于未知的总体参数估计总体参数,即对于未知的总体参数 ,想办法找出两,想办法找出两个数值个数值 和和 ,使,使 处于区间(处于区间( , )内的概率为)内的概率为 ,即,即 122)(21111)(21 区间估计的特点,它不指出被估计参数的确定值,而区间估计的特点,它不指出被估计参数的确定值,而是在一定的概率保证下指出被估计参数的可能范围。是在一定的概率保证下指出被估计参数的可能范围。 区间估计有两个基本要求(评价标准),它就是置信区间估计有两个基本要求(评价标准),它就是置信度和精确度。在样本容量度和精确度。在样本容量n n一定的条件下,这两个基本要求一定的条件下,
15、这两个基本要求是相互矛盾的。是相互矛盾的。浙江财经大学浙江财经大学2022-2-1119 区间估计有一个频率解释,即区间估计有一个频率解释,即 和和 都是不依赖于未都是不依赖于未知参数的随机变量,其具体数值要依被抽取样本的观测结知参数的随机变量,其具体数值要依被抽取样本的观测结果而定。概率果而定。概率 就是所有可能样本所给出的估计区间就是所有可能样本所给出的估计区间中包含总体参数中包含总体参数 在内的估计区间出现的频率。在内的估计区间出现的频率。121 对于双侧区间估计,在正态分布情况下,样本统计量对于双侧区间估计,在正态分布情况下,样本统计量关于总体参数对称分布。因此就有关于总体参数对称分布
16、。因此就有 这样,这样,就有就有,21。1)( 具体到总体均值和总体成数的区间估计,当样本容量具体到总体均值和总体成数的区间估计,当样本容量充分大时,在充分大时,在 的概率保证下,我们可得到总体均值的概率保证下,我们可得到总体均值和总体成数的估计区间分别如下:和总体成数的估计区间分别如下:1浙江财经大学浙江财经大学2022-2-1120)(),(22xSEzxxSEzx)(),(22pSEzppSEzp总体均值估计区间总体均值估计区间总体成数估计区间总体成数估计区间浙江财经大学浙江财经大学2022-2-1121(1)PPx%27.68%45.95%73.99SE1SE1SE2SE2SE3SE3
17、(概率)(概率)常用的常用的 及对应的及对应的 0.68271.64 0.901.96 0.95 0.95452.58 0.993 0.99732Z(1)(1)2Z2Z浙江财经大学浙江财经大学2022-2-1122第四节第四节 各种抽样组织形式的参数估计各种抽样组织形式的参数估计浙江财经大学浙江财经大学2022-2-1123 一、简单随机抽样一、简单随机抽样 不同的抽样组织形式,估计是的具体形式和抽样标准不同的抽样组织形式,估计是的具体形式和抽样标准误的计算方法都是有所差别的,因此,在相同的样本容量误的计算方法都是有所差别的,因此,在相同的样本容量n n和相同的概率保证和相同的概率保证 下,不
18、同抽样组织形式的估计结下,不同抽样组织形式的估计结果也是不同的。果也是不同的。1 (一)总体均值(一)总体均值 的估计的估计X设设 为样本中第为样本中第 个个体的变量值,则当样本容量为个个体的变量值,则当样本容量为 时,总体均值时,总体均值 的估计量为的估计量为ixinXniinxxX1/浙江财经大学浙江财经大学2022-2-1124与该估计量相对应的抽样标准误为与该估计量相对应的抽样标准误为 nSxSE2( (重复抽样时重复抽样时) )或或 nSfxSE2)1 ( ( (不重复抽样时不重复抽样时) )实例实例P104P104其中其中f=n/Nf=n/N,称为抽样比。,称为抽样比。1-f1-f
19、称为有限总体校正系数,当称为有限总体校正系数,当 时,时, ,重复抽样与不重复抽样的抽样标准误相,重复抽样与不重复抽样的抽样标准误相差甚微,可以忽略有限总体校正系数。当总体方差差甚微,可以忽略有限总体校正系数。当总体方差S S2 2未知未知时,可用样本方差时,可用样本方差s s2 2代替。此时抽样标准误用代替。此时抽样标准误用 来表示。来表示。%5f11 f)(xse浙江财经大学浙江财经大学2022-2-1125 (二)总体成数(二)总体成数 的估计的估计P nPQpSE( (重复抽样时重复抽样时) )或或 PQnfnPQNnpSE)1 ()1 ( (不重复抽样时不重复抽样时) )实例实例P1
20、05P105 根据前面关于总体成数与样本成数的定义,总体成数根据前面关于总体成数与样本成数的定义,总体成数 的估计量为:的估计量为: 。与估计量相对应的抽样标准误为:。与估计量相对应的抽样标准误为: PnnpP1当总体方差当总体方差 未知时,要以样本方差未知时,要以样本方差 来估计。此时抽样标准误用来估计。此时抽样标准误用 来表示。来表示。)1 (PPPQ)1 (1ppnn)(pse浙江财经大学浙江财经大学2022-2-1126 (三)样本容量(三)样本容量 的确定的确定n 样本容量的大小要受总体分布、抽样精度、可靠程度、样本容量的大小要受总体分布、抽样精度、可靠程度、抽样调查经费等因素的影响
21、。在不考虑调查经费时,简单抽样调查经费等因素的影响。在不考虑调查经费时,简单随机抽样的样本容量可由以下公式确定:随机抽样的样本容量可由以下公式确定:22222)1 (22pxPPZnSZn重重或Nnnn重重不重1 由于总体方差通常是未知的,可用近期由于总体方差通常是未知的,可用近期的过去数据代替或由经验判断确定,也可由的过去数据代替或由经验判断确定,也可由试抽样的样本方差代替。试抽样的样本方差代替。浙江财经大学浙江财经大学2022-2-1127注意事项注意事项: :(1 1)样本容量计算结果取整数,若除不尽,则小数点)样本容量计算结果取整数,若除不尽,则小数点后往上进一位取整数;后往上进一位取
22、整数;(2 2)若同时进行总体均值和总体成数估计,则分别套)若同时进行总体均值和总体成数估计,则分别套相应公式计算,并取其大作为样本容量;相应公式计算,并取其大作为样本容量;(3 3)属性总体方差未知时,取其最大方差进行计算;)属性总体方差未知时,取其最大方差进行计算;(4 4)若提供多个属性总体方差,则应选择)若提供多个属性总体方差,则应选择P P值最接近值最接近50%50%的进行计算。的进行计算。 实例实例P106P106实例实例浙江财经大学浙江财经大学2022-2-1128 二、分层抽样二、分层抽样 (一)总体均值(一)总体均值 的估计的估计XHiij设总体的设总体的 个个体分为个个体分
23、为 层,层, 为第为第 层个体数,层个体数,为第为第 层的层权,层的层权, 为第为第 层抽取的个体数,层抽取的个体数,为第为第 层的抽样比,层的抽样比, 为第为第 层第层第 个个体的变量值,个个体的变量值,那么第那么第 层的层均值层的层均值 的估计量为:的估计量为:NiiNNNWii/iiiiiNnf/inijxiiXiHiijiinxxX1浙江财经大学浙江财经大学2022-2-1129总体均值总体均值 的估计量为:的估计量为:XHiiistxWxX1这一估计量是无偏的,即这一估计量是无偏的,即。HistXXWxE)(与该估计量相对应的抽样标准误为与该估计量相对应的抽样标准误为或或( (不重复
24、抽样时不重复抽样时) )HiiiiistSWnfxSE1221)( (重复抽样时重复抽样时) )HiiiistnSWxSE122)(浙江财经大学浙江财经大学2022-2-1130i为第为第 层的方差,层的方差,其中其中iNjiijiNXxSi122)(未知时要用层内样本方差未知时要用层内样本方差 来估计。来估计。2iS实例实例107107 (二)总体成数(二)总体成数 的估计的估计P 设设 为第为第 层的某类变量值的个数,层的某类变量值的个数, 为第为第 层样本中层样本中某类变量值的个数,那么第某类变量值的个数,那么第 层成数层成数 的估计量为:的估计量为:1 iNiii1 iniPiiiin
25、npP1浙江财经大学浙江财经大学2022-2-1131成数成数 的估计量为的估计量为PHiiistPWpP1与该估计量相对应的抽样标准误为与该估计量相对应的抽样标准误为HiiiiistQPnWpSE12)((重复抽样时)(重复抽样时)HiiiiiistQPnWfpSE12)1 ()((不重复抽样时)(不重复抽样时)iiiiqpnn1 层方差层方差 未知时要以层内样本方差未知时要以层内样本方差 来估计。来估计。iiQP实例实例108108浙江财经大学浙江财经大学2022-2-1132 (三)样本容量(三)样本容量 的确定的确定n 当总的样本容量当总的样本容量n n确定时,各层样本容量确定时,各层
26、样本容量 的确定,通的确定,通常有以下三种方法:常有以下三种方法:in1 1、比例分配法、比例分配法nWnii2 2、最优分配法、最优分配法iiiiiSNSNnn3 3、经济分配法、经济分配法iiiiiiiCSWCSWnn/浙江财经大学浙江财经大学2022-2-1133 三、整群抽样三、整群抽样 在此只讨论各群大小相等时的情况。在此只讨论各群大小相等时的情况。 (一)总体均值(一)总体均值 的估计的估计XnrM jiRMR设总体的设总体的 个个体分为个个体分为 群,每群群,每群 个个体。从个个体。从 群中群中随机抽取随机抽取 群(一般采用不重复抽样方法),共群(一般采用不重复抽样方法),共个个
27、体构成样本。若以个个体构成样本。若以 表示第表示第 群第群第 个个体的变量个个体的变量值,那么群均值值,那么群均值 为:为:NrijxiXMxXMjiji1总体均值总体均值 的估计量为的估计量为XrXxXriics1浙江财经大学浙江财经大学2022-2-1134与该估计量相对应的抽样标准误为:与该估计量相对应的抽样标准误为:21)(BcsSrfxSE1)(212rxXsricsibRXXSRiiB212)(Rrf 其中其中 为群抽样比,为群抽样比, 为总体群间方差。为总体群间方差。 未知时要以样本群间方差未知时要以样本群间方差 来估计。来估计。2BS浙江财经大学浙江财经大学2022-2-113
28、5 (二)总体成数(二)总体成数 的估计的估计P格式与总体均值一致格式与总体均值一致略略浙江财经大学浙江财经大学2022-2-1136例例4:某公司对一批新产品的使用寿命进行测试。随机收取:某公司对一批新产品的使用寿命进行测试。随机收取了了400个产品,测得其平均寿命为个产品,测得其平均寿命为2800小时,标准差小时,标准差100小时,小时,不合格产品数为不合格产品数为80个。要求个。要求:(1)以)以95.45的可靠程度估计这批新产品的平均使用寿命的可靠程度估计这批新产品的平均使用寿命;(2 2)以)以95%95%的可靠程度估计这批新产品的不合格率;的可靠程度估计这批新产品的不合格率;(3 3)若要将这
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海快餐店管理办法
- 仓储区概况管理办法
- 河南洗染业管理办法
- 皮肤科医生管理办法
- 陇西供热管理办法
- epc结算管理办法
- 渣土大运输管理办法
- 玉溪市公墓管理办法
- 浙江碳交易管理办法
- 电子出图章管理办法
- 卒中中心应知应会
- 山西省代县金升铁矿有限公司铁矿资源开发利用、地质环境保护与土地复垦方案
- 2021年新高考全国Ⅱ卷语文真题(含答案)
- 《天黑前的夏天》中水意象解析
- 院感知识PPT完整版
- JJF 1910-2021电化学工作站校准规范
- ks-s3002腔全自动刻蚀机规格书
- DB37-T 2401-2022危险化学品岗位安全生产操作规程编写导则
- 2023年小学科学教师招聘考试真题练习试题卷及参考答案
- 劳资专管员任命文件(样本)
- 电子教案与课件:制药过程安全与环保-第5章-制药过程“三废”防治技术
评论
0/150
提交评论