版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学基础统计学基础任务五 抽样估计抽样估计n5.1 抽样与抽样分布抽样与抽样分布n5.2 参数估计的方法参数估计的方法n5.3 必要样本量的确定必要样本量的确定 l 总体均值的区间估计总体均值的区间估计l 总体比例的区间估计总体比例的区间估计学习要点学习要点 任务五 抽样估计抽样估计5.1 5.1 抽样与抽样分布抽样与抽样分布l 5.1.1 抽样估计抽样估计l 5.1.2 抽样方法抽样方法l 5.1.3 抽样估计的基本概念抽样估计的基本概念l 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计5.1.1 抽样估计抽样估计抽样估计是指在随机抽样的基础上,利用样本的实
2、际抽样估计是指在随机抽样的基础上,利用样本的实际资料计算样本统计量,并以样本统计量对总体相应参资料计算样本统计量,并以样本统计量对总体相应参数作出具有一定可靠程度估计的一种统计分析方法。数作出具有一定可靠程度估计的一种统计分析方法。 l抽样估计的概念抽样估计的概念l抽样估计的特点抽样估计的特点 抽样估计是一种通过部分认识总体的统计分析方法;抽样估计是一种通过部分认识总体的统计分析方法; 以概率抽样为基础,按随机原则抽取样本;以概率抽样为基础,按随机原则抽取样本; 用一定的概率来保证将估计误差控制在规定的范围之内。用一定的概率来保证将估计误差控制在规定的范围之内。 任务五 抽样估计抽样估计 概率
3、抽样概率抽样非概率抽样非概率抽样 简单随机抽样简单随机抽样 等等 距距 抽抽 样样 分分 类类 抽抽 样样 整整 群群 抽抽 样样 多阶段抽样多阶段抽样 偶偶 遇遇 抽抽 样样 主主 观观 抽抽 样样 定定 额额 抽抽 样样 滚雪球抽样滚雪球抽样5.1.2 抽样方法抽样方法 任务五 抽样估计抽样估计 概率抽样概率抽样 非概率抽样非概率抽样又称为等概率抽样或又称为等概率抽样或 随机抽样随机抽样 按随机原则抽取样本按随机原则抽取样本 可以从数量上推断总体可以从数量上推断总体 可以计算抽样误差可以计算抽样误差 根据方便或主观判断抽取样本根据方便或主观判断抽取样本 又称为不等概率抽样或又称为不等概率抽
4、样或 非随机抽样非随机抽样 不能从数量上推断总体不能从数量上推断总体 不能确定抽样误差不能确定抽样误差 5.1.2 抽样方法抽样方法 任务五 抽样估计抽样估计5.1.2 抽样方法抽样方法l 按随机原则直接从总体按随机原则直接从总体N N个单位中抽取个单位中抽取n n个单位个单位组成样本,总体中每个单位都有被抽中的机会(或组成样本,总体中每个单位都有被抽中的机会(或抽中的概率)。抽中的概率)。 l适合于均匀分布的总体。适合于均匀分布的总体。 l当当N N 很大时,不易构造抽样框。很大时,不易构造抽样框。 任务五 抽样估计抽样估计5.1.2 抽样方法抽样方法111 5000 5000 5000L
5、L,例例不重复抽样:又称不放回抽样。不重复抽样:又称不放回抽样。111 5000 4999 4998L L,例例重复抽样:又称有放回抽样。重复抽样:又称有放回抽样。l简单随机抽样简单随机抽样 的做法:的做法: l两种抽样方法两种抽样方法直接抽取法直接抽取法抽签法抽签法随机数字表法随机数字表法 任务五 抽样估计抽样估计5.1.2 抽样方法抽样方法l系统抽样又称为机械抽样、等距离抽样系统抽样又称为机械抽样、等距离抽样 l将总体各单位按一定标志或次序排列,将总体各单位按一定标志或次序排列, 然后按相等的距离或间隔抽取样本单位。然后按相等的距离或间隔抽取样本单位。l有等概率系统抽样和不等概率系统抽样有
6、等概率系统抽样和不等概率系统抽样 两种抽取方式。两种抽取方式。 任务五 抽样估计抽样估计5.1.2 抽样方法抽样方法l分层抽样也称类型抽样分层抽样也称类型抽样 l先将总体按某种特征分成若干层,然后在各层中按先将总体按某种特征分成若干层,然后在各层中按随机原则抽取一定数量的单位构成样本。随机原则抽取一定数量的单位构成样本。l保证了样本的结构与总体的结构比较相近,因而,保证了样本的结构与总体的结构比较相近,因而,样本代表性高、估计的精度高。样本代表性高、估计的精度高。l常用方法有两种,比例抽样法和加权比例抽样法。常用方法有两种,比例抽样法和加权比例抽样法。 任务五 抽样估计抽样估计5.1.2 抽样
7、方法抽样方法l整群抽样是先将所有总体单位分割为若干小群组,整群抽样是先将所有总体单位分割为若干小群组,然后从中随机抽取一部分群,对中选群中的所有单位然后从中随机抽取一部分群,对中选群中的所有单位实施全面调查。实施全面调查。 l简化了抽样的工作量,节省了调查费用,也方便了调简化了抽样的工作量,节省了调查费用,也方便了调查的实施。查的实施。 l不足之处是,与其它抽样方式相比抽样误差较大。不足之处是,与其它抽样方式相比抽样误差较大。l分群的原则:群内差异尽可能大,群间差异尽可能小。分群的原则:群内差异尽可能大,群间差异尽可能小。 任务五 抽样估计抽样估计5.1.2 抽样方法抽样方法l多阶段抽样又称为
8、多级抽样。多阶段抽样又称为多级抽样。 l在抽取样本时,分为两个及两个以上的阶段从总体在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式。中抽取样本的一种抽样方式。 l多阶段抽样由于实行了再抽样,可以在更广的范多阶段抽样由于实行了再抽样,可以在更广的范围内获得调查单位。围内获得调查单位。 任务五 抽样估计抽样估计5.1.2 抽样方法抽样方法5.1.3 5.1.3 抽样估计的几个基本概念抽样估计的几个基本概念 任务五 抽样估计抽样估计u总体总体u个体个体 u样本样本参数参数统计量统计量 样本均值样本均值样本比例样本比例样本标准差样本标准差总体均值总体均值总体比例总体比例总体标准差
9、总体标准差spx5.1.3 5.1.3 抽样估计的几个基本概念抽样估计的几个基本概念 任务五 抽样估计抽样估计变量变量 nxxNXffxxffX1)(2nxxsxNXx2)(1)(2ffxxsxffXx2)(nnp0NN0)1 (ppsp)1 (p样本样本总体总体均均 值值根据未分组根据未分组资料计算资料计算根据分组资根据分组资料计算料计算均值均值的的标准标准差差根据未分组根据未分组资料计算资料计算根据分组资根据分组资料计算料计算比比 例例比例的标准差比例的标准差5.1.3 5.1.3 抽样估计的几个基本概念抽样估计的几个基本概念 任务五 抽样估计抽样估计 是指一个样本所包含的样本单位数,通常
10、用是指一个样本所包含的样本单位数,通常用n n表示。表示。一般来说,样本单位数一般来说,样本单位数n30n30称为大样本,而称为大样本,而n n3030称称为小样本。社会经济现象的抽样调查多取大样本。为小样本。社会经济现象的抽样调查多取大样本。 u样本容量样本容量是指从总体中可能抽取的样本的个数。是指从总体中可能抽取的样本的个数。对同一个总体,采用重复抽样和不重复抽样的方法对同一个总体,采用重复抽样和不重复抽样的方法可以获得不同数量的样本。可以获得不同数量的样本。u样本个数样本个数5.1.3 5.1.3 抽样估计的几个基本概念抽样估计的几个基本概念 任务五 抽样估计抽样估计【例例】如果总体有如
11、果总体有1 1、2 2、3 3、4 4四个数,从中抽取四个数,从中抽取两个数构成样本,以重复抽样和不重复抽样的方两个数构成样本,以重复抽样和不重复抽样的方法分别可以构成几个样本?法分别可以构成几个样本?重复抽样:有重复抽样:有 个可能样本个可能样本1642nN不重复抽样:有不重复抽样:有 个可能样本个可能样本6)!24( ! 2! 4)!( !nNnN5.1.3 5.1.3 抽样估计的几个基本概念抽样估计的几个基本概念 任务五 抽样估计抽样估计抽样方法抽样方法 重复抽样重复抽样 不重复抽样不重复抽样 所有可能的样本所有可能的样本样本个数样本个数16个个6个个5.1.3 5.1.3 抽样估计的几
12、个基本概念抽样估计的几个基本概念 任务五 抽样估计抽样估计5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计u抽样分布,即样本统计量的概率分布,是抽样分布,即样本统计量的概率分布,是指当随机抽取容量为指当随机抽取容量为 的样本时,的样本时, 个样个样本统计量的可能取值的频率分布本统计量的可能取值的频率分布nku抽样分布是一种理论分布抽样分布是一种理论分布5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计N11X22X33X44X假设总体假设总体=4=4,取值分别为,取值分别为 , ,总体均值为:总体均值为: 5 .
13、 244321NX总体方差为:总体方差为: 25. 14)5 . 24()5 . 23()5 . 22()5 . 21 ()(222222NX总体分布总体分布5 . 225. 12总体的两个特征值总体的两个特征值总体均值总体均值总体方差总体方差5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计1、样本均值的抽样分布、样本均值的抽样分布抽样方法抽样方法 重复抽样重复抽样 样本个数样本个数 1616个个 所有可能所有可能的样本的样本 1,1 2,1 3,1 4,11,1 2,1 3,1 4,11,2 2,2 3,2 4,21,2 2,2 3,2 4,21,3
14、 2,3 3,3 4,31,3 2,3 3,3 4,31,4 2,4 3,4 4,4 1,4 2,4 3,4 4,4 样本均值样本均值 1 1.5 2 2.51 1.5 2 2.51.5 2 2.5 3 1.5 2 2.5 3 2 2.5 3 3.52 2.5 3 3.52.5 3 3.5 4 2.5 3 3.5 4 ix625. 02x样本均值的特征值样本均值的特征值5 . 2x样本均值的数学期望样本均值的数学期望样本均值的方差样本均值的方差5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计总体分布总体分布5 . 225. 125 . 2x625. 0
15、2xxnx22结论结论5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计当样本容量当样本容量n n充分大时,样本均值的抽样分布近似服充分大时,样本均值的抽样分布近似服从均值为从均值为、方差为、方差为2 2/ /n n的正态分布的正态分布l样本均值的均值样本均值的均值( (数学期望数学期望) ) 等于总体均值等于总体均值 l样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/n倍倍)(xEnx22)1 (22Nnnx重复抽样重复抽样不重复抽样不重复抽样即:即:5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计
16、l样本均值的标准差样本均值的标准差 也称均值的也称均值的抽样标准差抽样标准差或或抽样平均误差抽样平均误差重复抽重复抽样样不重复抽不重复抽样样nx)1 (2Nnnx5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计2 2、样本比例的抽样分布、样本比例的抽样分布 当样本容量很大时,样本比例的抽样分布可用正态分布当样本容量很大时,样本比例的抽样分布可用正态分布近似。对于一个样本比例,如果近似。对于一个样本比例,如果 55和和 5 5,就可以认为样本容量足够大。就可以认为样本容量足够大。 )(Pl样本比例的数学期望等于总体比例样本比例的数学期望等于总体比例 l样
17、本比例的方差等于总体方差的样本比例的方差等于总体方差的1/n倍倍nP)1 (2)1 ()1 (2NnnPpn)1 (pn5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计l样本比例的标准差样本比例的标准差 也称比例的也称比例的抽样标准差抽样标准差或或抽样平均误差抽样平均误差)1 ()1 (NnnPnP)1(重复抽样重复抽样不重复抽样不重复抽样5.1.4 5.1.4 样本统计量的抽样分布样本统计量的抽样分布 任务五 抽样估计抽样估计 任务五 抽样估计抽样估计5.2 5.2 参数估计的方法参数估计的方法l 5.2.1 点估计点估计l 5.2.2 区间估计及其
18、原理区间估计及其原理l 5.2.3 总体均值的区间估计总体均值的区间估计l 5.2.4 总体比例的区间估计总体比例的区间估计l 5.2.5 Excel操作操作 重点重点 任务五 抽样估计抽样估计u参数估计参数估计是用样本资料来估计相应的是用样本资料来估计相应的 总体指标的方法,即用样本统计量估总体指标的方法,即用样本统计量估 计总体参数。计总体参数。u总体参数的估计有总体参数的估计有点估计点估计和和区间估计区间估计 两种方法。两种方法。5.2.1 5.2.1 点估计点估计 任务五 抽样估计抽样估计5.2.1 5.2.1 点估计点估计l点估计点估计用样本的统计量直接作为总体参数的估计值用样本的统
19、计量直接作为总体参数的估计值pPsxX, 任务五 抽样估计抽样估计5.2.1 5.2.1 点估计点估计 评价估计量的标准评价估计量的标准 无偏性无偏性 有效性有效性 一致性一致性 任务五 抽样估计抽样估计5.2.1 5.2.1 点估计点估计无偏性:用抽样指标估计总体指标要求抽样指标的无偏性:用抽样指标估计总体指标要求抽样指标的 平均数等于被估计的总体指标。平均数等于被估计的总体指标。 E xX 任务五 抽样估计抽样估计5.2.1 5.2.1 点估计点估计较小的样本容量较大的样本容量P( )一致性:随着样本容量的增大,估计量的值越来越一致性:随着样本容量的增大,估计量的值越来越 接近被估计的总体
20、参数接近被估计的总体参数 任务五 抽样估计抽样估计5.2.1 5.2.1 点估计点估计有效性:对同一总体参数的两个无偏点估计量,有效性:对同一总体参数的两个无偏点估计量, 更小标准差的估计量更有效更小标准差的估计量更有效 的抽样分布 的抽样分布12P( ) 任务五 抽样估计抽样估计5.2.1 5.2.1 点估计点估计l区间估计区间估计 是根据给定的概率保证程度的要求,利用实际抽是根据给定的概率保证程度的要求,利用实际抽样资料,推算出总体参数可能存在的区间范围。样资料,推算出总体参数可能存在的区间范围。5.2.2 5.2.2 区间估计及其原理区间估计及其原理 任务五 抽样估计抽样估计u 区间估计
21、的原理区间估计的原理点估计值点估计值边际误差边际误差 置信区间是指在一定置信水平下总体参数的估计区间。置信区间是指在一定置信水平下总体参数的估计区间。 (样本统计量)(样本统计量)点估计值点估计值点估计值点估计值点估计值点估计值边际误差边际误差 点估计值点估计值5.2.2 5.2.2 区间估计及其原理区间估计及其原理 任务五 抽样估计抽样估计将构建置信区间的步骤重复很多次,在所构建的将构建置信区间的步骤重复很多次,在所构建的 置信区间中,包含总体参数真值的次数所占的比置信区间中,包含总体参数真值的次数所占的比 例称为置信水平,用例称为置信水平,用 表示。表示。 是事先确定的一个风险值,即置信区
22、间不包是事先确定的一个风险值,即置信区间不包 含总体真值的概率。含总体真值的概率。 1常用的置信水平值有常用的置信水平值有 99%, 95%, 90% 相应的相应的 为为0.01,0.05,0.105.2.2 5.2.2 区间估计及其原理区间估计及其原理 任务五 抽样估计抽样估计 误误 差差登记性误差登记性误差代表性误差代表性误差系统性误差系统性误差随机性误差随机性误差5.2.2 5.2.2 区间估计及其原理区间估计及其原理 任务五 抽样估计抽样估计抽样误差的计算抽样误差的计算l抽样标准差,或抽样平均误差抽样标准差,或抽样平均误差nx2nP)1 (El边际误差边际误差E抽样标准差抽样标准差概率
23、度概率度2/z) 1(2/nt正态分布正态分布分布分布t5.2.2 5.2.2 区间估计及其原理区间估计及其原理 任务五 抽样估计抽样估计xx正态分布正态分布条件下条件下5.2.2 5.2.2 区间估计及其原理区间估计及其原理 任务五 抽样估计抽样估计1、正态总体,总体方差、正态总体,总体方差2 2已知或大样本条件下已知或大样本条件下nzX2l使用正态分布统计量使用正态分布统计量 z zl总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为5.2.3 5.2.3 总体均值的区间估计总体均值的区间估计 任务五 抽样估计抽样估计5.2.3 5.2.3 总体均值的区间估计总体
24、均值的区间估计 任务五 抽样估计抽样估计5.2.3 5.2.3 总体均值的区间估计总体均值的区间估计 任务五 抽样估计抽样估计例例5-2-25-2-2(1)点估计值)点估计值 9 . 4x(2)样本均值的抽样标准差)样本均值的抽样标准差 1005 . 3nsx(3)样本均值的边际误差)样本均值的边际误差69. 01005 . 396. 12/xZE(4)95%的置信区间的置信区间 ExEx69. 09 . 469. 09 . 459. 521. 45.2.3 5.2.3 总体均值的区间估计总体均值的区间估计 任务五 抽样估计抽样估计例例5-2-35-2-3该校学生月均支出该校学生月均支出90%
25、的置信区间为:的置信区间为: nZx2/5 .16450255065. 14505 .4665 .4333、正态总体,方差(、正态总体,方差(2)未知且小样本()未知且小样本(n30)l使用使用t t 分布统计量分布统计量l总体均值总体均值 在在1-1- 置信水平下的置信水平下的置信区间为置信区间为nsntx) 1(25.2.3 5.2.3 总体均值的区间估计总体均值的区间估计 任务五 抽样估计抽样估计l t t 分布是类似正态分布的一种对称分布,它通常要分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称比正态分布平坦和分散。一个特定的分布依赖于称之为自由度
26、的参数。随着自由度的增大,分布也逐之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布渐趋于正态分布 5.2.3 5.2.3 总体均值的区间估计总体均值的区间估计 任务五 抽样估计抽样估计5.2.3 5.2.3 总体均值的区间估计总体均值的区间估计 任务五 抽样估计抽样估计例例5-2-45-2-4该批食品重量该批食品重量99%的置信区间为:的置信区间为: nsntx) 1(2/08. 3875.5021618. 495. 2875.502955.505795.499u总体比例的区间估计总体比例的区间估计l假定条件:大样本条件下,样本比例的抽样分假定条件:大样本条件下,样本比例的抽样分 布
27、可以由正态分布来近似布可以由正态分布来近似l使用正态分布统计量使用正态分布统计量 z z代替未知,可由不重复抽样(或重复抽样pNnNnzpnzp)()1)-1 ()()1 (22 任务五 抽样估计抽样估计5.2.4 5.2.4 总体比例的区间估计总体比例的区间估计 任务五 抽样估计抽样估计5.2.4 5.2.4 总体比例的区间估计总体比例的区间估计例例5-2-55-2-5该比例该比例95%的置信区间为:的置信区间为: nppzp)1 (2/14. 06 . 0504 . 06 . 096. 16 . 0%74%46 p ExcelExcel操作操作l利用利用ExcelExcel的描述统计求得均值和抽样标准差;的描述统计求得均值和抽样标准差;l利用利用CONFIDENCECONFIDENCE函数或分布计算求出边际误差;函数或分布计算求出边际误差;最后确定置信区间。最后确定置信区间。 lNORMSINVNORMSINV函数可得正态分布的临界值函数可得正态分布的临界值lTINVTINV函数可得函数可得t 分布的临界值分布的临界值) 1(2/nt2/z 任务五 抽样估计抽样估计5.2.5 5.2.5 区间估计的区间估计的ExcelExcel操
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年规范自建房合同参考
- 房屋拆迁安置协议书
- 施工管理委托合同范本
- 代理销售合同(交易股份)
- 店铺租赁合同书协议书
- 城区物品搬运协议
- 地下车位买卖合同范本
- 建筑吊车租赁合同样本
- 办公大楼物业管理服务合同2024年
- 2025年春九年级语文下册 期末综合测试卷(人教河南版)
- 幼儿园教学课件中班美术《百变的花瓶》课件
- 液化石油气充装操作规程(YSP118液化石油气钢瓶)
- 工程样板过程验收单
- 颅内动脉动脉瘤介入治疗临床路径
- 粮食仓储场建设项目可行性研究报告
- 珠宝销货登记表Excel模板
- 深基坑开挖施工风险源辨识与评价及应对措施
- 唯美手绘风花艺插花基础培训PPT模板课件
- 《现代汉语语法》PPT课件(完整版)
- 5G智慧农业建设方案
- 航海学天文定位第四篇天文航海第1、2章
评论
0/150
提交评论