版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章抽样推断第一节抽样及抽样分布第五章抽样推断第一节抽样及抽样分布1指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会一、抽样推断的涵义及特点按照随机原则
从调查对象中抽取一部分单位进行调查,并根据样本推断总体数量特征的一种统计方法1、抽样推断的涵义指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体2按随机原则抽取样本单位目的是推断总体的数量特征抽样误差可以事先计算并控制2、抽样推断的特点按随机原则抽取样本单位2、抽样推断的特点3设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):指被估计的总体指标,又被称为全及指标二、总体参数设总体中个总体单位某项标志的标志值分别⒈总体平均数4⒉总体单位标志值的标准差:⒊总体单位标志值的方差:⒉总体单位标志值的标准差:⒊总体单位标志值的方差:5⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方差:⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方6设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则⒈样本平均数(又叫样本均值):指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量三、样本指标设样本中个样本单位某项标志的标志值⒈样本平均数(又7⒉样本的标准差:⒊样本的方差:为自由度为的无偏估计为的无偏估计⒉样本的标准差:⒊样本的方差:为自由度为的无偏估8⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:为的无偏估计为的无偏估计⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非9四、抽样方法1、重复抽样又被称作重置抽样、有放回抽样四、抽样方法1、重复抽样又被称作重置抽样、有放回抽样102、不重复抽样又被称作不重置抽样、不放回抽样2、不重复抽样又被称作不重置抽样、不放回抽样11五、抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本应用仅适用于规模不大、内部各单位标志值差异较小的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式五、抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单122·类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额抽取等比例抽取最优抽取······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标2·类型抽样(分层抽样)——将总体全部单位分类,形成若干个133·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。3·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志144·整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差4·整群抽样(集团抽样)——将总体全部单位分为若干“群”155·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)5·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单16六、样本容量和样本个数n≥30,为大样本;n<30,为小样本样本容量指样本中含有的总体单位的数目,通常用n来表示。确定适当样本容量的意义:若n过大,调查工作量增大,体现不出抽样调查的优越性;若n过小,抽样误差会增大,抽样推断就会失去价值。六、样本容量和样本个数n≥30,为大样本;n<30,为小17在重复选取容量为n的样本时,由样本平均数的所有可能取值形成的相对频数分布一种理论概率分布推断总体平均数的理论基础 七、样本平均数(均值)的抽样分布在重复选取容量为n的样本时,由样本平均数的所有可能取值形成的18样本平均数的抽样分布
(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4。总体的平均数、方差及分布如下总体分布14230.1.2.3平均数和方差样本平均数的抽样分布
(例题分析)【例】设一个总体,含有4个19样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布
(例题分析)现从总体中抽取n=2的20计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5计算出各样本的均值,如下表。并给出样本均值的抽样分布3.21μ=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5xμ=2.5总体分布14230.1.2.3抽样分布P(22样本平均数的抽样分布
与中心极限定理=50
=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)样本平均数的抽样分布
与中心极限定理=50=10X23样本比例的抽样分布样本比例的抽样分布24总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为
比例
(proportion)总体(或样本)中具有某种属性的单位与全部单位总数之比比例
(25在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似推断总体比例的理论基础 样本比例的抽样分布在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相26样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布
(数学期望与方差)样本比例的数学期望样本比例的抽样分布
(数学期望与方差)27一、抽样误差的概念二、抽样平均误差三、抽样极限误差第二节抽样误差一、抽样误差的概念第二节抽样误差28指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则29抽样平均误差的计算公式⒈样本平均数的抽样平均误差重复抽样时:不重复抽样时:抽样平均误差的计算公式⒈样本平均数的抽样平均误差重复抽样时30⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:抽样平均误差的计算公式⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:抽样平均31影响抽样误差的因素总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。影响抽样误差的因素总体各单位的差异程度(即标准差的大小):32抽样极限误差指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等抽样极限指在一定的概率保证程度下,抽样误差不允许超过的某一给33抽样极限误差的计算公式(大样本条件下)样本平均数的极限误差:⒈样本成数的极限误差:⒉Z为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。抽样极限误差的计算公式(大样本条件下)样本平均数的极限误差:34Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:
z值概率保证程度
1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽样极限误差的计算公式(大样本条件下)Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率35抽样分布与抽样误差课件36第三节参数估计一、点估计二、区间估计三、样本容量的确定第三节参数估计一、点估计37一、点估计指直接以样本指标来估计总体指标,也叫定值估计简单,具体明确优点缺点无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况一、点估计指直接以样本指标来估计总体指标,也叫定值估计简单,38评价估计量的标准评价估计量的标准39无偏性
(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P(
)BA无偏有偏无偏性
(unbiasedness)无偏性:估计量抽样分布的40有效性
(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效
AB的抽样分布的抽样分布P(
)有效性
(efficiency)有效性:对同一总体参数的两个41一致性
(consistency)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(
)一致性
(consistency)一致性:随着样本容量的增大42二、区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为置信区间,估计的可靠程度也称为置信度。(这里只讨论常用的大样本的情况)二、区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断43总体平均数的区间估计表达式其中,为极限误差总体平均数的区间估计表其中,44总体成数的区间估计表达式其中,为极限误差总体成数的区间估计表其中,45三、样本容量的确定三、样本容量的确定46推断总体平均数所需的样本容量⑴重复抽样条件下:或S通常未知。一般按以下方法确定其估计值:①过去的经验数据;②试验调查样本的S。计算结果通常向上进位推断总体平均数所需的样本容量⑴重复抽样条件下:或S47⑵不重复抽样条件下:确定方法推断总体平均数所需的样本容量⑵不重复抽样条件下:确推断总体平均数所需的样本容量48确定方法推断总体成数所需的样本容量⑴重复抽样条件下:确推断总体成数所需的样本容量⑴重复抽样条件下:49⑵不重复抽样条件下:推断总体成数所需的样本容量⑵不重复抽样条件下:推断总体成数所需的样本容量50第五章抽样推断第一节抽样及抽样分布第五章抽样推断第一节抽样及抽样分布51指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会一、抽样推断的涵义及特点按照随机原则
从调查对象中抽取一部分单位进行调查,并根据样本推断总体数量特征的一种统计方法1、抽样推断的涵义指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体52按随机原则抽取样本单位目的是推断总体的数量特征抽样误差可以事先计算并控制2、抽样推断的特点按随机原则抽取样本单位2、抽样推断的特点53设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则⒈总体平均数(又叫总体均值):指被估计的总体指标,又被称为全及指标二、总体参数设总体中个总体单位某项标志的标志值分别⒈总体平均数54⒉总体单位标志值的标准差:⒊总体单位标志值的方差:⒉总体单位标志值的标准差:⒊总体单位标志值的方差:55⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方差:⒋总体成数:⒌总体是非标志的标准差:⒍总体是非标志的方56设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则⒈样本平均数(又叫样本均值):指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量三、样本指标设样本中个样本单位某项标志的标志值⒈样本平均数(又57⒉样本的标准差:⒊样本的方差:为自由度为的无偏估计为的无偏估计⒉样本的标准差:⒊样本的方差:为自由度为的无偏估58⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非标志的方差:为的无偏估计为的无偏估计⒋样本成数:⒌样本单位是非标志的标准差:⒍样本单位是非59四、抽样方法1、重复抽样又被称作重置抽样、有放回抽样四、抽样方法1、重复抽样又被称作重置抽样、有放回抽样602、不重复抽样又被称作不重置抽样、不放回抽样2、不重复抽样又被称作不重置抽样、不放回抽样61五、抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本应用仅适用于规模不大、内部各单位标志值差异较小的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式五、抽样组织方式1·简单随机抽样(纯随机抽样)——对总体单622·类型抽样(分层抽样)——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。总体N样本n等额抽取等比例抽取最优抽取······能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标2·类型抽样(分层抽样)——将总体全部单位分类,形成若干个633·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。3·等距抽样(机械抽样或系统抽样)——将总体单位按某一标志644·整群抽样(集团抽样)——将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差4·整群抽样(集团抽样)——将总体全部单位分为若干“群”655·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)5·多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单66六、样本容量和样本个数n≥30,为大样本;n<30,为小样本样本容量指样本中含有的总体单位的数目,通常用n来表示。确定适当样本容量的意义:若n过大,调查工作量增大,体现不出抽样调查的优越性;若n过小,抽样误差会增大,抽样推断就会失去价值。六、样本容量和样本个数n≥30,为大样本;n<30,为小67在重复选取容量为n的样本时,由样本平均数的所有可能取值形成的相对频数分布一种理论概率分布推断总体平均数的理论基础 七、样本平均数(均值)的抽样分布在重复选取容量为n的样本时,由样本平均数的所有可能取值形成的68样本平均数的抽样分布
(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4。总体的平均数、方差及分布如下总体分布14230.1.2.3平均数和方差样本平均数的抽样分布
(例题分析)【例】设一个总体,含有4个69样本均值的抽样分布
(例题分析)
现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)样本均值的抽样分布
(例题分析)现从总体中抽取n=2的70计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P
(x)1.53.04.03.52.02.5计算出各样本的均值,如下表。并给出样本均值的抽样分布3.71μ=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5xμ=2.5总体分布14230.1.2.3抽样分布P(72样本平均数的抽样分布
与中心极限定理=50
=10X总体分布n=4抽样分布xn=16当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)样本平均数的抽样分布
与中心极限定理=50=10X73样本比例的抽样分布样本比例的抽样分布74总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为
比例
(proportion)总体(或样本)中具有某种属性的单位与全部单位总数之比比例
(75在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布一种理论概率分布当样本容量很大时,样本比例的抽样分布可用正态分布近似推断总体比例的理论基础 样本比例的抽样分布在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相76样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布
(数学期望与方差)样本比例的数学期望样本比例的抽样分布
(数学期望与方差)77一、抽样误差的概念二、抽样平均误差三、抽样极限误差第二节抽样误差一、抽样误差的概念第二节抽样误差78指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则抽取样本而产生的代表性误差,不包括登记性误差和系统偏差抽样误差指样本估计量与总体参数之间数量上的差异,仅指由于按照随机原则79抽样平均误差的计算公式⒈样本平均数的抽样平均误差重复抽样时:不重复抽样时:抽样平均误差的计算公式⒈样本平均数的抽样平均误差重复抽样时80⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:抽样平均误差的计算公式⒉样本成数的抽样平均误差重复抽样时:不重复抽样时:抽样平均81影响抽样误差的因素总体各单位的差异程度(即标准差的大小):越大,抽样误差越大;样本单位数的多少:越大,抽样误差越小;抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小;抽样组织方式:简单随机抽样的误差最大。影响抽样误差的因素总体各单位的差异程度(即标准差的大小):82抽样极限误差指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围、误差置信限等抽样极限指在一定的概率保证程度下,抽样误差不允许超过的某一给83抽样极限误差的计算公式(大样本条件下)样本平均数的极限误差:⒈样本成数的极限误差:⒉Z为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。抽样极限误差的计算公式(大样本条件下)样本平均数的极限误差:84Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:
z值概率保证程度
1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973抽样极限误差的计算公式(大样本条件下)Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率85抽样分布与抽样误差课件86第三节参数估计一、点估计二、区间估计三、样本容量的确定第三节参数估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 部编版四年级语文上册第五单元导读《我手写我心彩笔绘生活》精美课件
- 六下美术苏教版教育课件
- 部编版四年级语文上册《语文园地四》精美课件
- 保险理念沟通-保险公司早会培训资料早会分享课件模
- 《专用车资料》课件
- 智能制造生产线技术及应用 课件 项目三-4 数控折弯机认知
- 《1别伤着自己》课件
- 《数据的处理》课件
- 教科版小学综合实践6下(教案+课件)201 奇妙的指纹-走进司法机关专题活动
- 牙颌畸形病因介绍
- 特种设备运行故障和事故记录表
- 骨与软组织肿瘤的冷冻消融治疗
- 2020年度城镇道路工程施工与质量验收规范
- 中药熏洗法(课堂PPT)
- 医院消毒供应中心CSSD专科知识《术前外来医疗器械的处理流程》精美培训课件
- 大美青海美食图鉴
- 政治角度看“淄博烧烤”+课件【高效备课精研+知识精讲提升】 高考政治二轮复习人教版
- 社区社会工作智慧树知到答案章节测试2023年山东女子学院
- 初中生物八年级下册 生命的起源 课件
- 工艺变更履历表
- 尊重知识产权 课件
评论
0/150
提交评论