




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、抽样分布与抽样方法课件第5章 抽样分布与抽样方法抽样分布与抽样方法课件本章主要内容 随机抽样和统计推断随机抽样和统计推断 抽样分布抽样分布 抽样设计方法抽样设计方法抽样分布与抽样方法课件教学基本要求 通过本章的学习,掌握抽样的概念,简单随机通过本章的学习,掌握抽样的概念,简单随机抽样的方法;掌握重置抽样的抽样分布,不重抽样的方法;掌握重置抽样的抽样分布,不重置抽样的抽样分布;识记抽样其他组织形式,置抽样的抽样分布;识记抽样其他组织形式,抽样设计的基本原则,掌握各种抽样组织形式抽样设计的基本原则,掌握各种抽样组织形式的抽样平均误差的计算方法,了解抽样方案的的抽样平均误差的计算方法,了解抽样方案的
2、设计内容。设计内容。抽样分布与抽样方法课件抽样的基本概念 抽样涉及的基本概念有:抽样涉及的基本概念有: 总体与样本总体与样本 样本容量与样本个数样本容量与样本个数 总体参数与样本统计量总体参数与样本统计量 重复抽样与不重复抽样重复抽样与不重复抽样 这些概念是统计学特有的,体现了统计学的基本这些概念是统计学特有的,体现了统计学的基本思想与方法。思想与方法。抽样分布与抽样方法课件总体和样本(回顾) 1.总体总体:又称全及总体、母体,指所要研究对象的:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同性质的单位全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用构成。总
3、体单位数用 N 表示。表示。 2.样本样本:又称子样,来自总体,是从总体中按随机:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构成。样本单原则抽选出来的部分,由抽选的单位构成。样本单位数用位数用 n 表示。表示。 3.总体是唯一的、确定的,而样本是不确定的、可总体是唯一的、确定的,而样本是不确定的、可变的、随机的。变的、随机的。 抽样分布与抽样方法课件例例1:一汽车轮胎制造商生产一种被认为一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎寿命更长的新型轮胎。 例例2:某党派想支持某一候选人参选美国某州议员,为了决定某党派想支持某一候选人参选美国某州议员,为了决定是否支持该
4、候选人,该党派领导需要估计是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财力的限制:。由于时间及财力的限制:120个个样本样本测试平均里程:36,500公里推断新轮胎新轮胎平均寿命平均寿命:36,500公里400个样本 支持人数:160推断支持该候选人的选民支持该候选人的选民占全部选民的比例:占全部选民的比例:160/400=40%抽样分布与抽样方法课件 抽样估计方法主要用在下列两种情况:抽样估计方法主要用在下列两种情况: 1、对所考查的总体、对所考查的总体不可能不可能进行全部测度;进行全部测度; 2、从
5、理论上说可以对所考查的总体进行全部测度,、从理论上说可以对所考查的总体进行全部测度,但实践上由于人力、财力、时间等方面的原因,无法但实践上由于人力、财力、时间等方面的原因,无法或没有必要(或没有必要(不划算不划算)进行全部测度。)进行全部测度。 注意:注意: 抽样调查必须遵循抽样调查必须遵循随机原则随机原则。 抽样估计只能得到对总体特征的近似测度抽样估计只能得到对总体特征的近似测度,因此,因此,抽样估计还必须同时考察所得结果的抽样估计还必须同时考察所得结果的“可能范围可能范围”与与“可可靠程度靠程度”。 抽样分布与抽样方法课件样本容量与样本个数 样本容量:一个样本中所包含的单位数,用样本容量:
6、一个样本中所包含的单位数,用n表示。表示。 样本个数:又称样本可能数目,指从一个总体中所样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。可以计算出来。样本个数的多少与抽样方法有关。(这个概念只是对有限总体有意义,对无限总体没有这个概念只是对有限总体有意义,对无限总体没有意义!意义!)抽样分布与抽样方法课件 例例3:某大公司人事部经理整理其某大公司人事部经理整理其2500个中层干部个中层干部的档案。其中一项内容是考察这些中层干部的的档案。其中一项内容是考察这些中层干部的
7、平平均年薪均年薪及及参加过公司培训计划的比例参加过公司培训计划的比例。 总体:总体:2500名中层干部(名中层干部(population ), 如果:上述情况可由每个人的个人档案中得知,如果:上述情况可由每个人的个人档案中得知,可容易地测出这可容易地测出这2500名中层干部的平均年薪及标名中层干部的平均年薪及标准差。准差。 假如:假如:1:已经得到了如下的结果:已经得到了如下的结果: 总体均值(总体均值(population mean) =51800 总体标准差(总体标准差(Population standard deviation=4000抽样分布与抽样方法课件 2、同时,有同时,有1500
8、人参加了公司培训,人参加了公司培训, 则参加公司培训计划的比例为:则参加公司培训计划的比例为: P=1500/2500=0.60是总体的数值特征(是总体的数值特征(A parameter is a numerical characteristic of a population.)。 如:如:例例3中的中层干部中的中层干部平均年薪平均年薪,年薪标准差年薪标准差及及受培训人数所占比例受培训人数所占比例均为该公司中层干部这一均为该公司中层干部这一总体的参数。总体的参数。 抽样估计就是要通过样本而非总体来估计总体抽样估计就是要通过样本而非总体来估计总体参数。参数。抽样分布与抽样方法课件统计量x1,x
9、2, xn是相应于样本是相应于样本X1,X2, Xn的样本值的样本值,则称则称g(x1,x2, xn)是是g(X1,X2, Xn)的观察值。的观察值。 注:统计量是随机变量。是一是一统计量统计量。若若X1, X2, Xn是是来自总体来自总体X 的一个样本的一个样本,g(X1,X2, Xn)是是X1,X2, Xn的函数,的函数,不含任何未知参数不含任何未知参数, 则称则称g(X1,X2, Xn)若若g中中1.抽样分布与抽样方法课件设为来自总体设为来自总体 的一个样本,的一个样本,nXX ,1),(2 NX已已知知,未未知知其其中中2, 问下列随机变量中那些是统计问下列随机变量中那些是统计量量.)
10、(;)(;2122111nnXXXXnXXXXnnnn思考?思考?抽样分布与抽样方法课件常用统计量样本均值样本均值样本方差样本方差niiXnX11niiXXnS122)(11它反映了总体均值它反映了总体均值的信息的信息它反映了总体方差它反映了总体方差的信息的信息 niiXXnSS122)(11样本标准差:样本标准差:抽样分布与抽样方法课件样本样本k阶原点矩阶原点矩样本样本k阶中心矩阶中心矩nikikXnA11 nikikXXnB1)(1 k=1,2,它反映了总体它反映了总体k 阶矩阶矩的信息的信息,当,当k=1时,时,就是样本均值就是样本均值它反映了总体它反映了总体k 阶阶中心矩的信息中心矩的
11、信息抽样分布与抽样方法课件它们的观察值分别为:它们的观察值分别为: niixnx1111)(11122122 niiniixnxnxxns niixxns12)(112 , 1,11 kxnanikik2 , 1,)(11 kxxnbnikik样本均值样本均值样本方差样本方差样本标准差样本标准差样本样本k阶矩阶矩样本样本k阶中心矩阶中心矩抽样分布与抽样方法课件注意: 总体参数是总体参数是常数常数,计算总体参数的公式中所用到,计算总体参数的公式中所用到的总体各单位的标志值是确定的具体数值,而样的总体各单位的标志值是确定的具体数值,而样本统计量是本统计量是随机变量随机变量,计算样本统计量的公式中,
12、计算样本统计量的公式中所用的样本在未具体观察前是随机变量。所用的样本在未具体观察前是随机变量。 计算有限总体参数的公式中要使用总体的所有单计算有限总体参数的公式中要使用总体的所有单位的标志值,(有限总体的单位总数位的标志值,(有限总体的单位总数N),而计),而计算样本统计量的公式中只使用抽取到的样本(其算样本统计量的公式中只使用抽取到的样本(其个数是样本量个数是样本量n)。)。抽样分布与抽样方法课件总体参数和样本统计量总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。样本统计量:根据样本分布计算的指标。是随机变量。样本统计量:根
13、据样本分布计算的指标。是随机变量。平均数平均数标准差、方差标准差、方差成数成数参数参数 、 2统计量统计量S、 S2P=n1/n总体总体样本样本X22()1x xsn22()1ffx xs抽样分布与抽样方法课件 例:从一批瓷砖中随机抽取例:从一批瓷砖中随机抽取10件,测得其重量为件,测得其重量为(单位:千克):(单位:千克): 2.10,2.43,1.85,2.40,2.15,2.28,1.96,2.35,2.00,1.99 求这组样本的均值和方差。求这组样本的均值和方差。 解:解:1112.102.431.992.15110niixxn4334. 011212niixxns抽样分布与抽样方法
14、课件抽样分布抽样分布与抽样方法课件总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 分布通常是未知的分布通常是未知的可以假定它服从某种分布可以假定它服从某种分布 总体分布总体分布(population distribution)抽样分布与抽样方法课件一个样本中各观察值的分布一个样本中各观察值的分布 也称经验分布也称经验分布 当样本容量当样本容量n逐渐增大时,样本分布逐渐接近总逐渐增大时,样本分布逐渐接近总体的分布体的分布 样本分布样本分布(sample distribution)抽样分布与抽样方法课件抽样分布的概念抽样分布的概念 1、举个例子:丢骰子、举个例子:丢骰子 2、结论
15、:样本均值并不总是落在总体均值很、结论:样本均值并不总是落在总体均值很近的位置。因此,我们不能仅仅根据一个样本近的位置。因此,我们不能仅仅根据一个样本得出总体的情况,需认识到样本统计量本身就得出总体的情况,需认识到样本统计量本身就是个随机变量,不同的样本会导致样本统计量是个随机变量,不同的样本会导致样本统计量取不同的值。取不同的值。 3、解决方法:在大量重复抽样试验的基础上,、解决方法:在大量重复抽样试验的基础上,得出统计量取值的集合及相应的概率,进而作得出统计量取值的集合及相应的概率,进而作出判断和比较出判断和比较抽样分布与抽样方法课件抽样分布的形成过程抽样分布的形成过程 (sampling
16、 distribution)抽样分布与抽样方法课件样本统计量的概率分布,是一种理论分布样本统计量的概率分布,是一种理论分布在重复选取容量为在重复选取容量为n的样本时,由该统计量的样本时,由该统计量的所有可能取值形成的相对频数分布的所有可能取值形成的相对频数分布 随机变量是随机变量是样本统计量样本统计量样本均值样本均值, 样本比例,样本方差等样本比例,样本方差等结果来自结果来自容量相同容量相同的所有可能样本的所有可能样本提供了样本统计量长远而稳定的信息,是进行提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要推断的理论基础,也是抽样推断科学性的重要依据依据 抽样分布
17、抽样分布 (sampling distribution)抽样分布与抽样方法课件样本均值的抽样分布样本均值的抽样分布(例题分析)5 . 21NxNii25. 1)(122NxNii抽样分布与抽样方法课件样本均值的抽样分布样本均值的抽样分布 (例题分析)3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n = 2 的样本(共的样本(共16个)个)抽样分布与抽样方法课件3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.5
18、1.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)样本均值的抽样分布样本均值的抽样分布 (例题分析)抽样分布与抽样方法课件样本均值的抽样分布样本均值的抽样分布例题分析为样本数目MnMxnixix2221221610625. 016)5 . 20 . 4()5 . 20 . 1 ()(11.0 1.54.02.516niixxM抽样分布与抽样方法课件样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 (例题分析)5 . 2x625. 02x抽样分布与抽样方法课件抽样分布的形式抽样分布的形式 1、样本均值抽样分布的形式与原有总体的分、样本均值抽样
19、分布的形式与原有总体的分布和样本容量布和样本容量n的大小有关的大小有关 2、如果原总体分布是正态分布,那么,无论、如果原总体分布是正态分布,那么,无论样本容量的大小如何,样本均值的抽样分布都样本容量的大小如何,样本均值的抽样分布都服从正态分布服从正态分布 3、如果原总体分布是非正态分布,即看样本、如果原总体分布是非正态分布,即看样本容量的的大小,当样本容量容量的的大小,当样本容量大于大于30时,抽样分时,抽样分布将趋近正态分布,这就是著名的中心极限定布将趋近正态分布,这就是著名的中心极限定理理抽样分布与抽样方法课件样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理x5x50 x5
20、 . 2x当总体服从正态分布当总体服从正态分布N(,2)时,来自该总体的所有时,来自该总体的所有容量为容量为n的样本的均值的样本的均值 x也服从正态分布,也服从正态分布, x 的数的数学期望为学期望为,方差为,方差为2/n。即。即 xN(,2/n)抽样分布与抽样方法课件中心极限定理中心极限定理(central limit theorem)nx设从均值为设从均值为 ,方差为,方差为 2的一个任的一个任意总体中抽取容量为意总体中抽取容量为n的样本,当的样本,当n充分大时,样本充分大时,样本均值的抽样分布近似服从均值为均值的抽样分布近似服从均值为 、方差为、方差为2/n的正的正态分布态分布x抽样分布
21、与抽样方法课件中心极限定理中心极限定理 (central limit theorem)抽样分布与抽样方法课件总体总体(或样本或样本)中具有某种属性的单位与全部单位总数之中具有某种属性的单位与全部单位总数之比比不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品) 与全部产品总数之比与全部产品总数之比总体比例可表示为总体比例可表示为样本比例可表示为样本比例可表示为样本比例的分布(proportion)NNNN101?nnpnnp101或抽样分布与抽样方法课件样本比例的分布在重复选取容量为在重复选取容量为n的样本时,由样本比例的所有可能的样本时,由样本比例的所有可
22、能取值形成的相对频数分布取值形成的相对频数分布总体为二项分布总体为二项分布当样本容量很大时,样本比例的抽样分布可用当样本容量很大时,样本比例的抽样分布可用正态分布正态分布近似近似,即,即 1n kkkrnP Pk nC pp 2111,11E Pnpp Var PnppppnnnnpppNp)1 (,抽样分布与抽样方法课件抽样分布与总体分布的关系抽样分布与总体分布的关系正态分布正态分布非正态分布非正态分布正态分布正态分布正态分布正态分布非正态分布非正态分布抽样分布与抽样方法课件例:求样本平均数的概率分布 设某公司设某公司1000名职工的人均年奖金为名职工的人均年奖金为2000元,标准差元,标准
23、差500元,元,随机抽取随机抽取36人作为样本进行调查,问样本的人均年奖金在人作为样本进行调查,问样本的人均年奖金在19002200元之间的概率有多大?元之间的概率有多大?2000,500,36n(19002200)( 1.22.4)PXPZ111900 20001.250036Xzn22200 20002.450036z(1.2)(2.4)0.8768221.22.4(2.4)(1.2)(2.4)2抽样分布与抽样方法课件 设设XN(72,100),为使样本均值大于为使样本均值大于70的概率不小的概率不小于于90%,则样本量至少应取多少?,则样本量至少应取多少? 解:设样本量为解:设样本量为n
24、,则,则例nnXPXPnNX2 . 0107270170170100,729 . 02 . 0n426025.4129. 12 . 0nnn依题意:依题意:查表得:查表得:抽样分布与抽样方法课件抽样设计方法抽样分布与抽样方法课件抽样估计效果的衡量与抽样组织形式 抽样估计效果好坏,关键是抽样估计效果好坏,关键是抽样平均误差抽样平均误差的控制。的控制。抽样平均误差小,抽样效果从整体上看就是好的;抽样平均误差小,抽样效果从整体上看就是好的;否则,抽样效果就不理想。否则,抽样效果就不理想。 抽样平均误差受以下几方面的因素影响:抽样平均误差受以下几方面的因素影响: 总体的变异性总体的变异性,即与总体的标
25、准差大小有关,即与总体的标准差大小有关 样本容量样本容量 抽样方法抽样方法 抽样的组织形式抽样的组织形式 抽样的组织形式有如下几种:抽样的组织形式有如下几种:简单随机抽样、等距抽样、类型抽样、整群抽样、简单随机抽样、等距抽样、类型抽样、整群抽样、阶段抽样阶段抽样 抽样分布与抽样方法课件简单随机抽样(Simple Random Sampling) 若总体若总体X的样本的样本X1,X2,Xn满足:(满足:(1)X1,X2,Xn与与X同分布同分布;(;(2)X1,X2,Xn相相互独立互独立,那称它为简单随机样本。,那称它为简单随机样本。简称为样本,简称为样本,其观察值其观察值x1,x2,xn称为称为
26、样本值样本值。抽样分布与抽样方法课件 niinxFxxF11*)(),( niinxfxxf11*)(),( 定理定理 : 若若 为为X的一个样本,则的一个样本,则 的联合分布函数为:的联合分布函数为:nXX,1nXX,1若设若设X的概率密度为的概率密度为f,则的联合概,则的联合概率密度为:率密度为:nXX,1抽样分布与抽样方法课件简单随机抽样(Simple Random Sampling) 简单随机抽样可根据总体的有限性或无限性简单随机抽样可根据总体的有限性或无限性分为分为有限总体简单随机抽样有限总体简单随机抽样与与无限总体随机抽样无限总体随机抽样。 有限总体简单随机抽样的特点有限总体简单随
27、机抽样的特点: 每一个可能的相同容量的样本被抽中的概率每一个可能的相同容量的样本被抽中的概率相同。相同。 无限总体简单随机抽样的特点:无限总体简单随机抽样的特点: 1、每一样本(单位)来自同一总体;、每一样本(单位)来自同一总体; 2、每一样本(单位)是独立抽取的。、每一样本(单位)是独立抽取的。抽样分布与抽样方法课件简单随机抽样1、自、自有限总体有限总体的抽样的抽样方法方法:将总体单位编成抽样框,而后用抽签或随机:将总体单位编成抽样框,而后用抽签或随机数表抽取样本单位。数表抽取样本单位。适用适用:总体规模不大;总体内部差异小。:总体规模不大;总体内部差异小。2、自、自无限总体无限总体的抽样的
28、抽样方法方法:必须特殊制定一种独立选取样本点的抽样过:必须特殊制定一种独立选取样本点的抽样过程,以避免由于某些类型的个体以较大概率被选入程,以避免由于某些类型的个体以较大概率被选入而产生误差。而产生误差。适用适用:总体太大或是无限的;总体内部差异小。:总体太大或是无限的;总体内部差异小。抽样分布与抽样方法课件随机数字表(摘录)随机数字表(摘录)63271 59986 71744 51102 15141 80714 58683 93108 13554 7994588547 09896 95436 79115 08303 01041 20030 63754 08459 28364 55957 57
29、243 83865 09911 19761 66355 40102 26646 60147 1570246276 87453 44790 67122 45573 84358 21625 16999 13385 2278255363 07449 34835 15290 76616 67191 12777 21861 68689 0326369393 92785 49902 58447 42048 30378 87618 26933 40640 1628113186 29431 88190 04588 38733 81290 89541 70290 40113 0824317726 28652 5
30、6836 78351 47327 18518 92222 55201 27340 1049336520 64465 05550 30157 82242 29520 69753 72602 23756 5493581628 36100 39254 56835 37636 02421 98063 89641 64953 99337 随机数字表中,可以从任何一个位置、任何方向开始挑选随机数字表中,可以从任何一个位置、任何方向开始挑选随机数。一旦选择一个任意起点,就采用事先确定的程序。随机数。一旦选择一个任意起点,就采用事先确定的程序。 抽样分布与抽样方法课件重复抽样与不重复抽样 对于无限总体而言,抽
31、样总是可以看成是重复抽对于无限总体而言,抽样总是可以看成是重复抽样(或重置抽样),然后,对于样(或重置抽样),然后,对于有限总体有限总体而言而言,由抽样由抽样是否具有可重复性是否具有可重复性,又可分为,又可分为重复重复(重置重置)抽样抽样与与不重复(不重置)抽样不重复(不重置)抽样。而且,根据抽样。而且,根据抽样中中是否排序是否排序,所能抽到的样本个数往往不同。,所能抽到的样本个数往往不同。抽样分布与抽样方法课件 重复抽样:例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2 考虑顺序时:样本个数考虑顺序时:样本个数=Nn=52=25 不考虑顺序时:样本个数不考虑顺序时:样本
32、个数=重复(置)抽样ABACDEBBCDAECBCDAEDBCDAEEBCDAE-(- )!(- )! !nNnNnCNn111抽样分布与抽样方法课件 重置抽样可以看做是有限总体下的简单随机抽样。所以以下结果都适用: 222var1XPE XXnE Ppppn抽样分布与抽样方法课件不重复(置)抽样 也叫不放回抽样,指每次从有限总体中随机抽取也叫不放回抽样,指每次从有限总体中随机抽取一个单位,登记结果后不放回原总体,下一个单一个单位,登记结果后不放回原总体,下一个单位继续从总体中余下的单位随机抽取。位继续从总体中余下的单位随机抽取。 其特点为:其特点为: n个单位的样本由个单位的样本由n次抽取的
33、结果构成;次抽取的结果构成; 每次抽取的结果不是独立的;每次抽取的结果不是独立的; 虽然在同次试验中每个单位被抽取到的概率相同,但虽然在同次试验中每个单位被抽取到的概率相同,但在不同次的试验中被抽取到的概率是不相等的。在不同次的试验中被抽取到的概率是不相等的。抽样分布与抽样方法课件 例如从例如从A、B、C、D、E五个字母中随机抽取两个作为样本。五个字母中随机抽取两个作为样本。N=5,n=2 考虑顺序时:样本个数考虑顺序时:样本个数 不考虑顺序时:样本个数不考虑顺序时:样本个数不重复(置)抽样ABCDEBCDAECBDAEDBCAEEBCDAn)!-(N!NPnNABCDEBCDECDEDEEn
34、)!n!-(N!NCnN抽样分布与抽样方法课件22221122222222001220111111nNiiiiNiiSXXxxnNNE SE SNxxSNN对于不重复抽样:注意:并不是总体方差的无偏估计,即。事实上,可以证明。如果假设,则是的无偏估计。当然如果总体单位总数 较大,和就没有什么太大区别了。抽样分布与抽样方法课件例2222468 10 12=854812855xNxN 元元 设某小型工厂有设某小型工厂有5位工人,他们的时薪分别为位工人,他们的时薪分别为4,6,8,10,12元,那么总体均值和方差分别是元,那么总体均值和方差分别是抽样分布与抽样方法课件 按不重置抽样方法从5位工人中抽
35、出2人,并计算样本均值的期望与方差:样样本本值值46810124-65-867-10789-12891011-两两样本的平均数(单位:元)样本均值样本均值频数频数频率频率511/10611/10722/10822/10922/101011/101111/10合计101样本均值的分布抽样分布与抽样方法课件根据样本均值的分布,计算样本均值的期望与方差: 22222151181015811 831015285 121xfE XfxE XfVar XfNnNnNnVar XNn有限总体(不重有限总体(不重置简单随机抽样)置简单随机抽样)的修正系数的修正系数抽样分布与抽样方法课件重置抽样分布-样本平均数
36、的分布 由概率论知,如果总体是正态分布的,则样本平均由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布数的抽样分布是如下正态分布 这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。2( ,)Nn抽样分布与抽样方法课件重置抽样分布-样本成数的分布 总体成数总体成数p是指具有某种特征的单位在总体中的比重。成数是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数,设总体单位总数目是是一个特殊平均数,设总体单位总数目是N,总体中有该特,总体中有该特征的单位数是征的单位数是N1。设。设x是是0、1变量(总体单位有该特征,则变量(总体单位有该特征,则x取
37、取1,否则取,否则取0),则有:),则有: 现从总体中抽出现从总体中抽出n个单位,如果其中有相应特征的单位数是个单位,如果其中有相应特征的单位数是n1,则样本成数是:则样本成数是: P也是一个随机变量,利用样本平均数的分布性质结论,即也是一个随机变量,利用样本平均数的分布性质结论,即有:有:1NpxN1nPn ( )11E PpppppPnnn抽样分布与抽样方法课件不重置抽样分布 样本均值的分布性质:样本均值的分布性质: 样本成数的分布性质样本成数的分布性质2()()1XE XNnXnN ( )11E PpppNnPnN抽样分布与抽样方法课件总结样本平均数的分布样本平均数的分布样本成数的分布样
38、本成数的分布重复重复抽样抽样不重不重复抽复抽样样()E X()nX 1ppPn()E X( )E Pp2()1NnXnN( )E Pp 11ppNnPnN抽样分布与抽样方法课件例 某地区职工家庭的人均年收入平均为某地区职工家庭的人均年收入平均为12000元,标准差为元,标准差为2000元。若知该地区家庭的人均年收入服从正态分布,现采元。若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取用重复抽样从总体中随机抽取25户进行调查,问出现样本平户进行调查,问出现样本平均数等于或超过均数等于或超过12500元的可能性有多大?元的可能性有多大?()nXn200012000200025
39、40025,()()(.)p Xp Zp Z12500 12000125001 25400(1.25)0.50.10942抽样分布与抽样方法课件例 某商场推销一种洗发水。据统计,本年度购买此种洗发水的某商场推销一种洗发水。据统计,本年度购买此种洗发水的有有10万人,其中万人,其中6万是女性。如果按不重复随机抽样方法,万是女性。如果按不重复随机抽样方法,从购买者中抽出从购买者中抽出100人进行调查,问样本中女性比例超过人进行调查,问样本中女性比例超过50%的可能性有多大?的可能性有多大?(50%) ?p P(1)0.6 0.4100( )(1)(1)0.00489100100000ppnPnN(
40、 )50% 60%2.040.00489P pPz(50%)(2.04)p Pp Z(2.04)0.5 0.97932660%, ( )(1)10pppp抽样分布与抽样方法课件抽样优良性的一个准则 222=1XXE XVar XE XVar XnNnnN对于样本均值 ,有,或标准差测度了样本均值估计总体均值的误差程度。因此,我们用样本均值的标准差作为判断抽样优良性的一个标准。抽样标准误差抽样分布与抽样方法课件例 按重置抽样方法从总体随机抽取样本量为按重置抽样方法从总体随机抽取样本量为n的样本。如果总体标准差的样本。如果总体标准差=2,样本量从,样本量从n=4增加增加到到n=16,那么抽样误差有
41、何变化?,那么抽样误差有何变化? 解:当解:当n=4时,抽样误差为时,抽样误差为 当当n=16时,抽样误差为时,抽样误差为 因此,当样本量从因此,当样本量从n=4增加到增加到n=16,即增加,即增加4倍时,抽样标准误差减少一半。倍时,抽样标准误差减少一半。142nx5 . 0162nx抽样分布与抽样方法课件等距抽样(机械抽样或系统抽样) 1、方法方法:将总体单位按某一标志排序,而后按一:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。设总体有定的间隔抽取样本单位。设总体有N个单位组成个单位组成,现在抽取一个容量为现在抽取一个容量为n的样本的样本,现将总体现将总体N个单位按个单位按标志排
42、队标志排队,然后将然后将N划分为划分为n个单位相等部分个单位相等部分,每部每部分包含分包含k个单位个单位,(Nnk),然后在每部分中抽取一然后在每部分中抽取一个单位。个单位。 按排队标志性质的不同,可分为按排队标志性质的不同,可分为有关标志排有关标志排队等距抽样队等距抽样和和无关标志排队等距抽样。无关标志排队等距抽样。抽样分布与抽样方法课件 先按某个标志对总体单位进行排序,然后依固定的间隔来抽先按某个标志对总体单位进行排序,然后依固定的间隔来抽取样本单位。这样可以保证样本单位均匀地分布在总体的各取样本单位。这样可以保证样本单位均匀地分布在总体的各个部分,有较高的代表性。个部分,有较高的代表性。
43、 总体的单位数总体的单位数N,需要抽取的样本单位数,需要抽取的样本单位数n,则等距抽样的间,则等距抽样的间隔大小:隔大小:k=N/n()()()ikkkk iknknknk ink1212211121总体排序标志是由总体的有关辅总体排序标志是由总体的有关辅助信息确定的,与调查标志两者助信息确定的,与调查标志两者间可以有关也可以无关。间可以有关也可以无关。1 1、无关标志排队:如家计调查,、无关标志排队:如家计调查,按门牌号码排序。按门牌号码排序。2 2、有关标志排队:如农产量调、有关标志排队:如农产量调查按平均亩产量高低排序。查按平均亩产量高低排序。一般来讲,有关标志排序要比无一般来讲,有关标
44、志排序要比无关标志排序的机械抽样更为优越。关标志排序的机械抽样更为优越。在排队时,要注意避免在排队时,要注意避免抽样间隔与现象本身的抽样间隔与现象本身的周期性节奏相重合。以周期性节奏相重合。以减少减少系统偏差的影响,提系统偏差的影响,提高样本的代表性高样本的代表性。抽样分布与抽样方法课件2、等距抽样平均误差的计算、等距抽样平均误差的计算 关于等距抽样的平均误差关于等距抽样的平均误差,它和标志排列顺序有关它和标志排列顺序有关,情况比较复杂。如果用来排队的标志是无关标志,而情况比较复杂。如果用来排队的标志是无关标志,而且是随机起点抽样,那么它的抽样误差就十分接近简且是随机起点抽样,那么它的抽样误差
45、就十分接近简单随机抽样的误差,为了简便起见,可以采用简单随单随机抽样的误差,为了简便起见,可以采用简单随机抽样误差公式来近似计算即:机抽样误差公式来近似计算即:)Nn-(1nnnxx2或抽样平均误差样本平均数抽样分布与抽样方法课件 1、方法:将总体全部单位分类,形成若干个类型组,后方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。从各类型中分别抽取样本单位,合成样本。类型抽样(分层抽样或分类抽样)k设总体分为 组,有按比例取样,即NnNnNnNnkk2211kNNNN21knnnn2112212211121221,kkkknnnXXXXXXXXX得到样本如下:
46、得到样本如下:需要解决的问题是:如何求出抽样平均误差(即样本平均数的标准差)?抽样分布与抽样方法课件2、类型抽样的特点:、类型抽样的特点: 根据方差定理:根据方差定理: 总方差总方差=组内方差的平均数组内方差的平均数+组间方差组间方差 在划分类型后,类型抽样实际是对每组都在划分类型后,类型抽样实际是对每组都抽去了一个样本,如果各组内的抽样误差都为抽去了一个样本,如果各组内的抽样误差都为0,那么不论各组之间差异如何,整个样本的,那么不论各组之间差异如何,整个样本的方差就等于总方差(总方差方差就等于总方差(总方差=组间方差),也组间方差),也就是说抽取得到的样本分布完全和总体分布一就是说抽取得到的
47、样本分布完全和总体分布一样,也就不存在抽样误差。样,也就不存在抽样误差。 所以说,所以说,类型抽样总的抽样误差主要取决类型抽样总的抽样误差主要取决于于各组内的抽样误差。各组内的抽样误差。抽样分布与抽样方法课件3、类型抽样平均误差的计算、类型抽样平均误差的计算 设总体有设总体有N个单位组成,把总体分为个单位组成,把总体分为k组,然后从每组中组,然后从每组中抽取样本单位构成样本总体。怎样从每类中抽取呢?通常是等抽取样本单位构成样本总体。怎样从每类中抽取呢?通常是等比例抽样。比例抽样。 )Nn-(1n n n )( ),2, 1( 2i2i2ii2i221112211或样本平均数抽样误差组内方差的平
48、均数组内方差样本平均数各组抽样平均数各组的样本单位nnxxnxnNxNxkinxxNnNnNnNnNniiiikiiikiiiinjijiiii 抽样分布与抽样方法课件类型抽样两点结论 从类型抽样的抽样平均误差公式来看,类型抽样从类型抽样的抽样平均误差公式来看,类型抽样的抽样平均误差与组间方差无关,它决定于组内的抽样平均误差与组间方差无关,它决定于组内方差的平均水平。而方差的加法定方差的平均水平。而方差的加法定理:理: ,因此有如下结论:,因此有如下结论: 抽样效果一般来说好于简单随机抽样。抽样效果一般来说好于简单随机抽样。 因此在分组时应尽量扩大组间方差(组间差异),因此在分组时应尽量扩大组
49、间方差(组间差异),缩小组内方差(组内差异),从而减少抽样误差,缩小组内方差(组内差异),从而减少抽样误差,提高抽样效果。提高抽样效果。222i抽样分布与抽样方法课件类型抽样例假设某农场种植小麦假设某农场种植小麦1 200亩,根据其地理条件划分为甲、乙、丙三类,亩,根据其地理条件划分为甲、乙、丙三类,按按5%的比例总共抽取的比例总共抽取60亩进行调查,结果如下表所示。试以亩进行调查,结果如下表所示。试以95%的概率的概率估计农场平均亩产量的区间范围。估计农场平均亩产量的区间范围。 抽样分布与抽样方法课件整群抽样(集团抽样) 1、方法方法: 将总体全部单位分为许多个将总体全部单位分为许多个“群群
50、”,然后随机抽取若干然后随机抽取若干“群群”,对被抽中的各,对被抽中的各“群群”内内的所有单位登记调查。的所有单位登记调查。总体总体群1群2群 抽样分布与抽样方法课件2、整群抽样的特点:、整群抽样的特点:根据方差定理:根据方差定理:总方差总方差=组内方差的平均数组内方差的平均数+组间方差组间方差 在分群后,整群抽样实际是对中选群进行全在分群后,整群抽样实际是对中选群进行全面调查,其样本的代表性取决于抽中的群体对总面调查,其样本的代表性取决于抽中的群体对总体的代表性每组。如果各群体之间没有差异(即体的代表性每组。如果各群体之间没有差异(即组间方差组间方差=0),群内方差就等于总方差(总方差),群
51、内方差就等于总方差(总方差=组内方差),则样本能完全代替总体,也就不组内方差),则样本能完全代替总体,也就不存在抽样误差。存在抽样误差。 所以说,所以说,整群抽样整群抽样总的抽样误差主要取决于总的抽样误差主要取决于各群间的抽样误差各群间的抽样误差或或群间差异程度。群间差异程度。抽样分布与抽样方法课件3、整群抽样平均抽样误差计算公式:、整群抽样平均抽样误差计算公式: 设总体全部设总体全部单位划分为单位划分为群每群包含群每群包含单位则单位则现在从总体现在从总体群中随机抽取群中随机抽取群组成样本,并分别对中选群组成样本,并分别对中选群的所有群的所有单位进行调查单位进行调查)1Rr-R(rr)x-ixrxrMxx i2r1i2r1iir1iM1jij1抽样平均误差(群间方差样本平均数群的样本平均数第MxxMjiji抽样分布与抽样方法课件类型抽样与整群抽样比较 1、抽样平均误差的决定因素不同。、抽样平均误差的决定因素不同。 类型抽样的平均误差与组间方差无关,决定于组内方差的类型抽样的平均误差与组间方差无关,决定于组内方差的平均水平平均水平 整群抽样的平均误差与组内方差无关,决定于组间方差大整群抽样的平均误差与组内方差无关,决定于组间方差大小小 2、减小类型抽样与整群抽样平均误差的方法不同。、减小类型抽样与整群抽
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届高考政治二轮复习《法律与生活》命题特点和备考策略探讨
- 2025(统编版)语文四年级下册第一单元教学设计
- 2025年高线密度玻璃纤维直接无捻粗纱项目发展计划
- 探索2024年国际物流师试题及答案
- 2024国际物流的安全管理试题及答案
- 经典CPSM考点试题及答案分享
- CPSM考试优化策略试题与答案
- 餐饮美学基础 课件 2.4形态审美
- 2024年CPMM考试重要理论试题及答案
- 2025年卤代烃合作协议书
- KAT1-2023井下探放水技术规范
- 第10课+近代以来的世界贸易与文化交流的扩展+高二下学期历史统编版(2019)选择性必修3
- 2024秋初中化学九年级下册人教版上课课件 第十一单元 课题2 化学与可持续发展
- 光电产品包装及运输方案创新
- 汽车检测技术课件 任务六 检测汽车平顺和通过性能
- 2024年云南省初中学业水平考试地理试卷含答案
- ASTM-A269-A269M无缝和焊接奥氏体不锈钢管
- 工程施工赶工措施方案
- 生猪屠宰兽医卫生检验人员理论考试题及答案
- 杭州市卫生健康委员会所属事业单位招聘考试真题
- 九年级分流工作实施方案
评论
0/150
提交评论