




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第21章统计与统计数据
第一节统计学
【本节考点】
1、统计学的两大分支
2、描述统计的含义、内容、举例
3、推断统计的含义、内容、举例
【本节内容】
一、统计学的含义:
统计学是关于收集、整理、分析数据和从数据中得出结论的科学。
二统计学的两大分支(描述统计和推断统计)
类型含义及内容举例
描述统计研究数据收集、整理和描述的统计方法。其为了解与居民生活相关的商
内容包括:品及服务价格水平的变动情
(1)如何取得所需要的数据;况,收集统计局发布的CPI
(2)如何用图表或数学方法对数据进行数据,利用统计图展示CPI,
整理和展示;利用增长率计算CPI的走
(3)如何描述数据的一般特征。势。
推断统计研究如何利用样本数据推断总体特征的统某公司评测顾客满意度,随
计方法。其内容包括:机抽取部分顾客进行调查,
1、参数估计:利用样本信息推断总体特征:再对顾客总体满意度进行评
2、假设检验:利用样本信息判断对总体假估,此时需要用到参数估计
设是否成立。法,然后验证满意度高的客
户更倾向于成为忠诚客户。
【例题1:单选】描述统计的研究内容不包括。
A如何取得所需要的数据;
B如何用图表或数学方法对数据进行整理和展示;
C如何描述数据的一般特征。
D如何利用样本信息判断对总体假设是否成立
【答案】D
【例题2:单选】收集统计局发布的CPI数据,利用统计图展示CPI,利用增长率计算CPI的走势,这种
统计方法是。。
A描述统计B推断统计C客观统计D心理统计
【答案】A
第二节变量和数据
【本节考点】
A.变量的含义及分类
B.数据的含义及分类
【本节内容】
项目含义分类
变量变量是研究对象的定量变量变量的取值是数量。
属性或特征,它是(数量变量)如企业销售额、注册员工数
相对于常数而言分类变量的取值是类别。
的。常数只有一个变量变量如企业所属行业、员工性别
固定取值,变量亘顺序变量的取值是类别且有顺序。
以有两个或更多个变量如员工受教育水平
可能的取值。
数据数据是对变量进行定量数据是对定量变量的观测结果,其取值表现
测量、观测的结果。(数值型数据)为具体的数值。
数据可以是数值、如企业销售额1000万元。
文字或者图像等形定性分类分类变量的观测结果,表现为类别,二
式数据数据般用文字来表述,也可用数字描述。如,
用1表示男性,2表示女性。
顺序顺序变量的观测结果,表现为类别,二
数据般用文字描述,也可用数字描述。如用
1表示硕士及以上,2表示本科,3表示
大专及以下。
「A分类变量
测量结果.分类数据
统
计
变
量
与
数
据
测量结果顺序数据
数值型数据
对于不同类型的数据,可以采用不同的统计方法处理和分析。对分类数据可以计算出各类别的频率,而数
值型数据则可以计算均值和方差等统计量。
【例题3:多选】定性变量的观测结果是()。
A.顺序变量
B.分类数据
C.顺序数据
D.数值型数据
E.分类变量
【答案】BC
【例题4:09年多选题改编】下列变量中,通常用数值型数据表示的有。。
A.商品销售额
B.上班出行方式
C.家庭收入
D.居住地区
E.年龄
【答案】ACE
第三节常用的数据特征测度
【本节考点】
1、均值和中位数
2、方差和标准差
【本节内容】
对统计数据特征的测度,主要从三个方面进行:
一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;
二是分布的离散程度,反映各数据远离其中心值的趋势;
三是分布的偏态和峰度,反映数据分布的形状。
(-)均值和中位数(测度数据的集中趋势)
集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测度
也就是寻找数据水平的代表值或中心值。
1、均值
均值也就是平均数,就是数据组中所有数值的总和除以该组数值的个数。
【注1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。
[注2]均值主要适用于数值型数据,但不适用于分类数据和顺序数据。
【注3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代
表性减弱。
2、中位数
(1)含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。中位数将
数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
(2)计算:
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式
为:
(l)n为奇数:中位数位置是山,该位置所对应的数值就是中位数数值。
---2
(2)n为偶数:中位数位置是介于上和(匚+1)之间,中位数就是这两个位置对应的数据的均值。
------21
(3)适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值
的影响,抗干扰性强。
【例题5:2008单选题】某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、
36人、36人、37人、37人,其中位数为()
A34
B35
C36
D37
【答案】B
【解析】n为偶数,中位数=(34+36)/2=35.
【例题6:单选】下面一组数据为9个家庭的人均月收入数据(单位:元):750;780;850;960;1080;
1250;1500;1650;2000;则中位数为()
A750
B1080
C1500
D2000
【答案】B
【解析】n为奇数,中位数位置为5,所对应的数值为1080。
【例题7:2011年单选】2010年某省8个地市的财政支出(单位:万元)分别为:
59000500026560266450780007800078000132100这组数据的中位数是()万元。
A.78000
B.72225
C.66450
D.75894
【答案】B
[解析]由于所给数据是8个,所以中位数的位置是第4个和第5个数据的平均数。(66450+78000)/2=72225
【例题8:2003年单选】集中趋势最主要的测度值是()。
A.众数
B.中位数
C.均值
D.几何平均数
【答案】C
【解析】算术平均数也称为均值,是集中趋势最主要的测度值。
【例题9:2007年单选改编】某连锁超市6个分店的职工人数有小到大排序后为57人、58人、58人、
60人、63人、70人其均值、中位数分别为()。
A.59、58
B.61、58
C.61、59
D.61、70
【答案】C.
【解析】均值=(57+58+58+60+63+70)/6=61
中位数=(58+60)/2=59
(二)方差和标准差(测度数据的离散趋势)
离散程度反映的是各变量值远离中心值的程度。
集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数据的离散水
平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差,离散程度越小,其代表性就越好。
【例题10:2010年单选】集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据
的离散程度越大,集中趋势的测度值对该组数据的代表性()。
A.越好
B.越差
C.始终不变
D.在一定区间内反复变化
【答案】B
1、含义:
(1)左差是数据组中各数值与其均值离差平方的平均数。是实际中应用最广泛的离散程度测度值。方差越小,
说明数据值与均值的平均距离越小,均值的代表性越好。
(2)标准差:方差的平方根,不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。
2、计算:
指标名称总体样本
方差
n代表样本单位数。
【注】(1)在有放回的简单随机抽样中,
N代表总体单位数。样本方差T是总体方差匚的无偏估计
S(2)在不放回的简单随机抽样中,
样本方差,是总体方差7的无偏估计
量
标准差
【例题11】某售货小组有5名营业员,元旦一天的销售额分别为520元、600元、480元、750元和500
元,求该日平均销售额及样本方差和样本标准差。
【解析】
A.平均销售额=(520+600+480+750+500)/5=570元
B.样本方差
第一步:计算差
520-570=-50;600-570=30;480-570=90;750-570=180;500-570=-70
第二步:计算差平方和
(-50)2+(30)2+(90)2+(180)2+(-70)2
第三步:计算方差
方差二----------------M--------------
=12200
(3)样本标准差=J12200=110.45
3、适用
只适用于数值型数据,容易受极端值的影响。
【例题12:2010年多选题改编】数值型数据离散程度的测度指标有()。
A.中位数
B.几何平均数
C.均值
D.标准差
E.方差
【答案】DE
第四节数据来源
【本节考点】
一、观测数据和实验数据
二、一手数据和二手数据
【本节内容】
分类类别内容
按收集方法观测数据通过直接调查或测量而收集的数据。观测数据是在没有对
事物施加任何人为控制因素的条件下得到的。
几乎所有与社会经济现象有关的统计数据都是观测数据,
如GDP、CPI、房价等。
实验数据通过在实验中控制实验对象以及其所处的实验环境收集到
的数据。如,一种新产品使用寿命的数据,一种新药疗效
的数据。
自然科学领域的数据大多都是实验数据。
按来源一手数据来源于直接的调查和科学实验的数据,对使用者来说这是
数据的直接来源。其来源主要有:调查或观察;实验。
二手数据来源于别人的调查或实验的数据。对使用者来说这是数据
的间接来源。
【例题13:多选】统计数据按其收集方法,可以分为。。
A观测数据
B一手数据
C主观数据
D实验数据
E二手数据
【答案】AD
【例题14:单选】几乎所有与社会经济现象有关的统计数据都是()
A观测数据
B一手数据
C二手数据
D实验数据
【答案】A
第五节统计调查
【本节考点】
1、统计调查的概念及分类
2、统计调查的方式
【本节内容】
一、统计调查的概念和和分类
1、统计调查的概念
统计调查过程有两个重要特征:一是调查是一种有计划、有方法、有程序的活动;二是调查的结果表现为
搜集到的数据。
2、统计调查的分类
种类具体内容
按调查对象的范全面调查全面统计报表和普查
围不同非全面调查非全面统计报表、抽样调查、重点调查和典型调
查
按调查登记的时连续调查观察总体现象在一定时期内的数量变化,说明现
间是否连续象的发展过程,目的是为了解社会现象在一段时
期的总量。如工厂的产品生产、原材料的投入、
能源的消耗、人口的出生、死亡等。
不连续调查间隔相当长的时间所作的调查,为了对总体现象
在一定时点上的状态进行研究。如生产设备拥有
量、耕地面积等。
【例题15:2008年多选题】下列调查方式中,属于非全面调查的有()
A、重点调查
B、抽样调查
C、典型调查
D、普查
E、全面报表
【答案】ABC
【例题16:多选】按调查登记的时间是否连续,统计调查分为连续调查和不连续调查,下列现象适合不
连续调查的是()
A生产设备拥有量
B耕地面积
C人口的出生死亡
D原材料的投入
E工厂的产品生产
【答案】AB
(二)统计调查的方式
调查含义特征、分类及应用场合
方式
L按调查对象范围的不同分为全面报表和非全面报
按照国家有关法规的规定,
表。目前的大多数统计报表都是全面报表。
统计自上而下地统一布置,自下
2.按报送周期长短,分为日报、月报、季报、年报等。
报表而上地逐级提供基本统计
3.按报表内容和实施范围不同分为国家的、部门的、
数据的一种调查方式。
地方的统计报表。
特点:
1普.查通常是一次性的或者周期性的;
为某一特定目的而专门组
2.一般需要规定统一的标准调查时间,以避免调查数
织的一次性全面调查,主要
据的重复或遗漏,保证普查结果的准确性。
普查用于了解处于某一时点状
3.数据一般比较准确,规范化程度较高,可以为抽样
态上的社会经济现象的基
调查或其他调查提供基本的依据。
本全貌。
4.使用范围比较窄,只能调查一些最基本及特定的现
象。
(1).经济性:
是抽样调查的一
个显著优点。
(2)时效性强:
可以迅速、及时
的获得所需要的
从调查对象的总体中抽取
信息O
一部分单位作为样本进行
抽样(3).适应面广:
调查,并根据样本调查结果
调查可用于全面调查
来推断总体特征的一种非
能够调查的现
全面调查
象,也能调查全
面调查所不能调
查的现象,特别
适合特殊现象的
调查。如:产品
质量检验、农产
品试验、医药的
临床实验。
(4).准确性高:
调查的目的只要求了解基本状况和发展趋势,不要求
掌握全面数据,而调查少数重点单位就能满足需要
从调查对象的全部单位中时,采用重点调查比较适宜。
选择…部分重点单位进行(1)为了及时了解全国城市零售物价的变动趋势,
调查。就可以对全国的35个大中型城市的零售物价的变化
重点
重点单位虽然只是全部单进行调查就是重点调查。
调查
位中的一部分,但就调查的(2)要及时了解全国工业企业的增加值和资产总额
标志值来说在总体中占绝情况,只需对全国大中型工业企业进行重点调查即
大比重。可。
(3)国家统计局的全国5000家工业企业联网直报制
度属于重点调查。
有意识的选择若干具有典作用:弥补全面调查的不足;在一定条件下可以验证
典型
型意义的或有代表性的单全面调查数据的真实性。
调查
位进行的调查。
【注】抽样调查和重点调查、典型调查的区别:
抽样调查是随机的抽取调查单位,可以根据抽样结果推断总体的数量特征;
重点调查和典型调查的单位不是随机抽取的,具有一定的主观性,因此调杳结果不能推断总体。
【例题17:2006年单选题】能够根据样本结果推断总体数量特征的调查方式是()
A.重点调查
B.抽样调查
C.典型调查
D.所有非全面调查
【答案】B
【例题18:2009年单选题】为了解全国煤炭企业的生产安全状况,找出安全隐患,专家根据经验选择10
个有代表性的企业进行深入细致的调查。这类调查方法属于()。
A.专家调查
B.重点调查
C.系统调查
D.典型调查
【答案】D
【例题19:2012年单选题】在进行重点调查时,应选择的调查单位是。。
A.就调查标志值来说在总体中占绝大比重的单位
B.有典型意义的单位
C.主动参与调查的单位
D.随机抽取的单位
【答案】A
【例题20:2011年多选题改编】关于抽样调查的说法,正确的有()。
A.抽样调查中不存在非抽样误差
B.抽样调查用样本数据推断总体特征
C.抽样调查适应面广
D.抽样调查时效性差
E.抽样调查通常从总体中选择重点单位进行调查
【答案】BC
【第21章考点总结】
1、统计学的两大分支
2、描述统计和推断统计的含义及内容
3、变量和数据的含义及类型
4,均值及中位数的计算和适用范围
5,方差和标准差的关系及二者的适用范围
6、数据的来源(按收集方法及按来源)
7、统计调查的分类
8、统计调查的方式
第22章抽样调查
第一节抽样调查的基本概念
【本节考点】
1、总体、样本;抽样框、抽样单位;总体参数、样本统计量
2、概率抽样的特点,非概率抽样的主要方法
3、抽样调查的步骤
4、抽样调查中的误差
【本节内容】
一、抽样调查基本概念
概念含义例子
总体和总调查对象的全体,组成总体的各个如研究某公司所有注册在职人员
体单元个体称作总体单元或单位。(共有1000名)的工资状况,总
体是公司所有注册在职员工,每
个注册在职人员是总体单元。
样本、样样本是总体的一部分,由从总体中上例中,按一定原则从所有注册
本单位及按一定原则或程序抽出的部分个体在职人员中抽取出200人调查。
样本量所组成。样本也是一个集合。每个这200名注册在职员工就是样
被抽中进入样本的单位称为人样单本;而抽出的每一名员工就是入
位。样本中包含的入样单位的个数样单位;该样本的样本量是200.
称为样本量。
抽样框供抽样所用的所有抽样单元的名上述例子中,企业1000名注册在
单,是抽样总体的具体表现。常见职职工的名册,就是抽样框。
的抽样框有名录框,如企业名录、
电话簿、人员名册。抽样框也可以
是一张地图或其他适当的形式,不
管是那种形式,抽样框中的单位必
须是有序的,便于编号。高质量的
抽样框应当提供被调查单位更多的
信息,并且没有重复和遗漏。
抽样单元构成抽样框的基本要素,抽样单元要调查城市拥有两套以上住房的
可以只包括一个总体单元,也可以人口比例,总体单元是该城市的
包括多个总体单元。每个人,但抽样单元可以是该城
市的每户家庭或是每个居委会。
总体参数总体参数就是总体指标值,它是未如研究某公司所有注册在职人员
知的常数,是根据总体中所有单位(共有1000名)的工资状况,公
的数值计算的,是通过调查想要了司所有注册在职人员的平均工资
解的,不受样本的抽选结果影响。就是总体参数。
常用的总体参数有总体总量、总体
均值、总体比例、总体方差。
样本统计是根据样本中各单位的数值计算如上例中,200名注册在职职工
量(估计的,是对总体参数的估计,也称估的平均工资就是该公司所有员工
量)计量。它是一个随机变量,取决于平均工资的一个估计量(样本统
样本设计和正好被选入样本的单元计量)
特定组合。常用的样本统计量有样
本均值、样本比例、样本方差。
【例题1:2012年单选】在研究某城市居民的家庭消费结构时,在全部50万户家庭中随机抽取300
0户进行入户调查,这项抽样调查中的样本是指该城市中。。
B.抽取出来的3000户家庭
B.50万户家庭
C.每一户家庭
D.抽取出来的每一户家庭
【答案】A
【例题2:单选】某工厂为了检测出厂的十万只灯泡的寿命,随机抽取了1000只灯泡进行检测.关于该抽
样调查下列表述错误的是()。
A总体是出厂的十万只灯泡
B样本是抽取到的1000只灯泡
C全体灯泡的平均寿命是总体参数
D1000只灯泡的平均寿命是抽样单元
【答案】D
【解析】1000只灯泡的平均寿命是样本统计量,也称为估计量。
二、概率抽样和非概率抽样
抽样含义特点具体方式
方法
概率依据随机1.按一定概率以随机原则1.简单随机抽样;
抽样原则,按照抽取样本。2.分层抽样
某种事先2.总体中每个单元被抽中3.系统抽样;
设计的程的概率是已知的或者是可4.整群抽样
序,从总体以计算出来5.多阶段抽样
中抽取部3.当采用样本对总体参数
分单元的进行估计时,要考虑到每个
方法。样本单元被抽中的概率。若
每个单位被抽中的概率相
等,则成为等概率抽样;否
则称为非等概率抽样。
非概调查者根抽取样本时并不是依据随L判断抽样:调查者依据调查目的
率抽据自己的机原则。和对调查对象的了解,人为确定样
样方便或主本单元;
观判断抽2.方便抽样:拦截式
取样本的3.自愿样本:网上调查
方法。4.配额抽样:总体划分若干类型,
将样本数额分配到各类型,从各类
型中抽取样本的方法没有严格限
制,一般采用方便抽样。
【例题3:2011年单选题】下列抽样方法中,属于非概率抽样的是()。
A.分层抽样
B.整群抽样
C.判断抽样
D.等距抽样
【答案】C
【例题4:多选题】相对于非概率抽样而言,概率抽样的特点有。
A按一定的概率以随机原则抽取样本
B总体中每个单元被抽中的概率是已知的或可以计算出来
C每个单位被抽入样本的概率相等
D抽取样本时不需要依据随机原则
E当采用样本对总体参数进行估计时,要考虑到每个样本单元被抽中的概率
【答案】ABE
三、抽样调查的一般步骤
1、确定调查问题:
2、调查方案设计:明确如何实施调查,包括抽样方案的设计和问卷设计。
3、实施调查过程:获得样本单元的调查数据,关键的问题是要保证原始数据的质量。
4、数据处理分析:对数据进行检查核对、编码、录入、预处理、统计分析、对总体参数进行估计。
5、撰写调查报告:调查活动的最终成果。
四、抽样调查中的误差
样本估计值和总体参数值之间的差异称为误差,一般来说调查中的误差分为抽样误差和非抽样误差两类。
误差形成原因
抽样由抽样的随机性造成的,用样本统计量估计总体参数时出现的误差。抽到
误差哪一个样本完全是随机的,而抽到不同的样本,对总体的估计就会不同。
非抽样误除抽样误差外,由其他原因引起的样本统计量与总体真值之间的差异。
1(1)抽样框误差:样本框不完善造成的。如用工商局签发的营业执照作为
个体商业的抽样框,对个体商业实施抽样调查,以掌握个体商业零售额的
情况。但有些商贩无照经营、有些商贩虽有执照但转行,不再经商;有些
虽有一个摊点却办理多个营业执照。这些情形均会导致估计结果失真。
(2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。无
回答分为:
①由于随机因素造成的。如被调查者恰巧不在家,这种会减少有效样本量,
造成估计量方差增大。
②由于非随机因素造成的:如被调查者不愿告诉实情而拒绝回答,这时,
回答者与不回答者在调查指标上存在数量的差异,调查的结果中只有回答
者的信息,却没有无回答者的信息,这种无回答不仅造成估计量方差增大,
还会带来估计偏差。
(3)计量误差:由于调查所获得的数据与其真值之间不一致造成的误差。这
种误差可能是由调查人员、问卷设计、受访者等原因造成的。
【例题5:单题】抽样误差形成的原因主要是。
A、抽样的随机性
B、有意虚报、瞒报
C、问卷设计缺陷
D、调查人员没能够从被调查者那里得到所需要的数据
【答案】A
【例题6:2010年多选题改编】统计数据的非抽样误差形成的原因主要有0。
A.受访者提供虚假数字
B.抄录错误
C.无回答误差
D.抽样的随机性
E.抽样框不完善
【答案】ABCE
【例题7:2010年多选题改编】人口普查统计数据可能存在的误差来源有()。
A.填报错误
B.抽样的随机性
C.抄录错误
D.汇总错误
E.有意瞒报
【答案】ACDE
【解析】普查只存在非抽样误差。所以本题实质是考核登记性误差产生的原因。
第二节几种基本的概率抽样方法
【本节考点】
各种概率抽样方法的含义、特点
【本节内容】
一、简单随机抽样
(-)含义
1、有放回简单随机抽样
从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到
抽满n个单位为止。
【注】单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。
2、不放回简单随机抽样
从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被抽入样本的单元中等概率的抽
取下一个单元,直到抽取n个单元为止。
【注】每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低
的抽样误差。
(二)优缺点
优点:简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同,样本估计量形式
也比较简单。
缺点:没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十
分分散,增加了调查过程中的费用和时间。
(三)适用条件
1、抽样框中没有更多可以利用的辅助信息
2、调查对象分布的范围不广阔
3、个体之间的差异不是很大
【例题8:单选】下列关于简单随机抽样的表述错误的是
A总体的每个单位入样概率相同
B是最基本的随机抽样方法
C没有利用抽样框更多的辅助信息
D适用个体之间差异较大的调查
【答案】D
二、分层抽样
(-)含义
先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层
样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。
分层抽样样本量在各层分配的方法有两类,如下表:
分配方法含义优缺点
等比例层中单位数越多,抽取的样本单位就操作容易,易于理解,在实践中广
分配越多,该层样本单位比例与该层中的泛使用。但各层单位数相差悬殊或
总体单位比例相一致.层内方差过大时抽样误差会很大。
不等比例分层样本单位比例与该层中的总体单如果各层的总体方差已知,不等比
配位比例不一致。例抽样的抽样误差可能比等比例
抽样更小。
【例题9:单选】某校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采
取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为()
A.45,75,15
B.45,45,45
C.30,90,15
D.45,60,30
【答案】D
【解析】样本量占总体容量的比=135/2700=5%
-"900=5%,所以,n(«->=5%X900=45A
n(«-)/1200=5%,所以,一*二>=5%乂1200=60人
n8三"600=5%,所以,n*三>=5%X600=30人
(二)优缺点
优点:
1.不仅可以估计总体参数,同时也可以估计各层参数
【例】调查某市中小企业就业的相关指标,可以按照行业将该市中小企业进行分层,再在每个行业内独立随机
抽取一部分中小企业进行调查,这样不仅能估计全市中小企业就业的相关指标,还可以在各行业进行推算。
2.便于抽样工作的组织。
3.每层都要抽取一定的样本单位,这样样本在总体中分布比较均匀,可以降低抽样误差。
(三)适用条件
抽样框中有足够的辅助信息,能够将总体单位按某种标准划分到各层之中,实现在同一层内,各单位之间
的差异尽可能小,不同层之间各单位的差异尽可能大。(层内差异小,层间差异大)
三、系统抽样
(一)含义
系统抽样指先将总体中的所有单元按一定顺序排列,在规定范围内随机抽取一个初始单元,然后按事先规定的
规则抽取其他样本单元。
最简单的系统抽样是等距抽样。其步骤:
1.将总体N个单位按直线排列,依次编号1——N;
2.根据样本量n确定抽样间隔K
抽样间隔=以曰匕1C勺最4
nn
【例】N=24,n=4,抽样间隔是24/4=6
若N=23,n=4,抽样间隔是23/4=5.6%6
3.在1——K的范围内随机抽取一个整数i,令位于i位置上的单位为起始单位,往后每间隔k抽取一个
单位,直至抽满n。
【接上例】N=24,n=4,抽样间隔是24/4=6,在1〜6之间,随机抽取一个整数2作为起始单位,以6为
间隔,可得到样本到2+6=8;8+6=14;14+6=20
(二)优缺点
1、优点:
(1)操作简便;
(2)对抽样框的要求比较简单,它只要求总体单位按一定顺序排列,而不一定是一份具体的名录清单。
系统抽样的估计效果与总体排列顺序有关。
①、无关标识排列:
排列顺序与调查内容没有联系。这时系统抽样估计与简单随机抽样估计效率相仿。
【例】对汽车尾气排放情况的调查中,是按汽车牌号排列,牌号与尾气排放没有关系,即属于无关标识排
列。
②、有关标识排列:
排列顺序与调查内容有关。其抽样精度一般比简单随机抽样的精度高。
【例】对汽车尾气排放情况的调查中,按汽车价格排列,价格与尾气排放量有相关性。
2、缺点:
方差估计比较复杂,这就给计算抽样误差带来一定困难。
四、整群抽样
(-)含义
整群抽样是将总体中所有的基本单位按照一定规则划分为互不重叠的群,抽样时直接抽取群,对抽中的群调查
其全部的基本单位,对没有抽中的群则不进行调查。
【例】调查某市在职的房地产行业人员工资水平,将房地产行业所有在职人员按照所属企业分群,直接
抽取企业单位,入样的企业单位内所有职工接受调查,没有入样的企业单位员工都不调查。
(二)优缺点
1、优点:
(1)实施调查方便,可以节省费用和时间。
(2)抽样框编制得以简化,抽样时只需要群的抽样框
2、缺点
群内各单位之间存在相似性,差异比较小,而群与群之间的差别比较大,使得整群抽样的抽样误差比较大。
(三)适用
如果群内各单位之间存在较大差异,群与群的结果相似,整群抽样会降低估”•误差。
【例】调查某地区的男女比例,以家庭为群,整群抽样估计男女比例的误差就低于简单随机抽样。
整群抽样特别适合于对某些特殊群结构进行调查。
【例题10:2012单选】在调查某城市小学教师亚健康状况时,从该城市的200所小学中随机抽取40所,
每个被抽取小学中的所有教师都参与调查,这样抽样方法属于()。
A.简单随机抽样B.整群抽样
C.分层抽样D.等距抽样
【答案】B
(五)多阶段抽样
(一)含义
在大规模抽样调查中,一次抽取到最终样本单位很难实现,往往需要经过二个或二个以上阶段才能抽到最终样
本单位,这就是多阶段抽样方法。首选从总体中采用随机方法抽取若干个小总体,称为初级单元;再在这些中
选的初级单元中随机抽取若干个单位。
(二)优缺点
在大范围的抽样调查中,采用多阶段抽样是必要的。首先,多阶段抽样是分阶段进行的,抽样框也可以分级进
行准备。其次因为多阶段抽样是在中选单位中的再抽选,这样就使样本的分布相对集中,从而可以节省调查中
的人力和财力。
多阶段的抽样设计比较复杂,其抽样误差计算也比较复杂。
第三节估计量和样本量
【本节考点】
3、估计量的性质
4、抽样误差的估计
5、样本量的影响因素
【本节内容】
一、估计量的性质(一无有,可记忆为“一无所有”)
性质内含
一致性随着样本量的增大,估计量的值如果稳定于总体参数的真值,这个估计量
就有一致性,可称为“一致估计量”。
无偏性对于不放回简单随机抽样,所有可能的样本均值取值的平均值总等于总体
现值(样本均值的平均数等于总体均值),这就是样本均值估计量的无偏性。
有效性在同一抽样方案下,对某一总体参数,如果有两个无偏估计量。1、82,由
于样本的随机性,如果e1的可能样本取值较e2更密集在总体参数真值附
亚,则认为S比。更有效,此时e।的方差小于ez的方差。
【例题11:单选】抽样统计中,估计量的性质不包括()。
A一致性
B相关性
C无偏性
D有效性
【答案】B
(二)抽样误差的估计
抽样误差无法避免,但是可计算的。
在不放回简单随机抽样方法中,将样本均值作为总体均值的估计量。则估计量的方差为:
样本估计量的方差=
【结论】
C.抽样误差与总体分布有关,总体单位值之间差异越大,即总体方差越大,抽样误差越大。
D.抽样误差与样本量n有关,其他条件相同,样本量越大,抽样误差越小。
E.抽样误差与抽样方式和估计量的选择也有关。例如分层抽样的估计量方差一般小于简单随机抽样。
F.利用有效辅助信息的估计量也可以有效的减小抽样误差。
2、实践中,总体方差是未知的,可以利用样本方差来估计,因此估计量方差的的估计公式为:
样本估计量的方胃
【例12】从某个N=1000的总体中抽出一个样本容量为100的不放回简单随机样本,样本均值50,样本方差
200,对总体均值的估计量等于样本均值等于50,估计量的方差是。。
【解析】
样样本方
样本估计量的方差=4-总体分羹C样本看
=a_K)O)x2OC=18
10001OC
【例13:多选】下列关于抽样误差的表述正确的有()。
A抽样误差无法避免,但可计算
B抽样误差与总体分布有关,总体方差越大,抽样误差越大。
C其他条件相同,样本量越大,抽样误差越小
D抽样误差与抽样方式和估计量的选择也有关
E分层抽样的估计量方差一般大于简单随机抽样
【答案】ABCD
三、样本量的影响因素
1、调查的精度:用样本数据对总体进行估计时可以接受的误差水平,要求的调查精度越高,所需要的样
本量就越大。
2、总体的离散程度:在其他条件相同情况下,总体的离散程度越大,所需要的样本量也越大。
3、总体的规模:对于大规模的总体,总体规模对样本量的需求则几乎没有影响(样本量n可大致用
------、——公式表示)。但对于小规模的总体,总体规模越大,为保证相同估计精度,样本量也要
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国涡杆减速装置行业投资前景及策略咨询研究报告
- 2025年中国桑塔纳轿车进气歧管行业投资前景及策略咨询研究报告
- 2025年中国智能计频器行业投资前景及策略咨询研究报告
- 2025年中国数字化校园管理系统行业投资前景及策略咨询研究报告
- 海外企业员工管理制度
- 七台河废旧物品管理制度
- 服务业新规章管理制度
- 地产公司开发部管理制度
- 口腔修复体消毒管理制度
- 功儿园特种设备管理制度
- 限高架维修合同8篇
- 全麻期间气道梗阻的预防与处理
- 工业大数据的安全与隐私保护-洞察阐释
- 搬运装卸服务外包项目投标方案(技术方案)
- 病原微生物识别技巧试题及答案
- 绿植移植合同协议
- 2024-2025学年高中中国航天日班会 课件 弘扬航天精神 逐梦星辰大海
- 不稳定型心绞痛护理诊断及护理措施
- 药品配送运输流程图解
- 商业安全培训
- 腹膜透析围手术期的护理
评论
0/150
提交评论