版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章统计抽样估计
教学目的:1.了解统计抽样的概念和特点;2.掌握抽样平均误差、抽样极限误差的计算;3.熟练掌握区间估计方法;4.掌握必要样本单位数的确定方法。重点:简单随机抽样组织形式的区间估计方法难点:区别抽样误差、抽样平均误差和抽样极限误差第一节统计抽样概述一、统计抽样的概念(一)统计抽样的概念统计抽样是抽样调查和抽样推断的总称,它是按照随机原则从被研究现象总体中抽取部分单位进行调查,并根据对这部分单位的调查结果对总体的数量特征作出具有一定可靠性的估计和推断,从而认识总体的一种统计方法。例如,在某地区100万户居民中,随机抽取1000户居民进行家庭收入情况调查,以此来推断该地区100万户居民的家庭收入情况,这种方式就是统计抽样。(二)抽样调查的特点1.遵循随机原则从调查总体中抽取调查单位2.以样本的数量特征推断总体的数量特征。3.抽样误差可以事先计算并加以控制。
4.运用了概率估计的方法二、抽样调查的作用1.对某些不可能进行全面调查而又需要了解全面情况的社会经济现象,可以用抽样法来了解其全面情况。4.可用于生产过程中的质量控制。3.可以对全面调查的资料加以补充和修订。2.对于需要及时了解情况的现象,也经常采用抽样技术。三、统计抽样的基本概念(一)全及总体和样本总体1.全及总体,又称总体或母体,是所要认识研究对象的全体,它是由具有某种共同性质的许多单位所组成的集合体。全及总体的单位数通常用N表示。如前例中,100万户居民就是全及总体,N=100万。2.样本总体,也称样本或子样,是指从全及总体中按照随机原则抽取的那部分个体所组成的集合体。样本总体的单位数称为样本容量,通常用n表示。(二)全及指标和样本指标1.全及指标,也称总体指标或总体参数,是根据全及总体各单位标志值计算的反映总体数量特征的综合指标。常用的全及指标有总体平均数()、总体成数(P)、总体标准差(σ)和总体方差(σ2)。总体中具有某一属性的单位数占总体单位数的比重,一般用P表示,即;总体中不具有某一属性的单位数占总体单位数的比重,一般用Q表示,即,,则有。统计中通常把这样的两种比重称为成数。(三)抽样的方法在抽样调查中,从全及总体中抽取样本单位的方法有两种:重复抽样和不重复抽样。1.重复抽样,又称重置抽样或回置抽样,是指从总体中抽出一个单位后,把结果登记下来,再放回总体中参加下一次的抽选。重复抽样每次都是从全部总体单位中抽选,每个单位被抽中的机会在各次中是完全相同的,且有多次被抽中的可能。ABCD
AAABACADBABBBCBD
CACBCCCD
DADBDCDDABCD(图6-1)
其样本数目用公式计算为:
=Nn=42=16(个)
2、不重复抽样,考虑顺序:样本组合数目如图2:
AAABACADBABBBCBDCACBCCCD
DADBDCDD
ABCDABCD(图6-2)
其样本数目用公式计算为:
===
=12(个)
3、重复抽样,不考虑顺序,样本组合数目如图3:AAABACADBABBBCBDCACBCCCDDADBDCDDABCDABCD(图6-3)其样本数目用公式计算为:
CnN+n-1
==
=10(个)
4、不重复抽样,不考虑顺序:样本组合数目如图4:
AAABACADBABBBCBDCACBCCCDDADBDCDDABCDABCD
(图6-4)其样本数目用公式计算为:
==6(个)
从以上样本数目来看,重复抽样个数大于不重复抽样个数。=(五)抽样的组织形式1.简单随机抽样简单随机抽样,又称为纯随机抽样,它是按照随机原则直接从总体N个单位中抽取n个单位组成样本,使总体中每个单位都有同等的被抽中的机会。⑴抽签法⑵随机数字表法2.分层抽样分层抽样,也称分类抽样或类型抽样,它是先将总体各单位按某一标志分组,然后在各组中随机抽取单位构成样本的抽样组织形式。3.等距抽样等距抽样,也称机械抽样或系统抽样,它是先将总体各单位按某一标志排序,然后按相等的距离抽取单位构成样本的抽样组织形式。4.整群抽样整群抽样,也称成组抽样。前面介绍的三种抽样组织形式都是一个一个地抽取样本单位,故也称为个体抽样。第二节抽样误差一、抽样误差的概念要了解抽样的概念,必须正确认识误差的不同类型,准确地把握抽样误差的概念。1、计量误差;2、记录误差;3、计算误差;
4、抄录误差;5、汇总误差;6、调查者、
被调查者有意虚报或瞒报造成的误差。
1、偏差:破坏了随机原则产生的偏差(系统性误差)(1)实际误差(绝对误差)
|
-
||P-p|(2)抽样平均误差
,p2、抽样随机性误差
登记误差
抽样代表性
统计误差
(图6-5),二、影响抽样误差大小的因素
抽样误差的大小受以下几个因素的影响:1.样本单位数(样本容量n)的多少。2.总体各单位标志值的变异程度。3.抽样方法。4.抽样组织形式。三、抽样平均误差从一个总体中可以抽取许多个样本,每个样本指标与总体指标之间的离差称为抽样实际误差。但是在实践中总体指标数值往往是未知的,因此抽样实际误差是无法计算的。在实际工作中是以抽样平均误差来衡量抽样误差大小的==≈≈1.29(件)
从这里我们可以看出,复重抽样的抽样平均误差大于不重复抽样的抽样平均误差。用定义公式计算抽样平均误差很麻烦,在实际工作中,也是难以做到的。能不能将定义公式转换成适用公式?数理统计研究证明,是可以的。因为:抽样平均误差就是所有可能出现的样本指标和总体指标的平均离差,所有可能的抽样平均数的平均数,就是总体平均数的数学期望,即:==
两边平方得:
=E(
-)2
=E[
-]2
=E[
]2
=
由于∑
=0,E
2=2,则上式:
=两边开方:
,这是重复抽样的抽样平均误差公式。对于不重复抽样,则要在根号内加乘修正系数:,当N>100时,1可忽略不计,则变成:=在小样本条件(小于30)下,仍用系数
。
未知的情况下,也可以用S代替,计算
在结合6.1例,重复抽样条件下:
首先,我们计算总体标准差:见表6-3:【例7-3】一批罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格率的抽样平均误差。已知:
在重复抽样条件下,在不重复抽样条件下,四、抽样极限误差概率与概率度如图6-5表6-5:(图6-6)【例7-4】已知某乡粮食亩产量的标准差为公斤,总体单位数为亩,现重复随机抽取400亩进行调查,求得其抽样平均误差为查《正态分布概率表》,当t=2时,置信度F(t)为95.45%。第三节总体指标推断一、点估计点估计,也称定值估计,它是直接以样本指标的实际值作为相应总体指标的估计值。用公式表示为:二、区间估计【例7-6】某地区种植小麦4000亩,重复随机抽取200亩进行试验,测得结果:平均亩产量300千克,抽样总体的标准差为6千克,试求在概率为95.45%的保证下,小麦的平均亩产量的可能范围是多少?所以,小麦平均亩产量的可能范围是300±0.84,即299.16~300.84千克。按重量分组/克/包包数/包xxf66~6868~7070~7272~7474~7626642676971737513441442629215028.8819.440.2419.3635.28合计20-1416103.20试以95.45%的概率保证程度推算:⑴这批食品的平均每包重量是否符合规定要求;⑵若每包食品重量低于70克为不合格,求合格率的范围。这批食品平均每包重量的范围是70.8±1.02,即69.78~71.82克。所以,这批食品平均每包重量不符合规定要求。所以,合格率的范围是60%±21.91%,即38.09%~81.91%。第四节必要样本数目的确定一、影响必要样本单位数的因素一般地,在确定抽样单位数时,必须考虑以下因素:1.总体方差的大小。2.抽样极限误差的大小。3.抽样推断的可靠程度。4.抽样方法与组织形式。二、抽样单位数的确定
抽样必要单位数,可以根据抽样允许(极限)误差中的n来确定。在重复抽样中:由于
,,方程两边平方:
在不重复抽样中:两边平方,可得到则当N很大,例如大于100时,N-1约等于N,则
同理,成数的必要抽样个数为:
-在小样本时,则为:
由此可见,影响样本容量n的因素主要有总体方差,允许误差,概率度,总体单位数。【例7-8】某企业生产某种产品日产量为10000只标准件,根据以往经验,产品的一级品率为90%,现在用重复抽样的方法进行产品质量检验,要求一级品率的抽样极限误差不超过2%,而概率保证程度不低于95.45%,试计算应抽取多少产品?【例7-9】某市开展职工家计调查,根据历史资料该市职工家庭平均每人每年收入的标准差为250元,而家庭消费的恩格尔系数为65%。现在用重复抽样的方法,要求在95.45%的概率保证下,平均收入的极限误差不超过20元,恩格尔系数的极限误差不超过4%,求必要的样本单位数。根据公式,在重复抽样条件下,样本平均数的单位数:第8章相关与回归分析技术教学目标:本章的目的在于帮助学生了解相关关系的概念与种类,掌握判断现象之间相关方向和相关程度的技能,理解相关分析与回归分析之间的关系,掌握利用简单直线回归模型对经济数据进行分析和预测的技能,会绘制相关散点图,计算相关系数,建立回归模型,利用回归方程式对现象进行分析与预测。重点:1.相关系数的计算2.回归方程式的确定3.利用相关与回归分析的方法对现象进行分析与预测难点:回归分析中两个参数计算公式的推导第一节相关分析的意义
一、相关关系的概念与特点
(一)相关关系的概念(二)相关关系的特点现象之间的相关关系具有以下几个特点。1.现象之间客观存在着相互依存的数量关系2.具有相关关系的两个变量之间的关系是对等的3.现象之间客观存在的这种数量依存关系不确定、不唯一、不精确二、相关关系的种类(一)按相关关系的密切程度划分,可以分为完全相关、不完全相关和不相关(二)按相关关系的方向来划分,可以分为正相关与负相关(三)按相关关系的表现形式来划分,可以分为线性相关与非线性相关(四)按相关关系影响因素的多少来划分,可以分为单相关与复相关第二节相关分析一、相关表和相关图(一)相关表(二)相关图(一)相关系数的定义二、相关系数(二)相关系数的性质(三)相关密切程度划分的标准(四)相关系数的计算企业编号n产品销售额x/万元销售利润y/万元xyx2y21
26022
5720
67600
4842
31026
8060
96100
6763
3503010500
122500
9004
4203514700
5304021200
28090016006
7206244640
51840038447
8106552650
65610042258
9507571250
902500562591030808240010609006400101100869460012100007396合计6480521405720509140032375从表8-2可知:n=10,6480,521,405720,5091400,32375,将数据代入简捷计算公式得:第三节直线回归分析一、回归分析的含义(一)回归分析的概念(二)回归分析的类型根据不同的标准,对回归分析可以进行不同的分类。1.根据回归分析中变量间的表现形态不同,可分为线性回归(直线回归)分析与非线性回归(曲线回归)分析。2.根据回归分析中自变量数量的多少来分,可分为一元回归分析与多元回归分析。二、简单线性回归方程的建立(一)简单线性回归方程的确立(二)简单线性回归分析的特点(三)简单线性回归的应用序号年广告费用/万元年销售量/万台1101222015330184403055037660407705088061990651010072要求:(1)计算广告费用与销售量之间的相关系数,并说明其相关程度。(2)对广告费用与销售量进行回归分析,确定回归方程,并解释回归系数的经济含义。(3)进行预测,当广告费用达到150万元时,产品销售量可以达到多少万台?解:(1)计算相关系数时不必区分自变量与因变量,而在进行简单线性回归分析时,需要区分自变量与因变量,因此,这里以年广告费用为自变量x,年销售量为因变量y。建立相关系数计算表,如下表8-4所示。序号n年广告费用x/万元年销售量y/万台xyx2y21
10
12
120
100
1442
20
15
300
400
2253
30
18
540
900
3244
40
30
1200
1600
9005
50
37
1850
2500
1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业礼品定制协议
- 自密实水泥购销合同
- 农业机械销售合同范例
- 工程模板安装劳务分包合同
- 经营周转贷款协议
- 百货商品购销合同格式
- 劳动合同保密协议的内涵
- 设备及货物采购合同
- 监控服务合同的权益维护与违约责任
- 棉粕饲料购销合同
- 毛概讨论全面建设小康社会
- 煤矿职工安全生产的权利和义务
- 银行客户经理竞聘演讲课件
- EMS中国邮政速递物流
- 初中九年级音乐课件外婆的澎湖湾
- 道口开设施工方案
- 医疗器械经营客户投诉处理培训
- 备战2024年中考语文复习考点帮(全国通用)考点十三 小说阅读(好题冲关·真题演练)(原卷版)
- 《软件测试黑盒测试》课件
- 招投标过程中的信息安全与保密措施建议
- DB5120-T 19.3-2023 数据资源体系技术指南 第3部分:数据清洗加工规范
评论
0/150
提交评论