几种统计分析模型介绍_第1页
几种统计分析模型介绍_第2页
几种统计分析模型介绍_第3页
几种统计分析模型介绍_第4页
几种统计分析模型介绍_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

几种统计分析模型介绍第一页,共五十三页,编辑于2023年,星期日张业圳福建师范大学经济学院副教授、博士、财金系副主任主要教学研究方向:数量经济学与金融实证分析联系电话:87369087

Email:zhangyz1971@126.comQQ:107345901地址:福建师范大学经济学院邮编:350108第二页,共五十三页,编辑于2023年,星期日经济统计分析统计学研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。

经济统计分析就是用统计方法来分析经济现象数量特征和经济变量之间的关系。主要的工作有:1)分析经济现象中变量之间相互关系2)经济预测3)政策评价第三页,共五十三页,编辑于2023年,星期日什么是经济统计分析模型模型对现实的描述和模拟。用不同方法对现实进行描述和模拟,就构成不同的模型。语义模型、物理模型、几何模型、数学模型和计算机模拟模型。经济数学模型:用数学方法描述经济活动。采用的数学方法不同,对经济活动提示的程度不同,构成各类不同的经济数学模型。数理经济模型计量经济学模型

第四页,共五十三页,编辑于2023年,星期日本次培训主要模型1、聚类分析2、回归分析3)因子分析和主成分分析4)时间序列分析第五页,共五十三页,编辑于2023年,星期日第一部分:预备知识第六页,共五十三页,编辑于2023年,星期日样本与统计量总体与样本

在数理统计中,把研究对象的全体称为总体(population)或母体,而把组成总体的每个单元称为个体。抽样

要了解总体的分布规律,在统计分析工作中,往往是从总体中抽取一部分个体进行观测,这个过程称为抽样。第七页,共五十三页,编辑于2023年,星期日样本与统计量子样

子样是n个随机变量,抽取之后的观测数据称为样本值或子样观察值。在抽取过程中,每抽取一个个体,就是对总体X进行一次随机试验,每次抽取的n个个体,称为总体X的一个容量为n的样本(sample)或子样;其中样本中所包含的个体数量称为样本容量。第八页,共五十三页,编辑于2023年,星期日随机抽样方法的基本要求独立性——即每次抽样的结果既不影响其余各次抽样的结果,也不受其它各次抽样结果的影响。满足上述两点要求的子样称为简单随机子样.获得简单随机子样的抽样方法叫简单随机抽样.从简单随机子样的含义可知,样本是来自总体、与总体具有相同分布的随机变量.代表性——即子样()的每个分量与总体具有相同的概率分布。第九页,共五十三页,编辑于2023年,星期日简单随机抽样

例如:要通过随机抽样了解一批产品的次品率,如果每次抽取一件产品观测后放回原来的总量中,则这是一个简单随机抽样。但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。

例如:为了分析福建省居民家庭收入状况,对福建省居民家庭收入进行调查。第十页,共五十三页,编辑于2023年,星期日统计量则例如:设是从正态总体中抽取的一个样本,其中为已知参数,为未知参数,是统计量不是统计量

定义设()为总体X的一个样本,为不含任何未知参数的连续函数,则称为样本()的一个统计量。第十一页,共五十三页,编辑于2023年,星期日几个常用的统计量样本均值(samplemean)设是总体的一个样本,样本方差(samplevariance)第十二页,共五十三页,编辑于2023年,星期日样本均方差或标准差它们的观测值用相应的小写字母表示.反映总体X取值的平均,或反映总体X取值的离散程度。几个常用的统计量设是总体的一个样本,第十三页,共五十三页,编辑于2023年,星期日子样的K阶(原点)矩几个常用的统计量设是总体的一个样本,子样的K阶中心矩第十四页,共五十三页,编辑于2023年,星期日它包括两个方面——数据整理计算样本特征数数据的简单处理为了研究随机现象,首要的工作是收集原始数据.一般通过抽样调查或试验得到的数据往往是杂乱无章的,需要通过整理后才能显示出它们的分布状况。数据的简单处理是以一种直观明了方式加工数据。第十五页,共五十三页,编辑于2023年,星期日计算样本特征数:数据的简单处理数据整理:将数据分组计算各组频数作频率分布表作频率直方图(1)反映趋势的特征数样本均值中位数:数据按大小顺序排列后,位置居中的那个数或居中的两个数的平均数。众数:样本中出现最多的那个数。第十六页,共五十三页,编辑于2023年,星期日数据的简单处理(2)反映分散程度的特征数:极差、四分位差极差——样本数据中最大值与最小值之差,四分位数——将样本数据依概率分为四等份的3个数椐,依次称为第一、第二、第三四分位数。第一四分位数Q1:第二四分位数Q2:第三四分位数Q3:第十七页,共五十三页,编辑于2023年,星期日第二部分:参数估计第十八页,共五十三页,编辑于2023年,星期日第一节参数的点估计

一、点估计问题设总体X的分布函数的形式为已知的F(

x,θ

),其中x是自变量,θ为未知参数(它可以是一个数,也可以是一个向量).借助于总体X的一个样本(X

1,X

2,…,X

n),来估计未知参数θ的值的问题,称为参数的点估计问题.点估计的问题就是要构造一个适当的统计量(X1,X2,…,Xn),用样本的一组观察值(x1,x2,…,xn),得到的观察值(x1,x2,…,xn),以此来估计未知参数θ.称统计量(X

1,X

2,…,X

n)为θ的估计量,称(x1,x2,…,xn)为θ的估计值.第十九页,共五十三页,编辑于2023年,星期日二、矩估计法的函数,记作μl=μl()即,l=1,2,…,k.设总体X的分布函数为,其中为k个未知参数.

假设总体X的各阶原点矩存在,则E(Xl)是对于总体X的样本(X1,X2,…,Xn),样本的l阶原点矩为,l=1,

2,…,k.令μl=

Al,l=1,2,…,k,第二十页,共五十三页,编辑于2023年,星期日即从上述方程组中解出,分别记作以此作为未知参数的估计量,称为矩估计量.第二十一页,共五十三页,编辑于2023年,星期日如果样本观察值为(x1,x2,…,xn),则得未知参数的矩估计值为上述估计未知参数的方法就叫做矩估计法.第二十二页,共五十三页,编辑于2023年,星期日解此方程组得到与的矩估计量为令即解

例1设总体X的均值为μ,方差为,且,但μ与均未知,又设总体X的一个样本为(X1,

X2,

,

Xn),求μ与的矩估计量.第二十三页,共五十三页,编辑于2023年,星期日解由例4可得例2某厂生产一批铆钉,现要检验铆钉头部直径,从这批产品中随机抽取12只,测得头部直径(单位:mm)如下:13.30 13.38 13.40 13.43 13.32 13.4813.54 13.31 13.34 13.47 13.44 13.50设铆钉头部直径这一总体X服从正态分布,试求与的矩估计值.注此例说明,无论总体X服从什么分布,样本均值都是总体均值的矩估计量,样本二阶中心矩就是总体方差的矩估计量.第二十四页,共五十三页,编辑于2023年,星期日三、极大似然估计法1.设总体X为离散型随机变量,其分布律为其中θ为未知参数,取值范围为.设X1,X2,,Xn为来自X的样本,则X1,X2,,Xn的联合分布律为.又设x1,x2,,xn为一组样本值,令

称L(θ)为样本的似然函数.(1)若有,使得对一切,有成立,则称为θ的极大(或最大)似然估计值,相应的统计量称为θ的极大(或最大)似然估计量.第二十五页,共五十三页,编辑于2023年,星期日我们规定,使得的就是θ的极大似然估计值.由于lnx是单增函数,所以

与有相同的驻点,因此只需从

中解出就是θ的极大似然估计值,称方程(2)(2)为极大似然方程.第二十六页,共五十三页,编辑于2023年,星期日

例3设总体,与未知,(X1,X2,…,Xn)为总体X的样本,求与的极大似然估计量.解

X的概率密度为设x1,x2,…,xn为样本值,似然函数为第二十七页,共五十三页,编辑于2023年,星期日令解得与的极大似然估计值为因此,与的极大似然估计量为第二十八页,共五十三页,编辑于2023年,星期日四、估计量的评选标准1.无偏性估计量是样本的函数,它是一个随机变量,由不同的方法得到的估计量可能相同也可能不同.而对同一估计量,由不同的样本观察值得到参数的估计值也可能不同.我们很自然地要求估计量的期望等于参数的真值,即无偏性.定义设是未知参数θ的估计量,若,则称为θ的无偏估计(量).第二十九页,共五十三页,编辑于2023年,星期日例4设总体X的均值为,(X1,X2,X3)是总体X的样本,证明下列两个估计量都是的无偏估计.

证由于所以与都是的无编估计.(只需k1+

k2++

kn

=1,则=k1X1+

k2X2++

knXn就是的无偏估计)第三十页,共五十三页,编辑于2023年,星期日设为参数θ的估计量,若当时,按概率收敛于θ,即对于任意正数ε,有,则称为θ的一致估计(量).3.一致性根据大数定律可知,样本均值是总体均值的一致估计量.设与是参数θ的两个无偏估计量,若,则称比有效.2.有效性第三十一页,共五十三页,编辑于2023年,星期日第二节参数的区间估计点估计是通过构造统计量(X1,X2,…,

Xn)来对总体X中的未知参数θ进行估计,由一个样本值(x1,x2,…,

xn)可得到θ的估计值(x1,x2,…,

xn).这种估计值是无法知道误差的.我们要定出一个范围,并要求以一定的概率保证这个范围包含着θ的真值.这个范围通常以区间的形式给出,我们把这个区间称为置信区间.定义设总体X的分布中含有一个未知参数θ,(X1,X2,…,

Xn)是来自总体X的一个样本.如果对于给定的常数,统计量θ1=θ1(X1,X2,…,

Xn)与θ2=θ2(X1,X2,…,

Xn)满足(1)则称随机区间(θ1,θ2)是θ的置信度为的置信区间,分别称θ1与θ2为θ的置信下限与置信上限.第三十二页,共五十三页,编辑于2023年,星期日

例1设总体,为已知,未知,(X1,X2,…,Xn)为来自总体X的一个样本,求的置信度为的置信区间.解由于是的无偏估计,且有由正态分布表可查得,使1-称为置信度或置信水平.(1)式的含义是,随机区间(θ1,θ2)以的概率包含着θ,也就是说,对每一个样本值(x1,x2,…,

xn)可求得一个具体的区间(θ1(x1,x2,…,

xn),θ2(x1,x2,…,

xn)).在这些众多的区间中,包含θ的有100()%个,不包含θ的有100%个.第三十三页,共五十三页,编辑于2023年,星期日即有取,于是得到的置信度为的置信区间为第三十四页,共五十三页,编辑于2023年,星期日求未知参数θ的置信区间的一般方法:1°对于给定的样本X1,X2,…,Xn,构造样本函数,它包含待估参数θ,而不含其它未知参数,并且Z的分布已知,在Z的分布中不依赖任何未知参数.2°对于给定的置信度,定出两个常数a,b(一般地,按Z所服从的分布的上分位点来确定),使

3°从a<Z(X1,X2,…,Xn)<b得到等价的不等式θ1(X1,X2,…,Xn)<θ<θ2(X1,X2,…,Xn),其中θ1=θ1(X1,X2,…,Xn)与θ2=θ2(X1,X2,…,Xn)都是统计量,于是得到θ的一个置信度为的置信区间(θ1,θ2).第三十五页,共五十三页,编辑于2023年,星期日第三部分:假设检验第三十六页,共五十三页,编辑于2023年,星期日假设检验是进行统计推断的另一种方法,问题的一般提法是对总体未知参数或总体的分布形式作一假设,利用样本提供的信息来检验这一假设是否成立,这一方法具有很重要的实际意义,因而也是数理统计的重要内容之一.第三十七页,共五十三页,编辑于2023年,星期日第一节假设检验的基本概念假设检验是指施加于一个或多个总体的概率分布或参数的假设.所作的假设可以是正确的,也可以是错误的.为判断所作的假设是否正确,从总体中抽取样本,根据样本的取值,按一定的原则进行检验,然后,作出接受或拒绝所作假设的决定.何为假设检验?第三十八页,共五十三页,编辑于2023年,星期日假设检验所以可行,其理论背景为实际推断原理,即“小概率原理”.假设检验的内容参数检验非参数检验总体均值、均值差的检验总体方差、方差比的检验分布拟合检验符号检验秩和检验假设检验的理论依据第三十九页,共五十三页,编辑于2023年,星期日

引例1某产品的出厂检验规定:次品率p不超过4%才能出厂.现从一万件产品中任意抽查12件发现3件次品,问该批产品能否出厂?若抽查结果发现1件次品,问能否出厂?件,没理由拒绝原假设,从而接受原假设,即该批产品可以出厂.解假设这是小概率事件,一般在一次试验中是不会发生的,现一次试验竟然发生,故可认为原假设不成立,即该批产品次品率这不是小概率事,则该批产品不能出厂.第四十页,共五十三页,编辑于2023年,星期日若不采用假设检验,按理也不能够出厂.注

直接算对总体要求利用样本观察值对提供的信息作出接受H0

(可出厂),还是接受H1

(不准出厂)的判断.上述出厂检验问题的数学模型提出假设第四十一页,共五十三页,编辑于2023年,星期日

引例2

某厂生产的螺钉,按标准强度为68克/mm2,而实际生产的螺钉强度X服从N(,3.62).若E(X)==68,则认为这批螺钉符合要求,否则认为不符合要求.为此提出如下假设:H0:=68H1:

68现从该厂生产的螺钉中抽取容量为36的样本,其样本均值为,问原假设是否正确?称为原假设或零假设.原假设的对立面:称为备择假设.第四十二页,共五十三页,编辑于2023年,星期日若原假设正确,则故取较大值是小概率事件.因而,即偏离68不应该太远,偏离较远是小概率事件,由于第四十三页,共五十三页,编辑于2023年,星期日规定为小概率事件的概率大小,通常取=0.05,0.01,…例如,取=0.05,则因此,可以确定一个常数c,使得由第四十四页,共五十三页,编辑于2023年,星期日的取值区间(66.824,69.18)为检验的接受域

(实际上没理由拒绝),而区间现落入接受域,则接受原假设H0:=68.为检验的拒绝域.称(,66.824)与(69.18,+)由引例2可见,在给定的前提下,接受还是拒绝原假设完全取决于样本值,因此所作检验可能导致以下两类错误的产生:

第一类错误弃真错误第二类错误取伪错误第四十五页,共五十三页,编辑于2023年,星期日H0

为真H0

为假真实情况所作判断接受H0拒绝H0正确正确第一类错误(弃真)第二类错误(取伪)假设检验的两类错误犯第一类错误的概率通常记为;犯第二类错误的概率通常记为.第四十六页,共五十三页,编辑于2023年,星期日希望所用的检验方法尽量少犯错误,但不能完全排除犯错误的可能性.理想的检验方法应使

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论