多元统计分析-1_第1页
多元统计分析-1_第2页
多元统计分析-1_第3页
多元统计分析-1_第4页
多元统计分析-1_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1多元统计分析大连海事大学林国顺博士lgsbox@189.cnTel133422970182009年9月2课程计划课程名称 多元统计分析(研究生)

学期 2009-2010(一)管理科学与工程学科 教师:林国顺教学时数:24学时实验学时:12学时周四1-4节文科楼126

3课程大纲周次讲课课时3第1章序论

24-5第2章多元正态分布

46第3章多元正态分布假设检验

47第4章多元数据图表示法

28第5章聚类分析

29第6章判别分析

210第7章主成分分析

211第8章对应分析

212第9章因子分析213第10章典型相关分析214第11章多元线性回归24课程意义多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。利用多元分析中不同的方法还可以对研究对象进行分类(如指标分类或样品分类)和简化(如把相互依赖的变量变成独立的或降低复杂集合的维数等)。在当前科技和经济迅速发展的今天,在国民经济许多领域中特别对社会经济现象的分析,只停留在定性分析上往往是不够的。为提高科学性、可靠性,通常需要定性与定量分析相结合。实践证明,多元分析是实现定量分析的有效工具。

5第一章绪论

(2学时)1.1什么是多元统计分析

1.2多元分析能解决哪些类型的实际问题

6在工业、农业、医学、气象、环境以及经济、管理等诸多领域中,常常需要同时观测多个指标。例如,要衡量一个地区的经济发展,需观测的指标有:总产值、利润、效益、劳动生产率、万元生产值能耗、固定资产、流动资金周转率、物价、信贷、税收等;要了解一种岩石,需观测或化验的指标也很多,如:颜色、硬度、含碳量、含硫量等等;1.1什么是多元统计分析7要了解一个国家经济发展的类型也需观测很多指标,如:人均国民收入,人均工农业产值、人均消费水平等等。在医学诊断中,要判断某人是有病还是无病,也需要做多项指标的体检,如:血压、心脏脉搏跳动的次数、白血球、体温等等。

随机变量

8总之,在科研、生产和日常生活中,受多种指标共同作用和影响的现象是大量存在的,举不胜举。上述指标,在数学上通常称为变量,由于每次观测的指标值是不能预先确定的,因此每个指标可用随机变量来表示。随机变量9多元正态总体的参数估计和假设检验;主成分分析、因子分析、对应分析;路径分析、多维标度法等。多元数据图表示法、聚类分析、判别分析;本书重点介绍多元分析中常用的各种方法。

多元分析的主要内容

多重多元回归分析、典型相关分析;101928年

Wishart发表论文《多元正态总体样本协差阵的精确分布》,可以说是多元分析的开端。

20世纪30年代

R.A.Fisher、H.Hotelling、S.N.Roy、许宝碌、江泽培、张里千等人作了一系列的奠基性工作,使多元分析在理论上得到了迅速的发展。

我国50-60年代涌现陈家鼎、钱敏、刘婉如等一批知名教授。

返回多元分析起源

11下面例举一些实际问题,从中不仅可以看到多元分析能解决哪些不同类型的问题,而且还可以看到多元分析应用的广度和深度.它将会引起学习者们的浓厚兴趣。

1.2多元分析解决的实际问题

12对我国30个省市自治区的社会情况进行分析,一般不是逐个省市自治区去分析,而较好地做法是选取能反映社会情况的代表性指标,如:人口密度、城市和农村的平均每人每月收入和支出情况、居住面积、城市绿化覆盖率等等。根据这些指标对30个省市自治区进行分类,然后根据分类结果对社会情况进行综合评价。经济学

13如要考察北京、天津等几所大城市的企业情况,首先要选取企业方面有代表性指标,如:企业个数、工业总产值、平均人数、固定资产净值、资金利税率、资金利润率、全员劳动生产率等等。由于要考察的指标多,通常先对指标进行分类,按分类结果对指标进行综合分析给出企业的评价。如何分类?可用

Q型或R型聚类分析法。

聚类分析14可根据人均国民收入、人均工农业产值、人均消费水平等多种指标判定一个国家的经济发展程度所属的类型。又如在市场预测中如何根据以往调查所得的种种指标判别下季度产品是畅销、平常或滞销,可用判别分析法。

判别分析法15

如何研究国民收入变量(工农业国民收入、运输业国民收入、建筑业国民收入等)与投资性变量(劳动者人数、货物周转量、生产建设投资等)之间的相关关系。典型相关分析法如何研究全国所有制独立核算工业企业的经济效益指标与其资金、利税等主要财务指标之间的关系,可用典型相关分析法。16概率基本概念1.随机事件

2.随机变量

3.概率4.独立

5.分布函数6.分布密度7.均值8.方差概率统计基本概念离散型随机变量(1).

两点分布(2).

二项分布(3)

Poisson分布(4).

几何分布连续型随机变量(1).

均匀分布(2).

正态分布(3)

指数分布(4).

Χ2分布

(5).t分布

(6).

F分布统计基本概念1.总体2.样本

3.统计量

4.估计量5.无偏估计6.矩母函数7.大数定律8.中心极限定理17测试1(10题)答题格式:概率统计基础知识测试姓名:专业班级:学号:测试日期:年

日星期四得分:12345678910答案测试10题,每题正确得1分,每错1题扣1分18测试1--1(1分钟)1在概率论中,随机试验应满足下列个条件()A允许在相同的条件下重复地进行B不允许在相同的条件下重复地进行C试验之前不知道会出现哪种现象

D每次试验结果不一定相同2若X的分布律为:P(X=1)=PP(X=0)=1-P(0<P<1)则称X服从()。A两点分布B0—1分布C二项分布DPoisson分布19测试1--2(1分钟)3分布函数F(x)具有下列性质():A0≤F(x)≤1BF(x)是X的减函数CD4设连续型随机变量(X1,X2)有联合分布函数F(X1,X2),X1

与X2相互独立,则有()AF(X1,X2)=Bf(X1,X2)=CF(X1,X2)=Df(X1,X2)=20测试1-3(1分钟)5设X是一个随机变量,k为常数,均值具有下列性质()AE(kX)=kE(X)BE(X+Y)=EX+EYCE(XY)=E(X)·E(Y)DE(X-Y)=EX-EY6如果X1,X2,…,Xn,…是独立同分布的随机变量,E

X1=μ,若成立,则称随机变量列{Xn}满足()A大数定律B弱大数定律C强大数定律D中心极限定理21测试1--4(1分钟)7统计量是随机变量。(T/F)

8估计量是统计量,是随机变量。(T/F)

9随机样本是统计量。(T/F)

10统计样本是实验观测值,不是随机变量。(T/F)

22测试1参考答案12345678910答案23多元正态分布在多元统计分析中所占的重要地位,如同一元统计分析中一元正态分布所占的重要地位一样,多元统计分析中的许多重要理论和方法都是直接或间接建立在正态分布的基础上,多元正态分布是多元统计分析的基础。此外,在使用中遇到的随机向量常常是服从正态分布或近似正态分布。因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。第二章.多元正态分布

(孟佳佳,周黎)242.1基本概念

随机变量

总体

样本

随机向量的分布函数

独立

随机向量的均值

随机向量的协差阵

25随机变量对许多社会经济现象进行认识和研究时,往往涉及多个随机变量。一般说来,这些随机变量之间又有某种联系,因而需要把这些随机变量作为一个整体(即向量)来研究。将p个随机变量X1,X2,…,Xp的整体称为p维随机变量,记为X=(X1,X2,…,Xp)。

26将所研究的对象称为总体,它是由许多(有限或无限)的个体构成的集合,如果构成总体的个体是具有p个需要观测指标的个体,我们称这样的总体为p维总体(或p元总体)。由于从p维总体中随机抽取一个个体,其p个指标观测值是不能事先精确知道的,他依赖于被抽到的个体,因此p维总体可用一个p维随机向量来表示.这种表示便于人们用数学方法去研究p维总体的特性.这里”维”(或”元”)的概念,表示共有几个分量.

总体27设X是具有分布函数F的随机向量,若X1,X2,…Xp是具有同一分布函数F的、互相独立的随机变量,则称X1,X2,…Xp为从分布函数F得到的容量为p的随机样本,简称样本。样本

28定义设X=(X1,X2,…Xp)T是p维随机向量,它的多元分布函数定义为:

F(x)=F(X1,X2,…Xp)=P(X1≤x1,X2≤x2,…Xp≤xp)记为X~F(x),其中x=(x1,x2,…xp)T∈Rp,Rp表示p维欧氏空间。

多维随机向量的统计特性可用它的分布函数来完整的描述。随机向量的分布函数

29设X=(X1,X2,…Xp)T是p维随机向量,若存在有限个或可列个p维数向量x1,x2,…,记P(X=Xk)=pk(k=1,2,…)且满足p1+p2+…=1则称X为离散型随机向量,称P(X=Xk)=pk(k=1,2,…)为X的概率分布。离散型随机向量概率分布30若存在一个非负函数f(x1,x2,…xp),使得F(x)=F(X1,X2,…Xp)=对一切x∈Rp,则称X为连续型随机变量;f(x1,x2,…xp)为分布密度函数,简称为密度函数。随机向量分布密度函数

31一个p元函数f(x1,x2,…,xp)能作为Rp中某个随机向量的密度函数的主要条件是:f(x1,x2,…,xp)≥0,(x1,x2,…,xp)´∈Rp;密度函数的条件32设AB是两事件,如果具有等式P(AB)=P(A)P(B)则称AB为相互独立的事件。随机变量的独立性:X,Y是2个随机变量,如果AB是任意两个事件,有P(X∈A,Y∈B)=P(X∈A)P(Y∈B)则称X,Y相互独立。独立的概念33X,Y相互独立的主要判定条件:f(X,Y)=f(X)×f(Y)X,Y相互独立的判定F(X,Y)=F(X)×F(Y)34设X=(X1,X2,…Xp)′,若EXi(i=1,…,p)存在且有限,则称E(X)=(EX1,EX2,…EXp)′为X的均值或数学期望。容易推得均值具有以下性质:(1)E(AX+d)=AE(X)+dE(XB)=E(X)B(2)E(AXB)=AE(X)BE(AXB)=AE(XB)=AE(X)B(3)E(AX+BY)=AE(X)+BE(Y)随机向量的均值

其中X、Y为随机变量,A、B为大小适合运算得常数矩阵。35DX=E(X-EX)(X-EX)T=(σij)p×p称为随机向量X的方差阵。其中σij

=E(Xi-EXi)(Xj-EXj)

Cov(X,Y)=E(X-EX)(Y-EY)T称为随机向量X、Y的协差阵。随机向量的协差阵

其实,我们可以看出DX=

Cov(X,X)36若Cov(X,Y)=0,则称X和Y不相关;由X和Y相互独立易推得别Cov(X,Y)=0即X和Y不相关;随机向量的相关性

但反过来,当X和Y不相关时,一般不能推知它们独立。37容易推得协差阵有以下性质:(1)D(X)≥0,即X的协差阵是非负定阵。特征值≥0(2)对于常数向量a,有D(X+a)=D(X)。(3)设A为常数矩阵,则D(AX)=AD(X)A´。(4)Cov(AX,BY)=ACov(X,Y)B´。协差阵性质其中a,A,B为大小适合运算的常数向量和矩阵38若p维随机向量X=(X1,X2,…Xp)′的密度函数为:其中X=(X1,X2,…Xp)′,μ是p维向量,Σ是p阶正定阵,则称X服从p元正态分布,也称X为p维正态随机向量,简记为,显然当p=1时,即为一元正态分布密度函数。

§2.2

基本性质

可以证明µ为X的均值,Σ为X的协差阵。

39当|Σ|=0时,Σ-1不存在;X也就不存在通常意义下的密度;|Σ|=0这也是如今人们不大采用密度函数来定义多元正态分布的原因。40X=(X1,X2,……,XP)~N(μ,Σ)(1)如果Σ是对角矩阵,则X1,X2,……,XP

相互独立(2)Y=AX+d~N(Aμ+d,AΣAT)多元正态分布性质

(3)Y1=(X1,X2,……,Xr),Y2=(Xr+1,Xr+2,……,XP),X=(Y1,Y2)~N(μ,Σ)则Y1~N(μ(1),Σ(1)),Y2~N(μ(2),Σ(2))41(1)多元正态分布的任何边缘分布为正态分布,但反之不真;(2)由于Σ12=Cov(X(1),X(2)),故Σ12=0表示X(1),X(2)不相关;对于多元正态变量而言,不相关与独立是等价的由此可知,对于多元正态变量而言,X(1),X(2)的不相关与独立是等价的。4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论