多元统计分析详解演示文稿_第1页
多元统计分析详解演示文稿_第2页
多元统计分析详解演示文稿_第3页
多元统计分析详解演示文稿_第4页
多元统计分析详解演示文稿_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析详解演示文稿1当前1页,总共39页。(优选)多元统计分析2当前2页,总共39页。多元统计分析所研究的内容和方法概括为:(1)简化数据结构(降维问题):如主成份分析,因子分析等;(2)分类与判别(归类问题):如聚类分析,判别分析等;(3)变量间的相互联系:相关分析,回归分析等;(4)统计推断:参数估计,假设检验等;(5)多元统计分析的理论基础:多元统计量及其分布和性质,抽样分布理论等;第十一章多元统计分析当前3页,总共39页。多元统计分析的应用:(1)教育学;(2)医学,医生对病人的诊断是靠对病人观察若干症状后来综合判定的;事先有一批经专家确诊或经病理化验确诊的病理材料,利用多元统计方法可以建立诊断的准则(即专家系统),对来诊的病人,观测若干指标后,根据诊断准则,即可作出诊断。(3)气象学:气象预报,各种气象指标的分析等;(4)环境科学;(5)地质学;(6)考古学;(7)服装工业:服装的定型分类问题;(8)经济学;(9)农业;(10)社会科学;(11)文学:文学词汇的研究,在《红楼梦》的著作权的研究中,使用较多的方法是聚类分析,主成分分析,典型相关分析等,得出前80回和后40回截然分为两类,证实了前80回和后40回的作者之不同。(12)其它:体育科研,军事科学,生物学,心里学,保险科学,地震预报,火灾预警等等。第十一章多元统计分析当前4页,总共39页。§2.多元随机变量一、随机向量的联合分布,边缘分布,条件分布第十一章多元统计分析当前5页,总共39页。第十一章多元统计分析当前6页,总共39页。第十一章多元统计分析当前7页,总共39页。第十一章多元统计分析当前8页,总共39页。二、数字特征第十一章多元统计分析当前9页,总共39页。第十一章多元统计分析当前10页,总共39页。§3.判别分析的介绍根据观察到的数据来对要研究的对象(样本)进行判别分类;如在气象学中,根据已有的气象资料(气温、气压、湿度等)来判断明天是阴天还是晴天,是有雨还是无雨;在经济学中,可根据各国的人均国民收入、人均工农业产值和人均消费水平等判定一个国家经济发展程度放入所属类型;

在医学中,经常要根据患者的不同症状和化验结果等多项指标类诊断其患病类型;

判别分析是应用性很强的统计分析方法。第十一章多元统计分析当前11页,总共39页。一般的判别分析描述为:设有k个m维总体G1,G2,…Gk,其分布已知,即已知分布函数分别为F1(x),F2(x),…Fn(x),

或知道来自各个总体的训练样本。对给定的新样本X,要判断它属于哪个总体。在进行判别归类时,由假设的前提,判别的依据及处理的手法不同,可得出不同的判别方法。如距离判别,贝叶斯(Bayes)判别,费希尔(Fisher)判别,逐步判别,序贯判别等。第十一章多元统计分析当前12页,总共39页。§3.距离判别

距离判别的基本思想:样本与哪个总体的距离最近就判断它属于哪个总体。一、马氏距离第十一章多元统计分析当前13页,总共39页。第十一章多元统计分析当前14页,总共39页。第十一章多元统计分析当前15页,总共39页。第十一章多元统计分析当前16页,总共39页。第十一章多元统计分析当前17页,总共39页。第十一章多元统计分析当前18页,总共39页。第十一章多元统计分析当前19页,总共39页。第十一章多元统计分析当前20页,总共39页。第十一章多元统计分析当前21页,总共39页。第十一章多元统计分析当前22页,总共39页。第十一章多元统计分析当前23页,总共39页。第十一章多元统计分析当前24页,总共39页。例.(盐泉含钾性判别)某地区经勘探证明,A盆地是一个钾盐矿区,B盆地是一个钠盐矿区,其它盐盆地是否含钾盐有待判断。今从A,B两盆地各抽取5个盐泉样品,从其它盆地抽取8个盐泉样品,对其它盆地的8个盐泉样品进行含钾性判别。第十一章多元统计分析类

型序号x1x2x3x4含

钾113.852.797.849.6222.314.6712.3147.8328.824.6316.1862.15415.293.547.543.2528.794.916.1258.1含

钠62.181.061.2220.673.850.84.0647.1811.403.5093.662.422.1415.11012.105.680待

判18.853.385.1726.1228.62.41.2127320.76.77.630.247.92.44.333.253.193.21.439.9612.45.14.4324.6716.83.42.3131.38152.75.0264当前25页,总共39页。第十一章多元统计分析当前26页,总共39页。第十一章多元统计分析当前27页,总共39页。第十一章多元统计分析当前28页,总共39页。第十一章多元统计分析当前29页,总共39页。第十一章多元统计分析当前30页,总共39页。§4.聚类分析介绍

俗话说:“物以类聚、人以群分”,在现实世界中存在着大量的分类问题。判别分析和聚类分析都是研究事物分类的基本方法,它们有着不同的分类目的,彼此之间既有联系又有区别。各种判别分析方法都要求有已知的分类,据此得出判别函数或规则,进而对新的样本的归类进行判断。而聚类分析的目的是把研究对象按一定规则分成若干类。这些类不是事先给定的,而是根据数据的特征确定的。第十一章多元统计分析当前31页,总共39页。一、聚类方法

(1)系统聚类法:开始每个对象自成一类,然后每次将最相似的两类合并,合并后重新计算新类与其它类的距离或相近性测度,这一过程一直继续直到所有对象归为一类为止,并类的过程可用一张谱系聚类图描述。(2)动态聚类法:首先对n个对象初步分类;然后根据分类的损失函数尽可能小的原则进行调整,直到分类合理为止。(3)最优分割法:开始将所有样本看成一类,然后根据某种最优准则将它们分割为二类、三类,直到所需的k类为止。(4)模糊聚类法;(5)图论聚类法;(6)聚类预报法;等等第十一章多元统计分析当前32页,总共39页。聚类分析根据分类对象的不同又分为R型和Q型两大类,R型是对变量(指标)进行分类,Q型是对样本进行分类。

Q型聚类分析的目的主要是对样品进行分类,分类的结果是直观的,且比传统分类方法更细致、全面、合理。当然使用不同的分类方法通常会得到不同的分类结果。对任何观测数据都没有唯一“正确的”的分类方法。实际应用中,常采取不同的分类方法,对数据进行分析计算,以便对分类提供具体意见,并由实际工作者决定所需要的分类数及分类情况。本节简单介绍在实际问题中应用最广泛的系统聚类法,且主要讨论Q型聚类分析问题。第十一章多元统计分析当前33页,总共39页。二、变量的类型及数据的变换根据变量取值的不同,可分为两大类:定量变量和定性变量。定量变量具有数字特点。而定性变量不具有数量上的变化,而只有性质上的差异,如天气(阴、晴),性别(男、女),职业(工农兵),质量(一二三等)。这类变量又可以分为有序变量和名义变量(无序)。不同类型的变量在定义距离和相似性测度时有很大差异,应先进行适当的数据变换。第十一章多元统计分析当前34页,总共39页。二、变量的类型及数据的变换第十一章多元统计分析均值标准差极差样本变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论