版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多元统计分析第四章第一页,共二十二页,编辑于2023年,星期五本章学习目标领会作多元数据图的思想。会作简单的多元数据图形并且会分析图形。第二页,共二十二页,编辑于2023年,星期五第四章多元数据图表示法
图形有助于我们对所研究数据的直观了解,如果能把一些多元数据直接显示在平面图上,便可以从图形一目了然地看出多元数据之间的关系。当只有一、二维数据时,可以使用通常的直角坐标系在平面上点图;当有三维数据时,也可以使用空间直角坐标系点图,但是已经不方便;当维数大于3时,用通常的方法已不能点图。但是在许多实际问题中,多元数据的维数都大于3。第三页,共二十二页,编辑于2023年,星期五例考察北京、上海、陕西、甘肃四个省市人均生活消费支出情况,选取以下五项指标,具体数据如下表:
肉禽及制品住房医疗保健交通和通讯文娱用品及服务北京563.51227.78147.76235.99510.78上海678.92365.07112.82301.46465.88陕西237.38174.48119.78141.07245.57甘肃253.41156.13102.96108.13212.20第四页,共二十二页,编辑于2023年,星期五
多元数据图表示法的分类:一类是使高维空间的点与平面上的某种图形应,这种图形能反映高维数据的某些特点或数据间的某些关系;另一类是在尽可能多地保留原数据信息的原则下进行降维,若能使数据维数降至2或1维,则可在平面上点图。第二类分类方法可用后面介绍的主成分分析、因子分析等去解决。这一章只对第一类方法介绍四种图表示法,更多的方法可在有关专著中找到。第五页,共二十二页,编辑于2023年,星期五4.1轮廓图
作图步骤为:
(1)作平面坐标系,横坐标取个点表示个变量。
(2)对给定的一次观测值,在个点上的纵坐标(即高度)和它对应的变量取值成正比。
(3)连接个高度的顶点得一折线,则一次观测值的轮廓为一条多角折线形。次观测值可画出条折线,构成轮廓图。第六页,共二十二页,编辑于2023年,星期五
下图画出四条折线为北京、上海、陕西、甘肃五项指标的数据即四个省市五项指标的轮廓。轮廓图第七页,共二十二页,编辑于2023年,星期五由轮廓图可以看出:北京、上海的居民生活消费较高且相似;陕西、甘肃生活消费较低且相似。如果考察的样品较多,画折线时图形中可能出现重复点多,不便于区分哪个样品对应哪条折线,这时最好多用几种颜色或长短虚实等标志画出折线。第八页,共二十二页,编辑于2023年,星期五4.2雷达图
作图步骤:
(1)作一圆,并把圆周分为等分。
(2)连接圆心和各分点,把这条半径依次定义为各变量的坐标轴,并标以适当的刻度。
(3)对给定的一次观测值,把它的个分量值分别点在相应的坐标轴上,然后连接成一个边形,这个边形就是元观测值的图示,次观测值可画出个边形。第九页,共二十二页,编辑于2023年,星期五将上例数据用雷达图表示如下:利用雷达图有助于观测多元数据的某些特点,便于进行分析,例如从上图可以看出北京,上海各项指标都较高,对应着一个面积较大的五边形;而陕西,甘肃各项指标都较低,其图形面积也较小,利用图形和面积大小可对样品进行初始分类,将北京,上海分为一类,陕西,甘肃分为一类。第十页,共二十二页,编辑于2023年,星期五当观测次数较大时,为使图形清晰,每张图可以只画少数几次观测数据,甚至每张图只画一次观测值。为了获得较好的效果,在雷达图中适当分配变量的坐标轴,并选取合适的尺度是十分重要的。
注意:这里坐标轴只有正半轴,因而只能表示非负数据,若有负数据,只能通过合理变换使之非负才行。第十一页,共二十二页,编辑于2023年,星期五4.3调和曲线图
调和曲线图的思想:把高维空间中的一个样品点对应于二维平面上的一条曲线。调和曲线图是D.F.Andrews在1972年提出的三角多项式作图法,所以又称为三角多项式图。第十二页,共二十二页,编辑于2023年,星期五
上例数据北京,上海,陕西,甘肃分别对应的曲线为:第十三页,共二十二页,编辑于2023年,星期五
调和曲线图第十四页,共二十二页,编辑于2023年,星期五
在多项式的图表示中,当各变量的数值太悬殊时,最好先标准化后再作图。调和曲线图对聚类分析很有帮助,如果选择聚类统计量为距离的话,同类的曲线非常靠近拧在一起,不同类的曲线拧成不同的束,非常直观。调和曲线的性质:
(1)保线性关系第十五页,共二十二页,编辑于2023年,星期五
(2)保欧式距离第十六页,共二十二页,编辑于2023年,星期五4.4星座图
思想:将高维空间中的样品点投影到平面上的一个半圆内,用投影点表示样品点。
作图步骤:
第十七页,共二十二页,编辑于2023年,星期五
(3)画出一个半径为1的上半圆及半圆底边的直径。第十八页,共二十二页,编辑于2023年,星期五下面对本章开头所给出的数据,使用相同的权数作星座图。由数据表易知,各指标的最高分,最低分以及它们的级差分别为:第十九页,共二十二页,编辑于2023年,星期五
它们的星座图如下:第二十页,共二十二页,编辑于2023年,星期五在人工画星座图时,可按下面步骤去作:第二十一页,共二十二页,编辑于2023年,星期五有时为了突出星星的位置,也可以不画路径,只画星星,容易想象,如果这次观测数据来自不同的类,且不同类的观测数据所对应的星星分别相对集中地散步在星座图的不同区域,那么星座图可能用于多变量数据的分类。从作图过程可以看出:星星的位置和路径与权数的选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园防骗防拐演练
- 知荣辱课件教学课件
- 食品安全与健康相关
- 退行性脊椎病X线
- 酶促反应原理临床治疗
- DB1304T 488-2024大丽花露地栽培技术规程
- 聪聪课件 教学课件
- 高温烫伤应急预案演练
- 肺全切术后护理查房
- 运动治疗仪器及使用方法
- 汽车租赁项目可行性分析报告
- 6-7高原弥散式氧气机说明书
- 重金属废水采用反渗透技术工艺处理的原理
- 研究生课程《广义函数与Sobolev空间》教学大纲
- 妇幼保健院重点学科带头人选拔与考核激励机制
- 部编教材九年级历史(上)全册教案
- 农业部-世界银行气候智慧型农业项目
- 高中化学基础知识竞赛试题及答案共六套
- 大班科学《我们身体的洞》22张幻灯片
- 唐雎不辱使命课件(共张PPT)
- 武汉理工网络《证券法》试题及其答案
评论
0/150
提交评论