版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第1章多元正态分布 1、在数据处理时,为什么通常要进行标准化处理? 数据的标准化是将数据按比例缩放, 使之落入一个小的特定区间。在某些比 较和评价的指标处理中经常会用到, 去除数据的单位限制,将其转化为无量纲的 纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是 0-1标准化和Z标准化。 2、欧氏距离与马氏距离的优缺点是什么? 欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义, 它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就 是两点之间的距离。 缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。每个坐标对欧 氏距离的贡献是同等的。当
2、坐标表示测量值时,它们往往带有大小不等的随机波 动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的 坐标有较小的权系数,这就产生了各种距离。当各个分量为不同性质的量时,“距 离”的大小与指标的单位有关。它将样品的不同属性之间的差别等同看待, 这一 点有时不能满足实际要求。没有考虑到总体变异对距离远近的影响。 马氏距离表示数据的协方差距离。为两个服从同一分布并且其协方差矩阵为 工的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化 为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。 优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位
3、无关。 由标准化数据和中心化数据计算出的二点之间的马氏距离相同。马氏距离还可以 排除变量之间的相关性的干扰。 缺点:夸大了变化微小的变量的作用。 受协方差矩阵不稳定的影响,马氏距 离并不总是能顺利计算出。 3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计 距离是否一致? 统计距离区别于欧式距离,此距离要依赖样本的方差和协方差, 能够体现各 变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的 单位无关。如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵,则 马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。 4、如果正态随机向量
4、X (XnX2丄Xp)的协方差阵 为对角阵,证明X的分量 是相互独立的随机变量。 解:因为X (X1,X2,L Xp)的密度函数为 f (X1,.,Xp) p 1 1/2 1 1 2工 exp -(x卩)工(x 山 又由于艺 12 Il 1 2 1 1 2 2 1 2 p 则 f (Xi,,Xp) 1 2 1 1 F iL i 1匚2一旳 则其分量是相互独立。 1/2 exp 1(X 1 2 2 (xm) 1 exp 1(X1 2 1)2 2 1 1(X2 2 3)2 1 (Xp 2 p)2 2 p f(Xi).f (Xp) 5. y1和y2是相互独立的随机变量,且y1N(0,1), y2 N
5、 (3,4)。 (a) 求y;的分布。 y y的分 (b) 如果yy1,写出yy关于y1与y的表达式,并写出 (yi 3) / 2 布。 (c) 如果y yi且yN (,),写出y 1 y关于yi与y的表达式,并 y2 1 写出yy的分布。 解:(a)由于yiN (0,1),所以yi(1) 0 (b)由于 yi N (0,1) , y2 N (3,4); 所以勺卫N (0,1); 故yy y:(y2 2 3)2,且 yy (2) 第2章 均值向量和协方差阵的检验 1、略 2、试谈Wilks统计量在多元方差分析中的重要意义。 答:威尔克斯统计量在梦元方差分析中是用于检验均值的统计量, 矢 至少存
6、在心丿使円工円 |f| 用佩熱比原贝1崗咸豹检验统计量沟A = H = i LI人(f 一否则回4; j 1,2,., m)都是均值为0,方差为1的变量,因此a0同时也是Xj 与 Fj 的相关系数。 (2)记g2a: a: . a:(j 1,2,.,m),则g2表示的是公共因子Fj对于X的 每一分量Xj(i 1,2,., p)所提供的方差的总和,称为公共因子Fj对原始变量X的 方贡献,它是衡量公共因子相对重要性的指标。g2越大,表明公共因子Fj对Xj 的贡献越大,或者说对 X的影响作用就越大。如果因子载荷矩阵对A的所有的 g2(j 1,2,.,m)都计算出来,并按大小排序,就可以依此提炼出最有
7、影响的公共 因子。 3、略 第 7 章 对应分析 1、试述对应分析的思想方法及特点。 思想:对应分析又称为相应分析,也称 R Q分析。是因子分子基础发展起来的 一种多元统计分析方法。 它主要通过分析定性变量构成的列联表来揭示变量之间 的关系。当我们对同一观测数据施加 R和Q型因子分析,并分别保留两个公共因 子,则是对应分析的初步。 对应分析的基本思想是将一个联列表的行和列中各 元素的比例结构以点的形式在较低维的空间中表示出来。 它最大特点是能把众多 的样品和众多的变量同时作到同一张图解上, 将样品的大类及其属性在图上直观 而又明了地表示出来, 具有直观性。 另外,它还省去了因子选择和因子轴旋转
8、等 复杂的数学运算及中间过程, 可以从因子载荷图上对样品进行直观的分类, 而且 能够指示分类的主要参数(主因子)以及分类的依据,是一种直观、简单、方便 的多元统计方法。 特点:对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的 形式在较低维的空间中表示出来。它最大特点是能把众多的样品和众多的变量同 时作到同一张图解上,将样品的大类及其属性在图上直观而又明了地表示出来, 具有直观性。另外,它还省去了因子选择和因子轴旋转等复杂的数学运算及中间 过程,可以从因子载荷图上对样品进行直观的分类,而且能够指示分类的主要参 数(主因子)以及分类的依据,是一种直观、简单、方便的多元统计方法。 2
9、、试述对应分析中总惯量的意义。 总惯量不仅反映了行剖面集定义的各点与其重心加权距离的总和,同时与x2 统计量仅相差一个常数,而x2统计量反映了列联表横联与纵联的相关关系,因此 总惯量也反映了两个属性变量各状态之间的相关关系。对应分析就是在对总惯量 信息损失最小的前提下,简化数据结构以反映两属性变量之间的相关关系。 3、略 第8章典型相关分析 1、试述典型相关分析的统计思想及该方法在研究实际问题中的作用。 答:典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用 于揭示两组变 量之间的内在联系。典型相关分析的目的是识别并量化两组变 量之间的联系。将两组变量相 关关系的分析转化为一组变量的
10、线性组合与另 一组变量线性组合之间的相关关系。 基本思想: (1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的 相关系数。即:X (X1,X2,, , x p)、x (X1,X2, , , Xq)是两组 相互关联的随机变量,分别在两组变量中选取若干有代表性的综合变量 U、Vi, 使是原变量的线性组合。 UO|Xi a? X 2 ap X p = aX Vb1Y1b2 Y2. bq Yq 三 b Y 在Qa X )D(b X) 1的条件下,使得 (a X , b X )达到最大。 (2) 选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相 关系数最大的一对。 (
11、3) 如此继续下去,直到两组变量之间的相关性被提取完毕为此。 其作用为: 进行两组变量之间的相关性分析,用典型相关系数衡量两组变量之间的相关性。 2、简述典型相关分析中冗余分析的内容及作用。 答:典型型冗余分析的作用即分析每组变量提取出的典型变量所能解释的该组 样本总方差的比例,从而定量测度典型变量所包含的原始信息量。 第一组变量样本的总方差为tr(R11 ) p,第二组变量样本的总方差为 tr (R22 ) q。 * * A?z和Bz是样本典型相关系数矩阵,典型系数向量是矩阵的行向量, U; a?*zz,乂 B;z 前r对典型变量对样本总方差的贡献为 力优)铲+鈔铲+iii+鉀鈔)二工食轨
12、tZi tZi k 1 r 力曲砂+型型+111+EV) 丈忌” r-l 41 1 则第一组样本方差由前r个典型变量解释的比例为: 第二组样本方差由前r个典型变量解释的比例为: 3、典型变量的解释有什么具体方法?实际意义是什么? 答:主要使用三种方法:(1)典型权重(标准相关系数):传统的解释典型函数 的方法包括观察每个原始变量在它的典型变量中的典型权重, 即标准化相关系数 (Standardized Canonical Coefficients )的符号和大小。有较大的典型权重, 则说明原始变量对它的典型变量的贡献较大,反之则相反。原始变量的典型权重 有相反的符号说明变量之间存在一种反面关系,反之则有正面关系。但是这种解 释遭到了很多批评。这些问题说明在解释典型相关的时候应慎用典型权重。 (2)典型载荷(结构系数):由于典型载荷逐步成为解释典型相关分析结果的基 础。典型载荷分析,即典型结构分析(Canonical Structure Analyse),是原始 变量(自变量或者因变量)与它的典型变量间的简单线性相关系数。 典型载荷反 映原始变量与典型变量的共同方差,它的解释类似于因子载荷,就是每个原始变 量对典型函数的相对贡献。 (
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44903-2024温室气体产品碳足迹量化方法与要求畜产品
- 商铺合同模板集合
- 二零二四年度高速公路声屏障施工合同3篇
- 空白劳动合同范本2篇
- 2024年度电力工程质量问题处理与维修合同2篇
- 动物皮肤病课件
- 化工原理自测题:第二章(自)
- 2024年度企业改制与重组合同4篇
- 中医科推拿护理小讲课
- 员工创新管理分析报告
- FAB-常用词汇介绍
- 放射防护管理机构(组织构成、管理部门、人员、职责)
- 2023-2024年司考刑法真题(含答案及解析)
- 上肢血管超声检查
- pep人教版英语四年级上册 Unit 6《Meet my family!》单元作业设计
- 高寒地区陆上大型风力发电机组安装工法文本
- ISTA-6-AMAZON-亚马逊测试标准(快递包裹运输)
- 施工方案abcd类分类
- 职业病危害告知书
- 情绪管理学习通超星课后章节答案期末考试题库2023年
- 科教版高中信息技术必修1第一单元初识数据与计算1.2数据的计算公开课一等奖课件省赛课获奖课件
评论
0/150
提交评论