




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多元统计分析总结计划要点多元统计分析总结计划要点多元统计分析总结计划要点多元分析要点宿舍版第一:多元方法及用;多元方法分(按量、模型、因量等)多元分析用:数据或构性化运用的方法有:多元回分析,聚分析,主成分分析,因子分析分和合运用的方法有:判分析,聚分析,主成分分析量之的有关关系运用的方法有:多元回,主成分分析,因子分析,与决议运用的方法有:多元回,判分析,聚分析因果模型(因量数):多元回,判分析横数据:相依模型(量度):因子分析,聚分析多元分析方法:多元方法的分:1)按量数据的根源分:横数据(同一不同样事例的数据),数据(同事例在不同样的多次数据)2)按量的度等(数据型)分:(非量型)量,数
2、型(量型)量3)按分析模型的属性分:因果模型,相依模型4)按模型中因量的数目分:因量模型,多因量模型,多因果模型第二:算均、差、有关;互相独立性第三:主成分定、用及基本思想,主成分性,主成分分析步主成分定:何主成分分析就是将本来的多个指(量)性合成几个新的互相没关的合指(主成分),并使新的合指尽可能多地反应本来的指信息。主成分分析的用:(1)数据的、构的化;(2)品的合价,排序主成分分析概括思想:(1)把定的一量X1,X2,XP,通性,一不有关的量Y1,Y2,YP。(2)在种中,保持量的方差(X1,X2,Xp的方差之和)不,同,使Y1拥有最大方差,称第一主成分;Y2具有次大方差,称第二主成分。
3、挨次推,本来有P个量,就能够出P个主成分(3)在用中,了化,平常找能反应本来P个量的大多数方差的q(qp)个主成分。主成分性质:1)性质1:主成分的协方差矩阵是对角阵:(2)性质2:主成分的总方差等于原始变量的总方差(3)性质3:主成分Yk与原始变量Xi的有关系数为:(YK,Xi)=kiitki,并称之为因子负荷量(或因子载荷量)。主成分分析的详细步骤:将原始数据标准化;成立变量的有关系数阵;求的*特点根为L1*p0,相应的特点向量为T1,T2,L,Tp;由积累方差贡献率确*定主成分的个数(m),并写出主成分为Yi(Ti)X,i1,2,L,m第四讲:因子分析定义,因子载荷统计意义,因子分析模型
4、及假定,因子旋转因子分析定义:因子分析就是经过对多个变量的有关系数矩阵的研究,找出同时影响或支配所有变量的共性因子的多元统计方法。因子载荷统计意义:1因子载荷aij的统计意义关于因子模型Xiai1F1ai2F2LaijFjLaimFmii1,2,L,p我们能够获得,Xi与Fj的协方差为:mCov(Xi,Fj)Cov(aikFki,Fj)k1mCov(aikFk,Fj)Cov(k1aij假如对Xi作了标准化办理,rXi,FjCov(Xi,Fj)D(Xi)D(Fj)i,Fj)Xi的标准差为1,且Fj的标准差为1,所以Cov(Xi,Fj)aij(7.6)那么,从上边的分析,我们知道关于标准化后的Xi
5、,aij是Xi与Fj的有关系数,它一方面表示Xi对Fj的依靠程度,绝对值越大,亲密程度越高;另一方面也反应了变量Xi对公共因子Fj的相对重要性。认识这一点对我们理解抽象的因子含义有非常重要的作用。2变量共同度hi2的统计意义设因子载荷矩阵为A,称第i行元素的平方和,即mhi2aij2i1,2,L,pj1(7.7)为变量Xi的共同度。由因子模型,知D(Xi)ai21D(F1)ai22D(F2)Laim2D(Fm)D(i)ai21ai22Laim2D(i)22hii(7.8)这里应当注意,(7.8)式说明变量Xi的方差由两部分构成:第一部分为共同度hi2,它描绘了所有公共因子对变量Xi的总方差所作
6、的贡献,反应了公共因子对变量Xi的影响程度。第二部分为特别因子i对变量Xi的方差的贡献,平常称为个性方差。假如对Xi作了标准化办理,有1hi2i2(7.9)3、公因子Fj的方差贡献g2j的统计意义设因子载荷矩阵为A,称第j列元素的平方和,即pg2jaij2j1,2,L,mi1为公共因子Fj对X的贡献,即g2j表示同一公共因子Fj对各变量所供给的方差贡献之总和,它是权衡每一个公共因子相对重要性的一个尺度。因子分析模型及假数学模型:每一个量都能够表示成公共因子的性函数与特别因子之和,即:Xi=ai1*F1+a12*F2+aim*Fm+i(i=1,2,p)式中的F1,F2,Fm称公共因子,i称Xi的
7、特别因子。模型可用矩表示:X=AF+,且足:(1)mp(2)Cov(F,)=0,即公共因子与特别因子是不有关的;(3)DF=D(F)=21,0,0.01,0,0.020,1,0.00,2,0.0.0,0,0.20,0,0.1=Im,即各个公共因子不有关且方差1;(4)D=D()=p,即各个特别因子不有关,方差不要求相等。因子旋因子旋的目的:初始因子的合性太,以找出因子的意,所以需要通坐旋,使因子荷两极分化,要么凑近于0,要么凑近于?1,进而降低因子的合性,使其意凸出来,以便于解因子。因子旋的基本方法:一是正交旋(保持因子的正交性,差旋),一是斜交旋(因子不用然正交)3种,常用最大方公共因子提取
8、个数:(1)特点大于等于求响的准化正交特点向量来算因子荷那些因子(3)累方差献率大于85%1的因子(主成分)作初始因子,通(2)碎石:去特点平的第五:聚型,系聚、K-均聚思想及步,系聚方法,相像性度方法聚型:依据分的象可将聚分析分:系Q型与R型(即品聚与量聚)系聚、K-均聚思想及步:系聚的基本思想:距离周边的本(或量)先聚成,距离相的后聚成,程向来行下去,每个品(或量)能聚到适合的中。聚程及步:假共有n个品(或量),第一步将每个品(或量)单独聚成一,共有n;第二步依据所确立的品(或量)“距离”公式,把距离近的两个品(或量)聚合一,其余的品(或量)仍各自聚一,共聚成n-1;第三步将“距离”近来的
9、两个一步聚成一,共聚成n-2;,以上步向来行下去,最后将所有的品(或量)全聚成一。最后能够画系分析。迅速聚的基本思想,步:(也称K-均法,逐渐聚,迭代聚),基本思想是将每一个品分派近来中心(均)的中,详细的算法步以下:(1)将所有的品分红K个初始;(2)通欧氏距离将某个品划入离中心近来的中,并得品与失掉品的,从头算重心坐。(3)重复步2,直到所有的品都不可以够再分派止。系聚方法:最短距离法(接),最距离法(完满接),中距离法,均匀法(均匀接法),可均匀法,重心法,可法,离差平方和法相像性度方法:不同样真相似性胸怀:距离度里包含:明氏,氏,和式不同样量相像度的胸怀:包含:角余弦,有关系数。第六:
10、判分析及各判方法思想,判分析假条件,距离判与叶斯判关系判分析定:一种行判和分的技手段。它能够就必然数目事例的一个重量和相的其余多元量的已知信息,确立分与其余多元量之的数量关系,成立判函数(discriminantFunction)。此后便能够利用一数目关系其余已知多元量信息、但未知分型所属的事例行判分。各判方法思想:距离判:求新品X到G1的距离与到G2的距离之差,假如其正,X属于G21;否X属于GBayes判:因为k个体G1,G2,Gk出的先概率分q1,q2,qk,用R来行判所造成的均匀失kkkg(R)qir(i,R)qiC(j|i)P(j|i,R)i1i1j1(4.12)所Bayes判法,就
11、是要R1,R2,Rk,使得(4.12)式表示的均匀失g(R)达到极小。Fisher判的基本思想和步:从K个体中抽取拥有p个指的品数据,借助方差分析的思想结构一个性判函数:U(X)=1X12X2.pXpX,此中系数=(1,2,,p)确立的原是使得体之区最大,而使每个体内部的离差最小。有了性判函数后,于一个新的品,将它的p个指代入性判函数式中求出U(X),此后依据判必然的,就能够判新的品属于哪个体。判分析假条件:判分析的假之一,是每一个判量(解量)不可以够是其余判量的性合。即不存在多重共性。判分析的假之二,是各量的方差矩相等。判分析最和最常用的形式是采纳性判函数,它是判量的性合。在各方差矩相等的假
12、条件下,能够使用很的公式来算判函数和行著性。判分析的假之三,是各判量之拥有多元正散布,即每个量于所有其余量的固定有正散布。在种条件下能够精准算著性和分属的概率。当背假,算的概率将特别不正确。距离判与叶斯判关系:XG1,假如W(X)0距离判中两个体的距离判:G2,W(X),而X假如0 xG1,当V(x)d叶斯鉴别规则为:,两者独一差异仅在于阀值点,从某种xG2,当V(x)d意义上讲,距离鉴别是贝叶斯判其余特别情况。题型及分数:一、判断对错并更正(4题,8分)二、不定项选择(10题,20分)三、简答题(4题,32分)(六选四)主成分基本思想,系统聚类,K-均值聚类基本思想及过程,鉴别分析及费希尔基
13、本思想,比较聚类与回归、鉴别,因子分析及因子旋转聚类与回归、鉴别:鉴别与回归:联系:都是依据已有数据鉴别将来趋向。差异:多元回归的因变量是数值型变量,且自变量但是0-1变量;鉴别分析的因变量是种种类变量,而自变量不是0-1变量鉴别与聚类:聚类分析:种类未知,利用样本确立分组数及所属种类;鉴别分析:种类数及意义已知,还可以够“展望”新样本所属种类;聚类中加进一个变量需要对类进行更新,从头计算与其余类的距离,而鉴别对新样本进行鉴别后,不更新所属的类。四、计算题(1题,10分)计算样本均值、协差阵、有关阵五、分析题(2题,30分)(四选二)1)主成分分析的SPSS实例分析(主成分个数确立,主成分表达
14、式,主成分分析步骤)2)因子分析的SPSS实例分析(因子分析模型,公因子的解说命名分析)(二选一)3)聚类分析的SPSS实例分析(分类数确立,聚类结果命名分析,优弊端及改良策略)分类数确立树状图,确立原则是组内距离小,组间距离大。聚合系数图:在曲线开始变得缓和的点选择适合的分类树任何类都必然在周边各种中是突出的,即各种重心间的距离必然大各种所包含的元素都不要过分地多分类数目应符合使用的目的若采纳几种不同样的聚类法,则在各自的聚类图上应发现同样的类对聚类过程中聚合系数分类数的变化(曲线)进行分析,能够协助确立合理的分类数聚类分析的弊端层次聚类法的结果简单受奇怪值的影响,而迅速聚类法受奇怪值、相像测度和不适合的聚类变量的影响较小。层次聚类法能够获得一系列的聚类数,而迅速聚类只好获得指定类数的聚类数。层次聚类法在数据比好多时计算量比较大,需要占有特别大的计算机内存空间,而迅速聚类法计算量较小。层次聚类法是单向的,样本点一旦进入某类就不可以够
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025在线咨询服务合同
- 2025年上海市农产品买卖合同范本
- 2025法律顾问审核版工程活动隔断合同
- 发电机租赁合同
- 上海市买卖合同范本
- 彩钢围挡制作安装合同范本
- 劳动合同法(本科)形考任务1-4
- 2025授权产品合同模板版本
- 产品授权经营协议书
- 2025年03月咸阳事业单位研究生公开招聘(90人)笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 游艇理论训练考试题库600题(单选、判断题)
- 不同时滞可燃物含水率预测模型精度的研究
- 本科大学生劳动教育理论与实践教程第二章 教学课件
- 空运提单格式
- 商务楼写字楼商业楼宇租赁技巧培训
- 空气自动监测站运维技术服务合同模版
- (完整)康复医学考试题(含答案)
- 个 人 简 历 及 亲 属 关 系 表
- 自密实混凝土课件(PPT 72页)
- 旅游投资简要概述PPT通用课件
- 空气轴承技术培训教程
评论
0/150
提交评论