版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析方差分析相关与回归分析目录页方差分析主成分分析相关与回归分析方差分析的应用条件(1)独立,各组数据相互独立,互不相关(2)正态,即各组数据符合正态分布(3)方差齐性,即各组方差相等
统计学上的因素是指研究者所关心的实验条件,而水平是指因素的具体表现形式。如,温度(30、60、90)℃、药物种类(A、B、C)和产地(山东、安徽、江苏)。温度、药物种类和产地就是因素,而每个因素里具体的不同形式就称为水平单因素方差分析例:一共有4种不同的饲料喂猪,共有19头猪分为4组,每组一种饲料,一段时间后称重。比较4种饲料对猪的体重影响是否显著不同。饲料的类型增加的体重单击“两两比较”主成分分析
是考察多个变量间相关性的一种多元统计方法,其主要目的是用较少的变量去解释原始数据中的大部分变异。它通常用来寻找判断某种事物或现象的综合指标,并且给综合指标所包含的信息以适当的解释,从而更好的揭示事物内在的规律。但在实际的应用当中,主成分分析只是一种达到目的的中间手段,而不是最终目的,而要结合其他的统计方法来处理问题。2023/2/416第二章主成分分析
主成分分析(principalcomponentsanalysis)。主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率。2023/2/417主成分分析的基本思想
既然研究某一问题涉及的众多变量之间有一定的相关性,就必然存在着起支配作用的共同因素,根据这一点,通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成分分析得到的主成分与原始变量之间有如下基本关系:1.每一个主成分都是各原始变量的线性组合;2.主成分的数目大大少于原始变量的数目2023/2/418
目录上页下页返回结束
3.主成分保留了原始变量绝大多数信息4.各主成分之间互不相关
通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次的启发,把研究工作引向深入。主成分分析的任务1计算主成分首先将原有的变量标准化,然后计算各变量之间的相关矩阵、该矩阵的特征根和特征向量,最后将特征根由大到小排列,分别计算出对应的主成分。2确定主成分个数(1)累计贡献率:当前k个主成分的累计贡献率达到某一特定值(一般采用70%以上)时,则保留前k个主成分。(2)特征根:一般选取特征根≥1的主成分。
表示主成分影响力度大小的指标,即引入该主成分后可以解释平均多少原始变量的信息,如果特征根小于1,说明该主成分的解释程度还不如直接引入一个原始变量的平均解释程度大。
表示前k个主成分累计提取了原始变量多少的信息。2023/2/420注意的问题1.首先应当认识到主成分分析方法适用于变量之间存在较强相关性的数据,如果原始数据相关性较弱,运用主成分分析后不能起到很好的降维作用,即所得的各个主成分浓缩原始变量信息的能力差别不大。一般认为当原始数据大部分变量的相关系数都小于0.3时,运用主成分分析不会取得很好的效果。2.主成分分析不能有效地剔除重叠信息,但它至少可以发现原始变量是否存在着重叠信息,这对我们减少分析中的失误是有帮助的。2023/2/421主成分分析步骤1.根据研究问题选取初始分析变量;2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;3.求协差阵或相关阵的特征根与相应标准特征向量;4.判断是否存在明显的多重共线性,若存在,则回到第一步;5.得到主成分的表达式并确定主成分个数,选取主成分;6.结合主成分对研究问题进行分析并深入研究。例:1980年某汽车制造商从竞争对手中选择了17种车型,访问了25名顾客,要求他们根据自己的偏好对这17种车型打分,打分范围0-9.9分。如下表:点击“继续”,回到主页点击”确定“
相关关系的常见类型:线性相关:正线性相关、负线性相关非线性相关相关关系不象函数关系那样直接,但却普遍存在,且有强有弱.如何测度?相关分析和回归分析的任务研究对象:相关关系相关分析旨在测度变量间线性关系的强弱程度.回归分析侧重考察变量之间的数量变化规律,并通过一定的数学表达式来描述这种关系,进而确定一个或几个变量的变化对另一个变量的影响程度.回归分析基本步骤(1)确定自变量和因变量(2)从样本数据出发确定变量之间的数学关系式,并对回归方程的各个参数进行估计.(3)对回归方程进行各种统计检验.(4)利用回归方程进行预测.相关分析(一)目的通过样本数据,研究两变量间线性相关程度的强弱.(例如:投资与收入之间的关系、GDP与通信需求之间的数量关系)(二)基本方法绘制散点图、计算相关系数绘制散点图基本操作步骤(1)菜单选项:graphs->scatter(2)选择散点图类型:(3)选择x轴和y轴的变量(4)选择分组变量(setmarkersby):分别以不同颜色点的表示(5)选择标记变量(labelcaseby):散点图上可带有标记变量的值(如:省份名称)计算相关系数(1)作用:以精确的相关系数(r)体现两个变量间的线性关系程度.r:[-1,+1];r=1:完全正相关;r=-1:完全负相关;r=0:无线性相关;|r|>0.8:强相关;|r|<0.3:弱相关(2)说明:相关系数只是较好地度量两变量间的线性相关程度,不能描述非线性关系.基本操作步骤(1)菜单选项:analyze->correlate->bivariate...(2)选择计算相关系数的变量到variables框.(3)选择相关系数(correlationcoefficients).(4)显著性检验(testofsignificance)tow-tailed:输出双尾概率P.one-tailed:输出单尾概率P(一)一元回归方程:
y=β0+β1xβ0为常数项;β1为y对x回归系数,即:x每变动一个单位所引起的y的平均变动(二)一元回归分析的步骤利用样本数据建立回归方程回归方程的拟和优度检验回归方程的显著性检验(t检验和F检验)残差分析预测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 卷1-备战2022年中考生物【名校地市好题必刷】全真模拟卷(全国2024)·第一辑(解析版)
- 安全教育:打雷下雨时怎办
- 金融员工法律知识
- 气体钢瓶安全操作规程
- 家庭住宅木地板安装合同
- 学区房二手房买卖合同模板
- 建筑设计退休设计师聘用协议
- 水电站后勤保障合同
- 美食广场餐饮服务人员培训计划
- 钢筋施工拓展协议
- 高中地理知识体系的建构
- 高压真空断路器及成套设备型式试验的项目参数及试验方法
- 连接器领域:立讯精密企业组织架构及部门职责
- 汉语拼音书写纸(打印版).
- 手铐使用技术
- 高一物理必修一课程纲要Word版
- 设备单机试运转记录
- 人教版小学数学三年级下册《年 月 日》的认识-文档资料
- 全风险全流程外包概述
- 培养研究生的一点经验和体会.PPT
- 变电站电气工程质量监理旁站点及旁站监理记录
评论
0/150
提交评论