数学建模主成分分析详解演示文稿课件_第1页
数学建模主成分分析详解演示文稿课件_第2页
数学建模主成分分析详解演示文稿课件_第3页
数学建模主成分分析详解演示文稿课件_第4页
数学建模主成分分析详解演示文稿课件_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学建模主成分分析详解演示文稿2022/8/7优选数学建模主成分分析2022/8/7 近几年赛题 为例2009年A题 制动器试验台的控制方法分析 B题 眼科病床的合理安排 2010年A题 储油罐的变位识别与罐容表标定 B题 上海世博会影响力的定量评估 2011年A题 城市表层土壤重金属污染分析 B题 交巡警服务平台的设置与调度2012年A题 葡萄酒的评价 B题 太阳能小屋的设计 近几年全国数学建模竞赛题2022/8/72010年B题 上海世博会影响力的 定量评估 2009年B题 眼科病床的合理安排 2011年A题 城市表层土壤重金属 污染分析2012年A题 葡萄酒的评价 均可归属为- 基于数据

2、分析的综合评价模型2022/8/7两类模型常用建模方法综合评价法测试分析法专题建模法信息合理运用法2022/8/7综合评价基本方法简易的方法有:常用的方法有:2022/8/7测试分析法回归分析曲线拟合计算机模拟与仿真2022/8/7专题建模法数学规划(线性规划与非线性规划)概率论与数理统计图论微分方程各学科实际问题2022/8/7信息合理运用法将与问题相关的论文合理运用将其他问题的论文合理运用07年选区的重新划分与统计物理2022/8/7 主成份分析法2022/8/7问题实际背景,在众多评价问题中,人们往往会对评价样品收集尽可能多的指标,例如人口普查往往要调查每个人的姓名、年龄、性别、文化程度

3、、住房、职业、收入、消费等几十项指标;再如,2012年葡萄评价有24指标。从收集资料的角度来看,收集较多的数据有利于完整反映样品的特征,但是这些指标从统计角度来看相互之间具有一定的依赖关系,从而使所观测的数据在反映信息上有一定重叠,同时又使得问题变得复杂。2022/8/7思考:如何减少变量,但信息量保留得较多。由此产生了主成分分析法。 主成分分析也称主分量分析(principal components analysis,PCA)是由美国的科学家哈罗德霍特林(Harold otelling)于1933年首先提出的。 2022/8/7解决的问题之一:降维2022/8/7解决的问题之二:几何分析20

4、22/8/7 解决的问题之三:客观加权2022/8/7 主成分分析的基本思想 2022/8/7一、降维的两个准则准则1:信息量损失尽可能少。准则2:新主成分之间相关性低、重叠少。2022/8/7二、明确信息量的数学意义 我们知道,当一个变量所取数据相近时,这个变量(数据)提供的信息量较为单一,当这个变量取数据差异较大时,说明它对各种场景的“遍历性”越强,提供的信息就更加充分,从数学角度来论,变量的标准差或方差越大,变量涵盖的信息越足。2022/8/7三、明确重叠少数学意义 我们知道,当一个变量与有关联时难免表达信息有重复,没关联反映在数学上最好是两变量独立,而这一要求过强,较难满足,这里我们就

5、要求新主成分之间无线性关系就好,反映在概率理论上就是每两个主成分之间的协方差为“0”或相关系数为“0” 。2022/8/7建立选取主成分分析模型2022/8/7引例:假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系 中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系 中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系 中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系 中,观察散点的分布,2022/8/7引例:单独看这n个点的分量 ,它们沿着 方向和 方向都具有相近的离

6、散性,如果仅考虑其中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃某个分量不是“确定主成分”的有效办法。2022/8/7结论: 为第一主成分, 为第二主成分。换个角度观察 事实上,散点的分布总有可能沿着某一个方向略显扩张,这里沿椭圆的长轴方向数据变化跨度就明显大于椭圆的短轴方向。2022/8/7结论: 为第一主成分, 为第二主成分。换个角度观察 结论:长轴方向变量为第一主成分;短轴方向变量为第二主成分。2022/8/7结论: 为第一主成分, 为第二主成分。 当 新旧变量间夹角为 时,由坐标变换公式可得主成分获得的数学模型2022/8/7确定主成分的数学模型:2022/8/7

7、推广一般主成分确定的模型或其中T是正交矩阵2022/8/7主成分满足的约束要求:Y的各分量是不相关的;并且Y的第一个分量的方差是最大的;第二个分量的方差次之,等等。为了保持信息不丢失,Y的各分量方差和与X的各分量方差和相等。2022/8/7 主成分的方差及它们的协方差其中 表示方差,Cov表示协方差, 这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用其中 表示方差,Cov表示协方差, 这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用其中 表示方差,Cov表示协方差, 这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用2022/8/7所以协方差矩阵是对称矩阵,且

8、为非负定的!复习:关于随机向量的协方差矩阵的协方差矩阵为的协方差矩阵为2022/8/7第一主成分求法Y1的方差2022/8/7第二主成分及第k主成分满足条件考虑到Y2 =t21x1+t22x2 + t23x3 +. +tp1xp = T2X ,及我们的准则 考虑到Y2 =t21x1+t22x2 + t23x3 +. +tp1xp = T2X ,及我们的准则 2022/8/7第二主成分及第k主成分求法表明 是的特征值,T2为特征向量2022/8/7第 主成分求法2022/8/7结论:思考:总信息量不变吗?2022/8/7主成分保持信息总量不少2022/8/7主成分个数确定的标准2022/8/7主

9、成分个数确定的标准2022/8/7 主成分分析的步骤 2022/8/71.构造样本阵样本阵 , 其中 是样本容量即评价对象, 是评价指标个数, 是第 个样本中采集的第 项评价指标值。 2022/8/72.指标标准化 为克服单位差异对评价结果的影响,须将指标标准化 其中, 2022/8/73.协方差矩阵(也是样本阵的相关系数阵?)可证,由标准化后得到的矩阵 ,而2022/8/74.确定主成分2022/8/75.构造综合评价函数 1.求 的权值公式:2.构造综合评价函数:这里我们应该注意,从本质上说综合评价函数是对原始指标的线性综合,从计算主成分到对之加权,经过两次线性运算后得到综合评价函数。 2

10、022/8/7啤酒风味评价实例分析2022/8/7题目:啤酒是个多指标风味食品, 为了全面了解啤酒的风味, 啤酒企业开发了大量的检测方法用于分析啤酒的指标, 但是面对大量的指标数据, 大多数企业又感到茫然,不知道如何利用这些大量的数据, 来对各品牌的啤酒加以评价,由上面的介绍可知,在这种情况下,主成分分析法较为适合。 2022/8/71.样本阵(1)确定原始评价指标:即未经简化的指标6个,选有:乙醛、乙酸乙酯、异丁酯、乙酸异戊酯、异戊醇及己酸乙酯 (m=6)(2)确定评价对象:即定抽样,本题选有:百威啤酒、喜力啤酒和青岛啤酒 ,南方某种啤酒(n=4)2022/8/7(3)构造样本阵: 本题 样

11、本阵 乙醛 乙酸乙酯 异丁酯乙酸异戊酯 异戊醇己酸乙酯 百威啤酒1.22.33.10.72.14.5 喜力啤酒2.13.25.16.47.61.3 青岛啤酒1.10.62.13.11.93 南方某品牌2.31.54.13.2132022/8/72.构造标准化阵Z 指标规范化 为克服单位差异对评价结果的响,须将样本阵元素规范化,得标准化矩阵Z其中2022/8/7可得本题标准化矩阵-1.000280.464991-0.5-1.46277-0.45111.5302351.2537311.6842111.4166671.9104482.4126980.440678-1.21086-1.51122-1.

12、5-0.138-0.537020.0493621.316154-0.464990.5-0.0828-0.923670.0493622022/8/73.协方差矩阵(相关系数阵的实对称) 2022/8/7本题相关系数阵乙醛乙酸乙酯异丁酯乙酸异戊酯 异戊醇己酸乙酯乙醛1乙酸乙酯0.4210551异丁酯0.8633970.8137331乙酸异戊酯0.6056130.4222220.6844671异戊醇0.3193610.7840870.6873860.8058141己酸乙酯-0.59667-0.36954-0.65158-0.99835-0.7753212022/8/74.确定主成分(1)解样本相关系数矩阵R 的特征方程 得6个特征根, (2)确定主成分个数 k :并由大到小排列:使信息的利用率达85%以上,本题k=2,累计贡献率d=45.1%+38.2%=83.3%2022/8/7 5.构造2个主成份 : 对每个j, j=1,2 解得单位特征向量 则第j个主成份2022/8/76.构造综合评价价值函数: (1)首先构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论