数学建模主成分分析_第1页
数学建模主成分分析_第2页
数学建模主成分分析_第3页
数学建模主成分分析_第4页
数学建模主成分分析_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模主成分分析第一页,共六十六页,编辑于2023年,星期六常见相关模型及其

建模方法2.专题求解模型1.发散思维模型第二页,共六十六页,编辑于2023年,星期六近几年赛题为例2009年A题制动器试验台的控制方法分析

B题眼科病床的合理安排

2010年A题储油罐的变位识别与罐容表标定

B题上海世博会影响力的定量评估

2011年A题城市表层土壤重金属污染分析

B题交巡警服务平台的设置与调度2012年A题葡萄酒的评价

B题太阳能小屋的设计

近几年全国数学建模竞赛题2023/5/31第三页,共六十六页,编辑于2023年,星期六2010年B题上海世博会影响力的定量评估

2009年B题眼科病床的合理安排

2011年A题城市表层土壤重金属污染分析2012年A题葡萄酒的评价

均可归属为-

基于数据分析的综合评价模型2023/5/31第四页,共六十六页,编辑于2023年,星期六两类模型常用建模方法综合评价法测试分析法专题建模法信息合理运用法2023/5/31第五页,共六十六页,编辑于2023年,星期六综合评价基本方法简易的方法有:常用的方法有:2023/5/31第六页,共六十六页,编辑于2023年,星期六测试分析法回归分析曲线拟合计算机模拟与仿真2023/5/31第七页,共六十六页,编辑于2023年,星期六专题建模法数学规划(线性规划与非线性规划)概率论与数理统计图论微分方程各学科实际问题2023/5/31第八页,共六十六页,编辑于2023年,星期六信息合理运用法将与问题相关的论文合理运用将其他问题的论文合理运用07年选区的重新划分与统计物理2023/5/31第九页,共六十六页,编辑于2023年,星期六

主成份分析法第十页,共六十六页,编辑于2023年,星期六问题实际背景,在众多评价问题中,人们往往会对评价样品收集尽可能多的指标,例如人口普查往往要调查每个人的姓名、年龄、性别、文化程度、住房、职业、收入、消费等几十项指标;再如,2012年葡萄评价有24指标。从收集资料的角度来看,收集较多的数据有利于完整反映样品的特征,但是这些指标从统计角度来看相互之间具有一定的依赖关系,从而使所观测的数据在反映信息上有一定重叠,同时又使得问题变得复杂。2023/5/31第十一页,共六十六页,编辑于2023年,星期六思考:如何减少变量,但信息量保留得较多。由此产生了主成分分析法。

主成分分析也称主分量分析(principalcomponentsanalysis,PCA)是由美国的科学家哈罗德·霍特林(Haroldotelling)于1933年首先提出的。

2023/5/31第十二页,共六十六页,编辑于2023年,星期六解决的问题之一:降维2023/5/31第十三页,共六十六页,编辑于2023年,星期六解决的问题之二:几何分析2023/5/31第十四页,共六十六页,编辑于2023年,星期六

解决的问题之三:客观加权2023/5/31第十五页,共六十六页,编辑于2023年,星期六

主成分分析的基本思想2023/5/31第十六页,共六十六页,编辑于2023年,星期六一、降维的两个准则准则1:信息量损失尽可能少。准则2:新主成分之间相关性低、重叠少。2023/5/31第十七页,共六十六页,编辑于2023年,星期六二、明确信息量的数学意义

我们知道,当一个变量所取数据相近时,这个变量(数据)提供的信息量较为单一,当这个变量取数据差异较大时,说明它对各种场景的“遍历性”越强,提供的信息就更加充分,从数学角度来论,变量的标准差或方差越大,变量涵盖的信息越足。2023/5/31第十八页,共六十六页,编辑于2023年,星期六三、明确重叠少数学意义

我们知道,当一个变量与有关联时难免表达信息有重复,没关联反映在数学上最好是两变量独立,而这一要求过强,较难满足,这里我们就要求新主成分之间无线性关系就好,反映在概率理论上就是每两个主成分之间的协方差为“0”或相关系数为“0”。2023/5/31第十九页,共六十六页,编辑于2023年,星期六建立选取主成分分析模型2023/5/31第二十页,共六十六页,编辑于2023年,星期六引例:假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,假设共有n个样品,每个样品都测量了两个指标(X1,X2),在坐标系中,观察散点的分布,2023/5/31第二十一页,共六十六页,编辑于2023年,星期六引例:单独看这n个点的分量

,它们沿着

方向和

方向都具有相近的离散性,如果仅考虑其中的任何一个分量,那么包含在另一分量中的信息将会损失,因此,直接舍弃某个分量不是“确定主成分”的有效办法。2023/5/31第二十二页,共六十六页,编辑于2023年,星期六结论:为第一主成分,为第二主成分。换个角度观察

事实上,散点的分布总有可能沿着某一个方向略显扩张,这里沿椭圆的长轴方向数据变化跨度就明显大于椭圆的短轴方向。2023/5/31第二十三页,共六十六页,编辑于2023年,星期六结论:为第一主成分,为第二主成分。换个角度观察

结论:长轴方向变量为第一主成分;短轴方向变量为第二主成分。2023/5/31第二十四页,共六十六页,编辑于2023年,星期六结论:为第一主成分,为第二主成分。当新旧变量间夹角为时,由坐标变换公式可得主成分获得的数学模型2023/5/31第二十五页,共六十六页,编辑于2023年,星期六确定主成分的数学模型:2023/5/31第二十六页,共六十六页,编辑于2023年,星期六推广一般主成分确定的模型或其中T是正交矩阵2023/5/31第二十七页,共六十六页,编辑于2023年,星期六主成分满足的约束要求:①Y的各分量是不相关的;②并且Y的第一个分量的方差是最大的;第二个分量的方差次之,……,等等。③为了保持信息不丢失,Y的各分量方差和与X的各分量方差和相等。2023/5/31第二十八页,共六十六页,编辑于2023年,星期六主成分的方差及它们的协方差其中表示方差,Cov表示协方差,这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用其中表示方差,Cov表示协方差,这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用其中表示方差,Cov表示协方差,这里X是多维随机向量,D(X)则表述的是X的协方差阵,一般用2023/5/31第二十九页,共六十六页,编辑于2023年,星期六所以协方差矩阵是对称矩阵,且为非负定的!复习:关于随机向量的协方差矩阵的协方差矩阵为的协方差矩阵为2023/5/31第三十页,共六十六页,编辑于2023年,星期六第一主成分求法Y1的方差2023/5/31第三十一页,共六十六页,编辑于2023年,星期六第二主成分及第k主成分满足条件考虑到Y2=t21x1+t22x2+t23x3+...

+tp1xp

=

T'2X

,及我们的准则考虑到Y2=t21x1+t22x2+t23x3+...

+tp1xp

=

T'2X

,及我们的准则2023/5/31第三十二页,共六十六页,编辑于2023年,星期六第二主成分及第k主成分求法表明是∑的特征值,T'2为特征向量גּ2023/5/31第三十三页,共六十六页,编辑于2023年,星期六第主成分求法2023/5/31第三十四页,共六十六页,编辑于2023年,星期六结论:思考:总信息量不变吗?2023/5/31第三十五页,共六十六页,编辑于2023年,星期六主成分保持信息总量不少2023/5/31第三十六页,共六十六页,编辑于2023年,星期六主成分个数确定的标准2023/5/31第三十七页,共六十六页,编辑于2023年,星期六主成分个数确定的标准2023/5/31第三十八页,共六十六页,编辑于2023年,星期六

主成分分析的步骤2023/5/31第三十九页,共六十六页,编辑于2023年,星期六1.构造样本阵样本阵,其中是样本容量即评价对象,是评价指标个数,是第个样本中采集的第项评价指标值。

2023/5/31第四十页,共六十六页,编辑于2023年,星期六2.指标标准化

为克服单位差异对评价结果的影响,须将指标标准化

其中,

2023/5/31第四十一页,共六十六页,编辑于2023年,星期六3.协方差矩阵(也是样本阵的相关系数阵?)可证,由标准化后得到的矩阵,而2023/5/31第四十二页,共六十六页,编辑于2023年,星期六4.确定主成分2023/5/31第四十三页,共六十六页,编辑于2023年,星期六5.构造综合评价函数

1.求的权值公式:2.构造综合评价函数:这里我们应该注意,从本质上说综合评价函数是对原始指标的线性综合,从计算主成分到对之加权,经过两次线性运算后得到综合评价函数。

2023/5/31第四十四页,共六十六页,编辑于2023年,星期六啤酒风味评价实例分析2023/5/31第四十五页,共六十六页,编辑于2023年,星期六题目:啤酒是个多指标风味食品,为了全面了解啤酒的风味,啤酒企业开发了大量的检测方法用于分析啤酒的指标,但是面对大量的指标数据,大多数企业又感到茫然,不知道如何利用这些大量的数据,来对各品牌的啤酒加以评价,由上面的介绍可知,在这种情况下,主成分分析法较为适合。2023/5/31第四十六页,共六十六页,编辑于2023年,星期六1.样本阵(1)确定原始评价指标:即未经简化的指标6个,选有:乙醛、乙酸乙酯、异丁酯、乙酸异戊酯、异戊醇及己酸乙酯(m=6)(2)确定评价对象:即定抽样,本题选有:百威啤酒、喜力啤酒和青岛啤酒,南方某种啤酒(n=4)2023/5/31第四十七页,共六十六页,编辑于2023年,星期六(3)构造样本阵:本题样本阵

乙醛

乙酸乙酯

异丁酯乙酸异戊酯

异戊醇己酸乙酯

百威啤酒1.22.33.10.72.14.5

喜力啤酒2.13.25.16.47.61.3

青岛啤酒1.10.62.13.11.93

南方某品牌2.31.54.13.2132023/5/31第四十八页,共六十六页,编辑于2023年,星期六2.构造标准化阵Z

指标规范化为克服单位差异对评价结果的响,须将样本阵元素规范化,得标准化矩阵Z其中2023/5/31第四十九页,共六十六页,编辑于2023年,星期六可得本题标准化矩阵-1.000280.464991-0.5-1.46277-0.45111.5302351.2537311.6842111.4166671.9104482.4126980.440678-1.21086-1.51122-1.5-0.138-0.537020.0493621.316154-0.464990.5-0.0828-0.923670.0493622023/5/31第五十页,共六十六页,编辑于2023年,星期六3.协方差矩阵(相关系数阵的实对称)

2023/5/31第五十一页,共六十六页,编辑于2023年,星期六本题相关系数阵

乙醛乙酸乙酯异丁酯乙酸异戊酯

异戊醇己酸乙酯乙醛1乙酸乙酯0.4210551异丁酯0.8633970.8137331乙酸异戊酯0.6056130.4222220.6844671异戊醇0.3193610.7840870.6873860.8058141己酸乙酯-0.59667-0.36954-0.65158-0.99835-0.7753212023/5/31第五十二页,共六十六页,编辑于2023年,星期六4.确定主成分(1)解样本相关系数矩阵R的特征方程

得6个特征根,

(2)确定主成分个数

k

:并由大到小排列:

使信息的利用率达85%以上,本题k=2,累计贡献率d=45.1%+38.2%=83.3%2023/5/31第五十三页,共六十六页,编辑于2023年,星期六

5.构造2个主成份:

对每个λj,j=1,2解得单位特征向量

则第j个主成份2023/5/31第五十四页,共六十六页,编辑于2023年,星期六6.构造综合评价价值函数:

(1)首先构造权向量:其中

2023/5/31第五十五页,共六十六页,编辑于2023年,星期六(2)构造价值函数:2023/5/31第五十六页,共六十六页,编辑于2023年,星期六本题结果:综合结论:由好到差排序喜力啤酒

百威啤酒

青岛啤酒南方某种啤酒2023/5/31第五十七页,共六十六页,编辑于2023年,星期六主成分的方差协方差矩阵的对角线元素正交矩阵T中对应的第k行第i列元素模型解释-主成分因子载荷量:随机向量X的方差协方差阵对的第k个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论