主成分分析与主成分回归_第1页
主成分分析与主成分回归_第2页
主成分分析与主成分回归_第3页
主成分分析与主成分回归_第4页
主成分分析与主成分回归_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主成分分析与主成分回归第1页,课件共48页,创作于2023年2月1.Introduction1.1Chemometrics1.2

NecessaryKnowledge第2页,课件共48页,创作于2023年2月1.1Chemometrics1.1.1.1970S发展1.1.2.交叉学科1.1.3.现代仪器1.1.4.一个例子1971:瑞典人S.Wold基金项目定名时首提1974:S.Wold何B.R.Kowalski

倡议在西雅图首开学术会议新创学术刊物J.Chem.Info.Comp.Sci.J.ChemometricsChemom.Intell.Lab.Syst.化学计量学与计量关系ChemometricsStoichiometry需要化学计量学获得更多信息BACK应用数学、统计学、与计算机科学的手段设计或优化量测方法,并通过解析数据最大限度地获取化学及相关信息。化学

分析化学数学统计学计算机科学接口第3页,课件共48页,创作于2023年2月ANewtrendinAnalyticalChemistry---HyphenatedInstrument(聯用儀器)SeparationInstrumentSignal

InstrumentHPLC DAD(diode-arraydetector)GC

MS(Mass-spectrometer)第4页,课件共48页,创作于2023年2月HPLC-DADGetmoredata3DchromatogramHPLCchromatogramofnucluesideofCordycepsSinensis(冬蟲草)atonewavelength第5页,课件共48页,创作于2023年2月GC-MSGCchromatogramof

pepticpowder(平胃散)Massspectrumtakenatretentiontime10.2minutesBACKTwo-waydatacontainingbothchromatographyandspectra;Datamatrixwithmorethan80Megabytes;Databaseoflotsofchemicalstandards

第6页,课件共48页,创作于2023年2月梁逸曾教授的经历美国标准局16组分PAH混合物标样(Sulpeco)

已知峰9为苯并[a]蒽和屈,峰14为苯并芘和二苯并蒽的二组分重叠峰BACKNext芴、苊、菲三混合第7页,课件共48页,创作于2023年2月Peaks5and6intheplot第8页,课件共48页,创作于2023年2月峰5、峰6的演进特征投影图

峰5的前5个特征值依次为16382,2436,1294,22,11第9页,课件共48页,创作于2023年2月分辨所得的芴、苊、菲、蒽的色谱与光谱

化学学报1998,中国科学1998,ChemLab.1999BACK第10页,课件共48页,创作于2023年2月线性代数→1.2NecessaryKnowledgeonLinearAlgebra1.2.1矢量Vector1.2.2线性相关1.2.3矩阵Matrix1.2.3秩Rank一组溶液的光谱集合一条光谱同物质不同浓度的光谱混合溶液中的物种数BACK第11页,课件共48页,创作于2023年2月矢量:n个有顺序的数a1,a2,…,an组成的数组α。k1α1+k2α2+…+kmαm=0线性组合:γ=k1α+k2β。就称为α,β的行矢量:α=(a1,a2,…,an);列矢量αt

。问:由α,β,γ组成的矩阵,rank最大为几?

α1

=(123456)

α2

=(654321)

α3=(111111)α1+α2-7α3=0第12页,课件共48页,创作于2023年2月Gradedikreceivedbystudentifromprofessorkis矩阵:

一组相同大小的矢量组合

经典例子:教授给学生打分TruescoreofstudentiRelativeloading(importance)givenbyprofessorkj:factors(i,e.,subjects)chem.,physics,math.,etc.

第13页,课件共48页,创作于2023年2月Fourstudentsthreeprofessor

twosubject:ChemistryandEnglishProfessors123Students1234Students1234Professors123factors

1212Factors3教授给4学生写留学推荐信[S]isthematrixoftruescores,calledthescorematrix[L]isthematrixofimportance,calledtheloadingmatrix得分矩阵载荷矩阵第14页,课件共48页,创作于2023年2月矩阵的秩:对于A(m×n),其秩是A中最大线性无关的行数(或列数)。秩=组分数?秩为几?三种组分,吸收光谱各不相同(s1,

s2

,s3)

6组溶液,各组分浓度不同

吸光度矩阵A(20×6)Rank=NumberofEigenvalue秩=不为0的特征值的数目矩阵:一组不同浓度组合的混合溶液测得的光谱集合矢量:一条光谱第15页,课件共48页,创作于2023年2月Eigenvalue特征值奇异值分解法:Y=USVt

S:对角矩阵,收集了Y的特征值U:标准列正交矩阵(ScoresMatrix)Vt:标准行正交矩阵(LoadingsMatrix)用Matlab很方便!一句话!BACK第16页,课件共48页,创作于2023年2月2.PCA主成分分析

PrincipalComponentAnalysis2.1目的12.2基本步骤22.3应用实例3第17页,课件共48页,创作于2023年2月2.1主成分分析(PCA)的目的BACK现代仪器获得两维数据(矩阵)矩阵处理确定秩为多少确定复杂分析体系中的物种数PCA的目的-定性有几种物种species定性第18页,课件共48页,创作于2023年2月2.2PCA的步骤BACK矩阵分解真实误差法收集特征值特征值比值法Y=USVt在S中比较RSD与REMax第19页,课件共48页,创作于2023年2月BACKNIPALS分解矩阵分解奖金10000元=10000×15000×2100×1001×10000Y=TP奇异值(SVD)分解SingleValueDecompositionY=USVt

S:对角矩阵,收集了Y的特征值U:标准列正交矩阵(ScoresMatrix)Vt:标准行正交矩阵(LoadingsMatrix)用Matlab很方便!一句话!怎么分解?看了头大!分解成正交矩阵的乘积第20页,课件共48页,创作于2023年2月Y(m×n)有d个主成分真实误差法-确定主成分数d+表示来自主因子0表示来误差=真实误差RE(RealError,可以知道)RE=RSD(剩余标准偏差)ResidualStandardDeviation第21页,课件共48页,创作于2023年2月确定或设定REd=1…n-1计算RSD(d)

d=1RSD(d)≤REYES此时d即为主成分数Nod=d+1RSD与实际误差是否吻合判断标准BACK第22页,课件共48页,创作于2023年2月相邻特征值比值法出现最大值时相应的d表示最小成分信号的λ表示最大噪声信号的λ

显著差异BACK第23页,课件共48页,创作于2023年2月2.3PCA的应用实例BACK混合色素中组分数的确定反应过程中组分数的确定第24页,课件共48页,创作于2023年2月一组食用色素混合溶液测得吸光度矩阵Y15×6dλdλd/λd+1

RSD14.6084.10.117421.1301.80.059930.614564.00.001740.00961.150.001550.00841.160.0013PCA结果组分数nc=3722的噪声水平0.0023

0.614564.00.0017第25页,课件共48页,创作于2023年2月同样的样品用Agilent8453dλdλd/λd+1

RSD15.73611.70.046420.4902.50.019530.19964.30.000440.00312.10.000350.00151.90.0002PCA结果组分数nc=3噪声水平0.00023

0.19964.30.0004实际上有3种色素胭脂红柠檬黄日落黄第26页,课件共48页,创作于2023年2月反过来,已知主成分数时PCA:通常可以正确判定主成分数根据RSD判断仪器的噪声水平判断操作者的操作水平使用7220.0010~0.0040BACK第27页,课件共48页,创作于2023年2月实例讨论-forachemicalreaction三种化学成分A、B、C,光谱线性无关Model1:Consecutive1storderreactionResult:

Rank=numberofcomponent=3第28页,课件共48页,创作于2023年2月Matrixtwo-waydata

光谱矩阵S动力学矩阵Q两维数据矩阵YY=QST第29页,课件共48页,创作于2023年2月日落黄电解降解最终产物无吸收有中间体吗?第30页,课件共48页,创作于2023年2月日落黄电解降解dλdλd/λd+1

RSD14.1476.000.025520.69125.800.001230.02682.350.000740.01141.180.000550.00970.0003PCA结果组分数d=2第31页,课件共48页,创作于2023年2月PCA确定组分数nλnλn/λn+1

RSD123.06010.60.0617122.1862.40.0241130.910215.70.0001440.0043.50.0000850.0011.20.0000760.0010.00007最终产物有吸收d=3第32页,课件共48页,创作于2023年2月实例讨论三种化学成分A、B、C,光谱线性无关Model2:nc=3,rank=2Y=QST第33页,课件共48页,创作于2023年2月实例讨论Model3:Parallelreactionnc=3,rank=?ACBo1o2o1=or≠o2o1=o2=1k2qB-k1qC=0线性相关rank=2第34页,课件共48页,创作于2023年2月实例讨论Model3:Parallelreactionnc=3,rank=?ACBo1o2o1=0,o2=1dA/dt=k1+k2AdB/dt=k1dC/dt=k2A线性无关rank=3第35页,课件共48页,创作于2023年2月PCA确定组分数Y=load('E:\Hp8453\BB\OH15.txt');[U,S,V]=svd(Y);lmd=diag(S);n=size(lmd,1);fork=1:n-1sumlmd=0;forj=(k+1):nsumlmd=sumlmd+lmd(j)*lmd(j);endRSD(k)=sqrt(sumlmd/(nw*(nt-k)));end第36页,课件共48页,创作于2023年2月PCA:Conclusions根据矩阵的秩确定化学成分数组分无吸收No!谱线性相关亏秩!某组分信号太弱复杂!好大学问!

BACK第37页,课件共48页,创作于2023年2月3.PCR回归

PrincipalComponentRegression3.1概念13.2基本步骤23.3应用实例33.4提醒3第38页,课件共48页,创作于2023年2月3.1PCR:概念BACK主成分分析PCAPCR多元校正之一因子分析FA主成分回归PCR多元校正MC相似概念常常混用步骤略异侧重不同解决多组分同时测定问题定量第39页,课件共48页,创作于2023年2月3.2PCR:基本步骤K-矩阵法K-MatrixMethod数学模型实验测量数据矩阵Size:nw×ns吸光系数矩阵Size:nw×nc混合浓度矩阵Size:nc×ns建模/校正Seenext预测已知K,解出未知样浓度单样品多样品第40页,课件共48页,创作于2023年2月3.2PCR:基本步骤SVD分解SVD分解分离重组广义逆建模未知样预报与K矩阵法相比仅一次求逆过程剔除了主成分模型误差系数矩阵P意义不明确但用于预报是正确的BACK第41页,课件共48页,创作于2023年2月Y:波长数nw=8;溶液数ns=6;组分数nc=3YV

tUSnc=3U后3列Vt后3行误差信息剔除后Y0V*tU*S*广义逆矩阵第42页,课件共48页,创作于2023年2月多元线性回归MLRMultipleLinearRegressionK-矩阵法建模相当于单波长单组分的工作曲线ঔ矩阵除法即乘以其逆矩阵ঔ方阵可求逆已知C

第43页,课件共48页,创作于2023年2月BACK多元线性回归MLRMultipleLinearRegressionK-矩阵法建模建模/校正(相当于单波长单组分的工作曲线)ঔ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论