版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
化学计量学课件新第一页,共四十一页,2022年,8月28日绝对值距离:
xik:第i个样本第k个指标
dij:第i个样本与第j个样本之间的距离。
第二页,共四十一页,2022年,8月28日两样品的色谱图图Ⅰ图Ⅱ第三页,共四十一页,2022年,8月28日各保留时间下的峰高第四页,共四十一页,2022年,8月28日用向量表示第五页,共四十一页,2022年,8月28日和之间的绝对值距离计算第六页,共四十一页,2022年,8月28日例题1
试用绝对值距离计算下列样本两两之间的距离
第七页,共四十一页,2022年,8月28日解:第八页,共四十一页,2022年,8月28日
欧氏距离
第九页,共四十一页,2022年,8月28日
数据预处理:标准差标准化:
对n个样本,m个指标
第十页,共四十一页,2022年,8月28日系统聚类法(Hierarchicalclusteringmethod)
先将n个样本各自看成一类,然后规定样本之间的距离和类与类之间的距离。开始时,各样本自成一类,这时类之间的距离与样本之间的距离是相等的,然后选择距离最小的两类合并成新类,并计算该新类与其它类之间的距离,接着再将距离最近的两类合并,这样每次减少一类,直至所有的样本都合并成一类为止。第十一页,共四十一页,2022年,8月28日一、最短距离法
以G1,G2,……表示类
Dpq表示第p类(Gp)与第q类(Gq)之间的距离
定义:第十二页,共四十一页,2022年,8月28日例题2:例题1中,p类样本:X1
、X2,q类样本:X3
、X4,求Dpq
?解:第十三页,共四十一页,2022年,8月28日聚类分析步骤:
1.构成距离矩阵D(0)第十四页,共四十一页,2022年,8月28日2.选择D(0)中的非对角最小元素,设为Dqp,将Gp和Gq合并成一新类,记为Gr,
Gr={Gp,Gq}第十五页,共四十一页,2022年,8月28日
3.计算新类和其它类(假定为K类)的距离,从中将距离最短的合并,得新矩阵D(1)
新类和K类的距离为:
Drk=min{Dpk,Dqk}
=min{mindij,mindij}
i∈Gpi∈Gq
j∈Gkj∈Gk第十六页,共四十一页,2022年,8月28日4.对D(1)重复上一步得D(2),如此下去直到成为一类为止。如果某一步D(m)中最小的元素不止一个,则对应这些最小元素的类可同时合并。
第十七页,共四十一页,2022年,8月28日
例3:
6个样本:x1=1,x2=2,x3=5
x4=7,x5=9,x6=10,试分类
1、构成D(0)
第十八页,共四十一页,2022年,8月28日2、选择D(0)中的最短距离,
G7={G1,G2}G8={G5,G6}
第十九页,共四十一页,2022年,8月28日
3、计算新类G7,G8与各类之间的距离D(1)第二十页,共四十一页,2022年,8月28日
4、
重复2,3
G9={G3,G4,G8}={x3,x4,x5,x6}
最后将G7和G9合并为G10
D(2)第二十一页,共四十一页,2022年,8月28日第二十二页,共四十一页,2022年,8月28日分类:阀值法第二十三页,共四十一页,2022年,8月28日例题4:试用绝对值距离以最短距离法,将下列5个样本进行聚类,写出距离矩阵并绘出聚类图。
第二十四页,共四十一页,2022年,8月28日构成D(0)
第二十五页,共四十一页,2022年,8月28日计算新类与各类之间的距离第二十六页,共四十一页,2022年,8月28日x1
x2x3
x4
x5
第二十七页,共四十一页,2022年,8月28日隔着泡眼测定真假片剂的近红外光谱聚类图真假片剂的马氏距离为2.8第二十八页,共四十一页,2022年,8月28日前胡族中药用植物分类聚类分析的谱系图第二十九页,共四十一页,2022年,8月28日
6.2模式识别(Patternrecognition)
模式:样本
模式识别:对样本的判别或分类第三十页,共四十一页,2022年,8月28日特征
特征向量(模式向量)
X=[x1,x2,…,xn]T
特征空间(模式空间)
1有监督学习系统
2无监督学习系统第三十一页,共四十一页,2022年,8月28日6.2.1最近领域判决法
Nearestneighborclassificationmethod
1.
1-NN(1-最近领域判决法)
设有样本集{x1,x2,…,xN}分别属于类ω1,ω2;记djq为样本Xj到样本xq之间距离
当且已知xj∈ωi0则判决xq∈ωi0
即将样本xq判决到它最近的一个样本所属的类别中。
第三十二页,共四十一页,2022年,8月28日2.k-NN(k-最近邻域判决法)
对一个未知模式x,若它的k(k为奇数)个最近邻的模式中大多数属于某一类,则该模式x就属于这一类。
第三十三页,共四十一页,2022年,8月28日6.2.2线性学习机(Linearlearningmachine)
增广特征空间:将n维特征向量X=(x1,x2,…,xn)T
扩充为X=(x1,x2,…,xn,1)T
设有ω1,ω2两类模式集合,在增广特征空间中存在区分这两类的超平面:
φ(x)=αTx称为线性判决函数
其中:α=(α1,α2,…,αn+1)T
称为系数向量(权向量)第三十四页,共四十一页,2022年,8月28日x=(x1,x2,…,xn+1)T
判决规则如下:
若αTx>0则判决x∈ω1
若αTx<0则判决x∈ω2
第三十五页,共四十一页,2022年,8月28日通过学习找出φ(x)=αTx
学习过程:模式按i=1,2,…,逐个输入
1.设定初值α=α1,如α1=[0,0,…,0]T
学习规则第三十六页,共四十一页,2022年,8月28日2.若x∈ω1
但αTx≤0
则令αi+1=αi+xi
若x∈ω2
但αTx≥0
则令αi+1=αi-xi
若x∈ω1
但αTx>0
则令αi+1=αi
若x∈ω2
但αTx<0
则令αi+1=αi
3.继续第二步训练,直到α不再修正为止。
第三十七页,共四十一页,2022年,8月28日例1,设有四个模式在增广特征空间(3+1维)中:
ω1:X1(1)=(1,0,1,1)记为Y1
X2(1)=(0,1,1,1)记为Y2
ω2:X1(2)=(1,1,0,1)记为Y3
X2(2)=(0,1,0,1)记为Y4
求线性判决函数第三十八页,共四十一页,2022年,8月28日解:取α1=(0,0,0,0)T
得α1TY1=0
则α2=α1+Y1=(1,0,1,1)T
有α2TY2=(1,0,1,1)(0,1,1,1)T=2>0
则α3=α2=(1,0,1,1)T
有α3TY3=(1,0,1,1)(0,1,1,1)T=2>0
则α4=α3-Y3=(1,0,1,1)T-(1,1,0,1)T
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度不锈钢水箱风险防范与违约责任合同
- 2024年度城市核心区域喷泉规划合同
- 2024年度广告投放合同投放内容详述
- 身体护肤乳市场发展现状调查及供需格局分析预测报告
- 头发脱色剂市场发展现状调查及供需格局分析预测报告
- 2024年度医疗设备采购合同及售后服务协议
- 2024年度服务外包合同:某足疗店与服务外包公司之间的合同
- 2024年度建筑工程合同标的详细描述
- 2024年度市场营销合作独家代理合同
- 2024年度农产品采购与保密合同
- qq仪表dcs-io表热水循环泵出口压力
- 病理产科 死胎 (妇产科学课件)
- 翻身拍背课件
- 全套课件-中文版AutoCAD-2020基础教程-完整
- 2022最新 冰壶教案
- 中医穴位养生保健课件
- 属地管理课件
- 可行性研究报告编制工作流程
- 国家开放大学《可编程控制器应用实训》形考任务2(实训二)参考答案
- 木薯淀粉预处理及其糖化工艺初步设计
- 我的家庭贡献与责任说课课件
评论
0/150
提交评论