版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
化学计量学课件新第1页,共41页,2023年,2月20日,星期一绝对值距离:
xik:第i个样本第k个指标
dij:第i个样本与第j个样本之间的距离。
第2页,共41页,2023年,2月20日,星期一两样品的色谱图图Ⅰ图Ⅱ第3页,共41页,2023年,2月20日,星期一各保留时间下的峰高第4页,共41页,2023年,2月20日,星期一用向量表示第5页,共41页,2023年,2月20日,星期一和之间的绝对值距离计算第6页,共41页,2023年,2月20日,星期一例题1
试用绝对值距离计算下列样本两两之间的距离
第7页,共41页,2023年,2月20日,星期一解:第8页,共41页,2023年,2月20日,星期一
欧氏距离
第9页,共41页,2023年,2月20日,星期一
数据预处理:标准差标准化:
对n个样本,m个指标
第10页,共41页,2023年,2月20日,星期一系统聚类法(Hierarchicalclusteringmethod)
先将n个样本各自看成一类,然后规定样本之间的距离和类与类之间的距离。开始时,各样本自成一类,这时类之间的距离与样本之间的距离是相等的,然后选择距离最小的两类合并成新类,并计算该新类与其它类之间的距离,接着再将距离最近的两类合并,这样每次减少一类,直至所有的样本都合并成一类为止。第11页,共41页,2023年,2月20日,星期一一、最短距离法
以G1,G2,……表示类
Dpq表示第p类(Gp)与第q类(Gq)之间的距离
定义:第12页,共41页,2023年,2月20日,星期一例题2:例题1中,p类样本:X1
、X2,q类样本:X3
、X4,求Dpq
?解:第13页,共41页,2023年,2月20日,星期一聚类分析步骤:
1.构成距离矩阵D(0)第14页,共41页,2023年,2月20日,星期一2.选择D(0)中的非对角最小元素,设为Dqp,将Gp和Gq合并成一新类,记为Gr,
Gr={Gp,Gq}第15页,共41页,2023年,2月20日,星期一
3.计算新类和其它类(假定为K类)的距离,从中将距离最短的合并,得新矩阵D(1)
新类和K类的距离为:
Drk=min{Dpk,Dqk}
=min{mindij,mindij}
i∈Gpi∈Gq
j∈Gkj∈Gk第16页,共41页,2023年,2月20日,星期一4.对D(1)重复上一步得D(2),如此下去直到成为一类为止。如果某一步D(m)中最小的元素不止一个,则对应这些最小元素的类可同时合并。
第17页,共41页,2023年,2月20日,星期一
例3:
6个样本:x1=1,x2=2,x3=5
x4=7,x5=9,x6=10,试分类
1、构成D(0)
第18页,共41页,2023年,2月20日,星期一2、选择D(0)中的最短距离,
G7={G1,G2}G8={G5,G6}
第19页,共41页,2023年,2月20日,星期一
3、计算新类G7,G8与各类之间的距离D(1)第20页,共41页,2023年,2月20日,星期一
4、
重复2,3
G9={G3,G4,G8}={x3,x4,x5,x6}
最后将G7和G9合并为G10
D(2)第21页,共41页,2023年,2月20日,星期一第22页,共41页,2023年,2月20日,星期一分类:阀值法第23页,共41页,2023年,2月20日,星期一例题4:试用绝对值距离以最短距离法,将下列5个样本进行聚类,写出距离矩阵并绘出聚类图。
第24页,共41页,2023年,2月20日,星期一构成D(0)
第25页,共41页,2023年,2月20日,星期一计算新类与各类之间的距离第26页,共41页,2023年,2月20日,星期一x1
x2x3
x4
x5
第27页,共41页,2023年,2月20日,星期一隔着泡眼测定真假片剂的近红外光谱聚类图真假片剂的马氏距离为2.8第28页,共41页,2023年,2月20日,星期一前胡族中药用植物分类聚类分析的谱系图第29页,共41页,2023年,2月20日,星期一
6.2模式识别(Patternrecognition)
模式:样本
模式识别:对样本的判别或分类第30页,共41页,2023年,2月20日,星期一特征
特征向量(模式向量)
X=[x1,x2,…,xn]T
特征空间(模式空间)
1有监督学习系统
2无监督学习系统第31页,共41页,2023年,2月20日,星期一6.2.1最近领域判决法
Nearestneighborclassificationmethod
1.
1-NN(1-最近领域判决法)
设有样本集{x1,x2,…,xN}分别属于类ω1,ω2;记djq为样本Xj到样本xq之间距离
当且已知xj∈ωi0则判决xq∈ωi0
即将样本xq判决到它最近的一个样本所属的类别中。
第32页,共41页,2023年,2月20日,星期一2.k-NN(k-最近邻域判决法)
对一个未知模式x,若它的k(k为奇数)个最近邻的模式中大多数属于某一类,则该模式x就属于这一类。
第33页,共41页,2023年,2月20日,星期一6.2.2线性学习机(Linearlearningmachine)
增广特征空间:将n维特征向量X=(x1,x2,…,xn)T
扩充为X=(x1,x2,…,xn,1)T
设有ω1,ω2两类模式集合,在增广特征空间中存在区分这两类的超平面:
φ(x)=αTx称为线性判决函数
其中:α=(α1,α2,…,αn+1)T
称为系数向量(权向量)第34页,共41页,2023年,2月20日,星期一x=(x1,x2,…,xn+1)T
判决规则如下:
若αTx>0则判决x∈ω1
若αTx<0则判决x∈ω2
第35页,共41页,2023年,2月20日,星期一通过学习找出φ(x)=αTx
学习过程:模式按i=1,2,…,逐个输入
1.设定初值α=α1,如α1=[0,0,…,0]T
学习规则第36页,共41页,2023年,2月20日,星期一2.若x∈ω1
但αTx≤0
则令αi+1=αi+xi
若x∈ω2
但αTx≥0
则令αi+1=αi-xi
若x∈ω1
但αTx>0
则令αi+1=αi
若x∈ω2
但αTx<0
则令αi+1=αi
3.继续第二步训练,直到α不再修正为止。
第37页,共41页,2023年,2月20日,星期一例1,设有四个模式在增广特征空间(3+1维)中:
ω1:X1(1)=(1,0,1,1)记为Y1
X2(1)=(0,1,1,1)记为Y2
ω2:X1(2)=(1,1,0,1)记为Y3
X2(2)=(0,1,0,1)记为Y4
求线性判决函数第38页,共41页,2023年,2月20日,星期一解:取α1=(0,0,0,0)T
得α1TY1=0
则α2=α1+Y1=(1,0,1,1)T
有α2TY2=(1,0,1,1)(0,1,1,1)T=2>0
则α3=α2=(1,0,1,1)T
有α3TY3=(1,0,1,1)(0,1,1,1)T=2>0
则α4=α3-Y3=(1,0,1,1)T-(1,1,0,1)T
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电商精准营销数据驱动的仓储管理优化平台建设
- 智能仓储管理数字化升级路径
- 智能仓储与物流一体化解决方案
- 智慧物流园区智能化管理系统开发
- 2024-2025学年小学生阳光体育活动的有效教学设计
- 三农村土壤肥力提升方案
- 三农政策执行监督作业指导书
- 《水中漂浮、水中滑行》教案
- 2024-2025学年小学自我保护能力教学设计
- 24 司马光 教学设计-2024-2025学年语文三年级上册统编版
- 小学生中医药文化知识科普传承中医文化弘扬国粹精神课件
- 安全隐患规范依据查询手册22大类12万字
- 二年级数学角的初步认识 全国一等奖
- 无违法犯罪记录证明申请表(个人)
- 华科版五年级全册信息技术教案(共24课时)
- 丰臣丽晶商务楼建设项目项目申请报告
- 雨伞制作工艺流程
- 《上海市住宅室内装饰装修管理办法》
- 九年级物理培优讲义
- 纸箱包装市场的营销策略
- 实验报告样板热电偶的定标与测温
评论
0/150
提交评论