已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章距离分类器和聚类分析 2 1距离分类器 一 模式的距离度量 距离函数应满足的条件 对称性 非负性 三角不等式 常用的距离函数 欧几里德距离 EucideanDistance 常用的距离函数 街市距离 ManhattanDistance 常用的距离函数 明氏距离 MinkowskiDistance 常用的距离函数 角度相似函数 AngleDistance 是X与Y之间的内积 为矢量X的长度 也称为范数 二 单个标准样本距离分类器 M个类别 每个类别有一个标准样本 对待识样本X进行分类 建立分类准则 如果有 则判别 距离分类器 三 多标准样本的距离分类器 M个类别 第m个类别有训练样本集合 对待识样本X进行分类 多标准样本的距离分类器 平均样本法对每一类求一个标准样本T m 使T m 到所有训练样本的平均距离最小 平均样本法的特点 算法简单存储量小计算量小效果不一定很好 平均距离法 已知 i类有训练样本集 定义待识模式X与类别 i的距离 最近邻法 待识模式X与类别 i的距离 最近邻法的改进 平均样本法 用一点代表一个类别 过于集中 最近邻法 以类内的每一点代表类别 过于分散 改进最近邻法 将每个类别的训练样本划分为几个子集 以子集的平均样本作为代表样本 K 近邻法 计算X与所有训练样本的距离 对所计算出的距离从小到大排序 统计前K个中各类样本的个数Ni 如果 则判别 2 2聚类分析 简单聚类法系统聚类法动态聚类法 简单聚类法 试探法 最近邻规则的简单试探法最大最小距离算法 最近邻规则的简单试探法 已知 N个待分类模式 X1 X2 XN 阈值T 每个样本到其聚类中心的最大距离 分类到 1 2 类别中心为Z1 Z2 最近邻规则的简单试探法 第一步 取任意的样本作为第一个聚类中心 Z1 X1 计算D21 X2 Z1 如果D21 T 则增加新类别 Z1 X1 否则 X2归入 1类 重新计算 Z1 X1 X2 2 最近邻规则的简单试探法 第二步 设已有M个类别 加入样本Xk计算Dk1 Xk Z1 Dk2 Xk Z2 如果Dki T 则增加新类别 M 1ZM 1 Xk 否则 Xk归入最近的一类 重新计算该类的聚类中心 最大最小距离算法 基本思路 以最大距离原则选取新的聚类中心 以最小距离原则进行模式归类 已知 N个待识模式 X1 X2 XN 阈值比例系数 最大最小距离算法 任选样本作为第一个聚类中心Z1 从样本集中选择距离Z1最远的样本Xi作为第二个聚类中心 Z2 Xi 设定阈值 T Z1 Z2 最大最小距离算法 计算未被作为聚类中心的各样本Xi与Z1 Z2之间的距离 以其中的最小值作为该样本的距离di 若di T 将Xi作为第3个聚类中心 Z3 Xi 转3 否则 转5按照最小距离原则 将所有样本分到各类别中 系统聚类法 基本思路 首先每一个样本自成一类 然后按照距离准则逐步合并 类别数由多到少 达到合适的类别数为止 已知 N个待识模式 X1 X2 XN 类别数M 类与类之间的距离 最短距离 最长距离 平均距离 系统聚类算法 第一步建立N个初始类别 每个样本一个类别 计算距离矩阵D Dij 第二步寻找D中的最小元素 合并相应的两个类别 建立新的分类 重新计算距离矩阵D 重复第二步 直到类别数为M为止 动态聚类法 基本思想 首先选择若干个样本点作为聚类中心 然后各样本点向各个中心聚集 得到初始分类 判断初始分类是否合理 如果不合理 则修改聚类中心 包括 K 均值算法 ISODATA算法 K 均值算法 C 均值 第一步 任选K个初始聚类中心 第二步 将每一个待分类样本分到K个类别中去 第三步 计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《塑料成型工艺及模具设计》教学大纲
- 玉溪师范学院《数据库原理与应用实训》2022-2023学年期末试卷
- 很好的分数混合运算复习教案
- 学生版教育课件
- 教你看懂狗狗常见的动作语言
- 中学家长会课件
- 2024年血细胞分析仪器试剂项目评估分析报告
- 2024年网络及通信协议处理软件项目评估分析报告
- 2023年室内LED照明灯具项目成效分析报告
- 投资学 第7版 课件 第14章 现代投资银行
- DLT1249-2013 架空输电线路运行状态评估技术导则
- 肛肠科患者的营养支持与饮食调理实践
- 电磁炮完整分
- 海水直接电解制氢研究进展
- 马铃薯购销合同范本
- 莫言读书分享《檀香刑》
- 自然辩证法科学技术社会论课件
- 河北省保定市竞秀区2023-2024学年七年级上学期期中地理试题(解析版)
- 古代汉语-词头、词尾
- 《活出最乐观的自己》
- 保护秦岭生态环境主题班会通用课件
评论
0/150
提交评论