版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
图像标注的翻译模型及K-means(K-均值聚类)1什么是图像标注就是通过计算机给这幅图像加上sky、horse、grass这样能表达图像语义内容的词。2
如何实现?先要提供一个由人工标注了语义词的图像集,在此图像集上通过各种方法寻找图像特征与标注词之间的映射关系。对于一副未标注图像,先提取其图像特征,然后根据前面找到的特征与标注词之间的映射关系,确定出这幅图像应标注的语义词。3
翻译模型(就是一种寻找图像特征与语义词之间映射关系的方法)思想:将图像标注的过程看作是从“视觉”语言到“文本”语言的翻译问题。其中,视觉词汇是由图像的各个分割区域经过聚类的结果,被称为“聚类块”;而文本词汇就是标注词,然后利用机器语言翻译的方法建立起“聚类块”与文本词汇之间的对应关系,进而得到图像的语义标注。4翻译模型的标注过程(1)对已人工标记的图像集进行分块、特征提取、聚类分块:每幅图像分为9个块,整个图像集共有4×9=36个块特征提取:对36个块分别提取图像特征[xx,xx,xx,xx],共有36个特征值聚类:对36个特征值进行聚类,得到N个聚类聚类1:对应分块2、4、5、6、19、20、25、28、30、33、35、36聚类2:对应分块11、12、13、14、21、22、24、26、27聚类N:……4翻译模型的标注过程(2)对N个聚类进行标注词统计聚类1:对应分块2、4、5、6、19、20、25、28、30、33、35、361#{山、水、船}各4次
(2、4、5、6)3#{山、草、水}各3次
(19、20、25)4#{山、水、树}各5次
(28、30、33、35、36)统计得:山:12次
水:12次
树:5次
船:4次草:3次
结论为:聚类1=>{山、水}(注:取统计值较大的前几个,或设定一个阈值)4翻译模型的标注过程(2)对N个聚类进行标注词统计聚类2:对应分块11、12、13、14、21、22、24、26、272#{水、草、鸟}各4次
(11、12、13、14)3#{山、草、水}各5次
(21、22、24、26、27)统计得:水:9次
草:9次
山:5次
鸟4次结论为:聚类2
=>{水、草}最终得到一个特征向量及对应语义词的映射表:一个聚类对应的特征向量怎么计算出来的?4翻译模型的标注过程(3)标注一副图像图像特征向量?,?,?向量语义词映射表语义词4翻译模型的标注过程(3)标注一副图像4翻译模型的标注过程相似度计算:欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、夹角余弦、汉明距离、杰卡德相似系数、相关系数与相关距离、信息熵(3)标注一副图像5
K-means(K-均值聚类)K-means聚类算法是将N*P的矩阵X划分为K个类,使得类内对象之间距离最小,而类之间距离最大。它是一个无监督的机器学习过程。5
K-means(K-均值聚类)Kmeans的计算过程大概表示如下:(1)从N个样本中随机选择K个做为聚类中心。(2)计算每个样本到K个聚类中心的距离。(3)将每个样本聚类到离它最近的中心,此时共有K个聚类,每个样本点属于其中一个。(4)对每个新类从新计算聚类中心(求质心),并以此中心替代原中心。(5)转至(2)步,重复以上步骤直到满足收敛要求。(就是中心点不再改变或满足一定迭代次数)5
K-means(K-均值聚类)下面为一个对平面上20个点的K均值聚类matlab仿真:clearall;data=floor(100*rand(20,2));%随机范围0-100;共有20个点;x=data(:,1);y=data(:,2);plot(x,y,'*');%画出20个点axis([01000100]);K=input('请输入一个K值:');[Idx,C,sumD,D]=kmeans(data,K,'dist','sqEuclidean','rep',4);%Idx:N*1的矩阵,存储N个向量的分类标记;%C:K*P的矩阵,存储的是K个聚类质心%sumD:1*K的和向量,存储的是类间所有点与该类质心点距离之和%D:N*K的矩阵,存储的是每个点与所有质心的距离5
K-means(K-均值聚类)%画出K个质心点holdonx=C(:,1);y=C(:,2);plot(x,y,'ro');%质心与同类点连接线段fori=1:size(C,1)forj=1:size(Idx,1)ifi==Idx(j)plot([C(i,1),data(j,1)],[C(i,2),data(j,2)],'k:');endendend5
K-means(K-均值聚类)算法特点:(1)聚类结果与初始点有关,因为是迭代递进的过程;(2)是局部最优解,对脏数据敏感,K值不易确定;(3)在实际做的时候,可随机选择多
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社区网络建设的自我反思计划
- 品牌信誉重建的案例与策略计划
- 2024年度仪器仪表采购与租赁合同2篇
- 学校秋季教学评价体系计划
- 健全仓库物品损毁赔偿机制计划
- 2024年度工程债券发行合同3篇
- 2024年汉语拼音基础课件设计
- 2024年电机与变压器教案:培养未来工程师的新思路
- 如何通过项目管理实现年度目标计划
- 走进2024:游山西村教学策略
- 2024年度品牌授权代理终止协议书
- 班组长安全培训资料
- Unit1 lesson 1 Me and my body说课稿2024-2025学年冀教版(2024)初中英语七年级上册
- 2024-2030年中国冶炼钛产业未来发展趋势及投资策略分析报告
- 作文写清楚一件事的起因经过和结果公开课获奖课件省赛课一等奖课件
- 线上主播管理劳动合同(3篇)
- 《中秋节》完整教学课件
- 2024年广东深圳市龙华区招聘非编人员98人管理单位遴选500模拟题附带答案详解
- 质子交换膜燃料电池汽车用氢气中颗粒物的测定-称重法-编制说明
- 2024-2030年青海省旅游行业市场发展分析及发展趋势与投资前景研究报告
- 恢复驾驶资格科目一汽车类考试题库被吊销补考用450题
评论
0/150
提交评论