图像标注的翻译模型

上传人：x*** IP属地：湖北上传时间：2024-01-14 格式：PPTX 页数：16 大小：447.59KB 积分：30 举报 版权申诉

已阅读5页，还剩11页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

图像标注的翻译模型及K-means(K-均值聚类)1什么是图像标注就是通过计算机给这幅图像加上sky、horse、grass这样能表达图像语义内容的词。2

如何实现？先要提供一个由人工标注了语义词的图像集，在此图像集上通过各种方法寻找图像特征与标注词之间的映射关系。对于一副未标注图像，先提取其图像特征，然后根据前面找到的特征与标注词之间的映射关系，确定出这幅图像应标注的语义词。3

翻译模型（就是一种寻找图像特征与语义词之间映射关系的方法）思想：将图像标注的过程看作是从“视觉”语言到“文本”语言的翻译问题。其中，视觉词汇是由图像的各个分割区域经过聚类的结果，被称为“聚类块”；而文本词汇就是标注词，然后利用机器语言翻译的方法建立起“聚类块”与文本词汇之间的对应关系，进而得到图像的语义标注。4翻译模型的标注过程（1）对已人工标记的图像集进行分块、特征提取、聚类分块：每幅图像分为9个块，整个图像集共有4×9=36个块特征提取：对36个块分别提取图像特征[xx,xx,xx,xx]，共有36个特征值聚类：对36个特征值进行聚类，得到N个聚类聚类1：对应分块2、4、5、6、19、20、25、28、30、33、35、36聚类2：对应分块11、12、13、14、21、22、24、26、27聚类N：……4翻译模型的标注过程（2）对N个聚类进行标注词统计聚类1：对应分块2、4、5、6、19、20、25、28、30、33、35、361#｛山、水、船｝各4次

（2、4、5、6）3#｛山、草、水｝各3次

（19、20、25）4#｛山、水、树｝各5次

（28、30、33、35、36）统计得:山：12次

水：12次

树：5次

船：4次草：3次

结论为：聚类1=>{山、水}（注：取统计值较大的前几个，或设定一个阈值）4翻译模型的标注过程（2）对N个聚类进行标注词统计聚类2：对应分块11、12、13、14、21、22、24、26、272#{水、草、鸟}各4次

（11、12、13、14）3#{山、草、水}各5次

（21、22、24、26、27）统计得：水：9次

草：9次

山：5次

鸟4次结论为：聚类2

=>{水、草}最终得到一个特征向量及对应语义词的映射表：一个聚类对应的特征向量怎么计算出来的？4翻译模型的标注过程（3）标注一副图像图像特征向量？，？，？向量语义词映射表语义词4翻译模型的标注过程（3）标注一副图像4翻译模型的标注过程相似度计算：欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、夹角余弦、汉明距离、杰卡德相似系数、相关系数与相关距离、信息熵（3）标注一副图像5

K-means(K-均值聚类)K-means聚类算法是将N*P的矩阵X划分为K个类，使得类内对象之间距离最小,而类之间距离最大。它是一个无监督的机器学习过程。5

K-means(K-均值聚类)Kmeans的计算过程大概表示如下:（1）从N个样本中随机选择K个做为聚类中心。（2）计算每个样本到K个聚类中心的距离。（3）将每个样本聚类到离它最近的中心，此时共有K个聚类，每个样本点属于其中一个。（4）对每个新类从新计算聚类中心（求质心），并以此中心替代原中心。（5）转至（2）步，重复以上步骤直到满足收敛要求。(就是中心点不再改变或满足一定迭代次数)5

K-means(K-均值聚类)下面为一个对平面上20个点的K均值聚类matlab仿真：clearall;data=floor(100*rand(20,2));%随机范围0-100；共有20个点；x=data(:,1);y=data(:,2);plot(x,y,'*');%画出20个点axis([01000100]);K=input('请输入一个K值:');[Idx,C,sumD,D]=kmeans(data,K,'dist','sqEuclidean','rep',4);%Idx:N*1的矩阵，存储N个向量的分类标记；%C:K*P的矩阵，存储的是K个聚类质心%sumD：1*K的和向量，存储的是类间所有点与该类质心点距离之和%D：N*K的矩阵，存储的是每个点与所有质心的距离5

K-means(K-均值聚类)%画出K个质心点holdonx=C(:,1);y=C(:,2);plot(x,y,'ro');%质心与同类点连接线段fori=1:size(C,1)forj=1:size(Idx,1)ifi==Idx(j)plot([C(i,1),data(j,1)],[C(i,2),data(j,2)],'k:');endendend5

K-means(K-均值聚类)算法特点：（1）聚类结果与初始点有关，因为是迭代递进的过程；（2）是局部最优解，对脏数据敏感，K值不易确定；（3）在实际做的时候，可随机选择多

人人文库> 全部分类> 教育资料 > 备课教案

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

图像标注的翻译模型

文档简介

温馨提示

最新文档

评论

图像标注的翻译模型

文档简介

温馨提示

最新文档

评论

相关文档