基于模糊聚类表征的音频例子检索及相关反馈_第1页
基于模糊聚类表征的音频例子检索及相关反馈_第2页
基于模糊聚类表征的音频例子检索及相关反馈_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、任务描述用自己熟悉的输入方法输入范文内容,或使用“”,然后以“”为文件名保存;文稿要求用计算机打印在A4(297*210)纸上;文稿必须包括中英文题名、作者姓名、作者单位、中英文摘要和关键词、中图法分类号、正文、参考文献;论文章节编号采用三级标题顶格排序。一级标题形如1,2,3.排序,二级标题形如1.1, 1.2,.;2.1,2.2,.排序,引言不排序。 参考文献作者署名,不多于三人全部著录,超过三人,第三人后加“等”(et al)。无论中英文署名,一律姓先名后。参考文献著录方法及书写规范如下:1) 期刊或杂志: 序号 文章作者名1,名2,名3,等. 文章名 J. 杂志名, 年, 卷(期):

2、起止页码。2) 书或专著:序号 著者名. 书名M. 出版社所在城市名: 出版社名, 出版年: 起止页码。3) 论文集: 序号 文章作者名. 文章名 A. 论文集编者. 文集名C. 出版地所在城市名:出版社名, 出版年: 起止页码。结果参见图基于模糊聚类表征的音频例子检索及相关反馈吴某某,赵某某(浙江大学,杭州,310027)摘要:避免先前基于例子的音频检索要按照监督机制训练不同类别的复杂的音频模板,一种新的基于非监督机制音频例子快速检索方法被提出来。其步骤如下:首先从原始音频流中提取压缩域特征,然后使用时空约束机制实现压缩域特征的模糊聚类,用聚类质心来表征整个音频例子。关键词:音频检索;时空约

3、束;模糊聚类;相关反馈中图分类号: Audio Clip Retrieval and Relevance Feedback based on the Audio Representation of Fuzzy ClusteringWU , ZHAO (Zhejiang University, Hangzhou, 310027)Abstract: Avoiding generating audio template by supervised learning and find similar audio clip based on pre-trained audio template, eve

4、ry audio clip is presented by limited number of centroids which is extracted by unsupervised learning algorithm. Audio features such as Centroid, Rolloff, Spectral, Flux and RMS are extracted from each overlapping audio frame in the original compressed domain. Keywords: Audio Retrieval Time-Spatial

5、Constraint Fuzzy Clustering Relevance 作为多媒体重要媒质之一的音频蕴涵了丰富语义,从90年代中期开始的基于内容音频检索就研究如何提取音频信息流中的语义信息,以实现对音频数据进行检索1:如在“Muscle Fish”中2,每个音频例子的MFCC等特征被提取,然后归一化欧氏距离用来判别提交的检索音频属于音频数据库中哪一类,这种方法取得了81%左右正确率;提取音频例子中12个MFCC系数和1个能量特征3,对语音、笑声、雨声和双簧管音等6类不同音频类别构造量化树,将每个量化树作为相应类别音频的模板,然后用余弦距离进行相似度量,取得了77.2%的检索平均正确率;采用

6、监督式的学习机制,从每个音频帧中提取感知和物理特征4,为每类音频训练支持向量学习机,取得了平均80%左右检索正确率。1 音频例子表征与检索1.1 MPEG压缩域音频特征提取MPEG音频压缩利用了“心理声学模型(psychoacoustics model)”,在MPEG压缩领域上直接提取特征,可以保留这些感知特性,实现对音频语义内容的理解。1) 压缩域特征高斯化处理1.3 音频例子相似度比较 既然每个音频用个质心来表征,那么两个音频之间的相似度就可以通过质心来计算。3 总结与今后工作本文介绍了基于非监督约束机制的音频检索及相关反馈算法,并且实时实现了这样的原型系统。在模糊聚类因子取为11和聚类质

7、心数目取为6时,系统查全率和查准率均超过90%,比其它算法取得了更高效率。参考文献1 Foote J T, An overview of audio information retrieval J, Multimedia Systems, 1999 7(1): 2-112 (et al), Content-based classification, search and retrieval of audio J, IEEE Multimedia Magazine,1996, 3(3):27-363 Jonathan T. Foote, Content-Based Retrieval of Music and

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论