数字图像处理大作业2008_第1页
数字图像处理大作业2008_第2页
数字图像处理大作业2008_第3页
数字图像处理大作业2008_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字图像处理大作业2008本次作业的任务是进行图片分类实验,实验数据集由20个类别共2000张图片组成,其中1000张图片用于训练,另1000张图片用于测试(详情见附录A)。图片分类程序的常见步骤【建议】图片分类程序可以分为以下5个步骤:(1) 为训练图片提取底层特征,用特征向量表示训练图片; (2) 利用训练图片的特征向量和类别标注数据训练分类器;(3) 为测试图片提取底层特征,用特征向量表示测试图片;(4) 使用训练好的分类器对测试图片的特征向量进行预测分类;(5) 对预测分类的结果进行评测。底层特征【要求】在本次大作业中,至少要用到以下底层特征:(1) HSV颜色特征:将H通道量化到18

2、个值,S通道量化到3个值,V通道量化到3个值,HSV三个通道共量化到18x3x3=162个值;(2) CIE-Lab颜色特征:将L通道量化到4个值,a通道量化到8个值,b通道量化到8个值,Lab三个通道共量化到4x8x8=256个值;(3) 除HSV颜色特征和CIE-Lab颜色特征以外,自选一种颜色特征;(4) 除以上颜色特征之外,自选2种非颜色类的底层特征(比如说,纹理特征和形状特征)。【建议】除以上要求的底层特征之外,可以自己查阅资料,使用更多更好的底层特征。【建议】可以在对不同的底层特征进行融合的过程中,观察不同的底层特征之间的互补关系,并加以分析。分类方法【要求】在本次大作业中,至少要

3、用到以下分类器:(1) Libsvm:SVM是一种被广泛采用的分类方法,Libsvm是一个应用非常普遍的开源的SVM实现,当前的最新版本是2.85版本(下载地址);(2) 除Libsvm外,自选另外两种分类方法。【建议】除以上要求的分类器之外,可以自己查阅资料,使用更多更好的分类方法。【建议】可以在实验过程中,观察不同的分类方法的效果优劣,并加以分析。统一的预测分类结果文件格式为了便于进行图片分类结果的评测和比较,在实验的过程中请将图片分类结果输出为以下统一的格式:(1) 每一行由3个数字组成,分别是图片(在整个图片集中)的序号、图片的真实(标注)类别、图片分类程序的预测类别;(2) 由于共有

4、1000张图片,该文件共有1000行。50 1 151 1 31999 20 20结果评测指标图片分类实验的评测指标平均准确率A是所有类别的准确率的平均值,即:A=(A1+A2+A20)/ 20其中Ai是对类别i的测试图片进行预测分类的准确率,定义如下:Ai=Ri / Ni其中Ri是类别i的测试图片中预测分类正确的图片的数目, Ni是类别i的测试图片的数目(对于本次作业的图片集Ni=50)。结果显示【要求】图形界面:实现一个图形化的界面用来展示图片分类结果。【建议】可以按照下图进行图形化演示界面的设计。其中A为图片类别列表,B为当前选定类别的训练图片列表,C为当前选定类别的测试图片列表。【建议

5、】图形化演示界面的原则是越能清楚地反应图片分类结果越好,越美观越好。并不一定要按照上面的结构进行设计。【要求】Confusion matrix: 将图片分类结果的Confusion matrix以一张图的形式显示出来。Confusion matrix是一个20x20的矩阵,其中的第(i,j)个元素,是测试图片中第i类图片被判断为第j类的概率。Confusion matrix中每一行中所有元素的和应为1。Confusion matrix中对角线上的第(i,i)个元素是第i类图片的分类准确率Ai,对角线上所有元素的平均值就是图片分类实验的平均准确率A。【建议】尽量将Confusion matrix

6、的图做的清楚,美观。例子:下面是一个6个类别的图片分类实验的Confusion matrix(出处)。Confusion Matrix的数据:0.9692 0.0031 0.0021 0.0051 0.0021 0.01850.0700 0.3762 0.0312 0.0425 0.3150 0.16500.0009 0.0009 0.9962 0.0009 0 0.00090.0504 0 0.0150 0.9283 0.0016 0.0047 0 0 0 0 0.9886 0.01140.0028 0.0083 0.0014 0 0.0028 0.9848Confusion Matrix的

7、图片显示:作业提交方式本次作业至少需要提交以下内容:提交内容详细要求作业文档详细介绍采用的图片分类方法,包括使用的底层特征和分类方法的细节、最终的图片分类结果等。程序源代码相关程序的全部源代码,要求能够正常编译和运行;如果程序中使用了网上的开源代码,请同时提供下载地址。程序说明详细说明如何编译源代码、如何运行图片分类程序、如何评测分类结果。助教将根据“程序说明”编译你提交的源代码,并重新运行图片分类程序,因此,你提交的源代码应该能够在Windows XP操作系统上正常编译和运行。由于资源限制,你的程序不应该使用超过2G的内存,总的运行时间不应该超过12小时。在绝大多数情况下,这个限制是非常宽松

8、的。项目详细要求操作系统Windows XP使用内存< 2G运行时间< 12小时如果出现代码无法编译、占用内存过多、运行时间过长或运行出错、运行结果与作业文档中的结果不一致等情况,在正常评分的基础上将酌情减分。附录A:实验图片集本次大作业采用的实验图片集含有20个类别共2000张图片(0.jpg-1999.jpg),每个类别各100张图片(其中训练图片50张,测试图片50张),如下表所示。类别类别名称训练图片测试图片 0African people and villages 0-49 50-991Beach 100-149 150-1992Historical buildings

9、200-249 250-2993Buses 300-349 350-3994Dinosaurs 400-449 450-4995Elephants 500-549 550-5996Flowers 600-649 650-6997Horses 700-749 750-7998Mountains and glaciers 800-849 850-8999Food 900-949 950-99910Dogs1000-10491050-109911Lizards1100-11491150-119912Fashion1200-12491250-129913Sunsets1300-13491350-139914Cars1400-14491450-14991

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论