版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 数字图像处理 问题(wnt):人为什么能分辨(fnbin)出见过一次的东西?眼睛是生物体上十分神奇的器官,人类的眼睛可分辨约一千万颜色。他可以感知(gnzh)光线,是人们获得外界信息最主要的途径;同时,眼睛包括含心理意识在内的丰富信息。一、人眼构造人眼是人身体中最重要的感觉器官,人获取的信息90%以上通过眼睛来获取。人眼的构造决定了人眼成像的原理,同时决定了人眼的特性。人眼相当于一架摄像机或照相机,但在构造方面有别于摄像机和照相机。人眼的成像系统是由角膜、晶状体、前房、后房和玻璃体组成。角膜直径为11mm的透明膜,镶嵌于巩膜前面圆孔内,其中央部的曲率半径为8mm,周边部比较平坦。晶状体形似双
2、凸镜的透明组织,由小带纤维悬挂于瞳孔后面,睫状肌收缩时小带松弛,晶状体依靠其本身的弹性而变厚,前后表面的曲度增加,整体屈光度增加,利用看清近处物体,称为调节。在角膜和水晶体之间为虹膜,中间开有一个可以自动控制大小的孔,让适当的光线进来,称为瞳孔。前方(qinfng)、后房前房为角膜后面、虹膜和晶状体前面的孔隙,充满着房水。后房(hu fn)为位于虹膜后面、睫状体、晶状体周边部之间的孔隙,也充满着房水。房水的主要功能是维持眼内压,并维持晶状体的代谢。玻璃体一透明胶样组织,充填于视网膜内的空间。占眼球4/5的容积(rngj)。具有保护视网膜、缓冲震动功能。视网膜是接近黑的深红色,反光很弱,其上面布
3、满感光细胞。正对眼球中心有一个直径约为2mm的黄色区域,称为黄斑,黄斑中心有一小凹,称为中央凹,面积为1平方毫米。 视网膜上面有两种感光细胞,一种叫做视锥细胞,另一种叫做视杆细胞。视锥细胞是像一个玉米的锥形,尖向外,只对较强的光敏感,至少有分别感觉红、蓝、绿三种颜色的视锥细胞存在,因此能够感知颜色。视杆细胞只有一种,因此没有颜色感觉,但灵敏度非常高,可以看到非常暗的物体。 视锥细胞在黄斑里面非常集中,尤其是在中央凹里面最为集中,是产生最清晰视觉的地方。视杆细胞恰好在黄斑里面最少,除此之外分布的比较均匀,距离中心1020度的范围内相对集中些。在比较暗的情况下,视锥细胞就不再起作用了,只能是分布广
4、而相对稀疏的视杆细胞起作用,一次人眼的分辨能力大大下降。中心黄斑部分视力下降到0.05,反而不如黄斑以外,非黄斑区域视力基本不变,最好视力在黄斑附近,大约偏离中心15度左右,为0.1,这时的视力,称为暗视觉。但由于视杆细胞只有一种,因此是分辨不出物体颜色的,因此我们观察星云时,看不出颜色。二、人眼的视觉特征人眼的视觉系统是世界上最好的图像处理系统,但它远远不是完美的。人眼的视觉系统对图像的认知是非均匀的和非线性的,并不是对图像中的任何变化都能感知。例如图像系数的量化误差引起的图像变化在一定范围内是不能为人眼所觉察的。因此,如果编码方案能利用人眼视觉系统的一些特点,是可以得到高压缩比的。对人眼视
5、觉特性的深入研究及由此而建立的各种数学模型,一直是各种图像数字压缩算法的基础。人眼对380780纳米内不同波长的光具有不同的敏感程度,称为(chn wi)人眼的视敏特性。 衡量(hng ling)描述人眼视敏特性的物理量为视敏函数和相对视敏函数。1.1视敏函数(hnsh) 在相同亮度感觉的条件下,不同波长上光辐射功率的倒数可以用来衡量人眼对各波长光明亮感觉的敏感程度。称为视敏函数K()=1/pr() 。1.2 相对视敏函数 实验表明,人眼对波长为555纳米的光最敏感,因此把任意波长的光的视敏函数与最大视敏函数值K(555)相比的比值称为相对视敏函数。2.1对比灵敏度 人眼对亮度光强变化的响应是
6、非线性的,通常把人眼主观上刚刚可辨别亮度差别所需的最小光强差值称为亮度的可见度阈值。也就是说,当光强I增大时,在一定幅度内感觉不出,必须变化到一定值I+I时,人眼才能感觉到亮度有变化,I/I一般也称为对比灵敏度。因此恢复图像的误差如果低于对比灵敏度,即不会被人眼察觉。此外,高频部分在相同的灵敏度阈值下,色差信号Y-R空间频率只有亮度Y的一半,色差信号Y-B空间频率只有亮度Y的1/4。人眼对于运动图像的对比灵敏度与时间轴上信息的变化速度有关,随着时间轴变化频率的增加,人眼所能感受到的图像信息的误差阈值呈上升趋势,视觉上的这种动态对比灵敏度特性表现为图像序列之间相互掩盖效应。可见度阈值和掩盖效应对
7、图像编码量化器的设计有重要作用,利用这一视觉特性,在图像的边缘可以容忍较大的量化误差,因而可使量化级减少,从而降低数字码率。2.2分辨率当空间平面上两个黑点相互靠拢到一定程度时,离开黑点一定距离的观察者就无法区分它们,这意味 着人眼分辨景物细节的能力是有限的,这个极限值就是分辨率。研究表明人眼的分辨率有如下一些特点:当照度太强、太弱时或当背景亮度太强时,人眼分辨率降低。当视觉目标运动速度加快时,人眼分辨率降低。人眼对彩色细节的分辨率比对亮度细节的分辨率要差,如果黑白分辨率为1,则黑红为0.4,绿蓝为0.19。2.3马赫效应当亮度发生跃变时,会有一种边缘增强的感觉,视觉上会感到亮侧更亮,暗侧更暗
8、。马赫效应会导致局部阈值效应,即在边缘的亮侧,靠近边缘像素的误差感知阈值比远离边缘阈值高34倍,可以认为边缘掩盖了其邻近像素,因此对靠近边缘的像素编码误差可以大一些。三、视觉(shju)感知对时间(shjin)频率的感知时间频率(pnl)即画面随时间变化的快慢。Kelly.D.H用亮度按时间正弦变化的条纹做实验,亮度Yt) = B(1+mcos2ft)。改变m, 测试不同时间频率f下的 HYPERLINK /subview/2186253/2186253.htm t /view/_blank 对比敏感度。实验表明时间频率响应还和平均亮度有关。在一般室内光强下,人眼对时间频率的响应近似一个 HY
9、PERLINK /subview/204524/204524.htm t /view/_blank 带通滤波器。对1520Hz信号最敏感,有很强闪烁感(flick),大于75Hz响应为0,闪烁感消失。刚到达闪烁感消失的频率叫做临界融合频率(CFF)。在较暗的环境下,呈低通特性,且CFF会降低,这时对5Hz信号最敏感,大于25Hz闪烁基本消失。电影院环境很暗,放映机的刷新率为24Hz也不感到闪烁, 这样可以减少 HYPERLINK /subview/283601/283601.htm t /view/_blank 胶卷用量和机器的转速。而 HYPERLINK /subview/10849117/
10、11131864.htm t /view/_blank 电脑显示器亮度较大,需要75Hz闪烁感才消失。闪烁消失后,亮度感知等于亮度时间平均值(塔鲁伯法则)。这种低通特性,也可以解析为 HYPERLINK /view/1004663.htm t /view/_blank 视觉暂留特性,即当影像消失/变化时,大脑的影像不会立刻消失,而是保留一个短暂时间。生活中常感受到的 HYPERLINK /view/3295852.htm t /view/_blank 动态模糊,运动 HYPERLINK /view/3457121.htm t /view/_blank 残像也和这个有关。有很多电子产品设计利用了
11、这一现象,例如 HYPERLINK /view/52538.htm t /view/_blank LED数码管的动态扫描,LED旋转字幕等。对运动物体(wt)感知观察一个运动物体,眼球会自动跟随其运动,这种现象(xinxing)叫随从运动(eye pursuit movement)。这时眼球和物体的 HYPERLINK /subview/1205324/1205324.htm t /view/_blank 相对速度(xin du s d)会降低,我们能更清晰地辨认物体。例如观看球类比赛(如棒球),尽管棒球的运动速度很快,由于随从运动,我们仍够看得到球的大概样子 (但会有 HYPERLINK /
12、subview/415325/415325.htm t /view/_blank 运动模糊)。如果我们把眼睛跟着风扇转动方向转动,会发现对扇叶细节看得较清楚。眼球随从最大速度为45度/秒,因此我们不可能看清楚一颗子弹飞行。空间频率即影像在空间中的变化速度。用亮度呈空间 HYPERLINK /view/295487.htm t /view/_blank 正弦变化的条纹做测试,亮度Y(x,y) = B(1+mcos2fx), 给定条纹频率f为一固定值(看作是宽度),改变振幅m(看作 HYPERLINK /view/66029.htm t /view/_blank 对比度),测试分辨能力。显然m越大
13、分辨越清楚,测试不同条件下(不同cpd)可分辨的最少m值,定义1/mmin为 HYPERLINK /subview/2186253/2186253.htm t /view/_blank 对比敏感度(contrast sensitivity)。定义人眼的对空间感觉的角度频率:cpd: cycle / degree ,表示眼球每转动一度扫过的黑白条纹周期数。对给定的条纹,这个值与人眼到 HYPERLINK /view/78216.htm t /view/_blank 显示屏的距离有关,对于同样大小的屏幕,离开越远,cpd越大。通常人眼对空间的感觉相当于一个 HYPERLINK /subview/2
14、04524/204524.htm t /view/_blank 带通滤波器。最敏感在25个cpd ,空间 HYPERLINK /subview/141523/141523.htm t /view/_blank 截止频率为30cpd。比如我们看油画和电视机屏幕时,当距离离开一定远,cpd增大,人的 HYPERLINK /view/18941.htm t /view/_blank 眼睛就分辨不了象素点细节,便感觉不到颗粒感了。当人观察一个静止影像时,眼球不会静止一处(精神病人除外), 通常停留在一处几百 HYPERLINK /subview/251176/251176.htm t /view/_b
15、lank 毫秒完成取像后,移到别处取像,如此持续不断。 这种运动称为跳跃性运动(saccadic eye movement)。研究表明跳跃性运动可以增大 HYPERLINK /subview/2186253/2186253.htm t /view/_blank 对比敏感度,但敏感度峰值却减少。模式识别人们在观察事物或现象的时候,常常要寻找它与其他事物或现象的不同之处,并根据一定的目的把各个相似的但又不完全相同的事物或现象组成一类。字符识别就是一个典型的例子。例如数字“4”可以有各种写法,但都属于同一类别。更为重要的是,即使对于某种写法的“4”,以前虽未见过,也能把它分到“4”所属的这一类别。人
16、脑的这种思维能力就构成了“模式”的概念。在上述例子中,模式和集合的概念是分未弄的,只要认识这个集合中的有限数量的事物或现象,就可以识别属于这个集合的任意多的事物或现象。为了强调从一些个别的事物或现象推断出事物或现象的总体,我们把这样一些个别的事物或现象叫作各个模式。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法(fngf)。前者是生理学家、心理学家、 HYPERLINK /view/7868.htm t /_blank 生物学家和神经生理学家的研究内容(nirng),后者通过数学家、信息学专家
17、和 HYPERLINK /view/92404.htm t /_blank 计算机科学工作者近几十年来的努力(n l),已经取得了系统的研究成果80年代初(1982,1984,1985),陈霖提出视觉拓扑理论(visual topological theory)。该理论认为,在视觉处理的早期阶段,人的视觉系统首先检测图形的拓扑性质;它对图形的大范围拓扑性质敏感,而对图形的局部几何性质不敏感。 图形的拓扑性质(topological properties):指在拓扑变换下图形保持不变的性质和关系,如连通性(connectedness)、封闭性(closedness)、洞(hole),都是典型的拓扑性质,而大小、角度、平行性等几何性质则不是拓扑性质。 按照人们的直觉经验,圆盘、三角形和正方形是明显不同的图形;但按拓扑学的观点,由于它们都是实心图形,因而在拓扑性质上是等价的。相反,圆盘和圆环按直觉经验是相似的,而按其拓扑性质讲,则是不等价的。 陈霖认为,图形的封闭性、连通性、洞都是图形的拓扑学性质。图形的具体形状可能千差万别,但只要它们的拓扑性质相同,就可以说它们是拓扑性质等价的图形。在视觉早期
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 基于供应链管理的流通企业仓储物流优化研究
- .NET开发工程师招聘面试题及回答建议(某世界500强集团)2024年
- 第五章二元一次方程复习练习20222023学年北师大版数学八年级上册
- 专题22计数原理概率随机变量及其分布(选填压轴题)-2022年高考数学高分必刷必过题
- 2024年工程劳务分包:基坑支护专业合作协议
- 《第1节 原子结构》(同步训练)高中化学必修2-鲁科版-2024-2025学年
- 2024年度大数据中心路灯智能化控制系统合同
- 2024年度冶金行业装载机租赁合同
- 2024年建筑行业实习生合同:培养新一代人才
- 人教版英语八年级上册Unit 5 训练案
- 絮凝搅拌机操作规程
- 高考文言文阅读模拟训练:苏轼《晁错论》(附答案解析与译文)
- 小学数学 三年级上《去游乐园》教学设计
- 小学综合实践活动-我做急救小医生教学设计学情分析教材分析课后反思
- 湖北三环III型高压变频器用户手册(V10)
- 高中数学必修二 第六章 知识总结及测试(无答案)
- DB13T 5387-2021 水库库容曲线修测及特征值复核修正技术导则
- 学好普通话很重要
- 大数据治理平台解决方案
- 软件平台安全体系建设方案
- MBR污水处理设备说明书
评论
0/150
提交评论