版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第14章场景解释14.1 线条图标记解释14.2 体育比赛视频排序14.3 计算机视觉系统模型14.4 计算机视觉理论框架14.1 线条图标记解释1.轮廓标记在线条图中对轮廓进行标记时的一些名词概念(1)刃边(2)翼边(3)折痕(4)痕迹(5)阴影14.1 线条图标记解释2.结构推理三面角点目标,处于常规位置14.1 线条图标记解释2.结构推理14.1 线条图标记解释3.回朔标记已知2-D线条图中的一组边,要给每条边赋一个标记,以解释3-D的情况回朔标记法将边排成序列,以深度优先的方式生成通路,依次对每条边进行所有可能的标记,检验新标记与其他边标记的一致性,依次赋给所有边的标记都满足一致性,则
2、得到一种标记结果 棱锥4个顶点分别用A,B,C,D表示14.1 线条图标记解释14.2 体育比赛视频排序1.体育比赛视频的特点一般均有较强的结构性总有一些高潮事件环境是特定的,比赛中有许多不定因素,事件发生的时间位置不能事先确定,所以比赛中无法控制视频生成过程有关特殊事件的精彩镜头是一大看点使用先验知识对精彩事件进行定义检测14.2 体育比赛视频排序2.比赛节目的结构(乒乓球比赛)比赛事件、发球事件、场间休息、观众和重放将节目中的镜头根据场景进行非监督聚类14.2 体育比赛视频排序3.目标检测和跟踪 基于客观指标 运动员检测 球桌检测 球检测 运动员跟踪 乒乓球跟踪14.2 体育比赛视频排序3
3、.目标检测和跟踪 白线框为运动员外接盒跟踪得到的乒乓球轨迹14.2 体育比赛视频排序4.精彩度判定和排序 (1)基本层的排序球运动的平均速度连续两次击球间球运动的平均距离运动员连续两次击球间运动的平均距离14.2 体育比赛视频排序4.精彩度判定和排序 (2)品质层的排序运动员移动的激烈程度球轨迹的品质击球的变化14.3 计算机视觉系统模型14.3.1 多层次串行结构14.3.2 以知识库为中心的辐射结构14.3.3 多模块交叉配合结构14.3.1 多层次串行结构将图像理解过程看作是一个信息加工过程,具有确定的输入和输出,因而将图像理解系统组织成一系列分别处于不同层次的模块并以串行方式结合起 来
4、,每个模块(在其他模块的协同配合下)按顺序执行一些特定的工作,从而逐步完成预定的视觉任务由底向上的处理,比较通用,但不一定总有 效。由顶向下的处理,在约束充分时效率会比较高,反之则不实用14.3.1 多层次串行结构14.3.2 以知识库为中心的辐射结构可以看作是一种类比于人类视觉系统的结构。它的特点是以知识为中心,系统整体不分层,信号在各个模块及知识库中多次进行交换处理14.3.3 多模块交叉配合结构将整个系统分成多个模块,各有确定的输入和输出,且互相配合交叉,比较灵活一个图,其中每个结点代表一个加工过程或加工任务,而结点间的连接则反映了信息的流动和过程的联系本书的整体框架,即本书所采用的计算
5、机视觉系统框架是对上述多模块交叉配合结构的系统框图根据教学需求经过调整而得到的14.3.3 多模块交叉配合结构14.4 计算机视觉理论框架14.4.1 马尔视觉计算理论14.4.2 对马尔理论框架的改进14.4.3 新理论框架的研究14.4.1 马尔视觉计算理论1.视觉是一个复杂的信息加工过程要解决两个问题。一个是视觉信息的表达问 题,另一个是视觉信息的加工问题2.视觉信息加工的三个要素14.4.1 马尔视觉计算理论2.视觉信息加工的三个要素一个任务要用计算机完成,它应该是可以被计算的。这就是可计算性问题,需要用计算理论来回答有了计算理论后,还必须要有算法实现,为此需要给加工所操作的实体选择一
6、种合适的表达有了表达和算法,在物理上如何实现算法也是必不可少的。特别是随着对实时性要求的不断提高,专用的硬件实现问题常常被提出来14.4.1 马尔视觉计算理论2.视觉信息加工的三个要素上述三个要素之间有一定的逻辑因果联系,但并无绝对的依赖关系箭头正向表示带有指导的含义,反过来则有作为基础的含义14.4.1 马尔视觉计算理论3.视觉信息的三级内部表达(1)基素表达一种2-D表达,它是图像特征的集合(2)2.5-D表达完全是为了适应计算机的运算功能而提出来的(3)3-D表达以物体为中心(也包括了物体的不可见部分)的表达形式14.4.1 马尔视觉计算理论3.视觉信息的三级内部表达如何由原始图的像素表
7、达出发,通过基素表达和2.5-D表达,最后得到3-D表达14.4.1 马尔视觉计算理论4.视觉信息处理是按照功能模块的形式组织起来的视觉信息系统应该包括许多模块,每个模块获取某一特定的视觉线索,进行一定的加工5.计算理论形式化表示必须考虑约束条件约束条件一般是借助先验知识获得的,利用约束条件可改变病态问题14.4.2 对马尔理论框架的改进马尔的理论也有其不足之处:(1)框架中输入是被动的,给什么图像,系统就处理什么图像(2)框架中加工目的不变,总是恢复场景中物体的位置和形状等(3)框架缺乏或者说未足够重视高层知识的指导作用(4)整个框架中信息加工过程基本自下而上,单向流动,没有反馈14.4.2
8、 对马尔理论框架的改进4个方面的改进:(1)主动视觉(2)有目的视觉(3)高层知识(4)反馈控制14.4.3 新理论框架的研究1.基于知识的理论框架(1)从图像特征中提取那些相对于观察方向在大范围内保持不变的分组和结构(2)利用概率排队的方法减小搜索空间(3)使3-D模型的投影直接与图像特征相匹配14.4.3 新理论框架的研究2.主动视觉理论框架(1)选择注意机制(2)注视控制14.4.3 新理论框架的研究3.计算机视觉的最终目标人类视觉系统是相当通用的计算机视觉系统。计算机视觉研究的一个重要目标就是要建立能完成各种视觉任务的通用系统计算机视觉是一个牵涉人类智能的问题。对于许多看起来非常简单的人类智能是否可能在计算机上复现,至今还没有定论这是一个值得研究和有所作为的领域,有着光明的前景,让我们一起努力吧!教程作者(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 石河子大学《应急人力资源管理》2022-2023学年第一学期期末试卷
- 物业智能化解决方案
- 石河子大学《数学文化赏析》2021-2022学年第一学期期末试卷
- 石河子大学《口腔颌面外科学》2022-2023学年第一学期期末试卷
- 石河子大学《工程热力学与传热学》2023-2024学年第一学期期末试卷
- 精神科新冠肺炎演练
- 沈阳理工大学《数学建模》2023-2024学年第一学期期末试卷
- 沈阳理工大学《液压与气动技术》2022-2023学年第一学期期末试卷
- 沈阳理工大学《电气控制与PC技术》2022-2023学年期末试卷
- 沈阳理工大学《场地设计》2021-2022学年第一学期期末试卷
- 百度投诉保证函
- 2.7-植被与自然环境的关系(精品课件)-2020-2021学年高一地理(新教材中图版必修第一册)
- 清欠工作管理制度管理办法
- 三甲评审文件盒资料--终稿
- 铁路项目桥梁墩台身施工方案
- 工作岗位风险评估工作规程
- 智能存包柜(储物柜)产品技术说明书
- 常见化学式大全
- 電鍍技術資料大全
- 偏拉墙体配筋分析及建议课件
- 消防电气检验批质量验收记录表(共18页)
评论
0/150
提交评论