![一种基于Hadoop的视频大数据分布式解码方法冯强_第1页](http://file3.renrendoc.com/fileroot3/2021-11/6/0498d276-c58f-4d77-842a-d6c131530b2d/0498d276-c58f-4d77-842a-d6c131530b2d1.gif)
![一种基于Hadoop的视频大数据分布式解码方法冯强_第2页](http://file3.renrendoc.com/fileroot3/2021-11/6/0498d276-c58f-4d77-842a-d6c131530b2d/0498d276-c58f-4d77-842a-d6c131530b2d2.gif)
![一种基于Hadoop的视频大数据分布式解码方法冯强_第3页](http://file3.renrendoc.com/fileroot3/2021-11/6/0498d276-c58f-4d77-842a-d6c131530b2d/0498d276-c58f-4d77-842a-d6c131530b2d3.gif)
![一种基于Hadoop的视频大数据分布式解码方法冯强_第4页](http://file3.renrendoc.com/fileroot3/2021-11/6/0498d276-c58f-4d77-842a-d6c131530b2d/0498d276-c58f-4d77-842a-d6c131530b2d4.gif)
![一种基于Hadoop的视频大数据分布式解码方法冯强_第5页](http://file3.renrendoc.com/fileroot3/2021-11/6/0498d276-c58f-4d77-842a-d6c131530b2d/0498d276-c58f-4d77-842a-d6c131530b2d5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、一种基于Hadoop的视频大数据分布式解码方法冯强 目录目录总结总结实验结果分析实验结果分析解码方案描述解码方案描述研究现状研究现状项目简介项目简介项目简介项目简介v项目名称:项目名称:HadoopCV Hadoop + Computer Visionv项目任务项目任务 存储海量视频数据;存储海量视频数据; 基于基于Hadoop处理视频数据;处理视频数据;视频大数据视频大数据 + 分布式解码分布式解码常规处理流程HadoopCV处理流程项目简介项目简介视频数据IplImageOpenCV算法处理MapperReducer视频数据IplImage算法处理项目简介项目简介v系统边界系统边界目录目录
2、总结总结实验结果分析实验结果分析解码方案描述解码方案描述研究现状研究现状项目简介项目简介研究现状研究现状v单机解码单机解码 使用单一计算节点进行解码,数据存储和解码都在本地完成,目前流行的视频播放软件均采用这种模式 优点:架构简单,无需提供额外的视频管理机制,即用即解; 缺点:解码效率受节点配置影响,拓展性较差,数据安全性也较差,对大数据的处理能力不足。v分布式解码(转码)分布式解码(转码) 利用分布式系统进行解码,视频数据先分割成适合分块处理的大小,然后上传到分布式文件系统上。需要进行解码的时候,再将数据下载到本地,通过第三方解码库的调用进行解码,处理完成之后重新上传。这种解码模式数据存储在
3、分布式文件系统上,但解码的时候需要数据的下载和上传。 优点:利用了分布式计算框架,通过并行处理提高了解码效率; 缺点:没有充分利用分布式文件系统存储的优点,数据上传和下载的过程增加了系统开销,另外数据需要进行分割之后上传,需要提供相应的管理机制。研究现状研究现状v基于基于Hadoop的视频大数据分布式解码方的视频大数据分布式解码方法:法: 架构简单,无需提供额外的视频管理机制; 利用了分布式计算框架,通过并行处理提高解码效率;研究现状研究现状v视频压缩原理视频压缩原理原始帧关键帧GOP解码需要:解码需要:头数据;头数据;1. 关键帧;关键帧;研究现状研究现状vHadoop直接处理视频数据直接处
4、理视频数据 问题一:问题一:帧不完整 问题二:问题二:分割后缺少关键帧 问题三:问题三:分割后缺少头数据目录目录总结总结实验结果分析实验结果分析解码方案描述解码方案描述研究现状研究现状项目简介项目简介解码方案描述解码方案描述v数据预处理:数据预处理: HDFS设计之初是为了处理文本大数据,但只要被写入的数据很少被改动,并且对数据的操作主要是大规模的流式读取和小规模的随机读取,原则上HDFS就可以存储任何类型的数据,因此,视频数据可以不加任何处理的上传到HDFS之上。v数据物理分割:数据物理分割: 视频文件在上传到HDFS之后,根据用户设定的Block大小,默认顺序分割成64M大小的数据块,分布
5、式的存储于集群中的DataNode之上,此时,所有大于64M的文件都被物理分割。NameNode通过维护文件系统的元数据(metadata)对文件进行管理,而HDFS面向用户的接口又是一个完整连续的文件,HDFS对用户隐藏了分割的细节。解码方案描述解码方案描述v数据逻辑分割:数据逻辑分割: Block:物理分割数据块;物理分割数据块; Split:逻辑分割数据块;逻辑分割数据块;解码方案描述解码方案描述vHadoop直接处理视频数据直接处理视频数据 问题一:问题一:帧不完整 问题二:问题二:分割后缺少关键帧 问题三:问题三:分割后缺少头数据v问题原因:问题原因: Hadoop不知道数据内部组织
6、方式; 按字节分割,不是按照帧的位置进行分割;v解决问题关键:解决问题关键: 如何进行按照帧的位置进行分割解码方案描述解码方案描述v数据逻辑分割:数据逻辑分割: Split定义:定义:依然按照Block起止位置进行定义,数据大小同Block大小; Split读取规则:读取规则:向前读取;丢弃第一个关键帧之前数据,确定Split的真正起始帧位置;Split的终止帧位置设定在Block结束字节位置附近,定义在结束字节位置之后的第一个I帧;解码方案描述解码方案描述v数据逻辑分割:数据逻辑分割: 问题一:问题一:帧不完整 问题二:问题二:分割后缺少关键帧解码方案描述解码方案描述v分布式解码:分布式解码
7、: FFmepg: FFmpeg是一个开源免费跨平台的视频和音频流方案,可以运行在windows和linux上,包括一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。 Fuse-dfs: fuse-dfs是hadoop项目自带的一个功能模块。主要实现把dfs上的数据映射至本地指定mount点。由于现存的软件无法直接使用hdfs上的数据,所以此时可以借助fuse来实现本地文件系统的映射。解码方案描述解码方案描述v分布式解码:分布式解码: Split确定数据边界;确定数据边界; RecorderReader循环读取;循环读取; 解码数据;解码数据;vFFmpeg解码:解码:
8、支持本地文件接口;支持本地文件接口; 不兼容不兼容HDFS;vFuse-dfs挂载挂载HDFS:v 虚拟本地文件接口,提高兼容性;虚拟本地文件接口,提高兼容性;v 隐藏网络传输细节,通过网络传输隐藏网络传输细节,通过网络传输 视频头数据;视频头数据;解码方案描述解码方案描述v分布式解码:分布式解码: 问题三:问题三:分割后缺少头数据解码方案描述解码方案描述v输入输入/输出:输出:解码方案描述解码方案描述v输入输入/输出:输出: FrameNumWritable:标识帧位于视频帧序列的播放位置,以及帧对于的视频文件路径; ImageWritable: 标识帧的图像数据; Text:图像数据Has
9、h过后的文本数据; VideoMapper: 负责将解码过后的图像Hash成文本数据; VideoReducer: 负责将图像文本数据写入文件;解码方案描述解码方案描述v解码方案整体架构解码方案整体架构目录目录总结总结实验结果分析实验结果分析解码方案描述解码方案描述研究现状研究现状项目简介项目简介实验结果分析实验结果分析v实验集群概述:实验集群概述: Hadoop集群由15台PC机组成,每台PC机CPU为Intel(R) Pentium(R) 4 CPU 2.80GHz,内存为1.5G,硬盘为80G。其中1台作为集群Master,14台作为集群Slaves。v运行环境: 操作系统:Ubuntu
10、 12.04.1 Hadoop版本:1.0.3 JDK版本:1.7.0_07 OpenCV版本:2.4.2 ffmpeg版本:1.0实验结果分析实验结果分析v分布式分布式/单机解码效率对比:单机解码效率对比:实验结果分析实验结果分析v分布式分布式/单机解码效率对比:单机解码效率对比:实验结果分析实验结果分析v解码准确率测试:解码准确率测试: 把单机解码的视频作为样本视频记录E,分布式解码的视频为实际视频记录A。 帧数对比:比较A与E的视频帧数是否相同; 严格对比:将每一帧图像Hash成只包含头信息(图像长、宽、大小、通道数、深度)、图像数据的hash码。对比两条记录的这些信息来确定两帧图像是否
11、相等。 计算包含百分比:如果帧数相同且严格对比结果匹配,A与E完全相同;如果帧数相同但是严格对比结果不匹配,计算实际记录A与样本记录E中相互包含帧的百分比。实验结果分析实验结果分析v解码准确率测试:解码准确率测试:视频大小(视频大小(MB)E countE countA countA countEqualEqualE contain AE contain AA contain EA contain E15151796179611001003030419641961100100606077967796110010010010015584155841100100300300395373953711
12、0010050050071272712721100100102410241434011434011100100实验结果分析实验结果分析v分割大小对解码效率的影响:分割大小对解码效率的影响:实验结果分析实验结果分析v集群配置对解码效率的影响:集群配置对解码效率的影响: BlockSize实验结果分析实验结果分析v集群配置对解码效率的影响:集群配置对解码效率的影响: 节点数量节点数量目录目录总结总结实验结果分析实验结果分析解码方案描述解码方案描述研究现状研究现状项目简介项目简介总结总结v方案概述:方案概述: 基于Hadoop的视频大数据分布式解码方法,是一种分布式解码方法; 原始视频可以不用提前将分割即可直接上传到HDFS,由Hadoop进行物理分割; 逻辑分割Split的边界根据帧的位置进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度环保设备购置贷款合同范本
- 2025年度合肥工业学校食堂承包经营权转让合同书
- 2025年度智能仓储供应链服务合同
- 2025年度公路货运保险合同标的协议
- 邯郸2024年河北邯郸馆陶县选聘农村党务(村务)工作者90人笔试历年参考题库附带答案详解
- 菏泽2024年山东菏泽东明县文化和旅游局引进急需紧缺人才3人笔试历年参考题库附带答案详解
- 福建2025年福建省医学科学研究院招聘卫生健康政策研究高层次人才笔试历年参考题库附带答案详解
- 白山2025年吉林白山市县事业单位招聘应征入伍高校毕业生14人笔试历年参考题库附带答案详解
- 漯河2024年河南漯河市委党校(漯河行政学院漯河市社会主义学院)招聘2人笔试历年参考题库附带答案详解
- 济宁2025年曲阜师范大学招聘120人(博士长期招聘)笔试历年参考题库附带答案详解
- 新版药品管理法培训完整版本课件
- 医院信息系统HIS知识培训教学课件-HIS的主要内容
- 硝苯地平控释片
- 合成聚氨酯原料及助剂生产项目
- 四川省泸州市2019年中考物理考试真题与答案解析
- 部编版语文六年级下册全套单元基础常考测试卷含答案
- 2023年保险养老地产行业分析报告
- 保险公司防火应急预案
- 动物检疫技术-动物检疫的分类(动物防疫与检疫技术)
- 2024医师资格考试考生诚信考试承诺书
- 煤矿职业卫生培训课件2023
评论
0/150
提交评论