大数据应用基础-图像数据_第1页
大数据应用基础-图像数据_第2页
大数据应用基础-图像数据_第3页
大数据应用基础-图像数据_第4页
大数据应用基础-图像数据_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、图像数据大数据应用基础魏炜1计算机视觉的重要性图像是信息的重要载体。人类获取外界信息中,80%左右来自视觉。2计算机视觉的基本原理 首先,从图片中提取出特征。这个特征不仅是每个像素的颜色,更重要的是更高级的特征,例如形状、甚至图片中物体的名称。 进而,可以对大量图片进行聚类、分类、搜索。3计算机视觉的主要辅助技术 图像压缩:可以减少描述图像所用的数据量。 图像增强和复原:这是一种图像预处理。目的是提高图像质量,使图像更加清晰。 图像分割:把图像中有意义的部分提取出来,例如边缘、区域等。 图像融合:把几个关于某一场景的图像合并,最大限度地利用多个图像来源之间的互补信息,生成一个新图像。4如何对韩

2、国美女进行人脸识别 2013年韩国选美竞赛的20名参赛美女。 对参赛选手进行人脸识别颇有难度。发型识别呢?5重点:人脸 拍摄人脸,就能识别出这个人的表情:Emotient、Affectiva 拍摄人脸,就能在人脸数据库找出与其相似的人脸:百度魔图、北京旷视科技的Face+。 人脸数据库可以是明星脸数据库(百度)、也可以是社交媒体上的全部头像(Face+)、也可以是罪犯人脸数据库(MorphoTrust) 从视频中识别出含有某明星的片段:Orbeus 身份识别例如,Face+的云脸应用锁、灏泷智能科技的FaceEID人脸身份实证、杭州热和科技 检测驾驶员疲劳驾驶精神状态,并进行预警:灏泷智能科技

3、6人脸:识别表情、性别、年龄、种族 旷视科技:目前只能识别微笑程度不能识别其他情绪7人脸验证8重点:物品 拍摄任意一个物品,就能给出物品的名称:Camfind、百度轻拍 拍摄纸媒内容(例如广告、海报),就能链接到这个商品的零售网页,或者得到商家优惠券:Target公司的In a Snap手机应用、腾讯、基美文化传媒的基美耀拍APP(与亮风台合作开发)、亿拍天下 拍摄一件衣服,就能在零售商数据库中找到这件衣服,或者相似的衣服:Snap Fashion、Style-Eyes、Slyce、搜鞋客、图图搜衣、亮风台9重点:物品 拍摄一个商品,就能在零售商数据库中找出这件商品及同款商品的介绍、评论,并进

4、行比价,而且能进行购买:Viscovery、北京同创网讯、百度与唯品会的合作 拍摄一个景点,就能给出这个景点的名称、介绍:亮风台 拍摄一件展品,就能在数据库中找出这件展品的介绍:Guidico1011物品 拍摄葡萄酒酒标,就能给出商品信息、并进行比价、购买:佛山市咔嚓购的酒咔嚓APP。12物品 拍摄一组食物,就能给出这些食物的营养含量:芯草莓科技的微营养App。13物品 拍一个应用图标,能识别出这是什么APP:亮风台的应用拍拍APP14文字 拍摄外语文字,就能给出翻译:Viscovery、旷视科技 拍摄一个数学题,就能给出答案和解析:学习宝15有一些公司采用了深度学习 百度 Orbeus 旷视

5、科技 DNNresearch IQ Engines Looknow Clarifai Jetpac16重点:基础服务:基于深度学习的图片搜索 以图搜图:百度、谷歌 百度能识别出图片中的元素,例如河流、倒影、建筑、树木、白云、蓝天等。 拍摄图片,就能根据图中包含的元素生成一首诗:百度为你写诗 识别出画作中的视觉概念,例如鸭子、走路、死尸,进而根据描述性词汇组成的向量,用自然语言处理比较不同画作之间的相似度:达特茅斯学院和微软剑桥研究院17重点:基础服务:基于深度学习的图片自动分类 给照片自动加标签、归类,进而可以用关键词搜索图片:Orbeus、Madbits、百度云18和互联网广告结合 根据网页

6、上的图片,判断应该给这个网页的访问者展示什么广告:Cortica以往的互联网广告都是基于用户访问的网页中的文本内容了解用户的兴趣,而没有考虑到图片内容。19重点:图像输入的来源 手机摄像头 谷歌眼镜、百度眼镜20重点:物品识别准确率的挑战 物品形变会影响某些物品的识别。例如:同一件服装随着人的姿势不同,会发生很多形状上的变化。相比之下,建筑物的识别要容易很多。 拍摄角度也会影响人脸、服装等的识别 灯光明暗、物体反光也会影响物体识别。 拍摄焦距也会影响物体识别。 化妆也会影响人脸识别 干扰图像的遮挡会影响对商品图片的识别21一种加强人脸识别率的策略 把所有人脸图形都调整到正面照角度,然后生成给每个人脸正面照生成一个3D模型。 在这些3D模型之间进行比较,就更加准确。22如何降低对于隐私的担忧 尽量少把图像存储在云端 先不把技术用于涉及隐私的行业23重点:图像识别底层技术的开放 一些公司通过以下方式,把底层的技术开放给广大的、成千上万的开发者,由他们来设计各种各样的应用。云端API离线SDK开发包 例如:腾讯、Face+24语音识别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论