大数据的采集_第1页
大数据的采集_第2页
大数据的采集_第3页
大数据的采集_第4页
大数据的采集_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、+新一代数据体系中,将传统数据体系中没有考虑过的新数据源进行归纳与分类,可将其归纳为线上行为数据与内容数据两大类。+线上行为数据:页面数据、交互数据、表单数据、会话数据、其他。+内容数据:应用日志、电子文档、机器数据、语音数据、社交媒体数据、其他。+数据采集的传统含义是将被测对象的各种参量通过各种传感元件做适当转换后,再经信号转换、采集、量化、编码、传输等步骤,最后送到计算机系统中进行处理、分析、存储和显示。+采集的数据大多是瞬时值,也可是某段时间内的一个特征值。+数据测量方法有接触式和非接触式+大数据的数据采集是在确定用户目标的基础上,针对该范围内所有结构化、半结构化、非结构化的数据的采集来

2、源单一,数据量相对大数据较小结构单一关系数据库和并行数据仓库 传统的数据采集来源广泛,数据量巨大数据类型丰富,包括结构化、半结构化、非结构化 大数据的数据采集分布式数据库+包括硬件部分和软件部分+硬件部分又分为模拟部分和数字部分+硬件:传感器、前置放大器、滤波器、多路模拟开关、采样/保持器、A/D转换器和计算机系统+临床试验电子数据采集系统+EDS是通过互联网从试验中心直接远程收集临床试验数据的一种数据采集系统+包括数据录入、数据导出、试验设计、编辑查询、操作痕迹、系统安全、在线交流、医学编码、支持多语言1.提高了临床研究的效率,缩短了临床研究周期2.通过逻辑检查提高了数据质量3.对研究质量的监测更加方便大数据的主要来源1.商业数据2.互联网数据3.传感器数据大数据的采

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论