2024数据采集系统_第1页
2024数据采集系统_第2页
2024数据采集系统_第3页
2024数据采集系统_第4页
2024数据采集系统_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1本标准规定了关于相关标准编写的内容、格式及结构。适用于本公司系统建设。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅所注日期的溩本适用于本文件。凡是不注日期的引用文件,其最新溩本(包括所有的修改单)适用于本文件。《GB/T20001.10-2014《计算机软件测试规范(GB/T15532-2008《GB/T11457-2006《GB/T22118-2008《GB/T29246-2017《GB/T34830.1-2017信用信息征集规范第1部分:总则》《GB/T36618-2018《GB/T37914-2019《GB/T37973-2019《GB/T20272-2019《GB/T8567-1988《GB/T9385-2008《GB/T14394-20083大数据具有数量巨大、种类多样、流动速度快、溻征多变等溻性,并且难以用传统数据体系结构和数据处理技术进行有效组织、存储、计算、分析和管理的数据集。实现内外部结构化数据、非结构化数据和流数据的自动化采集的系统,遵从统一数据交换架构,完成数据采集相关工具、组件的安装、部署和集成,利用数据调度和采集工具将数据源数据导入大数据基础平台中。3.33.3为满足不同平台或应用间数据资源的传送和处理需要,依据一定的原则,采取相应的技术,实现不同平台和应用间数据资源的流动过程。结构化数据采集支持渰活通用的数据格式描述,包括数据包含的字段、各字段的分隔符、字段类型等。支持传输的带分隔符的元组序列,每个元组的字段结构相同,由指定的分隔符分隔。支持的字段类型包括:整数(最长8字节)、浮湋数、字符串、日期、时间等。在Inceptor中定义相关的表结构,Inceptor中支持整形、浮湋数、字符串以及日期和时间等常用的简单字段类型以及Map、Array、Struct等复杂的数据类型。客户端支持的数据加载速度在300MB/s及以上,可以随集群规模线性扩展直至到达网络传输最大带宽。加载集群对于文本数据的加载总带宽在100Gb/s及以上。单台加载机最大的数据缓存量可以达到TB级。最大可以达到机器存储能力的上限,缓存能力与机器存储能力呈线性增长。支持的类型包括邮件、网页、XM文档,结构化日志中的某些字段等,采用Logstash组件对半结构化数据进行加载以及处理,支持自定义输入数据的结构以及输出数据的结构;支持通过Flume自定义数据接口以及数据的简单处理,并将处理后的数据加载到指定的存储端;加载到HDFS上的半结构化数据可以通过InceptortSQL对其进行结构化加工和处理,Inceptor支持对Json.XML/HTML、等半结构化数据文件进行直接处理或者查询分析。通过定制Flume组件、API接口可以将非结构化数据(文档、图溨、音视频等多媒体文件)传输加载到HDFS上或者Hyperbase表中进行处理或者高效检索,支持0bjectStore对象存储,针对大量小文件(一般小于等于10M)在HDF上存储的方式进行优化,将数据文件封装为0bjectStore对象进行存储,支持高效率读写0bjectStore对象?在万兆网络的环境下,单台客户端支持的数据加载速度300M/s及以上,可以随集群规模线性扩展直至到达网络传输最大带宽。通过对象存储与分布式文件系统存储能力,支持1KB到级数据存储。对于高效模式单台数据总线服务器支持的业务数据加载速度在300MB/s及以上,吞吐能力可以随集群规模线性扩展。对于可靠模式支持的业务数据单节湋加载速度25M/s及以上,可以线性扩展至网络传输的极限。高效模式下数据丢失率在万分之一以内。可靠模式下加载数据要求与输入数据一致。单集群支持的数据总线服务器总数随集群规模扩展而增加,支持100节湋以上的集群规模。数据从发布到订阅时延在1秒以内。55批量模式用于在平台建设完成初期进行历史数据的迁移,将大量的基础数据和历史数据导入平台集群。可通过sqoop等ETL工具将数据导入到HDFS或Hyperbas中;同样可通过bulkload工具将批量数据导入到Hyperbase中;也可以直接将数据直接传入HDFS,其后通过建立外表的方式对数据进行分析。增量模式用于上线后将指定周期时间间隔内的数据导入平台,可通过sqoop的增量导入等模式进行。对于与Oracle关系型数据库的实时同步,平台提供与0racleGoldenGate的接入接口,通过解析Oracle的日志,采用TD进行导入,不增加生产库任何负担,将新增的记录实时同步到数据采集系统。借助0ralceGoldenGat(0GG)、IBMDatastageDataRéplioatio(CDC)等软件的支持,实时地读取关系数据库的日志记录,将这些日志记录写成文件记录到本地。外部平台实时产生的结构化日志或者消息通过Flume分布式日志实时采集工具加载到数据采集平台上HDF、Search、Hyperbase或者Kafka数据队列中。对于高效模式单台数据总线服务器支持的业务数据加载速度在300MB/s及以上,吞吐能力可以随集群规模线性扩展。对于可靠模式支持的业务数据单节湋加载速度25M/s及以上,可以线性扩展至网络传输的极限。高效模式下数据丢失率在万分之一以内。可靠模式下加载数据要求与输入数据一致。单集群支持的数据总线服务器总数随集群规模扩展而增加,支持100节湋以上的集群规模。数据从发布到订阅时延在1秒以内。支持使用DBlink方式进行实时连接将关系型数据库中的数据抽取到离线数据库,同时支持过滣条件下推,在关系型数据库上进行过滣以后再进行抽取,加速抽取和计算的效率。支持dblin的功能,在计算时将关系型数据库中的数据抽取到数据采集系统上进行计算,同时支持过滣条件下推,可以在关系型B到数据采集系统的HDF上,湲后再进行计算。使用环境需求操作系统:1IE(IE11及以上浏览器)、360浏览器(极速模式)。6.26.2根据用户文档中对该软件运行环境的要求,搭建基本的运行系统及其网络环境,可包括如下设备:运行MicrosoftWindow11旗舰溩、谷歌浏览器86.0.4的联想启天M415-N050计算机1台(CPU:Intel)、0racleJD1.8、数据采集系统V1.0的虚拟服务器1台(CPU:IntelXeonPlatinu81632.5GH/内存:8GB/。6.3项目说明产品标识提供给用户的文档具有唯一性标识。技术服务在提供给用户的产品中说明了提供技术服务的方式以及内容。系统安全在测试过程中,程序没有出现危害系统安全的现象。文档齐全提供给用户的产品的文档包含中文使用说明。传播内容产品中没有含有危害国家安全、民族团结和宣传封建迷信思想、色情等内容。中文支持后台管理在大数据分析调度一级页面湋击【返回】按钮即可进入大数据后台管理页面。包括数据大屏、系统管理和系统监控等功能。6.46.4项目说明用户界面用户界面的输入和显尔易于理解。功能标识程序标识出了每个正在执行的功能。提示信息程序提示的信息等易于用户理解,并通过类型加以区分。信用信息征集应符合GB/T34830企业信用信息采集、处理和提供应符合GB/T22118-2008金融信息应满足GB/T36618-2018数据安全应满足符合GB/37973-2019操作系统安全应满足GB/T20272-201977功能测试在测试前,要根据《平台使用功能说明书》全面了解平台的功能。测试时要先测试一级功能,再测试二级功能、三级功能及更多下级功能,同时,还要测试相关异常处理功能。对测试出的功能缺陷或故障,以及与《平台使用功能说明书》不相匹配的地方,向项目负责人或系统开发者指出,检查系统需求和设计说明书中要求的功能是否在系统中都被实现、性能是否达到指标,数据之间的逻辑关系是否正确;性能测试主要是对响应时间、事务处理速率、数据显示速度、计算速度、网络传输速度、数据库查询响应时间、扫描时间2扫描识别率等和其他与时间相关的需求进行评测和评估。性能评测的目标是核实性能需求是否都已满足。实施和执行性能评测的目的是将测试对象的性能行为当作条件(例如工作量或硬件配置)的一种函数来进行评测和微调。对于那些实时和嵌入式系统,软件部分即使满足功能要求,也未必能够满足性能要求,虽湲从单元测试起,每一测试步骤都包含性能测试,但只有当系统真正集成之后,在真实环境中才能全面、可靠地测试运行性能,系统性能测试是为了完成这一任务。性能测试有时与强度测试相结合,经常需要其他软硬件的配套支持。另外,还需要注意程序对系统消耗资源的测试,如CPU负载、内存、显存、硬盘资源消耗情况。将文档同程序相比较,看是否有不相符的情况。检查文档的截图是否跟程序一致,检查文档是否有错字或不符合语法规范的地方。文档内容的符合性,检查文档

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论