大数据分析与应用知到章节答案智慧树2023年咸阳职业技术学院_第1页
大数据分析与应用知到章节答案智慧树2023年咸阳职业技术学院_第2页
大数据分析与应用知到章节答案智慧树2023年咸阳职业技术学院_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据分析与应用知到章节测试答案智慧树2023年最新咸阳职业技术学院第一章测试HDFS已经成为了大数据磁盘存储的事实标准,针对关系型以外的数据模型,开源社区形成了K-V(key-value)、列式、()、图这四类NoSQL数据库体系。

参考答案:

文档麦肯锡全球研究所对大数据的定义是()。

参考答案:

一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征大数据应用场景不包括()。

参考答案:

人群标签,精准营销DataWorks是一个提供了大数据OS能力、并以allinonebox的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。同时能满足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。()

参考答案:

对云原生数据仓库MySQL版(简称ADB,原AnalyticDBforMySQL)是一种高并发低延时的PB级新一代云原生数据仓库,全面兼容MySQL协议以及SQL:2003语法标准,可以毫秒级针对万亿级数据进行即时的多维分析透视和业务探索。()

参考答案:

对第二章测试ETL是Extract、Transform、Loading三个字母的缩写,即抽取、转换、()。

参考答案:

装载HBase是一个构建在HDFS上的分布式列存储系统,用于海量结构化、半结构化数据存储。()

参考答案:

对数据规约:在尽可能保持数据原貌的前提下,最大限度地精简数据量。主要包括属性选择和数据抽样两种方法。()

参考答案:

对数据清洗是针对原始数据,对出现的噪声进行修复、平滑或者剔除。包括异常值、缺失值、重复记录、错误记录等;同时过滤掉不用的数据,包括某些行或某些列。()

参考答案:

对使用算法确保历史模型能够用户预测特定的结果。()

参考答案:

对第三章测试SQL集数据查询、数据操纵、数据定义和数据库控制功能于一体,语句ALTERTABLE实现数据定义功能。()

参考答案:

对结构化查询语言(StructuredQueryLanguage)简称SQL()

参考答案:

对在SQL中,修改表结构应使用的命令是ALTER.()

参考答案:

对SQLServer的字符型,系统数据类型主要包括char、varchar、text。()

参考答案:

对SQL语句中删除表的命令是DROPTABLE.()

参考答案:

对SQL语句中,条件年龄是beween15and35表示年龄在15到35之间,且包括15岁和35岁.()

参考答案:

对要想用T-SQL语句从学生表中查询学号的前四个字符为“2004”第五个字符任意,后三个字符为“-05”的学生,条件表达式为()

参考答案:

学号LIKE‘2004_-05’SQL语句中删除表的命令是()

参考答案:

DROPTABLE当where子句、聚合函数、groupby子句和having子句同时出现在一个查询中时,最后执行的是()

参考答案:

having子句第四章测试外部数据的采集通常借助于()来完成?

参考答案:

网络爬虫公开数据的特点不包括()?

参考答案:

实时性下列不属于常用ETL工具的是()?

参考答案:

Kaggle()爬取的目标是有更新的已下载网页和新产生的网页。

参考答案:

增量式网络排除()是指采用适当的方法对在数据审查过程中发现的错误值、缺失值、异常值、可疑数据等等进行”清洗“,使数据变得规范、有效。

参考答案:

数据清洗数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务()

参考答案:

对第五章测试数据质量问题的来源分为四类()。

参考答案:

管理问题;信息问题;流程问题;技术问题在描述人的信息中存在Germany的国家名,这种属于数据质量问题的()

参考答案:

嵌入问题数据清洗的动作包括()

参考答案:

重复值;异常值发现和修复;缺失值填充重复值的清洗流程分为()。

参考答案:

清除多余记录;识别(即匹配)关于同一真实世界实体的类似记录;类似的记录被合并到一个包含所有相关属性的记录中,保证没有冗余记录处理缺失值常用的方法有()。

参考答案:

用最可能的值,去填充缺失的值;直接忽略哪些有缺失字段的记录,在数据分析的过程中不去使用即可第六章测试企业指标体系,是指在业务环境中,由一系列相互之间有逻辑联系的指标所组成的整体,从各个侧面反映出现象总体或样本的数量特征。()

参考答案:

对一个完整的数据统计指标有()三个部分组成。

参考答案:

指标统计的时间和空间范围;指标的名称,或者叫原子性指标;指标的计算方法或者修饰词数据指标按功能可分为()

参考答案:

考核指标;描述指标;监控指标在企业指标体系中有许多指标可以来衡量企业的生产运行情况,包括衡量产品销售、用户质量、市场活动、风险控制的效果。()

参考答案:

对微软的PowerBI分析工具优点是简单的操作就能实现复杂的分析,它的价格比竞争对手便宜得多。()

参考答案:

对第七章测试下列不属于数据可视化作用的是()。

参考答案:

数据采集下列属于反映发展趋势的可视化图表的是。()

参考答案:

****张量场可视化属于()。

参考答案:

科学可视化QuickBI的核心流程有()。

参考答案:

数据门户;创建数据集;电子表格;获取数据可视化可以将难以理解的原始数据交换成用户可以理解的模式和特征,并显示出来。依据可视化流程概念图,在原始数据和可视化中间,这一步骤是()。

参考答案:

数据处理和交换第八章测试商业智能也叫BI,它是BusinessIntelligence的缩写,是某企业的一个产品。()

参考答案:

错BI报表的核心要素()。

参考答案:

业务指标规则;业务指标定义;数据流;加工逻辑数据分析报告决是策者认识事物、了解事物、掌握信息、搜集相关信息的主要工具之一,它的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论