大数据采集与存储知到智慧树章节测试课后答案2024年秋山东交通学院_第1页
大数据采集与存储知到智慧树章节测试课后答案2024年秋山东交通学院_第2页
大数据采集与存储知到智慧树章节测试课后答案2024年秋山东交通学院_第3页
大数据采集与存储知到智慧树章节测试课后答案2024年秋山东交通学院_第4页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据采集与存储知到智慧树章节测试课后答案2024年秋山东交通学院第一章单元测试

关系模式学生信息(学号,姓名,年龄,性别,籍贯),其中的主键是()

A:年龄

B:性别

C:学号

D:姓名

答案:学号

Oracle是一个开源、免费的中小型关系型数据库管理系统。()

A:对B:错

答案:错NoSQL的全称是()

A:NotSql

B:其余选项都不是

C:NoSql

D:NotOnlySql

答案:NotOnlySql

键值数据库,是基于key-value模式,它使用简单的键值方法来存储数据。()

A:错B:对

答案:对()是最原始的SQLOnHadoop的解决方案,它是基于Hadoop实现的分布式数据仓库。

A:Hbase

B:Hive

C:ZooKeeper

D:Hadoop

答案:Hive

图数据库,以“图”数据结构存储和查询数据,使用节点表示数据模型中的实体,节点之间的边表示实体之间的关系。()

A:对B:错

答案:对

第二章单元测试

关于数据模型,下列说法正确的是()。

A:3种基本数据模型有图形模型、层次模型和关系模型

B:数据操作是对数据库静态特性的描述。

C:数据模型的三要素是数据结构、数据操作和数据完整性约束

D:数据模型是对数据库动态特性的描述。

答案:数据模型的三要素是数据结构、数据操作和数据完整性约束

关于学生关系,下列哪一个属性适合作为候选码()。

A:性别

B:年龄。

C:学号。

D:班级

答案:学号。

有学生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。要检索学生表中“所有年龄小于等于19岁的学生的年龄及姓名”,SQL语句正确的是()

A:SelectSnameFromStudentWhereSage<=19

B:SelectSage,SnameFromStudent

C:SelectSage,SnameFromStudentWhereSage<=19

D:Select*FromStudentWhereSage<=19

答案:SelectSage,SnameFromStudentWhereSage<=19

有学生表Student(S#char(8),Snamechar(10),Ssexchar(2),Sageinteger,D#char(2),Sclasschar(6))。若要“检索名字为姓张的所有同学姓名”,SQL语句正确的是()

A:SelectSnameFromStudentWhereSnameLike‘张%’

B:SelectSnameFromStudentWhereSnameLike‘张_’

C:SelectSnameFromStudentWhereSnameNotLike‘张__’

D:SelectSnameFromStudentWhereSnameLike‘张__’

答案:SelectSnameFromStudentWhereSnameLike‘张%’

SQL语言中,删除一个表的命令是()

A:REMOVE

B:CLEAR

C:DELETE

D:DROP

答案:DROP

在下列关于视图的叙述中,正确的是()

A:当修改某一视图时,导出该视图的基本表也随之修改。

B:若导出某视图的基本表被删除,该视图将不受任何影响;

C:视图—旦建立,就不能被删除;

D:当某一视图删除后,由该视图导出的其它视图也将自动删除;

答案:当修改某一视图时,导出该视图的基本表也随之修改。

查询时,若要输出无重复的记录,SELECT子句中使用的保留字是:()

A:TOPNPERCENT

B:TOPN

C:DISTINCT

D:ALL

答案:DISTINCT

查询结果输出时要求按“总评成绩”降序排列,相同者按“性别”升序,正确的子句是()

A:ORDERBY总评成绩,性别DESC

B:ORDERBY总评成绩ASC,性别DESC

C:ORDERBY总评成绩DESC,性别DESC

D:ORDERBY总评成绩DESC,性别

答案:ORDERBY总评成绩DESC,性别

参照完整性规则是指表的()必须是另一个表主键的有效值,或者是空值。

A:外键

B:主属性

C:候选键

D:主键

答案:外键

下面有关HAVING子句,说法不正确的是()

A:使用HAVING子句的同时不能使用WHERE子句

B:使用HAVING子句的作用是过滤掉不满足条件的分组

C:使用HAVING子句的同时可以使用WHERE子句

D:HAVING子句必须与GROUPBY子句同时使用,不能单独使用

答案:使用HAVING子句的同时不能使用WHERE子句

第三章单元测试

MongoDB是一个开源、高性能、无模式的文档型数据库。()

A:对B:错

答案:对MongoDB通过()来描述和存放数据。

A:BSON

B:XML

C:JSON

答案:BSON

查看当前正在使用的数据库命令()

A:get

B:set

C:use

D:db

答案:db

查找kate同学的专业,使用指令()完成。

A:.find({'xm'='kate'})

B:.find({'xm':'kate'})

C:.find({'xm='kate'},{zy=1})

D:.find({'xm':'kate'},{zy:1})

答案:.find({'xm':'kate'},{zy:1})

MongoDB中,用户可以将_id字段上的索引删除。()

A:对B:错

答案:错关系型数据库遵循BASE和CAP理论。()

A:对B:错

答案:错

第四章单元测试

大数据采集,又称大数据获取,是指从()等获取数据的过程。

A:传感器

B:企业系统

C:社交网络

D:其它智能设备

答案:传感器

;企业系统

;社交网络

;其它智能设备

网络爬虫的步骤是

1)选取一部分种子URL;

2)从待抓取URL队列中取出待抓取的URL,解析DNS,得到主机的IP地址,并将URL对应的网页下载下来,存储到已下载网页库中。此外,将这些URL放进已抓取URL队列;

3)将这些URL放到待抓取URL中;

4)分析已抓取URL队列中的URL,分析其中的其他URL,并且将这些URL放入待抓取URL队列,从而进入下一个循环。()

A:1)3)2)4)

B:2)3)4)1)

C:1)2)3)4)

D:2)4)1)3)

答案:1)3)2)4)

数据完整性指的是数据具有一个实体描述的所有必需的部分。()

A:错B:对

答案:对在大数据预处理中,需要数据清洗的主要类型包括以下几类()

A:异常值数据

B:重复值数据

C:缺失值数据

D:需要标准化的数据

答案:异常值数据

;重复值数据

;缺失值数据

数据清洗时重复值数据不能够删除。()

A:对B:错

答案:错在数据离散化中,常见的离散化方法有()

A:等宽划分

B:基于卡方分箱的方法

C:基于熵的离散化

D:聚类划分

E:等频划分

答案:等宽划分

;基于卡方分箱的方法

;基于熵的离散化

;聚类划分

;等频划分

第五章单元测试

爬虫就是能够实现网页数据爬取的程序。()

A:错B:对

答案:对Python中提供的requests库的get()方法能够实现爬取网页信息的功能。()

A:错B:对

答案:对在使用requests库获取网页资源过程中,最重要的两个对象就是Request和Response,()负责将客户端的请求发送给服务器。

A:Response

B:Request

答案:Request

HTML语言使用“标签对”来标记信息。其中,<html>……</html>标记一个HTML文件中标题的开始和结束。()

A:对B:错

答案:错以下程序段的运行结果是

frombs4importBeautifulSoup

htmlText='<p>解析页面</p>'

soup=BeautifulSoup(htmlText,'html.parser')

print(soup.p)()

A:<p>解析页面</p>

B:解析页面

C:'<p>解析页面</p>'

答案:<p>解析页面</p>

如果有网络爬虫频繁的访问服务器,则容易引发()问题。

A:个人隐私问题

B:网站的性能下降

C:法律风险

答案:网站的性能下降

任何网站都有自己的Robots协议,用来保护网站的信息不会被恶意访问。()

A:对B:错

答案:错

第六章单元测试

Kettle是一种常用的ETL工具,它支持图形化的GUI设计界面。()

A:错B:对

答案:对在数据清洗中,“输入”功能主要是实现ETL的数据抽取、加载、格式转换。()

A:对B:错

答案:错Kettle能够支持多种格式的数据输出,但不支持下面()文件格式。

A:word

B:json

C:excel

D:txt

E:MySql数据库

答案:word

kettle中的以下组件中,属于基本数据清洗的是()

A:连接字段

B:数据排序

C:数据替换

D:删除数据

答案:连接字段

;数据排序

;数据替换

;删除数据

Kettle让我们在可视化的界面中,通过拖拽实现数据处理。无需掌握复杂的编程技术也可以帮助我们完成数据的ETL处理。()

A:对B:错

答案:对Kettle中的job作业是指定时完成一系列指定的数据转换,并将结果以邮件的方式告知给我们。()

A:对B:错

答案:对

第七章单元测试

在本案例中,数据采集是通过()获取。

A:网络爬虫

B:社交网络

C:传感器数据

D:企业管理系统

答案:网络爬虫

在数据采集后,python中使用()库把数据存储到csv文件中。

A:request库

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论