下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据库与数据挖掘智慧树知到期末考试答案2024年数据库与数据挖掘12在数据库的三级模式中,(
)是用户与数据库系统的接口,是用户用到的那部分数据的描述
A:内模式B:外模式C:模式D:存储模式答案:外模式Hive的计算引擎是什么(
)
A:HDFSB:SparkC:MapReduce答案:MapReduce解决并发操作带来的数据不一致性普遍采用(
)
A:存取控制技术B:封锁技术C:协商D:恢复技术答案:封锁在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:
(
)
A:渐进抽样B:分层抽样C:简单随机抽样答案:渐进抽样建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?
(
)
A:预测建模B:寻找模型和规则C:建模描述D:探索性数据分析答案:预测建模决策树中C4.5算法采用的划分标准是
(
)
A:信息增益B:信息增益比C:信息熵D:Gini指数答案:信息增益比当一个用户需要横跨多个项目对多个数据库进行操作的时候,可以通过哪个权限分组来进行管理(
)
A:用户B:角色C:管理员D:组答案:角色使用交互式的和可视化的技术,对数据进行探索属于数据挖掘的哪一类任务?(
)
A:建模描述B:预测建模C:寻找模型和规则D:探索性数据分析答案:探索性数据分析数据清洗的方法有(
)
A:错值修改B:去重C:缺失值填充D:其他三项都是答案:其他三项都是只有非零值才重要的二元属性被称作(
)
A:计数属性B:离散属性C:对称属性D:非对称的二元属性答案:非对称的二元属性决策树中不包含一下哪种结点(
)
A:根节点B:叶子节点C:内部节点D:外部节点答案:外部节点决策树中CART算法采用的划分标准是
(
)
A:信息增益B:Gini指数C:信息熵D:信息增益比答案:Gini指数在当前事务内,两条完全一样的查询语句返回的结果完全不同,这种情况属于(
)
A:网络延迟B:幻读C:不可重复读D:脏读答案:不可重复读在数据库中,软件错误属于(
)
A:活锁B:事务故障C:系统故障D:介质故障答案:系统故障以下选项不属于可视化基本特征的是(
)
A:必然性B:全面性C:专业性D:易懂性答案:全面性将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务(
)
A:频繁模式挖掘B:数据预处理C:分类与预测D:数据流挖掘答案:数据预处理以下哪些算法是分类算法(
)
A:DBSCANB:K-meansC:SVMD:EM答案:SVM数据挖掘常用的算法有(
)
A:聚类B:特征分析C:分类D:决策树归纳答案:分类;聚类;特征分析;决策树归纳下面哪些是spark比Mapreduce计算快的原因(
)
A:基于DAG调度框架B:基于Lineage容错机制C:基于分布式计算框架D:基于内存的计算答案:基于内存的计算;基于DAG调度框架;基于Lineage容错机制常见的文档数据库包括(
)
A:CouchDBB:LevelDBC:CassandraD:mongoDB答案:mongoDB;CouchDB下列属于Hadoop中数据压缩的一般使用场景的是(
)
A:输入压缩B:输出结果压缩C:中间结果压缩D:代码段压缩答案:代码段压缩关于L1和L2正则化,下面说法对的是
(
)
A:L2正则化标识各个参数的平方的和的开方值B:L2范数可以防止过拟合,L1范数不行C:L2正则化又叫Lasso
regularizationD:L1范数会值得权值稀疏答案:L2正则化标识各个参数的平方的和的开方值;L1范数会值得权值稀疏下列属于Hadoop自带的编解码器的是(
)
A:SnappyB:BZip2C:winzipD:Gzip答案:Snappy###winzip下列关于Hive中分区和分桶的说法正确的是(
)
A:分区表要尽可能减少分区层次B:分区属性的维度要尽量不同C:分区尽量级别要不同D:分区属性的维度要尽量相同答案:分区属性的维度要尽量相同Hadoop框架的缺陷有(
)
A:无法高效低支持迭代式计算B:过多的磁盘操作,缺乏对分布式内存的支持C:海量的数据存储D:MR编程框架的限制答案:海量的数据存储下列关于数据压缩说法正确的是(
)
A:可以增加分布式数据处理时的数据吞吐量与性能B:需要增加额外的CPU开销C:适用于计算密集型任务D:可以节约磁盘空间答案:适用于计算密集型任务Hive中使用SORT
BY关键字进行的排序不总是局部有序的。(
)
A:对B:错答案:对E-R图中的实体可以直接连接。(
)
A:错误B:正确答案:错误Hive中删除外部表不会删除表所指向的数据文件。(
)
A:错B:对答案:对朴素贝叶斯模型对异常值敏感,需要对数据进行异常值处理
(
)
A:对B:错答案:错Hive中对数据进行分区的最重要的原因就是为了方便数据存放。(
)
A:正确B:错误答案:错误给定n个数据点,如果其中一半用于训练,另一半用于测试,则训练误差和测试误差之间的差别会随着n的增加而减小。
(
)
A:错误B:正确答案:正确Hive中数据库的概念本质上是一个数据文件。(
)
A:正确B:错误答案:错误只要有数据,就必然存在安全与隐私的问题
(
)
A:对B:错答案:错回归函数A和B,如果A比B更简单,则A几乎一定会比B在测试集上表现更好。(
)
A:对B:错答案:错Hive不可以在创建数据库之后重新指定数据库所在目录位置。(
)
A:正确B:错误答案:正确事务隔离中级别最低的是(
)
A:读未提交数据B:可重复读C:可串行化D:读提交数据答案:AI参考:正确选项是A:读未提交数据。\n\n事务隔离级别按照从低到高的顺序依次为读未提交、读提交、可重复读和可串行化。其中,读未提交是最低的隔离级别,意味着事务只能读取最新的数据,并且不能保证数据的一致性和完整性。在数据库中,这可能会导致数据的不一致性,因此一般不建议使用这个隔离级别。因此,本题的正确选项是A:读未提交数据。'命令“SELECT
gender
FROM
subjects
CLUSTER
BY
age;”的作用是(
)
A:查询表subjects中的gender和ageB:按照age升序查询表subjects中的genderC:按照age降序查询表subjects中的gender答案:AI参考:正确选项是B:按照age升序查询表subjects中的gender。\n\n命令“SELECTgenderFROMsubj
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度跨境电子商务合作合同
- 《上海《广播歌选》研究(1949-1958)》
- 《TiB2颗粒增强铝基复合材料搅拌摩擦焊接及焊缝金属迁移行为研究》
- 《辽宁省少年女子铅球运动员背向滑步技术运动学分析》
- 《低压交流串联电弧故障检测方法研究》
- 《三星堆博物馆文创产品创新设计研究》
- 专题09文言文对比阅读(对比延伸)45题-2023-2024学年七年级语文下学期期中专题复习(原卷版)
- 2024年南昌客运资格证答题技巧
- 2024年常德道路客运输从业资格证培训资料
- 2024年广州客运资格证操作考试
- 国开(甘肃)2024年春《地域文化(专)》形考任务1-4终考答案
- 档案整理及数字化服务方案(技术标 )
- 静电粉末喷涂实用工艺
- 《十字绣》教学设计及反思
- 桥梁形象进度图
- C站使用说明JRC
- 习作:推荐一个好地方 推荐ppt课件
- 角的度量 华应龙(课堂PPT)
- 公路铣刨机整机的设计含全套CAD图纸
- 机器人学课程教学大纲
- 浙江世贸君澜酒店集团介绍
评论
0/150
提交评论