




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章测试
1
【单选题】(20分)
什么是KDD?
「A.
C.文档知识发现
1B.
A.数据挖掘与知识发现
「c.
D.动态知识发现
,D.
B.领域知识发现
参考答案
B
2
【判断题】(20分)
数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数
据等任务。
「A.
错
1B.
对
参考答案
B
3
【多选题】(20分)
数据挖掘的预测建模任务主要包括哪几大类问题?
rA.
分类
rB.
模式匹配
厂c.
模式发现
rD.
回归
参考答案
AD
4
【多选题】(20分)
以下哪些学科和数据挖掘有密切联系?
rA.
人工智能
rB.
计算机组成原理
rc.
矿产挖掘
rD.
统计
参考答案
AD
5
【判断题】(20分)
离群点可以是合法的数据对象或者值。
A.
错
B.
对
参考答案
B
第二章测试
1
【单选题】(20分)
下面哪个属于定量的属性类型:
'A.
区间
「B.
序数
「C.
标称
「D.
相异
参考答案
A
2
【单选题】(20分)
只有非零值才重要的二元属性被称作:
CA.
非对称的:元属性
'B.
离散属性
rC.
对称属性
「D.
计数属性
参考答案
A
3
【判断题】(20分)
定量属性可以是整数值或者是连续值。
「A.
对
「B.
错
参考答案
A
4
【单选题】(20分)
中心趋势度量模(mode)是指
「A.
数据集中出现频率展高的值
「B.
算术平均值
「C.
最大值
D.
最小值
参考答案
A
5
【多选题】(20分)
以下哪些是属于中心趋势的度量
厂A.
标准差
rB.
中位数
rc.
五数概括
rD.
平均值
参考答案
BD
第三章测试
1
【单选题】(20分)
数据清洗的方法不包括
「A.
一致性检查
'B.
缺失值处理
rC.
噪声数据清除
「D.
重复数据记录处理
参考答案
D
2
【单选题】(20分)
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务?
CA.
分类和预测
「B.
噪声检测
CC.
频繁模式挖掘
「D.
数据预处理
参考答案
D
3
【单选题】(20分)
以下哪项不属于数据规约的方法?
'A.
数据压缩
CB.
维规约
「C.
数值规约
「D.
数据迁移
参考答案
D
4
【单选题】(20分)
大数据预处理的方法不包含以下哪个选项?
「A.
数据变换
CB.
数据清洗
rC.
数据采集
CD.
数据规约
参考答案
C
5
【判断题】(20分)
在噪声数据中,波动数据比离群点数据偏离整体水平更大。
「A.
对
「B.
错
参考答案
B
第四章测试
1
【单选题】(20分)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖
掘的哪类问题?
CA.
关联规则发现
「B.
自然语言处理
「C.
聚类
「D.
分类
参考答案
A
2
【判断题】(20分)
关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则。
A.
错
1B.
对
参考答案
A
3
【判断题】(20分)
具有较高的支持度的项集具有较高的置信度。
「A.
错
「B.
对
参考答案
A
4
【判断题】(20分)
给定关联规则A>B,意味着;若人发生,B也会发生。
CA.
对
「B.
错
参考答案
B
【判断题】(20分)
啤酒与尿布的故事是聚类分析的典型实例。
'A.
对
「B.
错
参考答案
B
第五章测试
1
【判断题】(25分)
分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。
,A.
对
「B.
错
参考答案
A
2
【判断题】(25分)
决策树方法通常用于关联规则挖掘。
「A.
对
B.
错
参考答案
B
3
【判断题】(25分)
在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验
误差开始增大,这是出现了模型拟合不足的问题。
「A.
错
「B.
对
参考答案
A
4
【判断题】(25分)
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本
对分类结果没有影响。
「A.
对
「B.
错
参考答案
A
5
【单选题】(10分)
下面哪种分类方法是属于统计学的分类方法?
「A.
贝叶斯分类
'B.
判定树归纳
rC.
基于案例的推理
「D.
后向传播分类
参考答案
A
第六章测试
1
【判断题】(20分)
基于划分方法的聚类都是基于距离来判断数据对象相似度的
,A.
对
「B.
参考答案
A
2
【判断题】(20分)
K-Means聚类过程中计算出的“质心”点是虚拟的。
「A.
B.
对
参考答案
B
3
【判断题】(20分)
DBSCAN聚类和K-Medians聚类都需要预先指定聚类的簇的数目
CA.
对
CB.
错
参考答案
B
4
【多选题】(20分)
下列属于层次聚类方法的是
rA.
K-Means
rB.
DBSCAN
rc.
AGNES
rD.
DIANA
参考答案
CD
5
【单选题】(20分)
衡量离群点的离群因子,计算的是
「A.
簇间距离的加权平均值
「B.
平均绝对偏差
「C.
簇间距离
「D.
轮廓系数
参考答案
A
第七章测试
1
【单选题】(20分)
神经元节点计算什么()
「A.
神经元节点先计算线性函数(z=Wx+b),再计算激活
「B.
神经元节点先计算激活函数,再计算线性函数(z=Wx+b)
「C.
神经元节点计算函数g,函数g计算(Wx+b)
CD.
在将输出应用于激活函数之前,神经元节点计算所有特征的平均值
参考答案
A
2
【单选题】(20分)
在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步。如果以某种方法
知道了神经元准确的权重和偏差,你就可以近似任何函数。实现这个最佳的办法是什么?
CA.
赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
「B.
随机赋值,析祷它们是正确的
「C.
都不正确
「D.
搜索所有权重和偏差的组合,直到得到最佳值
参考答案
A
3
【单选题】(20分)
梯度下降算法的正确步骤是H么?
1.计算预测值和真实值之间的误差
2.迭代跟新,直到找到最佳权重
3.把输入传入网络,得到输出值
4.初始化随机权重和偏差
5.对每一个产生误差的神经元,改变相应的(权重)值以减小误差
「A.
3,2,1,5,4
B.
1.2,3,4,5
4,3,1,5,2
「D.
5,4,3,2,1
参考答案
c
4
【单选题】(20分)
以下什么情况下神经网络模型被称为深度学习模型?
「A.
当这是一个图形
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能硬件研发合作合同(2篇)
- 《餐饮服务与管理》课件-教学课件:中餐宴会服务
- 2025届高三押题信息卷(一)地理及答案
- 蝶骨嵴脑膜瘤的临床护理
- 团建新质生产力活动
- 2025年人教版小学数学一年级上册期中考试卷(带答案)
- 新质生产力新愿望
- 2025年监理工程师之水利工程目标控制自我检测试卷B卷附答案
- 2025年执业药师之西药学专业二全真模拟考试试卷B卷含答案
- 2020-2024年上海市秋考语文试题汇编含答案
- 商砼安全生产风险分级管控制度
- 强酸强碱烧伤及中毒的处理方法
- 厂家管道吹扫方案(参考)
- 超深水油田开发及水下生产系统概述-37页的简介
- 轧钢高线车间装配工工艺规程
- 法制副校长聘书模板52426
- 钢板桩施工专项方案
- 太湖县赵氏宗谱编纂理事会章程
- 水土保持常用监测表格(共9页)
- PPT翻书动画效果的制作
- 病理学第十六章-神经系统疾病
评论
0/150
提交评论