数据分析与挖掘学习通超星课后章节答案期末考试题库2023年_第1页
数据分析与挖掘学习通超星课后章节答案期末考试题库2023年_第2页
数据分析与挖掘学习通超星课后章节答案期末考试题库2023年_第3页
数据分析与挖掘学习通超星课后章节答案期末考试题库2023年_第4页
数据分析与挖掘学习通超星课后章节答案期末考试题库2023年_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析与挖掘学习通超星课后章节答案期末考试题库2023年“大数据+云计算”将会带来信息产业革命的第()个高峰

参考答案:

()博士和洪小文一起构建了世界上第一个大词汇量、非特定人、连续语音识别系统

参考答案:

李开复

()应该意味着这两个点属于一个分类的可能性越大

参考答案:

距离越近

()打开了自动驾驶的天花板

参考答案:

人工智能的理论和实践的突破

()是K-Means内部指标

参考答案:

DB指数

()是关于随机事件A和B的条件概率(或边缘概率)的一则定理

参考答案:

贝叶斯定理

()是在贝叶斯算法的基础上进行了相应的简化,即假定给定目标值时属性之间相互条件独立

参考答案:

朴素贝叶斯方法

()用于文本分类

参考答案:

多项式朴素贝叶斯

()用于计算最近邻的算法

参考答案:

algorithm='auto'

()的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。

参考答案:

KNN算法

()过程特别重要,在最优决策树生成过程中占有重要地位

参考答案:

剪枝

5G时代来临,万物互联互通将不再只是纸上谈兵,互联网即将消失,进入()时代

参考答案:

物联网

AI是()的英文缩写

参考答案:

ArtificialIntelligence

AlphaGo使用()彻底解决了围棋游戏搜索空间巨大的问题

参考答案:

深度神经网络和蒙特卡罗树搜索

AlphaGO对弈世界顶级围棋冠军李世石,科学界认为()才是制胜的帝道

参考答案:

计算力+人工智能

BP神经网络是一种按照()训练的多层前馈神经网络,是应用最广泛的神经网络

参考答案:

误差逆向传播算法

C4.5克服了ID3的哪两个缺点()

参考答案:

不能处理连续属性###用信息增益选择属性时偏向于选择分枝比较多的属性值

CART算法构成的是一个(),它在每一步的决策时只能是“是”或者“否”

参考答案:

二叉树

delta法则的关键思想:使用()来搜索可能权向量的假设空间,以找到最佳拟合训练样例的权向量

参考答案:

梯度下降

K-Medoids在各类别内选取到其余样本()作为新的类中心

参考答案:

距离之和最小的样本

KNN的优点有()

参考答案:

简单,易于理解,易于实现,无需估计参数,无需训练###适合对稀有事件进行分类(例如当流失率很低时,比如低于0.5%,构造流失预测模型)###特别适合于多分类问题(multi-modal,对象具有多个类别标签),例如根据基因特征来判断其功能分类,KNN比SVM的表现要好

KNN算法可以用于()

参考答案:

分类和回归

KNN算法流程中不正确的有()

参考答案:

返回前k个点出现频率最低的类别作为当前点的预测分类。

KNN计算步骤有()

参考答案:

算距离###找领居###做分类

k值通常是采用()来确定

参考答案:

交叉检验

lr.fit(X_train,y_train)语句的目的为()

参考答案:

用处理好的数据训练模型

P-R图一般为()曲线

参考答案:

非光滑非单调

sklearn库中提供()实现KNN算法

参考答案:

KNeighborsClassifier

SVM的目的就是()

参考答案:

从无数多个分割超平面中,找到最好的分割超平面

一个凸二次规划问题。可以直接用现成的优化计算包求解。但若利用()来求解,会更高效

参考答案:

对偶问题

下列()不属于人工智能新突破取得的产品

参考答案:

佳能相机

下列train_test_split参数解释错误的是()

参考答案:

train_data:所要划分的样本结果

下列不是金融科技公司的是()

参考答案:

诺亚财富

下列代码作用为()Net_in=np.array([0,0,-1])Out_in=np.array([0,0,0,0,-1])

参考答案:

中间层神经元输入和输出层神经元输入

下列代码实现()功能>>>x=list(range(20))>>>forindex,valueinenumerate(x):

ifvalue==3:

x[index]=5

参考答案:

将列表x中值为3的元素修改为5

下列关于人工智能叙述不正确的有()

参考答案:

AI没有真的到来

下列基本术语描述错误的是()

参考答案:

分类:输出结果是连续值

下列属于互联网普惠金融会造成的现象的是()

参考答案:

消费数据加持人工智能,解决了个人征信问题###互联网金融彻底改变了消费习惯,用户使用支付宝和微信就能完成99%的支持场景,中国进入无现金社会###支付宝旗下的天宏基金成为最大的货币基金###用户的零钱自动转余额宝,银行短期存款消失,揽储压力山大

下列属于互联网金融的是()

参考答案:

百度金融###蚂蚁金服###腾讯金融###京东金融

下列是数据挖掘的是()

参考答案:

从大量的数据中通过算法搜索隐藏于其中信息的过程

下列错误的是()

参考答案:

查准率/准确率(precision):P=TP/(TP-FP)

下面不属于人工智能研究基本内容是()

参考答案:

自动化

下面的代码其功能为()>>>x=[range(3*i,3*i+5)foriinrange(2)]>>>x=list(map(list,x))>>>x=list(map(list,zip(*x)))

参考答案:

首先生成一个包含列表的列表,然后模拟矩阵转置

两个二元向量:x=(1,0,0,0,0,0,0,0,0,0)y=(0,0,0,0,0,0,1,0,0,1),SMC=(),J=()

参考答案:

0.7,0

为了简化条件概率的计算,朴素贝叶斯算法提出条件假设(用于分类的特征在类别确定的条件下相互独立)即()的意义

参考答案:

朴素

产生过度拟合数据问题的原因有()

参考答案:

样本里的噪音数据干扰过大,大到模型过分记住了噪音特征,反而忽略了真实的输入输出间的关系###样本抽取错误,包括样本数量太少,抽样方法错误,抽样时没有足够正确考虑业务场景或业务特点等###建模时使用了样本中太多无关的输入变量###在决策树模型搭建中,使用的算法对于决策树的生长没有合理的限制和修剪,决策树的自由生长有可能每片叶子里只包含单纯的事件数据

人工智能不会()

参考答案:

表达感情

人工智能中运用到语音识别理论创造的产品有()

参考答案:

语音助手###智能音箱###在线翻译

人工智能在医疗上的使用不包括()

参考答案:

回收废弃医疗设备

人工智能复活之路上经历了()次热潮

参考答案:

3

人工智能存在的伦理道德问题有()

参考答案:

道德超载问题###算法的偏见###数据的偏见

人工智能时代来临,新竞技将更加残酷,在商场上可行的是()

参考答案:

开放的心态迎接人工智能的到来,积极适应新市场,学习创造新技术

人工智能是一种()

参考答案:

根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序

人工神经网络受到了生物学的启发,它是由一系列简单单元相互密集连接构成,其中每一个单元有一定数量的实值输入(可能是其他单元的输出),并产生()的实数值输出(可能成为其他很多单元的输入)

参考答案:

单一

人工网络学习的两个相似的算法:()

参考答案:

梯度下降法则###感知器训练法则

从目前技术角度来讲,下面说法不正确的是()

参考答案:

人工智能已无所不能

使用pip工具升级科学计算扩展库numpy的完整命令是()

参考答案:

pipinstall--upgradenumpy

使用离差平方和法聚类时,计算样品间的距离必须采用()

参考答案:

欧氏距离

信息增益算法有误的一步是()

参考答案:

(2)计算特征A对数据集D的经验熵H(A)

关于性能度量不正确的是()

参考答案:

性能度量实用意义不大

关于机器学习下列不正确的是()

参考答案:

以往经验获得的数据无需任何处理即可直接使用

关于随机森林,错误的是()

参考答案:

随机森林在bagging基础上做了修改,先从样本集中用bagging采样选出n个样本

决策树由()和()组成

参考答案:

结点,有向边

列表对象的sort()方法用来对列表元素进行原地排序,该函数返回值为()

参考答案:

None

区块链本身并非是一项全新技术,而是多项技术的集成式创新,其中不包括()

参考答案:

机械自动化

区块链特征包含有()

参考答案:

分布式是区块链技术区别于其他技术的核心要点,数据由系统中维护功能的节点共同维护###区块链技术通过数字加密算法进行编排,节点相互联系,没有一个中心节点可以被打击和篡改,稳定性和安全性更高###公有区块链系统是对所有人开放的,任何人均可以通过端口进行查询和开发,系统是公开透明的,从而也更容易形成共识###区块链技术节点之间交换遵循一定的算法,通过程序规则自行判断,并形成一种信任,即使是在匿名的情况下,也会对对方产生基本的信任

原始的朴素贝叶斯只能处理离散数据,当x1,…,xn是连续变量时,我们可以使用()完成分类任务

参考答案:

高斯朴素贝叶斯

受样本个数限制,若某个属性值在训练集中没有与某个同类同时出现过,如P清脆|是=P(敲声=清脆|好瓜=是)=0/8=0,则连乘公式h(好瓜=是)则必为零,其他属性取任意值都不能改变这一结论。()方法可以修正这一缺陷

参考答案:

拉普拉斯平滑处理

在BP神经网络中,只有相邻的神经层的各个单元之间有联系,除了输出层外,每一层都有一个()

参考答案:

偏置结点

大数据技术由()公司首先提出来的

参考答案:

谷歌

大数据是指()

参考答案:

无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产

大数据最明显的特点是()

参考答案:

数据规模大

大数据起源是()

参考答案:

互联网

如果原始样本空间是有限维,即属性数有限,那么()一个高维特征空间使样本线性可分

参考答案:

一定存在

学习器在训练集上的误差称为“训练误差”或(),在新样本上的误差称为“泛化误差”

参考答案:

经验误差

对于人工智能认知错误的是()

参考答案:

人工智能会毁灭人类

对偶问题本身为(),且随着训练样本数(m)增大,计算开销也会激增,所以需用更高效的算法。

参考答案:

组合优化问题

层次聚类主要有()类型

参考答案:

凝聚层次聚类###分裂层次聚类

已知x=([1],[2]),那么执行语句x[0].append(3)后x的值为()

参考答案:

([1,3],[2])

已知x=[1,2,3],执行语句x.append(4)之后,x的值是()

参考答案:

[1,2,3,4]

常用的聚类算法有()

参考答案:

K-均值聚类###K-中心点聚类###层次聚类

当熵和条件熵中的概率由数据估计(特别是极大似然估计)得到时,所对应的熵分别称为()和()

参考答案:

经验熵,经验条件熵

想要得到一个划分超平面,将不同类别的样本分开来,应尽可能地使不同类别的样本都尽可能地远离超平面,使得训练集之外的未见示例在该超平面的作用下也能正确分类,所以,超平面应该尽可能()划分训练集

参考答案:

正中间

我们把delta训练法则理解为训练一个()的感知器,也就是一个线性单元

参考答案:

无阈值

支持向量机的一个重要性质:训练完成后,大部分的训练样本都()保留,最终模型仅与支持向量有关。

参考答案:

不需要

数据挖掘主要构建四大模型描述错误的是()

参考答案:

聚类是依据历史数据形成刻画用户特征的类标识,进而可以预测未来数据的归类情况###分类指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程

数据的应用四个步骤为()

参考答案:

数据,信息,知识,智慧

时间序列对象一般使用pandas的()生成

参考答案:

date_range()函数

智能医疗应用场景不包括()

参考答案:

医院排队叫号

智能手机AI创新不包括()

参考答案:

手机材料更耐摔

智能手机市场10年混战之后,仅剩下()阵营

参考答案:

苹果IOS###谷歌Android

智能翻译可以实现的功能为()

参考答案:

多种语言翻译###语音翻译###方言翻译###拍照翻译

有了()和()之后,向量就可以在另一个坐标系中进行表示

参考答案:

特征值###特征向量

朴素贝叶斯分类算法为()

参考答案:

生成式模型

朴素贝叶斯算法的预测判定准则为()

参考答案:

对每个样本选择使条件风险R(c∣x)最小的类别标记

模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了,这样就会导致在后期测试的时候不能够很好地识别数据,模型泛化能力太差,这是()的原因

参考答案:

过拟合

模型选择有哪三个关键问题()

参考答案:

评估方法。如何获得测试结果###性能度量。如何评估性能优劣###比较检验。如何判断实质差别

泛化错误率由哪三个构成()

参考答案:

偏差###方差###噪声

生物制药智能化应用不包括开展()

参考答案:

人工检核制药过程

目标函数为变量的二次函数和约束条件为变量的线性函数,叫做()

参考答案:

二次规划问题

神经网络就是模拟人的大脑的神经单元的工作方式,但进行了很大的简化,神经网络由很多神经网络层构成,而每一层又由许多单元组成,第一层叫输入层,最后一层叫输出层,中间的各层叫()

参考答案:

隐藏层

第三次人工智能浪潮区别前两次在于()

参考答案:

人工智能的产品打破了人们的预期,真正做到了在识别方面比人类本身更智能更高效,是真正可以用的东西

算法处理流程中()属于分类器训练阶段

参考答案:

对每个类别计算P(yi)###对每个特征属性计算所有划分的条件概率

线性模型中使用的函数不包括()

参考答案:

API函数

线性模型中目标函数求解方法有()

参考答案:

梯度下降法###牛顿法

线性模型基本形式特点有()

参考答案:

形式简单,易于建模###蕴含机器学习的基本思想###是其他非线性模型的基础###权重体现出各属性重要性,可解释性强

统计学和数据挖掘区别在()

参考答案:

数据挖掘经常会面对尺度为GB甚至TB数量级的数据库,而用传统的统计方法很难处理这么大尺度的数据集###两者采用的模型有区别,数据挖掘往往需要采用各种相应的数学模型和应用传统统计学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论