大数据与人工智能智慧树知到期末考试答案章节答案2024年哈尔滨商业大学_第1页
大数据与人工智能智慧树知到期末考试答案章节答案2024年哈尔滨商业大学_第2页
大数据与人工智能智慧树知到期末考试答案章节答案2024年哈尔滨商业大学_第3页
大数据与人工智能智慧树知到期末考试答案章节答案2024年哈尔滨商业大学_第4页
大数据与人工智能智慧树知到期末考试答案章节答案2024年哈尔滨商业大学_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据与人工智能智慧树知到期末考试答案+章节答案2024年哈尔滨商业大学如果某一变量的无效值和缺失值很多,而且该变量对于所研究的问题不是特别重要,则可以考虑将该变量删除。

答案:对现代的人工智能已经具备了像国际象棋大师们洞察棋局的能力。

答案:错池化层的一个主要作用是缓解卷积层对位置的过度敏感性。

答案:对特征空间上的间隔最大的线性分类器只有一个。

答案:对在AlhpaGo中,落子决策网络通过每个落子后可能的结局预测下一步应该落在哪个位置胜率更大。

答案:对多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。

答案:对Stacking通常考虑的是异质弱学习器(不同的学习算法被组合在一起),而bagging和boosting主要考虑的是同质弱学习器。

答案:对Apriori算法具有这样一条性质:任一频繁项集的所有非空子集也必须是频繁的。

答案:对符号计算是一种智能化的计算,处理的是符号。

答案:对所有的程序都需要深度学习技术。

答案:错遗传算法中个体就是模拟生物个体而对问题中的对象(一般就是问题的解)的一种称呼,一个个体也就是搜索空间中的一个点。

答案:对池化层的输出通道数跟输入通道数相同。

答案:对人工智能的目标是希望计算机拥有像人一样的智力能力,可以替代人类实现识别、认知、分类和决策等多种功能。

答案:对HDFS是一个并行处理大数据集的编程模型。

答案:错机器学习模型建立过程其实是一个参数学习与调优的过程。

答案:对人脸识别可以应用在安防领域。

答案:对基于层次的聚类算法包括()。

答案:合并的层次聚类;分裂的层次聚类MapReduce分布式并行编程使程序员只关注()的实现。

答案:Map函数;Reduce函数Apriori算法采用()方式来找出所有的频繁项集。

答案:连接步;剪枝步对数据对象之间的相似性进行衡量,基本分为()。

答案:相似系数;距离一元线性回归的显著性检验包括()。

答案:线性关系的检验;回归系数的检验特征选择的方法包括()。

答案:Embedded方法;Wrapper方法;Filter方法K-Means算法的计算步骤包括()。

答案:把每个点划分进相应的类;聚类完成;重新计算质心;取得k个初始质心;迭代计算质心对于企业存储设备而言,根据存储实现方式,可将数据存储划分为()。

答案:存储区域网络;网络附加存储;直接附加存储无参的特征值归约包括()。

答案:选样;聚类;直方图参入mapreduce作业执行涉及的独立实体b包括()。

答案:client;JobTracker;TaskTracker;Hdfs将数据转换或统一呈适合于挖掘的形式,涉及的内容包括()。

答案:光滑;数据泛化;属性构造;聚集;规范化将目标函数转换成适应度函数一般应遵循的原则包括()。

答案:优化过程中目标函数的变化方向应与群体进化过程中适应度函数变化方向一致;适应度必须非负代替无效值和缺失值的最简单方法包括()。

答案:方差值;样本均值;中位数常用的分类算法包括()。

答案:神经网络;基于规则的分类算法;朴素贝叶斯分类法;支持向量机;决策树分类法遗传算法中首要解决的问题()。

答案:参数编码()是一种采用局部最优策略的决策树构建算法,它同时也是许多决策树算法的基础。

答案:Hunt算法()特点是数据占据存储空间大,在网络的传输中占据大量带宽资源。

答案:视频数据LDA是一种()的降维技术,也就是说它的数据集的每个样本是有类别输出的。

答案:监督学习Combiner和Reducer类都指向继承于Reducer的内部类()。

答案:Reduce()通常考虑的是异质弱学习器,并行地学习它们,并通过训练一个元模型将它们组合起来,根据不同弱模型的预测结果输出一个最终的预测结果。

答案:stacking网络附加存储的英文缩写是(

)。

答案:NAS决策树学习的关键一步是()。

答案:选择最优划分属性VGG构建深度模型是通过重复使用()。

答案:VGG块C4.5决策树学习算法以()为准则划分属性。

答案:增益率()相当于高维空间中向量所表示的点与点之间的距离。

答案:欧式距离早期的数据在企业数据的语境里,主要是()。

答案:文本人工智能最基本的研究内容()。

答案:搜索与求解()采用自顶向下的方法,从一个包含全部数据点的聚类开始,将根结点分裂成一些子聚类,每个子聚类再递归向下分裂,知道出现只有一个数据点的单结点聚类出现(每个聚类只含有一个数据点)为止。

答案:分裂的层次聚类在实例中用于训练svm模型的函数是()。

答案:fit()利用自然语言处理人工智能方法可实现电子病历非结构化智能信息提取。

答案:对医疗人工智能快速发展的要素包括()。

答案:算法革新;算力不断升级;医疗大数据医疗大数据的独有特性包括()。

答案:不完整性;多态性;隐私性;冗余性;时序性医院综合信息应用平台可实现()。

答案:业务应用;系统集成;数据整合基于医院大数据中心,可实现数据共享和挖掘应用。

答案:对对于商品数量多、出货频率快的物流中心,()就意味着工作效率和效益。

答案:储位优化前置仓的市场定位,是()之间的市场空白。

答案:大型超市与便利店智慧物流是以互联网+为核心,以物联网、大数据、()及“三网融合”等为技术支撑的。

答案:云计算前置仓优点包括()。

答案:成本低;速度快;及时性前置仓缺点包括()。

答案:品类运营差异,价格差异;订单的不确定性D.W检验就是误差序列的自相关检验。

答案:对皮尔森相关系数是一种最简单的,能帮助理解特征和响应变量之间关系的方法,该方法衡量的是变量之间的非线性相关性。

答案:错集成性特性是数据仓库和操作型数据库的根本区别。

答案:错聚类是发现数据集中数据之间的相关关系,对数据进行分组,组内的相似性越小,组间的差别越大,则聚类的效果越差。

答案:错特征选择是选取已有属性的子集来进行建模的一种方式。

答案:对多元分类希望预测的目标有多个选项,好像在做选择题。

答案:对集成性是指数据仓库会将不同来源数据库中的数据汇总到一起。

答案:对回归分析希望预测的目标是连续的值,好像在做计算题。

答案:对填充可以增加输出的高和宽,常用来使输出与输入具有相同的高和宽。

答案:对旨在组合弱学习器的元算法包括()。

答案:stacking;bagging;boostingAlphaGo主要分为两大部分,分别是()。

答案:落子决策网络;价值评估网络常用的数据采集方法包括()。

答案:DPI采集方式;网络采集数据方法;数据库采集;特定的系统接口采集;系统日志采集方法最初提出的AS版本包括()。

答案:Ant-quantity;Ant-cycle;Ant-density遗传算法中常见的交叉操作主要有以下几种()。

答案:均匀交叉;两点交叉;算术交叉;单点交叉数据规约包括()。

答案:样本归约;特征归约;特征值归约特征选择的目的(

)。

答案:增强对特征和特征值之间的理解;降低学习任务的难度,提升模型的效率;减少特征数量、降维;使模型泛华能力更强,减少过拟合相似系数度量包含()。

答案:杰卡德相似系数;皮尔逊系数;余弦相似度遗传算法有以下优点()。

答案:不需要辅助信息。;内在启发式随机搜索特性。;遗传算法在搜索过程中不容易陷入局部最优;对可行解表示的广泛性。;群体搜索特性。()是一种消极学习方法,它不需要建立模型,然而测试样例的开销很大,因为需要逐个计算测试样例和训练样例之间的相似度。

答案:最近邻分类器()思想是通过将这些弱学习器的偏置和/或方差结合起来,从而创建一个强学习器,从而获得更好的性能。

答案:集成方法()方法的思想是对每一维特征“打分”,即给每一维的特征赋予权重,这样的权重就代表着该特征的重要性,然后依据权重排序。

答案:Filter方法音频数据比较具有代表性的是()格式的数据

答案:MP3()是一种数据分析形式,它提取刻画重要数据类的模型。

答案:分类()是指在决策树生成过程中,对每个结点在划分前进行估计,若当前结点的划分不能带来决策树泛化性能的提升,则停止划分并将当前结点标记为叶结点。

答案:预剪枝蚁群算法是随机搜索算法。

答案:对Computer=>antivirus_software,

其中

support=2%,confidence=60%,表示的意思是所有的商品交易中有2%的顾客买了电脑,并且购买电脑的顾客中有60%也购买了杀毒软件。

答案:错蚁群算法执行过程中,核心操作步骤是更新信息素。

答案:对数据可视化是指把数据通过直观的可视化的方式展示给用户。

答案:对二元分类属于有监督学习。

答案:对遗传算法中种群就是模拟生物种群而由若干个体组成的群体,它一般是整个搜索空间的一个很小的子集。

答案:对感知与交流是指计算机对外部信息的直接感知和人机之间、智能体之间的直接信息交流。

答案:对深度学习无法自动将简单特征组合成复杂特征。

答案:错PCA原理中,找出第一个主成分的方向,也就是数据方差最大的方向。

答案:对填充是在输入四个角的位置填充元素255。

答案:错机器翻译无法表达出人类独有的感情。

答案:对两个等长的字符串s1和s2之间的汉明距离定义为将其中一个变为另一个所需要做的最小替换次数。

答案:对数据工程是指面向不同计算平台和应用环境,使用信息系统设计开发和评价的工程化技术和方法。

答案:对基尼系数越小,则数据集D的纯度越高。

答案:对皮尔森相关系数方法衡量的是变量之间的线性相关性。

答案:对由于Apriori算法使用逐层搜索技术,给定候选k项集后,只需检查它们的(k-1)个子集是否频繁。

答案:对机器翻译是利用计算机把一种自然语言转变成另一种自然语言的过程,用以完成这一过程的软件系统叫做机器翻译系统。

答案:对线性判别式分析也叫做Fisher线性判别。

答案:对一个像素由红绿蓝三个值构成。

答案:对最大池化取池化窗口中输入元素的最大值作为输出。

答案:对数据可视化技术基本概念包括()。

答案:数据开发;数据可视化;数据空间;数据分析数据平滑技术包括()。

答案:回归;分箱;聚类下列选项属于语音识别的主要应用的是()。

答案:电话外呼;电话客服;电脑系统声控;语音书写;医疗领域听写深度学习在自然语言处理应用的应用有()。

答案:词性标注;广告推荐;机器翻译;情感分析Hadoop的运行模式包括()。

答案:伪分布模式;全分布模式;单机模式人工智能的研究领域包括()。

答案:自然语言处理;机器人;专家系统;图像识别理解大数据的层面包括()。

答案:理论;技术;实践分类规则的质量可以用()来度量。

答案:覆盖率;准确率属于模拟人脑的机器学习的方法是()。

答案:连接学习;符号学习人脸识别的应用领域可以是()。

答案:娱乐;安防;风控;金融支付生成对抗网络的应用领域有()。

答案:语音和语言的合成;文本生成;视频预测;视频换脸Hadoop生态圈的组件包括(

)。

答案:数据分析工具;数据集成;数据存储;数据处理机器学习模型在部署前需要经过两个部分的工作()。

答案:模型评估;模型训练遗传算法中常见的变异操作主要有以下几种()。

答案:基本位变异;高斯变异;二元变异;均匀变异数据降维主要目的包括()。

答案:从数据中提取特征以便进行分类;压缩数据以减少存储量;将数据投影到低为可视空间,以便于看清数据的分布;去除噪声影响特征分类包括()。

答案:无关特征;冗余特征;相关特征有监督学习的分类()。

答案:回归分析;二元分类;多元分类处理缺失值的方法包括()。

答案:估算;成对删除;整例删除;变量删除机器学习中常见的算法()。

答案:神经网络算法;决策树算法;支持向量机算法;蚁群算法特征归约的步骤包括()。

答案:搜索过程;评估过程;分类过程一元线性回归平方和占总平方和的比例称为()。

答案:判定系数()是决策树学习算法中对付“过拟合”的主要手段。

答案:剪枝人工智能的英文缩写是()。

答案:AI借助某种存储工具或媒介对采集到的数据进行持久化的保存是指()。

答案:数据存储大部分自然科学的本质()。

答案:数据分析蚁群算法的英文缩写是()。

答案:ACO在降维技术方面,PCA的中文含义是()。

答案:主成分分析在实例中可用于读入数据文件的函数是()。

答案:loadtext()()是一种构建分类模型的非参数方法。换句话说,它不要求任何先验假设,不假定类和其他的属性服从一定的概率分布。

答案:决策树分类法定义支持商业流程所需要的数据要求的过程()。

答案:数据建模()是HDFS中的工作节点,它负责存储数据块。

答案:数据节点()是认知的必经途径,也是被广泛认同和传播的基线。

答案:理论大数据的英文缩写是()。

答案:BD()方法的思想是在模型既定的情况下学习出对提高模型准确性最好的特征。也就是在确定模型的过程中,挑选出那些对模型的训练有重要意义的特征。

答案:Embedded方法在一元线性回归中y的取值的波动称为()。

答案:变差()提供了一种用图形模型来捕获特定领域的先验知识的方法。

答案:朴素贝叶斯分类法在大数据组成中,数据的主要部分是()。

答案:非结构化数据ID3决策树学习算法以()为准则来选择划分属性。

答案:信息增益分布式人工智能系统一般由多个()组成。

答案:智能体()是将数据集中划分成“类内的点都足够近,类间的点都足够远”的效果。

答案:基于划分的算法Mapreduce的运行机制,按照时间顺序包括()。

答案:map阶段;shuffle阶段;输入分片;reduce阶段;combiner阶段Hadoop是一个由()开发的大数据分布式系统基础架构。

答案:Apache基金会()是在服务器集群上搭建Hadoop,更接近真实的生产环境。

答案:全分布模式Hadoop是一个数据管理系统,作为数据分析的核心,汇集了结构化和非结构化的数据。

答案:对名字节点保存源信息的种类有()。

答案:每个文件块的名及文件由哪些块组成;文件目录的所有者及其权限;文件名目录名及它们之间的层级关系通常一个HDFS集群中包含()。

答案:一个名称节点;第二名字节点;数据节点()角色就是定期的合并元数据信息文件和元数据操作日志。

答案:第2名字节点使用MapReduce框架时,我们仅仅只是填写map和reduce部分的代码,其他的都交给mapreduce框架来处理。

答案:对使用MapReduce之前不一定要初始化Configuration。

答案:错()是在单机上,模拟一个分布式的环境,具备Hadoop的所有功能。

答案:伪分布模式深度学习无法应用在渔业养殖领域。

答案:错深度学习在CV领域的应用包括检测和分割。

答案:对感知机不能解决异或问题。

答案:对感受野是特征图上的一个点对应的输入图上的区域。

答案:对VGG提出可以通过重复使用简单的基础模块来构建深度模型的思路。

答案:对机器翻译不会取代人工翻译。

答案:对LSTM模型不能应用于自然语言处理。

答案:错机器学习是深度学习的一个分支。

答案:错卷积神经网络相邻两层之间只有部分节点相连。

答案:对100层以上的网络才叫深度网络。

答案:错()方法的思想将子集的选择看作是一个搜索寻优问题,生成不同的组合,对组合进行评价,再与其他的组合进行比较。

答案:Wrapper方法关联规则A->B的支持度support=P(AB),指的是(

)。

答案:事件A和事件B同时发生的概率。置信度confidence=P(B|A)=P(AB)/P(A),指的是(

)。

答案:发生事件A的基础上发生事件B的概率。关联规则是形如X→Y的蕴涵式,表示通过X可以推导“得到”Y。

答案:对在降维技术方面,LDA的中文含义是(

)。

答案:线性判别方法K-Means算法中选择较大的K值可以降低数据的误差,并不会增加过拟合的风险。

答案:错LDA降维和PCA降维的不同之处包括(

)。

答案:LDA选择分类性能最好的投影方向,而PCA选择样本点投影具有最大方差的方向;LDA除了可以用于降维,还可以用于分类;LDA是有监督的降维方法,而PCA是无监督的降维方法;LDA降维最多降到k-1维,而PCA没有这个限制()常考虑的是同质弱学习器,相互独立地并行学习这些弱学习器,并按照某种确定性的平均过程将它们组合起来。

答案:bagging关联规则的执行过程包括(

)。

答案:由频繁项集产生强规则;找出所有的频繁项集()采用自底向上的聚类方法,从最底层开始,每一次通过合并最相似的聚类来形成上一层次中的聚类,当全部数据点都合并到一个聚类时或者达到某个终止条件时结束,是大部分层次聚类采用的方法。

答案:合并的层次聚类遗传算法在整个进化过程中的遗传操作不是随机的。

答案:错学习与发现是指机器的知识学习和规律发现。

答案:对遗传算法中最常用的一种编码方法()。

答案:二进制遗传算法采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。

答案:对遗传算法的局限性()。

答案:遗传算法容易出现过早收敛。;遗传算法通常的效率比其他传统的优化方法低。;单一的遗传算法编码不能全面地将优化问题的约束表示出来。;遗传算法对算法的精度、可信度、计算复杂性等方面,还没有有效的定量分析方法。;编码不规范及编码存在表示的不准确性。蚁群算法最早解决的问题是()。

答案:旅行商问题遗传算法中选择操作通过适应度选择优质个体而抛弃劣质个体,体现了“适者生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论