大数据分析与预测技术智慧树知到期末考试答案章节答案2024年山东财经大学_第1页
大数据分析与预测技术智慧树知到期末考试答案章节答案2024年山东财经大学_第2页
大数据分析与预测技术智慧树知到期末考试答案章节答案2024年山东财经大学_第3页
大数据分析与预测技术智慧树知到期末考试答案章节答案2024年山东财经大学_第4页
大数据分析与预测技术智慧树知到期末考试答案章节答案2024年山东财经大学_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据分析与预测技术智慧树知到期末考试答案+章节答案2024年山东财经大学因为HDFS有多个副本,所以NameNode是不存在单点问题的。

答案:错ID3算法的理论基础是信息论中的信息熵和信息增益

答案:对支持向量机的核函数负责输入变量和分类变量(输出)之间的映射。

答案:对对于小样本集,支持向量机的分类准确度可能优于其他对样本数量要求比较高的分类算法。

答案:对在做聚类时,DBSCAN会删掉它认为是噪声点的数据点。

答案:对多元线性回归的分布实现主要是把训练样本集拆分成数据块,以便Map程序直接计算回归系数。

答案:错基于内容的推荐和基于协同的推荐都需要领域知识。

答案:错实施机器学习项目下面说法错误的是哪些?

答案:做机器学习项目一劳永逸,不必考虑数据的更新。;可以直接使用同类公司机器学习的结果。;需求只要由用户给定就行了。下列选项中,哪两项是可以用于数据采集的技术?

答案:Kafka;Flume以下有关决策树剪枝正确的说法是

答案:预剪枝可能导致欠拟合,因此要通过训练样本检验确定合适的树深度。;预剪枝是在节点分枝前确定是否要继续树增长,可以比较分枝前后的准确率确定。大数据的业务应用处理需要经过哪些流程?

答案:数据采集;数据加工;数据清洗;数据建模Spark适用于那些场景?

答案:数据量大;计算量大下面哪个程序负责HDFS数据存储。

答案:Datanode大数据时代的到来,我们更应该注重数据中的相关关系,而不是因果关系。其中,数据之间的相关关系可以通过以下哪个算法直接挖掘

答案:Apriori在一个神经网络里,确定每一个神经元的权重和偏差是重要的一步。如果以某种方法确定了神经元准确的权重和偏差,你就可以近似任何函数。实现这个最佳的办法是什么?

答案:赋予一个初始值,然后迭代更新权重,直至代价函数取得极小。以下两种描述分别对应哪两种对分类算法的评价标准?(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。

答案:Precision,Recall有关冷启动的理解,以下说法错误的是哪个?

答案:对于一个新用户没有办法进行推荐。关于NameNode和SecondaryNameNode的说法错误的是

答案:数据的通信使用的是ftp协议(http协议)DBSCAN之所以难以有效处理高维数据,其主要原因是?

答案:开销过大关联规则可以用枚举的方法产生。

答案:对如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。

答案:错C4.5算法是一种贪心算法,用来构造决策树,是以信息熵的下降速度为选取测试属性的标准,即在每个节点选取还尚未被用来划分的具有最高信息增益的属性作为划分标准,然后继续这个过程,直到生成的决策树能完美分类训练样例。

答案:错DBSCAN能够很好的区分原始数据的形状,但受限于用户指定的参数。

答案:对频繁闭项集可用来无损压缩频繁项集。

答案:对对于项集来说,置信度没有意义。

答案:对决策树是一种简单但是使用广泛的分类器,决策树的优点有?

答案:效率高,决策树只需要一次构建,可以反复使用,每一次预测的最大计算次数不超过决策树的深度。;决策树模型可读性好,具有描述性,有助于人工分析以下哪个步骤是大数据分析与预测所需的预处理工作?

答案:变量相关性分析。;数值属性的标准化。;异常值分析。下面哪些评测指标可以度量推荐系统的性能?

答案:推荐结果的新颖性;平均绝对误差(MAE);覆盖率设有项目集X,X1是X的一个子集,则下列结论中成立的是

答案:如果X1是非频繁项目集,则X也是非频繁项目集;;如果X是频繁项目集,则X1也是频繁项目集;有关过拟合问题的说法正确的是哪些

答案:分类算法一般都会遇到过拟合问题;决策树的过拟合可以采用剪枝方法以下有关随机森林算法正确的说法有哪些?

答案:随机森林模型的准确率取决于少数准确度较好的少数决策树模型。;与单颗决策树相比,随机森林需要更多的特征工程。以下属于无监督学习的有哪些?

答案:聚类;关联分析Hadoop中节点之间的进程通信是通过什么协议来实现的

答案:RPC以下决策树说法错误的是哪个

答案:决策树中没有出现的属性是对分类无用的。在聚类分析中,簇之间的相似性越大,簇内样本的差别越大,聚类的效果就越好

答案:错误差逆传播算法(ErrorBackPropagation,简称BP)是最成功的训练多层前馈神经网络的学习算法。

答案:对数据预处理包括以下哪几个重要步骤:数据清洗、数据集成、数据转换、数据归约、数据离散化、特征提取、选择和构造

答案:对KNN没有显式的训练过程,是“懒惰学习”的著名代表

答案:对隐含层和输出层的神经元,都是具有激活函数的功能神经元

答案:对决策树剪枝的目的是为了减少训练过程的过拟合,从而提升决策树模型的准确性。

答案:对感知机可以求解那类问题?

答案:非;与;异或;或以下有关传统机器学习算法处理大数据的说法正确的有哪些?

答案:传统机器学习的算法在处理大数据时需要通过分布式的改造。;传统机器学习算法大多数不支持数据的批处理。;大数据通过合理切分就可以转化为传统机器学习算法容易处理的小数据。以下应用使用你的地理位置信息的是?

答案:滴滴;美团;高德地图关联规则的评价度量主要有哪些?

答案:提升度;置信度;支持度关于Hadoop下列说法正确的是

答案:Namenode负责维护文件系统的命名空间;HDFS暴露了文件系统的命名空间,允许用户以文件的形式在上面存储数据;HDFS采用了Master/Slave的架构模型有关决策树对大数据的处理,以下说法正确的是哪些?

答案:可以对决策表的样本进行划分,并行计算每个分片数据各种属性取值对应的类别个数,从而可以合并这些数据得到某个属性在整个数据集的重要性度量。;通过对决策表的每个字段进行数据分片(然后每个字段再按照记录分片),可以实现决策树重要分枝属性的选择。;决策树的分布式学习可以借助MapReduce计算框架。传统神经网络主要分为以下哪几类?

答案:反馈型神经网络;自组织神经网络;前馈型神经网络以下有关机器学习理解不正确的是哪个?

答案:查询大量的操作数据去发现新的信息。当采用K-距离的方法选择DBSCAN的Eps和MinPts参数时,如果设置的K的值太大,则小簇(尺寸小于K的簇)可能会被标记为

答案:噪声假设属性income的最大最小值分别是1200元和9800元。利用最大最小归一化的方法将属性的值映射到0至1的范围内。属性income的6630元将被转化为?

答案:0.631DBSCAN算法的过程是以下哪个?①删除噪声点。②每组连通的核心点形成一个簇。③将所有点标记为核心点、边界点和噪声点。④将每个边界点指派到一个与之关联的核心点的簇中。⑤为距离在Eps之内的所有核心点之间赋予一条边。

答案:③①⑤②④Apriori算法的加速过程依赖于以下哪个策略

答案:剪枝在Spark的软件栈中,用于机器学习的是?

答案:Mllib下面哪个回归分析的说法是正确的?

答案:非线性回归问题一般要转化为线性回归。传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?

答案:回归下面有关神经网络梯度消失说法错误的是

答案:网络梯度消失可以通过减少隐层神经元的个数减弱。学习没有标签的数据集的机器学习方法是?

答案:无监督学习建立一个模型,根据已知的多个变量值来预测其他某个变量值属于数据挖掘的哪一类任务?

答案:回归分析mapreduce计算模型适用于哪种任务?

答案:批处理逐步判别法的基本思想是:逐步引入变量,每次引入一个"最重要"的变量,同时也检验先前引入的变量,如果先前引入的变量其判别能力随新引入变量而变不显著,则及时将其从判别式中剔除,直到判别式中的变量都很显著,且剩下来的变量也没有重要的变量可引入判别式时,逐步筛选结束。

答案:对随机森林中的决策树之间是没有关联的,当测试数据进入随机森林时,其实就是让每一颗决策树进行分类看看这个样本应该属于哪一类,最后取所有决策树中分类结果最多的那个类作为最终的结果(每棵树的权重需要考虑进来)。

答案:对NoSQL数据库作为非关系型数据库,能够用来存储结构化和非结构数据。

答案:对SSE在无监督的簇评估中能起到很好的作用。

答案:对逻辑回归方法的可解释性强,可控性高,并且训练速度快,特别是经过特征工程之后效果更好。

答案:对业务监控是指组织应用数据仓库、商业智能技术和工具来监控组织的业务绩效。

答案:对过拟合是因为训练样本太多了,把训练样本的规律都拟合进去了,因此检测样本的准确率也很高。

答案:错信息熵值越小,当前样本集合D的纯度越小,属于同一类别的可能性越大

答案:错知识图谱是知识的一种表示方法,其中通过丰富语义形成了概念、实体和属性的网络关系。

答案:对DBSCAN会把所有点划分到各自的簇中。

答案:错根据患者的视网膜图像等相关医疗信息,使用机器学习算法进行建模,预测患者患糖尿病的可能性。这个任务需要无监督的机器学习算法。

答案:错对于同样的样本集,Apriori算法的速度要比FP增长算法慢一些,但前者获得的关联规则比后者全面。

答案:错BP神经网络模型拓扑结构包括以下哪些?

答案:输入层;输出层;隐层机器学习的预测建模任务主要包括哪几大类方法?

答案:回归分析;决策树;神经网络关于神经网络的相关概念,说法错误的是哪些?

答案:ReLU函数中所有负值均被截断为结果0,从而导致特征丢失,可适当调高学习率避免此类情况。;对激活函数的输出结果进行范围限定,有助于梯度平稳下降,而ReLU输出范围无限的函数会导致梯度消失问题。下列说法正确的是哪些?

答案:离群(异常)点可以是合法的数据对象或者值。;定量属性可以是整数值或者是连续值。随机森林的优点有哪些?

答案:每棵树相当于一个领域的专家,多棵树的意见结合在一起,结果是值得信赖的。;训练速度快。;每棵树使用了一部分的训练数据,很好地避免了过拟合。训练分类机器学习模型时需要避免过拟合和欠拟合的问题,关于这些问题以下说法错误的是

答案:增加数据量不能减少过拟合问题;神经网络不会出现过拟合问题;复杂的模型时容易发生欠拟合问题下列选项中,是用于数据存储的技术有哪些?

答案:MySQL;HDFS;MongoDB以下哪个属于大数据在电信行业的数据商业化方面的应用?

答案:精准广告;营销洞察;大数据检测和决策以下属于监督学习是哪些?

答案:KNN;支持向量机;决策树以下有关协同推荐说法正确的是哪些?

答案:当用户数目比较多时,基于用户的协同推荐复杂度比较高,因此一般用于离线方式进行推荐。;基于用户的协同推荐主要目的是寻找与用户兴趣相似的用户。;基于物品的协同推荐需要计算物品之间的相似度。有关推荐系统的组成,正确的说法有哪些?

答案:推荐系统的输出模块是根据用户的模型,匹配用户最可能感兴趣的物品。;推荐引擎是推荐系统的核心,负责分析用户的行为数据,提取用户的画像(用户建模)。;推荐系统的输入模块主要是获取反映用户偏好的数据,例如浏览、购物、评论等行为数据。以下有关推荐系统评估的说法,正确的是哪些?

答案:推荐系统的多样性是解决用户兴趣的非单一和隐含兴趣问题。;推荐算法的实时性是实时搜集和分析用户的行为,产生推荐结果。;推荐系统的惊喜度和新颖性是类似的2个指标。下面有关各类推荐算法的理解,正确的有哪些?

答案:基于用户行为二分图的推荐可以依据用户与物品之间的相关性计算。;基于标签的推荐可以通过表征用户兴趣的标签进行推荐,标签可以由用户给定或利用算法提取。;基于知识的推荐主要看目前用户掌握知识的情况,依赖知识关系图进行推荐。大数据可以被应用到的行业有?

答案:金融;电信;政府;工业下面哪个针对MapReduce的说法是错误的?

答案:MapReduce可以对分布式的大数据分片进行并行的实时分析。自然语言处理难点目前有四大类,下列选项中不是其中之一的是?

答案:机器性能HDfS中的block默认保存几份?

答案:3份“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。

答案:海量BP神经网络的学习规则是?

答案:梯度下降法以下不是大数据特征的是?

答案:价值密度高下面有关聚类算法的分布式实现说法错误的是哪个?

答案:k-均值聚类需要大量的迭代,因此不能使用分布式计算。人工智能、机器学习、深度学习的包含关系是?

答案:机器学习>深度学习>人工智能组织利用数据,分析和洞察力来改变它的业务模式或业务转型,这属于大数据应用成熟度的哪一个阶段?

答案:业务转型置信度(confidence)是衡量兴趣度度量()的指标。

答案:确定性有关基于关联规则的推荐的说法,错误的是哪个?

答案:关联推荐是一种基于物品之间因果关系的推荐方法。梯度下降算法的正确步骤是什么?1.计算预测值和真实值之间的误差2.迭代更新,直到找到最佳权重3.把输入传给网络,得到输出值4.初始化随机权重和偏差5.对每一个产生误差的神经元,改变相应的(权重)值以减小误差

答案:4,3,1,5,2有关数据质量正确的说法是哪个?

答案:数据预处理的重要目的是提高机器学习结果的质量。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?

答案:AI以下的决策树哪个是二叉树?

答案:CART如果处理以下形状的数据时,适宜采用DBSCAN的是?

答案:SS形整个MapReduce的过程大致分为Map、Shuffle、Combine和以下哪个?

答案:Reduce在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?

答案:数量越多处理时间越短HDFS适用于哪些场景?

答案:一次写入,多次读取;存储和管理PB级别数据Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小

答案:内存关于RDD,说法正确的两项是?

答案:弹性、集中式内存集;是一个容错的、并行的数据结构Yarn架构在Hadoop生态圈中有哪些作用?

答案:保证协同;资源分配;调度SparkStreaming是什么软件栈中的流计算?

答案:SparkHBASE的特点不包括哪两项?

答案:面向行;稠密性下列选项中,不是kafka适合的应用场景是?

答案:业务系统NoSQL数据库具有以下哪几个特点?

答案:灵活的数据模型;灵活的可扩展性;与云计算紧密融合有关可视化分析错误的说法有哪些?

答案:对于同样数据、同样的问题,不同数据分析师给出的可视化分析结果是一样的。;可视化分析的结果是否可用不需要人工检验。可视化分析的说法正确的是哪一个?

答案:可视化是一种基本的数据分析方法,需要选择合适的图表,展示数据中隐藏的信息。有关可视化分析与其他机器学习方法的关系,错误的说法是哪一种?

答案:可视化分析可以对分类模型的正确率进行评估。有关可视化分析的方法,下面错误的说法是哪种?

答案:可视化只是表格数据的另一种简单呈现。下面哪种可视化方法比较适合聚类分析?

答案:散点图在线教学学生行为的分析中,下面哪个选项不是可视化的作用?

答案:可视化可以预测一个刚选课不久的学生学完一门课程所需要的时间。标签云是图像数据常用的可视化方法

答案:错在可视化分析的应用过程中,最终用户抱怨没有看到有用的信息,可能的原因有以下哪些?

答案:数据分析人员对业务理解不够,未能选好指标(变量),给出的可视化难以看到有用的信息。;图表展示出来了容易让人误解的信息,误导了用户。;数据没有充分的预处理,展示出来的信息基本是已经的事实。有关箱(线)图的说法,正确的是哪些?

答案:若某变量的中位数是10,说明这个变量有一半的取值平均值小于10。;箱图可用于分析某个变量A对变量B的影响程度,主要看A的不同取值对应B变化的箱子的大小和位置变化。;从箱图可以发现变量的异常或噪声。以下有关可视化方法作用的说法,正确的有哪些?

答案:可视化可用作机器学习过程的观察以及结果的展示。;可视化不是简单地把数据展示成图形,可能要放在原始数据加工后更有效。;可视化可以在数据预处理阶段,帮助数据分析者发现变量之间的关系。下面哪种方法是文本特征获取的方法?

答案:信息增益;互信息;卡方统计量下面有关文本分析正确的说法是哪些?

答案:文本分类可以通过贝叶斯分类器完成。;时间和日期都是需要识别的命名实体。;句法分析可以表达组成句子的词语之间的搭配或修辞关系。下面哪个选项不是文本分析的组成?

答案:文本翻译有关文本特征的理解,错误的说法是哪个?

答案:one-hot可以表示一个词的重要性。面关于词法分析的描述中,正确的说法有哪些?

答案:基于统计的命名实体识别方法目前还主要采用统计的方法;基于词频统计的分词方法是一种无字典分词方法使用基于统计的方法进行特征选择、分词等分析都对语料库的要求比较高。

答案:对有关文本分析的说法,正确的是哪些?

答案:文本属于非结构化数据,因此需要经过预处理转化为向量等结构才方便处理。;从一个文本集中查询包含某些主题的文本也属于文本分析。;处理文本分类需要经历原始文本的提取、分词等预处理、特征提取与表示、分类模型构建以及评估等阶段。下面哪些算法不能用于文本的分词?

答案:词嵌入;TF-IDF算法下面有关向量空间模型(VSM)的描述中,错误的是哪个?

答案:文本特征词的向量权重可通过TF-IDF实现,从而保留文本词序结构信息以下有关文本分词的说法正确的是哪个?

答案:基于统计的分词方法的性能与训练语料库的质量密切相关。基于邻近度的异常检测算法的局限性有哪些?

答案:高维空间里,数据是稀疏的,邻近度变得没意义;对参数k选择敏感,如k太小,少量的邻近点导致离群点得分较低,而k太大,则点数少于k的数据点都可能成为离群点异常检测(Anomalydetection)是发现与大部分其他对象不同的对象,所以又成为离群点检测

答案:对以下哪个场景用到基于统计方法的异常检测?

答案:正常数据出现在随机模型的高概率区域,异常数据则位于随机模型的低概率区域下面这些场景中哪些用到异常检?

答案:从盗窃信用卡的人的购买行为不同于信用卡持有者分析信用卡欺诈;系统入侵异于正常用户登录行为检测入侵异常基于统计方法的异常检测有以下哪些局限性?

答案:对于高维数据难以估算其真实分布;许多情况下数据对象的分布是未知的;大多数统计模型检验只是针对单个特征常用的异常检测算法有哪些?

答案:KNN(K-最近邻);高斯分布建模;基于聚类的方法在基于邻近度的方法中,离群点的定义不包括以下哪个?

答案:一个对象的离群点得分是该对象周围密度的逆下面哪个是基于密度的方法算法的局限性?

答案:参数k选择困难数据分析任务通常是去掉离群点,离群点是没有意义的点

答案:错高维空间里,数据是稀疏的,我们会用到以下哪种异常检测的方法

答案:基于密度的方法假设{花生,啤酒,可乐,牛奶}项目集的支持度大于最小支持度,请问下面哪些项目集的支持度一定能达到最小值支持度要求?

答案:{啤酒,可乐};{花生,啤酒,可乐};{花生,啤酒}下面哪个通常不是关联算法的应用领域?

答案:分析信用卡欺诈以下哪种情景最不适合用关联分析?

答案:根据以前的股价预测未来的股价。关联规则中前向和后项存在因果关系才能投入使用。

答案:错关联规则是有方向的,A->B与B->A的支持度相同,它们的置信度也相等。

答案:错在频繁项目集的分析过程中,以下说法哪种是正确的?

答案:频繁项目集的交集肯定是频繁的。以下有关关联算法错误的说法是哪个?

答案:提升度是强关联规则的一个必要条件。以下哪些领域可比较适合使用关联分析?

答案:从学生评教数据中,找到评分较好的课程相关重要因素。;分析网上商品的评论和评分数据,讨论什么样的商品容易得到好的评分。以下有关关联分析的说法,正确的是哪些?

答案:关联分析本身就是一种推荐方法,用于网商商品的推荐,理由是购买某种商品的人在同次购物也可能会买其他商品。;提升度可以帮忙改进某些商品的推荐或营销效果。有关Apriori算法和FP-增长算法,正确的说法有哪些?

答案:对于同一个样本集,Apriori算法和FP增长算法的结果是相同的。;对于同样的样本集和算法参数(支持度和置信度等),Apriori算法的速度一般要慢于FP增长算法。有关聚类的算法,正确的说法有以下哪些?

答案:聚类的结果要考虑业务的可解释性。;类似Kmeans基于划分的聚类与基于层次的聚类都是样本的距离为划分基础。对于Kmeans而言,不同的初始聚类中心选择可能导致不同的聚类结果。

答案:对根据用户使用移动运营商的数据,可以为他们设计合适的套餐,使用哪种挖掘方法比较合适?

答案:聚类以下哪些数据的特征会对聚类有影响?

答案:高维性;离群点;噪声;样本规模有关聚类算法不正确的说法是?

答案:必须给出聚类的组数在kmeans的训练过程中,可以选择不同的k值,比较使绝对误差标准较小的k值,结合聚类业务的可解释性,从而选择合适的k值。

答案:对对联通客户进行分组,以便根据各组的特点,策划不同的营销方案,需要客户哪些数据?

答案:家庭男女组成;客户长途市话以及漫游等通话数据;客户人口数据聚类是一类重要的机器学习算法,以下哪些场景不属于聚类问题?

答案:根据学生的成绩,给出学生的名次。;判断一个网络访问是否为入侵访问。有关k-means下列说法正确的是?

答案:可以处理凸型分布数据的聚类减少神经网络过拟合可以通过增加网络的神经元个数或层数解决。

答案:错神经网络由许多神经元(Neuron)组成,下列关于神经元的陈述中哪一个是正确的?

答案:其他选项都正确下面关于感知机的说法中正确的是?

答案:单个感知机是线性回归的训练过程有关前馈神经网络的认识正确的是?

答案:神经网络训练过程是拟合训练数据模式的过程以下关于人工神经网络(ANN)的描述正确的说法是?

答案:训练ANN是一个很耗时的过程有关神经网络训练时使用的学习率参数说法正确的是

答案:学习率可以与其他网络参数一起训练,对降低代价函数是有利的。;网络训练时刚开始学习率可以大一些,以便提高学习速度,随后应减少学习率,以免引起学习震荡。;学习率可以随着训练误差动态调整效果更好。在一个神经网络里,确定每一个神经元的权重和偏差是模型拟合训练样本的目标,比较有效的办法是什么?

答案:赋予一个初始值,然后迭代更新权重,直至代价函数取得极小。BP神经网络在训练过程中,损失函数可能比较大,但随着训练的进行,损失函数基本不变化了,这种现象说明神经网络陷入全局最优解

答案:错在神经网络训练中,有关学习率调整说法错误的是?

答案:学习率太小会使神经网络的训练迅速达到极小值。;学习率设置不当会引起神经网络过拟合。激活函数通过具有以下哪些性质?

答案:计算简单;单调性;非线性;可微性以下哪个指标不能用于决策树的性能评价指标?

答案:决策树规则的数目以下哪些不是贝叶斯网络的应用场景?

答案:根据客户消费行为对其进行分组;招聘人才选拔规则以下哪个算法不是基于规则的分类器?

答案:贝叶斯分类器如果发现决策树模型的检验结果达不到要求,可以执行下面哪些方法进行改进?

答案:补充或调整样本的选择,并加强样本的预处理。;采用多种算法组合。;对算法的选择以及参数的调整进行优化。有关决策树的说法哪个是错误的?

答案:决策树的深度越大越好下面有关支持向量机错误的说法是?

答案:支持向量机是把高维的数据投影到低维的空间进行分类。下面有关线性判别分析错误的说法是哪个?

答案:线性判别分析中线性变换可以使同类样本的方差变大。如果从员工的日常表现数据预测其升职的可能性可以使用下面哪种机器学习方法?

答案:决策树类算法下面有关随机森林

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论