Python数据挖掘智慧树知到期末考试答案2024年_第1页
Python数据挖掘智慧树知到期末考试答案2024年_第2页
Python数据挖掘智慧树知到期末考试答案2024年_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python数据挖掘智慧树知到期末考试答案2024年Python数据挖掘OPTICS算法仅存储了每个对象的核心距离。()

A:对B:错答案:错不同于贝叶斯算法,决策树的构造过程不依赖领域知识,它使用属性选择度量来选择将元组最好地划分成不同的类的属性。()

A:对B:错答案:对定量属性可以是整数值或者是连续值()

A:错B:对答案:对从点作为个体簇开始,每一步合并两个最近的簇,这是一种分裂的层次聚类方法。()

A:对B:错答案:错寻找模式和规则主要是对数据进行干扰,使其符合某种规则以及模式。()

A:对B:错答案:(错)给定最小支持度阈值minsup,一个频繁项集的所有非空子集都是频繁的。()

A:对B:错答案:对Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。()

A:错B:对答案:对元组可以像列表一样,采用切片的方式访问。()

A:正确B:错误答案:正确逐层发现算法Apriori发现频繁项集的过程是按照项集的长度由大到小逐级进行的。()

A:错B:对答案:错使用函数有利于封装与信息隐藏。()

A:对B:错答案:对卡方测试用来度量离散标称属性数据的相关性。()

A:对B:错答案:对BIRCH算法利用了一个树结构来帮助我们快速的聚类,这个数结构类似于平衡B+树,一般将它称之为聚类特征树()

A:对B:错答案:对在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。()

A:对B:错答案:错字符串、列表和元组都为序列类型。()

A:对B:错答案:错数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成数据描述、预测数据等任务。()

A:对B:错答案:对设有字符串变量s1=“Chinese”和s2=“China”,执行print(s1<s2)的运行结果为:()

A:TrueB:Chinese<ChinaC:FalseD:1答案:False‏给定df是一个DataFrame对象,对df所有字段进行描述性统计,可以利用的方法为()。

A:df.statistics()B:df.mean()C:df.summary()D:df.describe()答案:df.describe()中心趋势度量模(mode)是指:()

A:算数平均值B:数据集中出现频率最高的值C:最大值D:最小值答案:数据集中出现频率最高的值设字典contacts={‘Fred’:’7235591’,‘Mary’:’3841212’,‘Bob’:’3841212’,‘Sarah’:’2213278’},输出字典中所有的键的代码为:()

A:print(contacts[::])B:print(contacts.keys)C:print(contacts.items)D:print(contacts.values)答案:print(contacts.keys)设X={1,2,3}是频繁项集,则可由X产生个关联规则。()

A:6B:4C:5D:7答案:6OPTICS算法属于下列那一项:()

A:分类。B:聚类。C:关联规则。D:时间序列预测。答案:聚类。设列表students=[[‘Zhang’,84],[‘Wang’,77],[‘Li’,100],[‘Zhao’,53]],执行students[1]的运行结果为:()

A:[‘Wang’,77]B:[‘Zhang’,84]C:‘Wang’D:‘Zhang’答案:[‘Wang’,77]设有字符串变量s=”IamaChinese”,将s中所有字母用大写方式输出。()

A:s.islower()B:s.lower()C:s.isupper()D:s.upper()答案:s.upper()设列表lst=[1,3,5,7,9],执行result=[xforxinaifx>5]的结果为:()

A:[1,3]B:[7,9]C:[5,7,9]D:[1,3,5]答案:[7,9]在多层次关联规则分析中,如果将商品进行归类,每一商品类别的支持度会()其包含的每个商品的支持度,从而有利于发现一些有意义的频繁模式或关联规则。()

A:大于B:不确定C:小于D:等于答案:等于简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()

A:非互斥聚类B:层次聚类C:模糊聚类D:划分聚类答案:划分聚类BIRCH是一种:()

A:特征选择算法B:分类器C:关联分析算法D:聚类算法答案:聚类算法假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()

A:第一个B:第三个C:第四个D:第二个答案:第二个下列属于ID3算法的缺点的是:()

A:ID3算法不能处理具有连续值的属性B:算法一般会优先选择有较多属性值的特征,因为属性值多的特征会有相对较大的信息增益,但这里的属性并不一定是最优的C:算法会生成很深的树,容易产生过拟合现象D:ID3算法不能处理属性具有缺失值的样本答案:ID3在scikit-learn中,BIRCH类的重要参数不多,以下对其参数描述正确的是:()

A:threshold:即叶节点每个CF的最大样本半径阈值T。B:branching_factor:即CFTree内部节点的最大CF数B,以及叶子节点的最大CF数L。C:compute_labels:表示标示类别数量,默认是整数1。D:n_clusters:即类别数K,在BIRCH算法是可选的,如果类别数非常多,我们也没有先验知识,则一般输入None。答案:nclusters朴素贝叶斯信念网络(BBN)有如下哪些特点:()

A:网络结构确定后,添加变量相当麻烦B:贝叶斯网络不适合处理不完整的数据C:构造网络费时费力D:对模型的过分问题非常鲁棒答案:构造网络费时费力###对模型的过分问题非常鲁棒下面关于数学函数库math,说法正确的为:()

A:math.sqrt(x)将返回x的平方根B:math.ceil(x)将返回不小于x的最小整数C:math.gcd(x,y)将返回x与y的最大公约数D:math.floor(x)将返回不大于x的最大整数答案:math.ceil(x)将返回不小于x的最小整数###math.gcd(x,y)将返回x与y的最大公约数###math.sqrt(x)将返回x的平方根###math.floor(x)将返回不大于x的最大整数下列选项中关于OPTICS算法说法正确的是:()

A:OPTICS算法的目的就是要过滤低密度区域,发现稠密样本点。B:OPTICS算法的提出就是为了帮助DBSCAN算法选择合适的参数,降低输入参数的敏感度C:OPTICS算法是一种基于高密度联通区域的聚类算法,它将类簇定义为高密度相连点的最大集合。D:OPTICS算法往往只能发现凸形的聚类簇答案:OPTICS算法的提出就是为了帮助DBSCAN算法选择合适的参数,降低输入参数的敏感度###OPTICS算法的目的就是要过滤低密度区域,发现稠密样本点###OPTICS算法是一种基于高密度联通区域的聚类算法,它将类簇定义为高密度相连点的最大集合设字典为dict={(1,1):30,(2,14):35,(3,6):37},下面对该字典的操作正确的为:()

A:dict.pop((2,14))B:dict[(1,1)]=31C:dict[1,1]=31D:dict.pop([2,14])答案:dict[(1,1)]=31###dict.pop((2,14))定义函数如下:

运行代码fun()的结果为:()

A:12345678910B:什么也没有C:0123456789D:0,1,2,3,4,5,6,7,8,9答案:AI参考:答案:D\n\n解析:这是一个输出一系列数字的函数,它接受一个参数并返回一个包含这个参数的数字列表。所以,函数内的代码应该按照列表的形式输出数字,即从0到9。因此,选项D是正确的。\n\n选项A、B和C都与函数定义不符,因为它们都没有正确地输出数字列表。选项A只输出了一个数字序列,选项B则什么也没有输出,而选项C则只输出了一个单独的数字。因此,这些选项都是错误的。'定义函数如下:

下面的调用方法不正确的为:()

A:fun(a=8,b=8)B:fun(c=8)C:fun(3,b=8)D:fun(a=8)答案:AI参考:正确答案是B:fun(c=8)。\n\n根据题目给出的函数定义,函数接受两个参数,并返回它们的和。选项A和C都是正确的调用方式,因为它们都提供了两个参数,并且第一个参数的值被设置为8。选项D也是正确的调用方式,因为第二个参数的值没有被指定,所以它的默认值是8。选项B是不正确的调用方式,因为只有一个参数被传递给函数,并且没有提供任何值给第一个参数。因此,正确答案是B。'打印出10以内所有的正偶数的代码为:()

A:B:C:D:答案:"AI参考:正确选项为B:以下是打印出10以内所有的正偶数的代码:```bashforiinrange(2,11):ifi%2==0:print(i)```这个代码使用了`for`循环,从2到9依次遍历每个数字,并使用`if`语句判断该数字是否为偶数。如果是偶数,则打印出来。最终输出结果为:2、4、6、8、10。"下列说法正确的是()。

A:K中心点能够解决有离群点的聚类问题B:K-modes能够解决离散数据的聚类问题C:K-means算法能够解决有离群点的聚类问题D:K-means++能够解决初始点影响聚类效果的问题答案:"AI参考:正确答案是:C:K-means算法能够解决有离群点的聚类问题;D:K-means++能够解决初始点影响聚类效果的问题。K中心点算法是解决离群点问题的算法,A选项错误;K-modes算法是处理连续变量的聚类算法,B选项错误;K-means算法是处理无监督学习问题中常见的一种方法,它的优势是可以找到样本空间的k个最能代表数据的中心点,用于样本聚类。该算法默认会在整个样本空间随机选取k个点作为初始质心,可能会存在效率低下或过度聚合等问题,为了提高聚类结果的可解释性和结果稳定性,现在发展出多种优化算法,比如K-means++、O-means等,这两种方法都是为解决初始质心影响聚类结果的问题,D选项正确。所以正确答案是C、D。"设有公式,用Python语言定义一个变量a和b,计算b的公式可以写成:()

A:b=1/2/aB:b=1/2//aC:b=1/(2*a)D:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论