下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据分析与可视化智慧树知到期末考试答案+章节答案2024年山东交通学院决策树算法适于处理离散型数据,对于连续性变量处理效果不佳。()
答案:对数据挖掘分析技术对高科技的研究是必不可少的,其主要的功能是对大批量数据的处理。()
答案:对所谓数据挖掘分析就是从海量的数据中抽取感兴趣的模式和知识()
答案:对神经网络的学习实际是不断调整权重的一个过程。()
答案:对在有反馈的前向神经网络中,输出层会对输入层产生反馈信息。()
答案:对BP神经网络是一种前馈神经网络。()
答案:对一个神经网络可以没有输入层或输出层。()
答案:错在K-均值聚类方法中,每个样本属于且仅属于一个类。()
答案:对在数据分布扁平程度的测度中,峰态系数>0为尖峰分布。()
答案:对数据挖掘分析的任务是从数据中发现模式,模式按功能分为预测型(Predictive)和描述型(Descriptive)。()
答案:对BP神经网络同一层之间的神经元相互无连接。()
答案:对数字离散化是数据变换的一部分。()
答案:错概念分层是指通过使用高层的概念(比如:青年、中年、老年)来替代底层的属性值(比如:实际的年龄数据值)来规约数据。()
答案:对给定关联规则A-->B,意味着:若A发生,B也会发生()
答案:对遗传算法是一种生物进化思想的算法。()
答案:对对分类数据进行自动概念分层时,不同值个数最多的属性将被放在概念分层的最顶层。()
答案:错数据挖掘一般过程为:数据集选取、数据预处理、数据分析算法、分析总结改进。()
答案:对所谓基于数据库的知识发现(KDD)是指从大量数据中提取有效的、新颖的、潜在有用的、最终可被理解的模式的非平凡过程。()
答案:对格结构常用来枚举所有可能的项集()
答案:对层次聚类不需要事先设置类别个数。()
答案:对不论是表头项节点还是FP-Tree中有节点,它们至少有2个属性,分别是()
答案:name;count可以用决策树算法来预测未来房价的走势。()
答案:错Apriori算法是一种典型的关联规则挖掘算法()
答案:对多元回归是线性回归的一种扩展。()
答案:对可以使用以下哪些标准比较分类或预测方法的有效性()
答案:方法的可伸缩性;准确率;计算速度以下哪些属于决策树算法的优点()
答案:可以帮助其他模型算法挑选自变量;构建高效,分类速度快;易于理解和实现从大量数据中挖掘出潜在价值关系、模式和趋势,并建立用于决策支持的模型,提供决策支持的方法、工具的过程,就是数据分析与挖掘。()
答案:对规范化指将数据按比例缩放,使之落入一个小的特定区间,以下哪些是常用的规范化的方法?()
答案:小数定标规范化;最小-最大规范化;z-score规范化在保险业中,通过使用数据挖掘分析技术可以预测哪些行业、哪个年龄段、哪种社会层次的人会买哪种保险,或者预测哪类人容易买新的险种等。()
答案:对以下关于分类和预测的说法正确的是()
答案:预测法主要用来估计连续值;分类法主要用来预测类标号;两者都需要构建模型;两者都是用模型来估计未知值常用的数据归约策略有?()
答案:数据立方体聚集;数值归约;维归约;数据压缩对于频繁项集挖掘分析,在分析过程中使用的约束包括以下几种类型()
答案:不可转变的;简洁的;可转变的;反单调的以下属维归约处理方法的有?()
答案:向前选择和向后删除相结合;逐步向后删除;判定归纳树插入;逐步向前选择以下哪些是概念分层生成的典型方法?()
答案:直方图分析;分箱技术;基于熵的离散化;聚类分析常见的统计图表有()
答案:饼图;散点图;箱线;维恩图以下哪些选项是数据挖掘分析的研究方向及趋势?()
答案:专门用于知识发现的形式化和标准化的数据挖掘分析语言。;网络环境下的数据挖掘分析技术。;数据挖掘分析过程中的便于用户理解的及人机交互的可视化方法。;加强对各种非结构化数据的挖掘,如对文本数据、图形数据、视频图像数据、声音数据等。数据可视化是与()等并列的概念()
答案:可视分析学;信息可视化;科学可视化以下哪些是常见的聚类算法()
答案:基于模型的方法;划分方法;层次方法;基于网格的方法以下属于数据预处理的是()
答案:补充缺项数据;数据变换;数据规约;删除冗余数据以下哪些统计学知识可以在数据挖掘中用到?()
答案:区间估计;参数检验;回归分析;正态分布以下关于误差的说法错误的是()
答案:误差一定是正值关联规则应用场景实例不包括()。
答案:目标检测关于数据的相关性分析,以下说法不正确的是?()
答案:相关性即意味着因果关系artist的()属性控制绘图顺序
答案:ZorderMatplotlib是基于()语言的开源项目
答案:Python()函数主要用于在figure绘制对象中绘制各种曲线
答案:Plot()以下关于BP神经网络的说法错误的是()
答案:BP神经网络的误差是向前传播的()又称文字云是对文本数据中出现频率较高的关键词用图像的方式以视觉上的突出展示,形成"关键词的渲染"。
答案:词云图以下关于切比雪夫不等式的说法哪一条是错误的?()。
答案:切比雪夫不等式提供的是“上界”,也就是“所占比例至多是多少”。以下哪个说法是正确的?()。
答案:一组数据中不可以自由取值的数据的个数。可视化涉及到的学科包括()
答案:统计分析;计算机图形学;人机交互;数据挖掘数据可视化是大数据发展的趋势。()
答案:对echars可以用来实现大数据可视化大屏()
答案:对若有一个数据集,每个数据点有5个属性,以下哪种可视化技术最适用于表示其属性凉凉之间的相关性呢?()
答案:散点图
答案:走势图K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。()
答案:错简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()
答案:划分聚类在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。
答案:曼哈顿距离()这些数据特性都是对聚类分析具有很强影响的。
答案:高维性;稀疏性;规模;噪声和离群点考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。
答案:共享最近邻如下哪些不是最近邻分类器的特点,()
答案:最近邻分类器基于全局信息进行预测以下哪些算法是分类算法,()
答案:C4.5以下哪项关于决策树的说法是错误的()
答案:决策树算法对于噪声的干扰非常敏感决策树中不包含一下哪种结点,()
答案:外部结点(externalnode)以下关于人工神经网络(ANN)的描述错误的有()
答案:神经网络对训练数据中的噪声非常鲁棒贝叶斯信念网络(BBN)有如下哪些特点,()
答案:构造网络费时费力;对模型的过分问题非常鲁棒Apriori算法的计算复杂度受(
)影响。
答案:事务数;支持度阀值;项数(维度);事务平均宽度下面购物篮能够提取的3-项集的最大数量是多少()ID购买项1牛奶,啤酒,尿布2面包,黄油,牛奶3牛奶,尿布,饼干4面包,黄油,饼干5啤酒,饼干,尿布6牛奶,尿布,面包,黄油7面包,黄油,尿布8啤酒,尿布9牛奶,尿布,面包,黄油10啤酒,饼干
答案:3某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()
答案:关联规则发现频繁项集、频繁闭项集、最大频繁项集之间的关系是:()
答案:频繁项集频繁闭项集最大频繁项集考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()
答案:1,2,4,5数据预处理的常见方法有()
答案:数据集成;数据变换;数据清洗数据预处理是指在对数据进行挖掘分析以前,需要对原始数据进行清理、集合和变换等一系列处理工作()
答案:对影响数据质量问题的因素有哪些()
答案:其余选项都对将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()
答案:数据预处理下面哪个属于映射数据到新的空间的方法?()
答案:傅立叶变换四分位数可以用于顺序数据、数值数据和分类数据()
答案:错在数据特征的测度中,描述分布的形状的值为()
答案:偏态;峰态以下属于推断统计的是()。
答案:离中趋势分析测度集中趋势就是寻找数据水平的代表值或中心值()
答案:对关于描述统计,包括()。
答案:相关分析;离中趋
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB12-T 995-2023 绿色公共机构评价技术规范
- 广东省湛江市(2024年-2025年小学五年级语文)统编版能力评测(上学期)试卷及答案
- 湖北省襄樊市(2024年-2025年小学五年级语文)人教版专题练习((上下)学期)试卷及答案
- 机床夹具设计电子教案第十五讲
- 二年级语文第四册电子教案
- 上海市市辖区(2024年-2025年小学五年级语文)人教版综合练习((上下)学期)试卷及答案
- 一年级数学计算题专项练习1000题汇编
- 四年级语文下册教案
- DB11T 1108-2014 地类认定规范
- 坐标测量装置产业深度调研及未来发展现状趋势
- 脑出血大病历.doc
- 煤矿联合试运转方案
- CJJ101-2016埋地塑料给水管道工程技术规程
- 文化广场规划设计方案说明书
- 2012年数学建模机器人避障问题
- 部编版二年级上册语文复习教案
- 燃气经营企业安全生产主体责任清单
- 规模化养猪场的科学用水管理
- 日本泡沫经济专题讲座PPT
- 电梯故障状态救援操作规程
- 车间现场作业指导书SOP模板样本
评论
0/150
提交评论