版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第一章1、2021年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获取、储存、治理和水平的数据集.A:计算B:访问C:应用D:分析答案:分析2、用4 V来概括大数据的特点的话,一般是指:Value、Velocity 、Volume和.A:VarietyB:VainlyC:VagaryD:Valley答案:Variety3、大数据分析四个方面的工作主要是:数据分类、关联规那么挖掘和时间序列预测.A:数据统计B:数据计算C:数据聚类D:数据清洗答案:数据聚类4、新浪和京东联合推出的大数据商品推荐,是由京东盲目推送到当前浏览新浪网站的用户的页面上的.A:对B:错答案:错5、目前
2、的大数据处理技术只能处理结构化数据.A:对B:错答案:错第二章1、我们常用的微软 Office套件中的Access数据库软件的数据库文件格式后缀名是.A:mdfB:mdbC:dbfD:xls答案:mdb2、大多数日志文件的后缀名是.A:txtB:csvC:xmlD:log答案:log3、本课程重点介绍的weka软件的专有文件格式是.A:MongoDBB:ARFFC:valueD:key map答案:ARFF4、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和.A:专业性B:排他性C: 一致性D:共享性答案:一致性5、八爪鱼软件的“自定义采集工作方式下,需要在软件里输入一个来作为采集
3、的目标.A: 号B:关键词C:网页地址D:用户名答案:网页地址6、八爪鱼软件的采集规那么可以通过文件的形式来导入或者导出,这种文件的后缀名是 .A:otdB:jpgC:pngD:gif答案:otd7、Excel可以通过“数据有效性按钮操作来标准数据输入的范围.A:对B:错答案:对8、Excel不能导入txt或csv格式的文件.A:对B:错答案:错9、八爪鱼软件只能对软件内建了 “简易采集规那么的网站采集数据.A:对B:错答案:错10、八爪鱼软件进行自定义采集时,需要了解对网页的页面结构.A:对B:错答案:对第三章1、使用DBSCA障法对莺尾花数据集(Iris.arff )进行聚类,将 epsi
4、lon 参数设置为0.2 , minPoints参数设置为5,忽略class属性,那么将形成()个簇.A: 1B: 2C: 3D: 4答案:32、使用EM算法对天气数据集(weather.numeric.arff )进行聚类,将 numClusters设置为4,即簇数为4,其他参数保持默认值,忽略class属性,从结果中可知,以下选项中,()是错误的.A:模型的最大似然估计值是-7.18B:这组数据用算法迭代15次C:第四个簇的先验概率是 0.14D:第四个簇的实例数为4答案:第四个簇的实例数为4 3、使用SimpleKMeans算法对天气数据集(weather.numeric.arff )进
5、行聚类,保持默认参数,即3个簇以及欧氏距离.选才i play属性为忽略属性,从结果中可知,以下选项中,() 是错误.A:这组数据用算法迭代四次B:产生了三个中央点C:聚合为3个簇,分别有7, 3, 4个实例D:平方和误差为8.928答案:这组数据用算法迭代四次4、使用线性回归(LinearRegression )分类器和用 M5P分类器对cpu.arff分别进行分类,由其输出的误差指标可知().A: LinearRegression的标准误差比M5P的标准误差小B: LinearRegression的平均绝对误差比 M5P的平均绝对误差小C: LinearRegression的相对误差比M5P
6、的相对误差小D: LinearRegression的平均方根误差比 M5P的平均方根误差大答案:LinearRegression的平均方根误差比 M5P的平均方根误差大5、删去cpu.arff 数据文件中的 CACHW性后,使用 M5P分类器构建方案,在结果中,到达LM2的实例数有个.A: 165B: 21C: 23D: 30答案:216、根据 J48分类器练习 weather.nominal.arff所生产的决策树,当 outlook=sunny ;temperature=cool ; humidity =high ; windy=TRUE时,分类的结果是.A: YesB: NoC:没有结果
7、D:无法分类答案:No7、根据 J48 分类器练习 iris.arff所生产的决策树,当 sepallength=4.4 ; sepalwidth=3.0 ;petallength=1.3 ; petalwidth=0.2 时,分类的结果是.A: Iris-setosaB: Iris-versicolorC: Iris-virginicaD:无法分类答案:Iris-setosa8、关于 Weka离散化说明正确的选项是.A:离散化是将数值属性转换为字符串型属性B:有监督离散化有两种等宽和等频方法C:等宽离散化是使实例分布均匀的D:离散化包括无监督离散化和有监督离散化答案:离散化包括无监督离散化和
8、有监督离散化9、以下不是 Weka的数据类型.A: numericB: nominalC: stringD: decimal答案:decimal10、关于Weka的文件类型描述错误的选项是.A: Weka可以翻开文件格式有 .arff、.csv、.xlsxB: Weka处理的数据集类似于关系数据库横行实例,竖行属性C: arff 是ASCII文件,可以用 Word等文本编辑器翻开查看D: relation定义数据集名称,data之后呈现实例,每一行就是一个实例答案:Weka 可以翻开文件格式有.arff、.csv、.xlsx11、以下属于关联分析的是.A: CPU性能预测B:购物篮分析C:自动
9、判断莺尾花类别D:股票趋势建模答案:购物篮分析12、大数据时代的到来,使我们无法人为地去发现数据中的微妙,与此同时,我们更应该注重数据中的相关关系,而不是因果关系.其中,数据之间的相关关系可以通过以下算法直接挖掘.A: K-meansB: Bayes NetworkC: C4.5D: Apriori答案:Apriori13、某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购置尿布,这种属于数据挖 掘的问题.A:关联规那么发现B:聚类C:分类D:自然语言处理答案:关联规那么发现14、在进行自动选择属性时,必须设立两个对象,其中确定使用什么方法为每个属性子集分 配一个评估值的对象是下面的.A:
10、搜索方法B:属性评估器C:元分类器D:规那么挖掘答案:属性评估器15、以下属于属性空间的搜索方法的是.A: GainRatioAttributeEvalB: BestFirstC: PrincipalcomponentsD: SymmetricalUncertAttributeEval答案:BestFirst16、在weka软件探索者界面中,利用Visualize 标签页通过更改各个参数来进行数据集的可 视化属性设置后,需要单击以下按钮,所有更改才会生效.A: Select AttributeB: SubSampleC: UpdateD: Fast scrolling答案:Update17、给
11、定关联规那么 AB,意味着:假设 A发生,B也会发生.A:对B:错答案:错18、支持度是衡量关联规那么重要性的一个指标.A:对B:错答案:对19、Ranker方法既可以用于单个属性评估器,又可以用于属性子集评估器.A:对B:错答案:错20、利用weka软件进行数据可视化时,用户可以选择类别属性对数据点着色,如果类别属性 是标称型,那么显示为彩色条.A:对B:错答案:错第四章1、贝叶斯网络中的节点代表.A:变量B:随机过程C:随机变量D:随机函数答案:随机变量的形2、贝叶斯网络中,节点需给出概率分布描述,对于离散型随机变量而言,可以用 式表不.A:条件概率密度函数B:正态分布C:条件概率表D:均
12、匀分布答案:条件概率表3、贝叶斯网络中节点之间的边代表.A:随机关系B:概率因果C:组合关系D:随机结果答案:随机关系4、贝叶斯网络保存的文件格式是.A:XML BIFB:DOCXC: TXTD:XLS答案:XML BIF5、下面不是反向传播神经网络的结构.A:输入层B:隐含层C:计算层D:输出层答案:计算层6、神经网络中的节点代表.A:鼓励变量B:鼓励函数C:随机变量D:随机函数答案:鼓励函数7、以下不是常见的鼓励函数.A:线性函数B:Sigmoid 函数C:阈值函数D:正弦函数答案:正弦函数8、在贝叶斯网络编辑界面时,如果节点的名称没法完全显示,需要从菜单项进行调整.A:Tools|Set
13、DataB:View|Zoom OutC:View|Zoom InD:Tools|Layout答案:Tools|Layout9、WEK中选择神经网络分类器操作时,应该选择.A:rules 条目下的 PARTB:functions 条目下的SG防类器C:functions 条目下的 MultilayerPerceptron 分类器D:默认的分类器答案:functions条目下的 MultilayerPerceptron 分类器10、下面关于 Package Manager安装后的目录说明不正确的选项是.A:doc子目录存放 API文档B:lib子目录存放包所需要的说明文件C:sample-dat
14、a 子目录存放数据集文件D:src子目录存放源代码文件答案:lib子目录存放包所需要的说明文件 第五章1、Tableau是一款定位于数据可视化敏捷开发和实现展现工具.Tableau 连续第6年在Gartner分析和商业智能魔力象限中蝉联领导者殊荣.A:商务智能B:商业行为C:商务计算D:商业统计答案:商务智能2、以下不是 Tableau的数据类型A:BooleanB:DateC:StringD:Decimal答案:Decimal3、Tableau可以用来实现交互的、的分析和仪表板应用,从而帮助我们快速地熟悉和理 解数据.A:连续性B:离散性C:智能化D:可视化答案:可视化4、以下说法错误的选项
15、是.A:Tableau通过内存数据引擎,可以直接查询外部数据库同时动态的从数据仓库抽取实时数 据,极大的提升了数据访问和查询效率B:用户仅需要通过轻点鼠标和简单拖放就可以迅速创立出智能、精美、直观和具有强交互性 的报表和仪表盘C:Tableau允许从多个数据源访问数据,包括带分隔符白文本文件、Excel文件、SQL数据库、Oracle数据库和多维数据库等D:Tableau不提供应用编程接口答案:5、度量往往是字段,度量是我们的指标.度量常常是连续的,连续的字段在图表中形成轴.将其拖放到功能区时,Tableau默认会进行.A:数值,聚合运算B:数值,混合运算C:分类,聚合运算D:分类,混合运算答
16、案:数值,聚合运算6、关于数据分层描述错误的选项是.A:数据分层可以实现向上钻取B:数据分层可以实现向下钻取C:数据分层的层级结构由数据维度的上下顺序决定D:数据分层的层次结构可以手工调整答案:数据分层可以实现向上钻取7、以下不属于集的创立方式的是.A:常规创立B:条件创立C:顶部创立D:分组创立答案:分组创立8、Tableau右边数据目录栏中,不能单击右键创立参数的纬度是A:纬度B:度量C:集D:参数答案:集9、以下不是创立计算字段时的运算逻辑的是.A:数字B:日期C:用户D:表结构答案:表结构10、仪表板版面大小设计选项,不属于大小设计选项.A:固定大小B:自动C:范围D:自定义答案:自定
17、义第六章1、Logistic 函数的定义域是.A:(-INF, +INF)B:0, 1C:(0, +INF)D:(-INF, 1)答案:(-INF, +INF)2、以下表达错误的选项是().A:逻辑回归是一种监督机器学习算法B:逻辑回归主要用于回归分析C:逻辑回归采用Sigmoid函数对样本数据进行拟合,以构建回归模型D:逻辑回归预测事件发生的概率并分析导致事件发生的因素答案:尺寸线用细点画线表示3、使用 旧k分类器和SMOH器对vote.arff分别进行分类,由其输出的结果可知()A:IBk正确分类百分比比SM仅B:IBk对republican的分类正确率比 SMOC:SMO寸democra
18、t的分类正确率比 旧k小D:SMO寸democrat和republican 的分类正确率都比 旧k大答案:SMO对democrat和republican的分类正确率都比 旧k大4、图片 10.pngA:0 或 1B:0 或-1C:1 或-1D:true 或 false答案:5、以下描述错误的选项是.A:SVM对噪声不具备鲁棒性B:SVM寻找具有最小边缘的超平面,因此经常被称为最小边缘分类器C:k-最近邻算法K-NN是一种消极学习器D:聚类分析可以看作是一种非监督的分类答案:6、线性支持向量机的最大化间隔正确的描述是.A:图片 6.pngB:图片 7.pngC:图片 8.pngD:图片 9.png答案:7、以下计算距离的公式中,计算欧氏距离的是.A:图片 2.pngB:图片 3.pngC:图片 4.pngD:图片 5.png答
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 花岗岩石制品项目可行性研究报告
- 中国智能型并口诊断卡项目投资可行性研究报告
- 年产4.8万台办公家具项目可行性研究报告申请报告
- 2021-2026年中国手工造纸市场竞争态势及投资战略规划研究报告
- XX村自来水工程可行性研究报告(正文)
- 农村一二三产业融合发展先导区项目可行性研究报告
- 室内设计行业市场发展现状及趋势与投资分析研究报告
- 经营压敏胶特种胶带行业深度研究报告
- 2025年中国火锅桌行业竞争格局分析及投资战略咨询报告
- 2020-2025年中国奥特莱斯开发与运营市场前景预测及投资规划研究报告
- 《人员素质测评理论与方法》电子版本
- 61850基础技术介绍0001
- 陶瓷色料的技术PPT课件
- 幼儿园食品安全工作计划四篇
- 课程设计YA32-350型四柱万能液压机液压系统设计
- (精心整理)系动词练习题
- 体彩排列五历史数据
- 中国工业数据库介绍
- 弱电智能化设计服务建议书(共35页)
- 中国银监会关于规范中长期贷款还款方式的通知
- 通信工程外文文献(共12页)
评论
0/150
提交评论