




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据专项测试题有答案单选题(总共40题)1.下列关于计算机存储容量单位的说法错误的是()。(1分)A、1kB<1MB<2GBB、基本单位是字节(Byte)C、一个汉字需要一个字节的存储空间D、一个字节能够容纳一个英文字符答案:C解析:
暂无解析2.下列去噪方法中能较好地保持图像边缘的是()(1分)A、中值滤波B、双边滤波C、均值滤波D、高斯滤波答案:A解析:
暂无解析3.下列代码中最适合接受系统输入是一个整数的是。(1分)A、num=input()B、num=input("6")$;$num=int(input)$;$num=?oat(input)C、num=int(input)D、num=?oat(input)答案:C解析:
暂无解析4.基于N-最短路径分词算法,其最后的粗分结果集合大小()N。(1分)A、大于B、不小于C、小于D、不大于答案:B解析:
暂无解析5.下列关于SOM神经网络的描述错误的是()。(1分)A、一种竞争学习型的无监督神经网络B、将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构C、SOM寻优目标为每个输出神经元找到合适的权重D、输出层神经元以矩阵方式排列在二维空间答案:C解析:
暂无解析6.变量的不确定性越大,相对应信息熵的变化是()。(1分)A、熵变小B、熵变大C、不变D、以上答案都不正确答案:B解析:
暂无解析7.在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于2,则表明模型中存在()。(1分)A、异方差B、序列相关C、多重共线性D、高拟合优度答案:C解析:
暂无解析8.下列关于Python内存管理的说法错误的是?(1分)A、变量不必事先声明B、变量无须先创建和赋值而直接使用C、变量无须指定类型D、可以使用del释放资源答案:B解析:
暂无解析9.下列不属于判别式模型的是()。(1分)A、决策树B、BP神经网络C、支持向量机D、贝叶斯答案:D解析:
暂无解析10.在一个线性回归问题中,通常使用R平方(R-Squared)来判断拟合度。此时,如果增加一个特征,模型不变,则下面说法正确的是()。(1分)A、如果R-Squared增加,则这个特征有意义B、如果R-Squared减小,则这个特征没有意义C、仅看R-Squared单一变量,无法确定这个特征是否有意义D、以上说法都不对答案:C解析:
暂无解析11.逻辑回归将输出概率范围限定为[0,1],()函数能起到这样的作用。(1分)A、Sigmoid()函数B、tanh()函数C、ReLU()函数D、LeakyReLU()函数答案:A解析:
暂无解析12.下列不属于数据科学项目主要角色的是()。(1分)A、项目发起人B、项目经理C、操作员D、验收人员答案:D解析:
暂无解析13.下列不属于Transformation操作的是()。(1分)A、mapB、filterC、sampleD、count答案:D解析:
暂无解析14.机器学习和深度学习的关系是()。(1分)A、深度学习包含机器学习B、机器学习包含深度学习C、二者是独立的D、二者相互促进答案:B解析:
暂无解析15.下列关于Python的说法不正确的是()(1分)A、Python是一门面向对象的解释性程序设计语言B、Python程序可以在IDLE和pycharm里进行开发C、Python功能很强大,可以编写网页和游戏D、Python只能在Windows系统下编写答案:D解析:
暂无解析16.在数据科学项目的活动流程中,主要用于回答“我们用什么方式记录和展现数据结果”问题的是()。(1分)A、数据的获得与管理B、模式/模型的验证和优化C、结果的可视化与文档化D、模式/模型的应用及维护答案:C解析:
暂无解析17.下列语句会无限循环下去的是()。(1分)A、forainrange(10):timesleep(10)B、whilei<10:timesleep(10)C、whileTrue:breakD、a=[3,-1,',']foriina[:]:ifnota:break答案:B解析:
暂无解析18.下列语句在Python中不合法的是。(1分)A、i="A"+2$;$i=True+2$;$x,y=y,x$;$x=y=z=2B、i=True+2C、x,y=y,xD、x=y=z=2答案:A解析:
暂无解析19.下列不属于python特点的是?(1分)A、面向对象B、运行效率高C、可移植性D、免费和开源答案:B解析:
暂无解析20.下面程序段执行后的输出结果是()n=1s=1whilen<5:s=s*nn=n+1print(s)(1分)A、24B、10C、120D、15答案:A解析:
暂无解析21.中文同义词替换时,常用到Word2vec,则下列说法错误的是()。(1分)A、Word2vec基于概率统计B、Word2vec结果符合当前预料环境C、Word2vec得到的都是语义上的同义词D、Word2vec受限于训练语料的数量和质量答案:C解析:
暂无解析22.假设一个线性回归模型完美适合训练数据(训练误差为1),则下列说法正确的是()。(1分)A、测试集误差一直为B、测试集误差可能为C、测试集误差不会为D、以上都不对答案:B解析:
暂无解析23.下列数据类型Hive不支持的是()。(1分)A、StructB、IntC、MapD、Long答案:D解析:
暂无解析24.下列关于组织机构的数据管理成熟度等级划分中的已执行级的描述错误的是?(1分)A、在具体项目中,DMM关键过程域(KPA)中给出的关键过程已被执行,但随意性和临时性较大B、DMM关键过程的执行不仅仅局限于特定业务范畴,存在跨越不同业务领域的关键过程C、缺少针对DMM关键过程的反馈与优化D、虽然有可能在特定业务过程中进行了基础性改进,但没有进行持续跟进,也未拓展到整个组织机构答案:B解析:
暂无解析25.下列操作中MapReduce的Shuffle阶段最后做的是?(1分)A、溢写B、分区C、排序D、合并答案:D解析:
暂无解析26.下列不属于可视化视觉下的数据类型的是()(1分)A、定类数据B、定序数据C、定宽数据D、定比数据答案:C解析:
暂无解析27.下列不属于数据科学开源工具的是?(1分)A、MapReduceB、ERPC、HadoopD、Spark答案:B解析:
暂无解析28.下列关于特征编码的叙述不正确的是?(1分)A、特征编码是将非数值型特征转换成数值型特征的方法B、数字编码与特征的排序无关C、One-Hot编码中,原始特征有n种取值,转换后就会产生n列新特征D、哑变量编码解决了One-Hot编码中存在线性关系的问题答案:B解析:
暂无解析29.()负责HDFS数据存储。(1分)A、NameNodeB、JobTrackerC、DataNodeD、SecondaryNameNode答案:C解析:
暂无解析30.()主要提供内存计算框架。(1分)A、Spark核心层B、资源管理层C、服务层D、Spark层答案:A解析:
暂无解析31.逻辑回归将输出概率范围限定为[0,2],()函数能起到这样的作用。(1分)A、Sigmoid()函数B、tanh()函数C、ReLU()函数D、LeakyReLU()函数答案:A解析:
暂无解析32.将Python中的.py文件转换为.pyc文件的组件为()。(1分)A、编辑器B、编译器C、虚拟机D、解释器答案:B解析:
暂无解析33.下列算法中不属于基于深度学习的图像分割算法的是()。(1分)A、FCNB、DeeplabC、Mask-RCNND、KNN答案:D解析:
暂无解析34.下列不属于基于区域的图像分割方法的是()(1分)A、区域生长法B、分水岭算法C、大津算法D、基于图论的分割算法答案:C解析:
暂无解析35.查看变量内存地址的Python内置函数是()。(1分)A、memery()B、id()C、localof()D、help()答案:B解析:
暂无解析36.下列函数能够让所有单词的首字母变成大写的是()。(1分)A、capitalize()B、title()C、upper()D、ijust()答案:B解析:
暂无解析37.()是一种著名的密度聚类算法,它基于一组邻域参数来刻画样本的紧密程度。(1分)A、DBSCANB、原型聚类C、密度聚类D、层次聚类答案:A解析:
暂无解析38.下列关于ZooKeeper特点的描述错误的是。(1分)A、复杂性B、自我复制C、顺序访问D、高速读取答案:A解析:
暂无解析39.下列关于词袋模型的说法错误的是()。(1分)A、词袋模型使用一个多重集对文本中出现的单词进行编码B、词袋模型不考虑词语原本在句子中的顺序C、词袋模型可以应用于文档分类和检索,同时受到编码信息的限制D、词袋模型产生的灵感来源于包含类似单词的文档经常有相似的含义答案:C解析:
暂无解析40.下列关于Python布尔值的描述正确的是()。(1分)A、整型的0不可以表示FalseB、浮点型的0不可以表示FalseC、0+0j可以表示FalseD、布尔值不可以进行算术运算答案:C解析:
暂无解析多选题(总共30题)1.Spark的关键技术包括()。(1分)A、RDDB、SchedulerC、StorageD、Shuffle答案:ABCD解析:
暂无解析2.数据故事化描述应遵循的基本原则有()。(1分)A、忠于原始数据原则B、设定共同场景原则C、有效性利用原则D、3C精神原则答案:ABCD解析:
暂无解析3.Python变量命名规则包含()。(1分)A、变量名只能包含字母、数字和下划线。变量名可以字母或下划线开头,但不能以数字开头。例如,可将变量命名为message_1,但不能将其命名为1_messageB、变量名不能包含空格,但可使用下划线来分隔其中的单词。例如,变量名greeting_message可行,但变量名greetingmessage会引发错误C、不要将Python关键字和函数名用作变量名,即不要使用Python保留用于特殊用途的单词,如printD、变量名应既简短又具有描述性。例如,name比n好,student_name比s_n好,name_length比length_of_persons_name好答案:ABCD解析:
暂无解析4.在词袋模型中使用单个的单词来构建词向量这样的序列被称为()。(1分)A、1元组(1-gram)B、单元组(unigram)模型C、列表D、字典答案:AB解析:
暂无解析5.数据科学基本原则中,“三世界”原则指的是()。(1分)A、精神世界B、数据世界C、物理世界D、数字世界答案:ABC解析:
暂无解析6.如果将A、B、C三个分类器的P-R曲线画在一个图中,其中A、B的P-R曲线可以完全包含住C的P-R曲线,A、B的P-R曲线有交点,A、B、C的平衡点分别为0.79、0.66、0.58,则下列说法中正确的有()。(1分)A、学习器A的性能优于学习器CB、学习器A的性能优于学习器BC、学习器B的性能优于学习器CD、学习器C的性能优于学习器B答案:ABC解析:
暂无解析7.常用的代价函数有()。(1分)A、均方误差B、均方根误差C、平均绝对误差D、交叉熵答案:ABCD解析:
暂无解析8.变量名可以包含()。(1分)A、字母B、数字C、下划线D、空格答案:ABC解析:
暂无解析9.区块链是()等计算机技术的新型应用模式。(1分)A、分布式数据存储B、点对点传输C、共识机制D、加密算法答案:ABCD解析:
暂无解析10.完整性约束通常包括()。.(1分)A、实体完整性B、域完整性C、参照完整性D、用户定义完整性答案:ABCD解析:
暂无解析11.在Python中,下列导入模块方式正确的有()。(1分)A、import模块名B、import模块名as模块的别名C、from模块名import函数名D、from模块名import函数名A,函数名B答案:ABCD解析:
暂无解析12.空间域滤波是直接以图像中的像素操作为基础的滤波,空间滤波器有时也可称为()。(1分)A、空间掩模B、核C、模板D、窗口答案:ABCD解析:
暂无解析13.图像分割中常使用的邻域有()。(1分)A、0邻域B、4邻域C、8邻域D、24邻域答案:BC解析:
暂无解析14.Hadoop框架的缺点有()。(1分)A、MapReduce编程框架的限制B、过多的磁盘操作,缺乏对分布式内存的支持C、无法高效支持迭代式计算D、不支持多用户写入和任意修改文件答案:ABCD解析:
暂无解析15.处理图像平滑的滤波有()。(1分)A、盒式滤波B、均值滤波C、高斯滤波D、中值滤波答案:ABCD解析:
暂无解析16.Spark支持的计算模型有()。(1分)A、批处理B、实时计算C、机器学习模型D、交互式查询答案:ABCD解析:
暂无解析17.RNN在NLP领域的应用包括()。(1分)A、语言模型与文本生成B、机器翻译C、语音识别D、图像描述生成答案:ABCD解析:
暂无解析18.数据安全不仅包括数据保密性,还包括()。(1分)A、完整性B、可用性C、不可否认性D、可审计性答案:ABCD解析:
暂无解析19.常用分词方法包含()。(1分)A、基于Binarytree的分词方法B、基于HMM的分词方法C、基于CRF的分词方法D、基于K-means的分词方法答案:BC解析:
暂无解析20.Python的特点和优点有()。(1分)A、解释性强B、使用动态特性C、面向对象D、语法简洁答案:ABCD解析:
暂无解析21.数据挖掘的主要功能包括概念描述、趋势分析、孤立点分析、()等方面。(1分)A、关联分析B、分类和预测分析C、聚类分析D、偏差分析答案:ABCD解析:
暂无解析22.大数据偏见包括()。(1分)A、数据源的选择偏见B、算法与模型偏见C、结果解读方法的偏见D、数据呈现方式的偏见答案:ABCD解析:
暂无解析23.数据科学项目主要涉及的活动包括()。(1分)A、模式/模型的应用及维护B、模式/模型的洞见C、结果的可视化与文档化D、模式/模型的验证和优化答案:ABCD解析:
暂无解析24.Hadoop的优点包括()。(1分)A、可靠性B、高效性C、可伸缩性D、成本低答案:ABCD解析:
暂无解析25.情感分析的途径有()。(1分)A、关键词识别B、词汇关联C、统计方法D、概念级技术答案:ABCD解析:
暂无解析26.数据可视化是利用计算机图形学和图像处理技术,将数据转换成()在屏幕上显示出来,并进行交互处理的理论、方法和技术。(1分)A、文字B、图形C、图像D、视频答案:BC解析:
暂无解析27.Python的优点有()。(1分)A、变量不用预定义类型B、数据结构功能强大C、语言可解释性强D、变量类型固定答案:ABC解析:
暂无解析28.常用的爬虫技巧有()。(1分)A、更改header,伪装成浏览器进行爬取B、设置爬取的时间间隔C、应用神经网络算法识别网站验证码D、通过代理服务器进行爬取答案:ABCD解析:
暂无解析29.Spark的部署模式包括()。(1分)A、本地模式B、Standalone模式C、SparkonYARN模式D、SparkonMesos模式答案:ABCD解析:
暂无解析30.Python中字典的内置方法包括()。(1分)A、radiansdictkeys()B、radiansdictsetdefault(key,default=None)C、radiansdictupdate(dict2)D、radiansdictvalues()答案:ABCD解析:
暂无解析判断题(总共30题)1.为确定是否安装了Python,执行命令python(请注意,其中的p是小写的)。()(1分)A、正确B、错误答案:A解析:
暂无解析2.数据管理是指通过管理数据实现组织机构的某种业务目的。而数据治理则指的是如何确保数据管理的顺利、科学、有效进行。()(1分)A、正确B、错误答案:A解析:
暂无解析3.HBase可以有列,可以没有列簇.(1分)A、正确B、错误答案:B解析:
暂无解析4.MapReduce为海量的数据提供了存储架构;()(1分)A、正确B、错误答案:B解析:
暂无解析5.Python中,<返回x是否小于y,这分别与特殊的变量True和False等价,需要注意这些变量名的大写()(1分)A、正确B、错误答案:A解析:
暂无解析6.Linux系统是为编程而设计的,因此在大多数Linux计算机中,都默认安装了Python;()(1分)A、正确B、错误答案:A解析:
暂无解析7.默认值参数就是在定义形参的时候,给函数默认赋一个值。()(1分)A、正确B、错误答案:A解析:
暂无解析8.eval(str)是计算在字符串中的有效Python表达式,并返回一个对象。()(1分)A、正确B、错误答案:A解析:
暂无解析9.沿负梯度下降的方向一定是最优的方向;()(1分)A、正确B、错误答案:B解析:
暂无解析10.文本挖掘又称信息检索,是从大量文本数据中提取以前未知的、有用的、可理解的、可操作的知识的过程()(1分)A、正确B、错误答案:B解析:
暂无解析11.SupportVectorMachine的目标是找到使得训练数据尽可能分开且分类间隔最大的超平面,应该属于结构风险最小化;()(1分)A、正确B、错误答案:A解析:
暂无解析12.相对路径使用的特殊符号"./"代表目前所在的目录(1分)A、正确B、错误答案:A解析:
暂无解析13.静态方法不需要关键字self.()(1分)A、正确B、错误答案:A解析:
暂无解析14.数据挖掘的目的是发现数据集中的模式或规律,数据挖掘有监督学习和无监督学习两种方式。()(1分)A、正确B、错误答案:A解析:
暂无解析15.在机器学习中,随着树中节点数变得太大,即使模型的训练误差还在继续减低,但是检验误差开始增大,这是出现了模型拟合不足的问题。()(1分)A、正确B、错误答案:B解析:
暂无解析16.如果仅仅是用于控制循环次数,那么使用foriinrange(20)和foriinrange(20,40)的作用是等价的。(1分)A、正确B、错误答案:A解析:
暂无解析17.数据产品开发涉及数据科学项目流程的部分活动()(1分)A、正确B、错误答案:B
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年保安员考试复习题库及答案指导
- 2025国际货运代理《理论实务》模拟题及答案
- 仪器仪表行业的人才培养与引进策略考核试卷
- 2025年报检员考试试题及答案A卷
- 压缩机在电子制造行业的应用考核试卷
- 食品生产过程自动化与食品安全控制技术考核试卷
- 挂职招商管理办法
- 杜绝小账管理办法
- 2024年西藏班戈县事业单位公开招聘工作人员考试题含答案
- 批量资产管理办法
- 2025年高级维修电工资格考试理论知识模拟题库及答案
- 煤矿职业病防治讲义课件
- 2025年世界防治结核病日知识竞赛考试题库300题(含答案)
- 医务科依法执业自查表
- 全国教育科学规划课题申报书:34.《高质量数字教材建设研究》
- 中建CFG桩施工方案
- 重度残疾儿童少年送教活动记录表
- 水电暖维修服务项目服务方案
- 新行政诉讼法课件
- 认证服务公司各部门岗位职责
- 股权收购协议书股权收购协议书
评论
0/150
提交评论