能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第1页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第2页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第3页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第4页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第5页
已阅读5页,还剩162页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1能源大数据应用开发技能竞赛理论考试题库-上(单选题汇总)一、单选题1.神经元计算什么?A、神经元计算激活函数后,再计算线性函数(z=Wx+b)B、神经元计算一个线性函数(z=Wx+b),然后接一个激活函数C、神经元计算一个函数g,它线性地缩放输入x(Wx+b)D、神经元先计算所有特征的平均值,然后将激活函数应用于输出答案:B2.有一个63x63x16的输入,并使用大小为7x7的32个过滤器进行卷积,使用步幅为2和无填充,请问输出是多少?A、29x29x32B、16x16x32C、29x29x16D、16x16x16答案:A3.某公司要建立资料库,该资料库要用ElasticSearch进行检索,请问下列哪些选项可以放到资料库中?A、Word文档B、公司宣传视频C、产品设计图D、以上全部正确答案:D4.在其他条件不变的前提下,以下哪些做法容易引起机器学习中的过拟合问题。A、增加训练集量B、减少神经网络隐藏节点数C、在损失函数中增加正则项D、SVM算法中使用高斯核/RBF核代替核性核答案:D5.HBase中KeyValue数据的存储格式是()。A、HFileB、HLogFileC、SequenceFileD、TXT答案:A解析:HBase中KeyValue数据的存储格式,是hadoop的二进制格式文件。6.____是指综合应用公司内部电力生产运行、经营管理、客户服务等业务活动所产生的数据资源,以及获取的外部数据资源,通过数据分析挖掘,释放数据资源价值,发现新知识、创造新价值、提升新能力,赋能公司提质增效,支撑行业高质量发展,服务国家治理现代化。A、能源数字化B、大数据报表C、能源大数据D、大数据应用答案:D7.深度学习中的“深度”是指()。A、计算机理解深度B、中间神经元网络的层次很多C、计算机的求解更加精确D、计算机对问题的处理更加灵活答案:B8.循环神经网络适合处理的数据为?A、节点数据B、序列数据C、结构化数据D、图像数据答案:B9.在回归分析中,说法正确的是()。A、解释变量和被解释变量都是随机变量B、解释变量为非随机变量,被解释变量为随机变量C、解释变量和被解释变量都为非随机变量D、解释变量为随机变量,被解释变量为非随机变量答案:B10.关于神经网络结构的权重共享现象,下面哪个选项是正确的()A、只有全连接神经网络会出现B、只有卷积神经网络(CNN)会出现C、只有循环神经网络(RNN)会出现D、卷积神经网络和循环神经网络都会出现答案:D11.np.dot([[1,2,3],[1,2,3],[1,2,3]],[[2,1,1],[2,1,1],[2,1,1]])的结果是()。A、[[1266][1266][1266]]B、[[223][223][223]]C、[[123][123][123]]D、[[211][211][211]]答案:A12.关于模型评估方法的说法,错误的是()A、“留出法”直接将数据集D划分成两个互斥的集合B、“自助法”在数据集较大、难以有效划分训练或测试集时很有用C、交叉验证法又称为“k折交叉验证”D、“留一法”是交叉验证法的一个特例答案:B解析:优点:自助法在数据集较小、难以有效划分训练/测试集时很有用。缺点:自助法改变了初始数据集的分布,这会引入估计偏差。13.以下对Python程序设计风格描述错误的选项是:A、Python中不允许把多条语句写在同一行B、PythonC、Python语句中,增加缩进表示语句块的开始,减少缩进表示语句块的退出D、Python可以将一条长语句分成多行显示,使用续航符“\”答案:A14.SVM模型通过最大化边界实现线性分类,以下哪个可以使得SVM实现非线性分类()A、松弛变量B、对偶空间求解C、kernelD、SMO算法答案:C15.在做CNN时,输入图片大小为37×37,经过第一层卷积层(有25个卷积核,每个卷积核的大小为5×5,不做填充,步长为1),与池化层(Maxpooling大小为3×3,不做填充,步长为1),输出图片再通过一次卷积层(有100个卷积核,每个卷积核的大小为4×4,不做填充,步长为1),与池化层maxpooling(Maxpooling大小为2×2,不做填充,步长为1),最终输出特征图大小为()。A、2×2B、3×3C、4×4D、5×5答案:C16.若数据量较大,下面哪种方式比较适合()A、系统聚类B、快速聚类(k-means)C、A和B都可以D、A和B都不可以E、A答案:B17.大数据应用是指综合应用公司内部电力生产运行、经营管理、客户服务等业务活动所产生的数据资源,以及获取的外部数据资源,通过(),释放数据资源价值,发现新知识、创造新价值、提升新能力,赋能公司提质增效,支撑行业高质量发展,服务国家治理现代化。A、大云物智移B、数据分析挖掘C、深度学习应用D、数据质量治理答案:B18.下列哪个程序通常与NameNode在一个节点启动()A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker答案:D19.下列关于数据转换,正确的是()。A、json内的取值只能有统一格式B、pdf文件在不同平台上打开显示不同C、可以通过python将csv文件转换成Excel格式D、excel存储数据的量无限制答案:C20.依托数据建模与仿真,实现经营管理的()可视、运营可控、问题可溯,持续提升科学决策能力、业务运行效率和风险管控水平。A、数据B、流程C、业务D、进度答案:B21.一般将原始业务数据分为多个部分,()用于模型的构建。A、训练集B、测试集C、验证集D、全部数据答案:A22.数据中台采用总部和()两级部署模式构建。A、省市公司B、市公司C、省公司D、市县公司答案:A23.下列哪项关于模型能力(modelcapacity指神经网络模型能拟合复杂函数的能力)的描述是正确的()A、隐藏层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、其他选项都不正确答案:A24.加强数据合规管理顶层设计,强化跨专业、跨层级统筹协调,建立健全()工作机制,确保公司数据合规管理工作有力、有序、有效推进。A、闭环B、协同C、安全D、监控答案:B25.下列不是NoSQL数据库的是()A、MongoDB、igTableC、HBaseD、Access答案:D26.下面哪个问题不适合使用机器学习方法解决()。A、判断电子邮件是否是垃圾邮件B、判断给定的图中是否有环C、判断是否给指定用户办理信用卡D、对滴滴拼车乘客分簇答案:B27.如果线性回归模型中的随机误差存在异方差性,那么参数的OLS估计量是()。A、无偏的,有效的B、无偏的,非有效的C、有偏的,有效的D、有偏的,非有效的答案:B28.在pandas中,哪一个函数可以统计Series每个唯一值出现的次数()。A、nunique()B、unique()C、sort_values()D、value_counts()答案:D解析:“value_counts是Pandas中的一个函数,用于计算一个Series中每个唯一值的出现次数,并将结果按照出现次数从高到低进行排序。”29.构建从公司总部到各级单位协调一致、符合实际的合规管理架构,确保数据在各层级、各单位、各板块之间合法合规流转,推动()共享应用。A、数据融合B、数据治理C、数据统计D、数据维护答案:A30.对于查询结果中有多个空值NULL的情况,SELECT命令中使用了DISTINCT和ORDERBYASC的结果是()A、空值只出现一次,排在最前面B、空值只出现一次,排在最后面C、空值出现多次,排在最前面D、空值出现多次,排在最后面答案:A解析:“如果使用SELECTDISTINCT语句从具有多个NULL值的列中查询数据,则结果集只包含一个NULL值。31.下面哪种不属于数据预处理的方法()。A、变量代换B、离散化C、聚集D、估计遗漏值答案:D32.正在构建一个用于识别黄瓜(y=1)与西瓜(y=0)的二进制分类器。对于输出层,建议使用哪一个激活函数?A、ReLUB、LeakyC、sigmoidD、tanh答案:C33.如何交换二维Numpy数组中的两列()。在数组arr中交换列1和2。arr=np.arange(9).reshape(3,3)A、rr[:,[1,0,2]]B、arr[:,[1,0,3]]C、arr[:,[1,0,1]]D、arr[:,[1,0]]答案:A34.下列选项中,()不是经典图像分割方法A、基于内容的分割方法B、基于阈值的分割方法C、基于边缘的分割方法D、基于基因编码的分割方法答案:A35.下列哪个不属于CRF模型对于HMM和MEMM模型的优势()。A、特征灵活B、速度快C、可容纳较多上下文信息D、全局最优答案:B36.已知一组数据X1,X2,X3,X4,X5的平均数是2,方差是1/3,那么另一组数据3X1-2,3X2-2,3X3-2,3X4-2,3X5-2的平均数和方差是:()。A、2,1/3B、2,1C、4,2/3D、4,3答案:D解析:分析:根据平均数公式与方差公式即可求解.解:∵据x1,x2,x3,x4,x5的平均数是2。∴=2,∵数据x1,x2,x3,x4,x5的平均数是2,方差是,∴[(x1-2)2+(x2-2)2+[(x3-2)2+(x4-2)2+(x5-2)2]=①;∴3x1-2,3x2-2,3x3-2,3x4-2,3x5-2,的平均数是,=3×-2=4.∴[(3x1-2-4)2+(3x2-2-4)2+(3x3-2-4)2+(3x4-2-4)2+(3x5-2-4)2]=[9(x1-2)2+9(x2-2)2+9(x3-2)2+9(x4-2)2+9(x5-2)2]=×9[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2]②把①代入②得,方差是:×9=3.故答案为:4;3.点评:本题考查了平均数的计算公式和方差的定义:一般地设n个数据,x1,x2,…xn的平均数为,则S2=[(x1-)2+(x2-)2+…+(xn-)2],它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.37.数据分析思维模式主要从()入手,最终改变()A、数据;业务B、业务;数据C、数据;项目D、项目;数据答案:A38.a=[[1,2,3],(4,5,6),7,8,9],请问a[1]是哪种数据类型?A、字符串B、列表C、集合D、元组答案:D39.以下哪项不是最近邻分类器的特点()A、它使用具体的训练实例进行预测,不必维护源自数据的模型B、分类一个测试样例开销很大C、最近邻分类器基于全局信息进行预测D、可以生产任意形状的决策边界答案:C40.DNN常用的激活函数有()。A、sigmoidB、tanhC、ReLUD、以上答案都正确答案:D解析:深度学习领域最常见的10中激活函数(sigmoid、Tanh、ReLU、LeakyReLU、ELU、PReLU、Softmax、Swith、Maxout、Softplus)41.()是一种基于日志的结构化数据复制软件,能够实现大量数据的实时捕捉、变换和投递。A、NosqlB、ETLC、OGGD、Hive答案:C解析:ogg是一种基于日志的结构化数据复制软件,它通过解析源数据库在线日志或归档日志获得数据的增删改变化(S护具量只有日志的四分之一左右);ogg能够实现大量交易数据的实时捕捉,变换和投递,实现源数据库与目标数据库的数据同步,保持最少10ms的数据延迟。42.公司大数据应用建设应按照电网数字化建设要求,遵循公司大数据应用统一技术架构与标准,充分利用()等各类企业级大数据应用公共服务能力平台进行开发和实施。A、电网资源业务中台B、全业务数据中心C、数据中台D、数字化能力开放平台答案:C43.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择?A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法答案:B44.构建从公司总部到各级单位协调一致、符合实际的合规管理架构,确保数据在各层级、各单位、各板块之间合法合规流转,推动数据()应用。A、价值创造B、数据生态C、融合共享D、业务融合答案:C45.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()A、层次聚类B、划分聚类C、非互斥聚类D、模糊聚类答案:B46.在线迁移同步过程中可能因数据冲突、数据加工、异构类型转化、对象缺失等因素导致数据异常,用户可以通过“异常数据”页签查看,以帮助异常写入的排查。下列同步过程中,支持异常诊断的是:()。A、Postgres->GaussDBB、Oracle->RDSC、Mysql->GaussDBD、Postgres->GaussDB答案:B47.在前馈神经网络中,误差反向传播(BP算法)将误差从输出端向输入端进行传输的过程中,算法会调整神经网络的()。A、神经元和神经元之间连接的有无B、相邻层神经元和神经元之间的连接权重C、同一层神经元之间的连接权重D、输入数据大小答案:B48.假设你需要调整超参数来最小化代价函数(costfunction),会使用下列哪项技术A、穷举搜索B、随机搜索C、Bayesian优化D、都可以答案:D49.给定一个长度为n的不完整单词序列,我们希望预测下一个字母是什么。比如输入是predictio(9个字母组成),希望预测第十个字母是什么。下面哪种神经网络结构适用于解决这个工作()A、循环神经网络B、全连接神经网络C、受限波尔兹曼机D、卷积神经网络答案:A50.赋能基层智慧作业,实现任务的智能推送和流程的自动接续,实现管理审批环节的线上自动处理,推动基层业务()。A、高效化B、放管服C、智慧作业D、自动化答案:B51.下列激活函数中,能够实现将特征限制到区间[-1,1]的是哪一个?A、tanhB、logistiC、reluD、sigmoid答案:A52.以下()不是NoSQL数据库。A、MongoDBB、igTableC、HBaseD、Access答案:D解析:1.access的数据库类型是:关系型数据库。2.NoSQL数据库的分类:列存储(HBase)、文档存储(MongoDB)、Key-Value存储(Redis)、图存储(FlockDB)、对象存储(db4o)、XML存储(BaseX)、bigtable等53.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范,开展权威数据源中台标注,推进权威数据源在中台的落地应用,常态推进()治理。A、数据源头B、数据中台C、业务中台D、数据应用答案:A54.数据库查询集合操作中,表示交集的是()。A、INTERSECTB、MINUSC、EXECPTD、UNION答案:A解析:并集操作(UNION)、交集操作(INTERSECT)、集操作(EXCEPT)55.以下哪种卷积神经网络的设计引入了残差网络结构()A、LeNetB、AlexNetC、GoogLeNetD、ResNets答案:D56.ls=[3.5,"Python",[10,"LIST"],3.6],ls[2][–1][1]的运行结果是A、LB、IC、PD、Y答案:B57.数据对外提供应遵守国家有关政策法规和公司管理规定要求,除国家机关依法调取数据外,原则上公司()数据不对外提供。A、明细业务B、统计C、安全D、财务答案:A58.一个MapReduce程序中的MapTask的个数由什么决定()A、输入的总文件数B、客户端程序设置的mapTask的个数C、FileInputFormat.getSplits(JobContextjob)计算出的逻辑切片的数量D、输入的总文件大小/数据块大小答案:C59.依据()等法规制度,保护商业秘密和工作秘密数据。A、《中华人民共和国民法典》B、《中华人民共和国网络安全法》C、《全国人大常委会关于加强网络信息保护的决定》D、《中央企业商业秘密保护暂行规定》答案:D60.下面关于Hive各个格式使用场景描述错误的是()A、Parquet对于大型查询的类型是高效的,对于扫描特定表格中的特定列的查询,Parquet特别有用B、目前Parquet默认使用gzip压缩格式C、ORC可以支持复杂的数据结构(比如Map等)D、RCFile是一种行列存储相结合的存储方式答案:B解析:目前Parquet默认为snappy61.标准循环神经网络隐含层的输入对于网络输出的影响随时间而()A、不断递归而衰退B、不断递归而增强C、先增强后减弱D、先减弱后增强答案:A62.关于OLAP的特性,下面正确的是:(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性()A、(1)(2)(3)B、(2)(3)(4)C、(1)(2)(3)(4)D、(1)(2)(3)(4)(5)答案:D解析:olap的特点是快速性、可分析性、多维性、信息性、共享性63.以下程序的输出结果是:x=['90','87','90']n=90print(x.count(n))A、NoneB、1C、2D、0答案:D64.神经网络模型(NeuralNetwork)因受人类大脑的启发而得名。神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,对输入进行处理后给出一个输出,请问下列关于神经元的描述中,哪一项是正确的?A、每个神经元可以有一个输入和一个输出B、每个神经元可以有多个输入和一个输出C、每个神经元可以有一个输入和多个输出D、上述都正确答案:D解析:每个神经元可以有一个或多个输入,和一个或多个输出。65.哪种策略可以加速词向量训练()。A、para2vectB、层级softmaxC、最大似然估计D、以上都不对答案:B66.在一个神经网络中,下面哪种方法可以用来处理过拟合()A、DropoutB、分批归一化(BatchC、正则化(regularization)D、都可以答案:D67.优化配电网运行,构建()等应用场景,优化停电策略,降低停电影响,提升配电网可靠性。A、精准停电分析B、精准故障抢修C、优化停电策略D、降低停电影响答案:B68.将python中的.py文件转换为.pyc文件的组件为()。A、编辑器B、编译器C、虚拟机D、解释器答案:B69.EDA方法与传统统计学中的验证性分析方法的主要区别在于()①EDA不需要事先假设,而验证性分析需要事先提出假设;②EDA需要事先假设,而验证性分析不需要事先提出假设;③EDA中采用的方法往往比验证性分析复杂;④EDA中采用的方法往往比验证性分析简单;⑤在一般数据科学项目中,探索性分析在先,而验证性分析在后A、①③⑤B、②③⑤C、①④⑤D、②④⑤答案:C70.混沌度(Perplexity)是一种常见的应用在使用深度学习处理NLP问题过程中的评估技术,关于混沌度,哪种说法是正确的?A、混沌度没什么影响B、混沌度越低越好C、混沌度越高越好D、混沌度对于结果的影响不一定答案:B71.国家支持开发利用数据提升公共服务的(),应当充分考虑老年人、残疾人的需求,避免对老年人、残疾人的日常生活造成障碍。A、数据化服务B、智能化服务C、智能化水平D、数据智能化答案:C解析:第十五条国家支持开发利用数据提升公共服务的智能化水平。提供智能化公共服务,应当充分考虑老年人、残疾人的需求,避免对老年人、残疾人的日常生活造成障碍。72.单个神经元模型不能解决()。A、线性二分类B、XOR问题C、线性二判别D、以上都不是答案:B解析:XOR问题用单个神经元模型无法解决,因为该问题是线性不可分的,对于两维输入空间,神经元的作用可以理解为对输入空间进行一条直线划分。73.数据分类应结合数据在挖掘、计算、分析、处理后()动态变化的特点识别、调整数据分级和保护要求。A、业务属性B、管理属性C、安全属性D、基础属性答案:C74.参考公司()按域进行数据分类。A、维度模型B、公共数据模型(SG-CIM)C、通用数据模型D、业务分类答案:B75.下面哪个属于映射数据到新的空间的方法?A、傅立叶变换B、特征加权C、渐进抽样D、维归约答案:A76.《中华人民共和国网络安全法》规定:国家采取措施,()来源于中华人民共和国境内外的网络安全风险和威胁,保护关键信息基础设施免受攻击、侵入、干扰和破坏,依法惩治网络违法犯罪活动,维护网络空间安全和秩序。A、监测、防御、反击B、监测、防御、处置C、检测、防御、反击D、检测、防御、处置答案:B解析:《中华人民共和国网络安全法》第五条:国家采取措施,监测、防御、处置来源于中华人民共和国境内外的网络安全风险和威胁,保护关键信息基础设施免受攻击、侵入、干扰和破坏,依法惩治网络违法犯罪活动,维护网络空间安全和秩序。77.下列关于支持向量的说法正确的是()A、到分类超平面的距离最近的且满足一定条件的几个训练样本点是支持向量B、训练集中的所有样本点都是支持向量C、每一类样本集中都分别只有一个支持向量D、支持向量的个数越多越好答案:A78.多分类图像识别任务常采用()作为输出的编码方式。A、二进制编码B、one-hot编码C、霍夫曼编码D、曼切斯特编码答案:B79.Hadoop中MapReduce组件擅长处理()场景的计算任务。A、迭代计算B、离线计算C、实时交互计算D、流式计算答案:B80.《国家电网有限公司数据共享负面清单管理细则》自()起施行。A、2020年3月30日B、2021年3月30日C、2020年6月30日D、2021年6月30日答案:B81.当Spark发生Shuffle时,MapTask的运算结果会通过()的形式把运算结果分发到对应的任务上去。A、序列化B、键值对C、二进制D、RDD答案:C82.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经网络下一层所接收到的数据维度是多少()A、218x218x5B、217x217x8C、217x217x3D、220x220x5答案:A83.在二十世纪八十年代,“从样例中学习”的一大主流主义是____学习,代表包括决策树和基于逻辑的学习。A、无监督B、监督C、连接主义D、符号主义答案:D84.()管理主要包括数据目录、数据共享需求清单、数据共享负面清单和数据归集管理。A、数据共享B、数据存储C、数据使用D、数据传输答案:A85.下列哪个不是RDD的缓存方法()A、persist()B、Cache()C、Memory()D、以上答案都正确答案:C解析:RDD通过persist方法或cache方法86.构建一个神经网络,将前一层的输出和它自身作为输入,则有反馈连接的是()。A、循环神经网络B、卷积神经网络C、限制玻尔兹曼机D、都不是答案:A87.MPP查询组件中,()是Impala的核心组件,以守护进程的形式运行在分布式存储系统的从节点上,由查询计划生成器(QueryPlanner)、查询调度器(QueryCo‐ordinator)、查询执行器(QueryExecEngine)组成MPP并行查询组件。A、selectB、ImpalaC、SparkD、zookeeper答案:B88.依据《国家电网有限公司数据管理办法》,建立基于负面清单的公司()机制,坚持“以共享为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、对外数据共享B、对内数据共享C、对外数据交换D、对内数据使用答案:B89.数据质量的基本属性不包括()A、正确性B、时效性C、一致性D、完整性答案:B90.对于神经网络的说法,下面正确的是:(__)。1.增加神经网络层数,可能会增加测试数据集的分类错误率2.减少神经网络层数,总是能减小测试数据集的分类错误率3.增加神经网络层数,总是能减小训练数据集的分类错误率A、1B、1、3C、1、2D、2答案:A91.长短时记忆神经网络被设计用来解决什么问题()A、传统RNN存在的梯度消失/爆炸问题B、传统RNN计算量大的问题C、传统RNN速度较慢的问题D、传统RNN容易过过拟合的问题答案:A92.在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?A、搜索每个可能的权重和偏差组合,直到得到最佳值B、赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重C、随机赋值,听天由命D、以上都不正确的答案:B93.卷积神经网络(convolutionalneuralnetwork,CNN)是一种专门用来处理具有类似()的数据的神经网络。A、网格结构B、数组结构C、序列结构D、表格结构答案:A94.以下选项中,不是建立字典的方式是A、d=[1,2]:1,[3,4]:3}B、d={(1,2):1、(3,4):3}C、d=[["三':1,"四":2}D、=[1:]1,2],3:[3,4]}答案:A95.大数据应用的业务规划将聚焦核心领域,打造共5大重点业务、()个业务领域、34项业务方向。A、12B、13C、14D、15答案:A96.在OneData方法论中,OneService理论描述错误的是哪项()?A、数据标准化B、主题式数据服务C、统一但多样化数据服务D、跨源数据服务答案:A97.以下数据库选型中,()是一种将任务分散到多个服务器节点,多个节点并行计算完成后,将各自部分的结果汇总到一起,得到最终结果的海量并行处理技术。A、PGB、MPPC、pipdownload<拟下载库名>D、pyinstaller需要在命令行运行:\>pyinstaller答案:B解析:MPP(MassivelyParallelProcessing),即大规模并行处理。简单来说,MPP是将任务并行的分散到多个服务器和节点上,在每个节点上计算完成后,将各自部分的结果汇总在一起得到最终的结果(与Hadoop相似)。98.选择神经网络的深度时,对于下面参数:①神经网络的类型(如MLP,CNN);②输入数据;③计算能力(硬件和软件能力决定);④学习速率;⑤映射的输出函数。需要考虑的是()。A、①②③④B、②③④⑤C、①③④⑤D、都需要考虑答案:D99.下列关于深度学习中优化问题说法错误的是()。A、当优化问题的数值解接近局部最优值时,随着目标函数解的梯度接近或变为零,通过最终迭代获得的数值解可能仅使目标函数局部最优,而不是全局最优B、在深度学习优化问题中,经常遇到的是梯度爆炸或梯度消失C、优化问题中设置的学习率决定目标函数能否收敛到局部最小值,以及何时收敛到最小值D、一般来说,小批量随机梯度下降比随机梯度下降和梯度下降的速度慢,收敛风险较大答案:D100.关于L1、L2正则化下列说法正确的是?A、L2正则化能防止过拟合,提升模型的泛化能力,但L1做不到这点B、L2正则化技术又称为LassoRegularizationC、L1正则化得到的解更加稀疏D、L2正则化得到的解更加稀疏答案:C101.国网数据中台,是在下面()阶段的基础上发展过来的。A、营销服务中心B、全业务统一数据中心C、海量历史/实时数据中心D、电网GIS数据中心答案:B102.安全巡检属于信息系统安全过程管理的()阶段。A、运行B、测试C、科研D、上线答案:A103.构建客户群体特征分析及细分模型,评估优化潜力,为用户智能推荐个性化服务方案,满足()服务需求。A、精准化B、个性化C、差异化D、特色化答案:C104.AlexNet使用ReLU激活函数的好处不包括以下哪个方面?()A、梯度为0时神经元难以正常工作B、开销小、计算快C、提高了网络训练速度D、缓解了梯度消失问题答案:A105.下列说法错误的是()A、当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解B、进行PCA降维时,需要计算协方差矩C、沿负梯度的方向一定是最优的方向D、利用拉格朗日函数能解带约束的优化问题答案:C106.输入图片大?为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大小为()。A、95B、96C、97D、98答案:C107.下列哪个不是专门用于可视化时间空间数据的技术:()。A、等高线图B、饼图C、曲面图D、矢量场图答案:B108.以下关于PCA说法正确的是()A、PCA是一种监督学习算法B、PCA在转换后的第一个新坐标轴选择的是原始数据中方差最小的方向C、PCA转换后选择的第一个方向是最主要特征D、PCA不需要对数据进行归一化处理答案:C109.下列关于数据交易市场的说法中,错误的是()。A、数据交易市场是大数据产业发展到一定程度的产物B、商业化的数据交易活动催生了多方参与的第三方数据交易市场C、数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D、数据交易市场是大数据资源化的必然产物答案:C110.假设你在卷积神经网络的第一层中有5个卷积核,每个卷积核尺寸为7B7,具有零填充且步幅为1。该层的输入图片的维度是224x224x3。那么该层输出的维度是多少()A、217x217x3B、217x217x8C、218x218x5D、220x220x7答案:C111.语句np.random.randn(5,4)的运算结果是()。A、生成一个5行4列的随机矩阵B、将矩阵的第5行第4列改成一个随机值C、将矩阵的第4行第3列改成一个随机值D、将矩阵的第5列和第4列都用随机值代替答案:A112.预训练模型是指()。A、先训练一个模型作为基准B、在正式训练之前,做一次试验训练C、已经在大数据集上训练好的一个模型D、预先根据任务特点,对模型结构进行调整答案:C113.下列关于对大数据特点的说法中,错误的是()。A、数据规模大B、数据类型多样C、数据价值密度高D、数据处理速度快答案:C114.《个人信息保护法》对于企业的影响不包括()。A、需要强化个人信息处理这主体责任B、明确了可以量化的中国版执行罚则C、需要设立负责处理个人信息保护相关事务的专门机构和指定代表D、收集和处理数据时可以不遵循“最小化”原则答案:D115.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、大数据应用项目B、数字化项目C、信息化项目D、数据研发项目答案:B116.运行下面代码的输出结果为()。a=np.array([[5,3,2],[2,4,0]])n=np.sort(a,axis=None)print(n)A、[0,2,2,3,4,5]B、[5,4,3,2,2,0]C、[[2,3,0],[5,4,2]]D、[[2,3,5],[0,2,4]]答案:A117.以电力数据()服务为核心动能,驱动新兴业务拓展。A、挖掘B、应用C、信用D、增值答案:C118.根据国家电网互联[2020]745号《国家电网有限公司关于进一步规范数据安全工作的通知》,以下说法错误的是()。A、商业秘密、工作秘密、个人信息等纳入负面清单的数据,由数据使用方提出申请,经数据产生的总部业务部门和数据归口管理部门审批后方可对内跨部门、跨单位给数据使用方使用。B、公司对外提供数据时,应根据有关要求,执行标准统一的数据开放策略。C、涉密数据按照公司保密规章制度执行,严格履行相关保密合规审核流程。D、除国家机关依法调取数据外,原则上公司明细业务数据不对外提供。答案:B119.Scipy库不包含以下哪种功能()。A、线性代数模块B、傅里叶变换C、信号和图像图例D、提供机器学习等算法答案:D120.在Apriori算法中,候选项集划分为不同的桶,存放在()中。A、字典B、集合C、Hash树D、列表答案:C121.按照公司战略实施要求,立足数据发展需要,以“可管、()、可信”为核心,建立健全数据合规管理体系A、可控B、可查C、可见D、可防答案:A122.梯度下降法中,为什么梯度要加一个负号?A、梯度方向是上升最快方向,负号就是下降最快方向B、梯度方向是上升最快方向,负号就是上升最快方向C、梯度方向是下降最快方向,负号就是下降最快方向D、梯度方向是下降最快方向,负号就是上升最快方向答案:A解析:梯度要乘以一个负号的原因:梯度前加一个负号,就意味着朝着梯度相反的方向前进!我们在前文提到,梯度的方向实际就是函数在此点上升最快的方向!而我们需要朝着下降最快的方向走,自然就是负的梯度的方向,所以此处需要加上负号123.下列关于线性回归分析中的残差说法正确的是()。A、残差均值总是为零B、残差均值总是约等于零C、残差均值总是大于零D、以上答案都不正确答案:A解析:线性回归分析中,目标是残差最小化。残差平方和是关于参数的函数,为了求残差极小值,令残差关于参数的偏导数为零,会得到残差和为零,即残差均值为零。124.有关聚类分析说法错误的是()A、无须有标记的样本B、可以用于提取一些基本特征C、可以解释观察数据的一些内部结构和规律D、聚类分析一个簇中的数据之间具有高差异性答案:D125.数据产品和服务提供方与使用方应签署相关使用协议,明确约束()等双方权利义务。A、使用范围B、安全规则C、使用规则D、保密规则答案:C126.对矩阵[[0,0,3],[1,1,0],[0,2,1],[1,0,2]]进行独热编码训练后,对矩阵[[0,1,3]]进行独热编码输出结果为()。A、[0,1,0,1,0,0,0,1,0]B、[1,0,0,1,0,0,0,0,1]C、[0,1,0,0,1,0,0,0,1]D、[1,0,0,0,1,0,0,1,0]答案:B127.下列关于多层前馈神经网络的描述错误的是()。A、输出层与输入层之间包含隐含层,且隐含层和输出层都拥有激活函数的神经元B、神经元之间存在同层连接以及跨层连接C、输入层仅仅是接收输入,不进行函数处理D、每层神经元上一层与下一层全互连答案:B解析:多层网络的概念:多层网络是指包含隐含层的神经网络。前馈网络的概念:网络中的神经元不存在同层连接和跨层连接。128.假设有100,000张带标签的图片是使用汽车的前置摄像头拍摄的,这也是模型训练的数据分布,如果可以从互联网上获得更大的数据集,即使互联网数据的分布不相同,这也可能对训练有所帮助。在刚刚开始着手这个项目,要做的第一件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。A、花几天时间去获取互联网的数据,这样就能更好地了解哪些数据是可用的。B、花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估计。C、花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间可收集多少数据。D、花几天时间训练一个基本模型,看看它会犯什么错误答案:D解析:在构建模型初期,我们不必要建立复杂的模型,可以建立一个基本模型来观察可能出现的问题。129.下列核函数特性描述错误的是()。A、只要一个对称函数所对应的核矩阵半正定,就能称为核函数;B、核函数选择作为支持向量机的最大变数;C、核函数将影响支持向量机的性能;D、核函数是一种降维模型;答案:D130.以下代码的输出结果为()。importnumpyasnpa=np.array([[10,7,4],[3,2,1]])print(np.percentile(a,50))A、[[10B、3.5C、[6.5D、[7.答案:B131.()是空语句,一般用做占位语句,不做任何事情。A、breakB、passC、ontinueD、print答案:B132.各地区、各部门应当按照数据()保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域答案:A解析:《中华人民共和国数据安全法》第二十一条:各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。133.MapReduce框架中中间有一步叫shuffle,把同样的()运输到同一个()上面去。A、value,keyB、value,reducerC、key,reducerD、key,value答案:C134.移动平均法是测定()的一种较为简单的方法。A、长期趋势B、循环变动C、季节变动D、不规则变动答案:A135.(__)在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A、支持向量机B、oosting算法C、贝叶斯分类器D、神经网络答案:B136.关于Pandas层次化索引,下列说法错误的是A、层次化索引是指Pandas对象在一个轴方向上具有多层索引B、层次化索引至多只能有两层索引C、可以使用swaplevel()方法对层次化索引的位置交换顺序D、使用sort_index()可以对索引进行排序答案:B137.Logistic回归是在商业领域上使用最广泛的预测模型,常用于(___)分类变量预测和概率预测。A、四值B、三值C、二值D、一值答案:C138.下列关于集成学习方法的说法错误的是()A、Boosting是一族可将弱学习器提升为强学习器的算法B、随机森林是Bagging的一个扩展变体C、随机森林简单、容易实现、计算开销小D、Boosting是个体学习器间不存在强依赖关系、可同时生成的并行化方法答案:D解析:Boosting:个体学习器之间存在强依赖关系,必须串行生成的序列化方法139.以下哪类负面清单属于商业秘密和工作秘密。()A、密钥密码、境外投资、“三重一大”事项B、个人证件号码、家庭住址、银行账户等C、投标标底、审计事项、问题线索D、以上都是答案:A140.以下统计学知识,数据科学中不常用的是()。A、归纳分析法B、描述统计C、推断统计D、基本分析法答案:A141.正确导入日期模块的语句()。A、importdateB、importdatetimeC、importtimeD、importdate_time答案:B142.MapReduce任务map输出结果将被写入()。A、HDFS文件系统B、新的记录文件C、磁盘(Linux文件系统)D、主数据库答案:C143.从安全属性对各种网络攻击进行分类,截获攻击是针对()的攻击。A、机密性B、可用性C、完整性D、真实性答案:A144.给出如下代码:s='Pythonisbeautiful!'可以输出"python"的语句是()A、print(s[0:6])B、print(s[0:6].lower())C、print(s[-21:-14].lower)D、print(s[:-14])答案:B145.下列哪个不属于常用的文本分类的特征选择算法()。A、卡方检验值B、互信息C、信息增益D、主成分分析答案:D146.下列可以用来降低深度学习模型的过拟合问题的方法有①增加更多的数据;②使用数据扩增技术(dataaugmentation);③使用归纳性更好的架构;④正规化数据;⑤降低架构的复杂度()。A、①④⑤B、①②③C、①③④⑤D、所有项目都有用答案:D147.现阶段的大数据技术体系主要类型不包括()。A、数据源与APPB、基础设施C、HadoopD、数据资源答案:C148.至十四五末,公司企业中台公共服务共享使用率将达到()。A、80%B、85%C、90%D、100%答案:D149.下列表达式的值为True的是()。A、(2**=3)2>2B、3>2>2C、1==1and2!=1D、not(1==1and0!=1)答案:C150.神经网络训练过程中,一般会遇到停滞期,即神经网络在进入全局最小值之前陷入局部最小值。以下哪个策略可以避免上述情况?A、增加参数数量B、减少参数数量C、在开始时将学习率降低10倍D、改变几个时期的学习率答案:D151.下列哪个神经网络结构会发生权重共享()A、卷积神经网络B、循环神经网络C、全连接神经网络D、卷积神经网络和循环神经网络答案:D152.下列哪一项在神经网络中引入了非线性()A、随机梯度下降修B、正线性单元(ReLU)C、卷积函数D、以上答案都不正确答案:B153.深度学习方法不适用的数据集为以下哪种情况?A、样本量充足B、样本量多样化C、数据集具有局部相关性D、特征之间不具有局部相关性答案:D154.SVM算法中,对于线性不可分的情况,通过使用非线性的映射函数可以将低维不可分的样本转化到高维空间使其线性可分,这样的非线性映射函数称为()A、激活函数B、核函数C、超函数D、转换函数答案:B155.从数据到智慧的转换依次递进过程是()。A、数据、知识、信息、理解、智慧B、数据、信息、理解、知识、智慧C、数据、信息、知识、理解、智慧D、数据、理解、信息、知识、智慧答案:C156.阅读以下文字:假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置,你应该()A、除去神经网络中的最后一层,冻结所有层然后重新训练B、对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对答案:B157.机器学习中,下面哪些方法不可以避免分类中的过拟合问题?A、增加样本数量B、增加模型复杂度C、去除噪声D、正则化答案:B158.大数据应用管理包括大数据应用()等全生命周期管理及大数据应用能力建设。A、需求立项、开发实施、发布应用、经营管理B、需求立项、开发实施、发布应用、成果评价C、需求立项、发布应用、经营管理、成果评价D、需求立项、开发实施、经营管理、成果评价答案:B159.关于对决策树进行剪枝的说法中不正确的是()A、先剪枝和后剪枝都可以降低决策树的过拟合风险B、后剪枝决策树的训练时间会比先剪枝决策树和未剪枝决策树长很多C、先剪枝和后剪枝都是利用验证集精度来判断是否剪枝的D、一般来说,后剪枝要比先剪枝的效果好很多答案:D解析:先剪枝和后剪枝都可以降低决策树的过拟合风险;后剪枝决策树的训练时间会比先剪枝决策树和未剪枝决策树长很多;先剪枝和后剪枝都是利用验证集精度来判断是否剪枝的160.CNN神经网络对图像特征提取带来了变革性的变化,使之前的人工特征提取升级到数据驱动的自动特征提取,在CNN中,起到特征提取作用的网络层是()。A、卷积层B、全连接层C、池化层D、采样层答案:A161.优化(),建立设备绩效和供应商业绩之间的关联关系,实现设备质量评价管理闭环,建立健全供应商信用风险评估体系,优化采购模式与供应商管理。A、设备质量监管B、设备物资供应链C、设备供应商管理D、设备质量评价管理答案:B162.下列论据中,能够支撑“大数据无所不能”的观点的是()A、互联网金融打破了传统的观念和行为B、大数据存在泡沫C、大数据具有非常高的成本D、个人隐私泄露与信息安全担忧答案:A163.以下哪些CNN模型不是在imagenet比赛中兴起的?A、lexNetB、VGG19C、ResNetD、Mask-RCNN答案:D164.以下不属于大数据应用业务规划五大核心领域的是()。A、电网运营B、经营管理C、对内服务D、业务创新答案:C165.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、技术服务项目B、科技项目C、信息化项目D、数字化项目答案:D166.从宏观角度看,数据可视化的功能不包括()A、信息记录B、信息的推理分析C、信息清洗D、信息传播答案:C167.以下说法错误的是()A、数据集中每个数据项作为单个图元素表示B、数据可视化技术提供多种数据分析和图形化方法C、数据可视化可以帮助决策者更直观的观察和分析数据D、多维数据无法进行数据可视化答案:D168.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?A、分类B、聚类C、关联分析D、隐马尔可夫链答案:B169.以下那种卷积神经网络的设计引入了残差网络结构?A、LeNetB、AlexNetC、VGGD、ResNet答案:D170.在支持向量机中,核函数的主要作用是()。A、将低维空间中线性不可分的数据映射到高维空间,使其线性可分B、将高维空间中线性不可分的数据映射到低维空间,使其线性可分C、将高维空间中线性可分的数据映射到低维空间,使其线性不可分D、将低维空间中线性可分的数据映射到高维空间,使其线性不可分答案:A解析:“支持向量机核函数的作用是将低维空间的数据映射到高维空间,从而使得原本不可分的数据变得可分,从而提高支持向量机的分类准确率。”171.企业中台不包含()A、业务中台B、数据中台C、技术中台D、服务中台答案:D172.()是一种处理时序数据的神经网络,常用语语音识别、机器翻译等领域。A、前馈卷神经网络B、卷积神经网络C、循环神经网络D、对抗神经网络答案:C173.公司大数据应用()管理主要包括项目启动、开发和实施、问题处置等工作A、开发实施B、立项检查C、成果验收D、开发流程答案:A174.下面代码的执行结果是()print(1.23e-45.67e8j.real)A、12300B、1.23C、5.67E+8D、0.000123答案:D175.以下哪个不是Spark的组件()A、DriverB、SparkContextC、lusterManagerD、ResourceManager答案:D176.应严格执行“规划指导计划、计划确定项目、项目安排资金”的要求,制定专项规划,落实投资计划,保障网络安全费用不低于信息化投入的()A、12%B、10%C、8%D、6%答案:C177.关于Attention-basedModel,下列说法正确的是()。A、相似度度量模型B、是一种新的深度学习网络C、是一种输入对输出的比例模型D、都不对答案:A178.强化对电网设备的状态感知、诊断、管控、运维能力,全面提升()水平。A、提升电网质效B、促进智能协同C、设备本质安全D、运行自主优化答案:C179.面向政府机构或非营利性组织等,从服务中央决策部署落地实施、社会治理现代化等方面,提供的公益性数据服务为()。A、政府监管类B、公益服务类C、商务增值类D、公共开放类答案:B180.通过数据资产核查及可视化的建设,可以帮助公司合理评估、规范高效的管控公司数据资产信息,又可以挖掘和发挥数据资产价值并促进持续增值,推动公司向()管理转型。A、数据质量B、数据治理C、数据分析D、数据驱动答案:D181.关键信息基础设施的运营者采购网络产品和服务,可能影响国家安全的应当通过国家()会同国务院有关部门组织国家安全审查。A、网信部门B、安全部门C、公安部门D、国防部门答案:A182.下列关于注意力机制的相关叙述,错误的是()A、自上而下的有意识的注意力,称为基于显著性的注意力B、多头注意力利用多个查询,来并行地从输入信息中选取多组信息C、为了提高模型能力,自注意力模型经常采用查询-键-值模式D、自注意力模型可以扩展为多头自注意力模型,在多个不同的投影空间中捕捉不同的交互信息答案:A183.数据中台建立数据安全传输机制,根据数据保护需求,实现两级数据中台之间、与()之间的安全传输。A、外部用户B、内部用户C、全部用户D、指定用户答案:A184.Hive的计算引擎是()。A、SparkB、MapReduceC、HDFSD、HBase答案:B185.数据库设计中的概念结构设计的主要工具是()A、数据模型B、E-R模型C、新奥尔良模型D、概念模型答案:B186.以下哪个是有关数据科学研究目的的原则?()A、DIKUW原则B、5W1H原则C、6S原则D、PDCA原则答案:A解析:数据科学的主要原则:资产原则;DIKUW原则:Data,Information,Knowledge,Understanding,Wisdom;黑客原则;协同原则;从简原则;经验原则;第四范式原则;数据业务化原则;数据驱动原则;数据预处理原则187.大数据的4V特性中,哪一个是错误的:()。A、数据量大B、价值密度高C、增长快D、维度高答案:B解析:大数据的4V特征:规模性(Volume)、高速性(Velocity)、多样性(Variety)、价值性(Value)。188.一般将原始业务数据分为多个部分,用于构建模型的是()A、训练集B、测试集C、验证集D、全部数据答案:A189.若a=np.array([5,1,2,3]),a.sort(),则数组a的结果是()。A、[5,1,2,3];B、[1,2,3,5];C、[3,2,1,5];D、11;答案:B190.关于Python语言的特点,以下选项中描述错误的是()A、Python语言是脚本语言B、Python语言是非开源语言C、Python语言是跨平台语言D、Python语言是多模型语言答案:B191.将一副图像进行分割后,分割出的区域彼此之间()重叠。A、可以B、不可以C、根据任务需要确定是否可以D、根据分割方法确定是否可以答案:B192.设计为8层的卷积神经网络AlexNet网络成功使用(),其效果远远地超过了Sigmoid函数。A、ReLUB、sigmoid函数C、tanhD、sin答案:A193.为什么要对输入x进行归一化?A、让参数初始化更快B、让代价函数更快地优化C、更容易做数据可视化D、是另一种正则化——有助减少方差答案:B194.以下哪个分类方法可以较好地避免样本的不平衡问题()。A、KNNB、SVMC、BayesD、神经网络答案:A195.下列哪一项在神经网络中引入了非线性()A、SGDB、激活函数C、卷积函数D、都不正确答案:B196.对参数进行L2正则,是机器学习常用的防止过拟合的方法。请问对参数做L2正则,下列()是对参数本身做先验分布假设。A、高斯分布B、拉普拉斯分布C、泊松分布D、均匀分布答案:A197.基于词的n元文法模型,其最后的粗分结果集合大小()N。A、大于B、大于等于C、小于D、小于等于答案:B198.()计算框架源自一种分布式计算模型,其输入和输出值均为“键-值对”结构。A、MahoutB、MapReduceC、SparkD、Sqoop答案:B解析:MapReduce计算框架源自一种分布式计算模型,其输入和输出值均为键/值对,其计算过程分为两个阶段——map阶段和reduce阶段,并分别以两个函数map()和reduce()进行抽象。199.关联规则的评价指标是()。A、均方误差、均方根误差B、Kappa统计、显著性检验C、支持度、置信度D、平均绝对误差、相对误差答案:C200.在MapReduce中,reduce函数可以将()值相同的输入进行合并处理。A、inputB、keyC、valueD、number答案:B201.[i**iforiinrange(3)]运行结果是()。A、[1,1,4]B、[0,1,4]C、[1,2,3]D、(0,1,4)答案:A202.HBase依靠()提供强大的计算能力。A、ZooKeeperB、ChubbyC、RPD、MapReduce答案:D203.在神经网络中,以下哪种技术用于解决过拟合()。A、减少网络容量B、添加权重正则化C、添加dropoutD、以上都是答案:D204.()不仅可用于多层前馈神经网络,还可用于其他类型的神经网络。A、感知机B、神经元C、神经系统D、误差逆传播答案:D解析:“误差逆传播算法(backpropagationBP算法)是迄今最成功的的神经网络算法。显示任务中使用神经网络时,大多是在使用BP算法进行训练。不仅适用于多层前馈神经网络,还可以用于其他类型的神经网络,训练递归。”205.L1正则和L2正则的共同点是什么()A、都会让数据集中的特征数量减少B、都会增大模型的偏差C、都会增大模型方差D、其余选项都错答案:D206.()是一个主要用于绘制二维图形的Python库。用途:绘图、可视化.A、numpyB、pandasC、MatplotlibD、PIL答案:C207.组织开展公司数据特别是电力数据的()管理研究与应用,确保数据加工、使用行为合法合规。A、分级分类B、安全防护C、运维审计D、数据处理答案:A208.BP神经网络具有很的表示能力,它经常遭遇(),其训练误差持续降低,但测试误差却可能上升。A、欠拟合B、误差过大C、误差过小D、过拟合答案:D209.()是一个开放源代码的对象关系映射框架,它对JDBC进行了非常轻量级的对象封装。A、hbaseB、hiveC、HibernateD、mapreduce答案:C解析:“Hibernate是一个开放源代码的对象关系映射框架,它对JDBC进行了非常轻量级的对象封装,它将POJO与数据库表建立映射关系,是一个全自动的orm框架,hibernate可以自动生成SQL语句,自动执行,使得Java程序员可以随心所欲的使用对象编程思维来操纵数据库。”210.下面哪项操作能实现跟神经网络中Dropout的类似效果?A、BoostingB、aggingC、StackingD、Mapping答案:B211.()方面,研究基于大数据的电能质量和计量数据分析技术,建立典型用电设备电能质量信息库、指标体系和大数据分析平台,提供电能质量辅助决策分析服务;A、电测量技术B、大数据测量技术C、电能技术D、用电技术答案:A212.加强数据传输、存储过程中的安全管理,釆取加密、隔离、备份等安全技术手段,确保符合相应安全条件或技术标准,具备()能力,防范数据泄露、篡改、损毁、丟失风险。A、共享B、灾备C、安全D、保护答案:B213.()是公司大数据应用工作的归口管理部门A、数字化部B、信通公司C、大数据中心D、发展部答案:A214.()将基础的、共性的、稳定的业务功能沉淀形成共享服务,供前端应用调用,并将相关业务生成的数据存储在业务中台,按需调用数据中台服务。A、业务中台B、数据中台C、技术中台D、前台答案:A215.一幅图像在采样时,行、列的采样点与量化级数()。A、既影响数字图像的质量,也影响到该数字图像数据量的大小B、不影响数字图像的质量,只影响到该数字图像数据量的大小C、只影响数字图像的质量,不影响到该数字图像数据量的大小D、既不影响数字图像的质量,也不影响到数字图像数据量的大小答案:A216.下列哪项方法不属于图像分割方法()。A、边缘检测法B、阈值分割法C、区域分割法D、特征提取法答案:D217.对MapReduce计算框架中生成的键值对的说法正确的是()。A、可以有相同的键,值必须唯一B、可以有相同的值,键必须唯一C、可以有相同的键,也可以有相同的值D、键和值都必须唯一答案:C218.运行以下程序,当从键盘上输入{1:"清华大学",2:"北京大学"},运行结果的是:x=eval(input())print(type(x))A、<class‘dict’>B、<class‘list’>C、<class‘int’>D、出错答案:A219.下列哪一项不是神经网路常用的激活函数()A、Sigmoid函数B、sin函数C、sign函数D、tanh函数答案:B220.有监督的学习和无监督的学习的根本区别在于()A、学习过程是否需要人工干预B、学习样本是否需要人工标记C、学习结果是否需要人工解释D、学习参数是否需要人工设置答案:B221.下面代码的输出结果是x=12.34print(type(x))A、<class‘int’>B、<class‘bool’>C、<class‘float’>D、<class‘complex’>答案:C222.减少神经网络过拟合的说法,以下哪些是正确的?()A、在神经网络训练过程中类似dropout减少神经元或相关链接权的数量B、通过正则化可以减少网络参数的取值或个数,一定程度可能减少过拟合C、利用L1或L2正则化可以使权重衰减,从而一定程度上减少过拟合D、以上都对答案:D223.Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用()语言实现开源软件框架。A、javaB、C++C、R语言D、以上都不是答案:A224.下列关于神经网络结构的权重共享现象的描述正确的是()。A、只有全连接神经网络会出现B、只有卷积神经网络(CNN)会出现C、只有循环神经网络(RNN)会出现D、卷积神经网络和循环神经网络都会出现答案:D225.()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A、支持向量机B、oosting算法C、贝叶斯分类器D、Bagging算法答案:B226.卷积神经网络能通过卷积以及池化等操作将不同种类的鸟归为一类。关于卷积神经网络能达到该效果的原因,下列说法不正确的是()。A、同样模式的内容(如鸟嘴)在图像不同位置可能出现B、池化之后的图像主体内容基本不变C、不同种类鸟的相同部位(如鸟嘴)形状相似D、池化作用能使不同种类鸟变得相似答案:D227.关于MaxComputeMR,说法正确的是:()。A、Map和Reduce前都需要对数据进行分片;B、进入reduce前,数据需要进行合并操作(combiner),然后按照key排序;C、Mapworker在输出数据时,需要为每一条输出数据制定一个key。D、Reducer的个数和Mapper的个数一致;答案:C228.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为y=7.19x+73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是()。A、身高一定是145.83cmB、身高一定超过146.00cmC、身高一定高于145.00cmD、身高在145.83cm左右答案:D解析:y=7.19x+73.93,将x=10代入得y=145.83。即身高在145.83cm左右229.卷积神经网络中每层卷积层(convolutionallayer)由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法最佳化得到,其作用是()。A、增强图像B、简化图像C、特征提取D、图像处理答案:C230.数据中台是企业级数据能力共享平台。数据通过分层与水平分解,经过()沉淀公共的数据能力,根据业务场景进行服务封装,形成企业级数据服务,支撑前端应用敏捷迭代和快速构建,实现数据价值共享A、汇聚、存储、整合、分析、加工B、汇聚、整合、分析、存储、加工C、汇聚、整合、分析、加工、存储D、汇聚、整合、存储、加工、分析答案:A231.向量空间模型的缺陷不包括()。A、维度灾难B、模型稀疏性C、语义信息缺失D、无法计算文本相似度答案:D232.下列关于误差的说法,正确的是()。A、训练样本容量增加,泛化误差也会增加B、过拟合指数据在训练集上的误差过大C、过拟合可以通过减少模型参数数量解决D、交叉验证不重复使用数据答案:C233.公司在我国境内收集和产生的个人信息和重要数据应当在()存储。A、境内B、境外C、私有云D、公共云答案:A解析:《中华人民共和国网络安全法》第三十七条规定,关键信息基础设施的运营者在中华人民共和国境内运营中收集和产生的个人信息和重要数据应当在境内存储。因业务需要,确需向境外提供的,应当按照国家网信部门会同国务院有关部门制定的办法进行安全评估;法律、行政法规另有规定的,依照其规定。234.()的主要目标是提供可扩展的机器学习算法及其实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。A、MahoutB、FlumeC、SqoopD、HBase答案:A235.提供能源()服务,提升上下游企业和能源生态圈的大数据运营服务能力。A、大数据增值B、支撑C、运营D、分析答案:A236.语音识别的应用场景包括()A、语音转文本B、语音合成C、人机交互D、以上都对答案:D237.营销客户档案等重要数据建议按()存放一份完整全量数据,生命周期为永久。A、天B、年C、月D、星期答案:A238.数据的异构性问题中,下列属于专用格式的是()A、XMLB、CSVC、LASSD、OWL答案:C解析:“class格式的字节码文件,在交给JVM通过字节码解释器或JIT即时编辑器混合执行,class文件其实就是一个二进制字节流文件,他有固定的格式。239.《国家电网公司信息网络运行管理规程》对进出机房的人员进行详细登记,有关的登记记录应保存的最短日期是()。A、1年B、2年C、3年D、半年答案:A240.下面哪个色彩空间最接近人的视觉系统的特点()。A、RGB空间B、CMY空间C、MYK空间D、HSI空间答案:D241.反向传播算法一开始计算什么内容的梯度,之后将其反向传播?A、预测结果与样本标签之间的误差B、各个输入样本的平方差之和C、各个网络权重的平方差之和D、都不对答案:A242.关于k-means算法,正确的描述是:A、能找到任意形状的聚类B、初始值不同,最终结果可能不同C、每次迭代的时间复杂度是O(n^2),其中n是样本数量D、不能使用核函数(kernel答案:B243.主要用于序列标注任务的是()A、序列到类别模式B、同步的序列到序列模式C、异步的序列到序列模式D、以上选项均不正确答案:B解析:同步的序列到序列模式主要用于序列标注(SequenceLabeling)任务,即每一时刻都有输入和输出,输入序列和输出序列的长度相同244.下列哪一种架构有反馈连接()。A、循环神经网络B、卷积神经网络C、受限玻尔兹曼机D、都不是答案:A245.各级单位网络安全归口管理部门是本单位网络安全等级保护工作归口管理部门,主要职责是不包括()A、本单位自建管理信息系统安全防护方案审查工作;B、本单位由本专业负责建设的信息系统的网络安全等级保护各环节工作。C、负责对本单位信息客服工作提出业务需求和目标;D、负责与所在地公安机关、行业主管部门的网络安全等级保护工作对接;答案:C246.plt.plot()函数的功能是()。A、展现变量的趋势变化B、寻找变量之间的关系C、设置x轴的数值显示范围D、设置x轴的标签文本答案:A解析:plt.plot()是Matplotlib库中用于绘制线图(折线图)的主要函数之一。它的作用是将一组数据点连接起来,以可视化数据的趋势、关系或模式。247.关于脏数据和乱数据的区分,以下哪种不属于脏数据()。A、含有缺失数据B、冗余数据C、噪声数据D、不规则形态数据答案:D248.子集搜索中,逐渐增加相关特征的策略称为()。A、前向搜索B、后向搜索C、双向搜索D、不定向搜索答案:A249.()的残差结构解决了深度学习模型的退化问题。在ImageNet的数据集上,其Top5准确率达到了95.51%A、InceptionNetB、VGGC、ResNetD、AlexNet答案:C250.数据传输环节,在互联网大区传输重要数据时应____。A、明文传输B、加密保护C、签发密钥答案:B251.Apriori算法的计算复杂度受()影响。①支持度阀值②项数(维度)③事务数④事务平均宽度A、①②③④B、②③④C、①③④D、①②③答案:A252.数据全生命周期安全防护,不包括()。A、数据采集环节B、数据传输环节C、数据存储环节D、数据建模分析节答案:D解析:数据全生命周期包括6个,分别为数据采集、数据存储、数据处理、数据传输、数据交换、数据销毁。253.Apriori算法是最基本的一种关联规则算法,它采用布尔关联规则的挖掘频繁项集的算法,利用()搜索的方法挖掘频繁项集。A、逐层B、逐级C、自底向上D、自上而下答案:A254.批规范化(BatchNormalization)的好处都有啥?A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是答案:A255.推动数据标准体系建设,按照“()”原则,组织幵展重点数据标准编制。A、急用先行B、顶层设计C、层层审批D、业数融合答案:A256.中台的出发点和落脚点是()A、高效便捷可复用B、稳定高效便捷C、敏捷高效可复用D、稳定便捷可复用答案:C257.下列关于机器学习的特征工程步骤的说法,错误的是()。A、数据标准化将具有量纲差异的数据缩小至一个更小的区间内B、数据离散化最终将连续型数据转化为离散型数据C、特征选择仅考虑特征的重要性D、特征构造基于原始数据既有的特征构造新的特征答案:C258.随机森林中的随机是指()A、随便构建树模B、随机选择一个树模型C、随机选择多个树模型D、在构建每个树模型时随机选择样本和特征答案:D259.以()为导向,发挥电力数据覆盖广优势,提供智能、精准、高效、便捷的公共服务。A、民生需求B、社会发展C、公共需求D、经济发展答案:A260.下列哪个神经网络结构会发生权重共享()。A、卷积神经网络B、循环神经网络C、全连接神经网络D、选项A和B答案:D261.感知机中,()是M-P神经元,也称为阈值逻辑单元。A、输入层B、输出层C、第一层D、第二层答案:B解析:感

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论