能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第1页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第2页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第3页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第4页
能源大数据应用开发技能竞赛理论考试题库-上(单选题)_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1能源大数据应用开发技能竞赛理论考试题库-上(单选题汇总)一、单选题1.下列关于运算符优先级的说法不正确的是()A、运算符按照优先级顺序表进行运算B、同一优先级的运算符在表达式中都是按照从左到右的顺序进行运算的C、同一优先级的运算符在表达式中都是按照从右到左的顺序进行运算的D、括号可以改变运算的优先次序答案:C2.CNN神经网络对图像特征提取带来了变革性的变化,使之前的人工特征提取升级到数据驱动的自动特征提取,在CNN中,起到特征提取作用的网络层是:(__)。A、convolution层B、fullC、maxD、norm层答案:A3.下列场景中最有可能应用人工智能的是()。A、刷脸办电B、舆情分析C、信通巡检机器人D、以上答案都正确答案:D4.关于OLAP和OLTP的区别描述,不正确的是()。A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同。B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务。C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高。D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的答案:C5.标准循环神经网络隐含层的输入对于网络输出的影响随时间A、不断递归而衰退B、不断递归而增强C、先增强后减弱D、先减弱后增强答案:A6.下列哪一项在神经网络中引入了非线性()A、SGDB、激活函数C、卷积函数D、都不正确答案:B7.长短时记忆神经网络被设计用来解决什么问题()A、传统RNN存在的梯度消失/爆炸问题B、传统RNN计算量大的问题C、传统RNN速度较慢的问题D、传统RNN容易过过拟合的问题答案:A8.有关Hadoop的陈述哪个是错误的()。A、它运行在通用硬件上;B、它是Apache软件基金会(ASC、下的项目;D、它是最好的实时流式数据处理框架;E、Hadoop对数据的处理是有延迟的;F、nan答案:C9.以下表名不符合数据中台分析层命名规范的是()。A、dim_cst_cust_dfB、dim_cst_custC、dws_cst_cust_dfD、wd_cst_cust答案:D10.以电力数据()服务为核心动能,驱动新兴业务拓展。A、挖掘B、应用C、信用D、增值答案:C11.县级以上地方人民政府有关部门的网络安全保护和(),根据国家有关规定确定。A、调研指导职责B、监督管理职责C、行政执法职责D、制度规划职责答案:B12.个人信息保护影响评估报告和处理情况记录应当至少保存()年。A、一B、十C、五D、三答案:D13.公司企业中台基于()构建,是企业级能力共享平台。A、华为云B、国网云C、阿里云D、百度云答案:B14.LSTM中,()的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。A、输入门B、遗忘门C、输出门D、更新门答案:A15.长短时记忆网络属于一种()。A、全连接神经网络B、门控RNNC、BP神经网络D、双向RNN答案:B16.使用copy模块深拷贝的方法为()。A、copy()B、deepcopy.copy()C、opy.deepcopy()D、eepcopy.deepcopy()答案:C17.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于网络强国的重要思想和国家网络空间安全战略、回家大數据发展战路,认其落实回务院回资委加睡容规作理、建设法治央企工作部署,紧扣“稳、进、()、开〞四字要求。A、平B、管C、育D、信答案:C18.下列关于数据分析的说法正确的是()A、描述性分析和预测性分析是诊断性分析的基础B、诊断性分析是对规范性分析的进一步理解C、预测性分析是规范性分析的基础D、规范性分析是数据分析的最高阶段,可以直接产生产业价值答案:C19.SVM算法中,对于线性不可分的情况,通过使用非线性的映射函数可以将低维不可分的样本转化到高维空间使其线性可分,这样的非线性映射函数称为(?)A、激活函数B、核函数C、超函数D、转换函数答案:B20.假定在神经网络中的隐藏层中使用激活函数X。在特定神经元给定任意输入,得到输出「-0.0001」。X可能是以下哪一个激活函数?A、ReLUB、tanhC、SIGMOIDD、以上都不是答案:B21.以下算法中不属于基于深度学习的图像分割算法是()。A、FCNB、deeplabC、Mask-RCNND、kNN答案:D22.在池化中,当步长小于卷积核的大小时会称为重叠池化。与非重叠池化相比,下面哪个不是重叠池化的优点?()A、损失信息少B、获得的图像特征更丰富C、提高卷积神经网络的正确率D、减少计算量答案:D23.语音识别的应用场景包括()A、语音转文本B、语音合成C、人机交互D、以上都对答案:D24.下面不属于池化操作()A、连接池化B、一般池化C、重叠池化D、金字塔池化答案:A25.从复杂度及价值高低两个维度,可以将数据分析分为()。A、描述性分析、诊断性分析、预测性分析、探索性分析B、探索性分析、诊断性分析、预测性分析、规范性分析C、探索性分析、描述性分析、预测性分析、规范性分析D、描述性分析、诊断性分析、预测性分析、规范性分析答案:D26.国家提倡诚实守信,()的网络行为,推动传播社会注意核心价值观,实行措施提高全社会的网络安全意识和水平,形成全社会共同参加促进网络安全的良好环境。A、自由公平B、健康文明C、团结互助D、和平友爱答案:B27.下列不属于深度学习的是()。A、监督学习B、无监督学习C、强化学习D、自主学习答案:D28.卷积神经网络的第一层中有10个卷积核,每个卷积核尺寸为5*5,步长为1,不补零,该层的输入图片的维度是224x224x3,那么该层输出的维度是()A、220x220x10B、220x220x5C、224x224x10D、224x224x5答案:A29.以下符合大数据问题处理范畴的是:A、1KB数据,1小时内提交结果B、1MB数据,2小时内提交结果C、1GB数据,3小时内提交结果D、1TB数据,0.5小时内提交结果答案:D30.银行进行户购买力分析,首先获取户历史账年,确定其中各项南品的计算权重,得出每位客户的购买力评分并存储记录,最后将结果以图表显示。请问该过程对应于以下哪个项目数据流程设计。A、数据源->数据处理->数据落地->数据可视化B、数据可视化->数据源->数据处理->数据落地C、数据可视化->数据源-)数据落地->数据处理D、数据源->数据落地->数据处理->数据可视化答案:A31.数据分析思维模式主要从()入手,最终改变()A、数据;业务B、业务;数据C、数据;项目D、项目;数据答案:A32.开展数据产品研发、发布等活动时,应确保遵从国家法律法规、数据主体授权范围、公司相关规章制度等()保护要求。A、数据使用B、数据研发C、数据交换D、数据安全答案:D33.合作单位和供应商的开发测试环境与公司()应做好隔离。A、内网环境B、测试环境C、生产环境D、业务环境答案:C34.循环神经网络适合处理什么数据()A、节点数据B、序列数据C、结构化数据D、图像数据答案:B35.以下扫描算子中用于对列存表进行扫描的算子是:()。A、SeqScanB、CstoreScanC、SubqueryScanD、ValuesScan答案:B36.数据中台采用总部和()两级部署模式构建。A、省市公司B、市公司C、省公司D、市县公司答案:A37.以下对Python程序设计风格描述错误的选项是:A、Python中不允许把多条语句写在同一行B、PythonC、Python语句中,增加缩进表示语句块的开始,减少缩进表示语句块的退出D、Python可以将一条长语句分成多行显示,使用续航符“\”答案:A38.假设你正在训练一个LSTM网络,你有一个10,000词的词汇表,并且使用一个激活值维度为100的LSTM块,在每一个时间步中,Γu的维度是多少。A、1B、100C、300D、10000答案:B39.以下统计学知识,数据科学中不常用的是()。A、归纳分析法B、描述统计C、推断统计D、基本分析法答案:A40.假设你需要调整超参数来最小化代价函数(costfunction),会使用下列哪项技术A、穷举搜索B、随机搜索C、Bayesian优化D、都可以答案:D41.神经网络的训练结果模型不包括()。A、权重矩阵B、偏置参数C、超参数D、计算图答案:C42.下列哪个不是专门用于可视化时间空间数据的技术(__)。A、等高线图B、饼图C、曲面图D、矢量场图答案:B43.关于Python的全局变量和局部变量,以下选项中描述错误的是()A、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用B、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用可以继续使用C、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放D、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效答案:B44.保护数据本身安全,即为保护商业秘密和业务正常运行而必须保障数据()、完整性、可用性A、及时性B、准确性C、机密性D、一致性答案:C45.在MapReduce中,reduce()函数可以将()值相同的输入进行合并处理。A、inputB、keyC、valueD、number答案:B46.使用pivot_table函数制作透视表时,要用下列()参数设置行分组键。A、datB、valuesC、olumnsD、Index答案:D47.下面关于展示数据管理说法不正确的是()A、大厅场景数据应基于数据中台统一获取B、建立大厅数据质量常态巡检核查机制C、不得违规存储、处理涉及敏感数据。D、历史数据需要删除答案:D48.常用深度学习平台包括()。A、PYTORCB、C、SQLD、HADOOPE、MAPREDUCEF、nan答案:A49.()的主要目标是提供可扩展的机器学习算法及其实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。A、MahoutB、FlumeC、SqoopD、HBase答案:A50.重视能力建设,加强大数据应用关键技术研究、软硬件环境建设,推动技术、资源和管理的有机融合,建立常态化人才培养机制,持续提升公司大数据(),为公司数字化转型注入强大动力。A、分析挖掘能力B、应用开发能力C、特征处理能力D、安全管理能力答案:B51.Hive的计算引擎是()。A、SparkB、MapReduceC、HDFSD、HBase答案:B52.Project被设置了“保护模式”以后,以下()说法是正确。A、所有人都无法访问该Project中的数据B、只有管理员可以访问该Project中的数据C、用户可以在本Project中访问数据,但是不能将数据导出到外部。D、以上全部答案:C53.由于不同类别的关键词对排序的贡献不同,检索算法一般把查询关键词分为几类,以下哪一类不属于此关键词类型的是()。A、引用词B、普通关键词C、高频词汇D、扩展关键词答案:C54.下列说法错误的是()A、当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解B、进行C、AD、沿负梯度的方向一定是最优的方向E、利用拉格朗日函数能解带约束的优化问题F、nan答案:C55.下列哪项关于模型能力(modelcapacity)的描述是正确的?(指模型能近似复杂函数的能力)A、隐层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、都不正确答案:A56.假设已经在ImageNet数据集(物体识别)上训练好了一个卷积神经网络。然后给这张卷积神经网络输入一张全白的图片。对于这个输入的输出结果为任何种类的物体的可能性都是一样的,对吗?A、对的B、不知道C、依情况而定D、不对答案:D57.业务中台提供“()”创新能力和统一的企业级共享服务,持续提升业务创新效率。A、敏捷、快速、低成本B、快速、便捷、低成本C、敏捷、高效、快速D、高效、便捷、可持续答案:A58.受到治安管理处罚的人员,()不得从事网络安全管理和网络运营关键岗位的工作;受到刑事处罚的人员,()不得从事网络安全管理和运营关键岗位的工作。A、五年内,十年内B、三年内,终身C、三年内,十年内D、五年内,终身答案:D59.朴素贝叶斯分类器的朴素之处在于:A、只能处理低维属性B、只能处理离散型属性C、分类效果一般D、属性之间的条件独立性假设答案:D60.CNN的()不能够减少网络自由参数的个数。A、全连接层B、池化C、权值共享D、局部连接答案:A61.CNN神经网络对图像特征提取带来了变革性的变化,使之前的人工特征提取升级到数据驱动的自动特征提取,在CNN中,起到特征提取作用的网络层是()。A、卷积层B、全连接层C、池化层D、采样层答案:A62.下列关于Python第三方库的安装方法说法错误的是()。A、使用集成安装工具B、使用pip命令C、访问UCI网站下载安装文件D、联系第三方库作者索要安装文件答案:D63.在数据集中,记录关于一个事件或对象的描述称为____。A、子类B、元素C、属性D、样本答案:D64.下列哪个不是专门用于可视化时间空间数据的技术:()。A、等高线图B、饼图C、曲面图D、矢量场图答案:B65.防止()发布或交互企业重要数据以及个人信息,扰乱互联网秩序等违法违规活动。A、非法B、擅自C、负面信息D、非授权答案:D66.在回归分析中,说法正确的是()。A、解释变量和被解释变量都是随机变量B、解释变量为非随机变量,被解释变量为随机变量C、解释变量和被解释变量都为非随机变量D、解释变量为随机变量,被解释变量为非随机变量答案:B67.有关深度学习加速芯片,以下的说法中不正确的是:A、GPU既可以做游戏图形加速,也可以做深度学习加速B、用于玩游戏的高配置显卡,也可以用于深度学习计算。C、GoogleD、FPGA最早是作为CPLD的竞争技术而出现的答案:C68.在Hadoop的分区阶段,默认的Partitioner是()。A、RangePartitionerB、PartitionerC、HashPartitionerD、用户自定义的Partitioner答案:C69.数据资产质量管理遵循“谁产生、谁负责”的原则,明确数据资产质量的责任归属,同一责任人产生的同一数据项一年内出现()以上质量问题,对责任单位予以通报批评,同时按照公司员工奖惩规定第十二条追究相关人员责任,具体惩处按照公司员工违规违纪行为惩处细则第十三条执行。A、一次B、两次C、三次D、三次以上答案:B70.从网络的原理上来看,结构最复杂的神经网络是()。A、卷积神经网络B、长短时记忆神经网络C、GRUD、BP答案:B71.数据产品和服务提供方与使用方应签署相关使用协议,明确约束()等双方权利义务。A、使用范围B、安全规则C、使用规则D、保密规则答案:C72.线性判别分析(LDA)从贝叶斯决策理论阐释,当两类数据同先验且满足()时,LDA达到最优分类。A、满足高斯分布B、协方差相等C、满足高斯分布且协方差相等D、协方差不等答案:C73.依据《国家电网有限公司数据管理办法》,建立基于()的公司对内数据共享机制,坚持“以共享为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、负面清单B、管理职责C、运维单位D、文件规定答案:A74.()是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。A、预处理B、特征抽取和选择C、分类器设计D、分类决策答案:C75.以下不符合大数据问题处理范畴的是A、1TB数据,秒级提交结果B、1TB数据,分钟级提交结果C、1TB数据,半小时内提交结果D、1TB数据,一天内提交结果答案:D76.以下关于函数的描述,错误的是A、使用函数的目的只是为了增加代码复用B、函数是一种功能抽象C、使用函数后,代码的维护难度降低了D、函数名可以是任何有效的Python标识符答案:A77.已知池中有两种鱼,比例为7:3,若随机捞上一条,按照70%和30%概率随机猜测其种类,则整体误差最接近于:A、20%B、30%C、40%D、50%答案:C78.有关深度神经网络的训练(Training)和推断(Inference),以下说法中不正确的是:()。A、将数据分组部署在不同GPU上进行训练能提高深度神经网络的训练速度。B、TensorFlow使用GPU训练好的模型,在执行推断任务时,也必须在GPU上运行。C、将模型中的浮点数精度降低,例如使用float16代替float32,可以压缩训练好的模型的大小。D、GPU所配置的显存的大小,对于在该GPU上训练的深度神经网络的复杂度、训练数据的批次规模等,都是一个无法忽视的影响因素答案:B79.下列关于集成学习方法的说法错误的是()A、Boosting是一族可将弱学习器提升为强学习器的算法B、随机森林是Bagging的一个扩展变体C、随机森林简单、容易实现、计算开销小D、Boosting是个体学习器间不存在强依赖关系、可同时生成的并行化方法答案:D80.分析应用计算后的分析主题数据存储在:()。A、贴源层B、共享层C、分析层D、整合明细层答案:C81.某电商网站的订单表ods_market_orders有如下字段:order_id'订单ID',order_time'订单时间'(unix时间戳),user_id'买家ID',goods_id'商品ID',user_ip'买家IP',ship_add'收货地址',phone_no'手机号',click_source'点击来源',click_cost'单点费用',pay_ct'订单完成时间',pay_staus'订单状态'现统计在每个点击来源中,购买数量最多的商品排名,以下哪个SQL语句是正确的?A、selectB、selectC、selectD、select答案:B解析:from(selectclick_source,goods_id,count(*)ascntfromods_market_ordersgroupbyclick_source)afrom(selectclick_source,goods_id,count(*)ascntfromods_market_ordersgroupbyclick_source,goods_id)afrom(selectclick_source,goods_id,count(*)ascntfromods_market_ordersgroupbyclick_source,goods_id)afrom(selectclick_source,goods_id,count(*)ascntfromods_market_ordersgroupbyclick_source,goods_id)a82.一个卷积层的卷积核大小为5×5,padding为2,stride为1,输出通道为3,没有偏置,对于3×10×10(C×H×W)的输入,其计算量和参数量为()A、22500225B、7500,75C、2500,25D、27500275答案:A83.资产评估应用实现全链路的数据资产监管和价值追踪,具体包括资产使用评估、()评估和敏感数据评估等功能。A、资产使用评估B、资产价值C、敏感数据评估D、数据质量评估答案:B84.()算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。A、prioriB、EMC、PCD、PAC答案:A85.数据资源主要是指能够被企业及组织访问和使用的所有数据信息的集合,通常表现为数据库、文档、图片、()等形式。A、脚本B、视频C、压缩文件D、备份文件答案:B86.下列选项中,()不是经典图像分割方法A、基于内容的分割方法B、基于阈值的分割方法C、基于边缘的分割方法D、基于基因编码的分割方法答案:A87.关于SOM神经网络描述错误的是:(__)。A、一种竞争学习型的无监督神经网络B、将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构C、SOM寻优目标为每个输出神经元找到合适的权重D、输出层神经元以矩阵方式排列在二维空间答案:C88.综合类大数据应用管理,主要包括(),由互联网部统一组织开展。A、应用需求B、分析应用C、成果管理D、以上都是答案:D89.个人信息数据收集应遵循不包括____的原则A、合法B、正当C、必要D、可溯源答案:D90.数据传输环节,在互联网大区传输重要数据时应()。A、加密保护B、明文传输C、明文接收D、任意操作答案:A91.Hadoop中combiner()函数的功能是()。A、数据排序B、数据标记C、数据分析D、数据合并答案:D92.中台的出发点和落脚点A、高效便捷可复用B、稳定高效便捷C、敏捷高效可复用D、稳定便捷可复用答案:C93.考虑以下两个随机数组a和b:a=np.random.randn(4,3)<a.shape=(4,3);b=np.random.randn(3,2)<b.shape=(3,2);c=a*b,c的维度是什么?A、c.shapeB、c.shapeC、shapeD、计算不成立因为这两个矩阵维度不匹配答案:D94.组织各专业部门、各单位梳理公司数据合规风险重点范围,开展()风险识别与评估工作。A、数据授权B、数据应用C、数据合规D、数据共享答案:C95.参考公司()按域进行数据分类。A、维度模型B、公共数据模型(SG-CIM)C、通用数据模型D、业务分类答案:B96.依据《国家电网有限公司数据管理办法》坚持__A、以共享为原则、不共享为例外B、一事一议C、层层审批的数据应用授权方式D、以上都可以答案:A97.以下哪项不是公司各级大数据中心、信通公司的负责事项?A、负责组织开展大数据应用平台、服务目录等基础环境建设,保障数据及运营安全,提供数据、算法和算力资源支持B、负责发布存储的数据目录和数据获取渠道C、协同开展大数据应用建设,并参与需求评审、应用推广等工作D、负责大数据应用技术前瞻性研究,负责大数据应用技术架构设计、技术选型验证和信息安全技术保障答案:D98.考察一个由三个卷积层组成的CNN:kernel=3×3,stride=2,padding=SAME。最低层输出100个特征映射(featuremap),中间层200个特征映射,最高层400个特征映射。输入是200×300的RGB图片,总参数的数量是多少?()A、903400B、2800C、180200D、720400答案:A99.为提高计算性能,Spark中Transformation操作采用的是()计算模式。A、活性B、惰性C、实时D、非实时答案:B100.已经为所有隐藏的单位建立了一个使用tanh激活的网络。使用np.random.randn(…,…)*1000将权重初始化为相对较大的值。会发生什么?A、没关系。只要随机初始化权重,梯度下降不受权重大小的影响。B、这将导致tanh的输入也非常大,从而导致梯度也变大。因此,必须将设置得非常小,以防止发散;这将减慢学习速度。C、这将导致tanh的输入也非常大,导致单元被“高度激活”。与权重从小值开始相比,加快了学习速度。D、这将导致tanh的输入也非常大,从而导致梯度接近于零。因此,优化算法将变得缓慢答案:D101.()牵头,有关部门、机构配合,加强数据合规管理制度建设。健全公司数据合规管理制度体系,组织完善涵盖数据共享、对外开放等方面的数据合规管理制度。A、信通公司B、数字化部C、大数据中心D、发展部答案:B102.要级联删除用户创建的表等数据库对象,使用关键字()。A、STRICTB、CASCADEC、USAGD、E、FORCEF、nan答案:B103.下列哪种业务场景中,不能直接使用Reducer充当Combiner使用()A、sum求和B、max求最大值C、ount求计数D、avg求平均答案:D104.DNN常用的激活函数有()。A、sigmoidB、tanhC、ReLUD、以上答案都正确答案:D105.以下关于Hadoop中MapReduce说法正确的是()。A、可以没有reduce任务B、Reducer输入为随机输入C、shuffle主要实现数据可视化功能D、一个reducer只能从一个map复制所需要的partition答案:A106.对分类任务来说,学习器从类别标记集合中预测出一个标记,最常见的结合策略是(__)。A、投票法B、平均法C、学习法D、排序法答案:A107.BP神经网络具有很的表示能力,它经常遭遇(),其训练误差持续降低,但测试误差却可能上升。A、欠拟合B、误差过大C、误差过小D、过拟合答案:D108.从安全属性对各种网络攻击进行分类,截获攻击是针对()的攻击。A、机密性B、可用性C、完整性D、真实性答案:A109.在下列哪些应用中,可以使用深度学习来解决问题?A、蛋白质结构预测B、化学反应的预测C、外来粒子的检测D、nan答案:C110.以下内容符合物体识别任务的是()。A、不能对图像进行压缩或剪裁B、遵守误差最小准则和最佳近似准则C、可以不指定分类的类别数量D、事先给定样本的分布特征答案:B111.大数据和算法关系以下描述正确的是:A、数据跟算法没有关系B、算法比数据更重要C、数据比算法更重要D、没有数据的算法没有意义,失去了算法的数据无法应用答案:D112.提升卷积核(convolutionalkernel)的大小会显著提升卷积神经网络的性能,这种说法是A、正确的B、错误的C、nanD、nan答案:B113.发挥数据核心生产要素作用,实现产品、业务、生态()布局,支撑电力大数据服务经济发展、社会治理和民生改善体系建设。A、全链条B、全方面C、全站式D、全面答案:C114.下列属于无监督学习的是()。A、K-meansB、SVMC、最大熵D、CRF答案:A115.()的层结构主要有:输入层、卷积层、池化层(汇聚层、下采样层)、输出层等,其他的还可以有全连接层,归一化层之类的层结构。A、卷积神经网络B、网络神经C、识别神经D、图像神经答案:A116.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()。A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据答案:B117.以下哪项是对早期停止(earlystop)的最佳描述?()。A、训练网络直到达到误差函数中的局部最小值B、在每次训练期后在测试数据集上模拟网络,当泛化误差开始增加时停止训练C、在中心化权重更新中添加一个梯度下降加速算子,以便训练更快地收敛D、更快的方法是反向传播算法答案:B118.Spark可以处理的数据任务包括()A、数据批处理任务;B、交互式处理任务;C、图数据处理任务;D、A,B和C;答案:D119.下列关于数据转换,正确的是()。A、json内的取值只能有统一格式B、pdf文件在不同平台上打开显示不同C、可以通过python将csv文件转换成Excel格式D、excel存储数据的量无限制答案:C120.在InceptionNet中,使用()和单层的全连接层替换掉了VCG的三层全连接层。A、全局最大池化层B、全局最小池化层C、卷积层D、全局平均池化层答案:D121.需加强国家秘密、企业秘密、个人信息、()等重点领域的数据合规管理A、他人信息B、个人秘密C、知识产权D、公共信息答案:C122.神经网络建模步骤一般是()。1模型评估;2网络配置;3模型训练;4数据准备;5模型预测A、12345B、32154C、54321D、42315答案:D123.对于CRF和HMM的区别,描述错误的是:A、HMM是判别式模型,CRF是生成式模型B、HMM是概率有向图,CRF是概率无向图C、HMM求解过程可能是局部最优,CRF可以全局最优D、CRF可以用前一时刻和当前时刻的标签构成的特征函数,加上对应的权重来表示HMM中的转移概率答案:A124.a=[1,2,3.4,5],切片时如果需要取[2,3.4],则下列结果正确的是()A、[1:4]B、a[-2:]C、a[1:-1]D、a[::2]答案:C125.如果线性回归模型中的随机误差存在异方差性,那么参数的OLS估计量是()。A、无偏的,有效的B、无偏的,非有效的C、有偏的,有效的D、有偏的,非有效的答案:B126.梯度下降法中,为什么梯度要加一个负号?A、梯度方向是上升最快方向,负号就是下降最快方向B、梯度方向是上升最快方向,负号就是上升最快方向C、梯度方向是下降最快方向,负号就是下降最快方向D、梯度方向是下降最快方向,负号就是下降最快方向答案:A127.至十四五末,公司全面建成企业中台,企业中台公共服务共享使用率达到()A、70%B、80%C、90%D、100%答案:D128.总部与各单位按两级贯通模式部署,并支持()成果共享。A、一级B、两级C、三级D、四级答案:B129.你正在训练一个RNN网络,你发现你的权重与激活值都是NaN,下列选项中,哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了答案:B130.下面关于Hive四种排序方式的区别,描述正确的是()A、orderB、sortC、distributeD、cluster答案:B131.为了提高系统性能,Spark采取“惰性计算模式”,具体为()。A、执行Transformation操作时不会提交,只有执行Action操作时才会被提交到集群中开始被执行B、执行Action操作时不会提交,只有执行Transformation操作时才会被提交到集群中开始被执行C、只有执行完Action操作和Transformation操作时,所有操作才会被提交到集群中开始被执行D、执行完Action操作或Transformation操作时都不会提交到集群答案:A132.对于依托公共服务能力平台开发的大数据应用,应遵循平台有关规范,重点开展数据溯源、数据建模以及数据展示等工作,安全防护、三方测试等相关要求统一纳入()进行管理,可不再单独开展。A、数据中台B、大数据应用建设平台C、公共服务能力平台D、人工智能平台答案:C133.年度需求由()统筹组织开展储备与立项工作。A、互联网部B、信息化部C、数字化工作部D、科技信息部答案:C134.下列选项中,不符合《国家电网有限公司大数据应用管理办法》第二章职责分工第六条的是()。A、审议决策公司数据管理重大事项B、协调解决数据管理重要问题C、对公司数据管理工作进行监督指导D、公司数据管理体系和规章制度建设答案:D135.(__)网络是一种竞争学习型的无监督神经网络,它能将高维输入数据映射到低维空间,同时保持输入数据在高维空间的拓扑结构,即将高维空间中相似的样本点映射到网络输出层中的临近神经元。A、SOM网络B、RBF网络C、ART网络D、ELman网络答案:A136.数据中台提供统一的身份认证和操作鉴权能力,确保在数据传输、存储、访问过程中的数据安全;提供数据访问权限控制、保护业务核心数据、防止()能力。A、数据泄露B、数据错乱C、数据分散D、数据无效答案:A137.卷积神经网络中卷积的主要作用是()A、进行特征选择,降低特征数量,从而减少参数数量B、提取一个局部区域的特征C、用来输出想要的结果D、读入数据答案:B138.在选择神经网络的深度时,下面哪些参数需要考虑?1神经网络的类型(如MLP,CNN);2输入数据;3计算能?(硬件和软件能?决定);4学习速率;5映射的输出函数。A、1,2,4,5B、2,3,4,5C、都需要考虑D、1,3,4,5答案:C139.Transformer架构首先是由下列哪项引入的?A、GloVeB、ERTC、OpenD、ULMFit答案:C140.例句1:JanewantstogotoShenzhen.例句2:BobwantstogotoShanghai.构建词袋模型形成的是(),例句1,2对应的向量为()。A、[Jane,B、[Jane,C、[Jane,D、[bob,答案:A141.假设数据集中有100条数据,设置batch_size为4,那么跑完一轮模型会迭代多少次()。A、400B、100C、25D、4答案:C142.数据中台由()、()、()、()、()五大板块组成,采用总部和省市公司两级部署模式构建。A、贴源层、共享层、分析层、统一数据服务调度和数据B、贴源层、应用层、分析层、统一数据服务调度和数据C、服务层、共享层、应用层、统一数据服务调度和数据D、服务层、共享层、分析层、统一数据服务调度和数据答案:A143.关于Pandas层次化索引,下列说法错误的是A、层次化索引是指Pandas对象在一个轴方向上具有多层索引B、层次化索引至多只能有两层索引C、可以使用swaplevel()方法对层次化索引的位置交换顺序D、使用sort_index()可以对索引进行排序答案:B144.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗?A、能B、依情况而定C、不一定D、不能答案:D145.以下属于Python脚本程序转变为可执行程序的第三方库的是:A、requestsB、pyinstallerC、numpyD、scrapy答案:B146.在做CNN时,输入图片大小为37×37,经过第一层卷积层(有25个卷积核,每个卷积核的大小为5×5,不做填充,步长为1),与池化层(Maxpooling大小为3×3,不做填充,步长为1),输出图片再通过一次卷积层(有100个卷积核,每个卷积核的大小为4×4,不做填充,步长为1),与池化层maxpooling(Maxpooling大小为2×2,不做填充,步长为1),最终输出特征图大小为()。A、2×2B、3×3C、4×4D、5×5答案:C147.在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的____之和最小。A、欧式距离B、城市距离C、余弦距离D、马氏距离答案:A148.如果自变量有连续型变量,则不适用的分类预测方法有(?)A、逻辑回归B、神经网络C、SVM算法D、C4.5算法答案:D149.下面哪个程序负责HDFS数据存储()A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode答案:C150.AI芯片也被称为AI加速器,是专门用于处理人工智能应用中的大量计算任务的功能模块。A、TRUEB、FALSEC、nanD、nan答案:A151.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,而是都设成0,下面哪个叙述是正确的()A、其他选项都不对B、没啥问题,神经网络会正常开始训练C、神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西D、神经网络不会开始训练,因为没有梯度改变答案:C152.依托数据建模与仿真,实现经营管理的流程可视、运营可控、()可溯,持续提升科学决策能力、业务运行效率和风险管控水平。A、问题B、异常C、管理D、投诉答案:A153.业务中台从管理上破除了系统建设的()壁垒,形成灵活、轻量、便捷的共享能力中心A、部门级B、管理级C、公司级D、企业级答案:A154.大数据应用管理包括大数据应用需求立项、开发实施、发布应用以及成果评价等()管理及大数据应用能力建设。A、全生产要素管理B、全生命周期管理C、全生产周期管理D、全数据链路管理答案:B155.反向传播算法一开始计算什么内容的梯度,之后将其反向传播?A、预测结果与样本标签之间的误差B、各个输入样本的平方差之和C、各个网络权重的平方差之和D、都不对答案:A156.以下程序的输出结果是:deffunc(num):num*=2x=20func(x)print(x)A、出错B、40C、20D、无输出答案:C157.应严格执行“规划指导计划、计划确定项目、项目安排资金”的要求,制定专项规划,落实投资计划,保障网络安全费用不低于信息化投入的()A、12%B、10%C、8%D、6%答案:C158.下列不是NoSQL数据库的是()A、MongoDB、igTableC、HBaseD、Access答案:D159.下列关于Sigmoid函数的说法错误的是()。A、存在梯度爆炸的问题B、不是关于原点对称C、计算D、存在梯度消失的问题答案:A160.网络运营者发布、共享、交易或向境外提供重要数据前,应当评估可能带来的安全风险,并报经()部门同意A、安全监察B、上级主管C、工业和信息化D、行业主管监督答案:D161.下面算法中属于图像锐化处理的是()。A、低通滤波B、加权平均法C、高通滤波D、中值滤波答案:C162.给出如下代码,可以输出“python”的是()s='Pythonisbeautiful!'A、print(s[:–14]);B、print(s[0:6].lower());C、print(s[0:6]);D、print(s[–21:答案:B163.使用预训练模型进行特征提取,要训练的部分是()。A、全连接分类器B、高层卷积层C、底层卷积层D、整个网络答案:A164.深度学习防止过拟合下列说法正确的是A、BN(批归一化)B、增强数据集样本数目、做一些数据增强的操作C、限制模型的学习能力D、以上都可以答案:D165.以下哪一个是ResNet-18的网络结构?()A、4个残差块各有4个卷积层(不包括恒等映射的1x1卷积层),B、3个残差块各有5个卷积层(不包括恒等映射的1x1卷积层),加上最后一个全连接层C、4个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),D、5个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),答案:A166.国网公司数据管理坚持()的原则。A、面向专业B、面向基层C、面向应用D、面向专业、面向基层、面向应用答案:D167.面向政府机构或非营利性组织等,从服务中央决策部署落地实施、社会治理现代化等方面,提供的公益性数据服务为()。A、政府监管类B、公益服务类C、商务增值类D、公共开放类答案:B168.以下哪一个不是LSTM三个门中的一个门()A、输入门B、遗忘门C、输出门D、迭代门答案:D169.智能电网综合支撑技术,在()的智能电网管理及运维关键技术中,应用大数据和先进计算技术,研究电网设备状态信息集成与综合分析技术;A、分布节能B、高效节能C、集约高效D、分布高效答案:C170.常见的核函数主要包括____。A、多项式核B、高斯核C、线性核D、以上全部答案:D171.神经网络模型(NeuralNetwork)因受?类大脑的启发而得名。神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,对输入进行处理后给出一个输出,请问下列关于神经元的描述中,哪一项是正确的?A、每个神经元可以有一个输入和一个输出B、每个神经元可以有多个输入和一个输出C、每个神经元可以有一个输入和多个输出D、上述都正确答案:D172.下列关于随机森林和GBDT的书法正确的是()A、在随机森林的单个树中,树和树之间是有依赖的,而GBDT中的单个树之间是没有依赖的B、这两个模型都使用随机特征子集,来生成许多单个的树C、我们可以并行地生成GBDT单个树,因为它们之间是没有依赖的D、GBDT训练模型的表现总是比随机森林好答案:B173.一组数据有8个特征,计算出其8个特征值从大到小依次为3.755、2.197、1.215、0.402、0.213、0.138、0.065、0.015,若选择累计百分比达到80%以上的特征值对应的主成分,则至少应选择几个主成分()。A、3B、4C、5D、2答案:A174.大数据应用的业务规划将聚焦核心领域,打造共5大重点业务、12个业务领域、()项业务方向。A、12B、32C、36D、34答案:D175.已知一组数据X1,X2,X3,X4,X5的平均数是2,方差是1/3,那么另一组数据3X1-2,3X2-2,3X3-2,3X4-2,3X5-2的平均数和方差是:()。A、2,1/3B、2,1C、4,2/3D、4,3答案:D176.现阶段的大数据技术体系主要类型不包括()。A、数据源与APPB、基础设施C、HadoopD、数据资源答案:C177.卷积神经网络中池化层的作用是()。A、降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性B、权值初始化C、对图像实现边缘检测D、提取输入的不同特征答案:A178.按照公司战略实施要求,立足数据发展需要,以“可管、()、可信”为核心,建立健全数据合规管理体系,明确数据合规。A、可控B、可防C、可溯D、可查答案:A179.我们在使用pandas时需要怎样导入A、ImportB、ImportC、ImportD、以上都不正确答案:A180.下列哪一项不是神经网路常用的激活函数()A、Sigmoid函数B、sinC、signD、tanh答案:B181.下列关于tensorflow的描述中,不正确的是()。A、TensorFlow的计算图中每个节点代表一个操作,如加法、减法等B、TensorFlow的张量是作为非子叶节点出现的(注:不能作为非子叶节点出现)C、基于梯度的机器学习算法会受益于TensorFlow的自动求微分能力D、TensorFlow答案:B182.一年四个季度,第二到第四个季度对于上个季度的销售额增长率分别为5%、10%、15%,请问第四个季度相对于第一季度的增长率约为()A、50%B、80%C、30%D、33%答案:D183.Dropout技术在下列哪种神经层中将无法发挥显著优势?A、仿射层B、卷积层C、RNN层D、均不对答案:C184.关于脏数据和乱数据的区分,以下哪种不属于脏数据()。A、含有缺失数据B、冗余数据C、噪声数据D、不规则形态数据答案:D185.[i**iforiinrange(3)]运行结果是()。A、[1,1,4]B、[0,1,4]C、[1,2,3]D、(0,1,4)答案:A186.()不属于深度学习模型。A、InceptionV3B、VGG19C、ResNet50D、CIFAR-10答案:D187.以下关于Python程序的基本语法元素,错误的描述是:A、变量是由用户定义的用来保存和表示数据的一种语法元素B、Python语言只能用4个空格的缩进来实现程序的强制可读性C、变量的命名规则之一是名字的首位不能是数字D、变量标识符是一个字符串,长度是没有限制的答案:B188.关于机器学习模型训练步骤的说法,错误的是()。A、测试集能够测试模型对于未知数据的拟合效果B、验证集能够用于防止模型过拟合C、划分数据集时需要注意数据是否为同分布D、模型训练需要准备多个备选算法用于效果比较答案:B189.下列关于长短时神经网络的叙述错误的是()。A、引用自循环思想B、产生梯度长时间持续流动的路径C、积累的时间尺度不可以因输入序列而改变D、可应用于语音识别和机器翻译答案:C190.国网公司数据管理以数据资产()为目标。A、易懂B、易取C、易用D、易懂、易取、易用答案:D191.()是一门以可视交互为基础,综合运用图形学、数据挖掘和人机交互等技术等多个学科领域的知识,以实现人机协同完成可视化任务为主要目的分析推理性学科。A、科学可视化B、可视分析学C、数据可视化D、信息可视化答案:B192.大数据计算服务(MaxCompute,原ODPS)tunnel命令?供了丰富的参数,可以通过参数设置,对上传或者下载操作进行控制,现在有一个大文件要上传至odps某表中,想先检查一下该文件内容是否和表的定义匹配,并不实际上传,以免文件中有错误记录会导致上传出错。可以使用哪个参数实现这个功能?A、错误记录丢弃:-dbrB、字段分隔符:-fC、扫瞄选项:-sD、空字符串显示:-ni答案:C193.以下哪种不是常用的数据选择方法()A、留一法B、留出法C、十则交叉验证法D、互助法答案:D194.常用的图像去噪方法有()。A、高斯滤波B、中值滤波C、P-M方程去噪D、以上答案都正确答案:D195.假设文件不存在,如果使用open方法打开文件会报错,那么该文件的打开方式是下列哪种模式()。A、rB、wC、aD、b答案:A196.下列描述中不属于数据治理内容的是()A、理解自己的数据B、行为规范的制定C、岗位职责的定义D、获得更多的数据答案:D197.一般情况下,整数用十进制表示,如果用其他进制表示一个数,错误的描述选项是:A、0o1010表示一个八进制数B、1010b表示一个二进制数C、0b1010表示一个二进制数D、0x1010表示一个十六进制数答案:B198.各单位应遵循()原则,优化数据安全防护架构,推进数据保护技术研究与应用,强化数据全生命周期的安全保护。A、“B、“不共享”C、“三同步”D、“两同步”答案:C199.下列关于算法进化的描述错误的是()。A、算法1.0的典型算法是精度分析,是实验分析技术的核心B、算法2.0的典型算法是线性回归,是问卷领域数据分析的核心C、算法3.0的典型算法是数据挖掘类方法,是数据库领域的核心D、算法4.0的典型算法是DM类算法,时超大数据分析的基础答案:A200.各地区、各部门应当按照数据()保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域答案:A201.机器学习中,下面哪些方法不可以避免分类中的过拟合问题??A、增加样本数量B、增加模型复杂度??C、去除噪声??D、正则化答案:B202.聚焦()经济发展新趋势,坚持维护数据安全合规和促进数据开发利用并重,持续优化数据合规管理机制与策略,支撑、赋能公司高质量发展。A、新能源B、社会科技C、信息技术D、能源数字答案:D203.random库中用于生成随机小数的函数是()。A、random()B、randint()C、getrandbits()D、randrange()答案:A204.关于Attention-basedModel,下列说法正确的是()。A、相似度度量模型B、是一种新的深度学习网络C、是一种输入对输出的比例模型D、都不对答案:A205.在手写数字识别的例子中,输入的图片为长和宽都是28像素的图片,输出判断数字0-9的概率。要构建前馈型神经网络去解决这个问题,输入层是()维的,输出层是()维的A、28,10B、28,1C、784,10D、784,1答案:C206.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,而是都设成0,则下列叙述正确的是()。A、没有问题,神经网络会正常开始训练B、神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西C、神经网络不会开始训练,因为没有梯度改变D、以上选项都不对答案:B207.MaxCompute架构由四层组成,每一层完成不同的工作。现在执行命令“selectcount(*)fromtable_a”,最终由()处理该命令并返回结果。A、计算层B、客户端C、接入层D、逻辑层答案:A208.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,以下不属于相关性分析方法的是()。A、Pearson相关系数B、Spearman秩相关系数C、Kendall相关系数D、傅里叶系数答案:D209.训练样本集S含有天气、气温、人体感受、风力4个指标,已知天气的熵为0.694,温度的熵为0.859,人体感受的熵为0.952,风力的熵为0.971,如使用ID3算法,选择()为树模型的分界点。A、天气B、气温C、人体感受D、风力答案:A210.以下程序的输出结果是:x=['90','87','90']n=90print(x.count(n))A、NoneB、1C、2D、0答案:D211.对于一个图像识别问题(在一张照片里找出一只猫),()可以更好地解决这个问题。A、循环神经网络B、感知机C、多层感知机D、卷积神经网络答案:D212.优化(),建立设备绩效和供应商业绩之间的关联关系,实现设备质量评价管理闭环,建立健全供应商信用风险评估体系,优化采购模式与供应商管理。A、设备质量监管B、设备物资供应链C、设备供应商管理D、设备质量评价管理答案:B213.以下()是数据业务图谱底座具备的功能。A、数据检索B、图谱展示C、动态数据集D、以上都是答案:D214.在实现前向传播和反向传播中使用的“cache”是什么A、它用于跟踪我们正在搜索的超参数,以加速计算B、用于在训练期间缓存代价函数的中间值C、我们使用它传递反向传播中计算的变量到相应的前向传播步骤,它包含对于前向传播计算导数有用的变量D、我们使用它传递前向传播中计算的变量到相应的反向传播步骤,它包含对于反向传播计算导数有用的变量答案:D215.输入图像已被转换为大?为28×28的矩阵和大?为7×7的步幅为1的核?/滤波器。卷积矩阵的大?是多少?A、22B、21C、28D、7答案:A216.以下哪种参数是用*来接收,不是必传的?A、位置参数B、默认值参数C、可变参数D、关键字参数答案:C217.下列关于Pytorch的描述中,正确的是()。A、Pytorch可以视作加入了GPU支持的NumpyB、Pytorch采用静态的、命令式的编程语言C、Pytorch的网络都是有向无环图的集合,可以直接定义D、Pytorch的底层代码高度工业化,不容易看懂答案:A218.严格遵守囯家法律、法规和公司相关规定,在保护国家秘密和企业秘密,且不损害公司及客户、供应商等相关方权益的前提下,有序推动数据对外幵放,重点防范对外幵放过程中的()数据泄露。A、明细B、业务C、敏感D、隐私答案:C219.常用的数据归约方法可以分为()。A、维归约数据压缩B、维归约参数归约C、维归约值归约D、数据压缩值归约答案:C220.Hadoop生态系统中,HBase是一种()。A、分布式文件系统B、数据仓庢C、实时分布式数据库D、分布式计算系统答案:C221.《国家电网公司信息系统事故调查规程》规定:各区域电网公司、省(自治区、直辖市)电力公司、国家电网公司直属单位或其所属任一地区供电公司本地网络完全瘫痪,且影响时间超过()小时,将构成二级信息系统事故。A、12B、24C、32D、40答案:B222.Sigmoid函数作为神经元激活函数的特点是()。A、连续但不光滑B、不连续但光滑C、连续且光滑D、不连续且不光滑答案:C223.国家电网公司信息化工作坚持“统一领导,统一规划,(),统一组织实施”的“四统一”原则。A、统一运作B、统一管理C、统一设计D、统一标准答案:D224.假设你在卷积神经网络的第一层中有5个卷积核,每个卷积核尺寸为7B7,具有零填充且步幅为1。该层的输入图片的维度是224B224B3。那么该层输出的维度是多少()A、217B、217C、218D、220答案:C225.《中华人民共和国网络安全法》规定:国家采取措施,()来源于中华人民共和国境内外的网络安全风险和威胁,保护关键信息基础设施免受攻击、侵入、干扰和破坏,依法惩治网络违法犯罪活动,维护网络空间安全和秩序。A、监测、防御、反击B、监测、防御、处置C、检测、防御、反击D、检测、防御、处置答案:B226.以下关于traintestsplit函数的说法正确的是()。A、train_test_splitB、train_test_split的输入只能是一个数组C、train_test_split每次的划分结果不同,无法解决D、train_test_split答案:D227.LSTM网络引入门控机制来控制信息传递的路径,其中输入门的作用是()A、控制上一个时刻的内部状态需要遗忘多少信息B、控制上一个时刻的内部状态有多少信息需要保存C、控制当前当刻的候选状态有多少信息需要保存D、控制当前当刻的内部状态有多少信息需要输出给外部状态答案:C228.混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是()。A、1/4B、1/2C、4/7D、1212122022年4月6日答案:B229.下列关于对大数据特点的说法中,错误的是()。A、数据规模大B、数据类型多样C、数据价值密度高D、数据处理速度快答案:C230.对文本数据处理通常采用()核函数A、多项式B、SigmoidC、线性D、拉普拉斯答案:C231.下列关于RBM说法错误的是(__)。A、学习过程很快B、RBM训练可以看作对一个深层BP网络的网络权值参数的初始化C、RBM不用人工选择特征D、RBM有标签样本集答案:A232.《国家电网公司信息网络运行管理规程》对进出机房的人员进行详细登记,有关的登记记录应保存的最短日期是()。A、1年B、2年C、3年D、半年答案:A233.下列关于凝聚层次聚类技术的描述中,合适的是()。A、抗噪声和异常值B、MAX(全链)聚类中合并距离最远的两个簇C、两个簇合并后,只保留一个簇D、没有可以直接最小化的目标函数答案:D234.视觉通道表现力评价指标不包括()A、精确性B、可辨认性C、可分离性D、可转换性答案:D235.当闵可夫斯基距离公式中的系数p值为2时,可得到(__)的公式。A、欧氏距离B、曼哈顿距离C、街区距离D、切比雪夫距离答案:A236.下面哪种不属于数据预处理的方法:()。A、变量代换B、离散化C、聚集D、估计遗漏值答案:D237.服务(),提供多模式电力交易大数据分析服务,开展电力交易市场化配置和风险预警数据应用,提高交易辅助决策和资源优化配置能力。A、电力供用电市场B、电力客户C、电力市场用户D、电力资源市场化配置答案:D238.以下哪种不是自适应学习率方法()。A、Mini-batchB、AdagradC、RMSpropD、Adadelta答案:A239.以下哪种卷积神经网络的设计引入了残差网络结构()A、LeNetB、AlexNetC、GoogLeNetD、ResNets答案:D240.公司大数据应用建设应按照电网数字化建设要求,遵循公司大叔苏剧应用统一技术架构与标准,充分利用()等各类企业级大数据应用公共服务能力平台进行开发和实施。A、电网资源业务中台B、全业务数据中心C、数据中台D、数字化能力开放平台答案:C241.pynlpir是一种常用的自然语言理解工具包,其中进行分词处理的函数是()。A、open()B、segment()C、AddUserWord()D、generate()答案:B242.MapReduce计算框架的输人数据结构是()。A、key-valueB、input-outputC、map-reduceD、key-column答案:A243.考虑某个具体问题时,可能只有少量数据来解决这个问题。不过有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络?A、把除了最后一层外所有的层都冻结,重新训练最后一层B、对新数据重新训练整个模型C、只对最后?层进行调参(fineD、对每一层模型进行评估,选择其中的少数来用答案:C244.基于词的n元文法模型,其最后的粗分结果集合大小()N。A、大于B、大于等于C、小于D、小于等于答案:B245.LSTM中,(__)的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。A、输入门B、遗忘门C、输出门D、更新门答案:A246.在MapReduce中,哪个组件是用户不指定也不会有默认的()A、CombinerB、OutputFormatC、PartitionerD、InputFormat答案:A247.DataWorks中不同角色拥有不同的权限,可以通过角色授权来控制成员的操作权限。角色主要有组织管理员、项目管理员、开发员、防客等,其中开发角色不具备什么权限。A、添加项目成员B、新建任务C、新建函数D、上传资源答案:A248.从合规性监测和成效后评估向超前诊断、辅助决策转变,融入到公司战略、投资、管理等决策各环节,提升()能力。A、业务B、经营C、管理D、决策答案:D249.高斯核也称为(__)。A、多项式核B、拉普拉斯核C、RBF核D、Sigmoid核答案:C250.卷积核大小是4*4,则其步长不能是()。A、0B、1C、2D、3答案:A251.倒传递神经网络(BP神经网络)的训练顺序为何?(A:调整权重;B:计算误差值;C:利用随机的权重产生输出的结果)A、BCB、CAC、BAD、CB答案:D252.根据数据质量核查和治理情况,互联网部对数据质量问题发生数、()、整改完成率等进行评估和通报,促进公司整体数据质量水平提升。A、整改量B、整改及时率C、问题频率D、问题整改情况答案:B253.建立与政府主管部门、行业协会、专家学者的有效沟通机制,组织各级单位积极参与《数据安全法》、《》等国家、地方和行业数据相关法律法规。A、《个人信息保护法》B、《网络安全法》C、《保守国家秘密法》D、《网络产品和服务安全审查办法(试行)》答案:A254.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范,开展权威数据源中台标注,推进权威数据源在中台的落地应用,常态推进()治理。A、数据源头B、数据中台C、业务中台D、数据应用答案:A255.np.dot([[1,2,3],[1,2,3],[1,2,3]],[[2,1,1],[2,1,1],[2,1,1]])的结果是()。A、[[12B、[[2C、[[1D、[[2答案:A256.下面关于循环神经网络说法错误的是()A、循环神经网络用于静态输出B、循环神经网络通过使用带自反馈的神经元,能够处理任意长度的时序数据C、循环神经网络具有短期记忆能力,相当于存储装置,因此其计算能力十分强大D、循环神经网络时间扩展,神经元与多个时间输出计算答案:A257.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、技术服务项目B、科技项目C、信息化项目D、数字化项目答案:D258.将两篇文本通过词袋模型变为向量模型,通过计算向量的()来计算两个文本间的相似度。A、正弦距离B、余弦距离C、长度D、方向答案:B259.当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速推进,基于___的训练芯片持续增多A、CPUB、GPUC、FPGAD、5G通讯答案:B260.假设我们使用原始的非线性可分版本的Soft-SVM优化目标函数。我们需要做什么来保证得到的模型是线性可分离的()A、C=0B、C=1C、正无穷大D、C负无穷大答案:C261.在OneData方法论中,OneService理论描述错误的是哪项()?A、数据标准化B、主题式数据服务C、统一但多样化数据服务D、跨源数据服务答案:A262.引入激活函数的目的是()A、加入额外的计算单元B、加快计算速度C、增加神经网络模型的非线性D、方便反向传播计算答案:C263.下列哪一种情况被称为过学习现象:A、在训练集上A优于B,在测试集上A也优于BB、在训练集上A优于B,在测试集上B优于AC、相对于分类数据集,决策树过于简单D、在训练集上决策树的误差很小答案:B264.下列关于特征编码的叙述中,不正确的是()。A、特征编码是将非数值型特征转换成数值型特征的方法;B、数字编码与特征的排序无关;C、One-Hot编码中,原始特征有n种取值,转换后就会产生n列新特征;D、哑变量编码解决了One-Hot编码中存在线性关系的问题;答案:B265.Apriori算法的计算复杂度受()影响。①支持度阀值②项数(维度)③事务数④事务平均宽度A、①②③④B、②③④C、①③④D、①②③答案:A266.将合规管理要求全面嵌入公司数据活动,在各领域、各环节确定合规管理重点,覆盖(),促进公司数据活动全面合规。A、数据生产B、数据全生命周期C、数据存储D、数据销毁答案:B267.下面哪个激活函数可以实现max(0,x)的功能()。A、sigmoidB、reluC、softmaxD、tanh答案:B268.公司网络安全和信息化领导小组是数据管理工作的领导决策机构,下列哪项不是其主要职责()A、评估公司数据管理工作制度B、审议决策公司数据管理重大事项C、协调解决数据管理重要问题D、对公司数据管理工作进行监督指导答案:A269.下列关于hive说法正确的是()A、一种数据仓库工具B、一种数据处理工具C、一种可视化工具D、一种分析算法答案:A270.下列关于支持向量的说法正确的是()A、到分类超平面的距离最近的且满足一定条件的几个训练样本点是支持向量B、训练集中的所有样本点都是支持向量C、每一类样本集中都分别只有一个支持向量D、支持向量的个数越多越好答案:A271.依据《国家电网有限公司数据管理办法》,建立基于()的公司对内数据共享机制。A、负面清单B、层层审批C、一事一议D、数据应用答案:A272.下列关于误差的说法,正确的是()。A、训练样本容量增加,泛化误差也会增加B、过拟合指数据在训练集上的误差过大C、过拟合可以通过减少模型参数数量解决D、交叉验证不重复使用数据答案:C273.以下代码的输出结果为()。importnumpyasnpa=np.array([[10,7,4],[3,2,1]])print(np.percentile(a,50))A、[[10B、3.5C、[6.5D、[7.答案:B274.构建客户群体特征分析及细分模型,评估优化潜力,为用户智能推荐个性化服务方案,满足()服务需求。A、精准化B、个性化C、差异化D、特色化答案:C275.大数据的最显著特征是()。A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高答案:A276.阶跃函数与sigmoid函数均为典型激活函数()。A、正确B、错误C、nanD、nan答案:A277.数据使用是指需要某一专业数据的部门或单位(以下简称“需求方”)向数据归口管理部门或单位(以下简称“提供方”)申请使用数据的过程。需求方根据专业管理需要,填写(),并提供相关需求文档至提供方。A、《业务数据需求申请表》B、《数据使用需求清单》C、《全业务统一数据中心数据使用备案表》D、《业务数据使用申请表》答案:D278.以下程序的输出结果是:ls=["浣熊","豪猪","艾草松鸡","棉尾兔","叉角羚"]x="豪猪"print(ls.index(x,0))A、1B、0C、-4D、-3答案:A279.实现多分类任务的神经网络,输出层的神经元个数一般选择()。A、与类别数一致B、10以内C、2个D、类别数的2倍答案:A280.若a=‘abcd’,若想将a变为‘ebcd’,则下列语句正确的是()A、[0]B、replace(‘a’,C、D、=‘e’+“bcd”答案:D解析:a[1]=‘e’281.假设拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置。A、除去神经网络中的最后一层,冻结所有层然后重新训练B、对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对答案:B282.“数字孪生(DigitalTwin)”这一概念被美国()教授提出。A、MichaelB、EdwardC、MichaelD、Arthur答案:C283.训练一个RNN网络,如果权重与激活值都是NaN,下列选项中,哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了答案:B284.数据全生命周期安全防护,不包括()。A、数据采集环节B、数据传输环节C、数据存储环节D、数据建模分析节答案:D285.下列缩进格式描述不正确的是()。A、缩进指在代码行前面添加空格或Tab;B、在Python程序中,缩进不是任意的;C、缩进可以使程序更有层次感、更有结构感,从而是程序更易读。D、平级的语句行(代码块)的缩进可以不相同。答案:D286.深度学习方法不适用的数据集为以下哪种情况?A、样本量充足B、样本量多样化C、数据集具有局部相关性D、特征之间不具有局部相关性答案:D287.大数据应用的业务规划将聚焦核心领域,打造共5大重点业务、()个业务领域、34项业务方向。A、12B、13C、14D、15答案:A288.()不仅可用于多层前馈神经网络,还可用于其他类型的神经网络。A、感知机B、神经

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论