版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1能源大数据应用开发技能竞赛理论考试题库-上(单选题汇总)一、单选题1.下列()不是神经网络的代表。A、卷积神经网络B、递归神经网络C、残差网络D、xgboost算法E、nan答案:D2.以下哪个不是Spark的组件()A、DriverB、SparkContextC、ClusterManagerD、ResourceManagerE、nan答案:D3.阶跃函数与sigmoid函数均为典型激活函数()。A、正确B、错误C、nanD、nanE、nan答案:A4.离散程度的测度值愈大,则()。A、映变量值愈分散,算术平均数代表性愈差B、映变量值愈集中,算术平均数代表性愈差C、映变量值愈分散,算术平均数代表性愈好D、映变量值愈集中,算术平均数代表性愈好E、nan答案:A5.()的层结构主要有:输入层、卷积层、池化层(汇聚层、下采样层)、输出层等,其他的还可以有全连接层,归一化层之类的层结构。A、卷积神经网络B、网络神经C、识别神经D、图像神经E、nan答案:A6.加强公司大数据应用项目化管理,建立全生命周期管理机制,运用数字化技术,强化()等关键环节和关键要素的在线管控力度,提升公司大数据应用管理规范性。A、职责、流程、制度、标准、评价B、职责、制度、流程、标准、评价C、职责、流程、标准、制度、评价D、职责、标准、制度、流程、评价E、nan答案:A7.以下关于语言类型的描述中,错误的是______。A、解释是将源代码逐条转换成目标代码同时逐条运行目标代码的过程B、静态语言采用解释方式执行,脚本语言采用编译方式执行C、C语言是静态编译语言,Python语言是脚本语言D、编译是将源代码转换成目标代码的过程E、nan答案:B8.下面代码的输出结果是foriinrange(10):ifi%2==0:continueelse:print(i,end=",")A、1,3,5,7,9,B、2,4,6,8,C、0,2,4,6,8,D、0,2,4,6,8,10,E、nan答案:A9.神经网络建模步骤一般是()。1模型评估;2网络配置;3模型训练;4数据准备;5模型预测A、12345B、32154C、54321D、42315E、nan答案:D10.卷积神经网络的第一层中有10个卷积核,每个卷积核尺寸为5*5,步长为1,不补零,该层的输入图片的维度是224x224x3,那么该层输出的维度是()A、220x220x10B、220x220x5C、224x224x10D、224x224x5E、nan答案:A11.下面哪个属于映射数据到新的空间的方法?A、傅立叶变换B、特征加权C、渐进抽样D、维归约E、nan答案:A12.数据资源主要是指能够被企业及组织访问和使用的所有数据信息的集合,通常表现为数据库、文档、图片、()等形式。A、脚本B、视频C、压缩文件D、备份文件E、nan答案:B13.以下哪种不是常用的数据选择方法()A、留一法B、留出法C、十则交叉验证法D、互助法E、nan答案:D14.Ndarray是一个通用的()数据容器A、单维同类B、单维多类C、多维同类D、多维多类E、nan答案:C15.大数据的最显著特征是()。A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高E、nan答案:A16.()负责数据合规归口管理,负责数据合规技术审查,持续提升数据合规管理水平。A、互联网部B、信通公司C、办公室D、安监部E、nan答案:A17.下列关于Hadoop组件的说法,正确的有()①HDFS是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上;②Hive是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制;③Flume采用了Agent、Gossip和Storage三层架构;④Sqoop主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作A、①②③B、①②④C、②③④D、①③④E、nan答案:B18.以下关于Python的控制结构,错误的是:A、每个B、在C、PythonD、elifE、nan答案:D19.()是一种处理时序数据的神经网络,常用语语音识别、机器翻译等领域。A、前馈卷神经网络B、卷积神经网络C、循环神经网络D、对抗神经网络E、nan答案:C20.合作单位和供应商的开发测试环境与公司()应做好隔离。A、内网环境B、测试环境C、生产环境D、业务环境E、nan答案:C21.下列哪个不属于常用的文本分类的特征选择算法()。A、卡方检验值B、互信息C、信息增益D、主成分分析E、nan答案:D22.数据存储环节,企业重要数据原则上应存储于管理信息大区,在互联网大区存储企业重要数据时应____。A、本地储存B、云上储存C、加密储存D、线下储存E、nan答案:C23.()负责公司数据保密工作归口管理,开展数据活动保密工作的指导和检查。A、互联网部B、法律部C、办公室D、安监部E、nan答案:C24.各地区、各部门应当按照数据()保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域E、nan答案:A25.关于SOM神经网络描述错误的是:(__)。A、一种竞争学习型的无监督神经网络B、将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构C、SOM寻优目标为每个输出神经元找到合适的权重D、输出层神经元以矩阵方式排列在二维空间E、nan答案:C26.在实际生产环境中获取的数据可能存在缺失值。为了更好地进行数据分析,通常需要对缺失数据进行识别和处理。下列关于DataFrame.dropna()方法说法正确的是()。A、DataFrame.dropna(axis=1,B、DataFrame.dropna(axis=0,C、DataFrame.dropna(axis=0,D、DataFrame.dropna(axis=1,E、nan答案:C27.下列哪一项在神经网络中引入了非线性()A、随机梯度下降修B、正线性单元(ReLU)C、卷积函数D、以上答案都不正确E、nan答案:B28.以下哪些CNN模型不是在imagenet比赛中兴起的?()A、AlexNetB、VGG19C、ResNetD、Mask-RCNNE、nan答案:D29.从网络的原理上来看,结构最复杂的神经网络是()。A、卷积神经网络B、长短时记忆神经网络C、GRUD、BP神经网络E、nan答案:B30.()计算框架源自一种分布式计算模型,其输入和输出值均为“键-值对”结构。A、MahoutB、MapReduceC、SparkD、SqoopE、nan答案:B31.对于一个图像识别问题(在一张照片里找出一只猫),()可以更好地解决这个问题。A、循环神经网络B、感知机C、多层感知机D、卷积神经网络E、nan答案:D32.按照《国家电网有限公司数据共享负面清单管理细则》,纳入公司负面清单的数据主要有()。A、商业秘密和工作秘密B、个人隐私C、相关敏感事项D、以上都是E、nan答案:D33.涉及个人信息处理的部门和单位,在制定相关制度时应明确(),建立体系化、多层次的告知同意机制,并采取必要的技术措施确保收集的个人信息安全。A、信息加工方式B、数据使用目的C、收集信息处理D、个人信息处理规则E、nan答案:D34.Python运算符中用来计算集合并集的是()A、|B、&C、||D、+E、nan答案:A35.假设一个具有3个神经元和输入为[1,2,3]的简单MLP模型。输入神经元的权重分别为4,5和6。假设激活函数是一个线性常数值3(激活函数为:y=3x)。输出是什么?A、32B、643C、96D、48E、nan答案:C36.业务中台从管理上突破了系统建设的()壁垒A、部门级B、地市C、专业D、公司级E、nan答案:A37.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是()。A、1B、3.2C、2.6D、3.8E、nan答案:C38.关系国家安全、国民经济命脉、重要民生、重大公共利益等数据属于国家()数据,实行更加严格的管理制度A、核心B、重要C、公共D、敏感E、nan答案:A39.现阶段的大数据技术体系主要类型不包括()。A、数据源与APPB、基础设施C、HadoopD、数据资源E、nan答案:C40.Hive的计算引擎是()。A、SparkB、MapReduceC、HDFSD、HBaseE、nan答案:B41.以下程序的输出结果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A、['z',B、['j',C、['j',D、['j',E、nan答案:B42.以下哪种不是自适应学习率方法?A、Mini-batchB、AdagradC、RMSpropD、AdadeltaE、nan答案:A43.下列算法在sklearn中未提及的是()A、K-means聚类算法B、LogisticC、KNN算法D、Apriori关联规则算法E、nan答案:D44.下面关于聚类分析说法错误的是(?)A、一定存在一个最优的分类B、聚类分析是无监督学习C、聚类分析可以用于判断异常值D、聚类分析即:物以类聚,人以群分E、nan答案:A45.下列哪个不是RDD的缓存方法()A、persist()B、Cache()C、Memory()D、以上答案都正确E、nan答案:C46.进行主成分分析的前提条件是,各变量间()。A、高度相关B、低度相关C、相互独立D、完全相关E、nan答案:B47.需加强国家秘密、企业秘密、个人信息、()等重点领域的数据合规管理A、他人信息B、个人秘密C、知识产权D、公共信息E、nan答案:C48.机房动力环境监控系统不包含(___)A、电源状态监测B、烟雾检测报警C、漏水检测报警D、新风系统E、nan答案:D49.卷积神经网络可以对一个输入进行多种变换(旋转、平移、缩放),这个表述正确吗()A、对的B、不知道C、看情况D、不对E、nan答案:D50.用onehot对某个只有一个属性的样本进行编码,下面可能是编码结果的是()。A、1010B、1100C、1111D、1000E、nan答案:D51.AlexNet使用ReLU激活函数的好处不包括以下哪个方面?()A、梯度为0时神经元难以正常工作B、开销小、计算快C、提高了网络训练速度D、缓解了梯度消失问题E、nan答案:A52.下列对于sigmoid函数的说法,错误的是()A、存在梯度爆炸的问题B、不是关于原点对称C、计算exp比较耗时D、存在梯度消失的问题E、nan答案:A53.常用的图像去噪方法有()。A、高斯滤波B、中值滤波C、P-M方程去噪D、以上答案都正确E、nan答案:D54.服务(),提供多模式电力交易大数据分析服务,开展电力交易市场化配置和风险预警数据应用,提高交易辅助决策和资源优化配置能力。A、电力供用电市场B、电力客户C、电力市场用户D、电力资源市场化配置E、nan答案:D55.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗A、可以B、不好说C、不一定D、不能E、nan答案:D56.有关聚类分析说法错误的是()A、无须有标记的样本B、可以用于提取一些基本特征C、可以解释观察数据的一些内部结构和规律D、聚类分析一个簇中的数据之间具有高差异性E、nan答案:D57.防止()发布或交互企业重要数据以及个人信息,扰乱互联网秩序等违法违规活动。A、非法B、擅自C、负面信息D、非授权E、nan答案:D58.倒传递神经网络(BP神经网络)的训练顺序为何?(A:调整权重;B:计算误差值;C:利用随机的权重产生输出的结果)?A、BCB、CAC、BAD、CBAE、nan答案:D59.数据全生命周期安全防护,不包括()。A、数据采集环节B、数据传输环节C、数据存储环节D、数据建模分析节E、nan答案:D60.关于神经网络结构的权重共享现象,下面哪个选项是正确的()A、只有全连接神经网络会出现B、只有卷积神经网络(CNN)会出现C、只有循环神经网络(RNN)会出现D、卷积神经网络和循环神经网络都会出现E、nan答案:D61.数据分析思维模式主要从()入手,最终改变()A、数据;业务B、业务;数据C、数据;项目D、项目;数据E、nan答案:A62.个人信息数据收集应遵循不包括____的原则A、合法B、正当C、必要D、可溯源E、nan答案:D63.数据库设计中的概念结构设计的主要工具是()A、数据模型B、E-R模型C、新奥尔良模型D、概念模型E、nan答案:B64.人工智能平台总体架构由()组成A、平台层B、应用层C、服务层D、全部E、nan答案:D65.Apriori算法的计算复杂度受()影响。①支持度阀值②项数(维度)③事务数④事务平均宽度A、①②③④B、②③④C、①③④D、①②③E、nan答案:A66.下列关于随机森林和GBDT的书法正确的是()A、在随机森林的单个树中,树和树之间是有依赖的,而GBDT中的单个树之间是没有依赖的B、这两个模型都使用随机特征子集,来生成许多单个的树C、我们可以并行地生成GBDT单个树,因为它们之间是没有依赖的D、GBDT训练模型的表现总是比随机森林好E、nan答案:B67.()要加强对涉及企业秘密的数据保护工作的组织、指导A、业务部门B、数字化部C、公司保密办D、安全部门E、nan答案:C68.关于Python的全局变量和局部变量,以下选项中描述错误的是()A、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用B、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用可以继续使用C、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放D、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效E、nan答案:B69.下列哪一项在神经网络中引入了非线性()A、SGDB、激活函数C、卷积函数D、都不正确E、nan答案:B70.下面选项不正确的是()。importnumpyasnpx=np.array([[1,2],[3,4]])y=np.linalg.inv(x)print(y)A、[[1B、[[-2.C、[[1.D、以上答案均不正确E、nan答案:B71.()是一个开放源代码的对象关系映射框架,它对JDBC进行了非常轻量级的对象封装。A、hbaseB、hiveC、HibernateD、mapreduceE、nan答案:C72.下列程序段执行后,输出结果是()。n=1s=1whilen<5:s=s*nn=n+1Print(s)A、24B、10C、120D、15E、nan答案:A73.公司对外提供数据时,应根据《国家电网有限公司关于数据对外开放的指导意见》(国家电网互联〔2020〕675号)有关要求,执行()的数据开放策略。A、差异化B、一致化C、最大化D、最小化E、nan答案:A74.基于Bagging的集成学习代表算法有()。A、AdaboostB、GBDTC、XGBOOSTD、随机森林E、nan答案:D75.以下统计学知识,数据科学中不常用的是()。A、归纳分析法B、描述统计C、推断统计D、基本分析法E、nan答案:A76.若a=np.array([5,1,2,3]),a.sort(),则数组a的结果是()。A、[5,1,2,3];B、[1,2,3,5];C、[3,2,1,5];D、11;E、nan答案:B77.公司企业中台基于()构建,是企业级能力共享平台。A、华为云B、国网云C、阿里云D、百度云E、nan答案:B78.通过数据盘点理清数据状况,建立数据目录,以()为基础梳理形成数据共享负面清单,结合负面清单明细进行数据安全分级,识别数据保护对象A、资产目录B、个人信息C、商业秘密D、数据目录E、nan答案:D79.业务中台从管理上破除了系统建设的()壁垒,形成灵活、轻量、便捷的共享能力中心A、部门级B、管理级C、公司级D、企业级E、nan答案:A80.Hive是基于Hadoop的数据仓库软件,最大可以查询有管理()级别的分布式数据。A、PBB、GBC、MBD、TBE、nan答案:A81.HDFS是Hadoop体系中定位是()。A、为数据仓库的管理提供功能B、对大型数据集进行分析和评估C、日志收集分析D、数据存储管理的基础E、nan答案:D82.以下哪个是有关数据科学研究目的的原则?()A、DIKUW原则B、5W1H原则C、6S原则D、PDCA原则E、nan答案:A83.当闵可夫斯基距离公式中的系数p值为2时,可得到(__)的公式。A、欧氏距离B、曼哈顿距离C、街区距离D、切比雪夫距离E、nan答案:A84.《国家电网公司信息网络运行管理规程》对进出机房的人员进行详细登记,有关的登记记录应保存的最短日期是()。A、1年B、2年C、3年D、半年E、nan答案:A85.属于卷积神经网络应用方向的是()。A、图像分类B、目标检测C、图像语义分割D、以上答案都正确E、nan答案:D86.numpy中用于改变数组形状的函数为()。A、np.ones()B、np.shape()C、np.reshape()D、np.dot()E、nan答案:C87.公司()要加强对涉及企业秘密的数据保护工作的组织、指导。A、互联网部B、信通公司C、保密办D、安监部E、nan答案:C88.大数据应用专业支撑单位应落实大数据应用相关数据安全策略和(),加强数据安全前沿技术研究应用,提升数据安全感知、监测、追溯和控制等能力,为大数据应用工作做好数据安全技术保障。A、安全措施B、技术措施C、防范措施D、管控措施E、nan答案:D89.下面算法属于局部处理的是()。A、灰度线性变换B、二值化C、傅里叶变换D、中值滤波E、nan答案:D90.朴素贝叶斯分类器的朴素之处在于:A、只能处理低维属性B、只能处理离散型属性C、分类效果一般D、属性之间的条件独立性假设E、nan答案:D91.在梯度下降算法中,通常采用多种策略避免()A、全局最小B、局部最小C、全局最大D、局部最大E、nan答案:B92.一个HDFS集群是由一个()和多个数据节点组成。A、索引节点B、根节点C、名字节点D、数据节点E、nan答案:C93.下列关于模型能力(modelcapacity,指神经网络模型能拟合复杂函数的能力)的描述正确的是()。A、隐藏层层数增加,模型能力增加B、DropoutC、学习率增加,模型能力增加D、以上都不正确E、nan答案:A94.数据科学项目应遵循一般项目管理的原则和方法,涉及()。A、整体、范围、时间、成本、质量、沟通、风险、宣传、消费B、整体、范围、时间、成本、质量、人力资源、沟通、风险、采购C、整体、范围、时间、成本、质量、人力资源、运维、采购、宣传D、整体、范围、时间、成本、质量、人力资源、采购、宣传、运维E、nan答案:B95.国家提倡诚实守信,()的网络行为,推动传播社会注意核心价值观,实行措施提高全社会的网络安全意识和水平,形成全社会共同参加促进网络安全的良好环境。A、自由公平B、健康文明C、团结互助D、和平友爱E、nan答案:B96.以下关于神经网络的说法错误的是()A、递归神经网络不允许网络中出现环形结构B、减少神经网络层数,可能会降低测试集分类错误率C、循环神经网络适合处理序列数据D、卷积神经网络可以应用于图像分类E、nan答案:A97.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是:()。A、总偏差平方和B、残差平方和C、回归平方和D、相关指数R2E、nan答案:B98.下面算法中属于图像锐化处理的是()。A、低通滤波B、加权平均法C、高通滤波D、中值滤波E、nan答案:C99.当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速推进,基于___的训练芯片持续增多A、CPUB、GPUC、FPGAD、5G通讯E、nan答案:B100.Hive的数据最终存储在()A、HDFSB、HBaseC、RDBMSD、MetastoreE、nan答案:A101.在选择神经网络的深度时,下面哪些参数需要考虑?1神经网络的类型(如MLP,CNN);2输入数据;3计算能?(硬件和软件能?决定);4学习速率;5映射的输出函数。A、1,2,4,5B、2,3,4,5C、都需要考虑D、1,3,4,5E、nan答案:C102.当总体为正态总体,方差已知,样本量为40,此时进行均值检验,应采用()统计量进行检验。A、卡方检验B、t检验C、F检验D、Z检验E、nan答案:D103.标准循环神经网络隐含层的输入对于网络输出的影响随时间A、不断递归而衰退B、不断递归而增强C、先增强后减弱D、先减弱后增强E、nan答案:A104.scipy.stats模块中随机变量的残存函数是()。A、cdfB、rvsC、pdfD、sfE、nan答案:D105.Spark的()组件用于支持实时计算需求。A、SparkSQLB、SparkStreamingC、SparkGraphXD、SparkMLLibE、nan答案:B106.回溯“深度学习”领域的学术脉络,2017年-2020年间研究量最多的主题是A、特征提取B、卷积神经网络C、人工智能D、迁移学习E、nan答案:B107.下面代码的执行结果是>>>1.23e-4+5.67e+8j.realA、1.23E+4B、1.23C、5.67E+8D、0.000123E、nan答案:D108.下列哪项关于模型能力(modelcapacity指神经网络模型能拟合复杂函数的能力)的描述是正确的()A、隐藏层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、都不正确E、nan答案:A109.以下哪些是通用逼近器?A、KernelB、NeuralC、BoosteD、以上所有E、nan答案:D110.大数据计算服务(Maxpute,原ODPS)tunnel命令?供了丰富的参数,可以通过参数设置,对上传或者下载操作进行控制,现在有一个大文件要上传至odps某表中,想先检查一下该文件内容是否和表的定义匹配,并不实际上传,以免文件中有错误记录会导致上传出错。可以使用哪个参数实现这个功能?A、错误记录丢弃:-dbrB、字段分隔符:-fC、扫瞄选项:-sD、空字符串显示:-niE、nan答案:C111.聚焦()经济发展新趋势,坚持维护数据安全合规和促进数据开发利用并重,持续优化数据合规管理机制与策略,支撑、赋能公司高质量发展。A、新能源B、社会科技C、信息技术D、能源数字E、nan答案:D112.以下关于函数的描述,错误的是A、使用函数的目的只是为了增加代码复用B、函数是一种功能抽象C、使用函数后,代码的维护难度降低了D、函数名可以是任何有效的Python标识符E、nan答案:A113.以下说法错误的是:(__)。A、当目标函数是凸函数时,梯度下降的解时全局最优解B、进行PCA降维时需要计算协方差矩阵C、沿负梯度下降的方向一定是最优的方向D、利用拉格朗日函数能解带约束的优化问题E、nan答案:C114.给出如下代码:s='Pythonisbeautiful!'可以输出"python"的语句是()A、print(s[0:6])B、print(s[0:6].lower())C、print(s[-21:-14].lower)D、print(s[:-14])E、nan答案:B115.假设数据集中有100条数据,设置batch_size为4,那么跑完一轮模型会迭代多少次()。A、400B、100C、25D、4E、nan答案:C116.下列关于线性回归分析中的残差说法正确是A、残差均值总是为零B、残差均值总是小于零C、残差均值总是大于零D、以上说法都不对E、nan答案:A117.大数据的4V特性中,哪一个是错误的:()。A、数据量大B、价值密度高C、增长快D、维度高E、nan答案:B118.机器学习和深度学习的关系是(__)。A、深度学习包含机器学习B、机器学习包含深度学习C、二者是独立的D、二者相互促进E、nan答案:B119.()不仅可用于多层前馈神经网络,还可用于其他类型的神经网络。A、感知机B、神经元C、神经系统D、误差逆传播E、nan答案:D120.在实现前向传播和反向传播中使用的“cache”是什么A、它用于跟踪我们正在搜索的超参数,以加速计算B、用于在训练期间缓存代价函数的中间值C、我们使用它传递反向传播中计算的变量到相应的前向传播步骤,它包含对于前向传播计算导数有用的变量D、我们使用它传递前向传播中计算的变量到相应的反向传播步骤,它包含对于反向传播计算导数有用的变量E、nan答案:D121.综合类大数据应用管理,主要包括(),由互联网部统一组织开展。A、应用需求B、分析应用C、成果管理D、以上都是E、nan答案:D122.除非获得()明确授权,未经脱敏处理的原始用户隐私数据等敏感数据限于公司内网传输、存储。A、安全机构B、企业C、上级D、用户E、nan答案:D123.()模块是Python标准库中最常用的模块之一。通过它可以获取命令行参数,从而实现从程序外部向程序内部传递参数的功能,也可以获取程序路径和当前系统平台等信息。A、sysB、platformC、mathD、D,参数是组合类型(可变对象)时,改变原参数的值E、nan答案:A124.依据《国家电网有限公司数据管理办法》,建立基于()的公司对内数据共享机制。A、负面清单B、层层审批C、一事一议D、数据应用E、nan答案:A125.子集搜索中,逐渐增加相关特征的策略称为()。A、前向搜索B、后向搜索C、双向搜索D、不定向搜索E、nan答案:A126.下列关于LSTM说法错误的是(__)。A、LSTM中存在sigmoid函数B、LSTM中存在tanh函数C、LSTM又称长短时记忆网络D、RNN是LSTM的变种E、nan答案:D127.下列关于循环神经网络说法错误的是()。A、长短期记忆网络是进行优化过后的循环神经网络B、RNN是一类可用于处理序列数据的神经网络C、循环神经网络广泛应用于自然语言处理领域,例如语音识别、语言建模和机器翻译等D、LSTM引入了一个基于循环神经网络(RNN)的架构后,梯度消失问题得以解决E、nan答案:D128.下列代码:deffoo():print("starting...")whileTrue:res=yield4print("res:",res)foo()返回的是A、resB、4C、starting...D、以上都不对E、nan答案:D129.安全巡检属于信息系统安全过程管理的()阶段。A、运行B、测试C、科研D、上线E、nan答案:A130.以下哪种参数是用*来接收,不是必传的?A、位置参数B、默认值参数C、可变参数D、关键字参数E、nan答案:C131.MapReduce框架中中间有一步叫shuffle,把同样的()运输到同一个()上面去。A、value,B、value,C、key,D、key,E、nan答案:C132.数据使用是指需要某一专业数据的部门或单位(以下简称“需求方”)向数据归口管理部门或单位(以下简称“提供方”)申请使用数据的过程。需求方根据专业管理需要,填写(),并提供相关需求文档至提供方。A、《业务数据需求申请表》B、《数据使用需求清单》C、《全业务统一数据中心数据使用备案表》D、《业务数据使用申请表》E、nan答案:D133.重视能力建设,加强大数据应用关键技术研究、软硬件环境建设,推动技术、资源和管理的有机融合,建立常态化人才培养机制,持续提升公司大数据(),为公司数字化转型注入强大动力。A、分析挖掘能力B、应用开发能力C、特征处理能力D、安全管理能力E、nan答案:B134.受到治安管理处罚的人员,()不得从事网络安全管理和网络运营关键岗位的工作;受到刑事处罚的人员,()不得从事网络安全管理和运营关键岗位的工作。A、五年内,十年内B、三年内,终身C、三年内,十年内D、五年内,终身E、nan答案:D135.深度学习方法不适用的数据集为以下哪种情况?A、样本量充足B、样本量多样化C、数据集具有局部相关性D、特征之间不具有局部相关性E、nan答案:D136.random库中用于生成随机小数的函数是()。A、random()B、randint()C、getrandbits()D、randrange()E、nan答案:A137.长短时记忆神经网络被设计用来解决什么问题?()A、传统RNN存在的梯度消失/爆炸问题B、传统RNN计算量大的问题C、传统RNN速度较慢的问题D、传统RNN容易过过拟合的问题E、nan答案:A138.下面关于Hive各个格式使用场景描述错误的是()A、Parquet对于大型查询的类型是高效的,对于扫描特定表格中的特定列的查询,Parquet特别有用B、目前Parquet默认使用gzip压缩格式C、ORC可以支持复杂的数据结构(比如Map等)D、RCFile是一种行列存储相结合的存储方式E、nan答案:B139.下面关于循环神经网络说法错误的是()A、循环神经网络用于静态输出B、循环神经网络通过使用带自反馈的神经元,能够处理任意长度的时序数据C、循环神经网络具有短期记忆能力,相当于存储装置,因此其计算能力十分强大D、循环神经网络时间扩展,神经元与多个时间输出计算E、nan答案:A140.下列关于网络用户行为的说法中,错误的是()。A、网络公司能够捕捉到用户在其网站上的所有行为B、用户离散的交互痕迹能够为企业提升服务质量提供参考C、数字轨迹用完即自动删除D、用户的隐私安全很难得以规范保护E、nan答案:C141.按照共享能力中心设计原则,不包括()。A、独立性B、高内聚C、完整性D、强拆分E、nan答案:A142.关于OLAP和OLTP的区别描述,不正确的是()。A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同。B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务。C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高。D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的E、nan答案:C143.在Spark中,()是指RDD的每个分区都只被子RDD的一个分区所依赖。A、子分区B、父分区C、宽依赖D、窄依赖E、nan答案:D144.下列哪个不是专门用于可视化时间空间数据的技术:()。A、等高线图B、饼图C、曲面图D、矢量场图E、nan答案:B145.plt.plot()函数的功能是(__)。A、展现变量的趋势变化B、寻找变量之间的关系C、设置x轴的数值显示范围D、设置x轴的标签文本E、nan答案:A146.分析应用计算后的分析主题数据存储在:()。A、贴源层B、共享层C、分析层D、整合明细层E、nan答案:C147.下面哪种说法有关机器学习的认识是错误的?()A、高质量的数据、算力和算法对一个机器学习项目是必不可少的。B、深度学习是机器学习的一类高级算法,可以处理图像、声音和文本等复杂数据。C、机器学习算法很多,后期出现的算法比早期出现的算法性能好。D、机器学习可以在一定程度上模仿人的学习,并能增强人的决策能力。E、nan答案:C148.()算法可以较好的避免样本的不平衡问题。A、KNNB、SVMC、BayesD、神经网络E、nan答案:A149.高斯核也称为(__)。A、多项式核B、拉普拉斯核C、RBF核D、Sigmoid核E、nan答案:C150.下列关于长短时神经网络的叙述错误的是()。A、引用自循环思想B、产生梯度长时间持续流动的路径C、积累的时间尺度不可以因输入序列而改变D、可应用于语音识别和机器翻译E、nan答案:C151.关于Python语言的浮点数类型,以下选项中描述错误的是A、浮点数类型与数学中实数的概念一致B、浮点数类型表示带有小数的类型C、Python语言要求所有浮点数必须带有小数部分D、小数部分不可以为0E、nan答案:D152.面向政府机构或非营利性组织等,从服务中央决策部署落地实施、社会治理现代化等方面,提供的公益性数据服务为()。A、政府监管类B、公益服务类C、商务增值类D、公共开放类E、nan答案:B153.由于业务系统原因影响数据质量,需修改、优化应用系统功能的,按照公司()进行。A、信息系统安全规定B、信息系统运维规定C、信息系统检修管理规定D、信息系统使用规定E、nan答案:B154.()负责HDFS数据存储。A、NameNodeB、JobTrackerC、DataNodeD、SecondaryNameNodeE、nan答案:C155.由于不同类别的关键词对排序的贡献不同,检索算法一般把查询关键词分为几类,以下哪一类不属于此关键词类型的是()。A、引用词B、普通关键词C、高频词汇D、扩展关键词E、nan答案:C156.数据分类应结合数据在挖掘、计算、分析、处理后()动态变化的特点识别、调整数据分级和保护要求。A、业务属性B、管理属性C、安全属性D、基础属性E、nan答案:C157.以下不属于大数据应用业务规划五大核心领域的是()。A、电网运营B、经营管理C、对内服务D、业务创新E、nan答案:C158.国家电网公司各单位推广后对新技术试运行情况进行技术总结和评价,包括新技术的运行性能、设计符合度、技术先进性、()、电网安全影响、推广应用难度等方面内容,并将评价报告报送相关主管部门。A、应用效果及成熟程度B、经济适宜性C、实用价值D、信息化的标准符合度E、nan答案:B159.需要生成一个[a,b]之间的整数,采用下列哪个代码()A、random.randomB、random.uniform(a,b)C、random.randint(a,b)D、random.ranrange(a,b)E、nan答案:C160.关于MaxputeMR,说法正确的是:()。A、Map和Reduce前都需要对数据进行分片;B、进入reduce前,数据需要进行合并操作(biner),然后按照key排序;C、MapD、Reducer的个数和Mapper的个数一致;E、nan答案:C161.关于基本数据的元数据是指:A、基本元数据与数据源,数据仓库,数据集市和应用程序等结构相关的信息B、基本元数据包括与企业相关的管理方面的数据和信息C、基本元数据包括日志文件和简历执行处理的时序调度信息D、基本元数据包括关于装载和更新处理,分析处理以及管理方面的信息E、nan答案:D162.及时将数据活动中产生的()纳入公司知识产权体系进行保护,妥善处理好数据内部共享、对外开放与知识产权保护的关系。A、智力成果B、软件著作权C、各类专利D、发表的论文E、nan答案:A163.在MySQL中,通常使用()语句来进行数据的检索、输出操作。A、SELECTB、INSERTC、DELETED、UPDATEE、nan答案:A164.构建一个神经网络,将前一层的输出和它自身作为输入,则有反馈连接的是()。A、循环神经网络B、卷积神经网络C、限制玻尔兹曼机D、都不是E、nan答案:A165.考察一个由三个卷积层组成的CNN:kernel=3B3,stride=2,padding=SAME。最低层输出100个特征映射(featuremap),中间层200个特征映射,最高层400个特征映射。输入是200B300的RGB图片,总参数的数量是多少()A、903400B、2800C、180200D、720400E、nan答案:A166.长短时记忆网络属于一种()。A、全连接神经网络B、门控RNNC、BP神经网络D、双向RNNE、nan答案:B167.以下哪一个是ResNet-18的网络结构?()A、4个残差块各有4个卷积层(不包括恒等映射的1x1卷积层),B、3个残差块各有5个卷积层(不包括恒等映射的1x1卷积层),加上最后一个全连接层C、4个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),D、5个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),E、nan答案:A168.公司()委员会负责数据合规管理工作统筹领导。A、信息安全B、网络安全C、安全领导D、合规管理E、nan答案:D169.Maxpute执行某个SQL时返回信息中包括“J3_1_2_Stg1”,以下说法中正确的是:()。A、当前Task(ID为3)依赖于ID为1的任务,该Task的WorkerB、当前Task(ID为3)依赖于ID为1的任务,同时触发ID为2的任务C、当前Task(ID为3)有2个Reducer,1个mapperD、当前Task(ID为3)依赖于ID为1和ID为2的两个TaskE、nan答案:D170.下列哪个程序通常与NameNode在一个节点启动()A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、JobtrackerE、nan答案:D171.()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A、支持向量机B、Boosting算法C、贝叶斯分类器D、Bagging算法E、nan答案:B172.在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是()。A、有放回的简单随机抽样B、无放回的简单随机抽样C、分层抽样D、渐进抽样E、nan答案:D173.关于pandas库的文本操作,下列说法错误的是()。A、Replace方法用于替换字符串B、Slice方法不是通过截取字符实现文本索引操作的C、Upper方法可将Series各元素转换为大写D、存在一些特殊的方法是Python原生str类型所没有的E、nan答案:B174.AI芯片也被称为AI加速器,是专门用于处理人工智能应用中的大量计算任务的功能模块。A、TRUEB、FALSEC、nanD、nanE、nan答案:A175.因业务需要,确需向境外提供的,应经公司保密办与业务部门审批,根据国家相关规定做好()等工作,视情况向国家有关部门报备。A、汇报审批B、安全评估C、安全测评D、安全报备E、nan答案:B176.从数据到智慧的转换依次递进过程是()。A、数据、知识、信息、理解、智慧B、数据、信息、理解、知识、智慧C、数据、信息、知识、理解、智慧D、数据、理解、信息、知识、智慧E、nan答案:C177.公司大数据应用建设应按照电网数字化建设要求,遵循公司大叔苏剧应用统一技术架构与标准,充分利用()等各类企业级大数据应用公共服务能力平台进行开发和实施。A、电网资源业务中台B、全业务数据中心C、数据中台D、数字化能力开放平台E、nan答案:C178.下列属于卷积网络类型分类的是(__)。A、普通卷积B、扩张卷积C、转置卷积D、以上答案都正确E、nan答案:D179.大数据和算法关系以下描述正确的是:A、数据跟算法没有关系B、算法比数据更重要C、数据比算法更重要D、没有数据的算法没有意义,失去了算法的数据无法应用E、nan答案:D180.一般情况下,整数用十进制表示,如果用其他进制表示一个数,错误的描述选项是:A、0o1010表示一个八进制数B、1010b表示一个二进制数C、0b1010表示一个二进制数D、0x1010表示一个十六进制数E、nan答案:B181.加强数据合规管理顶层设计,强化跨专业、跨层级统筹协调,建立健全()工作机制,确保公司数据合规管理工作有力、有序、有效推进。A、闭环B、协同C、安全D、监控E、nan答案:B182.考虑某个具体问题时,你可能只有少量数据来解决这个问题。不过幸运的是你有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络()A、把除了最后一层外所有的层都冻住,重新训练最后一层B、对新数据重新训练整个模型C、只对最后几层进行调参(fineD、对每一层模型进行评估,选择其中的少数来用E、nan答案:C183.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、技术服务项目B、科技项目C、信息化项目D、数字化项目E、nan答案:D184.以下哪种卷积神经网络的设计引入了残差网络结构()A、LeNetB、AlexNetC、GoogLeNetD、ResNetsE、nan答案:D185.健全安全管理机制,担起关键信息基础设施和数据安全保护责任,应坚持“()、分类分级、依法合规”的防护原则,以法规监管、业务需求、标准指引为出发点,统筹规划,构建覆盖组织、策略、流程和工具的安全管理体系,既防内又防外,对关键信息基础设施实施重点保护。A、安全监测B、攻防验证C、安全分区D、安全保护E、nan答案:C186.CNN神经网络对图像特征提取带来了变革性的变化,使之前的人工特征提取升级到数据驱动的自动特征提取,在CNN中,起到特征提取作用的网络层是:(__)。A、convolution层B、fullC、maxD、norm层E、nan答案:A187.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择?A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法E、nan答案:B188.在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题A、增加训练集量B、减少神经网络隐藏层节点数C、删除稀疏的特征D、SVM算法中使用高斯核/RBF核代替线性核E、nan答案:D189.电力线和信号线应分别敷设在()、()或桥架内,走线应整齐美观安全。A、走线架B、强电线槽,弱电线槽C、弱电线槽,强电线槽D、槽钢E、nan答案:B190.DB2在数据存储划分中属于RDBMS系统,对外可以提供()数据查询接口。A、顺序一致性B、最终一致性C、弱一致性D、强一致性E、nan答案:D191.googlenet提出的Inception结构优势有()。A、保证每一层的感受野不变,网络深度加深,使得网络的精度更高B、使得每一层的感受野增大,学习小特征的能力变大C、有效提取高层语义信息,且对高层语义进行加工,有效提高网络准确度D、利用该结构有效减轻网络的权重E、nan答案:D192.如果增加神经网络的宽度,精确度会增加到一个阈值,然后开始降低。造成这一现象的原因可能是()。A、只有一部分核被用于预测B、当核数量增加,神经网络的预测能力降低C、当核数量增加,其相关性增加,导致过拟合D、以上都不对E、nan答案:C193.以下()不属于开源数据湖解决方案。A、DLIB、IcebergC、HudiD、OpenE、nan答案:A194.若训练过程的目标是预测连续值,此类学习任务称为()。A、回归B、分类C、测试D、学习E、nan答案:A195.下列关于集成学习方法的说法错误的是()A、Boosting是一族可将弱学习器提升为强学习器的算法B、随机森林是Bagging的一个扩展变体C、随机森林简单、容易实现、计算开销小D、Boosting是个体学习器间不存在强依赖关系、可同时生成的并行化方法E、nan答案:D196.在反向传播的过程中,首先被计算的是变量()的梯度,之后将其反向传播。A、连接权重B、损失函数C、激活函数D、特征映射E、nan答案:C197.随机森林与Bagging中基学习器"多样性"的区别是()。A、都来自样本扰动B、都来自属性扰动C、来自样本扰动和自属性扰动D、多样本集结合E、nan答案:C198.已知:(1)大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。(2)每一个神经元都有输入、处理函数和输出。(3)神经元组合起来形成了网络,可以拟合任何函数。(4)为了得到最佳的神经网络,我们用梯度下降方法不断更新模型。给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?A、加入更多层,使神经网络的深度增加B、有维度更高的数据C、当这是一个图形识别的问题时D、以上都不正确E、nan答案:A199.以下程序的输出结果是:L2=[1,2,3,4]L3=L2.reverse()print(L3)A、NoneB、[4,C、[3,D、[1,2,3,]E、nan答案:A200.()的主要目标是提供可扩展的机器学习算法及其实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。A、MahoutB、FlumeC、SqoopD、HBaseE、nan答案:A201.Dropout技术在下列哪种神经层中将无法发挥显著优势?A、仿射层B、卷积层C、RNN层D、均不对E、nan答案:C202.助力()战略落地,依托电力大数据准确刻画乡村生产、生活、生态等发展现状,分析农业产业发展现状及成效,优化乡村基础设施及公共服务资源布局,服务农业农村发展。A、乡村建设B、乡村振兴C、三农政策D、服务农村E、nan答案:B203.下列哪一项在神经网络中引入了非线性?A、随机梯度下降B、修正线性单元(ReLU)C、卷积函数D、以上都不正确E、nan答案:B204.下列描述中不属于数据治理内容的是()A、理解自己的数据B、行为规范的制定C、岗位职责的定义D、获得更多的数据E、nan答案:D205.从电网科技发展战略和国家科技发展战略结合、推进基础支撑技术与电网发展的全面融合的角度来看,国家电网公司提出“需要利用先进计算与()成果,探索先进计算体系及高性能计算技术,研究电力大数据分析挖掘算法、优化策略和可视化展现技术,以及电力大数据仿真、测试与评价技术;开展面向智能电网的各业务领域大数据典型应用。”A、新能源技术B、电网安全与控制技术C、大数据技术D、重点跨领域技术E、nan答案:C206.组织开展公司数据特别是电力数据的()管理研究与应用,确保数据加工、使用行为合法合规。A、分级分类B、安全防护C、运维审计D、数据处理E、nan答案:A207.下列关于数据转换,正确的是()。A、json内的取值只能有统一格式B、pdf文件在不同平台上打开显示不同C、可以通过python将csv文件转换成Excel格式D、excel存储数据的量无限制E、nan答案:C208.下列哪个聚类算法中需要设定半径ε的是()A、K-means算法B、DBSCAN算法C、BIRCH算法D、STING算法E、nan答案:B209.大数据应用是指综合应用公司内部电力生产运行、经营管理、客户服务等业务活动所产生的数据资源,以及获取的外部数据资源,通过(),释放数据资源价值,发现新知识、创造新价值、提升新能力,赋能公司提质增效,支撑行业高质量发展,服务国家治理现代化。A、大云物智移B、数据分析挖掘C、深度学习应用D、数据质量治理E、nan答案:B210.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,以下不属于相关性分析方法的是()。A、Pearson相关系数B、Spearman秩相关系数C、Kendall相关系数D、傅里叶系数E、nan答案:D211.以下关于最大似然估计MLE的说法正确的是A、MLE中加入了模型参数本身的概率分布B、MLE认为模型参数本身概率是不均匀的C、MLE体现了贝叶斯认为参数也是随机变量的观点D、MLE是指找出一组参数,使得模型产生出观测数据的概率最大E、nan答案:D212.下列哪种业务场景中,不能直接使用Reducer充当biner使用()A、sum求和B、max求最大值C、count求计数D、avg求平均E、nan答案:D213.提升卷积核(convolutionalkernel)的大小会显著提升卷积神经网络的性能,这种说法是A、正确的B、错误的C、nanD、nanE、nan答案:B214.如果要将读写位置移动到文件开头,需要使用的命令是()。A、closeB、seek(0)C、truncateD、write('stuff')E、nan答案:B215.在InceptionNet中,使用()和单层的全连接层替换掉了VCG的三层全连接层。A、全局最大池化层B、全局最小池化层C、卷积层D、全局平均池化层E、nan答案:D216.下列哪些不是目前机器学习所面临的问题是()。A、测试集的规模B、维度灾难C、特征工程D、过拟合E、nan答案:A217.预训练模型是指()。A、先训练一个模型作为基准B、在正式训练之前,做一次试验训练C、已经在大数据集上训练好的一个模型D、预先根据任务特点,对模型结构进行调整E、nan答案:C218.下面有关线性判别分析错误的说法是哪个?A、通过对原始的数据进行线性变换,使得不同类的样本尽量分开B、线性变换可以使同类样本的方差变大C、线性变换可以使不同类别样本的距离加大D、提高不同类样本的可分性E、nan答案:B219.现实中往往会遇到“不完整”的训练样本,在这种存在属性变量值未知的情形下,可用(__)。A、边际似然B、EM算法C、贝叶斯决策D、贝叶斯分类器E、nan答案:B220.以下有关国网链平台的说法错误的是()A、以公有链架构为基础B、总体架构为“一主两侧多从”C、为公司各类区块链业务提供安全可信的底层区块链基础设施D、支持电网及上下游企业、外部机构间的信息可信共享与协同共用E、nan答案:A221.公司数据质量管理主要包括()A、数据质量规则管理B、数据质量核查C、数据问题整改与质量评估D、以上都是E、nan答案:D222.数据对外提供应遵守国家有关政策法规和公司管理规定要求,除国家机关依法调取数据外,原则上公司明细业务数据____。A、不对内提供B、不对外提供C、限制提供D、nanE、nan答案:B223.假定在神经网络中的隐藏层中使用激活函数X。在特定神经元给定任意输入,得到输出「-0.0001」。X可能是以下哪一个激活函数?A、ReLUB、tanhC、SIGMOIDD、以上都不是E、nan答案:B224.数据清洗的方法不包括()。A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理E、nan答案:D225.将python中的.py文件转换为.pyc文件的组件为()。A、编辑器B、编译器C、虚拟机D、解释器E、nan答案:B226.假设给定一个长度为n的不完整单词序列,希望预测下一个字母是什么,如输入是predictio(9个字母组成),希望预测第十个字母是什么。适用于解决这个工作的是()。A、循环神经网络B、全连接神经网络C、受限波尔兹曼机D、卷积神经网络E、nan答案:A227.下面关于查看Hive表信息描述正确的是()A、DESC查看表的描述是以建表语句的形式展示的B、SHOWC、TABLD、查看表的描述是以表格的形式展示的E、使用DESC查看表table1:DESF、table1;G、SHOWH、TABLE可以查看表的数据答案:C228.人工智能平台的三种应用模式不包含()A、云模式B、边模式C、端模式D、链模式E、nan答案:D229.()是公司大数据应用工作的归口管理部门。A、互联网部B、信息化部C、数字化工作部D、科技信息部E、nan答案:C230.Hadoop中MapReduce组件擅长处理()场景的计算任务。A、迭代计算B、离线计算C、实时交互计算D、流式计算E、nan答案:B231.《中华人民共和国数据安全法》规定,违反国家核心数据管理制度,危害国家主权、安全和发展利益的,由有关主管部门处()万元以上()万元以下罚款;构成犯罪的,依法追究刑事责任。A、100,200B、200,500C、2,001,000D、5,001,000E、nan答案:C232.至十四五末,公司全面建成企业中台,企业中台公共服务共享使用率达到()A、70%B、80%C、90%D、100%E、nan答案:D233.关于长短时神经网络的叙述中错误的是()。A、引用自循环思想B、产生梯度长时间持续流动的路径C、积累的时间尺度不可以因输入序列而改变D、可应用于语音识别和机器翻译E、nan答案:C234.Keras中想要引入Dropout,每次只让四分之三的神经元参与训练,相应的Python语句是()。A、model.add(Dropout(0.25))B、model.add(Dropout(0.75))C、model.add(Dropout(0.5))D、model.add(Dropout(0.333))E、nan答案:A235.给出如下代码,可以输出“python”的是()s='Pythonisbeautiful!'A、print(s[:–14]);B、print(s[0:6].lower());C、print(s[0:6]);D、print(s[–21:E、nan答案:B236.数据中台是企业级数据能力共享平台。数据通过分层与水平分解,经过汇聚、存储、整合、分析、加工,沉淀公共的数据能力,根据业务场景进行服务封装,形成企业级数据服务,支撑前端应用敏捷迭代和快速构建,实现数据价值共享A、汇聚、存储、整合、分析、加工B、汇聚、整合、分析、存储、加工C、汇聚、整合、分析、加工、存储D、汇聚、存储、整合、分析、加工E、nan答案:A237.下列哪一种情况被称为过学习现象:A、在训练集上A优于B,在测试集上A也优于BB、在训练集上A优于B,在测试集上B优于AC、相对于分类数据集,决策树过于简单D、在训练集上决策树的误差很小E、nan答案:B238.对以下程序描述错误的是()。try:A、改程序对异常处理了,因此一定不会终止程序B、改程序对异常处理了,不一定不会因异常引发终止C、语句块1,如果抛出IndexErrorD、语句块2E、nan答案:A239.构建从公司总部到各级单位协调一致、符合实际的合规管理架构,确保数据在各层级、各单位、各板块之间合法合规流转,推动()共享应用。A、数据融合B、数据治理C、数据统计D、数据维护E、nan答案:A240.卷积核大小是4*4,则其步长不能是()。A、0B、1C、2D、3E、nan答案:A241.在其他条件不变的前提下,以下哪些做法容易引起机器学习中的过拟合问题。A、增加训练集量B、减少神经网络隐藏节点数C、在损失函数中增加正则项D、SVM算法中使用高斯核/RBF核代替核性核E、nan答案:D242.《国家电网公司信息安全与运维管理制度和技术标准》第二条规定计算机病毒防治工作按照“安全第一、预防为主,(),综合防范”的工作原则规范地开展。A、谁主管、谁负责B、谁运营、谁负责C、管理和技术并重D、抓防并举E、nan答案:C243.以下哪个分类方法可以较好地避免样本的不平衡问题()。A、KNNB、SVMC、BayesD、神经网络E、nan答案:A244.下列关于深度学习中优化问题说法错误的是()。A、当优化问题的数值解接近局部最优值时,随着目标函数解的梯度接近或变为零,通过最终迭代获得的数值解可能仅使目标函数局部最优,而不是全局最优B、在深度学习优化问题中,经常遇到的是梯度爆炸或梯度消失C、优化问题中设置的学习率决定目标函数能否收敛到局部最小值,以及何时收敛到最小值D、一般来说,小批量随机梯度下降比随机梯度下降和梯度下降的速度慢,收敛风险较大E、nan答案:D245.LSTM中,(__)的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。A、输入门B、遗忘门C、输出门D、更新门E、nan答案:A246.在下列哪些应用中,可以使用深度学习来解决问题?A、蛋白质结构预测B、化学反应的预测C、外来粒子的检测D、nanE、nan答案:C247.按照公司战略实施要求,立足数据发展需要,以“可管、()、可信”为核心,建立健全数据合规管理体系A、可控B、可查C、可见D、可防E、nan答案:A248.以下代码的输出结果为()。importnumpyasnpa=np.arange(9)b=np.split(a,3)print(b)A、[0B、[array([0,1,2]),array([3,4,5]),array([6,7,8])]C、[array([0,1,2,3]),array([4,5,6]),array([7,8])]D、没有正确答案E、nan答案:B249.Scikit-Learn中StandardScaler是将特征数据的分布调整成(),也就是使得数据的均值为0,方差为1。A、正态分布B、泊松分布C、均匀分布D、二项分布E、nan答案:A250.以下哪种不是Hive支持的数据类型()A、StructB、IntC、MapD、LongE、nan答案:D251.HBase依靠()提供强大的计算能力。A、ZooKeeperB、ChubbyC、RPD、MapReduceE、nan答案:D252.以下哪项工作属于数据应用优化生产运行,提升电网质效。A、优化设备运维策略B、优化能源配置C、提升电网防灾抗灾能力D、优化设备物资供应链E、nan答案:C253.在SQL查询时,使用WHERE子句指出的是(?)A、查询目标B、查询结果C、查询条件D、查询视图E、nan答案:C254.在Adaboost算法的训练过程中,根据每个基分类器的分类结果对其表决权赋予一个权重,下列说法正确的是()A、基分类器错误率越低,表决权重越小B、基分类器错误率越低,表决权越大C、每个基分类器的权重一样大D、所有基分类器的权重都不相同E、nan答案:B255.()管理主要包括数据目录、数据共享需求清单、数据共享负面清单和数据归集管理。A、数据共享B、数据存储C、数据使用D、数据传输E、nan答案:A256.为了提高系统性能,Spark采取“惰性计算模式”,具体为()。A、执行Transformation操作时不会提交,只有执行Action操作时才会被提交到集群中开始被执行B、执行Action操作时不会提交,只有执行Transformation操作时才会被提交到集群中开始被执行C、只有执行完Action操作和Transformation操作时,所有操作才会被提交到集群中开始被执行D、执行完Action操作或Transformation操作时都不会提交到集群E、nan答案:A257.下面哪个程序负责HDFS数据存储()A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNodeE、nan答案:C258.关于DataFrame与RDD在结构上的区别,以下描述错误的是()A、DataFrame可以看作是分布式的Row对象的集合,在二维表数据集的每一列都带有名称和类型。B、RDD是分布式的Java对象的集合C、RDD在转换数据形式时效率相对较高D、DataFrame提供了比RDD更丰富的算子E、nan答案:C259.神经网络模型(NeuralNetwork)因受?类大脑的启发而得名。神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,对输入进行处理后给出一个输出,请问下列关于神经元的描述中,哪一项是正确的?A、每个神经元可以有一个输入和一个输出B、每个神经元可以有多个输入和一个输出C、每个神经元可以有一个输入和多个输出D、上述都正确E、nan答案:D260.以下哪些方法不能用于处理过拟合?A、减少特征维度,防止维灾难B、增大数据的训练量C、利用正则化技术D、增加特征维度E、nan答案:D261.以下选项,不属于程序流程图基本元素的是:A、循环框B、起始框C、判断框D、连接点E、nan答案:A262.互联网数据中心的设立应当远离()干扰。A、110kV以上超高压变电站B、电气化轨道C、医用射频设备D、以上都是E、nan答案:D263.使用pivot_table函数制作透视表时,要用下列()参数设置行分组键。A、datB、valuesC、columnsD、IndexE、nan答案:D264.以下属于浅层学习模型的是()。A、DBNB、CNNC、SVMD、RNNE、nan答案:C265.年度大数据应用需求由()重抽组织开展储备与立项工作。A、数字化部B、财务部C、大数据中心D、发展部E、nan答案:A266.以()为导向,发挥电力数据覆盖广优势,提供智能、精准、高效、便捷的公共服务。A、民生需求B、社会发展C、公共需求D、经济发展E、nan答案:A267.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范,开展权威数据源中台标注,推进权威数据源在中台的落地应用,常态推进()治理。A、数据源头B、数据中台C、业务中台D、数据应用E、nan答案:A268.Hadoop生态系统中,HBase是一种()。A、分布式文件系统B、数据仓庢C、实时分布式数据库D、分布式计算系统E、nan答案:C269.数据产品和服务提供方与使用方应签署相关使用协议,明确约束()等双方权利义务。A、使用范围B、安全规则C、使用规则D、保密规则E、nan答案:C270.鼓励各部门、各单位结合实际应用需求对已发布成果进行适应性改造,避免低水平的重复开发。改造后的成果可按照成果发布流程,重新发布到____。A、数字化能力开放平台B、全业务中台C、公共服务能力平台D、公司门户网站E、nan答案:A271.从安全属性对各种网络攻击进行分类,截获攻击是针对()的攻击。A、机密性B、可用性C、完整性D、真实性E、nan答案:A272.数据活动涉及公司商业秘密、工作秘密的,应该严格执行《国家电网有限公司保密工作管理办法》等有关规定,按照()实行分类管理。A、工作需要B、涉密程度C、归口部门D、数据类型E、nan答案:B273.主成分分析(PCA)降维的步骤为()①保留前N个最大的特征值对应的特征向量;②去除平均值;③计算协方差矩阵;④将特征值排序;⑤协方差矩阵的特征值和特征向量⑥将原始特征转换到上述N个特征向量构建的新空间中,实现特征压缩A、③②⑤④①⑥B、②③⑤④①⑥C、②③⑤①④⑥D、③②⑤①④⑥E、nan答案:B274.?下列关于随机森林和Adaboost说法不正确的是()A、和Adaboost相比,随机森林对错误和离群点更鲁棒B、随机森林准确率不依赖于个体分类器的实例和他们之间的依赖性C、随机森林对每次划分所考虑的属性数很偏感D、Adaboost初始时每个训练元组被赋予相等的权重E、nan答案:B275.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务:()。A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘E、nan答案:C276.对于?连续目标在深度神经网络的优化过程中,下面哪种梯度下降方法是最好的?A、SGDB、AdaGradC、l-BFGSD、拉格朗日松弛SubgradientE、nan答案:D277.语音识别的应用场景包括()A、语音转文本B、语音合成C、人机交互D、以上都对E、nan答案:D278.下列关于RBM说法错误的是(__)。A、学习过程很快B、RBM训练可以看作对一个深层BP网络的网络权值参数的初始化C、RBM不用人工选择特征D、RBM有标签样本集E、nan答案:A279.批规范化(BatchNormalization)的好处都有()?A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种?常有效的反向传播(BP)方法D、这些均不是E、nan答案:A280.为保证数据应用安全,对涉及负面清单敏感数据的共享应用,应采取的措施不包括()A、数据脱敏B、禁止访问C、访问授权D、安全审计E、nan答案:B281.各单位应遵循()原则,优化数据安全防护架构,推进数据保护技术研究与应用,强化数据全生命周期的安全保护。A、“B、“不共享”C、“三同步”D、“两同步”E、nan答案:C282.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()。A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据E、nan答案:B283.使用交叉验证法,我们可以()。A、帮助我们更好的进行模型选择,并在一定程度上减少过拟合B、C、增加模型复杂度D、更好进行特征选择,使得模型效果更好E、nan答案:A解析:减少模型计算量284.大数据时代,数据使用的关键是()。A、数据收集B、数据存储C、数据分析D、数据再利用E、nan答案:D285.运行下面的代码,输出结果是()。importnumpyasnpn=np.array([[1,2,3],[4,5,6]])print(n.size)A、2B、6C、(2,3)D、(3,2)E、nan答案:B286.下列关于凝聚层次聚类技术的描述中,合适的是()。A、抗噪声和异常值B、MAX(全链)聚类中合并距离最远的两个簇C、两个簇合并后,只保留一个簇D、没有可以直接最小化的目标函数E、nan答案:D287.以下关于traintestsplit函数的说法正确的是()。A、train_test_splitB、train_test_split的输入
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度园林绿化设计与施工合同
- 2024年度店铺货架租赁与销售分成合同
- 2024年度房屋买卖合同标的、房屋位置、房屋面积及房屋价格详细规定
- 衣帽架市场需求与消费特点分析
- 2024年度国际集装箱运输服务合同
- 2024年度影视版权转让合同:标的为电视剧版权交易
- 天线用滤波器市场发展现状调查及供需格局分析预测报告
- 2024年度版权转让合同详细内容
- 2024年度物流行业大数据分析与应用合作合同
- 2024年度教育设备采购与技术支持合同
- 《OperationsManagement》课程实施方案(教学大纲)
- 癫痫临床表现及护理课件
- 工程造价控制形考4参考答案
- 四年级上册英语试题Module 8 练习(含答案)外研版(一起)
- 新北师大版七年级下册英语(全册知识点语法考点梳理、重点题型分类巩固练习)(家教、补习、复习用)
- Unit 6 Longji Rice Terraces课件-外研版高中英语必修第一册
- 福建师范大学《计算机应用基础》3答卷答案
- 2021 国家开放大学《经济学基础》形考任务1-4
- 小儿支气管肺炎概述-PPT课件
- (完整ppt)隧道施工方法课件
- 发电机定冷水系统中铜含量异常处理及原因分析
评论
0/150
提交评论