版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE12023年能源大数据应用开发技能竞赛备考试题库汇总-上(单选题部分)一、单选题1.DataWorks中不同角色拥有不同的权限,可以通过角色授权来控制成员的操作权限。角色主要有组织管理员、项目管理员、开发员、防客等,其中开发角色不具备什么权限。A、添加项目成员B、新建任务C、新建函数D、上传资源答案:A2.下列属于无监督学习的是()。A、K-meansB、SVMC、最大熵D、CRF答案:A3.关于岭回归,下列说法错误的是()。A、属于线性回归B、使用L2正规项C、使用L1正规项D、基于最小二乘法答案:C4.以下哪个分类方法可以较好地避免样本的不平衡问题()。A、KNNB、SVMC、BayesD、神经网络答案:A5.MapReduce默认的分区函数是()。A、hashB、diskC、reduceD、map答案:A6.关于SOM神经网络描述错误的是:(__)。A、一种竞争学习型的无监督神经网络B、将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构C、SOM寻优目标为每个输出神经元找到合适的权重D、输出层神经元以矩阵方式排列在二维空间答案:C7.下面关于展示数据管理说法不正确的是()A、大厅场景数据应基于数据中台统一获取B、建立大厅数据质量常态巡检核查机制C、不得违规存储、处理涉及敏感数据。D、历史数据需要删除答案:D8.下面关于k近邻学习算法的说法,正确的是()。A、k近邻可以用于分类,但是不能用于回归B、k近邻属于“急切学习”C、k近邻用于分类时,对于新的样本,计算离其最近的k个样本的平均值,作为新样本的预测值D、k近邻用于分类时,对于新的样本,根据其k个最近邻样本的类别,通过多数表决的方式预测新样本的类别答案:D9.下列关于网络用户行为的说法中,错误的是()。A、网络公司能够捕捉到用户在其网站上的所有行为B、用户离散的交互痕迹能够为企业提升服务质量提供参考C、数字轨迹用完即自动删除D、用户的隐私安全很难得以规范保护答案:C10.下列关于LSTM的说法,错误的是()。A、LSTM中存在Sigmoid函数B、LSTM中存在tanh函数C、LSTM又称长短时记忆网络D、RNN是LSTM的变种答案:D11.如果要将读写位置移动到文件开头,需要使用的命令是()。A、closeB、seek(0)C、truncateD、write('stuff')答案:B12.服务(),提供多模式电力交易大数据分析服务,开展电力交易市场化配置和风险预警数据应用,提高交易辅助决策和资源优化配置能力。A、电力供用电市场B、电力客户C、电力市场用户D、电力资源市场化配置答案:D13.提供能源()服务,提升上下游企业和能源生态圈的大数据运营服务能力。A、大数据增值B、支撑C、运营D、分析答案:A14.深度学习防止过拟合下列说法正确的是A、BN(批归一化)B、增强数据集样本数目、做一些数据增强的操作C、限制模型的学习能力D、以上都可以答案:D15.()是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。A、预处理B、特征抽取和选择C、分类器设计D、分类决策答案:C16.构建一个神经网络,将前一层的输出和它自身作为输入,下列哪一种架构有反馈连接A、循环神经网络B、卷积神经网络C、限制玻尔兹曼机D、都不是答案:A17.对于一个图像识别问题(在一张照片里找出一只猫),下面哪种神经网络可以更好地解决这个问题()A、循环神经网络B、感知机C、多层感知机D、卷积神经网络答案:D18.下面算法中属于图像锐化处理的是()。A、低通滤波B、加权平均法C、高通滤波D、中值滤波答案:C19.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗?A、能B、依情况而定C、不一定D、不能答案:D20.Hadoop中MapReduce组件擅长处理()场景的计算任务。A、迭代计算B、离线计算C、实时交互计算D、流式计算答案:B21.设X={1,2,3}是频繁项集,则可由X产生()个关联规则?A、4B、5C、6D、7答案:C22.开展数据产品研发、发布等活动时,应确保遵从国家法律法规、数据主体授权范围、公司相关规章制度等()保护要求。A、数据使用B、数据研发C、数据交换D、数据安全答案:D23.如果对样本分类,不可以选择的方法是(?)A、层次聚类法B、K-均值聚类法C、两步聚类法D、混合聚类法答案:D24.随机森林中的随机是指()A、随便构建树模B、随机选择一个树模型C、随机选择多个树模型D、在构建每个树模型时随机选择样本和特征答案:D25.CREATETABLEAS创建表,后面需要添加查询语句类型是:()。A、INSERTB、UPDATEC、SELECTD、DELETE答案:C26.下面哪个操作肯定是宽依赖()A、mapB、flatMapC、reduceByKeyD、sample答案:C27.下面关于Hive四种排序方式的区别,描述正确的是()A、orderB、sortC、distributeD、cluster答案:B28.?时间序列数据更适合用()做数据规约。A、小波变换B、主成分分析C、决策树D、直方图答案:A29.HDFS集群中的namenode职责不包括()A、维护HDFS集群的目录树结构B、维护HDFS集群的所有数据块的分布、副本数和负载均衡C、负责保存客户端上传的数据D、响应客户端的所有读写数据请求答案:C30.批规范化(BatchNormalization)的好处都有什么A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是答案:A31.下列关于循环神经网络说法错误的是()。A、长短期记忆网络是进行优化过后的循环神经网络B、RNN是一类可用于处理序列数据的神经网络C、循环神经网络广泛应用于自然语言处理领域,例如语音识别、语言建模和机器翻译等D、LSTM引入了一个基于循环神经网络(RNN)的架构后,梯度消失问题得以解决答案:D32.以下不属于神经网络模型的是()A、DNNB、CNNC、KNND、RNN答案:C33.在MapReduce中,reduce()函数可以将()值相同的输入进行合并处理。A、inputB、keyC、valueD、number答案:B34.下列属于中台发展期的战略为A、“中台战略”B、“双中台”C、“多中台”D、“融合中台”答案:C35.依据(),建立基于负面清单的公司对内数据共享机制,坚持“以共享为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、《中华人民共和国民法典》B、《中华人民共和国网络安全法》C、《国家电网有限公司数据管理办法》D、《中央企业商业秘密保护暂行规定》答案:C36.下列哪个用于说明在RDD上执行何种计算()。A、分区;B、算子;C、日志;D、数据块;答案:B37.pandas的常用类不包括()。A、SeriesB、DataFrameC、PanelD、Index答案:C38.企业中台不包含()A、业务中台B、数据中台C、技术中台D、服务中台答案:D39.Ndarray是一个通用的()数据容器A、单维同类B、单维多类C、多维同类D、多维多类答案:C40.MapReduce计算框架的输人数据结构是()。A、key-valueB、input-outputC、map-reduceD、key-column答案:A41.Relief的扩展变体Relief-F能够处理(__)问题。A、二分类B、多分类C、回归D、降维答案:B42.某公司要建立资料库,该资料库要用ElasticSearch进行检索,请问下列哪些选项可以放到资料库中?A、Word文档B、公司宣传视频C、产品设计图D、以上全部正确答案:D43.Maxpute中负责对等待提交的task进行排序的模块是:()。A、schedulerB、controllerC、executorD、worker答案:A44.当我们需要在一张图表中特意指出某个特殊点,并加上标注达到醒目的目的时,需要用到(__)函数。A、plt.axvspan()B、plt.axhspan()C、plt.annotate()D、plt.text()答案:C45.()方面,研究基于大数据的电能质量和计量数据分析技术,建立典型用电设备电能质量信息库、指标体系和大数据分析平台,提供电能质量辅助决策分析服务;A、电测量技术B、大数据测量技术C、电能技术D、用电技术答案:A46.以下算法中不属于基于深度学习的图像分割算法是()。A、FCNB、deeplabC、Mask-RCNND、kNN答案:D47.数据仓库仅仅是提供存储的,提供一种()的服务,不面向最终分析用户:而数据集市是()的,面向最终用户。A、面向数据管理、面向分析应用B、面向分析应用、面向数据管理C、面向分析应用、面向事务交互D、面向事务交互、面向数据管理答案:A48.在反向传播的过程中,首先被计算的是变量()的梯度,之后将其反向传播。A、连接权重B、损失函数C、激活函数D、特征映射答案:C49.关于神经网络中经典使用的优化器,以下说法正确的是?A、Adam的收敛速度比RMSprop慢B、相比于SGD或RMSprop等优化器,Adam的收敛效果是最好的C、对于轻量级神经网络,使用Adam比使用RMSprop更合适D、相比于Adam或RMSprop等优化器,SGD的收敛效果是最好的答案:D50.在MapReduce中,哪个组件是用户不指定也不会有默认的()A、binerB、OutputFormatC、PartitionerD、InputFormat答案:A51.下列关于数据转换,正确的是()。A、json内的取值只能有统一格式B、pdf文件在不同平台上打开显示不同C、可以通过python将csv文件转换成Excel格式D、excel存储数据的量无限制答案:C52.加强数据合规管理顶层设计,强化跨专业、跨层级统筹协调,建立健全()工作机制,确保公司数据合规管理工作有力、有序、有效推进。A、闭环B、协同C、安全D、监控答案:B53.2*1的数组与1*3的数组相加结果为()。A、2*3的数组B、1*1的数组C、3*2的数组D、以上都不对答案:A54.感知机中,()是M-P神经元,也称为阈值逻辑单元。A、输入层B、输出层C、第一层D、第二层答案:B55.深度学习中的“深度”是指()。A、计算机理解深度B、中间神经元网络的层次很多C、计算机的求解更加精确D、计算机对问题的处理更加灵活答案:B56.在《国家电网公司“十三五”科技战略研究报告》中指出,十二五期间“先进计算与电力大数据技术取得良好开端”,主要体现在:在()及专业应用实现基础上,探索了大数据平台基础体系架构与应用规范A、技术中台B、公司一体化信息平台C、公司统一管理平台D、数据中台答案:B57.神经网络的训练结果模型不包括()。A、权重矩阵B、偏置参数C、超参数D、计算图答案:C58.做好数据识别和分类分级,通过数据盘点理清数据状况,建立数据目录,以数据目录为基础梳理形成数据共享()A、白名单B、分级目录C、备忘录D、负面清单答案:D59.卷积神经网络可以对一个输入进行多种变换(旋转、平移、缩放),这个表述正确吗()A、对的B、不知道C、看情况D、不对答案:D60.下列关于运算符优先级的说法不正确的是()A、运算符按照优先级顺序表进行运算B、同一优先级的运算符在表达式中都是按照从左到右的顺序进行运算的C、同一优先级的运算符在表达式中都是按照从右到左的顺序进行运算的D、括号可以改变运算的优先次序答案:C61.Spark核心层主要关注()问题。A、存储B、计算C、传输D、连接答案:B62.Maxpute架构由四层组成,每一层完成不同的工作。现在执行命令“selectcount(*)fromtable_a”,最终由()处理该命令并返回结果。A、计算层B、客户端C、接入层D、逻辑层答案:A63.()是公司大数据应用工作的归口管理部门。A、互联网部B、信息化部C、数字化工作部D、科技信息部答案:C64.下列哪个不是专门用于可视化时间空间数据的技术:()。A、等高线图B、饼图C、曲面图D、矢量场图答案:B65.回归问题和分类问题的区别是什么?A、回归问题与分类问题在输入属性值上要求不同B、回归问题有标签,分类问题没有C、回归问题输出值是连续的,分类问题输出值是离散的D、回归问题输出值是离散的,分类问题输出值是连续的答案:C66.自然语言处理、语音识别、股票交易、气象预测等应用适合采用(__)处理。A、循环神经网络B、卷积神经网络C、多层神经网络D、单层神经网络答案:A67.用onehot对某个只有一个属性的样本进行编码,下面可能是编码结果的是()。A、1010B、1100C、1111D、1000答案:D68.有监督的学习和无监督的学习的根本区别在于:A、学习过程是否需要人工干预B、学习样本是否需要人工标记C、学习结果是否需要人工解释D、学习参数是否需要人工设置答案:B69.给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个样本的信息来进行预测。这种学习算法称为(__)。A、k-meansB、k近邻学习C、随机森林D、决策树答案:B70.以下哪个是有关数据科学研究目的的原则?()A、DIKUW原则B、5W1H原则C、6S原则D、PDCA原则答案:A71.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经网络下一层所接收到的数据维度是多少A、218x218x5B、217x217x8C、217x217x3D、220x220x5答案:A72.下面哪个色彩空间最接近人的视觉系统的特点()。A、RGB空间B、CMY空间C、CMYK空间D、HSI空间答案:D73.下列()不是神经网络的代表。A、卷积神经网络B、递归神经网络C、残差网络D、xgboost算法答案:D74.()可以使神经网络模型拟合复杂函数的能力增加。A、隐藏层层数增加B、Dropout比例增加C、增大学习率D、增加训练轮数答案:A75.()是TensorFlow的核心数据单位。A、张量B、向量C、矩阵D、数组答案:A76.卷积神经网络中池化层的作用是()。A、降低卷积层对位置的敏感性,同时降低对空间降采样表示的敏感性B、权值初始化C、对图像实现边缘检测D、提取输入的不同特征答案:A77.以下表名不符合数据中台分析层命名规范的是()。A、dim_cst_cust_dfB、dim_cst_custC、dws_cst_cust_dfD、dwd_cst_cust答案:D78.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范,开展权威数据源中台标注,推进权威数据源在中台的落地应用,常态推进()治理。A、数据源头B、数据中台C、业务中台D、数据应用答案:A79.相关关系是一种与函数关系区别的非确定性关系,而相关分析就是研究事物或现象之间是否存在这种非确定性关系的统计方法,以下不属于相关性分析方法的是()。A、Pearson相关系数B、Spearman秩相关系数C、Kendall相关系数D、傅里叶系数答案:D80.假设给定一个长度为n的不完整单词序列,希望预测下一个字母是什么,如输入是predictio(9个字母组成),希望预测第十个字母是什么。适用于解决这个工作的是()。A、循环神经网络B、全连接神经网络C、受限波尔兹曼机D、卷积神经网络答案:A81.以下哪种方法可以将json字符串转换为Python形式()。A、read_jsonB、json.transC、json.loadsD、json.dumps答案:C82.下面关于循环神经网络说法错误的是()A、循环神经网络用于静态输出B、循环神经网络通过使用带自反馈的神经元,能够处理任意长度的时序数据C、循环神经网络具有短期记忆能力,相当于存储装置,因此其计算能力十分强大D、循环神经网络时间扩展,神经元与多个时间输出计算答案:A83.预训练模型是指()。A、先训练一个模型作为基准B、在正式训练之前,做一次试验训练C、已经在大数据集上训练好的一个模型D、预先根据任务特点,对模型结构进行调整答案:C84.国网公司数据管理坚持()的原则。A、面向专业B、面向基层C、面向应用D、面向专业、面向基层、面向应用答案:D85.卷积神经网络的结构不包括()。A、池化层B、卷积层C、激活层D、全连接层答案:C86.混淆矩阵中的TP=16,FP=12,FN=8,TN=4,准确率是()。A、1212122023年1月4日B、1212122023年1月2日C、1212122023年4月7日D、1212122023年1月7日答案:B87.通常“落伍者”是影响MapReduce总执行时间的主要影响因素之一,为此MapReduce采用()机制来解决。A、分布式计算B、惰性计算C、推测性执行的任务备份D、先进先出答案:C88.长短时记忆网络属于一种()。A、全连接神经网络B、门控RNNC、BP神经网络D、双向RNN答案:B89.k近邻学习是一种(__)。A、监督学习方法B、半监督学习方法C、无监督学习方法D、测试方法答案:A90.综合类大数据应用管理,主要包括(),由互联网部统一组织开展。A、应用需求B、分析应用C、成果管理D、以上都是答案:D91.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经网络下一层所接收到的数据维度是多少()A、218x218x5B、217x217x8C、217x217x3D、220x220x5答案:A92.根据国家电网互联[2020]745号《国家电网有限公司关于进一步规范数据安全工作的通知》,以下说法错误的是()。A、商业秘密、工作秘密、个人信息等纳入负面清单的数据,由数据使用方提出申请,经数据产生的总部业务部门和数据归口管理部门审批后方可对内跨部门、跨单位给数据使用方使用。B、公司对外提供数据时,应根据有关要求,执行标准统一的数据开放策略。C、涉密数据按照公司保密规章制度执行,严格履行相关保密合规审核流程。D、除国家机关依法调取数据外,原则上公司明细业务数据不对外提供。答案:B93.优化(),建立设备绩效和供应商业绩之间的关联关系,实现设备质量评价管理闭环,建立健全供应商信用风险评估体系,优化采购模式与供应商管理。A、设备质量监管B、设备物资供应链C、设备供应商管理D、设备质量评价管理答案:B94.安全巡检属于信息系统安全过程管理的()阶段。A、运行B、测试C、科研D、上线答案:A95.如果增加神经网络的宽度,精确度会增加到一个阈值,然后开始降低。造成这一现象的原因可能是()。A、只有一部分核被用于预测B、当核数量增加,神经网络的预测能力降低C、当核数量增加,其相关性增加,导致过拟合D、以上都不对答案:C96.关于Python的全局变量和局部变量,以下选项中描述错误的是()A、使用global保留字声明简单数据类型变量后,该变量作为全局变量使用B、局部变量指在函数内部使用的变量,当函数退出时,变量依然存在,下次函数调用可以继续使用C、简单数据类型变量无论是否与全局变量重名,仅在函数内部创建和使用,函数退出后变量被释放D、全局变量指在函数之外定义的变量,一般没有缩进,在程序执行全过程有效答案:B97.基于词的n元文法模型,其最后的粗分结果集合大小()N。A、大于B、大于等于C、小于D、小于等于答案:B98.对于依托公共服务能力平台开发的大数据应用,应遵循平台有关规范,重点开展____、数据建模以及数据展示等工作,安全防护、三方测试等相关要求统一纳入公共服务能力平台进行管理,可不再单独开展。A、数据查询B、数据清洗C、数据分类D、数据溯源答案:D99.决策树中的叶结点对应于(__)。A、属性B、样本C、决策结果D、标签值答案:C100.依据《国家电网有限公司数据管理办法》,建立基于负面清单的公司对内数据共享机制,坚持“以()为原则、不共享为例外”,改变当前“一事一议”、层层审批的数据应用授权方式。A、共享B、共建C、共通D、共赢答案:A101.数据安全,是指通过采取必要措施,确保数据处于有效保护和()的状态,以及具备保障持续安全状态的能力。A、合法利用B、合法获取C、规范使用D、安全传输答案:A102.加强数据传输、存储过程中的安全管理,釆取加密、隔离、备份等安全技术手段,确保符合相应安全条件或技术标准,具备()能力,防范数据泄露、篡改、损毁、丟失风险。A、共享B、灾备C、安全D、保护答案:B103.神经网络训练过程中,一般会遇到停滞期,即神经网络在进入全局最小值之前陷入局部最小值。以下哪个策略可以避免上述情况?A、增加参数数量B、减少参数数量C、在开始时将学习率降低10倍D、改变几个时期的学习率答案:D104.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗A、可以B、不好说C、不一定D、不能答案:D105.LSTM网络引入门控机制来控制信息传递的路径,其中输入门的作用是()A、控制上一个时刻的内部状态需要遗忘多少信息B、控制上一个时刻的内部状态有多少信息需要保存C、控制当前当刻的候选状态有多少信息需要保存D、控制当前当刻的内部状态有多少信息需要输出给外部状态答案:C106.下列关于深度学习中优化问题说法错误的是()。A、当优化问题的数值解接近局部最优值时,随着目标函数解的梯度接近或变为零,通过最终迭代获得的数值解可能仅使目标函数局部最优,而不是全局最优B、在深度学习优化问题中,经常遇到的是梯度爆炸或梯度消失C、优化问题中设置的学习率决定目标函数能否收敛到局部最小值,以及何时收敛到最小值D、一般来说,小批量随机梯度下降比随机梯度下降和梯度下降的速度慢,收敛风险较大答案:D107.可视分析学是一门以可视交互为基础,综合运用()、数据挖掘和人机交互等技术等多个学科领域的知识。A、图像学B、人工智能C、分析学D、图形学答案:A108.严格遵守囯家法律、法规和公司相关规定,在保护国家秘密和企业秘密,且不损害公司及客户、供应商等相关方权益的前提下,有序推动数据对外幵放,重点防范对外幵放过程中的()数据泄露。A、明细B、业务C、敏感D、隐私答案:C109.电力线和信号线应分别敷设在()、()或桥架内,走线应整齐美观安全。A、走线架B、强电线槽,弱电线槽C、弱电线槽,强电线槽D、槽钢答案:B110.年度大数据应用需求由()重抽组织开展储备与立项工作。A、数字化部B、财务部C、大数据中心D、发展部答案:A111.总部与各单位按两级贯通模式部署,并支持()成果共享。A、一级B、两级C、三级D、四级答案:B112.下面哪个属于映射数据到新的空间的方法?A、傅立叶变换B、特征加权C、渐进抽样D、维归约答案:A113.数据清洗的方法不包括()。A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理答案:D114.构建()客户画像,设计全网客户标签体系,形成客户标签库,全面及时分析客户行为活动,深度提炼客户行为特征规律,实现客户行为动态画像。A、全量B、多维动态C、全方面D、多维答案:B115.在InceptionNet中,使用()和单层的全连接层替换掉了VCG的三层全连接层。A、全局最大池化层B、全局最小池化层C、卷积层D、全局平均池化层答案:D116.在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的____之和最小。A、欧式距离B、城市距离C、余弦距离D、马氏距离答案:A117.在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用最大相似度估计进行度量,对于一些低频词,无论如何扩大训练数据,出现的频度仍然很低,下列哪种方法可以解决这一问题A、一元切分B、一元文法C、数据平滑D、N元文法答案:C118.按照数据全生命周期安全合规思路,做好数据()顶层设计,统筹推进数据合规管理体系建设,强化数据合规风险管控,促进公司数字化转型发展,为建设具有中国特色国际领先的能源互联网企业作出积极贡献。A、模型建设B、安全管理C、数据规划D、合规管理答案:D119.假设已经建立了一个神经网络,决定将权重和偏差初始化为零。以下哪项陈述是正确的?A、第一隐藏层中的每个神经元将执行相同的计算。因此,即使在梯度下降的多次迭代之后,层中的每个神经元将执行与其他神经元相同的计算。B、第一隐层中的每个神经元在第一次迭代中执行相同的计算。但是在梯度下降的一次迭代之后,他们将学会计算不同的东西,因为已经“破坏了对称性”。C、第一个隐藏层中的每个神经元将执行相同的计算,但不同层中的神经元执行不同的计算,因此完成了课堂上所描述的“对称性破坏”。D、即使在第一次迭代中,第一个隐藏层的神经元也会执行不同的计算,因此,它们的参数会以自己的方式不断演化答案:A120.关于pandas库的文本操作,下列说法错误的是()。A、Replace方法用于替换字符串B、Slice方法不是通过截取字符实现文本索引操作的C、Upper方法可将Series各元素转换为大写D、存在一些特殊的方法是Python原生str类型所没有的答案:B121.回溯“深度学习”领域的学术脉络,2017年-2020年间研究量最多的主题是A、特征提取B、卷积神经网络C、人工智能D、迁移学习答案:B122.从网络的原理上来看,结构最复杂的神经网络是()。A、卷积神经网络B、长短时记忆神经网络C、GRUD、BP答案:B123.为了提高系统性能,Spark采取“惰性计算模式”,具体为()。A、执行Transformation操作时不会提交,只有执行Action操作时才会被提交到集群中开始被执行B、执行Action操作时不会提交,只有执行Transformation操作时才会被提交到集群中开始被执行C、只有执行完Action操作和Transformation操作时,所有操作才会被提交到集群中开始被执行D、执行完Action操作或Transformation操作时都不会提交到集群答案:A124.从内外部环境与市场需求来看,以下哪一项不是大数据应用的业务规划将聚焦核心领域。A、电网运营B、经营管理C、客户服务D、科技创新答案:D125.智能电网综合支撑技术,在()的智能电网管理及运维关键技术中,应用大数据和先进计算技术,研究电网设备状态信息集成与综合分析技术;A、分布节能B、高效节能C、集约高效D、分布高效答案:C126.长短时记忆神经网络被设计用来解决什么问题?()A、传统RNN存在的梯度消失/爆炸问题B、传统RNN计算量大的问题C、传统RNN速度较慢的问题D、传统RNN容易过过拟合的问题答案:A127.关于LDA和PCA的描述,下列说法中错误的是?A、PCA是无监督的,LDA是有监督的B、LDA最多可以降到k-2维C、LDA可能会过拟合数据D、PCA是去掉原始数据冗余的维度,LDA是选择一个最佳的投影方向,使得投影后相同类别的数据分布紧凑,不同类别的数据尽量相互远离答案:B128.负责关键信息基础设施安全保护工作的部门,应当建立健全本行业、本领域的网络安全监测预警和(),并按照规定报送网络安全监测预警信息。A、网络安全风控机制B、信息通报制度C、网络安全风险库D、信息预警制度答案:B129.数据中台建立数据安全传输机制,根据数据保护需求,实现两级数据中台之间、与()之间的安全传输。A、外部用户B、内部用户C、全部用户D、指定用户答案:A130.a=[1,2,3.4,5],切片时如果需要取[2,3.4],则下列结果正确的是()A、a[1:4]B、a[-2:]C、a[1:-1]D、a[::2]答案:C131.数据中台由()、()、()、()、()五大板块组成,采用总部和省市公司两级部署模式构建。A、贴源层、共享层、分析层、统一数据服务调度和数据B、贴源层、应用层、分析层、统一数据服务调度和数据C、服务层、共享层、应用层、统一数据服务调度和数据D、服务层、共享层、分析层、统一数据服务调度和数据答案:A132.神经网络感知机只有()神经元进行激活函数处理,即只拥有一层功能神经元。A、输出层B、输入层C、感知层D、网络层答案:A133.为保障大数据应用的快速开发和敏捷迭代,按照依托()两种类型实施差异化管控。A、共享平台开发和独立开发B、共享平台开发和个人开发C、公共服务能力平台开发和独立开发D、公共服务能力平台开发和个人开发答案:C134.《中华人民共和国数据安全法》中的数据,是指任何以电子或者其他方式对()的记录。A、数据B、信息C、文件D、知识答案:B135.Transformer架构首先是由下列哪项引入的?A、GloVeB、BERTC、OpenD、ULMFit答案:C136.plt.contourf(X,Y,f(X,Y),8,alpha=.75,cmap=plt.cm.hot),cmap表示()。A、图例风格B、颜色映射风格C、网格线类型D、透明度答案:B137.建立与政府主管部门、行业协会、专家学者的有效沟通机制,组织各级单位积极参与《数据安全法》、《》等国家、地方和行业数据相关法律法规。A、《个人信息保护法》B、《网络安全法》C、《保守国家秘密法》D、《网络产品和服务安全审查办法(试行)》答案:A138.在Apriori算法中,候选项集划分为不同的桶,存放在()中。A、字典B、集合C、Hash树D、列表答案:C139.多分类图像识别任务常采用()作为输出的编码方式。A、二进制编码B、one-hot编码C、霍夫曼编码D、曼切斯特编码答案:B140.关于下面代码的描述,错误的是n=1deffunc(a,b):c=a*breturncs=func(Hello,2)print(c)A、打印输出字符串:HelloHello$运行结果是出错,出错类型是NameError:|运行结果是出错,出错类型是NameError:|c是一个局部变量|n是一个全局变量B、运行结果是出错,出错类型是NameError:C、c是一个局部变量D、n是一个全局变量答案:A141.假设有100,000张带标签的图片是使用汽车的前置摄像头拍摄的,这也是模型训练的数据分布,如果可以从互联网上获得更大的数据集,即使互联网数据的分布不相同,这也可能对训练有所帮助。在刚刚开始着手这个项目,要做的第一件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。A、花几天时间去获取互联网的数据,这样就能更好地了解哪些数据是可用的。B、花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估计。C、花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间可收集多少数据。D、花几天时间训练一个基本模型,看看它会犯什么错误答案:D142.数据质量的基本属性不包括()A、正确性B、时效性C、一致性D、完整性答案:B143.下列关于长短时神经网络的叙述错误的是()。A、引用自循环思想B、产生梯度长时间持续流动的路径C、积累的时间尺度不可以因输入序列而改变D、可应用于语音识别和机器翻译答案:C144.长短时记忆神经网络通过什么来缓解梯度消失问题()A、增加网络深度B、减少网络神经元C、使用双向的网络结构D、增加一个用来保存长期状态的单元答案:D145.创建RDS实例后,您需要设置RDS实例的白名单,以允许()设备访问该RDS实例。A、外部B、内部C、任意D、非安全答案:A146.在池化中,当步长小于卷积核的大小时会称为重叠池化。与非重叠池化相比,下面哪个不是重叠池化的优点?()A、损失信息少B、获得的图像特征更丰富C、提高卷积神经网络的正确率D、减少计算量答案:D147.按照《关于进一步加强公司数据安全的通知》,应严格电网省侧和经营管理数据对外发布共享。遵循()的原则,确保生产经营数据及分析结果数据不出网(管理信息大区和生产控制大区)、不触媒。A、以共享为原则、不共享为例外B、最小化授权C、明细业务数据不出中台D、谁主管谁负责,谁使用谁负责答案:C148.以下属于Python脚本程序转变为可执行程序的第三方库的是:A、requestsB、pyinstallerC、numpyD、scrapy答案:B149.使用copy模块深拷贝的方法为()。A、copy()B、deepcopy.copy()C、copy.deepcopy()D、deepcopy.deepcopy()答案:C150.考虑值集{12243324556826}的四分位数极差是()。A、21B、24C、55D、3答案:A151.一般将原始业务数据分为多个部分,用于构建模型的是()A、训练集B、测试集C、验证集D、全部数据答案:A152.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择?A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法答案:B153.大数据应用承建单位应基于项目建设方案编制实施方案不包括A、数据溯源B、数据申请C、数据需求调研D、数据建模答案:C154.在情感分析任务中,其目的是将无结构化的情感文本转化成计算机容易识别和处理的结构化文本,进而供情感分析上层的研究和应用服务的是()A、情感信息检索B、情感信息抽取C、情感信息分类D、情感信息归纳答案:B155.对于神经网络的说法,下面正确的是:(__)。1.增加神经网络层数,可能会增加测试数据集的分类错误率2.减少神经网络层数,总是能减小测试数据集的分类错误率3.增加神经网络层数,总是能减小训练数据集的分类错误率A、1B、1、3C、1、2D、2答案:A156.Hive的数据最终存储在()A、HDFSB、HBaseC、RDBMSD、Metastore答案:A157.通过数据资产核查及可视化的建设,可以帮助公司合理评估、规范高效的管控公司数据资产信息,又可以挖掘和发挥数据资产价值并促进持续增值,推动公司向()管理转型。A、数据质量B、数据治理C、数据分析D、数据驱动答案:D158.下列关于凝聚层次聚类技术的描述中,合适的是()。A、抗噪声和异常值B、MAX(全链)聚类中合并距离最远的两个簇C、两个簇合并后,只保留一个簇D、没有可以直接最小化的目标函数答案:D159.下列哪些不是目前机器学习所面临的问题是()。A、测试集的规模B、维度灾难C、特征工程D、过拟合答案:A160.网络运营者发布、共享、交易或向境外提供重要数据前,应当评估可能带来的安全风险,并报经()部门同意A、安全监察B、上级主管C、工业和信息化D、行业主管监督答案:D161.MapReduce任务map输出结果将被写入()。A、HDFS文件系统B、新的记录文件C、磁盘(Linux文件系统)D、主数据库答案:C162.HBase是一种可伸缩、高可靠、高性能、分布式和面向()的动态模式数据库。A、列B、行C、行和列D、元组答案:A163.LSTM的3个门分别是()。A、遗忘门、输入门、输出门B、输入门、更新门、输出门C、输入门、重置门、遗忘门D、遗忘门、更新门、输出门答案:A164.数据中台提供统一的身份认证和操作鉴权能力,确保在数据传输、存储、访问过程中的数据安全;提供数据访问权限控制、保护业务核心数据、防止()能力。A、数据泄露B、数据错乱C、数据分散D、数据无效答案:A165.下面哪一个主流任务没有用到卷积层A、中英文互译B、场景文字检测C、为图像自动生成标题D、中文分词答案:D166.假如你使用YOLO算法,使用19x19格子来检测20个分类,使用5个锚框(anchorbox)。在训练的过程中,对于每个图像你需要输出卷积后的结果y作为神经网络目标值(这是最后一层),y可能包括一些“?”或者“不关心的值”。请问最后的输出维度是多少。A、19x19x(25x20)B、19x19x(20x25)C、19x19x(5x25)D、19x19x(5x20)答案:C167.MapReduce计算框架的输入是()数据结构。A、key-valueB、input-outputC、map-reduceD、key-column答案:A168.资产评估应用实现全链路的数据资产监管和价值追踪,具体包括资产使用评估、()评估和敏感数据评估等功能。A、资产使用评估B、资产价值C、敏感数据评估D、数据质量评估答案:B169.MapReduce任务map输出结果将被写入()。A、HDFS文件系统B、新的记录文件C、磁盘(Linux文件系统)D、主数据库答案:C170.将合规管理要求全面嵌入公司数据活动,在各领域、各环节确定合规管理重点,覆盖(),促进公司数据活动全面合规。A、数据生产B、数据全生命周期C、数据存储D、数据销毁答案:B171.以下哪项工作属于数据应用优化生产运行,提升电网质效。A、优化设备运维策略B、优化能源配置C、提升电网防灾抗灾能力D、优化设备物资供应链答案:C172.下列关于神经网络结构的权重共享现象的描述正确的是()。A、只有全连接神经网络会出现B、只有卷积神经网络(CNN)会出现C、只有循环神经网络(RNN)会出现D、卷积神经网络和循环神经网络都会出现答案:D173.下列关于随机森林和GBDT的书法正确的是()A、在随机森林的单个树中,树和树之间是有依赖的,而GBDT中的单个树之间是没有依赖的B、这两个模型都使用随机特征子集,来生成许多单个的树C、我们可以并行地生成GBDT单个树,因为它们之间是没有依赖的D、GBDT训练模型的表现总是比随机森林好答案:B174.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、大数据应用项目B、数字化项目C、信息化项目D、数据研发项目答案:B175.健全数据合规管理体系,落实管理职责,强化横向协调和纵向指导,突出事前防范和过程管控,加强违规事件应对处置,严格管控()。A、数据安全风险B、信息安全风险C、数据合规风险D、数据泄露风险答案:C176.每?个神经元都有输入、处理函数和输出。神经元组合起来形成了网络,可以拟合任何函数。为了得到最佳的神经网络,我们用梯度下降方法不断更新模型给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?A、加?更多层,使神经网络的深度增加B、有维度更高的数据C、当这是一个图形识别的问题时D、以上都不正确答案:A177.ODPS-SQL进行操作连接表的关键字错误的是()A、leftB、rightC、outerD、inner答案:C178.下列描述中不属于数据治理内容的是()A、理解自己的数据B、行为规范的制定C、岗位职责的定义D、获得更多的数据答案:D179.下列哪项关于模型能力(modelcapacity指神经网络模型能拟合复杂函数的能力)的描述是正确的()A、隐藏层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、都不正确答案:A180.MapReduce的Shuffle过程中哪个操作是最后做的()A、溢写B、分区C、排序D、合并答案:D181.公司在我国境内收集和产生的个人信息和重要数据应当在()存储。A、境内B、境外C、私有云D、公共云答案:A182.数据需求部门向科信部确认数据的开放权限,需要详细说明所开放的数据名称、数据()、数据提供系统、需求部门、提供方式、数据的定义、统计口径以及共享范围和开放权限等。A、权限B、范围C、内容D、类型答案:C183.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,而是都设成0,下面哪个叙述是正确的?A、神经网络不会开始训练,因为没有梯度改变B、没有问题,神经网络会正常开始训练C、神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西D、其他选项都不对答案:C184.BP神经网络具有很的表示能力,它经常遭遇(),其训练误差持续降低,但测试误差却可能上升。A、欠拟合B、误差过大C、误差过小D、过拟合答案:D185.如果训练一个RNN网络时发现权重与激活值都是NaN,则导致这个问题最有可能的原因是()。A、梯度消失B、梯度爆炸C、ReLUD、Sigmoid答案:B186.大数据应用管理包括大数据应用()等全生命周期管理及大数据应用能力建设。A、需求立项、开发实施、发布应用、经营管理B、需求立项、开发实施、发布应用、成果评价C、需求立项、发布应用、经营管理、成果评价D、需求立项、开发实施、经营管理、成果评价答案:B187.下面算法属于局部处理的是()。A、灰度线性变换B、二值化C、傅里叶变换D、中值滤波答案:D188.大数据应用需求分为()需求和即时需求两类。A、年度B、半年度C、季度D、月度答案:A189.假设输入是一个300×300的彩色(RGB)图像,而没有使用卷积神经网络。如果第一个隐藏层有100个神经元,每个神经元与输入层进行全连接,那么这个隐藏层有多少个参数(包括偏置参数)?A、9,000,001B、9,000,100C、27,000,001D、27,000,100答案:D190.考虑下面的3项频繁集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4项集不包含()A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5答案:C191.单个神经元模型不能解决()。A、线性二分类B、XOR问题C、线性二判别D、以上都不是答案:B192.()负责数据合规归口管理,负责数据合规技术审查,持续提升数据合规管理水平。A、互联网部B、信通公司C、办公室D、安监部答案:A193.下列关于算法进化的描述错误的是()。A、算法1.0的典型算法是精度分析,是实验分析技术的核心B、算法2.0的典型算法是线性回归,是问卷领域数据分析的核心C、算法3.0的典型算法是数据挖掘类方法,是数据库领域的核心D、算法4.0的典型算法是DM类算法,时超大数据分析的基础答案:A194.《国家电网有限公司数据共享负面清单管理细则》自()起施行。A、2020年3月30日B、2021年3月30日C、2020年6月30日D、2021年6月30日答案:B195.对于依托公共服务能力平台开发的大数据应用,应遵循平台有关规范,重点开展数据溯源、数据建模以及数据展示等工作,安全防护、三方测试等相关要求统一纳入()进行管理,可不再单独开展。A、数据中台B、大数据应用建设平台C、公共服务能力平台D、人工智能平台答案:C196.RNN不同于其它神经网络的地方在于()。A、实现了记忆功能B、速度快C、精度高D、易于搭建答案:A197.Project被设置了“保护模式”以后,以下()说法是正确。A、所有人都无法访问该Project中的数据B、只有管理员可以访问该Project中的数据C、用户可以在本Project中访问数据,但是不能将数据导出到外部。D、以上全部答案:C198.下列关于线性回归分析中的残差说法正确的是()。A、残差均值总是为零B、残差均值总是约等于零C、残差均值总是大于零D、以上答案都不正确答案:A199.在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?A、搜索每个可能的权重和偏差组合,直到得到最佳值B、赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重C、随机赋值,听天由命D、以上都不正确的答案:B200.下列不是NoSQL数据库的是()A、MongoDB、BigTableC、HBaseD、Access答案:D201.大数据的4V特性中,哪一个是错误的:()。A、数据量大B、价值密度高C、增长快D、维度高答案:B202.以下不符合大数据问题处理范畴的是A、1TB数据,秒级提交结果B、1TB数据,分钟级提交结果C、1TB数据,半小时内提交结果D、1TB数据,一天内提交结果答案:D203.关于机器学习模型训练步骤的说法,错误的是()。A、测试集能够测试模型对于未知数据的拟合效果B、验证集能够用于防止模型过拟合C、划分数据集时需要注意数据是否为同分布D、模型训练需要准备多个备选算法用于效果比较答案:B204.参考公司()按域进行数据分类。A、维度模型B、公共数据模型(SG-CIM)C、通用数据模型D、业务分类答案:B205.{'name':'john','code':6734,'dept':'sales'}这种类型数据属于_____。A、列表B、元组C、集合D、字典答案:D206.列表中可以放()个字符串A、1B、255C、无限个D、由用户自己定义答案:C207.关键信息基础设施的运营者采购网络产品和服务,应当按照规定与提供者签订(),明确安全和保密义务与责任。A、合作协议B、安全保密协议C、安全补充条款D、保密涵答案:B208.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?A、分类B、聚类C、关联分析D、隐马尔可夫链答案:B209.假设文件不存在,如果使用open方法打开文件会报错,那么该文件的打开方式是下列哪种模式()。A、rB、wC、aD、b答案:A210.若a=np.array([5,1,2,3]),a.sort(),则数组a的结果是()。A、[5,1,2,3];B、[1,2,3,5];C、[3,2,1,5];D、11;答案:B211.结构化数组不能使用以下哪种数据类型创建()。A、元组列表B、字符串C、字典D、整数答案:D212.DAGScheduler的作用是什么()A、负责分配任务;B、负责调度Worker的运行;C、负责创建执行计划;D、负责清理执行完毕的任务;答案:C213.数据传输环节,在互联网大区传输重要数据时应()。采用公司统一密码基础设施签发的密钥或证书,实现企业重要数据的加密传输。A、安全保密B、适时销毁C、加密保护D、内网存储答案:C214.常用的图像特征不包括A、颜色特征B、形状特征C、纹理特征D、像素特征答案:D215.大数据计算服务(Maxpute,原ODPS)tunnel命令?供了丰富的参数,可以通过参数设置,对上传或者下载操作进行控制,现在有一个大文件要上传至odps某表中,想先检查一下该文件内容是否和表的定义匹配,并不实际上传,以免文件中有错误记录会导致上传出错。可以使用哪个参数实现这个功能?A、错误记录丢弃:-dbrB、字段分隔符:-fC、扫瞄选项:-sD、空字符串显示:-ni答案:C216.机房照明一般要求有()A、正常照明B、保证照明C、事故照明D、以上都是答案:D217.下列代码:deffoo():print(starting...)whileTrue:res=yield4print(res:,res)foo()返回的是A、resB、4C、starting...D、以上都不对答案:D218.构建多维动态客户画像,设计全网客户标签体系,形成(),全面及时分析客户行为活动,深度提炼客户行为特征规律,实现客户行为动态画像。A、客户标签库B、客户画像C、客户行为库D、用户画像答案:A219.向量空间模型的缺陷不包括()。A、维度灾难B、模型稀疏性C、语义信息缺失D、无法计算文本相似度答案:D220.批规范化(BatchNormalization)的好处都有()?A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是答案:A221.?以下关于PCA说法正确的是()A、PCA是一种监督学习算法B、PCA在转换后的第一个新坐标轴选择的是原始数据中方差最小的方向C、PCA转换后选择的第一个方向是最主要特征D、PCA不需要对数据进行归一化处理答案:C222.人工智能平台总体架构由()组成A、平台层B、应用层C、服务层D、全部答案:D223.()模块是Python标准库中最常用的模块之一。通过它可以获取命令行参数,从而实现从程序外部向程序内部传递参数的功能,也可以获取程序路径和当前系统平台等信息。A、sysB、platformC、mathD、参数是组合类型(可变对象)时,改变原参数的值答案:A224.相比LeNet-5,以下哪个不是AlexNet的创新点?()A、dropoutB、共享权重C、ReLU激活函数和重叠池化D、双GPU训练答案:B225.df.head(n)是指显示A、Dataframe数据中的前n行B、Dataframe数据中的后n行C、Dataframe数据中的前n列D、Dataframe数据中的后n列答案:A226.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为y=7.19x+73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是()。A、身高一定是145.83cmB、身高一定超过146.00cmC、身高一定高于145.00cmD、身高在145.83cm左右答案:D227.根据数据质量核查和治理情况,互联网部对数据质量问题发生数、()、整改完成率等进行评估和通报,促进公司整体数据质量水平提升。A、整改量B、整改及时率C、问题频率D、问题整改情况答案:B228.及时将数据活动中产生的()纳入公司知识产权体系进行保护,妥善处理好数据内部共享、对外开放与知识产权保护的关系。A、智力成果B、软件产品C、数据D、算法答案:A229.线性判别分析(LDA)从贝叶斯决策理论阐释,当两类数据同先验且满足()时,LDA达到最优分类。A、满足高斯分布B、协方差相等C、满足高斯分布且协方差相等D、协方差不等答案:C230.CNN中用来完成分类的是()A、卷积层B、池化层C、全连接层D、激活层答案:C231.已知:(1)大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数学表达。(2)每一个神经元都有输入、处理函数和输出。(3)神经元组合起来形成了网络,可以拟合任何函数。(4)为了得到最佳的神经网络,我们用梯度下降方法不断更新模型。给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模型?A、加入更多层,使神经网络的深度增加B、有维度更高的数据C、当这是一个图形识别的问题时D、以上都不正确答案:A232.a=[[1,2,3],(4,5,6),7,8,9],请问a[1]是哪种数据类型?A、字符串B、列表C、集合D、元组答案:D233.以下数据业务图谱实体中,()是数据实体。A、设备专业B、配电管理C、隐患管理D、隐患记录答案:D234.以下关于语言类型的描述中,错误的是______。A、解释是将源代码逐条转换成目标代码同时逐条运行目标代码的过程B、静态语言采用解释方式执行,脚本语言采用编译方式执行C、C语言是静态编译语言,Python语言是脚本语言D、编译是将源代码转换成目标代码的过程答案:B235.按照公司战略实施要求,立足数据发展需要,以“可管、()、可信”为核心,建立健全数据合规管理体系A、可控B、可查C、可见D、可防答案:A236.SQL语言中,删除一个表中所有数据,但保留表结构的命令是()A、DELETEB、DROPC、CLEARD、REMORE答案:A237.输入图像为37*37,经过第一层卷积(卷积核数量为25,每个卷积核大小为5*5,paddding方式为valid,步长为1)和池化层(卷积核大小为3*3,paddding方式为valid,),输出特征图大小为()A、10*10B、11*11C、12*12D、13*13答案:B238.下面与HDFS类似的框架是()A、NTFSB、FAT32C、GFSD、EXT3答案:C239.给出如下代码,可以输出“python”的是()s='Pythonisbeautiful!'A、print(s[:–14]);B、print(s[0:6].lower());C、print(s[0:6]);D、print(s[–21:答案:B240.输入图片大?为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大?为()。A、95B、96C、97D、98答案:C241.在神经网络学习中,感知机输出层中的M-P神经元通常被称为()。A、阈值逻辑单元B、激活函数C、挤压函数D、连接函数答案:A242.与HMM和MEMM模型相比,CRF模型的优势不包含()。A、特征灵活B、速度快C、可容纳较多上下文信息D、全局最优答案:B243.为什么要对输入x进行归一化?A、让参数初始化更快B、让代价函数更快地优化C、更容易做数据可视化D、是另一种正则化——有助减少方差答案:B244.Numpy中对数组进行转置的函数是哪个()。A、transpose()B、rollaxis()C、swapaxes()D、tan()答案:A245.鼓励各部门、各单位强化大数据成果转化、应用与推广。对内赋能电网运行、经营管理、客户服务、____等实际工作。A、社会治理B、金融信托C、基层减负D、国际援助答案:C246.下列哪一项属于特征学习算法(representationlearningalgorithm)?A、K近邻算法B、随机森林C、神经网络D、都不属于答案:C247.你正在训练一个RNN网络,你发现你的权重与激活值都是NaN,下列选项中,哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了答案:B248.减少神经网络过拟合的说法,以下哪些是正确的?()A、在神经网络训练过程中类似dropout减少神经元或相关链接权的数量B、通过正则化可以减少网络参数的取值或个数,一定程度可能减少过拟合C、利用L1或L2正则化可以使权重衰减,从而一定程度上减少过拟合D、以上都对答案:D249.推动数据标准体系建设,按照“()”原则,组织幵展重点数据标准编制。A、急用先行B、顶层设计C、层层审批D、业数融合答案:A250.执行下面操作后,list2的值是()。list1=[4,5,6]list2=list1list1[2]=3A、[4,5,6]B、[4,3,6]C、[4,5,3]D、以上答案都不正确答案:C251.各级()是本单位信息系统运行风险预警的管理部门,负责建立本单位信息系统运行风险预警管控机制负责与本单位业务应用部门的横向协调负责本单位信息系统运行风险预警管控工作的全过程监督、检查、评价。A、信息通信调度B、信通公司C、信息通信职能管理部门D、国网信通部答案:C252.《个人信息保护法》对于企业的影响不包括()。A、需要强化个人信息处理这主体责任B、明确了可以量化的中国版执行罚则C、需要设立负责处理个人信息保护相关事务的专门机构和指定代表D、收集和处理数据时可以不遵循“最小化”原则答案:D253.数据中台由贴源层、共享层、()、统一数据服务调度和数据资产管理五大板块组成A、应用层B、分析层C、数据层D、模型层答案:B254.下列哪个不属于常用的文本分类的特征选择算法()。A、卡方检验值B、互信息C、信息增益D、主成分分析答案:D255.将一副图像进行分割后,分割出的区域彼此之间(__)重叠。A、可以B、不可以C、根据任务需要确定是否可以D、根据分割方法确定是否可以答案:B256.以下哪类负面清单属于商业秘密和工作秘密。()A、密钥密码、境外投资、“三重一大”事项B、个人证件号码、家庭住址、银行账户等C、投标标底、审计事项、问题线索D、以上都是答案:A257.决策树是基于(__)结构来进行决策的。A、树B、链C、队列D、栈答案:A258.在Spark中,()是指RDD的每个分区都只被子RDD的一个分区所依赖。A、子分区B、父分区C、宽依赖D、窄依赖答案:D259.关于OLAP和OLTP的区别描述,不正确的是()。A、OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同。B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务。C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高。D、OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的答案:C260.大数据应用的业务规划将聚焦核心领域,打造共5大重点业务、()个业务领域、34项业务方向。A、12B、13C、14D、15答案:A261.以下哪一个是ResNet-18的网络结构?()A、4个残差块各有4个卷积层(不包括恒等映射的1x1卷积层),B、3个残差块各有5个卷积层(不包括恒等映射的1x1卷积层),加上最后一个全连接层C、4个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),D、5个残差块各有3个卷积层(不包括恒等映射的1x1卷积层),答案:A262.数据湖探索(DataLakeInsight,简称DLI)是支持以下()形式的大数据计算分析服务。A、流式处理B、批处理C、流批一体D、都不支持答案:C263.下列关于正则化说法错误的是()。A、L1正则化可以用于特征选择B、L1正则化和L2正则化可以减少过拟合C、Lp正则化不能减少过拟合D、L1正则化和L2正则化可以看成是损失函数的惩罚项答案:C264.以下哪项是对早期停止(earlystop)的最佳描述?()。A、训练网络直到达到误差函数中的局部最小值B、在每次训练期后在测试数据集上模拟网络,当泛化误差开始增加时停止训练C、在中心化权重更新中添加一个梯度下降加速算子,以便训练更快地收敛D、更快的方法是反向传播算法答案:B265.CNN中池化层所起的作用是()。A、识别图像中的子模式B、识别图像中位于不同位置的模式C、降低图像采样率D、获取图像的恒定表征答案:C266.DNN常用的激活函数有()。A、sigmoidB、tanhC、ReLUD、以上答案都正确答案:D267.对分类任务来说,学习器从类别标记集合中预测出一个标记,最常见的结合策略是(__)。A、投票法B、平均法C、学习法D、排序法答案:A268.分析应用计算后的分析主题数据存储在()。A、贴源层B、近源层C、共享层D、分析层答案:D269.各地区、各部门应当按照数据()保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列入目录的数据进行重点保护。A、分类分级B、分级分域C、分层分级D、分类分域答案:A270.已知池中有两种鱼,比例为7:3,若随机捞上一条,按照70%和30%概率随机猜测其种类,则整体误差最接近于:A、20%B、30%C、40%D、50%答案:C271.构建从公司总部到各级单位协调一致、符合实际的合规管理架构,确保数据在各层级、各单位、各板块之间合法合规流转,推动()共享应用。A、数据融合B、数据治理C、数据统计D、数据维护答案:A272.SLIC算法的主要目的是()。A、目标识别B、前景和背景分离C、超像素提取D、语义分割答案:C273.关于模型评估方法的说法,错误的是()A、“留出法”直接将数据集D划分成两个互斥的集合B、“自助法”在数据集较大、难以有效划分训练或测试集时很有用C、交叉验证法又称为“k折交叉验证”D、“留一法”是交叉验证法的一个特例答案:B274.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是:()。A、总偏差平方和B、残差平方和C、回归平方和D、相关指数R2答案:B275.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是()。A、1B、3.2C、2.6D、3.8答案:C276.在深度学习中,我们经常会遇到收敛到localminimum,下面不属于解决localminimum问题的方法是()A、随机梯度下降B、设置MomentumC、设置不同初始值D、增大batch答案:D277.确保数据收集、传输、存储、加工、使用、内部共享、对外开放、销毁等环节数据合规管理机制制度化、(),促进数据依法合规利用,维护公司合法权益,支撑公司战略目标实现。A、常态化B、规范化C、生态化D、自动化答案:B278.E.A.Feigenbaum等人在著名的《人工智能手册》(第三卷,把机器学习划分为:机械学习、示教学习、类比学习和____。A、符号主义学习B、监督学习C、无监督学习D、归纳学习答案:D279.下列不属于深度学习的是()。A、监督学习B、无监督学习C、强化学习D、自主学习答案:D280.已知样本x1,x2,x3,x4的平均数是2,则x1+3,x2+3,x3+3,x4+3的平均数是()A、2B、2.75C、3D、5答案:D281.np.linalg.svd()函数可以实现()功能。A、计算协方差矩阵B、实现奇异值分解C、计算方差D、计算均值;答案:B282.()用于将非线性引入神经网络。它会将值缩小到较小的范围内。A、损失函数B、优化函数C、激活函数D、目标函数答案:C283.数据安全管理要求不包括范围A、数据获取B、数据展示C、数据存储D、数据共享答案:B284.以下统计学知识,数据科学中不常用的是()。A、归纳分析法B、描述统计C、推断统计D、基本分析法答案:A285.关于Adam算法,下列哪一个陈述是错误的?A、Adam结合了Rmsprop和动量的优点B、Adam中的学习率超参数通常需要调整C、我们经常使用超参数的“默认”值D、Adam应该用于批梯度计算,而不是用于mini-batch答案:D286.关于DataFrame与RDD在结构上的区别,以下描述错误的是()A、DataFrame可以看作是分布式的Row对象的集合,在二维表数据集的每一列都带有名称和类型。B、RDD是分布式的Java对象的集合C、RDD在转换数据形式时效率相对较高D、DataFrame提供了比RDD更丰富的算子答案:C287.从宏观角度看,数据可视化的功能不包括()A、信息记录B、信息的推理分析C、信息清洗D、信息传播答案:C288.按照公司战略实施要求,立足()需要,以“可管、可控、可信”为核心,建立健全数据合规管理体系,明确数据合规管理职责与重点领域数据合规管理要求。A、数据发展B、行业发展C、信息发展D、能源发展答案:A289.主成分分析(PCA)降维的步骤为()①保留前N个最大的特征值对应的特征向量;②去除平均值;③计算协方差矩阵;④将特征值排序;⑤协方差矩阵的特征值和特征向量⑥将原始特征转换到上述N个特征向量构建的新空间中,实现特征压缩A、③②⑤④①⑥B、②③⑤④①⑥C、②③⑤①④⑥D、③②⑤①④⑥答案:B290.在Hadoop的分区阶段,默认的Partitioner是()。A、RangePartitionerB、PartitionerC、HashPartitionerD、用户自定义的Partitioner答案:C291.以下关于Python程序的基本语法元素,错误的描述是:A、变量是由用户定义的用来保存和表示数据的一种语法元素B、Python语言只能用4个空格的缩进来实现程序的强制可读性C、变量的命名规则之一是名字的首位不能是数字D、变量标识符是一个字符串,长度是没有限制的答案:B292.下列哪一种架构有反馈连接(__)。A、循环神经网络B、卷积神经网络C、受限玻尔兹曼机D、都不是答案:A293.以下()不属于开源数据湖解决方案。A、DLIB、IcebergC、HudiD、Open答案:A294.()不仅可用于多层前馈神经网络,还可用于其他类型的神经网络。A、感知机B、神经元C、神经系统D、误差逆传播答案:D295.为提高计算性能,Spark中Transformation操作采用的是()计算模式。A、活性B、惰性C、实时D、非实时答案:B296.除()依法调取数据外,原则上不对外提供公司业务明细数据。A、上级单位B、公安机关C、社会团体D、国家机关答案:D297.给出如下代码:s='Pythonisbeautiful!'可以输出python的语句是()A、print(s[0:6])B、print(s[0:6].lower())C、print(s[-21:-14].lower)D、print(s[:-14])答案:B298.至2021年,企业中台发展经历了几个时期:A、一B、二C、三D、四答案:C299.运行下面的代码后,变量n的类型是()。n={}A、setB、listC、未知类型D、dict答案:D300.常用的图像去噪方法有()。A、高斯滤波
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年西藏地区电子劳动协议启用及管理细则版
- 2023-2024年人教版八年级上历史期末模拟试卷(25+3)解析版
- 2024年邮轮旅游货物运输合同
- 2023-2024消防设施操作员之消防设备基础知识高频考点知识梳理
- 2022年中考化学模拟卷5(重庆专用)
- 2023-2024年执业药师之西药学专业试题库
- 2022年中考化学复习实验突破:化学基本实验
- 2024版新品居间销售合同3篇
- 2024年酒店管理服务保密协议与运营合作
- 2024年版物联网智能硬件产品生产销售合同
- 护理年终个人工作总结
- 《临床颅内压增高》课件
- 2024老师聘用合同范本
- 国开电大《建筑结构试验》形考任务1-4参考答案
- 年度分析报告格式范文
- 2024年度吉林省国家电网招聘之法学类典型题汇编及答案
- 2024年世界职业院校技能大赛中职组“婴幼儿保育组”赛项考试题库-下(多选、判断题)
- 2024电力建设工程质量问题通病防止手册
- 【初中地理】世界的聚落+课件-2024-2025学年七年级地理上学期(湘教版2024)
- 辩论英文课件教学课件
- 2023-2024学年四川省宜宾市八年级上学期期末数学试卷及参考答案
评论
0/150
提交评论