版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第页2023年能源大数据应用开发技能竞赛理论练习测试题附答案1.()的残差结构解决了深度学习模型的退化问题。在ImageNet的数据集上,其Top5准确率达到了95.51%A、InceptionNetB、VGGC、ResNetD、AlexNet【正确答案】:C2.为保障大数据应用的快速开发和敏捷迭代,按照依托()两种类型实施差异化管控。A、共享平台开发和独立开发B、共享平台开发和个人开发C、公共服务能力平台开发和独立开发D、公共服务能力平台开发和个人开发【正确答案】:C3.聚焦()经济发展新趋势,坚持维护数据安全合规和促进数据开发利用并重,持续优化数据合规管理机制与策略,支撑、赋能公司高质量发展。A、新能源B、社会科技C、信息技术D、能源数字【正确答案】:D4.CREATETABLEAS创建表,后面需要添加查询语句类型是:()。A、INSERTB、UPDATEC、SELECTDELETE【正确答案】:C5.机器学习中L1正则化和L2正则化的区别是()。A、使用L1可以得到稀疏的权值,使用L2可以得到平滑的权值B、使用L1可以得到平滑的权值,使用L2可以得到平滑的权值C、使用L1可以得到平滑的权值,使用L2可以得到稀疏的权值D、使用L1可以得到稀疏的权值,使用L2可以得到稀疏的权值【正确答案】:A6.下列关于RBM说法错误的是(__)。A、学习过程很快B、RBM训练可以看作对一个深层BP网络的网络权值参数的初始化C、RBM不用人工选择特征D、RBM有标签样本集【正确答案】:A7.假设文件不存在,如果使用open方法打开文件会报错,那么该文件的打开方式是下列哪种模式()。A、'r'B、'w'C、'a'D、'w+'【正确答案】:A8.负责关键信息基础设施安全保护工作的部门,应当建立健全本行业、本领域的网络安全监测预警和(),并按照规定报送网络安全监测预警信息。A、网络安全风控机制B、信息通报制度C、网络安全风险库D、信息预警制度【正确答案】:B9.当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速推进,基于___的训练芯片持续增多A、CPUB、GPUC、FPGAD、5G通讯【正确答案】:B10.某公司要建立资料库,该资料库要用ElasticSearch进行检索,请问下列哪些选项可以放到资料库中?A、Word文档B、公司宣传视频C、产品设计图D、以上全部正确【正确答案】:D11.以下哪项方法不属于汉语分词方法()。A、双向扫描法B、正向最大匹配法C、逐词遍历法D、词向量匹配法【正确答案】:D12.以下()不是NoSQL数据库。A、MongoDBBigTableC、HBaseD、Access【正确答案】:D13.给定一个置信概率和置信区域,若误差超过置信区域,则认为误差不是随机误差引起,视为异常值的判别方法()。A、聚类判别法;B、回归判别法;C、抽样判别法;D、统计判别法【正确答案】:D14.下面关于Hive四种排序方式的区别,描述正确的是()A、orderby是要对输出的结果进行全局排序,多个reducer可以实现全局排序B、sortby不是全局排序,只是在进入到reducer之前完成排序C、distributeby指的是按照指定的字段划分到不同的输出reduce文件中,常见使用方式是orderbydistributebyD、clusterby不仅支持正序排序,也支持逆序排序【正确答案】:B15.有监督的学习和无监督的学习的根本区别在于()A、学习过程是否需要人工干预B、学习样本是否需要人工标记C、学习结果是否需要人工解释D、学习参数是否需要人工设置【正确答案】:B16.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择?A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法【正确答案】:B17.下面关于Hive各个格式使用场景描述错误的是()A、Parquet对于大型查询的类型是高效的,对于扫描特定表格中的特定列的查询,Parquet特别有用B、目前Parquet默认使用gzip压缩格式C、ORC可以支持复杂的数据结构(比如Map等)D、RCFile是一种行列存储相结合的存储方式【正确答案】:B18.主要用于序列标注任务的是()A、序列到类别模式B、同步的序列到序列模式C、异步的序列到序列模式D、以上选项均不正确【正确答案】:B19.在MySQL中,通常使用()语句来进行数据的检索、输出操作。A、SELECTB、INSERTC、DELETED、UPDATE【正确答案】:A20.以下哪种参数是用*来接收,不是必传的?A、位置参数B、默认值参数C、可变参数D、关键字参数【正确答案】:C21.MapReduce服务(MRSHBase)具备高可靠性、高性能、可灵活扩展伸缩的、支持实时数据读写的分布式存储系统,以下哪项不是它的功能优点()。A、面向列(Column-Oriented)存储B、适合存储非结构化数据C、支持标准SQL方式操作数据D、适合存储半结构化数据【正确答案】:C22.假设你需要调整超参数来最小化代价函数(costfunction),会使用下列哪项技术A、穷举搜索B、随机搜索C、Bayesian优化D、都可以【正确答案】:D23.已经为所有隐藏的单位建立了一个使用tanh激活的网络。使用np.random.randn(…,…)*1000将权重初始化为相对较大的值。会发生什么?A、没关系。只要随机初始化权重,梯度下降不受权重大小的影响。B、这将导致tanh的输入也非常大,从而导致梯度也变大。因此,必须将设置得非常小,以防止发散;这将减慢学习速度。C、这将导致tanh的输入也非常大,导致单元被“高度激活”。与权重从小值开始相比,加快了学习速度。D、这将导致tanh的输入也非常大,从而导致梯度接近于零。因此,优化算法将变得缓慢【正确答案】:D24.下列关于多层前馈神经网络的描述错误的是()。A、输出层与输入层之间包含隐含层,且隐含层和输出层都拥有激活函数的神经元B、神经元之间存在同层连接以及跨层连接C、输入层仅仅是接收输入,不进行函数处理D、每层神经元上一层与下一层全互连【正确答案】:B25.神经元计算什么?A、神经元计算激活函数后,再计算线性函数(z=Wx+b)B、神经元计算一个线性函数(z=Wx+b),然后接一个激活函数C、神经元计算一个函数g,它线性地缩放输入x(Wx+b)D、神经元先计算所有特征的平均值,然后将激活函数应用于输出【正确答案】:B26.神经网络的训练结果模型不包括()。A、权重矩阵B、偏置参数C、超参数D、计算图【正确答案】:C27.大数据和算法关系以下描述正确的是:A、数据跟算法没有关系B、算法比数据更重要C、数据比算法更重要D、没有数据的算法没有意义,失去了算法的数据无法应用【正确答案】:D28.下面关于Hive架构描述不正确的是()A、Hive中QL是HiveSQL,方便用户完成数据读写B、HiveSerDe是Serializer和Deserializer的缩写,用于序列化和反序列化数据,即读写数据C、HiveMetaStore用户管理Hive的元数据D、HiveMetaStore对外暴露ThriftAPI,用于元数据的修改【正确答案】:A29.RNN不同于其它神经网络的地方在于()。A、实现了记忆功能B、速度快C、精度高D、易于搭建【正确答案】:A30.下列哪项所描述的相关技术是错误的?AdaGrad使用的是一阶差分(firstorderdifferentiation)B、L-BFGS使用的是二阶差分(secondorderdifferentiation)C、AdaGrad使用的是二阶差分(secondorderdifferentiation)D、以上都不是【正确答案】:C31.CNN神经网络对图像特征提取带来了变革性的变化,使之前的人工特征提取升级到数据驱动的自动特征提取,在CNN中,起到特征提取作用的网络层是()。A、convolution层B、fullC、maxD、norm层【正确答案】:A32.自然语言处理、语音识别、股票交易、气象预测等应用适合采用()处理。A、循环神经网络B、卷积神经网络C、多层神经网络D、单层神经网络【正确答案】:A33.下列关于运算符优先级的说法不正确的是()A、运算符按照优先级顺序表进行运算B、同一优先级的运算符在表达式中都是按照从左到右的顺序进行运算的C、同一优先级的运算符在表达式中都是按照从右到左的顺序进行运算的D、括号可以改变运算的优先次序【正确答案】:C34.执行下面操作后,list2的值是()。list1=[4,5,6]list2=list1list1[2]=3A、[4,5,6]B、[4,3,6]C、[4,5,3]D、以上答案都不正确【正确答案】:C35.分析应用计算后的分析主题数据存储在()。A、贴源层B、近源层C、共享层D、分析层【正确答案】:D36.神经网络感知机只有()神经元进行激活函数处理,即只拥有一层功能神经元。A、输出层B、输入层C、感知层D、网络层【正确答案】:A37.Dropout技术在下列哪种神经层中将无法发挥显著优势?A、仿射层B、卷积层C、RNN层D、均不对【正确答案】:C38.池化层的作用是()。A、标准化处理输入特征B、对特征图进行特征选择和信息过滤C、对提取的特征进行非线性组合以得到输出D、直接输出每个像素的分类结果【正确答案】:B39.下列选项中,()不是经典图像分割方法A、基于内容的分割方法B、基于阈值的分割方法C、基于边缘的分割方法D、基于基因编码的分割方法【正确答案】:A40.下列哪个用于说明在RDD上执行何种计算()A、分区B、算子C、日志D、数据块【正确答案】:B41.公司数据质量管理主要包括()A、数据质量规则管理B、数据质量核查C、数据问题整改与质量评估D、以上都是【正确答案】:D42.LSTM中,()的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。A、输入门B、遗忘门C、输出门D、更新门【正确答案】:A43.以下哪些CNN模型不是在imagenet比赛中兴起的?AlexNetB、VGG19C、ResNetD、Mask-RCNN【正确答案】:D44.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于网络强国的重要思想和国家网络空间安全战略、回家大數据发展战路,认其落实回务院回资委加睡容规作理、建设法治央企工作部署,紧扣“稳、进、()、开〞四字要求。A、平B、管C、育D、信【正确答案】:C45.大数据应用管理包括大数据应用()等全生命周期管理及大数据应用能力建设。A、需求立项、开发实施、发布应用、经营管理B、需求立项、开发实施、发布应用、成果评价C、需求立项、发布应用、经营管理、成果评价D、需求立项、开发实施、经营管理、成果评价【正确答案】:B46.以下属于深度学习框架的是()。A、TensorflowB、CaffeC、PyTorchD、以上答案都正确【正确答案】:D47.给出如下代码,可以输出“python”的是()s='Pythonisbeautiful!'A、print(s[:–14]);B、print(s[0:6].lower());C、print(s[0:6]);D、print(s[–21:【正确答案】:B48.各级()是本单位信息系统运行风险预警的管理部门,负责建立本单位信息系统运行风险预警管控机制负责与本单位业务应用部门的横向协调负责本单位信息系统运行风险预警管控工作的全过程监督、检查、评价。A、信息通信调度B、信通公司C、信息通信职能管理部门D、国网信通部【正确答案】:C49.下列哪个不属于个人信息影响评估原则()。A、个人信息的处理目的、处理方式等是否合法、正当、必要B、对个人的影响及风险程度C、谁主管谁负责D、所采取的安全保护措施是否合法、有效并与风险程度相适应【正确答案】:C50.plt.contourf(X,Y,f(X,Y),8,alpha=.75,cmap=plt.cm.hot),cmap表示()。A、图例风格B、颜色映射风格C、网格线类型D、透明度【正确答案】:B51.ndarry是一个通用的(__)数据容器。A、单维同类B、单维多类C、多维同类D、多维多类【正确答案】:C52.神经网络建模步骤一般是()。1模型评估;2网络配置;3模型训练;4数据准备;5模型预测A、12345B、32154C、54321D、42315【正确答案】:D53.数据可视化的本质是()。A、将数据转换为知识B、将知识转换为数据C、将数据转换为信息D、将信息转换为智慧【正确答案】:A54.公司企业中台基于()构建,是企业级能力共享平台。A、华为云B、国网云C、阿里云D、百度云【正确答案】:B55.()过大导致模型欠拟合,()过大导致过拟合A、方差,偏差B、偏差,方差C、偏差,标准差D、期望,偏差【正确答案】:B56.下列关于LSTM的说法,错误的是()。A、LSTM中存在Sigmoid函数B、LSTM中存在tanh函数C、LSTM又称长短时记忆网络D、RNN是LSTM的变种【正确答案】:D57.你正在训练RNN网络,发现你的权重与激活值都具有NaN的值(“非数字”)。以下哪项最可能是此问题的原因?A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了【正确答案】:B58.国家提倡诚实守信,()的网络行为,推动传播社会注意核心价值观,实行措施提高全社会的网络安全意识和水平,形成全社会共同参加促进网络安全的良好环境。A、自由公平B、健康文明C、团结互助D、和平友爱【正确答案】:B59.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘【正确答案】:C60.关于选择k折交叉检验中的“k”的值,以下说法正确的是A、k并不是越大越好,更大的k会减慢检验结果的过程B、选择更大的k会导致降低向真实期望错误的倾斜C、选择总是能最小化交叉验证中方差的kD、以上都是【正确答案】:D61.省电力公司级以上单位本地信息网络不可用,且持续时间4小时以上为()A、六级信息系统事件B、七级信息系统事件C、八级信息系统事件D、不算事故【正确答案】:A62.对于一个图像识别问题(在一张照片里找出一只猫),下面哪种神经网络可以更好地解决这个问题()A、循环神经网络B、感知机C、多层感知机D、卷积神经网络【正确答案】:D63.HDFS集群中的namenode职责不包括()A、维护HDFS集群的目录树结构B、维护HDFS集群的所有数据块的分布、副本数和负载均衡C、负责保存客户端上传的数据D、响应客户端的所有读写数据请求【正确答案】:C64.关于下面代码的描述,错误的是(),代码是n=1deffunc(a,b):c=a*breturncs=func("Hello",2)print(c)A、打印输出字符串:"HelloHello"B、运行结果是出错,出错类型是NameError:name'c'isnotdefinedC、c是一个局部变量D、n是一个全局变量【正确答案】:A65.关于TF-IDF模型,以下描述错误的是()。A、TF意思是词频B、IDF是逆文本频率C、该模型是一种统计方法D、该模型基于聚类方法【正确答案】:D66.至十四五末,公司企业中台公共服务共享使用率将达到()。A、80%B、85%C、90%D、100%【正确答案】:D67.以下有关国网链平台的说法错误的是()A、以公有链架构为基础B、总体架构为“一主两侧多从”C、为公司各类区块链业务提供安全可信的底层区块链基础设施D、支持电网及上下游企业、外部机构间的信息可信共享与协同共用【正确答案】:A68.业务中台从管理上突破了系统建设的()壁垒A、部门级B、地市C、专业D、公司级【正确答案】:A69.下列哪个不属于CRF模型对于HMM和MEMM模型的优势()。A、特征灵活B、速度快C、可容纳较多上下文信息D、全局最优【正确答案】:B70.对参数进行L2正则,是机器学习常用的防止过拟合的方法。请问对参数做L2正则,下列()是对参数本身做先验分布假设。A、高斯分布B、拉普拉斯分布C、泊松分布D、均匀分布【正确答案】:A71.{'name':'john','code':6734,'dept':'sales'}这种类型数据属于_____。A、列表B、元组C、集合D、字典【正确答案】:D72.在一个神经网络中,下面哪种方法可以用来处理过拟合()A、DropoutB、分批归一化(BatchC、正则化(regularization)D、都可以【正确答案】:D73.假设有100,000张带标签的图片是使用汽车的前置摄像头拍摄的,这也是模型训练的数据分布,如果可以从互联网上获得更大的数据集,即使互联网数据的分布不相同,这也可能对训练有所帮助。在刚刚开始着手这个项目,要做的第一件事是什么?假设下面的每个步骤将花费大约相等的时间(大约几天)。A、花几天时间去获取互联网的数据,这样就能更好地了解哪些数据是可用的。B、花几天的时间检查这些任务的人类表现,以便能够得到贝叶斯误差的准确估计。C、花几天的时间使用汽车前置摄像头采集更多数据,以更好地了解每单位时间可收集多少数据。D、花几天时间训练一个基本模型,看看它会犯什么错误【正确答案】:D74.选出主成分分析的步骤顺序:①确定主成分②求出相关系数矩阵③对原来的指标进行标准化④求出协方差矩阵的特征根和特征向量A、①③②④B、②①③④C、④①②③D、③②④①【正确答案】:D75.公司大数据应用需求与立项管理遵循()管理规范,严格落实项目制管理要求,主要包括需求征集、评审、储备、立项和计划编制与调整等工作。A、技术服务项目B、科技项目C、信息化项目D、数字化项目【正确答案】:D76.假设已经在ImageNet数据集(物体识别)上训练好了一个卷积神经网络。然后给这张卷积神经网络输入一张全白的图片。对于这个输入的输出结果为任何种类的物体的可能性都是一样的,对吗?A、对的B、不知道C、依情况而定D、不对【正确答案】:D77.回归任务中最常用的性能度量是A、均方误差B、查准率C、查全率D、F1【正确答案】:A78.AlexNet使用ReLU激活函数的好处不包括以下哪个方面?()A、梯度为0时神经元难以正常工作B、开销小、计算快C、提高了网络训练速度D、缓解了梯度消失问题【正确答案】:A79.评估完模型之后,发现模型存在高偏差(highbias),应该如何解决()A、减少模型的特征数量B、增加模型的特征数量C、增加样本数量D、以上说法都正确【正确答案】:B80.以下哪个不是Spark的组件()A、DriverB、SparkContextClusterManagerD、ResourceManager【正确答案】:D81.下列关于hive说法正确的是()A、一种数据仓库工具B、一种数据处理工具C、一种可视化工具D、一种分析算法【正确答案】:A82.下列哪个程序通常与NameNode在一个节点启动()A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker【正确答案】:D83.在Hadoop的分区阶段,默认的Partitioner是()。A、RangePartitionerB、PartitionerC、HashPartitionerD、用户自定义的Partitioner【正确答案】:C84.当总体为正态总体,方差已知,样本量为40,此时进行均值检验,应采用()统计量进行检验。A、卡方检验B、t检验C、F检验D、Z检验【正确答案】:D85.SVM模型通过最大化边界实现线性分类,以下哪个可以使得SVM实现非线性分类()A、松弛变量B、对偶空间求解C、kernelD、SMO算法【正确答案】:C86.《中华人们共和国网络安全法》规定:国家采取措施,()来源于中华人民共和国境内外的网络安全风险和威胁,保护关键信息基础设施免受攻击、侵入、干扰和破坏,依法惩治网络违法犯罪活动,维护网络空间安全和秩序。A、监测、防御、反击B、监测、防御、处置C、检测、防御、反击D、检测、防御、处置【正确答案】:B87.在Spark中,()是指RDD的每个分区都只被子RDD的一个分区所依赖。A、子分区B、父分区C、宽依赖D、窄依赖【正确答案】:D88.数据存储环节,企业重要数据原则上应存储于管理信息大区,在互联网大区存储企业重要数据时应____。A、本地储存B、云上储存C、加密储存D、线下储存【正确答案】:C89.熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是()。A、1B、3.2C、2.6D、3.8【正确答案】:C90.MapReduce中,Shuffle操作的作用是()。A、合并B、排序C、降维D、分区【正确答案】:B91.资产评估应用实现全链路的数据资产监管和价值追踪,具体包括资产使用评估、()评估和敏感数据评估等功能。A、资产使用评估B、资产价值C、敏感数据评估D、数据质量评估【正确答案】:B92.下列关于循环神经网络说法错误的是()。A、长短期记忆网络是进行优化过后的循环神经网络B、RNN是一类可用于处理序列数据的神经网络C、循环神经网络广泛应用于自然语言处理领域,例如语音识别、语言建模和机器翻译等D、LSTM引入了一个基于循环神经网络(RNN)的架构后,梯度消失问题得以解决【正确答案】:D93.数据仓库仅仅是提供存储的,提供一种()的服务,不面向最终分析用户:而数据集市是()的,面向最终用户。A、面向数据管理、面向分析应用B、面向分析应用、面向数据管理C、面向分析应用、面向事务交互D、面向事务交互、面向数据管理【正确答案】:A94.县级以上地方人民政府有关部门的网络安全保护和(),根据国家有关规定确定。A、调研指导职责B、监督管理职责C、行政执法职责D、制度规划职责【正确答案】:B95.下列关于多层前馈神经网络的描述错误的是()。A、输出层与输入层之间包含隐含层,且隐含层和输出层都拥有激活函数的神经元B、神经元之间存在同层连接以及跨层连接C、输入层仅仅是接收输入,不进行函数处理D、每层神经元上一层与下一层全互连【正确答案】:B96.数据的可用性取决于()。A、数据分析B、数据集采C、数据质量D、数据需求【正确答案】:C97.Python运算符中用来计算集合并集的是()A、|B、&C、||D、+【正确答案】:A98.高斯核也称为()。A、多项式核B、拉普拉斯核C、RBF核D、Sigmoid核【正确答案】:C99.机器学习中,下面哪些方法不可以避免分类中的过拟合问题?A、增加样本数量B、增加模型复杂度C、去除噪声D、正则化【正确答案】:B100.下列不属于action操作的是()A、collectB、filterC、reduceD、count【正确答案】:B1.常用的池化层有哪些?A、MaxPoolingB、AveragePoolingC、MinPoolingD、MedianPooling【正确答案】:AB2.下列关于EM算法描述正确的是(__)。A、EM算法是常用的估计参数隐变量的利器B、EM算法即是期望最大化算法C、EM算法常被用来学习高斯混合模型的参数D、EM算法是一种迭代式的方法【正确答案】:ABCD3.浙江数据中台部署方式A、一级部署B、二级部署C、三级部署D、集中部署【正确答案】:ABD4.以下哪些选项可以用于实现爬虫功能()。A、BeautifulSoup库B、re模块C、Scrapy框架D、urllibrequest库【正确答案】:ACD5.中台的设计原则()A、企业级复用原则B、稳态业务沉淀原则C、共性业务服务原则D、企业全局复用原则【正确答案】:ABC6.创建数据库可以指定兼容()参数。A、MySQLB、OraC、TDD、SQLServer【正确答案】:BC7.下列属于评估方法的有:A、留出法B、交叉验证法C、自助法D、反向验证法【正确答案】:ABC8.下列关于自助法描述错误的是(__)。A、自助法在数据集较大、难以有效划分训练集或测试集是很有用B、自助法能从初始数据集中产生多个不同的训练集C、自助法产生的数据集没有改变初始数据集的分布D、在初始数据量足够时,留出法和交叉验证法较自助法更为常用【正确答案】:AC9.神经网络模型(NeuralNetwork)因受人类大脑的启发而得名。神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,对输入进行处理后给出一个输出。请问下列关于神经元的描述中,哪一项是正确的(__)。A、每个神经元有一个输入和一个输出B、每个神经元有多个输入和一个输出C、每个神经元有一个输入和多个输出D、每个神经元有多个输入和多个输出【正确答案】:ABCD10.依据()职责划分,按照“谁主管谁负责,谁运行谁负责,谁使用谁负责”的总体原则,明确数据安全职责分工,落实数据安全责任。A、《信息安全技术网络安全等级保护基本要求》B、《中华人民共和国网络安全法》C、《国家电网有限公司数据管理办法》D、《国家电网有限公司网络与信息系统安全管理办法》【正确答案】:CD11.以下()方法可以支持MaxCompute中受保护项目空间的数据流出。A、使用owner通过ACL授权B、使用owner通过policy授权C、设置例外D、设置项目互信【正确答案】:CD12.数据中台是企业级数据能力共享平台。数据通过分层与水平分解,经过汇聚、(),沉淀公共的数据能力,根据业务场景进行服务封装,形成企业级数据服务,支撑前端应用敏捷迭代和快速构建,实现数据价值共享。A、存储B、整合C、分析D、加工【正确答案】:ABCD13.语音识别的方法包括()。A、声道模型方法B、模板匹配的方法C、利用人工神经网络的方法D、语音知识方法【正确答案】:ABCD14.CNN相比于全连接的DNN有哪些优势()A、参数更少B、泛化更好C、训练更快D、更容易搭建;【正确答案】:ABC15.Maxcompute的自定义函数包括:()。A、自定义标量函数B、自定义聚合函数C、自定义表值函数D、自定义扩展函数【正确答案】:ABC16.在处理序列数据时,不容易出现梯度消失现象的深度学习模型的是A、CNNB、LSTMC、GRUD、RNN【正确答案】:ABC17.在支持向量机中,参数的选取会影响拟合的结果,如果出现过拟合的现象,则导致该结果的原因有可能是(__)。A、其他参数保持不变,C值过大B、其他参数保持不变,λ值较少C、其他参数保持不变,σ较大D、其他参数保持不变,σ较小【正确答案】:ABD18.以下()函数是累积函数。A、cumsumB、argminC、cumprodD、argmax【正确答案】:AC19.CNN网络中可能包含哪些层()A、输入层B、卷积层C、池化层D、全连接层【正确答案】:ABCD20.下列哪些项目是在图像识别任务中使用的数据扩增技术?A、水平翻转B、随机裁剪C、随机放缩D、颜色抖动【正确答案】:ABCD21.图像数字化应该包括哪些过程()。A、采样B、模糊C、量化D、统计【正确答案】:AC22.线性模型的基本形式有()。A、线性回归B、对数几率回归(二分类问题)C、线性判别分析(Fisher判别分析)D、多分类学习【正确答案】:ABCD23.以下关于数据中台的描述,正确的是()。A、数据中台是企业级数据能力共享平台。B、数据中台将业务生产资料转变为数据生产力,通过数据整合、提纯加工、数据可视化推动数据价值释放,反哺业务,实现数据增值、赋能新业务。C、数据中台通过实现各类型数据资源全量纳管、处理分析,推动数据业务化。D、国网数据中台采用总部和省市公司两级部署模式构建。【正确答案】:ABCD24.数据科学以数据尤其是大数据为研究对象,主要研究内容包括()。A、数据加工B、数据管理C、数据计算D、数据产品研发【正确答案】:ABCD25.关于Maxcompute中的admin角色,以下()说法是正确的。A、包含的权限只有owner可以调整B、可以修改项目空间的鉴权模型C、不能将admin权限指派给用户D、不能设定项目空间的安全配置【正确答案】:CD26.在SQL语言分类中,以下属于DML的是:A、updateB、selectC、insertD、delete【正确答案】:ACD27.关于神经网络与深度学习的关系表述正确的是?A、深度学习的概念源于人工神经网络的研究B、含有多个隐层的神经网络算法就是一种深度学习算法C、单层神经网络也是深度学习的一种D、卷积神经网络属于深度学习的一种【正确答案】:ABD28.下列算法,哪些属于深度学习模型A、支持向量机SVMB、深度残差网络C、集成学习GBDTD、卷积神经网络CNN【正确答案】:BD29.()能知道一个MaxcomputeSQL在运行时占用了多少instance。A、根据表的大小,自己计算B、使用ps-ef查看相关进程数C、用odpscmd提交时,从返回的状态中查看D、打开logview查看【正确答案】:CD30.列式数据库(如BigTable和HBase)以表的形式存储数据,表结构包括()等元素A、行键B、时间戳C、列簇D、数据类型【正确答案】:ABC31.数据活动涉及公司商业秘密、工作秘密的,应严格执行()、()等有关规定,履行涉密审查流程,根据有关规定及工作需要确定知悉范围,并按照涉密程度实行分类管理A、《国家电网有限公司保密工作管理办法》B、《信息安全技术网络安全等级保护基本要求》C、《中华人民共和国网络安全法》D、《国家电网公司保护商业秘密规定》【正确答案】:AD32.MapReduce对map()函数的返回值处理后才传给reduce()函数,其中涉及哪些操作()。A、合并B、排序C、分区D、抽样【正确答案】:ABC33.我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()A、对训练集随机采样,在随机采样的数据上建立模型B、尝试使用在线机器学习算法C、使用PCA算法减小特征维度D、随机去掉部分特征【正确答案】:ABC34.Hadoop组件Flume三层架构包括()。AgentB、GossipCollectorD、Storage【正确答案】:ACD35.假设目标遍历的类别非常不平衡,即主要类别占据了训练数据的99%,现在你的模型在训练集上表现为99%的准确度,那么下面说法正确的是:()。A、准确度并不适合衡量不平衡类别问题B、准确度适合衡量不平衡类别问题C、精确度和召回率适合于衡量不平衡类别问题D、精确度和召回率不适合衡量不平衡类别问题【正确答案】:AC36.支持创建的数据标签类型有:()。A、规则标签B、组合标签C、手工标签D、实时标签【正确答案】:ABCD37.基于Boosting的集成学习代表算法有()。AdaboostB、GBDTC、XGBOOSTD、随机森林【正确答案】:ABC38.特征选择在子集生成与搜索方面引入了()人工智能搜索和评价方法。A、分支界限法B、浮动搜索法C、信息熵D、AIC【正确答案】:ABCD39.下面是文件基本操作的函数()。A、closeB、readC、renameD、remove【正确答案】:ABCD40.下面哪种操作能改善卷积网络训练的稳定性?A、动态的学习步长调整,例如AdamB、冲量项C、批归一化(batchnormalization)D、提高mini-batch中的样本个数【正确答案】:ACD41.有关通道的说法,哪些说法是正确的?A、在卷积操作时,每个卷积核要对输入特征图的所有通道分别做卷积后求和,得到对应的新特征图B、卷积层的输入特征图的通道数和输出特征图的通道数是相同的C、通道数越多,获得的特征图越多,网络获得的特征越充分D、随着卷积网络深度的增加,一般使用更小的卷积核和更多的通道,兼顾训练速度和网络分类性能【正确答案】:CD42.使用数据集成做数据同步,为了避免对数据源造成过大压力,如下通道控制的配置方法哪些是正确的?A、增大任务期望最大并发数B、减小任务期望最大并发数C、同步速率选择限流D、同步速率选择不限流【正确答案】:BC43.下列关于支持向量机的说法正确的是(__)。A、支持向量机的学习策略是间隔最大化B、支持向量机的基本模型是特征空间上间隔最大的线性分类器C、支持向量机只能对线性可分的样本进行分类D、传统支持向量机只能求解二分类问题【正确答案】:ABD44.下列表示同一种学习方法的是(__)。A、集成学习B、多分类器系统C、基于委员会的学习D、平均策略【正确答案】:ABC45.在MapReduce1.0版本中,JobTracker功能是()。A、负责资源管理B、作业控制C、作业存储D、作业审核【正确答案】:AB46.浅层神经网络与深度神经网络比较,其区别之处是?A、浅层结构算法:其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约B、深度学习可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示,并展现了强大的从少数样本集中学习数据集本质特征的能力。C、浅层神经网络的好处是可以用较少的参数表示复杂的函数D、深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。【正确答案】:ABD47.ADS支持()连接方式。A、安装了php-mysql-5.1.x模块的php环境B、使用版本为5.4系列的mysql-jdbc驱动C、用户管理控制台中的DMSD、mysql5.6的客户端【正确答案】:ABCD48.公司各级大数据中心、信通公司是大数据应用管理的专业支撑单位,负责组织开展大数据应用平台、服务目录等基础环境建设,保障数据及运营安全,提供()、()和()支持。A、数据B、算法C、平台D、算力资源【正确答案】:ABD49.过拟合和欠拟合都会导致问题,以下哪些问题可能是过拟合导致的()。A、误认为所有的树叶都必须有锯齿B、训练集损失很高,验证集损失很高C、训练集损失很低,验证集损失很高D、在测试集上效果好【正确答案】:AC50.以下哪些方法是tf-idf的变种()。A、TFCB、EWCC、ITCD、IG【正确答案】:AC51.决策树递归停止的条件为()。A、训练数据集使用完B、所有的类标签完全相同C、特征用完D、遇到丢失值【正确答案】:BC52.MySQL的CloudDBA的性能趋势指的是A、查看和对比性能趋势B、自定义性能趋势大盘C、查看异常诊断信息D、查看实例拓扑结构。【正确答案】:ABCD53.一个回归模型存在多重共线问题。在不损失过多信息的情况下,可如何处理()A、剔除所有的共线性变量B、剔除共线性变量中的一个C、我们可以计算方差膨胀因子(varianceinflationfactor)来检查存在的多重共线性并采取相应的措施D、移除相关变量可能会导致信息的丢失,为了保留这些变量,我们可以使用岭回归(ridge)或lasso等回归方法对模型进行惩罚E、删除相关变量可能会有信息损失,我们可以不删除相关变量,而使用一些正则化方法来解决多重共线性问题,例如【正确答案】:BCD54.以下()场景可以使用大数据计算服务(MaxCompute,原ODPS)的TunnelSDK方式实现。A、定时批量上传数据B、下载某个分区表的一个分区的数据C、一次性上传本地格式化文本文件D、随时变化的数据,通过事件(消息)驱动触发【正确答案】:ABC55.下面是Python注释语句的是()。A、'hello'B、'''hello'''C、"hello"D、<【正确答案】:BD56.大数据计算服务中,检查数据何时被修改时需要参考lastmodifiedtime属性,对于分区表,在分区级别和表级别都有lastmodified属性。对此属性的影响,以下描述正确的有:()。A、更新一个分区中的数据时,只会影响该分区的lastmodifiedtime属性B、更新一个分区中的数据时,表的lastmodifiedtime属性会被更新C、更新一个分区中的数据时,分区的lastodifiedtime属性会被更新D、更新一个分区中的数据时,不会更新表和分区的lastmodifiedtime【正确答案】:BC57.OTS费用从()维度计量。A、外网下行流量B、数据访问次数(万次)C、数据存储D、预留读写吞吐量【正确答案】:ACD58.Spark的部署模式包括()。A、本地模式B、standalone模式C、SparkonyarnD、mesos模式【正确答案】:ABCD59.聚焦区块链技术与能源转型深度融合,围绕平台架构优化、公共服务能力提升、运管能力扩展等方面,建设“先进适用、安全可靠、互联互通、开放共享”的公司级区块链公共服务平台“国网链”,挖掘区块链在公司生产、经营、服务等业务创新中的应用价值,支撑公司()、()、()三大领域12类区块链试点应用,探索“平台+应用+生态”的总体布局。A、能源B、金融C、营销D、政务【正确答案】:ACD60.相关与线性关系,下列说法正确的是()A、相关不一定是线性关系,可能是非线性关系B、相关一定是线性关系,不可能是非线性关系C、相关时若有相关系数r为0,说明两个变量之间不存在线性关系,仍可能存在非线性关系D、相关系数为0是两个变量独立的必要不充分条件【正确答案】:ACD61.在Python中,以下导入模块方式正确的是()。A、import模块名B、import模块名as模块的别名C、from模块名import函数名D、from模块名import函数名A,函数名【正确答案】:ABCD62.Scikit-Learn中可以实现()算法。A、分类B、聚类C、回归D、降维【正确答案】:ABCD63.数据中台分析层包括以下哪几种表()。A、维度表B、汇总宽表C、应用结果表D、事实明细表【正确答案】:ABCD64.深度学习的方法包括()A、监督学习B、无监督学习C、强化学习D、自主学习【正确答案】:ABC65.Analytics1.0的主要特点有()。A、分析活动滞后于数据的生成B、重视结构化数据的分析C、以对历史数据的理解为主要目的D、注重描述性分析【正确答案】:ABCD66.以下关于MaxComputeSQL中多路输出描述正确的是:()。A、多路输出是指MaxComputeSQL可以支持在一个语句中插入到不同的结果表或者分区B、一般情况下,单个SQL里最多可以写128路输出C、在一个multiinsert中,对于分区表,同一个目标分区不可以出现多次;对于未分区表,该表不能出现多次D、对于同一张分区表的不同分区,不能同时有insertoverwrite和insertinto操作,否则报错返回【正确答案】:ACD67.Spark的关键技术包括以下哪几个()。A、RDD;B、Scheduler;C、Storage;D、Shuffle;【正确答案】:ABCD68.建立(),规范数据信息擦除与销毁手段和方法,实现对数据的有效销毁,防范数据泄露风险。A、数据销毁流程B、审批机制C、合规机制D、数据存储流程【正确答案】:AB69.关于卷积神经网络的叙述中正确的是()。A、可用于处理时间序列数据B、可用于处理图像数据C、卷积网络中使用的卷积运算就是数学中的卷积计算D、至少在网络的一层中使用卷积【正确答案】:ABD70.神经网络中参数极多,常用的初始化方法有哪些?A、全零初始化B、随机初始化C、加载预训练模型D、使用深度信念网络【正确答案】:ABC71.大数据应用应严格遵守国家数据安全相关法律法规和公司数据安全相关规定,严格执行数据获取、____、____、____、数据共享、数据销毁等环节安全管理要求,确保大数据应用工作安全合规。A、数据传输B、数据存储C、数据分析D、数据使用【正确答案】:ABD72.下面是Python的特点和优点是()。A、解释性B、动态特性C、面向对象D、语法简洁【正确答案】:ABCD73.Caffe框架支持哪些语言。A、C++B、PythonC、MATLAD、R【正确答案】:ABC74.企业中台不仅是技术架构的创新,也是管理模式的转变,通过公司(),(),(),(),满足千人千面的需求服务,实现管理提升和价值创造。A、资源汇聚B、交叉引流C、业务融通D、开放共享【正确答案】:ABCD75.以下哪些模型结构中出现循环连接的结构A、LSTMB、GRUC、TransformerD、text-convolution【正确答案】:ABC76.假设在一个深度学习网络中,批量梯度下降花费了大量时间时来找到一组参数值,使成本函数小。以下哪些方法可以帮助找到值较小的参数值?A、令所有权重值初始化为0B、尝试调整学习率C、尝试mini-batch梯度下降D、尝试对权重进行更好的随机初始化【正确答案】:BCD77.下面关于单样本Z检验的说法,正确的是()。A、在Python中,单样本Z检验可以使用scipy.stats.ttest_1samp()实现B、单样本Z检验适用于样本量较大的情况C、单样本Z检验假设要检验的统计量(近似)满足正态分布D、单样本Z检验常用于检验总体平均值是否等于某个常量【正确答案】:BCD78.建立“企业全局复用、服务标准稳态、数据融合共享”的企业中台,是公司()的重要抓手。A、数字战略升级B、组织升级C、流程升级D、技术升级【正确答案】:ABCD79.数据来源和目标用户已定的情况下,不同视觉通道的表现力不同。视觉通道的表现力的评价指标包括()。A、精确性B、可辨认性C、可分离性D、视觉突出性【正确答案】:ABCD80.在决策树基本算法中,有三种情形会导致递归返回,这三种情形分别是(__)。A、当前结点包含的样本全属于同一类别,无需划分B、当前属性集为空,或是所有样本在所有属性上取值相同,无法划分C、当前结点包含的样本集合为空,不能划分D、当前结点包含的样本不属于同一类别,不可划分【正确答案】:ABC81.注意力机制的优点有()A、参数少B、并行运算C、速度快D、时序特征【正确答案】:ABC82.下面是python标准库的是()。A、osB、sysC、numpyD、re【正确答案】:ABD83.数据销毁环节,应根据公司要求合理选择数据___措施进行处理A、恢复B、传输C、擦除D、销毁【正确答案】:ACD84.若b=np.array([True,False,False]),以下能输出[FalseTrueTrue]的是()。A、print(b-1)B、print(~b)C、print(np.logical_not(b))D、print(b)【正确答案】:BC85.在MaxComputeSQL中可以通过createtable语句创建一个新表,创建表时可以指定ifnotexists,以下说法正确的有:()。A、如果在创建表时指定ifnotexists,如果存在同名的表,则不会更改现有表,直接返回成功B、如果在创建表时指定ifnotexists,并且存在表结构不一致的同名表,此同名表会改动表结构C、如果在创建表时不指定ifnotexists,并且存在同名表,报错返回D、如果在创建表时不指定ifnotexists,无论是否存在同名表,均返回成功【正确答案】:AC86.MapReduce最早是由Google提出的分布式数据处理模型,随后受到了业内的广泛关注,并被大量应用到各种商业场景中。以下场景中,()适合用MapReduce来实现。A、交互式查询:基于海量数据的透视分析,用户可以通过上卷、下钻、切片等交互操作,了解数据集细节B、机器学习:监督学习、无监督学习、分类算法如决策树、SVM等C、文本统计分析:比如词频TFIDF分析;学术论文、专利文献的引用分析和统计;维基百科数据分析等D、Web访问日志分析;分析和挖掘用户在web上的访问、购物行为特征,分析用户访问行为【正确答案】:BCD87.以下可用于处理由于光照不均带来的影响的图像处理方法有()。A、同态滤波B、顶帽变换C、基于移动平均的局部阈值处理D、拉普拉斯算子【正确答案】:ABC88.空间域滤波是直接以图像中的像素操作为基础的滤波,空间滤波器有时也可称为()。A、空间掩膜B、核C、模板D、窗口【正确答案】:ABCD89.无master架构的MPP数据库的优势在于哪些方面:A、所有服务节点对等B、可以通过任意服务节点查询和加载数据C、无单点风险D、无性能瓶颈【正确答案】:ABC90.加强数据传输、存储过程中的安全管理,釆取()等安全技术手段,确保符合相应安全条件或技术标准,具备灾备能力,防范数据泄露、篡改、损毁、丟失风险。A、加密B、隔离C、备份D、存储【正确答案】:ABC91.大数据应用承建单位应基于项目建设方案编制实施方案,开展()等工作,确保数据完整、准确、有效,并不断跟踪反馈、迭代更新数据模型,优化数据展示场景,充分发挥大数据应用价值。A、数据溯源B、数据申请C、数据清洗D、数据建模、数据展示【正确答案】:ABCD92.对前馈神经网络的描述正确的是A、层与层之间通过“全连接”进行连接,即两个相邻层之间神经元完全成对连接B、各个神经元接受前一级神经元的输入,并输出到下一级C、同一层内神经元之间存在全连接D、同一层内的神经元互相不连接【正确答案】:ABD93.常见的核函数主要包括()。A、多项式核B、高斯核C、线性核D、拉普拉斯核E、Sigmoid核【正确答案】:ABCDE94.EDA(探索性数据分析)方法与传统统计学的验证性分析方法的区别有()。A、EDA需要事先提出假设,而验证性分析不需要B、EDA中采用的方法往往比验证性分析简单C、在一般数据科学项目中,探索性分析在先,验证性分析在后D、EDA更为简单、易学和易用【正确答案】:BCD95.大数据计算服务(MaxCompute,原ODPS)中,使用CREATETABLELIKE语句创建新表时,原表的()属性会被复制到新表上。A、列注释B、分区C、表的生命周期属性D、表注释【正确答案】:ABD96.由境外产生并跨境传输至境内的数据,应禁止()信息流入境内。A、非法B、负面C、国家安全D、非授权【正确答案】:AB97.下列有关MapReduce计算框架的描述正确的是()。A、MapReduce可以计算任务的划分和调度;B、MapReduce可完成数据的分布存储和划分;C、MapReduce可以实现处理系统节点出错检测和失效恢复;D、MapReduce可实现处理数据与计算任务的同步;【正确答案】:ABCD98.按照公司战略实施要求,立足数据发展需要,以“”为核心,建立健全数据合规管理体系。A、可靠B、可管C、可控D、可信【正确答案】:BCD99.下列关于交叉验证法描述正确的是(__)。A、交叉验证法先将数据集划分为k个大小相似的互斥子集B、交叉验证法将数据集划分成的k个子集应尽可能保持数据分布的一致性C、通常把交叉验证法称为k折交叉验证D、假定数据集D中包含m个样本,若令交叉验证法中的系数k=m,则得到了交叉验证法的一个特例:自助法【正确答案】:ABC100.大数据计算服务(MaxCompute,原ODPS)中,在做web日志分析时如果发现日志内容(对应字段log_content)中有’select’字符串,则有可能是恶意的sql注入攻击,可以使用()从日志表log中找出所有符合这种特征的访问。A、select*fromlogwheretolower(log_content)like"%select%’;B、select*fromlogwhereinstr(tolower(log_content,select')>0;C、select*fromlogwhere‘select’intolower(logcontent);D、select*fromlogwhereinstr(tolower(log_content)’select’,1)>0【正确答案】:ABD1.日常核查由业务部门负责按日执行,检查的数据范围以公司数据质量规则库覆盖的数据范围为准。A、正确B、错误【正确答案】:B2.根据项目实际情況,可将结算并入竣工决算中一起编制。项目竣工决算报告应在项目竣工验收通过后三个月内完成。A、正确B、错误【正确答案】:A3.实时在线数据分析服务,主要指对数据更新频率要求为日级以下数据进行流式加工处理的功能需求。A、正确B、错误【正确答案】:A4.persist()和cache()是RDD的缓存方法()A、正确B、错误【正确答案】:A5.开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全。A、正确B、错误【正确答案】:A6.轻度汇总层主要面向业务视角,存放具有共性需求的宽表和单指标表。A、正确B、错误【正确答案】:A7.公司数据中台初步建成,汇聚166套业务系统(137套二级部署系统、29套一级部署系统)核心数据、调控云和采集系统的实时数据,以及石油、煤炭、天然气、水资源、发电等企业外部数据。A、正确B、错误【正确答案】:A8.推进新能源预测平台和碳市场交易辅助分析产品试点培育,试点开展火电企业碳排放监测与分析,探索碳排放诊断及对标模式等业务,加强技术与商业模式创新,推进市场应用拓展。A、正确B、错误【正确答案】:A9.《中华人民共和国数据安全法》首次提出了“重要数据”概念。A、正确B、错误【正确答案】:B10.2021年,公司按照时间计划要求完成5G应用实施计划、试点应用方案编制,完成外网北斗服务平台部署,完成50座基准站接入调试和北斗服务平台功能测试。A、正确B、错误【正确答案】:B11.K-means在进行邻近性度量时的距离是欧几里得距离。A、正确B、错误【正确答案】:B12.各单位负面清单原则上应与分部负面清单保持一致,按照分部负面清单执行。A、正确B、错误【正确答案】:B13.公司持续完善“电力助乡村振兴”系列产品,孵化扶贫产业发展、美丽乡村建设、特色小镇建设等产品,加强技术与商业模式创新,推进市场应用拓展。A、正确B、错误【正确答案】:A14.ADS创建表组时,可以指定表组的副本数,表组的副本数越多,可以一定程度的增加ADS的最大承受的QPS。A、正确B、错误【正确答案】:A15.专家系统的结构选择不需要根据系统的应用环境和所执行任务的特点就可以确定。A、正确B、错误【正确答案】:B16.各部门、各分部和公司各单位要按照“谁主管谁负责,谁运营谁负责,谁使用谁负责,管业务必须管安全”的总体原则,落实数据安全保护要求。A、正确B、错误【正确答案】:B17.开展大数据应用成果年度征集遴选工作,印发大数据应用成果集,发布推介年度大数据应用优秀成果。A、正确B、错误【正确答案】:A18.重构原数据超市,能够提升用户“读数、找数、用数”体验。A、正确B、错误【正确答案】:A19.DataHub数据源作为数据中枢,可提供完善的数据导入方案,能够快速解决海量数据的资源问题。()A、正确B、错误【正确答案】:B20.数据授权流程包括需求提报、专业审核、授权实施三个环节。A、正确B、错误【正确答案】:A21.公司各级业务部门负责重要数据相关业务系统开通、数据采集、使用和发布环节的安全审核。A、正确B、错误【正确答案】:A22.开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规定不用及时告知用户并向有关主管部门报告。A、正确B、错误【正确答案】:B23.公司科技互联网专业2021年基础资源运营方面需开展业务探索,拓展基础资源综合应用业务模式,基础资源运营收入突破1亿元。A、正确B、错误【正确答案】:A24.结合负面清单使用情况,根据数据共享应用需要,国网互联网部会同总部业务部门开展负面清单优化、更新,并通过离线方式发布、使用。A、正确B、错误【正确答案】:B25.K-means是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。A、正确B、错误【正确答案】:B26.加强数据对外开放的底层设计,统筹推进公司数据开放工作,建立规范的数据开放标准、流程,实现数据有序对外开放。A、正确B、错误【正确答案】:B27.在全行业数字化转型加速的形势下,公司数字化转型窗口期转瞬即逝唯有加快自我变革,才能避免机遇的丧失。A、正确B、错误【正确答案】:A28.公司明确具有中国特色国际领先的能源互联网企业战略目标,提出“一业为主、两翼齐飞、全要素发力”发展布局,为公司数字化转型指明了方向、明确了目标。A、正确B、错误【正确答案】:B29.RIPPER是一种基于规则的分类器。A、正确B、错误【正确答案】:A30.Maxcompute中,允许的SQL的最大长度为8M。A、正确B、错误【正确答案】:B31.CF模型是基于可信度表示不确定性推理的基本方法A、正确B、错误【正确答案】:A32.基于数据中台组件和能力,研究枃构建数据应用研发平台,强化数据中台、联邦学习等前沿技术研究和落地,能够为促进数据共建共创、共用共享打下稳固基础。A、正确B、错误【正确答案】:B33.在中华人民共和国境内开展数据处理活动及其安全监管,适用《中华人民共和国数据安全法》,在中华人民共和国境外开展数据处理活动,不适用本法。A、正确B、错误【正确答案】:B34.神经网络对训练数据中的噪声不敏感。A、正确B、错误【正确答案】:A35.2021年,公司科技互联网专业需制定并印发《国网湖南电力新兴业务职责建议方案》、《1+10新兴产业升级专项行动方案》,结合“转抓强”主题活动为总抓手,高位推动新兴产业升级攻坚工程落实见效。A、正确B、错误【正确答案】:A36.任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面对中华人民共和国采取歧视性的禁止、限制或者其他类似措施的,中华人民共和国可以根据实际情况对该国家或者地区对等采取措施。A、正确B、错误【正确答案】:A37.大数据常见的计算方式有三种:离线计算、流计算以及在线计算,其中流计算是消息驱动的,数据更新一般是定时更新。A、正确B、错误【正确答案】:B38.到“十四五”末,人资管理方面,人资数据质量优化率达到95%,基本建成全业务覆盖的智慧人资管理服务体A、正确B、错误【正确答案】:A39.加快制定公司数据增值服务产品建设规范,主要指研究数据增值服务管理机制、工作流程、产品开发策略,制订公司数据增值服务指导意见,推进业务规范化高质量发展。A、正确B、错误【正确答案】:A40.每日业务指标报表生成可使用实时在线数据分析服务。A、正确B、错误【正确答案】:B41.湖南省坚持“三新四高”发展战略,聚焦国家重要先进制造业、科技创新、内陆地区改革开放,旨在推动中部地区崛起和长江经济带发展。A、正确B、错误【正确答案】:B42.关于MaxCompute提供了完善的SQL访问,有效支持事务。A、正确B、错误【正确答案】:B43.国网大数据中心是公司数据管理的专业支撑机构,在总部互联网部和业务部门的委托和指导下,承担具体的数据管理和应用工作。A、正确B、错误【正确答案】:A44.DBSCAN是一种基于原型的、划分的聚类技术。A、正确B、错误【正确答案】:B45.充分运用调控电力大数据,可以准确辨识大电网运行风险,防范极端天气或自然灾害造成的电网重大风险。A、正确B、错误【正确答案】:A46.从Maxcompute导入数据到ADS的时候,导入路径格式为:.odps://project_name/table_name。()A、正确B、错误【正确答案】:B47.在0,1,„,9,这10个数字当中,一次任取两个,则抽到5这个数字的概率是0.1.A、正确B、错误【正确答案】:B48.推进基础资源商业化运营。深入挖掘公司现有场站、杆塔、沟道等电网基础资源的共享渠道和应用潜能,面向运营商、互联网企业等推进基础资源商业化运营,提高存量资产利用效率。可以适当降低安全底线。A、正确B、错误【正确答案】:B49.湖南省电力有限公司计划2022年6月正式上线指标中心。A、正确B、错误【正确答案】:A50.数组的切片是原数组的副本。()A、正确B、错误【正确答案】:B51.Spark组件不包括ResourceManager、Executor、Driver、RDDA、正确B、错误【正确答案】:B52.数字化转型可以看做是打造传统意义上的互联网企业。A、正确B、错误【正确答案】:B53.开展冬奧对旅游等关联行业协同发展分析,能够研判冬奥赛区及周边经济运行与人员流动状况,助力冬奥拉动区域及产业发展。A、正确B、错误【正确答案】:A54.K-means是一种基于密度的产生划分聚类的聚类算法。A、正确B、错误【正确答案】:B55.启发式搜索一定比盲目式搜索好A、正确B、错误【正确答案】:B56.公司科技互联网专业2021年工作目标有:业绩指标上创一流、产业发展上有跨越、数字转型上有突破。A、正确B、错误【正确答案】:A57.虚假数据的存在会
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年企业员工派遣服务协议
- 2024南京住宅二手交易协议范本
- 2024年第三方商铺租赁协议
- 商铺租赁协议书2024年
- 2024年协议管理流程及岗位职责
- 2024年担保公司贷款协议格式
- 2024水利设施堤坝施工合作协议
- 2024年酒店管理承包协议格式
- 2024年二手物资买卖协议模板
- 2024年度软件定制开发服务协议模板
- 廉洁风险点及控制措施
- 2024年广西来宾产业投资集团有限公司招聘笔试参考题库含答案解析
- 项目管理甘特图课件
- 2024年甘肃省普通高中信息技术会考试题(含24套)
- 我国的武装力量课件
- 液化石油气瓶安全使用告知书范文
- 供应室护理责任组长竞聘
- 高中数学教师的专业发展路径
- LTC与铁三角从线索到回款
- 《旅游市场营销》课程教学设计
- 工程流体力学课后习题答案-(杜广生)
评论
0/150
提交评论