大数据练习测试题附答案_第1页
大数据练习测试题附答案_第2页
大数据练习测试题附答案_第3页
大数据练习测试题附答案_第4页
大数据练习测试题附答案_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页大数据练习测试题附答案1.下面哪个属于映射数据到新的空间的方法?A、傅立叶变换B、特征加权C、渐进抽样D、维归约【正确答案】:A2.机器学习中,下面哪些方法不可以避免分类中的过拟合问题?A、增加样本数量B、增加模型复杂度C、去除噪声D、正则化【正确答案】:B3.下面关于循环神经网络说法错误的是()A、循环神经网络用于静态输出B、循环神经网络通过使用带自反馈的神经元,能够处理任意长度的时序数据C、循环神经网络具有短期记忆能力,相当于存储装置,因此其计算能力十分强大D、循环神经网络时间扩展,神经元与多个时间输出计算【正确答案】:A4.以电力数据()服务为核心动能,驱动新兴业务拓展。A、挖掘B、应用C、信用D、增值【正确答案】:C5.个人信息的保存期限的要求原则是()。A、实现处理目的之后15天B、实现处理目的之后30天C、所必要的最短时间D、所必要的最长时间【正确答案】:C6.现实中往往会遇到“不完整”的训练样本,在这种存在属性变量值未知的情形下,可用()。A、边际似然B、EM算法C、贝叶斯决策D、贝叶斯分类器【正确答案】:B7.建立与政府主管部门、行业协会、专家学者的有效沟通机制,组织各级单位积极参与《数据安全法》、《》等国家、地方和行业数据相关法律法规。A、《个人信息保护法》B、《网络安全法》C、《保守国家秘密法》D、《网络产品和服务安全审查办法(试行)》【正确答案】:A8.运行下面的代码,输出结果是()。importnumpyasnpn=np.array([[1,2,3],[4,5,6]])print(n.size)A、2B、6C、(2,3)D、(3,2)【正确答案】:B9.Apriori算法的计算复杂度受()影响。①支持度阀值②项数(维度)③事务数④事务平均宽度A、①②③④B、②③④C、①③④D、①②③【正确答案】:A10.至十四五末,公司企业中台公共服务共享使用率将达到()。A、80%B、85%C、90%D、100%【正确答案】:D11.Python运算符中用来计算集合并集的是()A、|B、&C、||D、+【正确答案】:A解析:

Python运算符中用来计算集合并集的是单竖线12.梯度下降算法的正确步骤是什么?1.计算预测值和真实值之间的误差;2.重复迭代,直至得到网络权重的最佳值;3.把输入传入网络,得到输出值;4.用随机值初始化权重和偏差;5.对每一个产生误差的神经元,调整相应的(权重)值以减小误差。A、1,2,3,4,5B、5,4,3,2,1C、3,2,1,5,4D、4,3,1,5,2【正确答案】:D13.下列代码中,返回每一列中的非空值的个数的是()A、df.corr()B、df.count()C、df.isnull()D、df.notnull()【正确答案】:B14.你正在训练RNN网络,发现你的权重与激活值都具有NaN的值(“非数字”)。以下哪项最可能是此问题的原因?A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了【正确答案】:B15.CREATETABLEAS创建表,后面需要添加查询语句类型是:()。A、INSERTB、UPDATEC、SELECTDELETE【正确答案】:C16.当Spark发生Shuffle时,MapTask的运算结果会通过()的形式把运算结果分发到对应的任务上去。A、序列化B、键值对C、二进制D、RDD【正确答案】:C17.在一个神经网络中,下面哪种方法可以用来处理过拟合()A、DropoutB、分批归一化(BatchC、正则化(regularization)D、都可以【正确答案】:D18.涉及个人信息处理的部门和单位,在制定相关制度时应明确(),建立体系化、多层次的告知同意机制,并采取必要的技术措施确保收集的个人信息安全。A、信息加工方式B、数据使用目的C、收集信息处理D、个人信息处理规则【正确答案】:D19.在回归分析中,说法正确的是()。A、解释变量和被解释变量都是随机变量B、解释变量为非随机变量,被解释变量为随机变量C、解释变量和被解释变量都为非随机变量D、解释变量为随机变量,被解释变量为非随机变量【正确答案】:B20.SVM模型通过最大化边界实现线性分类,以下哪个可以使得SVM实现非线性分类()A、松弛变量B、对偶空间求解C、kernelD、SMO算法【正确答案】:C21.数据变换的策略包括()。A、平滑处理、特征构造、聚集、标准化、离散化B、平滑处理、特征构造、聚集、审计、离散化C、平滑处理、标准化、聚集、审计、离散化D、特征构造、聚集、标准化、审计、离散化【正确答案】:A解析:

数据变换策略主要包括光滑、聚集、数据泛化、规范化、属性构造和离散化。22.国网公司坚持数据“一处生成、多处使用”,明确权威数据源引用规范,开展权威数据源中台标注,推进权威数据源在中台的落地应用,常态推进()治理。A、数据源头B、数据中台C、业务中台D、数据应用【正确答案】:A23.数据质量的基本属性不包括()A、正确性B、时效性C、一致性D、完整性【正确答案】:B24.以下哪项是对早期停止(earlystop)的最佳描述?()。A、训练网络直到达到误差函数中的局部最小值B、在每次训练期后在测试数据集上模拟网络,当泛化误差开始增加时停止训练C、在中心化权重更新中添加一个梯度下降加速算子,以便训练更快地收敛D、更快的方法是反向传播算法【正确答案】:B25.以下()是数据业务图谱底座具备的功能。A、数据检索B、图谱展示C、动态数据集D、以上都是【正确答案】:D26.优化配电网运行,构建()等应用场景,优化停电策略,降低停电影响,提升配电网可靠性。A、精准停电分析B、精准故障抢修C、优化停电策略D、降低停电影响【正确答案】:B27.下面哪个问题不适合使用机器学习方法解决()。A、判断电子邮件是否是垃圾邮件B、判断给定的图中是否有环C、判断是否给指定用户办理信用卡D、对滴滴拼车乘客分簇【正确答案】:B28.关于Python的数字类型,以下选项中描述错误的是A、python整数类型提供了4种进制表示:十进制、二进制、八进制和十六进制B、python语言提供int、float、complex等数字类型C、python语言要求所有浮点数必须带有小数部分D、python语言中,复数类型中实数部分和虚数部分的数值都是浮点类型,复数的虚数部分通过后缀“C”或者“c”来表示【正确答案】:D29.与传统机器学习方法相比,深度学习的优势在于()。A、深度学习可以自动学习特征B、深度学习完全不需要做数据预处理C、深度学习完全不提取底层特征,如图像边缘、纹理等D、深度学习不需要调参【正确答案】:A30.下列哪一项不是神经网路常用的激活函数()A、Sigmoid函数B、sin函数C、sign函数D、tanh函数【正确答案】:B31.公司内部共享数据时,应遵照()开展。原则上除列入负面清单的数据外,其余数据均可在公司内部共享。A、数据共享负面清单B、数据业务管理C、运维职责划分D、使用单位【正确答案】:A32.关于Attention-basedModel,下列说法正确的是()。A、相似度度量模型B、是一种新的深度学习网络C、是一种输入对输出的比例模型D、都不对【正确答案】:A33.机器学习和深度学习的关系是()。A、深度学习包含机器学习B、机器学习包含深度学习C、二者是独立的D、二者相互促进【正确答案】:B34.企业中台中不包含()A、业务中台B、数据中台C、技术中台D、应用中台【正确答案】:D35.加强数据合规管理顶层设计,强化跨专业、跨层级统筹协调,建立健全()工作机制,确保公司数据合规管理工作有力、有序、有效推进。A、闭环B、协同C、安全D、监控【正确答案】:B36.个人信息数据收集应遵循不包括____的原则A、合法B、正当C、必要D、可溯源【正确答案】:D37.数据归一化属于下面哪个阶段()A、数据采集B、数据预处理C、特征提取D、特征选择【正确答案】:B38.以下对Python程序设计风格描述错误的选项是:A、Python中不允许把多条语句写在同一行B、PythonC、Python语句中,增加缩进表示语句块的开始,减少缩进表示语句块的退出D、Python可以将一条长语句分成多行显示,使用续航符“\”【正确答案】:A39.公司()委员会负责数据合规管理工作统筹领导。A、信息安全B、网络安全C、安全领导D、合规管理【正确答案】:D40.阅读以下文字:假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置,你应该()A、除去神经网络中的最后一层,冻结所有层然后重新训练B、对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对【正确答案】:B41.哪个选项是使用PyInstaller库对Python源文件打包的基本使用方法?A、pip-hB、pipinstall<拟安装库名>C、pipdownload<拟下载库名>D、pyinstaller需要在命令行运行:\>pyinstaller【正确答案】:D42.HDFS集群中的namenode职责不包括()A、维护HDFS集群的目录树结构B、维护HDFS集群的所有数据块的分布、副本数和负载均衡C、负责保存客户端上传的数据D、响应客户端的所有读写数据请求【正确答案】:C43.下面算法属于局部处理的是()。A、灰度线性变换B、二值化C、傅里叶变换D、中值滤波【正确答案】:D44.以下哪种方法可以将json字符串转换为Python形式()。A、read_jsonB、json.transC、json.loadsD、json.dumps【正确答案】:C45.数据传输环节,在互联网大区传输重要数据时应()。A、加密保护B、明文传输C、明文接收D、任意操作【正确答案】:A46.Hadoop中partition函数描述正确的是()A、分区函数B、特征函数C、算法函数D、排序函数【正确答案】:A47.一个HDFS集群是由一个()和多个数据节点组成。A、索引节点B、根节点C、名字节点D、数据节点【正确答案】:C解析:

HDFS是一个主从结构。一个HDFS集群是由一个名字节点(NameNode)和多个数据节点(DataNode)组成,它们通常配置在不同的机器上。48.下列哪些不是目前机器学习所面临的问题是()。A、测试集的规模B、维度灾难C、特征工程D、过拟合【正确答案】:A解析:

目前,机器学习领域所面临的主要挑战包括过拟合、维度灾难、特征工程、算法的可扩展性49.下列关于随机森林和GBDT的书法正确的是()A、在随机森林的单个树中,树和树之间是有依赖的,而GBDT中的单个树之间是没有依赖的B、这两个模型都使用随机特征子集,来生成许多单个的树C、我们可以并行地生成GBDT单个树,因为它们之间是没有依赖的D、GBDT训练模型的表现总是比随机森林好【正确答案】:B50.从内外部环境与市场需求来看,哪项是大数据应用的业务规划将聚焦核心领域。A、电网运营B、科技创新C、新兴产业D、供电保障【正确答案】:A51.数据安全,是指通过采取必要措施,确保数据处于有效保护和()的状态,以及具备保障持续安全状态的能力。A、合法利用B、合法获取C、规范使用D、安全传输【正确答案】:A解析:

《中华人民共和国数据安全法》第三条:数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。52.年度需求由()统筹组织开展储备与立项工作。A、互联网部B、信息化部C、数字化工作部D、科技信息部【正确答案】:C53.数据资产质量管理遵循“谁产生、谁负责”的原则,明确数据资产质量的责任归属,同一责任人产生的同一数据项一年内出现()以上质量问题,对责任单位予以通报批评,同时按照公司员工奖惩规定第十二条追究相关人员责任,具体惩处按照公司员工违规违纪行为惩处细则第十三条执行。A、一次B、两次C、三次D、三次以上【正确答案】:B54.梯度提升树属于()模型。A、概率模型B、集成模型C、距离模型D、神经网络模型【正确答案】:B解析:

梯度提升树,是属于集成算法中boosting类的一种算法。55.神经网络模型(NeuralNetwork)因受人类大脑的启发而得名。神经网络由许多神经元(Neuron)组成,每个神经元接受一个输入,对输入进行处理后给出一个输出,请问下列关于神经元的描述中,哪一项是正确的?A、每个神经元可以有一个输入和一个输出B、每个神经元可以有多个输入和一个输出C、每个神经元可以有一个输入和多个输出D、上述都正确【正确答案】:D解析:

每个神经元可以有一个或多个输入,和一个或多个输出。56.()算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。AprioriB、EMC、PCD、PAC【正确答案】:A解析:

“Apriori算法是一种挖掘关联规则的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集。”57.各级单位网络安全归口管理部门是本单位网络安全等级保护工作归口管理部门,主要职责是不包括()A、本单位自建管理信息系统安全防护方案审查工作;B、本单位由本专业负责建设的信息系统的网络安全等级保护各环节工作。C、负责对本单位信息客服工作提出业务需求和目标;D、负责与所在地公安机关、行业主管部门的网络安全等级保护工作对接;【正确答案】:C58.若数据量较大,下面哪种方式比较适合()A、系统聚类B、快速聚类(k-means)C、A和B都可以D、A和B都不可以E、A【正确答案】:B59.关于OLAP的特性,下面正确的是:(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性()A、(1)(2)(3)B、(2)(3)(4)C、(1)(2)(3)(4)D、(1)(2)(3)(4)(5)【正确答案】:D解析:

olap的特点是快速性、可分析性、多维性、信息性、共享性60.依托数据建模与仿真,实现经营管理的流程可视、()可控、问题可溯,持续提升科学决策能力、业务运行效率和风险管控水平。A、业务B、管理C、经营D、运营【正确答案】:D61.以下哪种不是Hive支持的数据类型()A、StructB、IntC、MapD、Long【正确答案】:D62.以下()不是NoSQL数据库。A、MongoDBBigTableC、HBaseD、Access【正确答案】:D解析:

1.access的数据库类型是:关系型数据库。2.NoSQL数据库的分类:列存储(HBase)、文档存储(MongoDB)、Key-Value存储(Redis)、图存储(FlockDB)、对象存储(db4o)、XML存储(BaseX)、bigtable等63.输入图像已被转换为大?为28×28的矩阵和大?为7×7的步幅为1的核?/滤波器。卷积矩阵的大小是多少?A、22X22B、21X21C、28X28D、7X7【正确答案】:A64.在数据集中,记录关于一个事件或对象的描述称为____。A、子类B、元素C、属性D、样本【正确答案】:D解析:

样本:数据集中每条记录是关于一个事件或对象的描述,称为"样本",简单来说,一行为一个样本”65.plt.contourf(X,Y,f(X,Y),8,alpha=.75,cmap=plt.cm.hot),cmap表示()。A、图例风格B、颜色映射风格C、网格线类型D、透明度【正确答案】:B66.P{H|X}是给定观测值X条件下H出现的概率,统称为(__)。A、先验概率B、后验概率C、条件概率D、模型【正确答案】:B67.常用损失函数不包括()。A、均方差损失B、交叉熵损失C、L1损失D、协方差损失【正确答案】:D68.添加dropout是为了解决()问题。A、欠拟合B、过拟合C、训练过慢D、样本少【正确答案】:B69.(__)在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A、支持向量机Boosting算法C、贝叶斯分类器D、神经网络【正确答案】:B70.各单位要坚持总体(),持续跟踪国家关于数据安全的法律法规,全面贯彻落实相关要求,以法律法规为指引,开展相关工作,确保数据全生命周期安全合规,提高数据安全保障能力。A、国家大局观B、政治方向正确C、国家安全观D、社会安定【正确答案】:C71.哪种策略可以加速词向量训练()。A、para2vectB、层级softmaxC、最大似然估计D、以上都不对【正确答案】:B72.()负责数据活动合法合规性审核,为数据合规管理提供法律合规支持。A、互联网部B、法律部C、办公室D、安监部【正确答案】:B73.()在训练的每一轮都要检查当前生成的基学习器是否满足基本条件。A、支持向量机Boosting算法C、贝叶斯分类器D、Bagging算法【正确答案】:B74.对于一个图像识别问题(在一张照片里找出一只猫),下面哪种神经网络可以更好地解决这个问题()A、循环神经网络B、感知机C、多层感知机D、卷积神经网络【正确答案】:D75.如果问题存在最优解,则下面几种搜索算法中,广度优先搜索必然可以得到该最优解,()可以认为是“智能程度相对比较高”的算法。A、无界深度优先搜索B、深度优先搜索C、有界深度优先搜索D、启发式搜索【正确答案】:D76.以下关于traintestsplit函数的说法正确的是()。A、train_test_split能够将数据集划分为训练集、验证集和测试集B、生成的训练集和测试集在赋值的时候可以调换位置,系统能够自动识别C、train_test_split每次的划分结果不同,无法解决D、train_test_split函数可以自行决定训练集和测试集的占比【正确答案】:D77.下列关于Sigmoid函数的说法中,错误的是()。A、存在梯度爆炸的问题B、不是关于原点对称C、计算exp比较耗时D、存在梯度消失的问题【正确答案】:A78.LSTM网络引入门控机制来控制信息传递的路径,其中输入门的作用是()A、控制上一个时刻的内部状态需要遗忘多少信息B、控制上一个时刻的内部状态有多少信息需要保存C、控制当前当刻的候选状态有多少信息需要保存D、控制当前当刻的内部状态有多少信息需要输出给外部状态【正确答案】:C79.下列选项中,()不是经典图像分割方法A、基于内容的分割方法B、基于阈值的分割方法C、基于边缘的分割方法D、基于基因编码的分割方法【正确答案】:A80.以下扫描算子中用于对列存表进行扫描的算子是:()。A、SeqScanB、CstoreScanC、SubqueryScanD、ValuesScan【正确答案】:B81.下列哪些项目是在图像识别任务中使用的数据扩增技术(dataaugmentationtechnique)?1水平翻转(Horizontalflipping);2随机裁剪(Randomcropping);3随机放缩(Randomscaling);4颜色抖动(Colorjittering);5随机平移(Randomtranslation);6随机剪切(Randomshearing)A、1,3,5,6B、1,2,4C、2,3,4,5,6D、所有项目【正确答案】:D82.在手写数字识别的例子中,输入的图片为长和宽都是28像素的图片,输出判断数字0-9的概率。要构建前馈型神经网络去解决这个问题,输入层是()维的,输出层是()维的A、28,10B、28,1C、784,10D、784,1【正确答案】:C83.如果训练一个RNN网络时发现权重与激活值都是,则导致这个问题最有可能的原因是()。A、梯度消失B、梯度爆炸C、ReLUD、Sigmoid【正确答案】:B84.以下程序的输出结果是:ab=4defmyab(ab,xy):ab=pow(ab,xy)print(ab,end="")myab(ab,2)print(ab)A、164B、44C、1616D、416【正确答案】:A85.运行以下程序,从键盘输入1+2与4j,则输出结果是:x=eval(input())y=eval(input())print(abs(x+y))A、5.0B、5C、<class‘complex’>D、<class‘float’>【正确答案】:A86.假设数据集中有100条数据,设置batch_size为4,那么跑完一轮模型会迭代多少次()。A、400B、100C、25D、4【正确答案】:C87.假设已经在ImageNet数据集(物体识别)上训练好了一个卷积神经网络。然后给这张卷积神经网络输入一张全白的图片。对于这个输入的输出结果为任何种类的物体的可能性都是一样的,对吗?A、对的B、不知道C、依情况而定D、不对【正确答案】:D88.下列关于可视化方法体系说法不正确的是()。A、通常采用视觉图形元素和视觉通道两个维度进行视觉编码B、常用的共性方法有统计图表、图论方法、视觉隐喻和图形符号学等C、领域方法在所属领域内其可视化的信度和效果往往低于基础方法的直接应用D、视觉编码为其他数据可视化方法提供了方法学基础【正确答案】:C89.以下哪些方法不能用于处理过拟合?A、减少特征维度,防止维灾难B、增大数据的训练量C、利用正则化技术D、增加特征维度【正确答案】:D90.优化(),建立设备绩效和供应商业绩之间的关联关系,实现设备质量评价管理闭环,建立健全供应商信用风险评估体系,优化采购模式与供应商管理。A、设备质量监管B、设备物资供应链C、设备供应商管理D、设备质量评价管理【正确答案】:B91.以下不属于神经网络模型的是()A、DNNB、CNNC、KNND、RNN【正确答案】:C解析:

神经网络的具体形式:卷积神经网络模型(CNN)、网络森林(KNN)、循环神经网络模型(RNN)92.提升卷积核(convolutionalkernel)的大小会显著提升卷积神经网络的性能,这种说法是()A、正确B、错误C、视具体情况而定D、以上都不正确【正确答案】:B93.使用预训练模型进行特征提取,要训练的部分是()。A、全连接分类器B、高层卷积层C、底层卷积层D、整个网络【正确答案】:A94.RNN不同于其它神经网络的地方在于()。A、实现了记忆功能B、速度快C、精度高D、易于搭建【正确答案】:A解析:

“RNN网络和其它网络的不同之处在于RNN可以实现某种记忆功能,是进行时间序列分析的最好选择95.为了保证数据服务API的可用性,数据服务允许的API结果最长返回时间是()A、10秒B、20秒C、25秒D、30秒【正确答案】:B96.当闵可夫斯基距离公式中的系数p值为2时,可得到(__)的公式。A、欧氏距离B、曼哈顿距离C、街区距离D、切比雪夫距离【正确答案】:A97.通过池化降低空间维度的做法不但降低了计算开销,还使得卷积神经网络对于噪声具有()。A、健壮性B、静态性C、局部性D、准确性【正确答案】:A98.训练一个RNN网络,如果权重与激活值都是,下列选项中,哪一个是导致这个问题的最有可能的原因()A、梯度消失B、梯度爆炸C、ReLU函数作为激活函数g(.),在计算g(z)时,z的数值过大了D、Sigmoid函数作为激活函数g(.),在计算g(z)时,z的数值过大了【正确答案】:B99.加强公司大数据应用项目化管理,建立全生命周期管理机制,运用数字化技术,强化()等关键环节和关键要素的在线管控力度,提升公司大数据应用管理规范性。A、职责、流程、制度、标准、评价B、职责、制度、流程、标准、评价C、职责、流程、标准、制度、评价D、职责、标准、制度、流程、评价【正确答案】:A100.大数据应用评价与成果管理不包括()A、应用成效评估、工作评价B、适用频率C、增加经济效益D、论文数量【正确答案】:D1.下列哪些是传统RDBMS的缺点()A、表结构schema扩展不方便B、全文搜索功能较弱C、大数据场景下I/O较高D、存储和处理复杂关系型数据功能较弱【正确答案】:ABCD2.国网数据中台能力架构中数据接入能力包含()。A、数据复制B、ETLC、数据交换D、消息队列【正确答案】:ABCD3.使用MySQL客户端连接ADS时,()信息是必须的。A、端口B、服务器地址C、数据库名称D、AccountID【正确答案】:ABC4.实现对多种能源的(),充分结合市场机制、价格机制,优化调度运行方案,实现多元能源主体之间的智能协同。A、全息感知B、智能预测C、精准调度D、自动化监控【正确答案】:ABC5.常见的原型聚类算法包括()。A、k均值算法B、学习向量量化C、高斯混合聚类D、密度聚类【正确答案】:ABC6.充分发挥数据在公司战略实施中的基础支撑作用,防范数据泄露、____、____、____、非法使用等事件对公司造成的不良影响A、篡改B、窃取C、损毁D、删除【正确答案】:ABC7.各单位要坚持维护()并重。A、数据管理B、数据安全C、促进数据利用D、促进数据开发利用【正确答案】:BD8.下面关于Python中的列表和字典说法正确的是()。A、字典和列表都可以通过“[]”操作符访问元素的值B、列表的索引必须是整型数或者切片C、字典不过是列表的另一个名字。二者没有区别D、字典的长度是动态的,而列表的长度是固定的【正确答案】:AB9.关于Hbase存储模型的描述正确的是:()。A、即使是:key值相同,qualifier也相同的多个KeyValue也可能有:多个,此时使用时间戳来区分B、同一个key值可以关联多个valueC、keyvalue中期有:时间戳,类型等关键信息D、每一个keyvalue都有:一个qualifier标识【正确答案】:ABCD10.下列关于极大似然估计(MaximumLikelihoodEstimate,MLE),说法正确的是(__)。A、MLE可能并不存在B、MLE必定存在C、即使MLE存在,解也不一定唯一D、如果MLE存在,那么它的解一定是唯一的【正确答案】:AC11.公司各级大数据中心、信通公司是大数据应用管理的专业支撑单位,负责组织开展大数据应用平台、服务目录等基础环境建设,保障数据及运营安全,提供()、()和()支持。A、数据B、算法C、平台D、算力资源【正确答案】:ABD12.以下()方法可以支持MaxCompute中受保护项目空间的数据流出。A、使用owner通过ACL授权B、使用owner通过policy授权C、设置例外D、设置项目互信【正确答案】:CD13.训练CNN时,GPU显存溢出,此时可以采取什么办法?()A、减少mini_batch大小B、移除一些卷积层C、减少图片输入大小D、增加激活函数【正确答案】:ABC14.下面是Numpy支持的统计函数有()。A、minB、maxC、medianD、mean【正确答案】:ABCD15.Maxcompute中,当一个大表和多个小表做连接时,可以考虑使用mapjoin,以下关于mapjoin的限制,说法正确的是:()。A、leftouterjoin的左表必须是大表,innerjoin左表或者右表都可以为大表B、fullouterjoin不能使用mapjoinC、最多支持8张小表D、所有小表占用内存综合不能超过256M【正确答案】:AB16.下列在Python中描述正确的是()。A、pass语句不会执行任何操作,一般作为占位符或者创建占位程序B、sorted可以对列表进行排序C、内建的数据类型丰富,除了字典和列表外,还有集合(set)元组(tuple)等类型D、分号在Python中是无用途【正确答案】:ABC17.训练CNN时,GPU显存溢出,此时可以采取什么办法()A、减少mini_batch大小B、移除一些卷积层C、减少图片输入大小D、增加激活函数【正确答案】:ABC18.Flink支持的时间操作类型包括:以下()选项。A、结束时间B、处理时间C、采集时间D、事件时间【正确答案】:BD19.在ADS中,两个事实表进行join的充要条件包括:()。A、两张表的hash分区数必须一致B、两个表在一个表组C、两张表的joinkey至少有一列建立了hashmap索引D、两个表的joinkey是hash分区列【正确答案】:ABCD20.统计模式分类问题中,当先验概率未知时,可以使用()。A、最小最大损失准则B、最小误判概率准则C、最小损失准则D、N-P判决【正确答案】:AD21.大数据成果应用管理,主要包括:A、成果共享B、成果应用C、成果推广D、成果变现【正确答案】:ABC22.为什么正则化能处理过拟合?A、惩罚了模型的复杂度,避免模型过度学习训练集,提高泛化能力B、剃刀原理:如果两个理论都能解释一件事情,那么较为简单的理论往往是正确的C、正则项降低了每一次系数w更新的步伐,使参数更小,模型更简单D、贝叶斯学派的观点,认为加入了先验分布(l1拉普拉斯分布,l2高斯分布),减少参数的选择空间【正确答案】:ABCD23.加强数据合规管理体系建设包括:A、强化数据合规的组织管理B、加强数据合规管理制度建设C、完善数据合规管理工作机制D、培育公司数据合规文化。【正确答案】:ABCD24.以下哪些神经网络结构使用了卷积层?A、LeNet-5B、GRUC、LSTMD、VGG【正确答案】:AD25.根据训练数据是否拥有标记信息,学习任务可大致分为(___)和(___)。A、监督学习B、训练集C、无监督学习D、测试集【正确答案】:AC26.深度神经网络的构成中,把卷积层放在前面,全连接层放在后面。以下说法正确的是?A、用卷积层提取特征B、pooling的下采样能够降低overfittingC、全连接层只能有一层D、激活函数relu可以用到卷积层【正确答案】:ABD27.使用大数据计算服务中的MR时,MR中的()操作会引发Java安全沙箱的限制而报错。A、起子进程执行Linux命令B、获取本地IPC、本地文件以资源方式上传至大数据计算服务,在MR中以资源方式访问该文件D、Java反射限制【正确答案】:ABD28.数据管理指对数据生命周期的每个阶段里可能引发的各类数据质量问题,进行()等一系列管理活动,并通过改善和提高组织的管理水平是的数据质量获得进一步提高。A、识别B、度量C、监控D、预警【正确答案】:ABCD29.数据科学项目主要涉及的活动包括()。A、模式/模型的应用及维护B、模式/模型的洞见C、结果的可视化与文档化D、模式/模型的验证和优化【正确答案】:ABCD30.关于降维说法正确的是()。A、PA是根据方差这一属性降维的B、降维可以防止模型过拟合C、降维降低了数据集特征的维度D、降维方法有PLA等【正确答案】:ACD31.Feigenbaum等人在著名的《人工智能手册》中将机器学习划分为机械学习和(_)四种。A、深度学习B、示教学习C、类比学习D、归纳学习【正确答案】:BCD32.根据业界研究,企业数字化转型在()三方面都呈现出新的趋势A、要素驱动B、流程变革C、技术创新D、价值创造【正确答案】:ABD33.若b=np.array([True,False,False]),以下能输出[FalseTrueTrue]的是()。A、print(b-1)B、print(~b)C、print(np.logical_not(b))D、print(b)【正确答案】:BC34.假设一个随机变量服从正态分布,则随机变量的概率分布跟其()和()有关。A、众数B、频数C、平均值D、方差【正确答案】:CD35.关于MaxCompute的视图的描述,下列正确的是:()。A、视图可以引用视图,包括自身B、创建视图时,必须对引用表有读权限C、如果想保存当前视图中的数据,可以插入一张表或者使用物化视图D、视图只能包含一个有效的select语句【正确答案】:BD36.下列选项中,哪几项属于卷积神经网络减少模型参数量的措施()。A、稀疏连接B、参数共享C、池化操作D、稠密链接【正确答案】:AB37.卷积神经网络能通过卷积以及池化等操作将不同品种的鸟归为一类。关于卷积神经网络能达到该效果的原因,下列说法正确的是()A、同样模式的内容(如鸟嘴)在图像不同位置可能出现B、池化作用能使不同种类鸟变得相似C、不同种类的相同部位(如鸟嘴)形状相似D、池化之后的图像主题内容基本不变【正确答案】:ACD38.从形式语言表达能力而言,规则可分为两类:(__)和(__)。A、命题规则B、一阶规则C、原子命题D、逻辑连接词【正确答案】:AB39.人工智能网络的常用激活函数有A、sigmonB、tanhC、sinhD、relu【正确答案】:ABD40.下列属于数值优化算法的是()。A、梯度下降法B、牛顿法C、极大似然法D、逻辑回归【正确答案】:AB41.在MaxComputeSQL中可以通过createtable语句创建一个新表,创建表时可以指定ifnotexists,以下说法正确的有()。A、如果在创建表时指定ifnotexists,如果存在同名的表,则不会更改现有表,直接返回成功B、如果在创建表时指定ifnotexists,并且存在表结构不一致的同名表,此同名表会改动表结构C、如果在创建表时不指定ifnotexists,并且存在同名表,报错返回D、如果在创如果在创建表时不指定ifnotexists,无论是否存在同名表,均返回成功建表时不指定if【正确答案】:AC42.Spark的部署模式包括()。A、本地模式B、standalone模式C、SparkonyarnD、mesos模式【正确答案】:ABCD43.对于ADS的特色功能,以下说法正确的是:()。A、智能自动索引会自动为导入数据的每一列创建符合该列情况的索引类型,无需用户显式指定创建索引或索引类型B、聚集列能智能提升查询性能C、多值列支持in、contains等查询D、ADS采用高职能的基于规则的优化策略【正确答案】:ABC44.Python的模块符合以下哪些说法()。A、模块让你能够有逻辑地组织你的B、Python拥有丰富的模块,不支持自定义模块C、把相关的代码分配到一个模块里能让你的代码更好用,更易懂D、模块能定义函数,类和变量,模块里也能包含可执行的代码。【正确答案】:ACD45.健全数据合规管理体系,落实管理职责,强化横向协调和纵向指导,突出事前____和过程____,加强违规事件应对____,严格管控数据合规风险。A、防范B、管控C、处置D、预防【正确答案】:ABC46.传统关系数据库的优点包括()。A、数据一致性高B、数据冗余度低C、简单处理的效率高D、产品成熟度高【正确答案】:ABD47.以下关于降维方法,叙述正确的是()。A、主成分分析是一种常用的非线性降维方法B、核化线性降维是一种常用的线性降维方法C、流形学习是一种借鉴拓扑流形概念的降维方法D、度量学习绕过降维的过程,将学习目标转化为对距离度量计算的权重矩阵的学习【正确答案】:CD48.关于数据中台架构原则,以下说法正确的是()。A、模型统一B、资源汇聚C、同源维护D、共建共享【正确答案】:ABCD49.建立(),规范数据信息擦除与销毁手段和方法,实现对数据的有效销毁,防范数据泄露风险。A、数据销毁流程B、审批机制C、合规机制D、数据存储流程【正确答案】:AB50.常见的核函数主要包括()。A、多项式核B、高斯核C、线性核D、拉普拉斯核E、Sigmoid核【正确答案】:ABCDE51.请选择所有匹配项:下面哪些literal拥有数值数据类型(即哪些可用于算术表达式)()。A、0xffB、99C、122D、"1002"【正确答案】:ABC52.组织幵展数据按需脱敏、数据加密、数据应用分区保护、数据防泄漏、数据授权数据审计等安全防护相关专业技术的深入研究,强化数据在()过程中的安全管理。A、存储B、流转C、处理D、使用【正确答案】:BD53.相对于HadoopMapReduce,Spark有什么好处()。A、通用性;B、易用性;C、速度快;D、容错性;【正确答案】:ABC54.以下方法中可用于图像分割的有()。A、霍夫曼编码B、分水岭算法C、K-meansD、区域增长法【正确答案】:BCD55.按规定开展网络安全等级保护测评,强化()等技术措施;除非获得用户明确授权,未经脱敏处理的原始用户隐私数据等敏感数据限于公司内网传输、存储。A、信息脱敏B、定密加密C、去标识化D、去中心化【正确答案】:ABC56.在网络爬虫的爬行策略中,应用最为常见的是()。A、深度优先遍历策略B、广度优先遍历策略C、高度优先遍历策略D、反向链接策略E、大站优先策略【正确答案】:AB57.神经网络中参数极多,常用的初始化方法有哪些?A、全零初始化B、随机初始化C、加载预训练模型D、使用深度信念网络【正确答案】:ABC58.在数据安全领域常用的P2DR模型中,P2、D和R代表的是()。A、策略B、防护C、检测D、响应【正确答案】:ABCD59.tunnelupload命令可以上传数据到大数据计算服务中去,请判断以下()数据对象可以作为上传的目标。A、资源B、非分区表C、视图D、分区表【正确答案】:BD60.以下属于统一视频平台的设计思想的是()A、标准B、开放C、迭代D、兼容【正确答案】:ABCD61.MaxCompute的控制层由:()部分组成。A、WorkerB、SchedulerC、MasterD、Executor【正确答案】:ABD62.定期开展数据合规典型案例分析,明晰数据合规管理(),提升公司整体数据合规管理能力。A、重点环节B、重点内容C、关键环节D、关键内容【正确答案】:BC63.以下关于MapReduce1.0版本说法正确的是()。A、扩展性差B、可靠性差C、资源利用率低D、无法支持多种计算框架【正确答案】:ABCD64.MaxComputeSQL采用的是类似于SQL的语法,适用于海量数据,实时性要求不高的场合。关于MaxComputeSQL,以下说法正确的包括:()。A、MaxCompute可以等价成一个数据库,可以完成事务及回滚的功能B、MaxCompute的每个作业准备以及提交都需要花费较长时间,因此不适用对于要求响应时间较短的准实时查询C、MaxComputeSOQL支持多种操作,如含ioin,where,orderby,groupby等D、MaxComputeSOL包括的数据类型有Bialnt,Float,Double.String,DateTime,Boolean【正确答案】:BC65.下列哪些情况下SOL自诊断可以识别,并上报告警信息?A、数据倾斜。B、SQL语句不下推C、大表Broadcast.D、HashJoin中大表做内表【正确答案】:ABCD66.Hadoop框架的缺陷有()。A、MR编程框架的限制;B、过多的磁盘操作,缺乏对分布式内存的支持;C、无法高效支持迭代式计算;D、不支持多用户写入并任意修改文件;【正确答案】:ABCD67.下列哪种服务可以用于存储数据()。A、MapReduceB、YARNC、HBaseD、HDFS【正确答案】:CD68.可视分析学的几个特点包含()A、强调数据到知识的转换过程B、强调可视化分析与自动化建模之间的相互作用C、强调数据映射和数据挖掘的重要性D、强调数据加工E、强调人机交互的重要性【正确答案】:ABCDE69.在典型的卷积神经网络架构中,能看到的是?A、多个卷积层后面跟着的是一个池化层B、多个池化层后面跟着的是一个卷积层C、全连接层(FC)位于最后的几层D、全连接层(FC)位于开始的几层E、全连接层(FF、位于开始的几层【正确答案】:AC70.关于CAP理论说法正确的是()。A、一个分布式系统不能同时满足一致性、可用性和分区容错性等需求B、一致性主要指强一致性C、一致性、可用性和分区容错性中的任何两个特征的保证(争取)可能导致另一个特征的损失(放弃)D、可用性指每个操作总是在“给定时间”之内得到返回“所需要的结果”。【正确答案】:ABCD71.以下关于Hbase说法正确的是()。A、面向列的数据库B、非结构化的数据库C、支持大规模的随机、实时读写D、采用松散数据模型【正确答案】:ABCD72.下面哪些是有效的类构造函数()。A、def_Init_(self):B、def_init_(self,var=0):C、def_init():D、def_init(self,a,b,c)【正确答案】:ABD73.大数据计算服务(MaxCompute,原ODPS)中的ACL授权时类似SQL92定义的GRANT/REVOKE语法来实现,更接近于传统关系型数据库的授权模式,Policy授权主要解决ACL授权机制无法解决的一些复杂授权场景。以下场景中,()既能使用ACL授权又能使用Policy授权实现。A、一次操作对一组对象进行授权B、只允许用户使用SQL(而不允许其他类型的Task)来访问某张表C、将一个对象的多个权限一次性授予一个用户D、带限制条件的授权【正确答案】:BC74.下列跟人工智能场景相关的是()。A、图像识别B、人脸识别C、语音识别D、语义分析【正确答案】:ABCD75.Hadoop组件Zookeeper的设计目标和主要特点包括()。A、简单性B、自我复制C、顺序访问D、高速读取【正确答案】:ABCD76.MaxCompute中实例运行可能出现下述()状态。A、RunningB、SuccessC、FailedD、Terminated【正确答案】:ABC77.在支持向量机中,参数的选取会影响拟合的结果,如果出现过拟合的现象,则导致该结果的原因有可能是(__)。A、其他参数保持不变,C值过大B、其他参数保持不变,λ值较少C、其他参数保持不变,σ较大D、其他参数保持不变,σ较小【正确答案】:ABD78.可作为决策树选择划分属性的参数是()。A、信息增益B、增益率C、基尼指数D、密度函数【正确答案】:ABC79.将相关内容纳入年度培训计划,实现各级领导班子成员、管理人员、重要风险岗位人员、新入职人员、境外人员等重点人员数据合规培训全覆盖,突出等重要法律法规和数据合规重大案例培训,提升培训实效。A、《保守国家秘密法》B、《网络安全法》C、《数据安全法》D、《个人信息保护法》【正确答案】:BCD80.特征向量的缺失值处理:缺失值较多,直接将该特征舍弃掉,否则可能反倒会带入较大的noise,对结果造成不良影响;缺失值较少,其余的特征缺失值都在10%以内,我们可以采取很多的方式来处理:()。A、把直接作为一个特征,假设用0表示B、用均值填充C、用随机森林等算法预测填充D、以上答案都不正确【正确答案】:ABC81.与自然语言处理相关的工具包Jieba,Gensim,NLTK,Scikit-Learn的区别是()。A、Jieba专注于中文分词操作B、NLTK主要用于一般自然语言处理任务(标记化,POS标记,解析等)C、Gensim主要用于题和向量空间建模、文档集合相似性等D、Scikit-learn为机器学习提供了一个大型库,其中包含了用于文本预处理的工具,例如词频-逆文档频率特征提取(TfidfVectorizer)等。【正确答案】:ABCD82.神经网络可以按()A、学习方式分类B、网络结构分类C、网络的协议类型分类D、网络的活动方式分类【正确答案】:ABD83.大数据计算服务(MaxCompute,原ODPS)中的log表保存了日志内容,都被存到了log_content字段中,以访问者的IP地址开头,示例格式如下:—[22/Mar/2016:03:47:43-0700]”GET/favicon.icoHTTP/1.1”404209/””Mozilla/5.0(X11;Linuxx86_64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/49.0.2623.87Safari/537.36”为了提取出访问者的IP地址,可以用()内置的函数。A、regexp_substrB、regexp_extractC、substr和instrD、repeat【正确答案】:ABC84.循环神经网络主要被应用于哪些场景(__)。A、语音识别B、语音建模C、机器翻译D、图像识别【正确答案】:ABC85.从合规性监测和成效后评估向超前诊断、辅助决策转变,融入到公司()等决策各环节,提升决策能力。A、战略B、投资C、管理D、决策【正确答案】:ABC86.MySQL的CloudDBA的实时性能指的是A、QPSB、TPSC、连接数D、网络流量【正确答案】:ABCD87.大数据应用的业务规划将聚焦核心领域,打造共()大重点业务、()个业务领域、()项业务方向。A、5B、10C、12D、34【正确答案】:ACD88.通过与外部合作单位和供应商签订()等方式进行数据安全管控,合同、协议、承诺书由业务部门会同法律合规部门根据实际情况制定,内容需明确数据使用范围、途径等。A、技术规范B、合同C、保密协议D、保密承诺书【正确答案】:BCD89.下列关于EM算法描述正确的是(__)。A、EM算法是常用的估计参数隐变量的利器B、EM算法即是期望最大化算法C、EM算法常被用来学习高斯混合模型的参数D、EM算法是一种迭代式的方法【正确答案】:ABCD90.按照公司战略实施要求,立足数据发展需要,以“()”为核心,建立健全数据合规管理体系,明确数据合规管理职责与重点领域数据合规管理要求A、可管B、可控C、可查D、可信【正确答案】:ABD91.关于卷积神经网络的叙述中正确的是()。A、可用于处理时间序列数据B、可用于处理图像数据C、卷积网络中使用的卷积运算就是数学中的卷积计算D、至少在网络的一层中使用卷积【正确答案】:ABD92.语音识别的方法包括()。A、声道模型方法B、模板匹配的方法C、利用人工神经网络的方法D、语音知识方法【正确答案】:ABCD93.下列既可以用于分类,又可以用于回归的机器学习算法有:A、k近邻B、逻辑回归C、决策树D、线性回归【正确答案】:AC94.大数据成果应用管理,主要包括____、____、____等内容。A、成果共享B、成果应用C、成果交易D、成果推广【正确答案】:ABD95.下面是Python关键字的是()。A、FalseB、NoC、TrueD、And【正确答案】:ACD96.Spark的技术架构可以分为哪几层()。A、资源管理层;B、Spark核心层;C、应用层;D、服务层;【正确答案】:ABD97.技术中台为业务中台、数据中台及前台提供“()、()、()”的技术创新服务,助力企业数字化应用快速建设。A、统一B、易用C、多样D、强健【正确答案】:ABD98.MaxcomputeSQL支持的Join操作类型包括:()。A、INNERJOINB、LEFTOUTERJOINC、FULLOUTERJOIND、RIGHTOUTERJOIN【正确答案】:ABCD99.以下哪些应用适合使用循环神经网络来完成?()。A、看图说话B、机器翻译C、社交网络用户情感分类D、从一张合影照片找到特定的人【正确答案】:ABC100.异常值的检测方法有()A、直接通过数据可视化进行观察B、通过统计分布进行判断C、通过相对距离进行度量D、通过相对密度进行度量【正确答案】:ABCD1.回归平均法属于外推法。A、正确B、错误【正确答案】:B2.各部门、各分部和公司各单位要按照“谁主管谁负责,谁运营谁负责,谁使用谁负责,管业务必须管安全”的总体原则,落实数据安全保护要求。A、正确B、错误【正确答案】:B3.框架适合表达结构性的知识,概念、对象等知识最适于用框架表示A、正确B、错误【正确答案】:A4.到“十四五”末,信息通信网络全面实现网络设备国产化率95%A、正确B、错误【正确答案】:B5.当相关系数r=0时,说明现象之间完全无关.A、正确B、错误【正确答案】:B6.在安全合规的前提下,对同一需求方、同类数据用途及范围的数据需求,首次履行审批流程,后续仍要重复审批。A、正确B、错误【正确答案】:B7.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,反馈问题最多的是科网专业A、正确B、错误【正确答案】:B8.估价商圈经济及夜经济发展情况,可以分析产业结构、综合园区企业运营活跃程度、城乡发展协同程度和产业布局合理性A、正确B、错误【正确答案】:B9.数据管理方面,健全规范公司数据管理标准,构建统一数据模型(SG-IMS)。A、正确B、错误【正确答案】:B10.政府监管类和公共开放类需求由相关业务部门承接,公益服务类和商务增值类需求由开展数据应用的业务部门(单位)承接A、正确B、错误【正确答案】:A11.虚假数据的存在会影响数据分析的信度。A、正确B、错误【正确答案】:A12.2023-2025年,实现业务中台对公司重点应用支撑覆盖率达到90%,实现中台服务可用率到达95%以上。A、正确B、错误【正确答案】:A13.Maxcompute中,允许的SQL的最大长度为8M。A、正确B、错误【正确答案】:B14.阶跃函数与sigmoid函数均为典型激活函数()。A、正确B、错误【正确答案】:A15.每日业务指标报表生成可使用实时在线数据分析服务。A、正确B、错误【正确答案】:B16.国家支持开发利用数据提升公共服务的智能化水平。A、正确B、错误【正确答案】:A解析:

《中华人民共和国数据安全法》第十五条:国家支持开发利用数据提升公共服务的智能化水平。提供智能化公共服务,应当充分考虑老年人、残疾人的需求,避免对老年人、残疾人的日常生活造成障碍。17.信息化是数据业务化的过程,重点是通过信息系统固化业务流程,实现业务从线下到线上转变,积累数据,支撑业务发展。A、正确B、错误【正确答案】:B18.2021年公司数据增值服务工作的总体布局为“一体四翼”。A、正确B、错误【正确答案】:A解析:

国家电网公司2021年“两会”提出“一业为主、四翼齐飞、全要素发力”的总体布局,明确了公司改革发展的关键,确立了新形势下各项工作的战略方向。国网一体四翼指的是以电网业务为主体,以金融业务、国际业务、支撑产业、战略性新兴产业为四翼。19.回归是一种平滑处理的方法。A、正确B、错误【正确答案】:A20.开展数字化规划是落实公司总体布局,实现电网与企业的数字化、智慧化发展的路径。A、正确B、错误【正确答案】:A21.鲁宾逊归结原理中空子句是不可满足的,若一个子句集包含空子句集,则这个子句集一定是不可满足的。A、正确B、错误【正确答案】:A22.人工智能是计算机科学的一个分支,是智能计算机系统,即人类智慧在机器上的模拟,或者说是人们使机器具有类似于人的智慧(对语言能理解、能学习、能推理)。A、正确B、错误【正确答案】:A23.泛化误差可以认为是分类器的期望检验误差。A、正确B、错误【正确答案】:A24.湖南省坚持“三新四高”发展战略,聚焦国家重要先进制造业、科技创新、内陆地区改革开放,旨在推动中部地区崛起和长江经济带发展。A、正确B、错误【正确答案】:B解析:

2020年,湖南提出大力实施“三高四新”战略,即打造“三个高地”、践行“四新”使命。“三个高地”为国家重要先进制造业高地、具有核心竞争力的科技创新高地、内陆地区改革开放高地;“四新”使命为在推动高质量发展上闯出新路子,在构建新发展格局中展现新作为,在推动中部地区崛起和长江经济带发展中彰显新担当,奋力谱写新时代坚持和发展中国特色社会主义的湖南新篇章。25.在中华人民共和国境内开展数据处理活动及其安全监管,适用《中华人民共和国数据安全法》,在中华人民共和国境外开展数据处理活动,不适用本法。A、正确B、错误【正确答案】:B解析:

《中华人民共和国数据安全法》第二条:在中华人民共和国境内开展数据处理活动及其安全监管,适用本法。在中华人民共和国境外开展数据处理活动,损害中华人民共和国国家安全、公共利益或者公民、组织合法权益的,依法追究法律责任。26.定量属性可以是整数值或者是连续值。A、正确B、错误【正确答案】:A27.数据需求方对涉及本专业负面清单的数据共享需求进行专业审核与合规审查,明确敏感数据的脱敏要求。A、正确B、错误【正确答案】:B解析:

数据的共享应用要严格执行公司网络信息安全和保密有关规定,原则上只输出统计计算结果,明细数据不出中台,对涉及负面清单中个人信息等敏感数据的共享应用,由数据中台负责进行数据脱敏处理,保证数据应用安全。28.("x){P(x)àP(x)}消去蕴含符号得:($x){ØP(x)ÚP(x)}。A、正确B、错误【正确答案】:B29.国网湖南省电力有限公司2021年大数据应用及数据增值服务专项工作的工作原则包括聚焦需求,不包括价值创造。A、正确B、错误【正确答案】:B30.插值运算属于statsmodels模块的主要特点。A、正确B、错误【正确答案】:B31.数字化转型是数据业务化的过程,重点是挖掘数据价值,打造数字生态,赋能传统产业,拓展新兴产业,一般包括产业数字化和数字产业化两个方面。A、正确B、错误【正确答案】:A32.MaxCompute的分区表的分区层次目前不能超过.6层。A、正确B、错误【正确答案】:A33.命题是可以判断真假的语句。A、正确B、错误【正确答案】:B34.分类任务就是通过学习得到一个目标函数F,把每个属性集X映射到一个预先定义的预标号Y。A、正确B、错误【正确答案】:A35.湖南省电力有限公司数据服务能力提升专项行动工作要求有加强组织、明确责任;强化协同、形成合力;定期通报,严格考核。A、正确B、错误【正确答案】:A36.开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规定不用及时告知用户并向有关主管部门报告。A、正确B、错误【正确答案】:B解析:

《中华人民共和国数据安全法》第二十九条:开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规定及时告知用户并向有关主管部门报告。37.大数据计算服务(MaxCompute,原ODPS)中的日志表log是一张分区表,分区键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt=’20160101’至dt=’20160131’共31个分区的数据,为了删除20160101当天新增的数据,可以通过alter方式实现。A、正确B、错误【正确答案】:A38.业务规则是指数据质量符合业务规则的条件,用以描述符合业务的规范要求。A、正确B、错误【正确答案】:A39.从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,但不能留存审核、交易记录。A、正确B、错误【正确答案】:B解析:

《中华人民共和国数据安全法》第三十三条:从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,并留存审核、交易记录。40.发现需求提出方存在违反国家法律、法规,或者与公司签署的保密协议、合同相关情况时,应立即要求其停止相关行为,同时终止数据开放,并按规定追究相关责任A、正确B、错误【正确答案】:A41.下列函数中,time()是Python内置函数。A、正确B、错误【正确答案】:B42.互联网部依照数据质量管理评价标准对公司进行考核。A、正确B、错误【正确答案】:A43.研究数据新产品新业务定位、核心目标、结构功能和研发推广可行性,形成专项调研分析报告,可以为开展具有市场价值的数据产品研发和应用服务提供指导。A、正确B、错误【正确答案】:A44.公司建成全球最大、央企领先的一体化集团级信息系统,建成北京、上海、深圳三地集中式数据中心。A、正确B、错误【正确答案】:B45.SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器。A、正确B、错误【正确答案】:B46.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。A、正确B、错误【正确答案】:B47.坚持“以共享为原则、不共享为例外”,公司各单位所有数据都必须有条件接入数据中台。A、正确B、错误【正确答案】:B48.上下游企业及个人信息等第三方数据,不需获得授权即可开放共享A、正确B、错误【正确答案】:B49.框架是用于描述具有固定的静态对象的通用数据结构,但是也可以描述某些简单的动态对象。A、正确B、错误【正确答案】:B50.ADS表存在主键,即可根据主键使用delete删除纪录。()A、正确B、错误【正确答案】:B51.对于ADS的数据一致性问题,当updateType=realtime时,不支持事务,并且仅遵循会话一致性的设计,所以ADS并不能作为OLTP系统使用。A、正确B、错误【正确答案】:B52.开展冬奧对旅游等关联行业协同发展分析,能够研判冬奥赛区及周边经济运行与人员流动状况,助力冬奥拉动区域及产业发展。A、正确B、错误【正确答案】:A53.无监督逐层训练是单隐层网络训练的有效手段。A、正确B、错误【正确答案】:B54.print(100-25*3%4)结果是97。A、正确B、错误【正确答案】:A55.MaxCompute图模型主要适合用于迭代计算应用场景。()A、正确B、错误【正确答案】:A56.2021年,公司构建大数据分析创新环境,面向基层单位提供集成云资源、数据(平台)、分析工具等一站式服务,推行数据产品研发经理制,发动基层单位基于本职岗位开展大数据应用,按期组织发布、推广应用成果。A、正确B、错误【正确答案】:A57.数据产品和服务提供方与使用方应签署相关使用协议,明确约束使用规则等双方权利义务。A、正确B、错误【正确答案】:A58.电网生产数字化转型方面,实现电网数据与业务数据融通共享,电网全景“一览无遗”、智能业务“一键生成”、协同作业“一线贯通”,有力提升湖南公司能源保障及系统运行可靠性。A、正确B、错误【正确答案】:A59.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,统计出供电所高频使用的信息系统有25套。A、正确B、错误【正确答案】:B60.关于MaxCompute提供了完善的SQL访问,有效支持事务。A、正确B、错误【正确答案】:B61.人工智能的研究长期目标是使现有的电子计算机更聪明,更有用,使它不仅能做一般的数值计算及非数值信息的数据处理,而且能运用知识处理问题,能模拟人类的部分智能行为。A、正确B、错误【正确答案】:B62.公司科技互联网专业2021年内需完成“能源看经济”、“能源看灾害防治”、“能源看乡村振兴”、“能源看环保”、“能源+企业用能”、僵尸空壳企业监测应用等产品在能源大数据平台的统一发布。A、正确B、错误【正确答案】:A63.监测上下游企业生产活跃程度,可以深度分析产业链发展协同度及抗风险能力。A、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论