2023年能源大数据应用开发技能竞赛理论考试题库大全-下(判断、填空题)_第1页
2023年能源大数据应用开发技能竞赛理论考试题库大全-下(判断、填空题)_第2页
2023年能源大数据应用开发技能竞赛理论考试题库大全-下(判断、填空题)_第3页
2023年能源大数据应用开发技能竞赛理论考试题库大全-下(判断、填空题)_第4页
2023年能源大数据应用开发技能竞赛理论考试题库大全-下(判断、填空题)_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023年能源大数据应用开发技能竞赛理论考试题库大全-下(判

断、填空题汇总)

判断题

1.K-means是一种基丁密度的产生划分聚类的聚类算法。

A、正确

B、错误

答案:B

2.人工智能的研究途径是主张通过运用计算机科学的方法进行研究,实现人工智

能在计算机的模拟。

A、正确

B、错误

答案:A

3.ADS的高度智能优化策略是指:CBO。

A、正确

B、错误

答案:A

4.噪声数据的主要表现不包括重复数据。

A、正确

B、错误

答案:B

5.回归是一种平滑处理的方法。

A、正确

B、错误

答案:A

6.应用研发能力属于数据中台能力架构能力。

A、正确

B、错误

答案:B

7.推进新能源预测平台和碳市场交易辅助分析产品试点培育,试点开展火电企业

碳排放监测与分析,探索碳排放诊断及对标模式等业务,加强技术与商业模式创

新,推进市场应用拓展。

A、正确

B、错误

答案:A

8.IQR方法不适用于监测异常值。

A、正确

B、错误

答案:B

9.研究数据新产品新业务定位、核心目标、结构功能和研发推广可行性,形成专

项调研分析报告,可以为开展具有市场价值的数据产品研发和应用服务提供指导。

A、正确

B、错误

答案:A

10.公司科技互联网专业2021年工作目标有:业绩指标上创一流、产业发展上有

跨越、数字转型上有突破。

A、正确

B、错误

答案:A

11.Maxpute的屏显行数可以通过管理控制台实现。最大的显示条数为1000对于

ADS的数据一致性问题,当updateType二realtime时,不支持事务,并且仅遵循

会话一致性的设计,所以ADS并不能作为0LTP系统使用。关于MaxputeSQL,大

部分标准SQL的功能都支持,但是不支持窗口函数、rownum等。

A、正确

B、错误

答案:B

12.三大支撑机构梳理分析数据治理平台及相关组件提报的数据质量业务描述,

形成符合要求的业务规则。

A、正确

B、错误

答案:A

13.电网数字化专项计划纳入公司综合计划统一管理。公司总部统一管理,各单位

分级负责;综合计划管理部门与互联网职能管理部门分别履行各自职责,共同管

理。

A、正确

B、错误

A、正确

B、错误

答案:B

19.图搜索算法中,CLOSE表用来登记待考察的节点

A、正确

B、错误

答案:B

20.2023-2025年,实现业务中台对公司重点应用支撑覆盖率达到90%,实现中台

服务可用率到达95%以上。

A、正确

B、错误

答案:A

21.非经中华人民共和国主管机关批准,境内的组织、个人不得向外国司法或者

执法机构提供存储于中华人民共和国境内的数据。上述说法是否正确()

A、正确

B、错误

答案:A

22.数字化转型是推动沟建以新能源为主体的新型电力系统、服务碳达峰碳中和

目标的迫切需要。

Ax正确

B、错误

答案:A

23.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。

A、正确

B、错误

答案:B

24.估价商圈经济及夜经济发展情况,分析产业结陶、综合园区企业运营活跃程度、

城乡发展协同程度和产业布局合理性

A、正确

B、错误

答案:B

25.数字化转型是推进公司战略目标落地、实现高质量发展的迫切需要。

A、正确

B、错误

答案:A

26.公司鼓励数据依法合理有效利用,促进以数据价值为关键要数的数字经济发

展。

A、正确

B、错误

答案:B

27.神经网络对训练数据中的噪声不敏感。

A、正确

B、错误

答案:A

28.大数据计算服务的数据仓库的管理员发现用户表user没有备注信息,为了方

便其他人员的使用,可以通过alter方式给这张表加上备注。

A、正确

B、错误

答案:A

29.日常核查由业务部门负责按日执行,检查的数据范围以公司数据质量规则库

覆盖的数据范围为准。

Av正确

B、错误

答案:B

30.产生式规则不能表达具有结构性的知识,但效率较高。

A、正确

B、错误

答案:B

31.当簇具有非球形形状时,K-means很难检测到自然的簇。

A、正确

B、错误

答案:A

32.噪声是一个测量变量中的随机错误或偏差。

Ax正确

B、错误

答案:A

33.网络运营者不得泄露、篡改、毁损其收集的个人信息,未经被收集者同意,

不得向他人提供个人信息。

A、正确

B、错误

答案:A

34.到“十四五”末,信息通信网络全面实现网络设备国产化率95%

A、正确

B、错误

答案:B

35.K-means是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动

地确定。

A、正确

B、错误

答案:B

36.K-means在进行邻近性度量时的距离是欧几里得距离。

A、正确

B、错误

答案:B

37.建立横向部门之间,纵向各单位之间职责清晰、分工负责、协同配合的工作

机制,共同推动公司数据安全管理工作。

A、正确

B、错误

答案:B

38.(”x)[P(x)GP(x)}消去蕴含符号得:($x)(0P(x)UP(x))o

A、正确

B、错误

答案:B

39.结合负面清单使用情况,根据数据共享应用需要,国网互联网部会同总部业

务部门开展负面清单优化、更新,并通过离线方式发布、使用。

Av正确

B、错误

答案:B

40.数组的切片是原数组的副本。PCA的步骤包括构建协方差矩阵、矩阵分解得

到特征值和特征向量、特征值排序、特征值归一化。

A、正确

B、错误

答案:B

41.业务运营类项目包括开发工作完成或购买套装软件后的配套安装、配置调试

和培训等工作的项目;以对系统运行、业务应用、用户行为等的常态统计分析为

基础,开展系统优化改造、应用敏捷迭代、内容更新升级、网络安全服务、可研

论证评估、后评估、绩效评估等相关工作的项目。

A、正确

B、错误

答案:A

42.政府监管类主要包括需求受理、需求分析与初审、数据归口审核、签订合同

(协议)、提供服务五个环节

A、正确

B、错误

答案:B

43.Maxpute图模型主要适合用于迭代计算应用场景。

A、正确

B、错误

答案:A

44.轻度汇总层主要面向业务视角,存放具有共性需求的宽表和单指标表。

Av正确

B、错误

答案:A

45.探索性数据分析与传统统计学中的验证性方法类似,他们都要事先提出假设。

A、正确

B、错误

答案:B

46.国网互联网部和业务部门建立数据模型管理维护机制,信通公司承担数据模

型的设计工作。

Ax正确

B、错误

答案:B

47.在新兴产业运营能力升级方面,打造以数据、资金、物资、技术、人才等资

源的高速流动机制、资源连接渠道,实现新兴产业资源供需的有机协同与快速响

应。

A、正确

B、错误

答案:A

48.单个谓词是谓词公式。

Av正确

B、错误

答案:A

49.结合业务发展情况,以及各单位在模型应用中发现的问题,大数据中心组织

开展模型优化完善和维护。

A、正确

B、错误

答案:A

50.参考数据是对特定数据项允许取值集合的名称、代码值、含义、用途的规范

定义。

A、正确

B、错误

答案:A

51.框架适合表达结构性的知识,概念、对象等知识最适于用框架表示

A、正确

B、错误

答案:A

52.任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面

对中华人民共和国采取歧视性的禁止、限制或者其他类似措施的,中华人民共和

国可以根据实际情况对该国家或者地区对等采取措施。

A、正确

B、错误

答案:A

53.构建电力市场服务体系。就是打造适应新型电力系统的市场机制,贯通绿电

交易、可再生能源消纳责任权重、绿证与碳市场等数字化应用。

A、正确

B、错误

答案:A

54.公司各级业务部门负责重要数据相关业务系统开通、数据采集、使用和发布

环节的安全审核。

A、正确

B、错误

答案:A

55.除政府监管类及公共开放类部分按法律、行政法规规定确需提供业务明细数

据外,其余原则上不对外提供业务明细数据

A、正确

B、错误

答案:A

56.加强数据对外开放的底层设计,统筹推进公司数据开放工作,建立规范的数

据开放标准、流程,实现数据有序对外开放。

A、正确

B、错误

答案:B

57.公司明确具有中国特色国际领先的能源互联网企业战略目标,提出“一业为

主、两翼齐飞、全要素发力”发展布局,为公司数字化转型指明了方向、明确了

目标。

A、正确

B、错误

答案:B

58.开展数字化规划是落实公司总体布局,实现电网与企业的数字化、智慧化发

展的路径。

A、正确

B、错误

答案:A

59.人工智能是智能计算机系统,即人类智慧在机器上的模拟,或者说是人们使

机器具有类似于人的智慧(对语言能理解、能学习、能推理)。

A、正确

B、错误

答案:A

60.搭建大数据应用分析环境,可以实现自助式数据处理、统计分析、数据挖掘、

人工智能等在线服务。

A、正确

B、错误

答案:A

61.在安全合规的前提下,对同一需求方、同类数据用途及范围的数据需求,首

次履行审批流程,后续仍要重复审批。

Av正确

B、错误

答案:B

62.Kafka通过每个Producer分配唯一ID避免任务重复执行。

A、正确

B、错误

答案:A

63.互联网部依照数据质量管理评价标准对公司进行考核。

A、正确

B、错误

答案:A

64.依据国家相关法律法规和公司有关要求,对外提供数据中涉及国家秘密和公

司商业秘密的,均按公司有关要求履行相应的审批手续

A、正确

B、错误

答案:B

65.启发式搜索一定比盲目式搜索好

A、正确

B、错误

答案:B

66.健全数据管理工作体系需梳理数据标准、数据质量、数据共享、数据需求、

数据应用、数据安全等主要数据工作管理活动,细化各部门、各单位的职责分工

界面,明确各层级、各岗位的管理内容和工作要求。

A、正确

B、错误

答案:A

67.使用MaxputeSQL:createtabIet1Iiket2;建表时,表不会具有表t2的

生命周期属性。

A、正确

B、错误

答案:A

68.上下游企业及个人信息等第三方数据,不需获得授权即可开放共享

A、正确

B、错误

答案:B

69.湖南省坚持“三新四高”发展战略,聚焦国家重要先进制造业、科技创新、

内陆地区改革开放,旨在推动中部地区崛起和长江经济带发展。

A、正确

B、错误

答案:B

70.“提效”的关键推进企业运营提质增效,建设高效率数字化运营企业,缩短

业务流程环节,优化业务运营过程,由“人推动业务执行”向“数据推动业务执

行”转变,助力公司融入数字经济发展、数字中国建设格局。

A、正确

B、错误

答案:A

71.专项核查由信通公司执行,并生成数据质量问题清单,生成的数据质量问题

清单按发起人要求推送至数据中台及相关组件。

A、正确

B、错误

答案:B

72.CLIQUE是一种基于网格的聚类算法。

A、正确

B、错误

答案:A

73.泛化误差可以认为是分类器的期望检验误差。

Ax正确

B、错误

答案:A

74.推进基础资源商业化运营。深入挖掘公司现有场站、杆塔、沟道等电网基础

资源的共享渠道和应用潜能,面向运营商、互联网企业等推进基础资源商业化运

营,提高存量资产利用效率。可以适当降低安全底线。

A、正确

B、错误

答案:B

75.人工神经网络可以用来处理冗余特征。

Av正确

B、错误

答案:A

76.可信度带有较大的主观性和经验性,其准确性难以把握

A、正确

B、错误

答案:A

77.分类器的期望误差不受训练数据可变性的影响,因为训练集合的决策边界相

同。

A、正确

B、错误

答案:B

78.基于数据共享需求和专业审核意见,国网互联网部从数据归口管理角度,组

织对数据安全、合规、技术方式等进行审核、确认。

A、正确

B、错误

答案:A

79.分析层的各个项目空间,每个业务流程应设置至少一个正常调度的二级虚拟

节点

A、正确

B、错误

答案:A

80.发现需求提出方存在违反国家法律、法规,或者与公司签署的保密协议、合

同相关情况时,应立即要求其停止相关行为,同时终止数据开放,并按规定追究

相关责任

A、正确

B、错误

答案:A

81.定量属性可以是整数值或者是连续值。

A、正确

B、错误

答案:A

82.Maxpute的分区表的分区层次目前不能超过.6层。

A、正确

B、错误

答案:A

83.公司重点应用创新示范集中在对外服务政府和对内服务公司电网业务数字化

转型两个方面。

A、正确

B、错误

答案:A

84.数字化转型是数据业务化的过程,重点是挖掘数据价值,打造数字生态,赋

能传统产业,拓展新兴产业,一般包括产业数字化和数字产业化两个方面。

Av正确

B、错误

答案:A

85.SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称

为最小边缘分类器。

A、正确

B、错误

答案:B

86.国网大数据中心是公司数据管理的专业支撑机构,在总部互联网部和业务部

门的委托和指导下,承担具体的数据管理和应用工作。

A、正确

B、错误

答案:A

87.产生式系统的构成规则库,综合数据库两部分。

A、正确

B、错误

答案:B

88.公司建成全球最大、央企领先的一体化集团级信息系统,建成北京、上海、深

圳三地集中式数据中心。

A、正确

B、错误

答案:B

89.长期坚持、不断完善,逐步实现公司数据管理的体系化、规范化。

A、正确

B、错误

答案:A

90.基于数据中台组件和能力,研究杓建数据应用研发平台,强化数据中台、联邦

学习等前沿技术研究和落地,为促进数据共建共创、共用共享打下稳固基础。

A、正确

B、错误

答案:B

91.鲁宾逊归结原理中空子句是不可满足的,若一个子句集包含空子句集,则这

个子句集一定是不可满足的。

A、正确

B、错误

答案:A

92.预测性分析用于发现隐藏在大型数据集中的有意义联系。

A、正确

B、错误

答案:B

93.ADS创建表组时,可以指定表组的副本数,表组的副本数越多,可以一定程

度的增加ADS的最大承受的QPSo

A、正确

B、错误

答案:A

94.各单位负面清单原则上应与分部负面清单保持一致,按照分部负面清单执行。

A、正确

B、错误

答案:B

95.Apriori算法是一个关联规则算法。

A、正确

B、错误

答案:A

96.DataWorks中数据同步抽取(Reader)支持Redis数据源类型。

A、正确

B、错误

答案:B

97.电网生产数字化转型方面,实现电网数据与业务数据融通共享,电网全景“一

览无遗”、智能业务“一键生成”、协同作业“一线贯通”,有力提升湖南公司

能源保障及系统运行可靠性。

A、正确

B、错误

答案:A

98.根据经验对一个事物或现象为真的相信程度称为可信度

Av正确

B、错误

答案:A

99.根据项目实际情况,可将结算并入竣工决算中一起编制o项目竣工决算报告应

在项目竣工验收通过后三个月内完成。

A、正确

B、错误

答案:A

100.关联规则是反映事物之间的依赖关系,典型例子是购物篮分析,常见算法有

Apriori关联算法和FP-growth关联算法。

A、正确

B、错误

答案:A

101.pandas是建立在numpy基础上的高效数据分析处理库,是Python的重要数

据分析库。

A、正确

B、错误

答案:A

102.在0,1,〃,9,这10个数字当中,一次任取两个,则抽到5这个数字的概率

是0.1.

A、正确

B、错误

答案:B

103.构建农村“空心率”分析模型精确测算行政村实际常住人口数量,精确识别

“空心村”和“空心率”,辅助政府提高农村治理现代化水平。

A、正确

B、错误

答案:B

104.经过审批后,外部合作单位和供应商可以在对互联网提供服务的网络和信息

系统中存储或运行公司商业秘密数据和重要数据。

A、正确

B、错误

答案:B

105.print(100-25*3%4)结果是970

Ax正确

B、错误

答案:A

106.国网互联网部和业务部门共同建立主数据管理规范和要求,信通公司和相关

专业支撑机构具体承担主数据的维护,大数据中心承担主数据组件建设工作。

A、正确

B、错误

答案:B

107.开展冬奥对旅游等关联行业协同发展分析,研判冬奥赛区及周边经济运行与

人员流动状况,助力冬奥拉动区域及产业发展。

Av正确

B、错误

答案:A

1O8.DataHub数据源作为数据中枢,可提供完善的数据导入方案,能够快速解决

海量数据的资源问题。

A、正确

B、错误

答案:B

109.ADS中创建事实表(普通表)时会有一些限制,二级分区只能是Hash或Li

st0

A、正确

B、错误

答案:B

110.数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状

态,以及具备保障持续安全状态的能力。

A、正确

B、错误

答案:A

111.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,分析了

供电所常用25套信息系统

A、正确

B、错误

答案:A

112.做强做优现有产品和积极创新新业务、新模式是大数据应用的重点工作安排

之一。

A、正确

B、错误

答案:A

113.两个对象之间的相异度是这两个对象差异程度的数值度量。

A、正确

B、错误

答案:A

114.每日业务指标报表生成可使用实时在线数据分析服务。

A、正确

B、错误

答案:B

115.统筹组织开展一批大数据应用重点工作任务,对内服务政府科学决策和经济

社会发展,对外赋能生产提质、经营提效、服务提升,探索培育数据增值服务模式,

助力公司数字化转型发展。

A、正确

B、错误

答案:B

116.业务规则是指数据质量符合业务规则的条件,用以描述符合业务的规范要求。

Av正确

B、错误

答案:A

117.持续完善“电力助乡村振兴”系列产品,孵化扶贫产业发展、美丽乡村建设、

特色小镇建设等产品,加强技术与商业模式创新,推进市场应用拓展。

A、正确

B、错误

答案:A

118.数据产品和服务提供方与使用方应签署相关使用协议,明确约束使用规则等

双方权利义务。

A、正确

B、错误

答案:A

119.CF模型是基于可信度表示不确定性推理的基本方法

A、正确

B、错误

答案:A

120.语义网络、框架等知识表示方法,均是对知识和事实的一种静止的表示方法。

A、正确

B、错误

答案:A

121.不确定性推理指推理所使用的知识和推出的结论可以是不确定的。所谓不确

定性是真值为假。

A、正确

B、错误

答案:A

122.回归平均法属于外推法。

A、正确

B、错误

答案:B

123.企业级指标建设示范通过指标中心的共享复用,打造一批示范县公司和供电

所数字化指标看板。

A、正确

B、错误

答案:A

124.大数据常见的计算方式有三种:离线计算、流计算以及在线计算,其中流计

算是消息驱动的,数据更新一般是定时更新。

A、正确

B、错误

答案:B

125.命题是可以判断真假的语句。

A、正确

B、错误

答案:B

126.从Maxpute导入数据到ADS的时候,导入路径格式为:.odps:〃project」

ame/tabIe_nameo

A、正确

B、错误

答案:B

127.2021年公司数据增值服务工作的总体布局为“一体四翼”。

A、正确

B、错误

答案:A

128.湖南省电力有限公司数据服务能力提升专项行动工作要求有加强组织、明确

责任;强化协同、形成合力;定期通报,严格考核。

A、正确

B、错误

答案:A

129.《国网湖南省电力有限公司数据质量管理实施细则》自2021年3月20日起

生效。

A、正确

B、错误

答案:B

130.湖南省电力有限公司计划2022年6月正式上线指标中心。

Av正确

B、错误

答案:A

131.科技互联网专业2021年防灾产业方面需加强科技成果产业推广,确保年内

实现防灾业务外部营收0.6亿元目标。

A、正确

B、错误

答案:A

132.加快制定公司数据增值服务产品建设规范。研究数据增值服务管理机制、工

作流程、产品开发策略,制订公司数据增值服务指导意见,推进业务规范化高质

量发展。

A、正确

B、错误

答案:A

133.电网数字化储备项目下达计划前,须完成可研批复。限上项目由各单位互联

网职能管理部门负责批复,限下项目由各单位信通公司负责批复。

A、正确

B、错误

答案:B

134.实时在线数据分析服务,主要指对数据更新频率要求为日级以下数据进行流

式加工处理的功能需求。

Av正确

B、错误

答案:A

135.专家系统的结构选择不需要根据系统的应用环境和所执行任务的特点就可

以确定。

A、正确

B、错误

答案:B

136.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,统计出

供电所高频使用的信息系统有25套

A、正确

B、错误

答案:B

137.当有一条以上的规则的条件部分和当前数据库相匹配时,就需要决定首先使

用哪一条规则,这称为冲突解决。

A、正确

B、错误

答案:A

138.无监督逐层训练是单隐层网络训练的有效手段。

A、正确

B、错误

答案:B

139.维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提

高数据安全保障能力。

A、正确

B、错误

答案:A

140.主数据是用来描述公司核心业务实体的数据,是各业务应用和各系统之间进

行信息交互的基础。

A、正确

B、错误

答案:A

141.SparkJob默认的调度模式是FIFO。

A、正确

B、错误

答案:A

142.政府监管类和公共开放类需求由相关业务部门承接,公益服务类和商务增值

类需求由开展数据应用的业务部门(单位)承接

A、正确

B、错误

答案:A

143.2021年,公司按照时间计划要求完成5G应用实施计划、试点应用方案编制,

完成外网北斗服务平台部署,完成50座基准站接入调试和北斗服务平台功能测

试。

A、正确

B、错误

答案:B

144.公司数字化转型的发展愿景是建设智慧国网,为新型电力系统注入数字动力,

为能源互联网企业打造数字引擎。

A、正确

B、错误

答案:A

145.如果搜索是经接近起始节点的程序来依次扩展节点,这种搜索叫深度搜索。

A、正确

B、错误

答案:B

146.三大支撑机构按照数据质量管理评价标准的要求确认质量问题分级。

A、正确

B、错误

答案:B

147.python的内置函数Ien()函数可以返回列表,元组、字典、集合、字符串以

及range对象中元素个数

A、正确

B、错误

答案:A

148.各业务部门参考互联网部评价标准对各二级单位的数据质量管理工作进行

评价并制定考核规定。

A、正确

B、错误

答案:A

149.围绕服务政府重点打造“碳排放监测”“电力+企业安全生产”“电力+环保

监测”“电力助乡村振兴”“覆冰灾害智能预测”等产品,可以支撑政府的精准

施政。

A、正确

B、错误

答案:A

150.从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,

审核交易双方的身份,但不能留存审核、交易记录。

A、正确

B、错误

答案:B

151.插值运算属于statsmodels模块的主要特点。

A、正确

B、错误

答案:B

152.公司组织制定统一数据管理规章制度,各单位和部门落实数据管理要求,对

本单位和本专业的数据负责,共同推进数据管理体系落地。

A、正确

B、错误

答案:A

153.国网湖南省电力有限公司“十四五”数字化规划基准年为2021年.

A、正确

B、错误

答案:B

154.数据责任部门结合实际应用需要,在线提出数据共享需求,明确数据范围、

数据用途、数据获取方式等。

A、正确

B、错误

答案:B

155.国家支持开发利用数据提升公共服务的智能化水平。

A、正确

B、错误

答案:A

156.ADS表存在主键,即可根据主键使用delete删除纪录。

A、正确

B、错误

答案:B

157.开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,

应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规

定不用及时告知用户并向有关主管部门报告。

A、正确

B、错误

答案:B

158.特征提取技术并不依赖于特定的领域。

A、正确

B、错误

答案:B

159.分类任务就是通过学习得到一个目标函数F,把每个属性集X映射到一个预

先定义的预标号Y。

A、正确

B、错误

答案:A

160.数据接入方式主要有两种,全量数据接入、增量数据接入。

A、正确

B、错误

答案:B

161.Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待

分样本的分类结果取决于各类域中样本的全体。

A、正确

B、错误

答案:B

162.经典命题逻辑和谓词逻辑的语义解释只有两个:真和假,0和1。

A、正确

B、错误

答案:A

163.开展大数据应用成果年度征集遴选工作,印发大数据应用成果集,发布推介

年度大数据应用优秀成果。

A、正确

B、错误

答案:A

164.到“十四五”末,数据中台实现公司核心业务数据实时接入、调度数据秒级

接入、与国网公司数据中台按天同步,业务指标线上生成率95%

A、正确

B、错误

答案:A

165.DBSCAN是一种基于原型的、划分的聚类技术。

A、正确

B、错误

答案:B

166.各部门、各分部和公司各单位要按照“谁主管谁负责,谁运营谁负责,谁使

用谁负责,管业务必须管安全”的总体原则,落实数据安全保护要求。

Av正确

B、错误

答案:B

167.在中华人民共和国境内开展数据处理活动及其安全监管,适用《中华人民共

和国数据安全法》,在中华人民共和国境外开展数据处理活动,不适用本法。

A、正确

B、错误

答案:B

168.数字化转型的基本原则是坚持战略引领、坚持价值导向、坚持科技创新、坚

持企业级建设、坚持全要素驱动。

A、正确

B、错误

答案:A

169.十四五期间,以“三融三化”为总体思路,全力推动公司全业务、全环节数

字化转型。即主动融入电网业务、融入生产一线、融入产业生态,推进架构中台

化、数据价值化、业务智能化,赋能电网和企业高质量发展。

A、正确

B、错误

答案:A

170.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,反馈问

题最多的是科网专业

A、正确

B、错误

答案:B

171.INSERT写入分区表的指定分区时,需要改为INSERT

Ax正确

B、错误

答案:B

172.开展电力领域碳中和进程监测评估,建立能源生态链与电力数据关联模型,

发布电力领域碳指数,精准评估各地区、各主体措施成效,助力政策实施到位。

A、正确

B、错误

答案:A

173.公司科技互联网专业2021年重点任务:推动“科技创新、数字化、新兴产

业”三大工作齐头并进,全面提升公司科技互联网专业管理质效。具体要做好3

个方面23项工作。

A、正确

B、错误

答案:A

174.命题逻辑无法把它所描述的客观事物的结构及逻辑特征反映出来,也不能把

不同事物间的共同特征表述出来。

A、正确

B、错误

答案:A

175.虚假数据的存在会影响数据分析的信度。

A、正确

B、错误

答案:A

176.公司科技互联网专业2021年内需完成“能源看经济”、“能源看灾害防治”、

“能源看乡村振兴”、“能源看环保”、“能源-企业用能”、僵尸空壳企业监

测应用等产品在能源大数据平台的统一发布。

A、正确

B、错误

答案:A

177.公司在我国境内收集和产生的个人信息和重要数据应当在境内存储。

A、正确

B、错误

答案:A

178.Maxpute中,允许的SQL的最大长度为8M。

Ax正确

B、错误

答案:B

179.专项核查由发起人负责,发起人可以是业务部门、三大支撑机构、互联网部

或者这些单位的联合体。

A、正确

B、错误

答案:B

180.统筹公司数据、知识、成果等资源围绕数据中台打造开放式的大数据应用发

展模式,推动资源共享和跨界融合,主动融入新发展格局,带动产业链上下游共同

发展构建互利共赢的能源数字新生态。

A、正确

B、错误

答案:A

181.提供数据产品服务的社会公益类流程包括需求受理、保密合规审核、签订合

同(协议)、提供服务四个环节

A、正确

B、错误

答案:B

182.开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管

理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保

障数据安全。

A、正确

B、错误

答案:A

183.数字化转型需要“另起炉灶、从头再来”。

A、正确

B、错误

答案:B

184.预测性分析是一种将知识转换为智慧的分析过程。

A、正确

B、错误

答案:B

185.鲁宾逊归结原理中,设C1与C2是子句集S中的两个子句,C12是它们的归

结式,若把C12加入S中,得到新子句集S2,则S与S2是等价的。

A、正确

B、错误

答案:B

186.Spark组件不包括esourceManager、xecutorvriver、DD

A、正确

B、错误

答案:B

187.反向推理是以已知事实作为出发点,按照一定的策略,运用知识库中的知识,

推断出结论的过程

A、正确

B、错误

答案:B

188.2021年,科技互联网专业牵头编制公司十三五数字化规划、新兴产业规划,

配合完善电网数字化规划,指导公司数字化转型升级和新兴产业升级,指导数字

化项目储备与综合计划制定,按国网总部及时报送数字化规划。

A、正确

B、错误

答案:B

189.电网数字化项目(资本性)竣工投产后,项目建设单位(部门)应按照公司档案

管理要求做好项目文件材料归档工作,保证项目档案的真实准确、齐全完整、系

统规范,并在竣工投产六个月内完成向档案管理部门移交。

A、正确

B、错误

答案:B

190.大数据计算服务(Maxpute,原0DPS)中的日志表Iog是一张分区表,分区

键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt='2016010

r至dt='2016013r共31个分区的数据,为了删除20160101当天新增的数

据,可以通过alter方式实现。

A、正确

B、错误

答案:A

191.开发实施类项目包括信息系统(平台)功能设计和利用各类编程语言进行开

发(含需求分析、系统设计和开发等工作),以及开发工作完成或购买套装软件后

的配套安装、配置调试和培训等工作的项目。

A、正确

B、错误

答案:A

192.int、smallint是SQLServer数据库的系统数据类型(?)

A、正确

B、错误

答案:B

193.在互联网大区传输重要数据时应加密保护,采用公司统一密码基础设施签发

的密钥或证书。

A、正确

B、错误

答案:A

194.监测上下游企业生产活跃程度,分析产业链发展协同度及抗风险能力。

A、正确

B、错误

答案:A

195.数据共享时,需坚持“一事一议”、层层审批的数据应用授权方式。

A、正确

B、错误

答案:B

196.RDD中的数据被分区存储在集群中,使得任务可以并行执行。

Av正确

B、错误

答案:A

197.梳理一线业务岗位的数据责任需按照“坚持数据同源、一源一责、源头维护、

一源多用''的原则。

A、正确

B、错误

答案:A

198.国网公司各分部和各单位可按要求自主决策推进数据开放事宜

A、正确

B、错误

答案:B

199.TunnelUpload命令上传时,每个Tunnel的Session在服务端的生命周期为

24小时。

A、正确

B、错误

答案:A

200.贴源层存放着最细粒度的明细事实数据和维度数据。

A、正确

B、错误

答案:B

201.明细层中,公司维度模型数据主要依据九大业务主题分别整合,以此支撑自

建统计分析类应用。

A、正确

B、错误

答案:B

202.2021年,公司建立主数据管理规范,固化主数据管理流程,结合国网企业

级主数据管理规范及要求,按照存储一份、服务统一的原则,推动统一数据模型

在源头的落地应用。

A、正确

B、错误

答案:A

203.专项核查的工作方案内容包括责任人及其成员单位,核查的数据范围,单位

范围,核查时间及周期,对接人、注意事项等要素。

Ax正确

B、错误

答案:B

204.信息化是数据业务化的过程,重点是通过信息系统固化业务流程,实现业务

从线下到线上转变,积累数据,支撑业务发展。

A、正确

B、错误

答案:B

205.数据保护伞平台是一款数据安全管理产品,数据保护伞所具备的功能不包括

授权。

Av正确

B、错误

答案:A

206.Apriori算法是一个聚类算法。

A、正确

B、错误

答案:B

207.打造源网荷储协同互动服务。就是挖掘负荷侧资源潜力,推动各类电源、电

网、负荷和储能协同优化,提升电网协调控制能力和客户用能效率,促进清洁能源

消纳。

A、正确

B、错误

答案:A

208,2021年,公司科技互联网专业需制定并印发《国网湖南电力新兴业务职责

建议方案》、《1+10新兴产业升级专项行动方案》,结合“转抓强”主题活动

为总抓手,高位推动新兴产业升级攻坚工程落实见效。

A、正确

B、错误

答案:A

209.语义网络系统由两部分组成:由语义网络组成的知识库和用于求解问题的解

释程序即推理机。

A、正确

B、错误

答案:A

210.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,营销专

业反馈问题最多的是新增需求

A、正确

B、错误

答案:A

211.分类与回归是同一概念的不同称呼。

A、正确

B、错误

答案:B

212.人工智能是计算机科学的一个分支,是智能计算机系统,即人类智慧在机器

上的模拟,或者说是人们使机器具有类似于人的智慧(对语言能理解、能学习、

能推理)。

A、正确

B、错误

答案:A

213.在全行业数字化转型加速的形势下,公司数字化转型窗口期转瞬即逝唯有加

快自我变革,才能避免机遇的丧失。

A、正确

B、错误

答案:A

214.数字化转型既符合中央精神和国家工作要求,也高度契能源互联网的内涵和

发展重点,更加具有时代特色。

A、正确

B、错误

答案:A

215.到“十四五”末,人资管理方面,人资数据质量优化率达到95%,基本建成

全业务覆盖的智慧人资管理服务体

A、正确

B、错误

答案:A

216.重构原数据超市,提升用户“读数、找数、用数”体验。

A、正确

B、错误

答案:A

217.关于Maxpute提供了完善的SQL访问,有效支持事务。

A、正确

B、错误

答案:B

218.下列函数中,time。是Python内置函数。

A、正确

B、错误

答案:B

219.海伯伦定理可以在计算机上实现其证明过程。

A、正确

B、错误

答案:B

220.采集个人信息数据时,遵循合法、正当、必要、最小化、准确性、可问责性

的原则下,无需获得个人信息主体同意。

A、正确

B、错误

答案:B

221.数字化转型是顺应能源革命与数字革命相融并进趋势的必然选择。

A、正确

B、错误

答案:A

222.数据管理方面,健全规范公司数据管理标准,陶建统一数据模型(SG-IMS)o

A、正确

B、错误

答案:B

223.电网数字化项目(成本性)需要开展结算、竣工决算和转资工作,电网数字化

项目(资本性)需开展结算工作。

A、正确

B、错误

答案:B

224.人工智能的研究长期目标是使现有的电子计算机更聪明,更有用,使它不仅

能做一般的数值计算及非数值信息的数据处理,而且能运用知识处理问题,能模

拟人类的部分智能行为。

A、正确

B、错误

答案:B

225.数字化转型可以看做是打造传统意义上的互朕网企业。

A、正确

B、错误

答案:B

226.公司组织制定数据共享负面清单管理规章制度,各单位和部门落实数据共享

负面清单管理要求,对本单位和本专业的数据共享负面清单管理工作负责,做到

职责明确、协同推进。

A、正确

B、错误

答案:A

227.贝叶斯决策是根据后验概率进行决策的一种方法。

Av正确

B、错误

答案:A

228.当相关系数r=0时,说明现象之间完全无关.

A、正确

B、错误

答案:B

229.数据授权流程包括需求提报、专业审核、授权实施三个环节。

A、正确

B、错误

答案:A

230.数字化工作就是建设信息系统。

Ax正确

B、错误

答案:B

231.框架是用于描述具有固定的静态对象的通用数据结构,但是也可以描述某些

简单的动态对象。

A、正确

B、错误

答案:B

232.数据需求方对涉及本专业负面清单的数据共享需求进行专业审核与合规审

查,明确敏感数据的脱敏要求。

Av正确

B、错误

答案:B

233.涉及国家秘密的数据,遵循国家有关法律法规要求。

A、正确

B、错误

答案:A

234.persist()和cache()是RDD的缓存方法

A、正确

B、错误

答案:A

235.各单位要坚持维护数据安全和促进数据开发利用并重,以数据开发利用促进

数据安全,以数据安全保障数据开发利用和产业发展。

A、正确

B、错误

答案:A

236.坚持“以共享为原则、不共享为例外”,公司各单位所有数据都必须有条件

接入数据中台。

A、正确

B、错误

答案:B

237.直接提供明细数据的社会公益类流程包括需求受理、需求分析与初审、保密

合规审核、数据归口审核、签订合同(协议)、提供服务六个环节

A、正确

B、错误

答案:A

238.《中华人民共和国数据安全法》首次提出了“重要数据”概念。

A、正确

B、错误

答案:B

239.createtabIeTABLE_ALIKETABLE_Bpartitioned(dtstring)表示的是创建表

A,将B表的值赋给A表。

A、正确

B、错误

答案:B

240.2021年,公司构建大数据分析创新环境,面向基层单位提供集成云资源、

数据(平台)、分析工具等一站式服务,推行数据产品研发经理制,发动基层单

位基于本职岗位开展大数据应用,按期组织发布、推广应用成果。

A、正确

B、错误

答案:A

241.各单位对本单位数据共享工作负责,参照总部数据共享职责分工,明确数据

共享职责界面,建立数据共享工作机制,落实公司数据共享工作要求,组织做好

本单位数据共享工作。

A、正确

B、错误

答案:A

242.国网湖南省电力有限公司2021年大数据应用及数据增值服务专项工作的工

作原则包括聚焦需求,不包括价值创造。

A、正确

B、错误

答案:B

243.bIink不包含PANGU组件。

A、正确

B、错误

答案:A

244.逆向推理的缺点是若提出的假设目标不符合事实,但是不会降低系统效率。

A、正确

B、错误

答案:B

245.完善电力服务开发规范,研究适应各类业务场景的数据服务模式,设计符合

数据应用标准的产品体系。

A、正确

B、错误

答案:B

246.公司科技互联网专业2021年基础资源运营方面需开展业务探索,拓展基础

资源综合应用业务模式,基础资源运营收入突破1亿元。

A、正确

B、错误

答案:A

247.公司各专业、各单位信息化基础不同、能力不一,对数字化转型的边界和目

标认识有差异,导致对数字化转型的战略认知有区别。

A、正确

B、错误

答案:A

248.《国家电网有限公司数据管理办法》指出:坚持问题导向,以业务和应用为

驱动,加强数据管理,满足生产需要、促进业务发展、创造业务价值。

A、正确

B、错误

答案:B

249.公司数据中台初步建成,汇聚166套业务系统(137套二级部署系统、29套

一级部署系统)核心数据、调控云和采集系统的实时数据,以及石油、煤炭、天

然气、水资源、发电等企业外部数据。

A、正确

B、错误

答案:A

250.建设易查、易用、可视的指标中心,提供类似“数学公式”的指标定义与计

算功能,支撑各专业指标开发。

A、正确

B、错误

答案:A

填空题

1.字典对象的(一)方法返回字典的“键”列表

答案:keys

2.数据中台中,贴源层的企业内部。更新是以“T-r方式更新的。

答案:结构化

3.各单位应遵循()原则,优化数据安全防护架构,推进数据保护技术研究与应用。

答案:三同步

4.贝叶斯网络中表示变量之间的依赖关系的是()。

答案:有向无环图

5.当PostgreSQLReader根据splitPk进行数据()后,会先后启动多个并发任务

完成数据同步。

答案:切分

6.RDS云盘实例采用。三副本机制,为实例数据提供高可靠保证。支持在可用

区内自动复制您的数据,防止意外硬件故障导致的数据不可用,保护业务免于组

件故障的威胁。

答案:分布式

7.RDS实例都支持日志管理,可以通过控制台查询实例的错误日志和慢日志明细,

帮助故障()分析。

答案:定位

8.在pandas中的,()用来读取csv文件

答案:_read_csv

9.(_)网络是一种竞争学习型的无监督神经网络,它能将高维输入数据映射到低

维空间,同时保持输入数据在高维空间的拓扑结构,即将高维空间中相似的样本

点映射到网络输出层中的临近神经元。

答案:S0M网络

10.已知c=np.arange(12).reshape(3,4),那么c.sum(axis=0)的结果是0

答案:array[12,15,18,21]

11.在Apriori-gen函数产生有效候选项集的过程中存在两个操作,一个是候选

产生,还有一个是0。

答案:候选剪枝

12.()可以对用户的行为或相关事件进行实时监测和分析的产品:。

答案:流计算

13.数据使用环节,应结合数据业务场景采用脱敏、水印、审计等技术手段实现

差异化防护,遵循()访问和处理个人信息和企业重要数据。

答案:最小授权原则

14.贝叶斯网络中表示变量之间的依赖关系的是()。

答案:有向无环图

15.Hadoop框架中两大核心是:()和()。

答案:HDFS、MapReduce

16.通过numpy数组的:—)属性可以获得数组的形状。

答案:shape

17.()又称自助聚集,是一种根据均匀概率分布从数据集中重复抽样的技术。

答案:装袋

18.Maxpute对SQLDML语句进行解析后,得到执行计划。构成执行计划的是由多

个有相互依赖关系的0组成。

答案:执行阶段(Stage)

19.公司内部共享数据时,应遵照()开展。

答案:数据共享负面清单

20.在集市层进行数据计算时,对于需要多次迭代计算的数据,可使用的dataw。

rks的数据分析计算工具主要是。。

答案:PyODPS

21.从数据到智慧的转换依次递进过程是()。

答案:数据、信息、知识、理解、智慧

22.构造了一个词表:{1.小明2.喜欢3.踢4.看5.足球6.篮球7.电影},利用上

述词表的索引号,文档{小明喜欢踢足球}可以用一个7维向量表示为()。

答案:[1110100]

23.决策树的基本流程遵循()的策略。

答案:分而治之

24.各单位应遵循“。”原则,优化数据安全防护架构,推进数据保护技术研

究与应用,强化数据全生命周期的安全保护。

答案:三同步

25.自然语言处理、语音识别、股票交易、气象预测等应用适合采用(_)处理。

答案:循环神经网络

26.数据接入方式主要有()。

答案:全量数据接入、增量数据接入、E文件数据接入

27.pandas中获取前n行数据是()。

答案:head(n)

28.Python内置函数。可以返回列表、元组、字典、集合、字符串以及range

对象中元素个数。

答案:len()

29.AGNES是一种采用()策略的层次聚类算法。

答案:自底向上

30.分析服务目录的使用方式包括()o

答案:在线查看、表授权、URL接口、API接口、其他

31.ElasticSearch存放所有关键词的地方是()。

答案:词典

32.列表、元组、字符串是Python的(一)(有序?无序)序列

答案:有序

33.数据传输环节,在()传输重要数据时应加密保护。

答案:互联网大区

34.在Python中,下列代码的运行结果为()。a=[1,2,3,None,0,[],]print(l

en(a))

答案:6

35.(一)以统计实体为对象,构建轻度汇总数据、明细业务宽表。

答案:宽表

36.ONE-HOT-ENCODING可用于()处理

答案:类别型特征

37.Iist(map(str,[1,2,3]))的执行结果为()

答案:[T,2,3]

38.集市层数据加工只能直接引用明细层、()(英文缩写)的数据。

答案:DWS

39.()的含义是最大化簇中文档与簇的质心的相似性。

答案:凝聚度

4O.MaxputeSQL任务中,发现join操作有数据倾斜时,可以考虑用()方法优

化。

答案:mapjoin

41.神经网络感知机只有(_)神经元进行激活函数处理,即只拥有一层功能神经

兀。

答案:输出层

42.聚类有多种划分方法,当它以能否合理的将一个点放入簇中来划分时,可以

分为互斥的、重叠的以及()的。

答案:模糊

43.()技术可以将所有数据的特性通过图的方式展现出来。

答案:数据可视化

44.假设有Python程序文件demo,py,代码如下:defmain():if_name_=="_m

ain—':print(1)else:print⑵main()将该程序文件直接运行时输出结果为(—

_),作为模块导入时得到结果(一)。

答案:1、2

45.通过聚集多个分类器的预测来提高分类准确率的技术称为()。

答案:组合

46.pandas中实现表格型数据集的对象是:(—)。

答案:DataFrame

47.已知函数定义deffunc(**p):returnsum(p.vaIues()),那么表达式func(x=

1,y=2,z=3)的值为()

答案:6

48.除了维归约,常用的数据归约方法还有()。

答案:值归约

49.通过互联网电子渠道交互数据时,应采取符合公司0的业务数据交互方式。

答案:安全防护方案

50.常见的图像预处理方法包括。

答案:图像降噪、图像增强、图像尺寸归一化

51.表达式‘aaaassddf'.strip('af')的值为()

答案:“ssdd”

52.已知一个数据集,n为特征数,m为训练样本数,如果n较小,而且m大小中

等(例如n在17000之间,而m在1070000之间),则一般选择什么核函数的

支持向量机。。

答案:高斯核的支持向量机

53.在matplotIib子图绘制中,若执行pit.subplot(3,2,5),则当前的绘图子区

域索引号是(一)0

答案:5

54.nu叩y中创建全0的矩阵使用()函数

答案:zeros

55.对外发布特定数据产品和服务,需按照国家、行业相关法律法规要求,获得

相应的备案、()。

答案:资质或牌照

56.假设正则表达式模块re已导入,那么表达式,e.sub('\d+'1'Ja12345bbb

b67c890doe')的值为()

答案:ua1bbbb1c1d1en

57.selectoromstudent该代码中的*号,表示的正确含义是O。

答案:所有的字段名

58.Apriori算法属于一个0算法。

答案:关联规则挖掘

59.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于

网络强国的重要思想和国家()战略、国家大数据发展战略,认真落实国务院国

资委加强合规管理、建设法治央企工作部署,紧扣“稳、进、育、开”四字要求,

秉持“引领规范、支撑推动”理念。

答案:网络空间安全

60.a=np.arange(1,13,1).reshape(3,4),np.mean(a,axis=0)的输出结果是()0

答案:[5,6,7,8]

61.从复杂度及价值高低两个维度,可以将数据分析分为()o

答案:描述性分析、诊断性分析、预测性分析、规范性分析

62.DBSCAN算法的MinPts参数的意义是()。

答案:密度阈值

63.数据加工包括()、。、()。

答案:数据清洗、数据变换、数据归约

64.()算法是最广泛使用的聚类算法,算法简单,易于理解和操作。

答案:K-means

65.字典中多个元素之间使用(—)分隔开,每个元素的“键”与“值”之间使

用(一)分隔开

答案:逗号、冒号

66.()又称自助聚集,是一种根据均匀概率分布从数据集中重复抽样的技术。

答案:装袋

67.RDD具有()和()特征。

答案:可容错性、并行数据结构

68.在()神经网络中,允许同一层节点项链或一层的节点连接到前面各层中的节

点。

答案:递归

69.为了允许支持向量机在一些样本上出错,引入()的概念。

答案:软间隔

70.以下代码的运行结果为0x=[1,2,3];x.append([4,5]);x.extend([6,[7,

8)]);print(x);

答案:[1,2,3,[4,5],6.(7,8)]

71.Python标准库math中用来计算平方根的函数是()

答案:sqrt

72.决策树的决策结果存放在()上。

答案:叶节点

73.生成DWS的表,不可以使用的数据是来自0(英文缩写)层的。

答案:ADS

74.Python由解释器、编译器和(一)三个主要部分组成

答案:虚拟机

75.分析服务目录的服务类别包含()o

答案:场景应用、分析报告、算法模型、分析数据集、

76.生成DWD的表,可以使用的数据是来自(—)层的。

答案:0DS

77.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于

()的重要思想和国家网络空间安全战略、国家大数据发展战略,认真落实21务

院国资委加强合规管理、建设法治央企工作部署,紧扣“稳、、进、育、开”四字

要求,秉持“引领规范、支撑推动”理念。

答案:网络强国

78.数据集成是稳定高效、弹性伸缩的()平台,为阿里云大数据计算引擎(Ma

xputevAnalyticDBforPostgreSQL和Hologres等)提供离线、批量数据的进出

通道。

答案:数据同步

79.特征工程的目的是()o

答案:得到最好的输入数据

80.HDFS是一个()文件系统,提供读取和写入HDFS双向通道的功能,可以通过

脚本模式配置同步任务。

答案:分布式

81.()算法是决策树学习的基本算法,其他多数决策树学习方法都是它的变体。

答案:ID3算法

82.企业重要数据原则上应存储于()。

答案:管理信息大区

83.SG-CIM4.5模型和标准表是(一),主要用于两级数据贯通以及统推应月建

设。

答案:国网公司统一设计的模型体系

84.贝叶斯网络中的一个节点,如果它的父母节点已知,则该节点()于它的所有

非后代节点。

答案:条件独立

85.分析服务目录的定位是。。

答案:实现服务产品可视、可查、可用、可迭代

86.在Apriori-gen函数产生有效候选项集的过程中存在两个操作,一个是候选

产生,还有一个是0。

答案:候选剪枝

87.数据对外提供应遵守国家有关政策法规和公司管理规定要求,除国家机关依

法调取数据外,原则上公司0不对外提供。

答案:明细业务数据

88.聚合函数()用于求数据平均值的。

答案:AVG

89.HBaseReader通过HBase的Java客户端连接远程HBase服务,并通过Scan

方式读取您指定的rowkey范围内的数据,将读取的数据使用数据集成自定义的

数据类型拼装为。的数据集,并传递给下游Writer处理。

答案:抽象

90.有两个样本点,第一个点为正样本,它的特征向量是(0.7);第二个点为负样

本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类

器的分类面方程是()o

答案:x+2y=3

91.使用运算符测试集合包含集合A是否为集合B的真子集的表达式可以写作(一

—)

答案:A<B

92.在Apriori算法中,候选项集划分为不同的桶,存放在()中。

答案:Hash树

93.若arr=np.array([1,2,3]),则arr*arr•的输出为(—)。

答案:([1,4,9])

94.分析服务目录的共享原则是()。

答案:以共享为原则,不共享为例外

95.Python安装扩展库常用的是()工具

/r/r•

答案:pip

96.组合方法由训练数据构建一组(),后通过对每个该食物的预测来投票进行分

类。

答案:基分类器

97.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研

究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分

支学科叫()。

答案:机器学习

98.数据存储环节,企业重要数据原则上应存储于()。

答案:管理信息大区

99.数据传输环节,在互联网大区()重要数据时应加密保护。

答案:传输

100.所有预测模型在广义上都可称为一个或一组()o

答案:规则

101.依托全业务统一数据中心和数据中台依法合规进行()、共享应用,推动跨

专业数据贯通融合。

答案:数据归集

102.在Spark中,()是指RDD的每个分区都只被子RDD的一个分区所依赖。

答案:窄依赖

103.给定一个置信概率和置信区域,若误差超过置信区域,则认为误差不是随机

误差引起,视为异常值的判别方法0。

答案:统计判别法

104.数据同步任务中,可以从源并行读取或并行写入数据存储端的最大线程数称

为()。

答案:并发数

105.如果规则集中的规则按照优先级降序排列,则称规则集是()o

答案:有序规则

106.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研

究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分

支学科叫()。

答案:机器学习

107.()算法要求基学习器能对特定的数据分布进行学习,在训练过程的每一轮

中,根据样本分布为每个训练样本重新赋予一个权重。

答案:Boosting

108.(一)命令既可以删除列表中的一个元素,也可以删除整个列表

答案:del

109.数据使用时,应结合数据业务场景采用脱敏、水印、审计等技术手段实现差

异化防护,遵循()访问和处理个人信息和企业重要数据。

答案:最小授权原则

110.一般将原始业务数据分为多个部分,()用于模型的构建。

答案:训练集

111.当Kafka中日志片段大小达到。时,当前日志片段会被关闭。

答案:1GB

112.设s="abcdefg",则s[::2]值是()

答案:aceg

113.事务型事实表也称为(),包含与业务过程描述有关的所有事实,数据来自

于数据中台共享层数据,经清洗、转换、合并后得到。

答案:原子事实表

114.ADS的普通表的一级分区数量最多有()。

答案:256个

115.资产评估应用实现全链路的数据资产监管和价值追踪,具体包括资产使用评

估、()评估和敏感数据评估等功能。

答案:资产价值

116.偏倚一方差分解是分析预测模型的()的形式化方法。

答案:预测误差

117.高通滤波后的图像通常较暗,为改善这种情况,将高通滤波器的转移函数加

上一常数量以便于引入一些低频分量。这样滤波器叫。。

答案:高频提升滤波器

118.下列表达式中[print列y,10O-x-y)forxinrange(21)foryinrange(34)if

(100-x-y)%3=0and5*x+3*y+(100-x-y)〃3=100]第三次输出的结果是()。

答案:81181

119.国家建立(),对影响或者可能影响国家安全的数据处理活动进行国家安全

审查。

答案:数据安全审查制度

120.AGNES是一种采用()策略的层次聚类算法

答案:自底向上

121.C4.5决策树算法中采用(一)对连续属性进行离散化处理。

答案:二分法

122.词袋模型中的文本向量每个元素表示该词的()。

答案:频率

123.列表中可以放()个字符串

答案:无限个

124.“数据不出中台,数据(一)基于中台”。

答案:加工

125.向数据表添加数据,()是添加的关键字。

答案:INSERT

126.在SQL中,创建数据库用的命令是()

答案:CREATEDATABASE

127.数据挖掘与知识发现的英文缩写是()。

答案:KDD

128.()是一种处理输入特征的组合方法。

答案:随机森林

129.Maxpute的Mapjoin不支持()。

答案:fulI

130.元组变量t=("cat"F"dog","tiger","human"),t[::-1]的结果是

答案:('human','tiger','dog','cat1)

131

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论