![能源大数据应用开发技能竞赛理论考试题库-下(判断、填空题)_第1页](http://file4.renrendoc.com/view12/M02/3A/0C/wKhkGWbdYYaAfNQ8AAEY_Ld-NTs852.jpg)
![能源大数据应用开发技能竞赛理论考试题库-下(判断、填空题)_第2页](http://file4.renrendoc.com/view12/M02/3A/0C/wKhkGWbdYYaAfNQ8AAEY_Ld-NTs8522.jpg)
![能源大数据应用开发技能竞赛理论考试题库-下(判断、填空题)_第3页](http://file4.renrendoc.com/view12/M02/3A/0C/wKhkGWbdYYaAfNQ8AAEY_Ld-NTs8523.jpg)
![能源大数据应用开发技能竞赛理论考试题库-下(判断、填空题)_第4页](http://file4.renrendoc.com/view12/M02/3A/0C/wKhkGWbdYYaAfNQ8AAEY_Ld-NTs8524.jpg)
![能源大数据应用开发技能竞赛理论考试题库-下(判断、填空题)_第5页](http://file4.renrendoc.com/view12/M02/3A/0C/wKhkGWbdYYaAfNQ8AAEY_Ld-NTs8525.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1能源大数据应用开发技能竞赛理论考试题库-下(判断、填空题汇总)判断题1.建设易查、易用、可视的指标中心,需要提供类似“数学公式”的指标定义与计算功能,支撑各专业指标开发。A、正确B、错误答案:A2.各业务部门制定本专业数据资产标准,负责公司数据资产标准在本专业的实施。A、正确B、错误答案:B3.实时在线数据分析服务,主要指对数据更新频率要求为日级以下数据进行流式加工处理的功能需求。A、正确B、错误答案:A4.数字化转型的基本原则是坚持战略引领、坚持价值导向、坚持科技创新、坚持企业级建设、坚持全要素驱动。A、正确B、错误答案:A5.公司鼓励数据依法合理有效利用,促进以数据价值为关键要数的数字经济发展。A、正确B、错误答案:B解析:《中华人民共和国数据安全法》第七条:国家保护个人、组织与数据有关的权益,鼓励数据依法合理有效利用,保障数据依法有序自由流动,促进以数据为关键要素的数字经济发展。6.数据授权流程包括需求提报、专业审核、授权实施三个环节。A、正确B、错误答案:A7.网络运营者不得泄露、篡改、毁损其收集的个人信息,未经被收集者同意,不得向他人提供个人信息。A、正确B、错误答案:A解析:《中华人民共和国网络安全法》第四十二条规定,网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。8.日常核查由业务部门负责按日执行,检查的数据范围以公司数据质量规则库覆盖的数据范围为准。A、正确B、错误答案:B9.数据管理方面,健全规范公司数据管理标准,构建统一数据模型(SG-IMS)。A、正确B、错误答案:B10.图搜索算法中,CLOSE表用来登记待考察的节点A、正确B、错误答案:B11.从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,但不能留存审核、交易记录。A、正确B、错误答案:B解析:《中华人民共和国数据安全法》第三十三条:从事数据交易中介服务的机构提供服务,应当要求数据提供方说明数据来源,审核交易双方的身份,并留存审核、交易记录。12.PCA的步骤包括构建协方差矩阵、矩阵分解得到特征值和特征向量、特征值排序、特征值归一化。A、正确B、错误答案:B13.启发式搜索一定比盲目式搜索好A、正确B、错误答案:B14.基于数据中台组件和能力,研究枃构建数据应用研发平台,强化数据中台、联邦学习等前沿技术研究和落地,能够为促进数据共建共创、共用共享打下稳固基础。A、正确B、错误答案:B15.数字化转型可以看做是打造传统意义上的互联网企业。A、正确B、错误答案:B16.公司科技互联网专业2021年工作目标有:业绩指标上创一流、产业发展上有跨越、数字转型上有突破。A、正确B、错误答案:A17.轻度汇总层主要面向业务视角,存放具有共性需求的宽表和单指标表。A、正确B、错误答案:A18.到“十四五”末,信息通信网络全面实现网络设备国产化率95%A、正确B、错误答案:B19.当有一条以上的规则的条件部分和当前数据库相匹配时,就需要决定首先使用哪一条规则,这称为冲突解决。A、正确B、错误答案:A20.各单位负面清单原则上应与分部负面清单保持一致,按照分部负面清单执行。A、正确B、错误答案:B21.三大支撑机构梳理分析数据治理平台及相关组件提报的数据质量业务描述,形成符合要求的业务规则。A、正确B、错误答案:A解析:《国网湖南省电力有限公司基础数据管理实施细则》第十条:三大支撑机构”主要职责是:(一)负责从业务层面贯彻落实公司基础数据管理实施细则及相关要求;(二)负责各自职责范围内的基础数据质量业务规则编制以及业务规则和技术规则的一致性验证;(三)负责制定基础数据录入规范,推动源端业务系统录入校核功能完善22.int、smallint是SQLServer数据库的系统数据类型(?)A、正确B、错误答案:A23.公司组织制定统一数据管理规章制度,各单位和部门落实数据管理要求,对本单位和本专业的数据负责,共同推进数据管理体系落地。A、正确B、错误答案:A24.依据国家相关法律法规和公司有关要求,对外提供数据中涉及国家秘密和公司商业秘密的,均按公司有关要求履行相应的审批手续A、正确B、错误答案:B25.鲁宾逊归结原理中空子句是不可满足的,若一个子句集包含空子句集,则这个子句集一定是不可满足的。A、正确B、错误答案:A26.开展涉及国家秘密的数据处理活动,应当遵循国家有关法律法规要求。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第五十三条:开展涉及国家秘密的数据处理活动,适用《中华人民共和国保守国家秘密法》等法律、行政法规的规定。在统计、档案工作中开展数据处理活动,开展涉及个人信息的数据处理活动,还应当遵守有关法律、行政法规的规定。27.TunnelUpload命令上传时,每个Tunnel的Session在服务端的生命周期为24小时。A、正确B、错误答案:A28.在安全合规的前提下,对同一需求方、同类数据用途及范围的数据需求,首次履行审批流程,后续仍要重复审批。A、正确B、错误答案:B29.大数据常见的计算方式有三种:离线计算、流计算以及在线计算,其中流计算是消息驱动的,数据更新一般是定时更新。A、正确B、错误答案:B30.国网互联网部和业务部门共同建立主数据管理规范和要求,信通公司和相关专业支撑机构具体承担主数据的维护,大数据中心承担主数据组件建设工作。A、正确B、错误答案:B31.无监督逐层训练是单隐层网络训练的有效手段。A、正确B、错误答案:B32.两个对象之间的相异度是这两个对象差异程度的数值度量。A、正确B、错误答案:A33.建立横向部门之间、纵向各单位之间职责清晰、分工负责、协同配合的工作机制,共同推动公司数据安全管理工作。A、正确B、错误答案:B34.虚假数据的存在会影响数据分析的信度。A、正确B、错误答案:A35.监测上下游企业生产活跃程度,可以深度分析产业链发展协同度及抗风险能力。A、正确B、错误答案:A36.语义网络、框架等知识表示方法,均是对知识和事实的一种静止的表示方法。A、正确B、错误答案:A37.发现需求提出方存在违反国家法律、法规,或者与公司签署的保密协议、合同相关情况时,应立即要求其停止相关行为,同时终止数据开放,并按规定追究相关责任A、正确B、错误答案:A38.大数据计算服务(MaxCompute,原ODPS)中的日志表log是一张分区表,分区键是dt,每天产生一个分区用于存储当天新增的数据,现在共有dt=’20160101’至dt=’20160131’共31个分区的数据,为了删除20160101当天新增的数据,可以通过alter方式实现。A、正确B、错误答案:A39.噪声是一个测量变量中的随机错误或偏差。A、正确B、错误答案:A40.预测性分析用于发现隐藏在大型数据集中的有意义联系。A、正确B、错误答案:B41.科技互联网专业2021年防灾产业方面需加强科技成果产业推广,确保年内实现防灾业务外部营收0.6亿元目标。A、正确B、错误答案:A42.2021年,公司按照时间计划要求完成5G应用实施计划、试点应用方案编制,完成外网北斗服务平台部署,完成50座基准站接入调试和北斗服务平台功能测试。A、正确B、错误答案:B解析:2020年,国家电网公司基本建成北斗地基增强网和北斗综合服务平台。43.SparkJob默认的调度模式是FIFO。A、正确B、错误答案:A44.persist()和cache()是RDD的缓存方法A、正确B、错误答案:A45.数字化转型既符合中央精神和国家工作要求,也高度契能源互联网的内涵和发展重点,更加具有时代特色。A、正确B、错误答案:A46.公司科技互联网专业2021年重点任务:推动“科技创新、数字化、新兴产业”三大工作齐头并进,全面提升公司科技互联网专业管理质效。具体要做好3个方面23项工作。A、正确B、错误答案:A47.大数据计算服务的数据仓库的管理员发现用户表user没有备注信息,为了方便其他人员的使用,可以通过alter方式给这张表加上备注。A、正确B、错误答案:A48.每日业务指标报表生成可使用实时在线数据分析服务。A、正确B、错误答案:B49.数据责任部门结合实际应用需要,在线提出数据共享需求,明确数据范围、数据用途、数据获取方式等。A、正确B、错误答案:B解析:数据共享是由数据应用部门提出跨组织、跨部门的数据获取需求。50.开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第二十七条:开展数据处理活动应当依照法律、法规的规定,建立健全全流程数据安全管理制度,组织开展数据安全教育培训,采取相应的技术措施和其他必要措施,保障数据安全。利用互联网等信息网络开展数据处理活动,应当在网络安全等级保护制度的基础上,履行上述数据安全保护义务。51.分类器的期望误差不受训练数据可变性的影响,因为训练集合的决策边界相同。A、正确B、错误答案:B52.在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。A、正确B、错误答案:B53.根据经验对一个事物或现象为真的相信程度称为可信度A、正确B、错误答案:A54.公司科技互联网专业2021年基础资源运营方面需开展业务探索,拓展基础资源综合应用业务模式,基础资源运营收入突破1亿元。A、正确B、错误答案:A55.基于数据共享需求和专业审核意见,国网互联网部从数据归口管理角度,组织对数据安全、合规、技术方式等进行审核、确认。A、正确B、错误答案:A56.定量属性可以是整数值或者是连续值。A、正确B、错误答案:A57.公司数据中台初步建成,汇聚166套业务系统(137套二级部署系统、29套一级部署系统)核心数据、调控云和采集系统的实时数据,以及石油、煤炭、天然气、水资源、发电等企业外部数据。A、正确B、错误答案:A58.探索性数据分析与传统统计学中的验证性方法类似,他们都要事先提出假设。A、正确B、错误答案:B59.产生式规则不能表达具有结构性的知识,但效率较高。A、正确B、错误答案:B60.插值运算属于statsmodels模块的主要特点。A、正确B、错误答案:B61.blink不包含PANGU组件。A、正确B、错误答案:A62.结合负面清单使用情况,根据数据共享应用需要,国网互联网部会同总部业务部门开展负面清单优化、更新,并通过离线方式发布、使用。A、正确B、错误答案:B63.print(100-25*3%4)结果是97。A、正确B、错误答案:A64.数组的切片是原数组的副本。A、正确B、错误答案:B65.三大支撑机构按照数据质量管理评价标准的要求确认质量问题分级。A、正确B、错误答案:B66.数字化转型是推进公司战略目标落地、实现高质量发展的迫切需要。A、正确B、错误答案:A67.各单位要坚持维护数据安全和促进数据开发利用并重,以数据开发利用促进数据安全,以数据安全保障数据开发利用和产业发展。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第十三条:国家统筹发展和安全,坚持以数据开发利用和产业发展促进数据安全,以数据安全保障数据开发利用和产业发展。68.人工智能是智能计算机系统,即人类智慧在机器上的模拟,或者说是人们使机器具有类似于人的智慧(对语言能理解、能学习、能推理)。A、正确B、错误答案:A69.开发实施类项目包括信息系统(平台)功能设计和利用各类编程语言进行开发(含需求分析、系统设计和开发等工作),以及开发工作完成或购买套装软件后的配套安装、配置调试和培训等工作的项目。A、正确B、错误答案:A70.数据需求方对涉及本专业负面清单的数据共享需求进行专业审核与合规审查,明确敏感数据的脱敏要求。A、正确B、错误答案:B解析:数据的共享应用要严格执行公司网络信息安全和保密有关规定,原则上只输出统计计算结果,明细数据不出中台,对涉及负面清单中个人信息等敏感数据的共享应用,由数据中台负责进行数据脱敏处理,保证数据应用安全。71.MaxCompute的屏显行数可以通过管理控制台实现。最大的显示条数为1000A、正确B、错误答案:B72.企业级指标建设示范通过指标中心的共享复用,打造一批示范县公司和供电所数字化指标看板。A、正确B、错误答案:A73.业务规则是指数据质量符合业务规则的条件,用以描述符合业务的规范要求。A、正确B、错误答案:A74.SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器。A、正确B、错误答案:B75.参考数据是对特定数据项允许取值集合的名称、代码值、含义、用途的规范定义。A、正确B、错误答案:A76.在中华人民共和国境内开展数据处理活动及其安全监管,适用《中华人民共和国数据安全法》,在中华人民共和国境外开展数据处理活动,不适用本法。A、正确B、错误答案:B解析:《中华人民共和国数据安全法》第二条:在中华人民共和国境内开展数据处理活动及其安全监管,适用本法。在中华人民共和国境外开展数据处理活动,损害中华人民共和国国家安全、公共利益或者公民、组织合法权益的,依法追究法律责任。77.下列函数中,time()是Python内置函数。A、正确B、错误答案:B78.阶跃函数与sigmoid函数均为典型激活函数()。A、正确B、错误答案:A79.湖南省坚持“三新四高”发展战略,聚焦国家重要先进制造业、科技创新、内陆地区改革开放,旨在推动中部地区崛起和长江经济带发展。A、正确B、错误答案:B解析:2020年,湖南提出大力实施“三高四新”战略,即打造“三个高地”、践行“四新”使命。“三个高地”为国家重要先进制造业高地、具有核心竞争力的科技创新高地、内陆地区改革开放高地;“四新”使命为在推动高质量发展上闯出新路子,在构建新发展格局中展现新作为,在推动中部地区崛起和长江经济带发展中彰显新担当,奋力谱写新时代坚持和发展中国特色社会主义的湖南新篇章。80.任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面对中华人民共和国采取歧视性的禁止、限制或者其他类似措施的,中华人民共和国可以根据实际情况对该国家或者地区对等采取措施。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第二十六条:任何国家或者地区在与数据和数据开发利用技术等有关的投资、贸易等方面对中华人民共和国采取歧视性的禁止、限制或者其他类似措施的,中华人民共和国可以根据实际情况对该国家或者地区对等采取措施。81.2023-2025年,实现业务中台对公司重点应用支撑覆盖率达到90%,实现中台服务可用率到达95%以上。A、正确B、错误答案:A82.在互联网大区传输重要数据时应加密保护,采用公司统一密码基础设施签发的密钥或证书。A、正确B、错误答案:A83.电网数字化项目(资本性)竣工投产后,项目建设单位(部门)应按照公司档案管理要求做好项目文件材料归档工作,保证项目档案的真实准确、齐全完整、系统规范,并在竣工投产六个月内完成向档案管理部门移交。A、正确B、错误答案:B84.构建农村“空心率”分析模型精确测算行政村实际常住人口数量,能够精确识别“空心村”和“空心率”,辅助政府提高农村治理现代化水平。A、正确B、错误答案:A解析:2020年1月,国网甘肃电力成立技术攻坚团队,开展调研,收集数据,构建数据分析模型,不断训练、优化、验证,最终确定基于梯度增强树回归分析模型首创EEGM分析模型(基于用电量、经济与地理特征的空心村人口测算模型),识别出了陇南市“空心村”和空心率。国网甘肃省电力公司和陇南市政府协商将分析结果应用到陇南乡村大数据平台的便民服务功能,为人口普查工作人员提供住房空置情况、农村人口流动情况等相关信息,辅助调整入户时间,提高普查效率、节约普查成本,为农村留守老人、劳务输转和村貌治理等问题精准施策提供数据参考,助力实施乡村振兴战略落地,形成了电力大数据服务政府治理体系、治理现代化建设的“甘肃样本”。85.电网数字化储备项目下达计划前,须完成可研批复。限上项目由各单位互联网职能管理部门负责批复,限下项目由各单位信通公司负责批复。A、正确B、错误答案:B86.公司科技互联网专业2021年内需完成“能源看经济”、“能源看灾害防治”、“能源看乡村振兴”、“能源看环保”、“能源+企业用能”、僵尸空壳企业监测应用等产品在能源大数据平台的统一发布。A、正确B、错误答案:A87.推进新能源预测平台和碳市场交易辅助分析产品试点培育,试点开展火电企业碳排放监测与分析,探索碳排放诊断及对标模式等业务,加强技术与商业模式创新,推进市场应用拓展。A、正确B、错误答案:A88.关于MaxCompute提供了完善的SQL访问,有效支持事务。A、正确B、错误答案:B89.经过审批后,外部合作单位和供应商可以在对互联网提供服务的网络和信息系统中存储或运行公司商业秘密数据和重要数据。A、正确B、错误答案:B90.命题逻辑无法把它所描述的客观事物的结构及逻辑特征反映出来,也不能把不同事物间的共同特征表述出来。A、正确B、错误答案:A91.RDD中的数据被分区存储在集群中,使得任务可以并行执行。A、正确B、错误答案:A92.对于ADS的数据一致性问题,当updateType=realtime时,不支持事务,并且仅遵循会话一致性的设计,所以ADS并不能作为OLTP系统使用。A、正确B、错误答案:B93.非经中华人民共和国主管机关批准,境内的组织、个人不得向外国司法或者执法机构提供存储于中华人民共和国境内的数据。上述说法是否正确()A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第三十六条:中华人民共和国主管机关根据有关法律和中华人民共和国缔结或者参加的国际条约、协定,或者按照平等互惠原则,处理外国司法或者执法机构关于提供数据的请求。非经中华人民共和国主管机关批准,境内的组织、个人不得向外国司法或者执法机构提供存储于中华人民共和国境内的数据。94.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,反馈问题最多的是科网专业A、正确B、错误答案:B95.特征提取技术并不依赖于特定的领域。A、正确B、错误答案:B96.加快制定公司数据增值服务产品建设规范,主要指研究数据增值服务管理机制、工作流程、产品开发策略,制订公司数据增值服务指导意见,推进业务规范化高质量发展。A、正确B、错误答案:A97.完善电力服务开发规范,研究适应各类业务场景的数据服务模式,设计符合数据应用标准的产品体系。A、正确B、错误答案:B98.采集个人信息数据时,遵循合法、正当、必要、最小化、准确性、可问责性的原则下,无需获得个人信息主体同意。A、正确B、错误答案:B解析:《中华人民共和国网络安全法》第四十一条网络运营者收集、使用个人信息,应当遵循合法、正当、必要的原则,公开收集、使用规则,明示收集、使用信息的目的、方式和范围,并经被收集者同意。99.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,分析了供电所常用25套信息系统A、正确B、错误答案:A100.分类任务就是通过学习得到一个目标函数F,把每个属性集X映射到一个预先定义的预标号Y。A、正确B、错误答案:A101.根据项目实际情況,可将结算并入竣工决算中一起编制。项目竣工决算报告应在项目竣工验收通过后三个月内完成。A、正确B、错误答案:A102.框架适合表达结构性的知识,概念、对象等知识最适于用框架表示A、正确B、错误答案:A103.人工智能是计算机科学的一个分支,是智能计算机系统,即人类智慧在机器上的模拟,或者说是人们使机器具有类似于人的智慧(对语言能理解、能学习、能推理)。A、正确B、错误答案:A104.泛化误差可以认为是分类器的期望检验误差。A、正确B、错误答案:A105.分析层的各个项目空间,每个业务流程应设置至少一个正常调度的二级虚拟节点A、正确B、错误答案:A106.研究数据新产品新业务定位、核心目标、结构功能和研发推广可行性,形成专项调研分析报告,可以为开展具有市场价值的数据产品研发和应用服务提供指导。A、正确B、错误答案:A107.使用MaxcomputeSQL:createtablet1liket2;建表时,表t1不会具有表t2的生命周期属性。A、正确B、错误答案:A108.估价商圈经济及夜经济发展情况,可以分析产业结构、综合园区企业运营活跃程度、城乡发展协同程度和产业布局合理性A、正确B、错误答案:B109.国网湖南省电力有限公司数字化系统深化应用促基层减负专项行动,营销专业反馈问题最多的是新增需求A、正确B、错误答案:A110.公司组织制定数据共享负面清单管理规章制度,各单位和部门落实数据共享负面清单管理要求,对本单位和本专业的数据共享负面清单管理工作负责,做到职责明确、协同推进。A、正确B、错误答案:A111.不确定性推理指推理所使用的知识和推出的结论可以是不确定的。所谓不确定性是真值为假。A、正确B、错误答案:A112.开展大数据应用成果年度征集遴选工作,印发大数据应用成果集,发布推介年度大数据应用优秀成果。A、正确B、错误答案:A113.数字化转型是数据业务化的过程,重点是挖掘数据价值,打造数字生态,赋能传统产业,拓展新兴产业,一般包括产业数字化和数字产业化两个方面。A、正确B、错误答案:A114.数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第三条:本法所称数据,是指任何以电子或者其他方式对信息的记录。数据处理,包括数据的收集、存储、使用、加工、传输、提供、公开等。数据安全,是指通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。115.关联规则是反映事物之间的依赖关系,典型例子是购物篮分析,常见算法有Apriori关联算法和FP-growth关联算法。A、正确B、错误答案:A116.国网湖南省电力有限公司2021年大数据应用及数据增值服务专项工作的工作原则包括聚焦需求,不包括价值创造。A、正确B、错误答案:B117.湖南省电力有限公司数据服务能力提升专项行动工作要求有加强组织、明确责任;强化协同、形成合力;定期通报,严格考核。A、正确B、错误答案:A118.专项核查由信通公司执行,并生成数据质量问题清单,生成的数据质量问题清单按发起人要求推送至数据中台及相关组件。A、正确B、错误答案:B119.命题是可以判断真假的语句。A、正确B、错误答案:B120.坚持“以共享为原则、不共享为例外”,公司各单位所有数据都必须有条件接入数据中台。A、正确B、错误答案:B121.数据接入方式主要有两种,全量数据接入、增量数据接入。A、正确B、错误答案:B122.公司各级业务部门负责重要数据相关业务系统开通、数据采集、使用和发布环节的安全审核。A、正确B、错误答案:A123.Maxcompute中,允许的SQL的最大长度为8M。A、正确B、错误答案:B124.createtableTABLE_ALIKETABLE_Bpartitioned(dtstring)表示的是创建表A,将B表的值赋给A表。A、正确B、错误答案:B125.各业务部门参考互联网部评价标准对各二级单位的数据质量管理工作进行评价并制定考核规定。A、正确B、错误答案:A126.DataWorks中数据同步抽取(Reader)支持Redis数据源类型。A、正确B、错误答案:B127.国网湖南省电力有限公司“十四五”数字化规划基准年为2021年.A、正确B、错误答案:B128.MaxCompute图模型主要适合用于迭代计算应用场景。A、正确B、错误答案:A129.ADS中创建事实表(普通表)时会有一些限制,二级分区只能是Hash或List。A、正确B、错误答案:B130.关于MaxcomputeSQL,大部分标准SQL的功能都支持,但是不支持窗口函数、rownum等。A、正确B、错误答案:B131.语义网络系统由两部分组成:由语义网络组成的知识库和用于求解问题的解释程序即推理机。A、正确B、错误答案:A132.除政府监管类及公共开放类部分按法律、行政法规规定确需提供业务明细数据外,其余原则上不对外提供业务明细数据A、正确B、错误答案:A133.打造源网荷储协同互动服务。就是挖掘负荷侧资源潜力,推动各类电源、电网、负荷和储能协同优化,提升电网协调控制能力和客户用能效率,促进清洁能源消纳。A、正确B、错误答案:A134.直接提供明细数据的社会公益类流程包括需求受理、需求分析与初审、保密合规审核、数据归口审核、签订合同(协议)、提供服务六个环节A、正确B、错误答案:A135.加强数据对外开放的底层设计,统筹推进公司数据开放工作,建立规范的数据开放标准、流程,实现数据有序对外开放。A、正确B、错误答案:B136.DBSCAN是一种基于原型的、划分的聚类技术。A、正确B、错误答案:B137.政府监管类和公共开放类需求由相关业务部门承接,公益服务类和商务增值类需求由开展数据应用的业务部门(单位)承接A、正确B、错误答案:A138.数字化转型是推动构建以新能源为主体的新型电力系统、服务碳达峰碳中和目标的迫切需要。A、正确B、错误答案:A139.回归平均法属于外推法。A、正确B、错误答案:B140.在新兴产业运营能力升级方面,打造以数据、资金、物资、技术、人才等资源的高速流动机制、资源连接渠道,实现新兴产业资源供需的有机协同与快速响应。A、正确B、错误答案:A141.数字化转型是顺应能源革命与数字革命相融并进趋势的必然选择。A、正确B、错误答案:A142.单个谓词是谓词公式。A、正确B、错误答案:A143.国网大数据中心是公司数据管理的专业支撑机构,在总部互联网部和业务部门的委托和指导下,承担具体的数据管理和应用工作。A、正确B、错误答案:A144.可信度带有较大的主观性和经验性,其准确性难以把握A、正确B、错误答案:A145.如果搜索是经接近起始节点的程序来依次扩展节点,这种搜索叫深度搜索。A、正确B、错误答案:B146.2021年,公司构建大数据分析创新环境,面向基层单位提供集成云资源、数据(平台)、分析工具等一站式服务,推行数据产品研发经理制,发动基层单位基于本职岗位开展大数据应用,按期组织发布、推广应用成果。A、正确B、错误答案:A147.ADS的高度智能优化策略是指:CBO。A、正确B、错误答案:A148.人工智能的研究途径是主张通过运用计算机科学的方法进行研究,实现人工智能在计算机的模拟。A、正确B、错误答案:A149.十四五期间,以“三融三化”为总体思路,全力推动公司全业务、全环节数字化转型。即主动融入电网业务、融入生产一线、融入产业生态,推进架构中台化、数据价值化、业务智能化,赋能电网和企业高质量发展。A、正确B、错误答案:A150.公司持续完善“电力助乡村振兴”系列产品,孵化扶贫产业发展、美丽乡村建设、特色小镇建设等产品,加强技术与商业模式创新,推进市场应用拓展。A、正确B、错误答案:A151.专家系统的结构选择不需要根据系统的应用环境和所执行任务的特点就可以确定。A、正确B、错误答案:B152.数据保护伞平台是一款数据安全管理产品,数据保护伞所具备的功能不包括授权。A、正确B、错误答案:A153.python的内置函数len()函数可以返回列表、元组、字典、集合、字符串以及range对象中元素个数A、正确B、错误答案:A154.逆向推理的缺点是若提出的假设目标不符合事实,但是不会降低系统效率。A、正确B、错误答案:B155.MaxCompute的分区表的分区层次目前不能超过.6层。A、正确B、错误答案:A156.统筹公司数据、知识、成果等资源围绕数据中台打造开放式的大数据应用发展模式,能够推动资源共享和跨界融合,主动融入新发展格局,带动产业链上下游共同发展构建互利共赢的能源数字新生态。A、正确B、错误答案:A157.开展电力领域碳中和进程监测评估,建立能源生态链与电力数据关联模型,发布电力领域碳指数,可以做到精准评估各地区、各主体措施成效,提高政策实施效果。A、正确B、错误答案:A158.预测性分析是一种将知识转换为智慧的分析过程。A、正确B、错误答案:B159.Spark组件不包括ResourceManager、Executor、Driver、RDDA、正确B、错误答案:B160.IQR方法不适用于监测异常值。A、正确B、错误答案:B161.2021年公司数据增值服务工作的总体布局为“一体四翼”。A、正确B、错误答案:A解析:国家电网公司2021年“两会”提出“一业为主、四翼齐飞、全要素发力”的总体布局,明确了公司改革发展的关键,确立了新形势下各项工作的战略方向。国网一体四翼指的是以电网业务为主体,以金融业务、国际业务、支撑产业、战略性新兴产业为四翼。162.国家支持开发利用数据提升公共服务的智能化水平。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第十五条:国家支持开发利用数据提升公共服务的智能化水平。提供智能化公共服务,应当充分考虑老年人、残疾人的需求,避免对老年人、残疾人的日常生活造成障碍。163.公司在我国境内收集和产生的个人信息和重要数据应当在境内存储。A、正确B、错误答案:A解析:国家互联网信息办公室关于《个人信息和重要数据出境安全评估办法(征求意见稿):运营者在中华人民共和国境内运营中收集和产生的个人信息和重要数据,应当在境内存储。因业务需要,确需要向境外提供的,应当按照本办法进行安全评估。164.("x){P(x)àP(x)}消去蕴含符号得:($x){ØP(x)ÚP(x)}。A、正确B、错误答案:B165.专项核查的工作方案内容包括责任人及其成员单位,核查的数据范围,单位范围,核查时间及周期,对接人、注意事项等要素。A、正确B、错误答案:B166.国网互联网部和业务部门建立数据模型管理维护机制,信通公司承担数据模型的设计工作。A、正确B、错误答案:B167.ADS表存在主键,即可根据主键使用delete删除纪录。A、正确B、错误答案:B168.开展数字化规划是落实公司总体布局,实现电网与企业的数字化、智慧化发展的路径。A、正确B、错误答案:A169.公司重点应用创新示范集中在对外服务政府和对内服务公司电网业务数字化转型两个方面。A、正确B、错误答案:A170.人工神经网络可以用来处理冗余特征。A、正确B、错误答案:A171.进行数据抽样操作时,需要指定要进行抽样的时间以及要进行抽样的数据记录的条数限制。A、正确B、错误答案:A172.鲁宾逊归结原理中,设C1与C2是子句集S中的两个子句,C12是它们的归结式,若把C12加入S中,得到新子句集S2,则S与S2是等价的。A、正确B、错误答案:B173.2021年,公司科技互联网专业需制定并印发《国网湖南电力新兴业务职责建议方案》、《1+10新兴产业升级专项行动方案》,结合“转抓强”主题活动为总抓手,高位推动新兴产业升级攻坚工程落实见效。A、正确B、错误答案:A174.政府监管类主要包括需求受理、需求分析与初审、数据归口审核、签订合同(协议)、提供服务五个环节A、正确B、错误答案:B175.产生式系统的构成规则库,综合数据库两部分。A、正确B、错误答案:B176.2021年,科技互联网专业牵头编制公司十三五数字化规划、新兴产业规划,配合完善电网数字化规划,指导公司数字化转型升级和新兴产业升级,指导数字化项目储备与综合计划制定,按国网总部及时报送数字化规划。A、正确B、错误答案:B解析:十三五规划是2016年-2020年。题干2021年错误。177.公司各专业、各单位信息化基础不同、能力不一,对数字化转型的边界和目标认识有差异,导致对数字化转型的战略认知有区别。A、正确B、错误答案:A178.2021年,公司建立主数据管理规范,固化主数据管理流程,结合国网企业级主数据管理规范及要求,按照存储一份、服务统一的原则,推动统一数据模型在源头的落地应用。A、正确B、错误答案:A179.健全数据管理工作体系需梳理数据标准、数据质量、数据共享、数据需求、数据应用、数据安全等主要数据工作管理活动,细化各部门、各单位的职责分工界面,明确各层级、各岗位的管理内容和工作要求。A、正确B、错误答案:A180.Bayes法是一种在已知后验概率与类条件概率的情况下的模式分类方法,待分样本的分类结果取决于各类域中样本的全体。A、正确B、错误答案:B181.重构原数据超市,能够提升用户“读数、找数、用数”体验。A、正确B、错误答案:A182.Apriori算法是一个聚类算法。A、正确B、错误答案:B183.在0,1,„,9,这10个数字当中,一次任取两个,则抽到5这个数字的概率是0.1.A、正确B、错误答案:B184.应用研发能力属于数据中台能力架构能力。A、正确B、错误答案:B185.互联网部依照数据质量管理评价标准对公司进行考核。A、正确B、错误答案:A186.公司建成全球最大、央企领先的一体化集团级信息系统,建成北京、上海、深圳三地集中式数据中心。A、正确B、错误答案:B187.公司明确具有中国特色国际领先的能源互联网企业战略目标,提出“一业为主、两翼齐飞、全要素发力”发展布局,为公司数字化转型指明了方向、明确了目标。A、正确B、错误答案:B188.开展冬奧对旅游等关联行业协同发展分析,能够研判冬奥赛区及周边经济运行与人员流动状况,助力冬奥拉动区域及产业发展。A、正确B、错误答案:A189.到“十四五”末,人资管理方面,人资数据质量优化率达到95%,基本建成全业务覆盖的智慧人资管理服务体A、正确B、错误答案:A190.上下游企业及个人信息等第三方数据,不需获得授权即可开放共享A、正确B、错误答案:B191.梳理一线业务岗位的数据责任需按照“坚持数据同源、一源一责、源头维护、一源多用”的原则。A、正确B、错误答案:A192.CLIQUE是一种基于网格的聚类算法。A、正确B、错误答案:A193.K-means是一种基于密度的产生划分聚类的聚类算法。A、正确B、错误答案:B194.K-means是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。A、正确B、错误答案:B195.结合业务发展情况,以及各单位在模型应用中发现的问题,大数据中心组织开展模型优化完善和维护。A、正确B、错误答案:A196.湖南省电力有限公司计划2022年6月正式上线指标中心。A、正确B、错误答案:A197.人工智能的研究长期目标是使现有的电子计算机更聪明,更有用,使它不仅能做一般的数值计算及非数值信息的数据处理,而且能运用知识处理问题,能模拟人类的部分智能行为。A、正确B、错误答案:B198.分类与回归是同一概念的不同称呼。A、正确B、错误答案:B199.数据共享时,需坚持“一事一议”、层层审批的数据应用授权方式。A、正确B、错误答案:B200.维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提高数据安全保障能力。A、正确B、错误答案:A解析:《中华人民共和国数据安全法》第四条:维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提高数据安全保障能力。201.各单位对本单位数据共享工作负责,参照总部数据共享职责分工,明确数据共享职责界面,建立数据共享工作机制,落实公司数据共享工作要求,组织做好本单位数据共享工作。A、正确B、错误答案:A202.充分运用调控电力大数据,可以准确辨识大电网运行风险,防范极端天气或自然灾害造成的电网重大风险。A、正确B、错误答案:A203.数字化工作就是建设信息系统。A、正确B、错误答案:B204.各部门、各分部和公司各单位要按照“谁主管谁负责,谁运营谁负责,谁使用谁负责,管业务必须管安全”的总体原则,落实数据安全保护要求。A、正确B、错误答案:B205.Apriori算法是一个关联规则算法。A、正确B、错误答案:A206.开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规定不用及时告知用户并向有关主管部门报告。A、正确B、错误答案:B解析:《中华人民共和国数据安全法》第二十九条:开展数据处理活动应当加强风险监测,发现数据安全缺陷、漏洞等风险时,应当立即采取补救措施;发生数据安全事件时,应当立即采取处置措施,按照规定及时告知用户并向有关主管部门报告。207.贴源层存放着最细粒度的明细事实数据和维度数据。A、正确B、错误答案:B208.贝叶斯决策是根据后验概率进行决策的一种方法。A、正确B、错误答案:A209.神经网络对训练数据中的噪声不敏感。A、正确B、错误答案:A210.当簇具有非球形形状时,K-means很难检测到自然的簇。A、正确B、错误答案:A211.主数据是用来描述公司核心业务实体的数据,是各业务应用和各系统之间进行信息交互的基础。A、正确B、错误答案:A212.到“十四五”末,数据中台实现公司核心业务数据实时接入、调度数据秒级接入、与国网公司数据中台按天同步,业务指标线上生成率95%A、正确B、错误答案:A213.数据产品和服务提供方与使用方应签署相关使用协议,明确约束使用规则等双方权利义务。A、正确B、错误答案:A214.专项核查由发起人负责,发起人可以是业务部门、三大支撑机构、互联网部或者这些单位的联合体。A、正确B、错误答案:B215.框架是用于描述具有固定的静态对象的通用数据结构,但是也可以描述某些简单的动态对象。A、正确B、错误答案:B216.Kafka通过每个Producer分配唯一ID避免任务重复执行。A、正确B、错误答案:A217.公司内部共享数据时,应遵照数据共享负面清单开展。原则上所有数据均可在公司内部共享。A、正确B、错误答案:B218.《国网湖南省电力有限公司数据质量管理实施细则》自2021年3月20日起生效。A、正确B、错误答案:B219.电网数字化专项计划纳入公司综合计划统一管理。公司总部统一管理,各单位分级负责;综合计划管理部门与互联网职能管理部门分别履行各自职责,共同管理。A、正确B、错误答案:A220.当相关系数r=0时,说明现象之间完全无关.A、正确B、错误答案:B221.数字化转型需要“另起炉灶、从头再来”。A、正确B、错误答案:B222.回归是一种平滑处理的方法。A、正确B、错误答案:A223.提供数据产品服务的社会公益类流程包括需求受理、保密合规审核、签订合同(协议)、提供服务四个环节A、正确B、错误答案:B224.《国家电网有限公司数据管理办法》指出:坚持问题导向,以业务和应用为驱动,加强数据管理,满足生产需要、促进业务发展、创造业务价值。A、正确B、错误答案:B解析:坚持价值导向225.K-means在进行邻近性度量时的距离是欧几里得距离。A、正确B、错误答案:B226.INSERT写入分区表的指定分区时,需要改为INSERTINTOtablePARTITION(…)A、正确B、错误答案:B227.从Maxcompute导入数据到ADS的时候,导入路径格式为:.odps://project_name/table_name。A、正确B、错误答案:B228.电网生产数字化转型方面,实现电网数据与业务数据融通共享,电网全景“一览无遗”、智能业务“一键生成”、协同作业“一线贯通”,有力提升湖南公司能源保障及系统运行可靠性。A、正确B、错误答案:A229.构建电力市场服务体系。就是打造适应新型电力系统的市场机制,贯通绿电交易、可再生能源消纳责任权重、绿证与碳市场等数字化应用。A、正确B、错误答案:A230.反向推理是以已知事实作为出发点,按照一定的策略,运用知识库中的知识,推断出结论的过程A、正确B、错误答案:B231.电网数字化项目(成本性)需要开展结算、竣工决算和转资工作,电网数字化项目(资本性)需开展结算工作。A、正确B、错误答案:B232.“提效”的关键推进企业运营提质增效,建设高效率数字化运营企业,缩短业务流程环节,优化业务运营过程,由“人推动业务执行”向“数据推动业务执行”转变,助力公司融入数字经济发展、数字中国建设格局。A、正确B、错误答案:A233.海伯伦定理可以在计算机上实现其证明过程。A、正确B、错误答案:B234.经典命题逻辑和谓词逻辑的语义解释只有两个:真和假,0和1。A、正确B、错误答案:A填空题1.异常检测过程查找基于()组标准值偏差的异常个案。答案:聚类2.各单位要从责任、管理和技术上夯实基础,完善(),确保安全合规地使用、交互、共享数据。答案:数据安全风险防控体系3.CNN神经网络对图像特征提取带来了变革性的变化,使之前的人工特征提取升级到数据驱动的自动特征提取,在CNN中,起到特征提取作用的网络层是:(__)。答案:convolution层4.各单位应遵循“()”原则,优化数据安全防护架构,推进数据保护技术研究与应用,强化数据全生命周期的安全保护。答案:三同步5.在互联网大区存储企业重要数据时应()。答案:加密存储6.贝叶斯网络中的一个节点,如果它的父母节点已知,则该节点()于它的所有非后代节点。答案:条件独立7.装袋和()是两种处理训练数据集的组合方法。答案:提升8.通过互联网电子渠道交互数据时,应采取符合公司()的业务数据交互方式。答案:安全防护方案9.各单位应遵循()原则,优化数据安全防护架构,推进数据保护技术研究与应用。答案:三同步10.数据传输环节,在互联网大区()重要数据时应加密保护。答案:传输11.在Apriori-gen函数产生有效候选项集的过程中存在两个操作,一个是候选产生,还有一个是()。答案:候选剪枝12.在matplotlib子图绘制中,若执行plt.subplot(3,2,5),则当前的绘图子区域索引号是(____)。答案:513.RDS实例都支持日志管理,可以通过控制台查询实例的错误日志和慢日志明细,帮助故障()分析。答案:定位14.(__)是具有适应性的简单单元组成的广泛并行互联的网络。答案:神经网络15.由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为()。答案:箱线图16.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科叫()。答案:机器学习17.()算法是最广泛使用的聚类算法,算法简单,易于理解和操作。答案:K-means18.在()神经网络中,允许同一层节点项链或一层的节点连接到前面各层中的节点。答案:递归19.组合方法由训练数据构建一组(),后通过对每个该食物的预测来投票进行分类。答案:基分类器20.大数据服务(MaxCompute,原ODPS)中客户表customer是一张非分区表,现在想要清空表的内容然后重新上传数据,可以通过:()。答案:truncate21.元组变量t=("cat","dog","tiger","human"),t[::-1]的结果是答案:('human','tiger','dog','cat')22.有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是()。答案:x+2y=323.使用pip工具升级科学计算扩展库numpy的完整命令是(____)答案:pipinstall--upgradenumpy24.从复杂度及价值高低两个维度,可以将数据分析分为()。答案:描述性分析、诊断性分析、预测性分析、规范性分析25.一组数据有8个特征,计算出其8个特征值从大到小依次为3.755、2.197、1.215、0.402、0.213、0.138、0.065、0.015,若选择累计百分比达到80%以上的特征值对应的主成分,则至少应选择()个主成分。答案:326.分析服务目录产品推广模式分为()。答案:省公司推广、公司级推广27.()算法是决策树学习的基本算法,其他多数决策树学习方法都是它的变体。答案:ID3算法28.“数据不出中台,数据(____)基于中台”。答案:加工29.数据使用方对负面清单内的数据使用完毕后,应及时()相关数据。答案:销毁30.按照共享能力中心设计原则,包括()。答案:高内聚、完整性、强拆分31.一个MaxcomputeSQL中最多使用()个窗口函数。答案:532.AGNES是一种采用()策略的层次聚类算法。答案:自底向上33.(__)网络是一种竞争学习型的无监督神经网络,它能将高维输入数据映射到低维空间,同时保持输入数据在高维空间的拓扑结构,即将高维空间中相似的样本点映射到网络输出层中的临近神经元。答案:SOM网络34.在()神经网络中,允许同一层节点项链或一层的节点连接到前面各层中的节点。答案:递归35.使用运算符测试集合包含集合A是否为集合B的真子集的表达式可以写作(____)答案:A36.API相关命名规范包含()。答案:API分组、API名称、API描述37.贝叶斯网络中表示变量之间的依赖关系的是()。答案:有向无环图38.企业重要数据原则上应存储于()。答案:管理信息大区39.通过数据(),释放数据资源价值,发现新知识、创造新价值、提升新能力,赋能公司提质增效,支撑行业高质量发展,服务国家治理现代化。答案:分析挖掘能力40.()可以对用户的行为或相关事件进行实时监测和分析的产品:。答案:流计算41.已知c=np.arange(12).reshape(3,4),那么c.sum(axis=0)的结果是()答案:array[12,15,18,21]42.Maxcompute对SQLDML语句进行解析后,得到执行计划。构成执行计划的是由多个有相互依赖关系的()组成。答案:执行阶段(Stage)43.字典对象的(____)方法返回字典的“键”列表答案:keys44.资产评估应用实现全链路的数据资产监管和价值追踪,具体包括资产使用评估、()评估和敏感数据评估等功能。答案:资产价值45.SPARK默认的存储级别()。答案:MEMORY_ONLY46.数据传输环节,在()传输重要数据时应加密保护。答案:互联网大区47.列表中可以放()个字符串答案:无限个48.分析服务目录的定位是()。答案:实现服务产品可视、可查、可用、可迭代49.以习近平新时代中国特色社会主义思想为指导,全面贯彻习近平总书记关于网络强囯的重要思想和国家()战略、国家大数据发展战略,认真落实囯务院国资委加强合规管理、建设法治央企工作部署,紧扣“稳、进、育、幵”四字要求,秉持“引领规范、支撑推动”理念。答案:网络空间安全50.pandas中获取前n行数据是(____)。答案:head(n)51.HBaseReader通过HBase的Java客户端连接远程HBase服务,并通过Scan方式读取您指定的rowkey范围内的数据,将读取的数据使用数据集成自定义的数据类型拼装为()的数据集,并传递给下游Writer处理。答案:抽象52.()是一种处理输入特征的组合方法。答案:随机森林53.贝叶斯网络中表示变量之间的依赖关系的是()。答案:有向无环图54.数据中台中,贴源层的企业内部()更新是以"T+1"方式更新的。答案:结构化55.Scikit-Learn中()可以实现计算模型准确率。答案:accuracy_score56.数据接入方式主要有()。答案:全量数据接入、增量数据接入、E文件数据接入57.open函数中,参数'wb'的含义是()。答案:创建并二进制写入58.ONE-HOT-ENCODING可用于()处理答案:类别型特征59.在集市层进行数据计算时,对于需要多次迭代计算的数据,可使用的dataworks的数据分析计算工具主要是()。答案:PyODPS60.已知函数定义deffunc(**p):returnsum(p.values()),那么表达式func(x=1,y=2,z=3)的值为(____)答案:661.Python安装扩展库常用的是(____)工具答案:pip62.在Python中,下列代码的运行结果为()。a=[1,2,3,None,(),[],]print(len(a))答案:663.分析服务目录数据产品服务包含以下检索方式()。答案:产品类别、业务领域、专业部门、批示情况、标签检索64.Python标准库math中用来计算平方根的函数是(____)答案:sqrt65.在Python中,不论类的名字是什么,构造方法的名字都是(____)答案:__init__66.自然语言处理、语音识别、股票交易、气象预测等应用适合采用(__)处理。答案:循环神经网络67.Hadoop框架中两大核心是:()和()。答案:HDFS、MapReduce68.分析服务目录的批示情况按级别分为()。答案:国家级、省部级、地市级69.在Apriori-gen函数产生有效候选项集的过程中存在两个操作,一个是候选产生,还有一个是()。答案:候选剪枝70.假设有Python程序文件demo.py,代码如下:defmain():if__name__=='__main__':print(1)else:print(2)main()将该程序文件直接运行时输出结果为(____),作为模块导入时得到结果(____)。答案:1、271.()是一种处理输入特征的组合方法。答案:随机森林72.Python内置函数()可以返回列表、元组、字典、集合、字符串以及range对象中元素个数。答案:len()73.若训练过程的目标是预测连续值,此类学习任务称为()。答案:回归74.数据使用环节,应结合数据业务场景采用脱敏、水印、审计等技术手段实现()防护,遵循最小授权原则访问和处理个人信息和企业重要数据。答案:差异化75.聚类有多种划分方法,当它以能否合理的将一个点放入簇中来划分时,可以分为互斥的、重叠的以及()的。答案:模糊76.数据对外提供应遵守国家有关政策法规和公司管理规定要求,除国家机关依法调取数据外,原则上公司()不对外提供。答案:明细业务数据77.由于变量在使用之前不需要类型声明而且不允许隐式类型转换,因此python是一门()、()的语言答案:动态、强类型78.从数据到智慧的转换依次递进过程是()。答案:数据、信息、知识、理解、智慧79.偏倚-方差分解是分析预测模型的()的形式化方法。答案:预测误差80.为了提高Python代码运行速度和进行适当的保密,可以将Python程序文件编译为扩展名(____)的文件答案:pyc81.数据加工包括()、()、()。答案:数据清洗、数据变换、数据归约82.查看变量类型的Python内置函数是(____)答案:type83.事务型事实表也称为(),包含与业务过程描述有关的所有事实,数据来自于数据中台共享层数据,经清洗、转换、合并后得到。答案:原子事实表84.数据挖掘与知识发现的英文缩写是()。答案:KDD85.假设正则表达式模块re已导入,那么表达式re.sub('\d+','1','a12345bbbb67c890d0e')的值为(____)答案:a1bbbb1c1d1e86.常见的图像预处理方法包括()答案:图像降噪、图像增强、图像尺寸归一化87.例如源端是VARCHAR类型的数据写到INT类型的目标列中,导致因为转换不合理而无法写入的对于业务没有意义或者格式非法的数据称为()。答案:脏数据88.构造了一个词表:{1.小明2.喜欢3.踢4.看5.足球6.篮球7.电影},利用上述词表的索引号,文档{小明喜欢踢足球}可以用一个7维向量表示为()。答案:[1110100]89.每个季度第一天作为开始日期,resle()方法中的参数应该是(____)答案:QS90.()和假设检验又可归结为统计推断的范畴,即对总体的数量特征做出具有一定可靠程度的估计和判断.(答案:参数估计91.list(map(str,[1,2,3]))的执行结果为(____)答案:['1','2','3']92.线性回归算法寻找()与预测目标之间的线性关系。答案:属性93.select*fromstudent该代码中的*号,表示的正确含义是()。答案:所有的字段名94.HDFS是一个()文件系统,提供读取和写入HDFS双向通道的功能,可以通过脚本模式配置同步任务。答案:分布式95.ndarry是一个通用的(__)数据容器。答案:多维同类96.字典中多个元素之间使用(____)分隔开,每个元素的“键”与“值”之间使用(____)分隔开答案:逗号、冒号97.RDD具有()和()特征。答案:可容错性、并行数据结构解析:RDD,全称为ResilientDistributedDatasets,是一个容错的、并行的数据结构,可以让用户显式地将数据存储到磁盘和内存中,并能控制数据的分区。98.()的含义是最大化簇中文档与簇的质心的相似性。答案:凝聚度99.SG-CIM4.5模型和标准表是(____),主要用于两级数据贯通以及统推应用建设。答案:国网公司统一设计的模型体系100.向数据表添加数据,()是添加的关键字。答案:INSERT101.表达式'aaaassddf'.strip('af')的值为(____)答案:ssdd102.在datetime模块中,表示时间间隔的是()。答案:datetime.timedelta103.对外发布特定数据产品和服务,需按照国家、行业相关法律法规要求,获得相应的备案、()。答案:资质或牌照104.numpy中创建全0的矩阵使用()函数答案:zeros105.python序列类型包括sring、list、tuple三种;(____)是python中唯一的映射类型答案:字典106.高通滤波后的图像通常较暗,为改善这种情况,将高通滤波器的转移函数加上一常数量以便于引入一些低频分量。这样滤波器叫()。答案:高频提升滤波器107.()是利用样本的实际资料计算统计量的取值,并以引来检验事先对总体某些数量特征的假设是否可信作为决策取舍依据的一种统计分析方法答案:假设检验108.给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个样本的信息来进行预测。这种学习算法称为(__)。答案:k近邻学习109.()又称自助聚集,是一种根据均匀概率分布从数据集中重复抽样的技术。答案:装袋110.ADS的普通表的一级分区数量最多有()。答案:256个111.numpy中用于改变数组形状的函数为()。答案:np.reshape()解析:numpy.reshape函数用于改变数组的形状112.pandas中实现表格型数据集的对象是:(____)。答案:DataFrame113.所有预测模型在广义上都可称为一个或一组()。答案:规则114.通过聚集多个分类器的预测来提高分类准确率的技术称为()。答案:组合115.LSTM中,(__)的作用是确定哪些新的信息留在细胞状态中,并更新细胞状态。答案:输入门116.AGNES是一种采用()策略的层次聚类算法答案:自底向上117.scipy中模块stats的作用是()。答案:统计118.特征工程的目的是()。答案:得到最好的输入数据119.可以提供海量结构化数据的NoSQL存储服务和实时访问查询的是()。答案:OTS120.中国《中共中央关于制定国民经济和社会发展第十四个五年规划和2035远景目标纲要的建议》指出,要瞄准人工智能等前沿领域,实施一批具有前瞻性、战略性重大科技项目,推动()健康发展。答案:数字经济121.列表、元组、字符串是Python的(____)(有序?无序)序列答案:有序122.已知数组trans_cnt[1,2,3,4],trans_cnt[2]获取的结果为()。答案:3123.决策树的基本流程遵循()的策略。答案:分而治之124.OTS种以()方式来存储数据。答案:键值对125.数据接入方式主要有()种。答案:3126.在方差分析中,()反映的是样本数据与其组平均值的差异。答案:组内误差127.已知一个数据集,n为特征数,m为训练样本数,如果n较小,而且m大小中等(例如n在1-1000之间,而m在10-10000之间),则一般选择什么核函数的支持向量机()。答案:高斯核的支持向量机128.集市层数据加工只能直接引用明细层、()(英文缩写)的数据。答案:DWS129.Python由解释器、编译
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代纹样设计在商业品牌推广中的应用实践
- 现代办公环境下的AI餐厅服务应用研究
- 现代物流行业的服务创新与升级
- 现代办公环境下的报告制作技巧
- 2024年五年级语文上册 第六单元 口语交际:父母之爱说课稿 新人教版
- Module7 Unit2 This little girl can't walk(Period 1) (说课稿) -2024-2025学年外研版(三起)英语五年级上册
- 7《什么比猎豹的速度更快》说课稿-2024-2025学年五年级上册语文统编版001
- 13美丽的冬天 说课稿-2024-2025学年道德与法治一年级上册统编版
- 2024-2025学年高中化学 第1章 第4节 第2课时 有机物分子式与分子结构的确定说课稿 新人教版选修5
- 2024年五年级数学上册 二 多边形的面积第4课时 公顷和平方千米(2)说课稿 苏教版
- 福建省泉州市晋江市2024-2025学年七年级上学期期末生物学试题(含答案)
- 2025年春新人教版物理八年级下册课件 第十章 浮力 第4节 跨学科实践:制作微型密度计
- 货运车辆驾驶员服务标准化培训考核试卷
- 财务BP经营分析报告
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 国家行政机关公文格式课件
- 业务员回款考核办法
- 急性心梗的护理业务学习课件
- 2021年投标部工作计划
- 好书推荐《西游记》共33张幻灯片
- 2019年安徽省中考数学试卷及答案解析
评论
0/150
提交评论