ACP大数据工程师复习试题含答案

上传人：喝*** IP属地：广西上传时间：2025-02-28 格式：DOC 页数：65 大小：107.11KB 积分：25 举报 版权申诉

已阅读5页，还剩60页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第页ACP大数据工程师复习试题含答案1.tbl_p为一个ODPS的分区表，包含一个p1='1'的分区，现在想把该分区上的数据删除，达到使用select*fromtblwherepi='1'查询时，返回结果为空的目的。以下哪个SQL可以实现该功能？A、truncatetabletbl;B、altertabletbldroppartition(p1='1')；C、insertintotabletblselect*fromtblwhere1=2;D、deletefromtabletbl;【正确答案】：B解析：

MaxCompute不支持直接对表数据进行删除（DELETE）操作。您可以通过如下方法进行删除：通过删除（DROP语句）表，达到删除数据的目的。2.以下哪种对RDS的描述是正确的？A、一个实例可以创建多个数据库B、在实例内数据库命名可重复C、数据库不会共享该实例下的资源D、以上都不对【正确答案】：A解析：

RDS中数据库名称是唯一的，相同库名是无法创建的；RDS下数据库资源是可以共享的。3.Bob使用java开发了一个大数据计算服务的MapReduce，用来对海量交易数据做时序分析，结果该MR性能较差，某些map存在明显的长尾效应，__________方法可以有效的消除长尾效应。A、只关心处理的列，忽略其余的多余列B、合理使用combiner,适当的减少数据交互量C、通过set命令或者Jobconf修改MR参数，增大map/reduce的内存D、通过set命令或者Jobconf修改MR参数，影响分片的大小和个数【正确答案】：B解析：

无4.大数据计算服务中的日志表log是一张分区表，分区键是dt,每天产生一个分区用于存储当天新增的数据，现在共有dt='20160101'至dt='20160131'共31个分区的数据，为了删除20160101当天新增的数据，可以通过_____方式实现。A、deletefromlogwheredt='20160101'B、altertablelogdroppartition(dt=20160101')C、truncatetablewheredt='20160101'D、droppartitionlog(dt='20160101')【正确答案】：B解析：

删除分区表分区数据：使用drop关键字；删除非分区表数据：使用truncate关键字；不支持delete操作；5.作为技术人员,小王被ODPS的大数据处理能力吸引,想体验一下,他快速注册了阿里云账号,进入官网后试图创建一个名字为test.project的ODSPproject,结果没有成功,试分析,小王出错的最有可能的原因是()A、项目空间名称已存在B、账号未开通ODPS的使用权限C、账号未充值，余额不足导致出错D、未创建合适的accesslD和accessKey【正确答案】：A解析：

未开通服务是无法使用的;未充值也不影响创建项目；是否创建合适的accessid和创建项目空间没有直接关系。如果项目空间名称已存在，则不会创建成功。6.ADS的普通表的一级分区数量最多有多少个（）A、无限制B、128个C、256个D、1000个【正确答案】：C解析：

正确答案C。一般来讲，每个分区的数据不超过800万条为宜，当然也不绝对，分区数不能超过256个7.在大数据计算服务的数据仓库中的订单表fact_order，建表语句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的数据是从ods_order加工而来，ods_order建表语句如下：createtableods_order(order_idstring,order_amtbigint,order_dtstring)；ods_order中有一条记录数据值是order_idorder_amtorder_dt000110020160301。运行SQL语句将数据从ods_order加载到fact_order中：insertoverwritetablefact_orderpartition(dt='20160301')select*fromods_order;对此语句的执行结果描述正确的是___。A、提交SQL时会报语法错误B、语句可以执行，order_amt的值会被自动的转为double类型C、语句可以执行，但是这条数据会被当作脏数据丢弃D、目标表与源表中的数据类型不一致，执行出错【正确答案】：B解析：

隐式转换int会转换成double，语法不会报错，可以正常执行。int类型的值是可以转换double类型8.在ADS中,为了更高效的进行表关联，两个事实表进行Join的必要条件不包括以下哪些项？A、这两个表的joinkey至少有一列建立了主键B、这两个表在一个表组C、这两个表的joinkey是hash分区列D、两个表的Hash分区数必须一致【正确答案】：A解析：

为了更高效的进行表关联，分析型数据库对表关联操作在分析型数据库中，两个事实表进行Join的充要条件是：（1）这两个表在一个表组；（2）这两个表的JoinKey是Hash分区列；（3）两张表的Hash分区数必须一致，否则Join结果不准确；（4）两张表的JoinKey至少有一列建立了HashMap索引，推荐建立在数据量较小的一侧。9.大数据开发治理平台DataWorks中，周期性调度任务是指按配置的时间周期进行自动调度的任务，以下场景中，（）不适合配置成周期性调度任务。A、MaxCompute中基于商品库存表每隔一小时生成一张库存盘点的汇总表B、每隔5分钟对MaxCompute中的访问日志表进行一次数据清洗C、今天市场部经理临时要求分析师基于MaxCompute中的用户交易表生成一份昨天有成交记录的品牌列表D、把云数据库RDS中的用户登录记录表每天0点30分同步到MaxCompute表中【正确答案】：C解析：

根据题目临时要求，临时要求一般为一次性任务，很明显不需要周期调度。10.以下哪些应用场合适合RDS只读实例来完成（）A、扩大RDS的存储能力B、分担RDS主实例的写压力C、缓解RDS主实例的写压力D、实现两天前的数据回溯【正确答案】：B解析：

/yiqiu3812/article/details/10...11.2只读实例能分担RDS主实例的写压力11.有关DDoS攻击的描述，最准确的是？A、主要是攻击目标是数据库B、黑客自己够买了大量服务器，专门从事破坏活动C、攻击的目的是让服务超负载，然后窃取机密信息D、攻击的主要目的是让指定目标无法提供正常服务，甚至从互联网上消失，是目前最强大、最难防御的攻击之一【正确答案】：D解析：

无12.从ODPS导入数据到ADS的时候，导入路径的格式为？A、odps://project_nameltable_name:partition_specB、odps://project_nameltable_name/partition_specC、odps://project_nameltable_name(partition_spec)D、odps://project_nameltable_namepartition_spec【正确答案】：B解析：

无13.DataIDE的数据管理模块主要是对项目空间中的表的元数据、权限申请等进行管理操作，以下说法错误的是()A、可以通过数据管理模块查看项目空间中的表的生命周期B、可以通过数据管理模块查看项目空间中的表的结构C、可以通过数据管理模块申请项目空间中的表的查询权限D、可以通过数据管理模块查看项目空间中的表的数据.【正确答案】：D解析：

数据管理模块：全局预览，查找数据（此页面功能为搜索数据表），数据表管理，权限管理。可以查看表的基本信息（表名，项目名称，负责人，描述，权限），存储信息（物理存储量，生命周期，是否分区表，表的创建时间，ddl时间，数据最后变更时间），字段信息，分区信息，产出信息，变更历史，血缘信息，申请授权D、支持在数据管理模块预览数据，这道题有待考究14.Hadoop主要组成不包括以下哪个选项？A、MapReduceB、YARNC、HIVED、HDFS【正确答案】：C解析：

主要组成：MapReduce、YARN和HDFS15.大数据计算服务(MaxCompute，原ODPS)的开发人员在做数据探查时，想要从nginx日志表nginx_access_log中取10条记录，可以____通过实现。A、selectfromnginx_access_logwhererownumc=10B、selecttop10*fromnginx_access_logC、select"fromnginx_access_loglimit10;D、select"fromnginx_access_logorderby_rownum_limit10;【正确答案】：C解析：

取10条数据的方式：1、selectlimit10；前10条；2、Readtable_name10；随机10条；16.您希望通过管理控制台进行阿里云的专有网络VPC内的云服务器ECS实例的私网IP地址的修改，但发现操作的菜单不可用，是________原因引起的。A、该云服务器ECS实例所在的VPC类型是默认专有网络B、该云服务器ECS实例没有绑定IPC、没有针对该云服务器ECS实例进行停止操作，且该云服务器ECS实例不是停止状态D、该云服务器ECS实例不是运行状态【正确答案】：C解析：

修改私网IP需要保证ECS处于已停止的状态。17.数据工场DataWorks中，task1和task2都是按天调度的周期性调度任务，task1生成分区表table1,task2生成分区表table2，每天task2取table1最新分区的数据进行统计，而task1有部分数据来源是table2前一天分区的数据。task1和task2的依赖关系需要如何配置?A、只需要task1依赖属性的上游任务配置为task2B、task1和task2都不需要配置依赖属性C、task1跨周期依赖选择“等待自定义任务的上一周期结束，才能继续运行”，自定义任务填写task2，task2依赖属性的上游任务配置为task1D、只需要task2依赖属性的上游任务配置为task1【正确答案】：C解析：

调度周期配置按题意应该是task2依赖task1，task1依赖task2的前一天数据，要保证依赖关系正常执行，需要task1等待前一周期结束，然后task2才能正常执行。A、如果只设置task1依赖属性的上游任务配置为task2，那么task2无法取table1最新分区数据进行统计；B、不依赖是无法完成题目中复杂的逻辑运算的；D、只设置task2依赖属性的上游任务配置为task1，那么无法实现task1部分数据取字table2的前一天分区。18.OTS中可以使用拼接的分片键，拼接就是把几个属性拼接成一个属性。拼接是为了解决什么问题（）A、解决数据生命周期的问题B、解决写压力过于集中的问题C、解决单个分片键下数据量过大的问题D、解决OTS预留读写量不足的问题【正确答案】：C解析：

正确答案CTableStore建议单个分片下的数据量大小不超过1GB,如果您的表中单个分片键的所有行的总数据量大小可能超过1GB,在设计表时可以将原来的多个主键列拼接成分片键。19.关于Maxcompute,说法不正确的是（）A、在很多方面并不具备数据库的特征B、适用于海量数据，实时性要求不高的场合C、每个作业的准备，提交等阶段要花费较长时间D、大部分标准SQL的功能都支持，但是不支持窗口函数、rownum等【正确答案】：D解析：

Maxcompute不支持事务，索引等数据库特征，批量离线处理，对实时性不高；不能处理实时性特别高的事务，响应时间长，需要花费时间长。是支持窗口函数的。20.数据工场DataWorks(原DatalDE)中的调度任务可以通过配置依赖属性来控制任务运行的先后顺序，下列说法不正确的是（）。A、同一个组织的不同数据工场DataWorks(原DatalDE)项目空间中的调度任务不能配置成上下游依赖的关系B、多个调度任务可以配置成依赖同一个上游任务C、同一个项目空间中的节点任务和工作流任务可以配置成上下游依赖的关系D、一个调度任务可以配置多个上游依赖任务【正确答案】：A解析：

官网文档中：数据开发-调度配置-依赖关系中说明，DataWorks目前支持同区域下的跨项目依赖21.ODPS的命令行工具odpscmd可以使用以下哪个参数调用某个文件中的命令集？A、kB、eC、fD、C【正确答案】：C解析：

odpscmd-fxxx.sql22.在服务器上手动安装云盾客户端安骑士时需要什么权限？A、系统管理员权限B、FTP服务权限C、数据库权限D、系统普通用户权限【正确答案】：A解析：

登录阿里云帐号,进入服务器安全(安骑士)控制台-安装Agent页面,根据页面提示获取最新版本下载地址,以管理员权限在服务器上运行并安装,点击进入安装页面。23.在MaxCompute中，根据业务需要有时需要优化SQL语句，下列关于SQL语句优化方法的说法中，正确的是（）。A、在多个去重逾矩的场景中，可能发生数据膨胀，建议多使用groupby而不是distinctB、将groupby语句拆成两部分会降低SQL执行效率C、在进行Mapper优化时，当input的文件都很大，任务逻辑复杂，map执行非常慢的时候，可以考虑减少Map数D、分区裁剪过滤分区列，可以避免SQL执行时完整表扫描，通过logview检查分区裁剪是否有效【正确答案】：A解析：

当input的文件都很大，任务逻辑复杂，map执行非常慢的时候，可以考虑增加Map数，来使得每个map处理的数据量减少，从而提高任务的执行效率。groupby：数据量大时比distinct效率更高,且使用场景更大。24.ADS创建普通表时，关于updateType属性那种说法是错误的？A、合法的取值为realtime或者batch，该值不显式指定时，默认取batchB、该值为realtime时，对应的表必须指定合法的主键并且必须指定二级分区C、通过该属性指定数据的更新方式D、该值为batch时，如果要支持增量导入，必须指定二级分区【正确答案】：B解析：

根据表的数据更新方式不同，分析型数据库的表根据updateType分为批量更新表（仅能够离线批量更新数据)和实时更新表（能够通过insert/delete实时更新数据)，用updateType以区分，如果updateType选项不填则默认为批皇更新表。需要注意的是,updateType=realtime暨为实时更新表时，必须指定合法的主键并且不能有二级分区。25.以下不属于基于Dataworks的数据仓库建设的优势？A、全托管B、高性能C、免运维D、高成本【正确答案】：D解析：

高性能、低成本、免运维、全托管/document_detail/73016.html?spm=a2c4g.143996.0.i1026.关于ADS的ECU，说法正确的是？A、可以动态的扩容或者缩容，两者都是瞬间的同步操作B、通过参数设置，可以使同一个ADS的库同时使用两种类型的ECUC、可以通过查询表information_schema.resource_request获得目前的ECU的状态D、可以通过DDL语句alterdatabasesetecu_count=N来修改ECU的个数【正确答案】：D解析：

A、动态扩容或缩容不能瞬间完成；B、两种类型ECU需要根据业务需求指定一种使用：（1）高性能：以字母C或者H开头的ECU为高性能实例，数据全部存储在SSD磁盘中。适用于对性能要求高、查询并发高的业务场景。（2）大存储：以字母S开头的ECU为大存储实例，采用SSD/HDD分层存储架构，热点数据存储在SSD磁盘中，冷数据存储在HDD磁盘中。适用于并发稍低、性能要求不高（可接受数据查询响应时间受超过10秒以上）的业务场景。CD、如果当前ECU配置无法满足需求，您可以变更ECU配置。注意：当遇到特殊情况需要手动扩缩容时，请登录ads_ag容器，执行以下命令即可，[$ECU_Type]为ECU的类型，[$ECU_Count]为ECU的数量。27.关于ADS的权限模型，下列哪些描述是正确的（）A、每个权限级别能聚合其下面级别的所有权限B、导出数据时需要DUMPDATA、DESCRIBE和SELECT权限，同时需要数据导出目的地的数据写入相关权限C、查询表数据需要SELECT权限，最小级别是表D、ADS的授权模型和Mysql非常相似，比如ADS支持针对用户在host上授权【正确答案】：A解析：

正确答案A。A、聚合:Database–>Table[Group)]-->Column，即每个权限级别能聚合其下面级别的所有权限。B、导出数据同时需要DUMPDATA和SELECT权限,同时需要数据导出目的地的数据写入相关权限,并非所有查询都需要该权限，例如SELECTnow()C、最小查询级别是列级；D、任何分析型数据库支持的账号类型均可视为一个用户。和Mysql略有不同的是，分析型数据库目前不支持针对用户在host上授权。28.在进行数据分析之前，需要对数据进行处理，以下属于数据处理操作的是（）A、构建数据分析模型，进行预测分析，评估模型B、确定数据范围，获取目标数据，并整合相关数据C、整理组合信息，通过图表展现信息D、处理缺失数据，清洗不一致数据【正确答案】：D解析：

缺失值处理、异常值处理、重复值处理等数据清洗操作属于数据处理，所以选择D。29.大数据计算服务(MaxCompute，原ODPS)的MapReduce在正式执行Map前，需要将输入数据进行"片"(split)。关于分片的说法中错误的是A、分片会对输入文件进行实际的物理切分，即分片数据会被存成多个大小相同的物理文件B、一个输入分片就是能够被单个map操作处理的输入块C、每一个map操作只处理一个输入分片D、可以通过参数控制分片的大小【正确答案】：A解析：

map的分片是逻辑上的分片，只是一种标记，不会是物理上的分片MapReduce是处理数据的一种编程模型，通常用于大规模数据集的并行运算。您可以使用MapReduce提供的接口（JavaAPI）编写MapReduce程序，来处理MaxCompute中的数据。编程思想是将数据的处理方式分为Map（映射）和Reduce（规约）。在正式执行Map前，需要将输入的数据进行分片。所谓分片，就是将输入数据切分为大小相等的数据块，每一块作为单个MapWorker的输入被处理，以便于多个MapWorker同时工作。每个MapWorker在读入各自的数据后，进行计算处理，最终通过Reduce函数整合中间结果，从而得到最终计算结果。30.DRDS的产品定位不包括以下哪项？A、基于RDS的分布式数据存储和检索产品B、海量数据的多维分析C、降低用户使用分布式数据库的难度D、解决用户单RDS无法支撑业务的困难【正确答案】：B解析：

海量数据多维分析适合使用大数据计算服务完成。31.大数据计算服务(MaxCompute，原ODPS)tunnel命令提供了丰富的参数，可以通过参数设置，对上传或者下载操作进行控制，现在有一个大文件要上传至odps某表中，想先检查一下该文件内容是否和表的定义匹配，并不实际上传，以免文件中有错误记录会导致上传出错。可以使用哪个参数实现这个功能？A、错误记录丢弃:-dbrB、字段分隔符:-fdC、扫瞄选项:-SD、空字符串显示:-ni【正确答案】：C解析：

无32.阿里云QuickBI报表工具支持多种数据源，方便用户基于自己来自不同数据源的数据进行分析和展现。目前还不支持作为数据源。A、OSSB、MaxComputeC、AnalytieDBD、RDSMySQL【正确答案】：A解析：

支持如下数据源：目前自助取数功能可以支持的数据库类型有限，只支持MySQL、MaxCompute、Oracle、AnalyticDBforMySQL3.0、Clickhouse、Impala等六种类型的数据库。如果您有导出近百万条数据的需求，只能将数据存储于这几类数据库中，然后通过这几种数据库建数据集，再制作交叉表，供导出场景使用。33.某在线广告APP采用了阿里云的技术，通过对网上搜集的海量数据的分析，给企业主提供精准的广告投放人群。该app的产品经理介绍该系统能实现以下技术指标:1-能存储海量数据，单表大小超过10TB2-支持多张上亿的表进行Join3-支持多种筛选条件，包括连续范围筛选、取值筛选、and/or/not条件组合等4-支持快速(3秒以内)对数十个维度分别进行透视分析根据以上信息，请判断该app最有可能使用的是阿里云的哪一款产品?A、分布式关系型数据库（DRDS）B、表格存储（TableStore，原OTS）C、分析型数据库（AnalyticDB，原ADS）D、大数据计算服务（MaxCompute，原ODPS）【正确答案】：C解析：

分析型数据库支持sql规范规则并响应速度快。所以最合适。需要区别不同数据库的性能差异；分布式关系型数据库，主要基于RDS的分布式数据存储和检索产品，快速响应不及分析性数据库；表格存储NoSQL,海量结构化数据存储和实时访问，弹性资源预留，实时监控显示。

大数据计算服务主要是海量数据存储计算。34.在数据工场DataWorks中使用数据同步任务进行数据同步时，数据同步任务读源头表需要权限，写目标表也需要权限，如数据同步任务日志提示：ODPS-0420095：AccessDenied-AuthorizationFailed［4019］，YouhaveNOprivilege'odps:Describe'on{acs:odps:*:projects/xxx_prj/tables/xxx_table}.ContextD:2ac7aac3-0928-45d2-98c0-4085fbc6ba88.］通过该提示日志，可以得到信息。A、从该日志可以看出该任务是写表xxx＿prj／tables.xxx＿tableB、从该日志可以看出具体哪个云账号没有权限C、从该日志可以看出该任务是读表xxx＿prj／tables.xxx＿tableD、从该日志提示可以看出是对MaxCompute（原ODPS）表xxx＿prj／tables.xxx＿table没有describe权限【正确答案】：A解析：

无35.某Bl系统构建在大数据计算服务MaxCompute上，某数据分析员在分析订单的地域分布时，需要把订单表order(占用存储空间约10G)与地域维表region(占用存储空间100M)关联起来，两张表的结构如下:createtableorder(order_idstring,region_idstring,orderamtbigint);createtableregion(region_idstring,region_namestring)在运行时发现由于订单大量集中在上海地区，数据的倾斜导致整体运行时间较长，运行的SQL语句如下:selectregion_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;此时可以考虑通过优化SQL的运行效率。A、使用mapjoinhint:select/*+mapjoin(t2)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;B、使用mapjoinhint:select/*+mapjoin(t1)*/region_name,sum(order_amt)amtfromordert1joinregiont2ont1.region_id=t2.region_id;C、调整两张表的位置:selectregion_name,sum(order_amt)amtfromregiont1joint2ont1.region_id=t2.region_id;D、减小SQL的splitsize，增加计算资源【正确答案】：A解析：

使用Mapjoin小表放内存里可以提高运行速率Mapjoin应该把小表放内存，把大表放内存不符合调换位置不影响计算速度数据倾斜问题时减少splitsize不能解决的36.使用大数据计算服务tunnel命令上传log.txt文件到表t_log中去，t_log为分区表，分区列为(p1string,p2string)。下列命令中正确的是?A、tunneluploadlog.txtt_log/p1="b1"/p2="b2"B、tunneluploadlog.txtt_log/(p1="b1",p2="b2")C、tunneluploadlog.txtt_log/p1="b1",p2="b2"D、tunneluploadlog.txtt_log(p1="b1",p2="b2")【正确答案】：C解析：

upload：上传数据到MaxCompute的表中。支持文件或目录（指一级目录）的上传，每一次上传只支持数据上传到一张表或表的一个分区。分区表一定要指定上传的分区，多级分区一定要指定到末级分区。37.数据工场DataWorks(原DataIDE)中，按天调度的周期性任务task1的定时调度时间设置为2点0分；按天调度的周期性任务task2的定时调度时间设置为0点0分，task1依赖属性的**任务设置为task2，关于task1以下说法正确的是？A、每天0点0分开始执行B、每天2点0分一定开始执行C、每天只要task2当前周期执行状态为成功，则task1马上开始执行D、每天2点0分后task2当前周期执行状态为成功，则task1可以开始执行【正确答案】：D解析：

无38.大数据计算服务(MaxCompute,原ODPS)的MapReduce编程框架中，Reduce是把Map的输出结果进行“规约”（有时称作“化简”），得到最终结果的过程，关于Reduce过程，以下说法正确的是_________。A、Map后必须有至少一次的Reduce,对于扩展MR,Map后可以支持连续多次的ReduceB、对于MapReduce来讲，可以没有Map过程，但是Reduce是必须的C、Reduce的个数和Map的个数一定相同，由分片的个数决定D、在某些特殊情况下，可以没有Reduce过程【正确答案】：D解析：

Reduce是接收Map的输出结果进行后续的“化简”，所以Reduce可以没有，特殊情况下只需要Map输出就可以实现需求，排除选项A和B，且reduce个数可以进行人工设置，排除C。39.大数据计算服务中的fact_order表的生命周期属性设置成了30天，开发人员通过以下命令创建了一张新的fact_lottery_order表:createtablefact_lottery_orderlikefact_order;对于新表的描述正确的是____A、fact_lottery_order的生命周期属性是无穷大B、fact_lottery_order的生命周期属性不会被设置C、fact_lottery_order的生命周期属性是30D、fact_lottery_order的生命周期属性是0【正确答案】：A解析：

like复制表fact_order结构，但是并不会复制生命周期，所以fact_lottery_order表的生命周期为默认，而默认周期是永久的。40.资源（(Resource)是大数据计算服务(MaxCompute，原ODPS)的特有概念。用户如果想使用MaxCompute的MapReduce或自定义函数(UDF)功能，需要依赖资源来完成。DataIDE中，可以通过数据开发面板的资源管理上传资源,目前支持的资源类型有()。A、jar、file、archiveB、jar、file、pythonC、jar、archive、pythonD、file、archive、python【正确答案】：A解析：

无41.以下哪个不属于Maxcompute的访问策略的访问控制元素（）A、效果B、操作C、权限D、主体【正确答案】：C解析：

每次权限管理操作均是对效果（授权、撤销）、对象（如表、资源等）、主体（用户或是角色）、操作（读、写、删除等）的组合描述

/document_detail/104028.html?spm=a2c4g.27935.0.i042.大数据计算服务(MaxCompute,原ODPS)的开发人员在建模时需要使用内置函数floor对某表的value字段进行取整，在数据表中有两条记录，value字段的值是1.2和-3.3，则结果数据是A、1和-3B、2和-3C、1和-4D、2和-4【正确答案】：C解析：

正确答案C。内置函数考察floor是表示取下，1.2的下值为1，-3.3的下值为-443.下列对于ADS中表和表组的描述正确的是（）A、维度表在创建时不需要指定表组，但是需要配置分区信息B、维度表可以和除维度表组外的任意表组中的表关联C、批量插入的表如果只有一级分区，每次导入数据是会覆盖掉已有数据D、维度表组有且只有一个，用户可以修改表组属性，但是不能删除【正确答案】：C解析：

维度表可以和任意表组的任意表进行关联，并且创建时不需要配置分区信息，但是对单表数据量大小有所限制，并且需要消耗更多的存储资源。

维度表组有且仅有一个，并且在分析型数据库数据库建立时会自动创建，用户不可修改和删除44.您希望通过华北2（北京）地域的阿里云专有网络VPC中的云服务器ECS实例通过内网访问OSS，但是连接（华北2（北京）地域的通用内网地址）失败，可以通过________解决。A、只能通过外网地址进行访问B、其他方式都不能解决C、换其他地域的内网地址进行访问，如华北1（青岛）地域的通用内网地址（）D、通过VPC专用的OSS内网地址进行访问，【正确答案】：D解析：

在VPC的环境中ECS连接这个地址不通。这个是因为OSS针对VPC是有一套自己的内网地址，所以需要用北京：45.大数据计算服务(MaxCompute，原ODPS)的开发人员需要创建一个自定义函数用以评估客户的经营情况，输入参数的两个字段类型是double，则在开发JavaUDF函数时，这两个字段对应的输入参数类型应该是A、基础类型doubleBigDecimal类型C、String类型Double类型【正确答案】：D解析：

正确答案D。ODPS和Java的数据类型基本相似，在ODPS中的类型都是封装类型。ODPS中DOUBLE数据类型是对应java.lang.Double46.数据工场DataWorks(原DatalDE)中工作流任务支持一次性调度和周期调度两种类型，对于周期性调度可以设置不同时间粒度的调度周期，最小的调度周期为（）A、5分钟B、1分钟C、10分钟D、30分钟【正确答案】：A解析：

正确答案A目前分钟仅支持最小5分钟的粒度，时间表达式根据上面选择的时间生成，不能手动修改。47.AlphaGO.自动驾驶等场景实现都使用了比较复杂的机器学习算法，这些算法的特点是:一个系统和外界环境不断地交互，获得外界反馈，然后决定自身的行为，达到长期目标的最优化。对这类算法的归类中，最恰当的一个是.A、增强学习(reinforcementlearning)B、无监督学习(umsypervisedlearning)C、集成学习(ensemblelearning)D、经典学习(cassiolearning)【正确答案】：A解析：

是一种自反馈，自激励性学习，属于强化学习48.以下acl授权里，哪种是对ODPS的表赋予select权限？A、grantselectontabletable_nametouserB、grantdesconprojectproject_nametouserC、grantreadonprojectproject_nametouserD、grantreadontabletable_nametouser【正确答案】：A解析：

无49.如果在非阿里云的服务器安装了安骑士，如何在管理控制台查看报告？A、在安装安骑士的过程中需要输入“安装验证key"，通过此key关联用户的管理控制台B、通过阿里云官网账号关联C、报告无法体验在阿里云的管理控制台D、非阿里云服务器不支持安骑士【正确答案】：A解析：

对于非阿里云服务器,在安装过程中会提示输入验证Key,这个验证Key用于关联阿里云账号,通过阿里云账号在安骑士控制台使用相关功能,验证key会显示在安装页面中。50.阿里云数据湖构建（DataLakeFormation，简称DLF）是一款全托管的快速帮助用户构建云上数据湖及Lakehouse的服务，可无缝对接多种计算引擎，其元数据管理是核心功能之一，下列描述，哪些不属于元数据管理的功能？A、元数据抽取B、元数据产生C、元数据备份D、元数据管理【正确答案】：C解析：

/document_detail/183492.html?spm=a2c4g.1962a943bbfVaNV5S元数据备份不属于元数据管理的功能。51.某企业的数据仓库运行在大数据计算服务上,开发人员在加工数据时发现用户表user中的用户标识字段user_id有部分脏数据，正确的格式应该是8位的字符串。可以使用SQL语句_________将脏数据过滤出来。A、select*fromuserwherelength(userid)8B、select*fromuserwherelength(userid)>8C、select*fromuserwherelength(userid)D、select*fromuserwherelength(userid)8oruseridisnull【正确答案】：D解析：

表示不等于，只有d中可以把长度不等于8的，值为null的过滤出来A、只过滤了不等于8的，没过滤掉null的B、只过滤了大于8的，逻辑不正确C、之过滤了小于8的，逻辑不正确52.ODPS中，哪个命令可查看角色role_test的权限（）A、listrolerole_testB、showgrantsforrolerole_testC、descrolerole_testD、showaclforrolerole_test【正确答案】：C解析：

查看角色中的权限：describerole;A、listroles查询role角色B、Showgrantsforuserusername;不适合roleD、语法不对53.Hologress是阿里巴巴自主研发的一站式实时数仓引擎（Real-TimeDataWarehouse），关于Hologress，错误的描述是（）？A、支持海量数据实时写入、实时更新、实时分析，支持标准SQL，兼容Postgre大部分函数，兼容MySQL全部函数B、支持高并发低延迟的在线数据服务（Serving）C、支持PB级数据多维分析（OLAP）与即席分析（AdHoc）D、与MaxCompute、Flink、DataWorks深度融合，提供企业级离在线一体化全栈数仓解决方案。【正确答案】：A解析：

Hologres是阿里巴巴自主研发的一站式实时数仓引擎（Real-TimeDataWarehouse），支持海量数据实时写入、实时更新、实时加工、实时分析，支持标准SQL（兼容PostgreSQL协议和语法，支持大部分PostgreSQL函数），支持PB级数据多维分析（OLAP）与即席分析（AdHoc），支持高并发低延迟的在线数据服务（Serving），支持多种负载的细粒度隔离与企业级安全能力，与MaxCompute、Flink、DataWorks深度融合，提供企业级离在线一体化全栈数仓解决方案。/document_detail/113648.html?spm=a2c4g.183492.0.i654.在DataIDE中配置数据同步任务时，将云数据库RDS(Mysql)中的数据同步至大数据计算服务(MaxCompute，原ODPS)分区表对应的日期分区中，采用数据同步任务周期性的调度向不同分区中写入数据，把yyyymmdd的数据写入对应的yyyy-mm-dd分区中，如20160308的数据需要写入MaxCompute表的"2016-03-08分区中，MaxCompute的分区可以通过()实现。A、在MaxCompute侧中使用系统内置参数$bizdateB、在MaxCompute侧中使用变量${datetime},并在节点参数出赋值datetime=${YYYY/MM/DD}C、在MaxCompute侧的分区中写入常量值2016-03-18即可D、在MaxCompute侧中使用变量${datatime},并在节点参数出赋值datetime=${YYYY-MM-DD}【正确答案】：D解析：

datetime=${YYYY-MM-DD}符合要求格式55.下面关于冷热数据的说法，错误的是()A、在同一张表可以对不同的分片设置不同的预留读写吞吐量，对于冷数据所在的片，设置较低的预留读写吞吐量B、可以用不同的表来区分冷热数据，并设置不同的预留读写吞吐量C、表中存在大量冷数据会导致数据访问压力不均匀，从而导致表上配置的预留读写吞吐量无法被充分利用D、对冷数据对应的表，可以设置较小的预留读写吞吐量【正确答案】：A解析：

无56.某视频直播公司采用阿里云弹性伸缩（AutoScaling）来实现动态添加或者减少云服务器ECS实例，以应对业务量的变化。由于该公司的系统刚上线不久，没有历史数据做参考，同时也不能预估业务量的变化，他们希望通过ECS实例资源的使用情况（比如CPU利用率、系统负载Load等）来弹性伸缩计算资源。他们应该选择以下哪种伸缩模式？A、动态模式B、定时模式C、固定数量模式D、lazy模式【正确答案】：A解析：

用户没有历史数据作为参考，故使用动态模式配置弹性伸缩服务更为灵活。57.DataIDE的数据同步任务Task1，将数据从大数据计算服务(MaxCompute，原ODPS)同步到云数据库RDS(MySQL)中，数据表中存在数据质量问题，加载的时候会有部分出错记录，Task1中已经配置了容错记录条数，为了保证正确记录能够保留，在数据加载与控制中，还需要对Task1配置A、数据过滤条件B、视为脏数据，保留原有数据(insertinto)C、作业速率上限D、源表切分主键.【正确答案】：B解析：

A、数据过滤是完成数据筛选以及增量上传；C、作业速率上限只同步速率，不涉及容错；D、切分键是为了增加同步线程，增加同步速率。58.某企业需要一个能够从身份证号中分析得出所属省份的自定义函数，哪种自定义函数适用于这种场景？A、UserDefinedSplittedFunction(用户自定义分组函数)B、UserDefinedScalarFunction(用户自定义标量函数)C、UserDefinedTableValuedFunction(用户自定义表值函数)D、UserDefinedAggregationFunction(用户自定义聚组函数)【正确答案】：B解析：

无59.同步任务有一二级调度的概念，真正抽取数据的机器是哪级调度的机器?如何查看某个同步任务的真正抽取数据的机器是哪台?A、同步任务有一二级调度的概念，真正抽取数据的机器是哪级调度的机器?如何查看某个同步任务的真正抽取数据的机器是哪台?B、一级;任务日志中搜索onnode关键字得到的第二条结果C、二级;任务日志中搜索onnode关键字得到的第二条结果D、一级;任务日志中搜索onnode关键字得到的第一条结果【正确答案】：C解析：

针对数据同步任务，DataWorks的调度资源分为一级调度资源和二级运行资源。一级调度资源：可以进入运维中心>周期任务运维>周期实例页面，右键单击相应节点，选择查看更多详情，即可查看该节点的属性。二级运行资源：可以进入数据集成>同步资源管理>资源组页面，新增和查看二级任务运行资源。同步任务的真正抽取数据的机器是哪台是通过二级运行资源onnode关键字得到的第二条结果。60.数据质量模块中配置监控规则时，需要先进行分区表达式配置，对于非分区表的分区规则应选择（）？A、NULLB、NOTC、NOTAPARTITIONTABLED、$yyyymmdd【正确答案】：C解析：

数据质量通过分区表达式来确定需要配置的规则：如果您的检查对象为非分区表，可以配置分区表达式为NOTAPARTITIONTABLE。如果您的检查对象为分区表，可以配置为业务日期的表达式（例如$[yyyymmdd]）。/document_detail/73690.html?spm=a2c4g.468043.0.i1461.用户A是公司的系统管理员，经常去上海出差，每当他在上海远程登录服务器时系统就会发出报警信息，提示“有人异地登录，请注意服务器安全”，有什么方法可以快速、自动解决这个问题？A、登录阿里云管理控制台，在安骑士配置项里添加“常用登录地点”B、向我的朋友电话求助，他是业界有名的黑客高手C、向公司领导请求帮助D、立即提交工单，咨询阿里云工程师【正确答案】：A解析：

无62.大数据计算服务(MaxCompute,原ODPS)中的订单表fact_order是一张分区表，有order_id及order_amt两个字段，分区键是dt,每天新增的订单存储在当天的分区中，对应的源表是ods_order,源表中可能包括多天的订单，需要按照订单生成的日期(order_dt)将数据保存到fact_order表中，执行以下SQL语句:insertoverwritetablefact_orderspartition(dt)selectorder_id,order_amt,order_dtasdtfromods_order;在语句执行之前fact_order表中有dt='20160301'及dt='20160302'两个分区，在这个语句执行时ods_order表是空的，没有任何记录。对这个语句的执行结果，以下说法正确的是A、执行完以后fact_order表会被清空，所有的分区都会被删除B、执行完以后fact_order表中有三个分区，包括dt='20160301',dt="20160302'及dt="C、执行完以后fact_order中仍然有dt=*20160301"及dt='20160302'两个分区，但是数据会被清空D、执行完以后fact_order中的数据未受影响，仍然是dt='20160301'及dt='20160302'两个分区【正确答案】：D解析：

A、该语句是使用动态分区的方式插入数据，即会根据查询的最后一个字段确认分区值，因ods_order表是空的，而分区表操作相当于针对对应文件目录操作，所以并不会影响其他分区数据，其他分区无变化；

B、同A，同时dt="是语法不支持的，不支持空作为分区

C、同A，数据不受影响

D、正确63.大数据计算服务提供了大数据的存储和计算服务，非常适合应用于大数据分析的领域。以下说法中错误的是哪一项?A、可以实现大型互联网企业的数据仓库和BI分析B、提供了便捷的分析处理海量数据的手段，用户可以不必关心分布式计算细节，从而达到分析大数据的目的C、可以支持实时OLAP分析D、可以基于历史数据，进行用户特征和兴趣挖掘【正确答案】：C解析：

大数据计算服务属于批量、离线处理。OLAP对实时性要求较高，一般不适合使用。64.云盾DDoS基础防护功能如何开启？A、提交工单，24小时之内开通B、自动开通C、联系客户经理线下开通D、需要从管理控制台申请开通【正确答案】：B解析：

无65.大数据计算服务(MaxCompute，原ODPS）的开发人员需要创建一张用户消费习惯表，其中一个字段想要命名为like，则以下说法正确的是A、可以将字段命名为like，无需特殊处理B、可以将字段名命名为like，在创建表及引用该字段时，需要用括起来，即表示为'like'C、在创建表时无需特殊处理，但是在引用该字段时需要表示为'like’(注:没有测试成功)D、无法将字段命名为like，因为这是关键字【正确答案】：D解析：

无66.DataIDE的数据同步任务Task1，将数据从大数据计算服务(MaxCompute，原ODPS)同步到云数据库RDS(MySQL)中，源数据表中存在数据质量问题，加载的时候会有部分出错记录，Task1中已经配置了容错记录条数，为了保证正确记录能够保留，在数据加载与控制中，还需要对Task1配置()A、数据过滤条件B、视为脏数据，保留原有数据（insertinto）C、作业速率上限D、源表切分主键【正确答案】：B解析：

无67.对于OTS表的主键描述正确的是哪一个（）A、由四个属性组成B、建表的时候可以暂时不指定，之后用altertable修改C、组成主键的属性只能是string或者integerD、主键本身就是表的分片键【正确答案】：D解析：

表格存储（TableStore）是构建在阿里云飞天分布式系统之上的NoSQL数据存储服务。TableStore支持1~4个主键，主键类型为STRING、INTEGER和BINARY，其中第一个主键为分区键。主键属性一般有2个，分别是名称和类型；建表必须指定名称；主键类型有三种：STRING、INTEGER和BINARY；数据分区的划分粒度为主键的第一列，该列即为数据分区键。“主键本身就是分区键”没问题68.在实际应用中，哪种性能指标表示RDS实例磁盘空间的使用量？A、磁盘空间B、CPU利用率C、IOPSD、连接数【正确答案】：A解析：

无69.阿里云机器学习的标准化组件可以对数值型的字段进行标准化处理，以字段x为例，其标准化的计算为______。A、x字段整列的最大值减掉该列的最小值得到一个差，然后每一行的x值除以这个差:x/[max(x)-min(x)]B、每一行的x值除以该列最大的x值:x/max(x)C、每一行的x值减掉x字段整列的平均值，然后除以x字段整列的平均值:[xmean(x)]/mean(x)D、每一行的x值减掉x字段整列的平均值，然后除以x字段整列的标准差:[xmean(x)]/std(x)【正确答案】：D解析：

标准化所使用的公式:（X-Mean）/（standarddeviation）。70.在ODPS表T中添加一个新的列col，类型为bigint，最简单易行的办法是？A、将表T删掉重建B、altertabletaddcolumns(cbigint)C、新建一张表，将原有数据插入Daltertableaddcbigint【正确答案】：B解析：

增加字段最简单的方式是适用alter修改，D选项语法不对71.RDS采用的主备M-M的高可用架构，其主备之间的数据同步依靠日志的方式实现，MySQL数据库和SQLServer分别使用的日志是什么?A、均为事务日志B、MySQL数据库为事务日志，SQLServer为BINLOG日志C、MySQL数据库为BINLOG日志，SQLServer为事务日志D、均为BINLOG日志【正确答案】：C解析：

此题为常识题，Mysql数据库为BINLOG日志，SQLServer为事务日志。72.某图书管理系统使用ODPS进行离线数据分析，现在他们要将同一类目的书籍的名称拼成一个字符串，即将属于同一分组的字符串合并在一列展示，以下哪个内置函数可以实现这一功能？A、wm_concatB、split_partC、concatD、regexp_instr【正确答案】：A解析：

wm_concat聚合函数，用途:用指定的separator做分隔符，链接str中的值。其输入与输出是多对一的关系,即将多条输入记录聚合成一条输出值。可以与SQL中的groupby语句联用。split_part：split_part()切割函数对按分隔符去取某个特定位置上的值concat用途:返回值是将参数中的所有字符串连接在一起的结果。regexp_instr：返回字符串source从start_position开始,和pattern第n次（nth_occurrence）匹配的子串的起始/结束位置。任一输入参数为NULL时返回NULL。73.DRDS的服务可用性不低于百分之多少？A、95B、99.95C、99.99D、99【正确答案】：B解析：

无74.OTS中某秒内发生了10次读操作，其中5次每次操作读出当行数据大小为2.78KB，另外5次操作读出当行数据大小为5.36KB，则共消耗多少（）A、11CUB、20CUC、10CUD、15CU【正确答案】：D解析：

一、计算过程：

5次读操作：2.78k<4k,即使用5CU

5次写操作：5.36k>4K,即1<5.36/4<2,向上取整2*5=10CU

总共消耗：5+10=15CU

二、读/写吞吐量的单位为读服务能力单元和写服务能力单元，简称CU（CapacityUnit），是数据读写操作的最小计费单位。

CU消耗说明

1、PutRow操作消耗的读CU和写CU说明如下：

消耗的写CU为修改的行主键数据大小与属性列数据大小之和除以4KB向上取整。

如果指定条件检查不为IGNORE，则消耗行主键数据大小除以4KB向上取整的读CU。

如果操作不满足指定的行存在性检查条件，则操作失败并消耗1单位写CU和1单位读CU。

2、UpdateRow操作消耗的读CU和写CU说明如下：

消耗的写CU为修改的行主键数据大小与属性列数据大小之和除以4KB向上取整。操作中包含的需要删除的属性列，只有属性列的列名计入属性列数据大小。

如果指定条件检查不为IGNORE，则消耗行主键数据大小除以4KB向上取整的读CU。

如果操作不满足指定的行存在性检查条件，则操作失败并消耗1单位写CU和1单位读CU。

3、DeleteRow操作消耗的读CU和写CU说明如下：

消耗的写CU为删除的行主键数据大小除以4KB向上取整。

如果指定条件检查不为IGNORE，则消耗行主键数据大小除以4KB向上取整的读CU。

如果操作不满足指定的行存在性检查条件，则操作失败并消耗1单位写CU。

/document_detail/27284.html

/document_detail/54519.html75.大数据计算服务MaxCompute中，用户登录表user_login的建表语句如下createtableuser_login(user_idstring,logindatedatetime,loginipstring);表中包含了近3个月的用户登录信息，为了统计每天的用户登录次数，可以用（）实现。A、Selectdatetrunc(login_date,’dd’),count(*)fromuser_logingroupbydatetrunc(login_date,’dd’)B、selectdatetrunc(login_date,hh"),count(*)fromuser_logingroupbydatetrunclogin_date,’hh’);C、Selectdatetrunc(login_date,’mm’),count(*)fromuser_logingroupbydatetrunc(login_date,’mm’);D、Selectdatetrunc(login_date,’yyyy’),count(*)fromuser_logingroupbydatetrunc(login_date,’yyyy’)【正确答案】：A解析：

内置函数考察76.MaxCompute体系架构中，负责计算的是（），由逻辑层的Executor负责向该master提交SQL/MR任务。A、SchedulerB、SparkC、FlinkD、Fuxi【正确答案】：A解析：

Scheduler负责instance的调度：包括将instance分解为task、对等待提交的task进行排序、以及向计算集群的Fuximaster询问资源占用情况以进行流控（Fuxislot满的时候，停止响应Executor的task申请）。/apsara/enterprise/v_3_13_0_20201215/odps/enterprise-product-introduction/product-architecture.html77.大数据计算服务中，通常情况下，prj1项目空间的成员若要访问prj2项目空间的数据，则需要prj2项目空间管理员执行繁琐的授权操作:首先需要将prj1项目空间中的用户添加到prj2项目空间中，再分别对这些新加入的用户进行普通授权。实际上prj2项目空间管理员并不期望对prj1项目空间中的每个用户都进行授权管理，而期望有另一种更高效的机制能使得prj1项目空间管理员能对许可的对象进行自主授权控制。以下哪种授权方式可以帮助prj2项目空间管理员实现他的预期目标?A、LabelSecurityB、RoleC、PackageD、ProjectProtection【正确答案】：C解析：

通过打包的方式把授权给另外一个项目，然后有另外一个项目的管理员再分配权限，这样更高效，更利于团队的合作。A、LabelSecurity支持列级别的权限授权；B、Role是角色，使用户的集合；D、项目空间数据安全，开启后禁止数据流出。78.从优化角度来看,大数据计算服务的MapReduce对于哪个节点处理哪个分片这个问题,采用了_______策略。A、本地性原理，即数据在哪台机器上，就在哪台机器上启动mapB、能者多劳原理，将数据移动到计算能力最强的节点上，启动map.C、基于历史处理信息的优化原理,即将数据移到从历史执行信息看处理效果最好的机器上D、负载均衡原理，即将数据放在当前负载最小的节点上启动map【正确答案】：A解析：

map拉取数据遵从数据本地化原则79.数据工场DataWorks(原DataIDE)中，大数据计算服务(MaxCompute,原ODPS)的表可以通过数据管理模块的可视化建表功能创建，也可以通过开发面板或者调度执行建表语句创建。两种建表方式中，数据管理模块的可视化建表特有的功能点是________。A、可以设置表生命周期B、可以设置表类目C、可以设置表字段描述D、可以设置表描述【正确答案】：B解析：

除了设置表类目，其他都可以通过执行语句创建80.OTS中以什么方式来存储数据？A、二维表B、键值对C、对象D、聚簇列【正确答案】：B解析：

表格存储支持将主键列设置为自增列，每张表只能设置一个主键列为自增列，且分区键不能设置为自增列。主键列设置为自增列后，在写入一行数据时，该主键列无需填值，表格存储会自动生成该主键列的值。自动生成的主键列的值在分区键内严格递增且唯一。综上所述，OTS是类似于HBase存储方式以键值对的方式存储数据。81.ABC电商公司非常关心用户从浏览到下单到支付的转化率，他们想分析不同性别的人在该流程中的转化率的差异，可以通过很好的实现该需求。A、漏斗图B、饼图C、对比漏斗D、树图【正确答案】：C解析：

正确答案C。A、漏斗图适用于分析具有规范性、周期长、和环节多的业务流程。通过漏斗各环节业务数据的比较，能够直观地发现和说明问题所在。漏斗图还可以用来展示各步骤的转化率，适用于业务流程多的流程分析，例如通过漏斗图可以清楚地展示用户从进入网站到实现购买的最终转化率。漏斗图是由漏斗层标签和漏斗层宽决定的，漏斗层标签由数据的维度决定，如区域；漏斗层宽度由数据的度量决定，如订单金额。B、饼图显⽰的是⼀个数据系列，每个数据系列具有⼀个颜⾊或图案（当饼图的扇区数量超过12个时，会出现颜⾊重复）。饼图可⽤来展⽰数据中各项的⼤小与各项总和的⽐例，例如展⽰五险⼀⾦在个人收入中的比例等。C、旋风漏斗图可被看做是旋风图和漏斗图的结合体，本题更适合使用旋风漏斗图；D、树图是通过树形结构来展现层级数据的组织关系，以⽗⼦层次结构来组织对象，是枚举法的⼀种表达⽅式，例如查看某个省份下各地级市的收⼊状况，那么省份与地级市之间的关系就可以看做是⽗⼦层次结构。树图适⽤于与组织结构有关的分析，如公司的⼈员组织结构，或者医院的科室组织结构。82.哪个字符集是目前RDSforMySQL不支持的()A、gbkB、big5C、latin1D、utf8【正确答案】：B解析：

支持utf8、gbk、latin1或utf8mb483.下列关于ADS用户的说法，哪些是正确的？A、对用户的授权支持ACL和policy两种B、在授权给一个用户之前，需要使用adduseron.*将用户添加到ADS库dbname中来C、数据库拥有者可以删除用户，意味着被删除用户无法再使用ADS的任何服务D、用户是被授权的数据库用户，由数据库拥有者授权时添加，无须开通ADS服务【正确答案】：D解析：

支持ACL，不支持policy授权进行授权SQL语法GRANTprivilege_type[(column_list)][,privilege_type[(column_list)]...ON[object_type]privilege_levelTOuser[,user]...不可以删除用户，可以回收用户84.某业务部门计划使用ApacheFlink来实现QPS比较少且非核心业务的流式计算能力，下面哪种部署方式可以保证业务的高可用性？A、部署1个JobManager节点和1个TaskManger节点B、部署1个JobManager节点和若干TaskManger节点C、部署若干JobManager节点和1个TaskManger节点D、部署若干JobManager节点和若干TaskManger节点【正确答案】：D解析：

部署若干JobManager节点和若干TaskManager节点可以保证业务的高可用性。因为在这种部署方式下，如果某个节点出现故障，其他节点可以接管其任务，保证业务的持续运行。而其他部署方式可能会因为单点故障而导致业务中断。85.查询数据需要select权限。目前ADS中对select权限的管理的最小级别是？A、表组B、表C、列D、数据库【正确答案】：C解析：

查询数据的权限:查询表数据需要SELECT权限，最小级别是列并非所有查询都需要该权限,例如SELECTnow()导出数据的权限:导出数据同时需要DUMPDATA和SELECT权限同时需要数据导出目的地的数据写入相关权限86.OTS是构建在阿里飞天系统之上的产品，它提供的是什么服务？A、在线高并发事务服务B、海量数据的非结构化读写服务C、在线NoSQL数据库服务D、在线关系型数据库服务【正确答案】：C解析：

无87.ODPS中提供了别名命令ALIAS，可以为哪些对象设置别名（）A、资源B、列C、行D、表【正确答案】：A解析：

用途：为资源创建别名。88.使用ODPSSQL:createtablet1liket2:建表时，表t1不会具有表t2的哪种属性（）A、分区B、生命周期C、二级分区D、字段的注释【正确答案】：B解析：

lifecycle指明此表的生命周期，createtablelike语句不会复制源表的生命周期属性。除生命周期属性外，列名、列注释以及表注释等均相同。备注:Createas同样不会具有表t2的生命周期。但会获取t2表的数据。89.ADS的普通表最多包含多少个列？A、2048个B、1024个C、4096个D、512个【正确答案】：B解析：

(1)一张事实表至少有一级Hash分区并且分区数不能小于8个;(2)一个事实表组最多可以创建256个事实表;(3）一个事实表最多不能超过1024个列。90.数据工场DataWorks(原DatalDE)中，SQL任务task1是按小时调度的周期性调度任务，任务配置为每1小时执行次，结果会插入到表table1中去，table1为一个有两个分区键(ds和hh)的分区表，其中ds取前一个小时的年月日(格式为yyyymmdd)，hh取前一-小时的小时(格式为hh24)，要使用调度系统提供的时间参数定义分区，使得task1每次调度运行时自动替换时间值，task1应该如何配置?A、task1代码里table1的分区ds=${cdate},hh=$(h),.任务参数配置:hh=$[hh24]B、task1代码里table1的分区ds=${date},h=${h).任务参数配置:hh=$[hh24-1/24]C、task1代码里table1的分区ds=${daytime},hh={h).任务参数配置:daytime=[yyyymmd-1/24]hh=$hh24-1/24]D、task1代码里table1的分区ds=${daytime},hh=${h),任务参数配置:daytime=[yyyymmdd]hh=$[hh24-1/24]【正确答案】：D解析：

正确答案D。

符合yyyymmdd和hh24格式的，而且小时数需要减1的，只有一个选项“task1代码里table1的分区ds=${daytime},hh=${h),任务参数配置:daytime=[yyyymmdd]hh=$[hh24-1/24]”A、ds=${date}指业务日期，每小时执行的任务应取当前日期即cyctime或自定义参数；

hh=$[hh24]，无法满足跨天执行，hour的计算公式仍然是$[hh24-1/24]。B、同A，ds=${date}指业务日期，及前一天C、任务参数配置:daytime=[yyyymmd-1/24],无中生有不合理D、ds=${daytime}，自定义参数，通过自定义类型daytime=[yyyymmdd],[]代表取当前日期，yyyymmdd是日期格式化，如果想取前一天可采用${yyyymmdd},{}代表取前一天，yyyymmdd是日期格式化

91.使用数据工场DataWorks(原DataIDE)进行数据开发时，往往需要经过数据抽取、加工和装载的过程，即ETL过程，其中数据的抽取和装载可以使用数据同步节点实现。关于数据同步说法错误的是()。A、支持毫秒级数据同步B、支持全量导入C、支持增量导入D、支持多表数据同步【正确答案】：A解析：

同步属于离线同步，相应毫秒级一般无法达到,最细粒度5分钟。92.DRDS和普通的关系型数据库(如Mysql)相比，SQL优化要特别考虑的是（）A、磁盘IO开销B、内存开销C、并发度D、网络IO开销【正确答案】：D解析：

DRDS是一个高效稳定的分布式关系数据库系统。但是,由于其处理的是分布式的关系查询,因而它对于SQL的查询优化与传统的单一数据库(如Mysql,oracle)的查询优化有所不同。后者在查询优化时,主要考虑的就是磁盘IO的开销,但前者在优化时还需要考虑另外一个更为重要的IO开销-网络。93.针对ODPSSQL做逻辑分析的时候，会进行一些优化，不包括以下哪种优化（）A、扫描方式B、列映射C、谓语动词下沉D、常量表达式【正确答案】：A解析：

odps自带的优化引擎会对sql作业做一定的优化处理，如列裁剪、分区裁剪和谓词下推、常量表达式94.在大数据开发治理平台Dataworks数据同步任务（云数据库RDS数据同步至MaxCompute）

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

ACP大数据工程师复习试题含答案

文档简介

温馨提示

最新文档

评论

ACP大数据工程师复习试题含答案

文档简介

温馨提示

最新文档

评论

相关文档