![阿里云数据中台练习测试题附答案(一)_第1页](http://file4.renrendoc.com/view/d91c8a4288ed50370eb041f5d1c0e673/d91c8a4288ed50370eb041f5d1c0e6731.gif)
![阿里云数据中台练习测试题附答案(一)_第2页](http://file4.renrendoc.com/view/d91c8a4288ed50370eb041f5d1c0e673/d91c8a4288ed50370eb041f5d1c0e6732.gif)
![阿里云数据中台练习测试题附答案(一)_第3页](http://file4.renrendoc.com/view/d91c8a4288ed50370eb041f5d1c0e673/d91c8a4288ed50370eb041f5d1c0e6733.gif)
![阿里云数据中台练习测试题附答案(一)_第4页](http://file4.renrendoc.com/view/d91c8a4288ed50370eb041f5d1c0e673/d91c8a4288ed50370eb041f5d1c0e6734.gif)
![阿里云数据中台练习测试题附答案(一)_第5页](http://file4.renrendoc.com/view/d91c8a4288ed50370eb041f5d1c0e673/d91c8a4288ed50370eb041f5d1c0e6735.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第页阿里云数据中台练习测试题附答案1.下列关于阿里云流计算的描述总,错误的是()。A、是运行在阿里云平台上的流式大数据分析平台B、提供给用户在云上进行流式数据实时化分析工具C、可以使用阿里云StreamSQL进行流式数据分析D、流计算的数据存储是基于盘古分布式文件系统的【正确答案】:D2.大数据计算服务(MaxCompute,原ODPS)中的fact_oder表的生命周期属性设置成了30天,开发人员通过以下命令创建了一张新的fact_lottery_oder表:createtablefact_lottery_orderlikefact_oder;对于新表的描述正确的是()。A、fact_lottery_order的生命周期属性是无穷大B、fact_lottery_order的生命周期属性不会被设置C、fact_lottery_order的生命周期属性是0D、fact_lottery_order的生命周期属性是30【正确答案】:B3.ADS创建普通表时,关于updateType属性()说法是错误的。A、合法的取值为realtime或者batch,该值不显式指定时,默认取batchB、该值为realtime时,对应的表必须指定合法的主键并且必须指定二级分区C、通过该属性指定数据的更新方式D、该值为batch时,如果要支持增量导入,必须指定二级分区【正确答案】:B4.以下()不是加载数据到Maxcompute的合理方法。A、dshipB、tunnelC、DTtaskD、mapreduce【正确答案】:C5.MaxCompute的数据可靠性是()。A、0.9995B、0.999999C、0.995D、0.9999999999【正确答案】:D6.某借贷公司推出一款线上贷产品,采用阿里云的数据处理技术,通过对会员的历史数据进行分析,包括交易量、网上信用评价、企业自身经营状况等等,每天处理的数据在20P左右,基于这些数据对用户信用进行建模并产生预测数据,用户线上申请贷款时,能迅速根据用户模型预测结果进行资质评估、授信等。请根据你对阿里云产品的理解,下述方案中成本最低、性能最好的一个是()。A、使用ODPS对数据进行建模,然后使用该模型对所有符合贷款条件的会员进行资质评估和授信评估,将处理结果保存在ODPS中B、使用ODPS对数据进行建模,然后使用该模型对所有符合贷款条件的会员进行资质评估和授信评估,将处理结果保存在OTS中,以供实现快速查询C、使用ADS对数据进行建模,然后使用该模型对所有符合贷款条件的会员进行资产评估和授信评估,将处理结果保存在ADS中D、使用ADS对数据进行建模,然后使用该模型对所有符合贷款条件的会员进行资产评估和授信评估,将处理结果保存在OTS中【正确答案】:B7.某企业使用ADS做数据分析,其中部分数据来源于Maxcompute。技术人员在使用LOADDATA命令从Maxcompute加载数据到ADS的过程中,碰到如下错误信息:ERROR1105(HY000):Youarenottheownerofthesourcetable,最有可能出错的原因是()。A、源表不存在B、ADS的用户garuda_build@没有对源表的操作权限C、Maxcompute的用户garuda_build@没有对源表的操作权限D、源表中没有数据,为空表【正确答案】:C8.怎么查看一个分区表都有()分区(不是分区键,是分区内容)。A、SHOWB、DESCC、SHOWPARTITIONSDESCPARTITIONS【正确答案】:C9.Tom是MaxCompute中某个项目空间prg1的管理员。该项目空间有很多敏感数据,比如用户身份号码和薪资记录,还有很多自主知识产权的数据算法,Ton希望能按项自空间中的这些收感数据和算法保护好,项目中用户只能在项目空间中访问,数据只能在项目空间内流动,他应该()操作。A、使用ACL授权将所有用户设置为只读B、使用Policy授权将所有用户设管为只读C、允许对象创建者访问对象D、开启项目空间的数据保护机制【正确答案】:D10.作为技术人员,小王被Maxcompute强大的数据处理能力吸引,想去体验一下。他快速注册了一个阿里云帐号,进入官网后试图创建一个名字为test_project的Maxcomputeproject,结果没有成功。分析,小王出错的最有可能的原因是()。A、帐号未充值,余额不足导致出错B、帐号未开通Maxcompute的使用权限C、未创建合适的accessID和accessKeyD、项目名字和现有的其他帐户的名字重复【正确答案】:D11.Dataworks中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执行相应的实例。在调度的不同阶段,实例会处于不同的状态,包括未运行、运行中、运行成功、运行失败、等待时间、等待资源等。当实例处于()状态时可以将任务量为成功并恢复调度。A、运行中B、未运行C、等待时间D、失败【正确答案】:D12.ADS存储数据的时候采用的模型是()。A、雪花型模型B、关系型模型C、星型模型D、多维模型【正确答案】:B13.阿里云大数据计算服务(MaxCompute,原ODPS)是阿里巴巴自主研发的海量数据处理平台,主要服务于批量结构化数据的存储和计算。以下()场景不适合使用大数据计算服务实现。A、在线交易系统B、数据仓库C、大数据的分析建模D、网站日志离线分析【正确答案】:A14.以下()不是由MaxCompute接入层提供的服务。A、HTTP服务B、LoadBalanceC、括用户空间管理操作D、用户认证【正确答案】:C15.关于OTS中数据查询的说法正确的是()。A、查询时仅需要提供分片键即可B、可以创建索引,然后基于索引列进行查询C、查询时可以仅提供主键的一部分,但是和组成主键的列的顺序有关D、单行查询必须提供主键【正确答案】:D16.ADS的普通表最多包含()个列。A、2048个B、1024个C、4096个D、512个【正确答案】:B17.Maxcompute对SQLDML语句进行解析后,得到执行计划。构成执行计划的是由多个有相互依赖关系的()组成。A、任务(Task)B、作业(Job)C、执行阶段(Stage)D、实例(Instance)【正确答案】:C18.关于ADS的数据类型,说法不正确的是()。A、布尔类型boolean取值只能为0或1B、ADS所有的数据类型都不支持unsignedC、数值类型float可以指定精度,例如:float(5,3),但是double类型不支持指定精度D、双精度浮点数double类型的存储字节数为4,大整数类型bigint存储字节数为8【正确答案】:C19.DRDS中的表T的分库分表键分别为col1和col2,则下列语句中()不会进行全表扫描。A、select*fromTwherecol1=1orcol2=2;B、select*fromTwherecol2=2;C、select*fromTwherecol1=1;D、select*fromTwherecol1=1andcol2=2;【正确答案】:D20.Maxcomputetunnel命令的download子命令可以下载大数据计算服务中的表到本地。以下关于tunneldownload说法正确的是()。A、一次执行可以同时下载多个分区B、可以下载视图数据到本地C、下载出错后可以通过tunnelresume恢复下载D、支持多线程下载【正确答案】:D21.在大数据计算服务的数据仓库中的订单表fact_order,建表语句如下:createtablefact_order(order_idstring,order_amtdouble,order_dtstring)partitionedby(dtstring);此表中的数据是从ods_order加工而来,ods_order建表语句如下:createtableods_order(order_idstring,order_amtbigint,order_dtstring);ods_order中有一条记录数据值是order_idorder_amtorder_dt000110020160301运行SQL语句将数据从ods_order加载到fact_order中:insertoverwritetablefact_orderpartition(dt=’20160301’)select*fromods_order;对此语句的执行结果描述正确的是()。A、提交SQL时会报语法错误B、语句可以执行,order_amt的值会被自动的转为double类型C、语句可以执行,但是这条数据会被当作脏数据丢弃D、目标表与源表中的数据类型不一致,执行出错【正确答案】:B22.()监控信息不能从OTS的用户管理控制台直接获得。A、读写吞吐量B、平均返回延迟值C、QPSD、TPS【正确答案】:D23.在阿里云MaxCompute中,用于判断X和Y两个整型不相等,可以使用的操作符是()。A、X==YB、X!=YC、XYD、XlikeB【正确答案】:C24.下面()函数不是字符串处理函数。A、TRUNCB、TO_CHARC、SUBSTRD、丨NSTR【正确答案】:A25.MaxCompute中,()命令可查看角色roletest的权限。A、listroleroletestB、showgrantsforrolerole_testC、descrolerole_testD、showaclforroleroletest【正确答案】:C26.ADS中两个普通表关联,对于joinkey,()说法是不正确的。A、如果两张表的joinkey都没有hashmap索引,则会报错,修正方法为:至少一个joinkey上手工添加hashmap索引,且修改过的表需要重新加载数据,重新进行关联B、两张表的Hash分区数必须一致,且分区列一致C、两张表的JoinKey至少有一列建立了HashMap索引D、如果选择只在一张表上建HashMap索引的话,推荐建立在数据量较大表的一侧【正确答案】:D27.MaxCompute中,ProjectA中的成员要访问ProjectB的资源,在不考虑将此成员加入到ProjectB中的情况下,通过()授权方式可以实现跨项目空间访问资源。ACLB、PackageC、RoleD、Policy【正确答案】:B28.Maxcompute中()操作会使授权实效。A、上述授权都会失效B、对acl授权过的表重建C、对policy授权过的表重建D、对package授权过的表重建【正确答案】:B29.大数据计算服务(MaxCompute,原ODPS)的MapReduce由多个步骤组成,以下()步骤不是必须的。A、combineB、shuffleC、mapD、reduce【正确答案】:C30.如何快速获取odps项目空间表的数据内容()。A、select*from$tablewherepartiton=$(date+%Y%m%d)limit10;B、select*from$tablelimit10;C、read10$table;D、read$tablepartition(ds=$(date+%Y%m%d))10;【正确答案】:D31.MaxCompute的使用限制包括()。A、字符串格式的列内容不能超过2MB、单个任务引用的资源总计字节数不能超过64MC、单个任务中自定义的counter不能超过64个D、单个任务引用的资源个数不能超过512个【正确答案】:B32.dataworks新建离线同步任务如果设置了并发但是通过任务运行日志发现设置的并非并未生效的原因是()。A、未设置允许脏数据条数B、未正确配置切分键C、清理规则设置不合理D、开启了同步速率限制【正确答案】:B33.下列关于MaxCompute的描述中,错误的是()。A、一种快速、完全托管的TB/PB级数据仓库解决方案B、向用户提供了完善的数据导入方案C、多种经典的分布式计算模型,能够更t央速的解决用户海量数据计算问题D、提供了完善的SQL访问,有效支持事务【正确答案】:D34.公共云计算上分析型数据库的用户创建数据库的方式为()。A、直接通过CREATEDATABASE的DDL语句创建数据库B、直接通过CREATEDATABASE的DML语句创建数据库C、直接通过CREATETABLE的DDL语句创建数据库D、只能通过DMS控制台界面来创建需要的业务数据库【正确答案】:D35.MaxCompute选用OTS来存储元数据,以下()不是主要原因。A、支持大规模数据存储B、高性能,晕秒级单行读写C、可扩展,理论上无限容量D、成本低,存储和管理投入少【正确答案】:D36.在运行时,由MaxCompute依据上下文使用环境及类型转换规则自动进行的类型转换是()。A、显示转换B、影式专换C、cast转换D、SQL转换【正确答案】:B37.Maxcompute表t1、t2都是分区表,分区键是pt,对于sql语句selectt1.idfromt1leftouterjoint2ont1.id=t2.idwheret1.pt=’20140101’andt2.pt=’20140101’,()说法是正确的。A、两张表都会进行分区裁剪B、t2表会进行分区裁剪C、t1表会进行分区裁剪D、两张表都不会进行分区裁剪【正确答案】:C38.DataWorks的参数配置功能可以满足该业务场景的需求。您在配置参数后,即可赋予周期调度运行的任务自动解析出所需值。目前参数分为系统参数和自定义参数(推荐)两大类。以下关于自定义参数描述错误的是()。A、$bizdate表示业务日期,默认为当前时间减一天B、$cyctime表示任务定时调度时间。如果未给天任务定时,则默认定时时间为当天24点整(精确到时分秒,通常小时、分钟级调度任务使用)C、如果{}参数,则以bizdate为基准参与运算,补数据时选择的业务日期和参数替换结果保持一致D、如果是[]参数,则以cyctime为基准参与运行,和Oracle的时间运算方式一致。执行补数据时,参数替换结果为选择的业务日期+1天【正确答案】:B39.大数据服务(MaxCompute,原ODPS)中客户表customer是一张非分区表,现在想要清空表的内容然后重新上传数据,可以通过()。A、insertoverwritetablecustomerselect*fromcustomer;B、deletefromcustomer;C、truncatetablecustomer;D、droptablecustomer;【正确答案】:A40.大数据计算服务(MaxCompute,原ODPS)提供了完整的丰富的安全策略和授权策略,来保护我们的数据,在想下载数据到本地的时候,除了要有相应的权限之外,还要选择合适的下载方式。现在大数据计算服务的某表中有1000万行数据,需要把这些数据全部导出到本地。下面()是可行的方法。A、在客户端工具odpscmd中用select命令,把结果重定向到文件中B、管理控制台中读出该表,下载数据C、在命令行工具odpscmd中使用tunnel命令下载D、找到该表在大数据计算服务上的保存路径,然后把该路径下的文件全部下载【正确答案】:C41.从Maxcompute导入数据到ADS的时候,导入路径格式为()。A、odps://project_name/table_namepartiton_specB、odps://project_name/table_name:partiton_specC、odps://project_name/table_name(partiton_spec)D、odps://project_name/table_name/partiton_spec【正确答案】:D42.通过DMS管理后台或者数据库客户端,连接RDS数据库时,提示错误信息“max_user_connections”,代表()含义。A、IOPS超出极限B、RDS空间满了C、网络中断D、RDS数据库的连接数满了【正确答案】:D43.在MaxCompute中,可以通过Tunnel命令行来完成数据的上传下载。如果要下载test_project项目空间下的一个带分区的表test_table_p的内容到log.txt文件中,使用命令tunneldownloadtest_project.test_table_plog.txt;结果报错,其中出错的部分为()。A、tunnelB、downloadC、test_project.test_table_pD、log_txt【正确答案】:C44.MaxCompute数据表的默认生命周期是()。A、1天B、7天C、30天D、无期限【正确答案】:D45.OTS中可以使用拼接的分片键,拼接就是把几个属性拼接成一个属性。拼接是为了解决()问题。A、解决数据生命周期的问题B、解决写压力过于集中的问题C、解决单个分片键下数据量过大的问题D、解决OTS预留读写量不足的问题【正确答案】:C46.大数据计算服务(MaxCompute,原ODPS)中的角色(Role)是一组访问权限的集合。当需要读一组用户赋予相同的权限时,可以使用角色来授权。基于角色的授权可以大大简化授权流程,降低授权管理成本,当需要对用户授权时,应当优先考虑是否应该使用角色来完成。关于角色的说法中正确的是()。A、可以将Owner视为一个角色,赋给其他用户B、Admin是项目空间自动创建的角色,可以为该角色添加权限C、删除一个角色时,会先检查该角色内是否还存在其他用户。若存在,则删除该角色失败D、创建完角色后,需要给角色添加权限,仅支持以ACL授权的方式添加【正确答案】:C47.下列Maxcompute的()函数可以用在查询的where子句中。A、userdefinedtablefunctionB、userdefinedaggregationfunctionC、userdefinedscalarfunctionD、userdefinedfunction【正确答案】:D48.对于OTS表的主键描述正确的是()。A、由四个属性组成B、建表的时候可以暂时不指定,之后用altertable修改C、组成主键的属性只能是string或者integerD、主键本身就是表的分片键【正确答案】:C49.在ADS中,为了更高效的进行表关联,两个事实表进行Join的必要条件不包括以下()。A、这两个表的joinkey至少有一列建立了主键B、这两个表在一个表组C、这两个表的joinkey是hash分区列D、两个表的Hash分区数必须一致【正确答案】:A50.大数据计算服务中的客户表customer是一张非分区表,现在想要清空表的内容然后重新上传数据,可以通过()将数据清空。A、insertoverwritetablecustomerselect*fromcustomer;B、truncatetablecustomer;C、deletefromcustomer;D、droptablecustomer;【正确答案】:B51.关于QuickBI的数据门户的说法中,不正确的是()。A、也叫数据产品B、用来做权限管理、报表分类和仪表盘设计C、可以引用QuickBI中的数据结果D、支持外挂链接【正确答案】:B52.Maxcompute中,当一个用户被移除后,与该用户有关的()授权会保留。A、package授权B、policy授权C、ACL授权D、项目空间授权【正确答案】:C53.数据工场DataWorks中的调度任务可以通过配置依赖属性来控制任务运行的先后顺序,下列说法不正确的是()。A、同一个组织的不同数据工场DataWorks(原DatalDE)项目空间中的调度任务不能配置成上下游依赖的关系B、多个调度任务可以配置成依赖同一个上游任务C、同一个项目空间中的节点任务和工作流任务可以配置成上下游依赖的关系D、一个调度任务可以配置多个上游依赖任务【正确答案】:A54.下列OLAP中,无需预先建模的是()。A、HOLAPB、MOLAPC、ADSD、ROLAP【正确答案】:C55.Maxcompute拓展MR的主要特点是()。A、支持计算在内存中进行,中间结果不落地B、支持Map后连续任意多个Reduce操作C、可以在上一次的reduce结束之后,直接增加一次mapD、从Map直接到Reduce,省去Shuffle阶段【正确答案】:B56.Maxcompute项目空间prj1中存在表t1,owner打开LabelSecurity设置后,执行如下命令:SETLABEL1TOTABLEt1;SETLABEL2TOTABLEt1(id);SETLABEL3TOTABLEt1;此时,t1表中的列ID的敏感等级标签是()。A、0级B、2级C、1级D、3级【正确答案】:B57.下面()是Hadoop的生产中使用的模式。A、单机版B、分布式C、伪分布式D、全部正确【正确答案】:B58.OTS种以()方式来存储数据。A、对象B、二维表C、键值对D、聚簇列【正确答案】:C59.关于MaxComputeMR,说法正确的是()。A、Map和Reduce前都需要对数据进行分片;B、进入reduce前,数据需要进行合并操作(combiner),然后按照key排序;C、MapWorker在输出数据时,需要为每一条输出数据指定一个key;D、Reducer的个数和Mapper的个数一致;【正确答案】:C60.HDFS中的文件块的数量可以通过配置参数来规定,默认文件块副本数为3,每个文件块的大小是()(在hadoop2.x版本中)。A、64MB、12MC、128MD、256M【正确答案】:C61.在分析型数据库AnalyticDB中可以通过DML命令导入导出数据到MaxCompute中,以下导入、导出命令中正确的有()。A、loaddatafrom'odps://odps_project/odps_table'intotablemy_ads.my_table;B、uploaddatafrom'MaxCompute://odps_project/odps_table'intotablemy_ads.my_table;C、dumpdatainto'odps://odps_project/odps_table'selectid,namefrommy_ads.my_tableD、downloaddatainto'odps://odps_project_odps_table'selectid,namefrommyads.my_table【正确答案】:C62.在MaxComputeSQL中,concat('a',null,'b')的执行结果是()。A、aB、anullbC、abD、null【正确答案】:D63.DRDS的读策略中不包含以下()。A、主库读B、均衡C、自定义D、主库写【正确答案】:D64.Dataworks中,通过数据开发面板的脚本开发,可以创建SQL脚本文件并直接编辑、执行。关于脚本文件,以下说法正确的是()。A、脚本文件可以自动调度B、
脚本文件不能发布到目标项目空间C、脚本文件可以设置依赖属性D、脚本文件不能保存【正确答案】:B65.OTS单个分片下所有行的大小总和不能超过()。A、无限制B、1GC、1MD、1T【正确答案】:B66.下面()程序负责HDFS数据存储。A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode【正确答案】:C67.MaxComputeSQL中,使用关系运算符对两个操作数进行比较,如果进行比较的两个类型间不能进行隐式类型转换,则()。A、则该关系运算不能完成,但并不会报错B、则该关系运算可以完成,健艮错退出C、则该关系运算不能完成,报错退出D、提示用户需要使用cast进行显示的类型转换【正确答案】:C68.OTS中某秒内发生了10次读操作,其中5次每次操作读出当行数据大小为2.78KB,另外5次操作读出当行数据大小为5.36KB,则共消耗()。A、11CUB、20CUC、10CUD、15CU【正确答案】:D69.某企业选择了使用阿里云大数据计算服务(MaxCompute,原ODPS)进行数据仓库建设,由一个多人的团队负责实施和运维。为了更好的进行角色分工、数据权限、多用户协同等管理工作,同时还能实现任务的自动调度、任务监控、错误告警及处理等运维工作,并且需要有一个简单易用的幵发环境,以下方案中()是最便撞、最高效的。A、用MaxCompute的console客户端作为主要开发工具B、使用Maxcompute提供的SDK自己开发一个客户端工具C、使用Dataworks作为开发工具D、使用MaxCompute的管理控制台【正确答案】:C70.大数据计算服务中,临时数据表tmp_item是一张非分区表,开发人员在建表时指定了lifecycle属性为30,且使用一次后未再进行任何操作和访问。30天后这张表会()。A、tmp_item会被自动重命名为tmp_item.deletedB、tmp_item表会被自动删除掉C、不会任何变更D、tmp_item中的数据会被清空,表结构仍存在【正确答案】:B71.表A为ADS中的普通表,列a为其中一个普通列,类型为int,以下SQL()是正确的。A、SELECTa+COUNT(*)FROMAB、SELECTUDF_SYS_COUNT_COLUMN(a)FROMAC、SELECTSUM(COUNT(*))FROMAD、以上都正确【正确答案】:B72.关于Maxcompute类型之间的类型转化,说法不正确的是()。A、隐式类型转换是Maxcompute依据上下文使用环境自动进行的类型转换B、部分类型之间不可以通过显式的类型转换,但可以通过SQL的隐式转换完成C、不支持的隐式类型转换会导致异常D、Maxcompute支持的隐式类型转换规则与显式转换相同【正确答案】:B73.MaxComputeGraph中的边(Edge)的表示方式为(
)。A、<ID,Value,Halted>B、<ID,Value,Halted,Edges>C、<DestVertexID,Value>D、<ID,,Values>【正确答案】:C74.()查看一张表中数据的最后修改时间。A、找管理员从后台查B、DESC命令C、SHOWTABLES命令D、SELECTLAST_MODIFY_TIMEFROMTABLE【正确答案】:B75.从优化角度来看,大数据计算服务的MapReduce对于哪个节点处理哪个分片这个问题,采用了()策略。A、本地性原理,即数据在哪台机器上,就在哪台机器上启动mapB、能者多劳原理,将数据移动到计算能力最强的节点上,启动mapC、基于历史处理信息的优化原理,即将数据移到从历史执行信息看处理效果最好的机器上,启动mapD、负载均衡原理,即将数据放在当前负载最小的节点上启动map【正确答案】:A76.下列关于ADS用户的说法,()是正确的。A、对用户的授权支持ACL和policy两种B、在授权给一个用户之前,需要使用adduseron.*将用户添加到ADS库dbname中来C、数据库拥有者可以删除用户,意味着被删除用户无法再使用ADS的任何服务D、用户是被授权的数据库用户,由数据库拥有者授权时添加,无须开通ADS服务【正确答案】:D77.MaxCompute的mapjoin不支持()。A、fullouterjoinB、等值连接C、or连接关联条件D、不等值连接【正确答案】:A78.Maxcompute表T中某列C的数据类型为bigint,需要修改为double,以下()方式可以实现。A、将表T删掉重建B、ALTERTABLETCOLUMNCRENAMETOCDOUBLE;C、ALTERTABLETDROPCOLUMNC;ALTERTABLETADDCDOUBLE;D、ALTERTABLETCHANGECOLUMNSCBIGINT【正确答案】:A79.使用Maxcompute动态分区时,SELECT的分区列放在列表的()位置。A、中间B、开始C、任意位置D、结尾【正确答案】:D80.Dataworks的数据幵发功能模块是根据业务需求供调度系统自动执行的主要操作模块,所属数据幵发的下列()功能。A、任务开发B、脚本开发C、函数管理D、表查询【正确答案】:A81.MaxCompute服务是以RESTfulAPI的形式对外提供。下列()方法可以更新资源。A、UPDATEB、POSTC、GETD、PUT【正确答案】:D82.可以对用于的行为或相关事件进行实时监测和分析的产品的是()。AnalyticDBB、流计算C、MaxComputeD、TS【正确答案】:B83.Dataworks的数据通知任务Task1,将数据从大数据计算服务(MaxCompute,原ODPS)同步到云数据库RDS(MySQL)中,源数据表中存在数据质量问题,加载的时候会有部分出错纪录,Task1中已经配置了容错纪录条数,为了保证正确纪录能够保留,在数据加载与控制中,还需要对Task1配置()。A、源表切分主键B、视为脏数据,保留原有数据(insertinto)C、作业速率上限D、数据过滤条件【正确答案】:B84.Project被设置了“保护模式”以后,以下()说法是正确的。A、所有人都无法访问该Project中的数据B、只有管理员可以访问该Project中的数据C、用户可以在本Project中访问数据,但是不能将数据导出到外部。D、以上全部【正确答案】:C85.Maxcompute中一个表可以上限最多拥有()分区。A、60000个B、100000个C、不限制D、10000个【正确答案】:A86.下列()值,在MaxCompute中被视为合法的datetime类型。A、2014-02-2923:59:59B、41305.063020833C、25569.000011574D、42019.430908056【正确答案】:C87.MaxcomputeSQL的执行计划逻辑上可以被看做是一个有向图,其中边的含义是()。A、实例B、任务C、作业之间的依赖关系D、执行阶段的依赖关系【正确答案】:D88.对于ADS的连接方式,以下说话正确的是()。A、以上都是B、安装了php-mysql-5.1.x模块的php环境C、使用版本为5.4系列的mysql-jdbc驱动D、mysql5.6的客户端【正确答案】:A89.ADS一个普通表组最多可以包含()表。A、256个B、1000个C、无限制D、128个【正确答案】:A90.阿里云MaxCompute中,Table的名字描述中错误的是()。A、使用Createtable建表时,可以使用中文作为表的名字B、表中不能有特殊字符C、表名只能用英文的a-z,A-Z及数字和下划线」,且以字母开头D、名称的长度不超过128【正确答案】:A91.对于ADS的hash分区,()说法是正确的。ADS表的第一级分区必须为hash分区,第二级没有强制要求,目前可以为list或者hashB、hash分区时一种动态分区类型,需要指定具体的分区列,最多为2列C、ADS表的一级hash分区数最大为1000D、若一张表为batch更新类型,且仅有一级hash分区,则每次导入数据时,会对已有数据进行全量覆盖【正确答案】:D92.MaxCompute提供了多种针对日期的计算函数,以下函數中,能实现计算两个时间的差的是()。A、datediffB、timestampdiffC、intervalD、直接相减【正确答案】:A93.关于OTS中分片的说法正确的是()。A、一个分片可能包含多个分片键B、同一个分片上的纪录拥有相同的分片键C、单个分片数据量最大不能超过1TD、相同分片键的纪录不一定在同一分片上【正确答案】:A94.在ADS中,什么是用户所关心的最大单元,也是用户和ADS系统管理员的管理职权的分界点()。A、表组B、表C、数据库D、列【正确答案】:C95.Maxcompute中负责对等待提交的task进行排序的模块是()。A、WorkerB、ExecutorC、SchedulerD、controller【正确答案】:C96.Maxcompute中负责对等待提交的task进行排序的模块是()。A、schedulerB、controllerC、executorD、worker【正确答案】:A97.关于MaxcomputeSQL,说法不正确的是()。A、在很多方面并不具备数据库的特征B、适用于海量数据,实时性要求不高的场合C、每个作业的准备,提交等阶段要花费较长时间D、大部分标准SQL的功能都支持,但是不支持窗口函数、rownum等【正确答案】:D98.Dataworks中,通过运维中心的任务运维视图可以对调度任务操作重跑并恢复调度,即重跑该任务同时把下游未运行的任务恢复调度。任务task3依赖任务task2,任务task2依赖任务task1,对task2操作重跑并恢复调度,以下()场景会使task2和task3执行。A、task1为失败状态,task2、task3都是未运行状态B、task1、task2、task3都是运行成功状态C、task1、task2、task3都是未运行状态D、task1为成功状态,task2为失败状态,task3为未运行状态【正确答案】:D99.管理员基于表T建了一个视图V,将V的读权限授权给了用户U,下面()说法是正确的。A、U可以直接读TB、U不能读T,也不能读VC、U只能读V,不能读TD、U可以读V,也可以读T【正确答案】:C100.大数据开发套件Dataworks支持数据分析项目的全流程开发,以下的说法中不正确的是()。A、开发人员在数据开发和数据理模块中完成数据输入,数据加工,数据输出等工作B、部署或是运维人员可以根据最新的开发结果生成发布包C、部署人员或是运维人员可以通过发布管理模块完成发布包发布D、运维人员可以在运维中心模块中,监控生产环境下的数据运行情况【正确答案】:B1.大数据计算服务(MaxCompute,原ODPS)中的log表保存了日志内容,都被存到了log_content字段中,以访问者的IP地址开头,示例格式如下:—[22/Mar/2016:03:47:43-0700]”GET/favicon.icoHTTP/1.1”404209/””Mozilla/5.0(X11;Linuxx86_64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/49.0.2623.87Safari/537.36”为了提取出访问者的IP地址,可以用()内置的函数。A、regexp_substrB、regexp_extractC、substr和instrD、repeat【正确答案】:ABC2.大数据计算服务MaxCompute的开发人员执行了以下语句:droptableifexiststmp_t1;对此语句执行结果描述正确的有()。A、如果在运行前tmp_t1不存在,则语句会出错B、如果在运行前tmp_t1存在,则语句会出错C、如果在运行前tmp_t1存在,语句会成功D、如果在运行前tmp_t1不存在,语句会成功【正确答案】:CD3.动态数据仓库具有以下()优点。A、一线用户可以动态(或者说实时地)地访问数据仓库以便获取其所需的信息;B、使用动态数据加载方式,相比传统数据仓库采用批量形式加载数据,动态数据仓库通常以准实时的方式连续加载数据(以增量数据加载为主),最低可以到秒级的时间间隔,从而在根本上保证数据仓库数据的实时性;C、采用事件驱动和主动推送的方式为业务系统提供分析能力,例如银行的信贷风险管理员,当审批某人的贷款请求时,关于该申请人的相关风险评级等信息就会被主动推送过来。D、可以提供无限的人工智能和数据处理能力。【正确答案】:ABC4.关于MaxComputePolicy授权的特点,说法正确的是()。A、删除一个对象时,与该对象相关的policy授权会被删除B、Policy支持通过xml文件的方式授权C、当Allow和Deny同时存在时,遵循Deny优先原则D、授权对象支持以通配符【正确答案】:CD5.ADS创建普通表的时候有()限制。A、一张普通表至少有一级Hash分区并且分区数不能小于8个B、一个普通表组最多可以创建256个普通表C、一个普通表最多不能超过1024列D、一张普通表至少有一级Hash分区并且分区数不能多于1000个【正确答案】:ABC6.当前阿里云流计算对外接口包括()。A、StreamSQLB、UDFC、MapReduceD、Graph【正确答案】:AB7.关于ots实例热点分区的排查,以下描述正确的是()。A、列出所有SQLOnlineWorker地址,排查哪些worker机器CPU使用率高B、发现有CPU高的物理机登录到机器上进入到目录/apsara/ots_server/log排查sqlonline.LOG、ots_error_log.LOG日志的异常信息C、依据错误日志查找到InstanceName再通过“ots_ag上admin用户执行[python2.7/apsara/TableStoreAdmin/top/cluster_log_parser.pytop_perf-w$ip-tcount-oREAD_RANGE-m30]”找到分区idD、通过热点分区找到其实例的ID和实例的表名“sqllp|grep$part”,然后再做打散【正确答案】:ABCD8.关于ODPS跨项目资源共享的说法正确的是()。A、Packet是一种跨项目空间共享数据及资源的机制,主要用于解决跨项目空间的用户授权问题B、添加资源时支持的对象类型不包括Project类型,即不能将project添加到packet里C、如果某个package还有人在使用,则该package的owner无法删除此packageD、添加到Package中的不仅仅是对象本身,还包括相应的操作权限,如不显示指定权限,则默认为读写权限【正确答案】:ABC9.在MaxCompute中通过SQL创建了一张分区表,createtablet_student(namestring,scorebigint),下面的SQL语句中语法正确的有()。A、select*fromt_studentorderbyscorelimit100;B、select*fromt_studentorderbyscore;C、selectname,scoreaspfromt_studentorderbyplimit100;D、selectname,scoreassfromt_studentorderbyscorelimit100;【正确答案】:AC10.在MaxComputeSQL中可以通过reatetable语句创建一个新表,创建表时可以指定ifnotexists,以下说法正确的有()。A、如果在创建表时指定ifnotexists,如果存在同名的表,则不会更改现有表,直接返回成功B、如果在创建表时指定ifnotexists井且存在表结构不一致的同名表,此同名表会改动表结构C、如果在创建表时不指定ifnotexists,并且存在同名表,报错返回D、如果在创建表时不指定ifnotexists,无论是否存在同名表,均返回成功【正确答案】:AC11.项目空间(project)是大数据计算服务(MaxCompute,原ODPS)的基本组织单元,它类似于传统数据库的Database,以下关于项目空间的说法中正确的有()。A、所有的对象都会属于某个项目空间B、一个帐号可以拥有多个项目空间的权限C、一个帐号可以创建多个项目空间,最多不能超过10个D、通过安全授权,可以在一个项目空间中访问另一个项目空间中的数据【正确答案】:ABD12.ADS中,同一个表组的表具有以下()相同的属性。A、二级List分区数B、一级hash分区数C、副本数D、纪录条数【正确答案】:BC13.ADS的普通表分区,支持()分区方式。A、ListB、IntervalC、HashD、Range【正确答案】:AC14.MaxCompute由以下()部分组成。A、客户端B、接入层C、逻辑层D、计算层【正确答案】:ABCD15.OTS以()形式组织数据。A、schemaB、表组C、表D、实例【正确答案】:CD16.DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效的数据同步。在DataX中可以通过配置文件来定义作业,配置文件的格式可以是:()。A、JSONB、YAMLC、XMLD、HTML【正确答案】:AB17.以下()属于ADS的特色功能。A、聚集列B、多值列C、空间列D、智能自动索引【正确答案】:ABD18.下列对流式计算的链路描述正确的是()。A、流计算全链路整体上更加强调数据的实时性B、链路包括数据实时采集、数据实时计算、数据实时集成C、一个流计算作业必须至少使用一个流数据作为源D、流计算将计算的结果数据支持写入目的数据【正确答案】:ABCD19.Dataworks的运维中心是日常运维的主要工具,可对已提交工作流或节点任务进行管理与维护,同时也可针对节点来添加监控报警。运维中心可以供多种角色使用,包括()。A、开发B、部署C、运维D、项目管理员【正确答案】:CD20.ADS的数据导入job提交后,可以通过以下()方法查询当前的导入状态。A、使用log命令:logB、使用命令:showstatusforC、使用SQL:selectstatefrominformation_schema.currentjobwherejob_idD、使用DMS,通过菜单项查看:导入导出【正确答案】:CD21.以下关于动态分区的描述正确的是()。A、动态分区插入时,动态分区列必须在select列表中B、在使用动态分区功能的SQL中,在分布式环境下,单个进程最多只能输出512个动态分区C、在现阶段,任意动态分区SQL不可以生成超过2000个动态分区D、动态生成的分区值可以为NULL【正确答案】:ABC22.关于Maxcompute中小文件的说法,正确的是()。A、在reduce计算过程或者实时tunnel数据采集过程,会产生大量小文件B、小文件越多,会造成浪费资源,影响整体的执行性能,并且影响磁盘空间的利用率C、目前提供两种可供选择的小文件合并的方法:ALTER合并模式和SQL合并模式D、大小小于盘古文件系统中的块BLOCK大小的文件,称之为小文件【正确答案】:AB23.关于Maxcompute中的admin角色,()说法是正确的。A、包含的权限只有owner可以调整B、可以修改项目空间的鉴权模型C、不能将admin权限指派给用户D、不能设定项目空间的安全配置【正确答案】:CD24.Maxcompute的某个带有Join的SQL运行效率很低,可以采取以下()措施来检验或者改善。A、检查连接键是否存在数据倾斜B、检查是否有多对多连接C、如小表关联大表,可以考虑使用mapjoin优化D、检查是否有笛卡尔积【正确答案】:AC25.对于Maxcompute项目空间的描述,正确的是()。A、一个用户可以拥有多个项目空间的权限B、所有的对象都会属于某个项目空间C、通过安全授权,可以在一个项目空间中访问另一个项目空间D、一个帐号可以创建多个项目空间,最多不能超过10个【正确答案】:ACD26.OTS费用从()维度计量。A、外网下行流量B、数据访问次数(万次)C、数据存储D、预留读写吞吐量【正确答案】:ACD27.ADS的数据导人job提交后,可以通过以下()方法查询当前的导入状态。A、使用log命令:logB、使用命令:showstatusforC、使用SQL:selectstatefrominformation_schema.current_jobwherejob_id=D、使用DMS,通过菜单项查看:导入导出=>导入状态【正确答案】:CD28.大数据开发套件Dataworks中,如果当前工作流/节点任务存在上游任务,则调度执行时,必须满足()等条件才可以调度执行。A、上游任务已经执行B、上游任务已经执行并返回成功C、自身定制时间已到或已过D、自身定制时间未到【正确答案】:BC29.对AnalyticDB描述正确的是()。AnalyticDB是分析型数据库B、AnalyticDB可以用于流式计算C、AnalyticDB支持SQL查询D、AnalyticDB的基本计算单元是ecu【正确答案】:ACD30.MaxCompute中用户认证(Authentication)的主要功能是检查请求(Request)发送者的真实身份。它一般包括:()。A、正确验证消息发送方的真实身份B、正确验证接收到的消息在途中是否被篡改C、正确验证用户状态,包括是否欠费等D、用户需要提取用户个性化信息时进行用户个性化认证【正确答案】:AB31.Maxcompute中,当一个大表和多个小表做连接时,可以考虑使用mapjoin,以下关于mapjoin的限制,说法正确的是()。A、leftouterjoin的左表必须是大表,innerjoin左表或者右表都可以为大表B、fullouterjoin不能使用mapjoinC、最多支持8张小表D、所有小表占用内存综合不能超过256M【正确答案】:AB32.使用用户管理控制台创建ADS时,需要提供ECU的()信息。A、存储B、数量C、类型D、vCPU【正确答案】:BC33.使用Maxcompute的客户端工具odpscmd时,()进入一个已有的项目。A、使用odpscmd登录时,通过-p参数,指定登录使用的项目空间B、如果账户下就一个project,登录后就会默认进入该项目C、配置文件中指定project_name,登录后即默认进入项目D、进入odpscmd后,执行use【正确答案】:CD34.下列操作符属于MaxComputeSQL位运算符的是()。A、&B、&&C、|D、||【正确答案】:AC35.以下()项包含在MaxCompute项目空间的鉴权模型中。A、SecurityConfigurationB、ProjectProtectionCheckPermissionUsingACLD、LabelSecurity【正确答案】:BCD36.DataWorks中,工作流任务支持的调度类型包括:()。A、一次性调度B、周期调度C、混合类型调度D、需要第三方工具用于支持调度【正确答案】:AB37.DataX是阿里集团发起的开源项目,是一种离线数据同步的工具,支持多种异构数据源之间的高效的数据同步。DataX支持的数据源包括()。A、关系型数据库:Mysql、SQLserver、OracleB、阿里云大数据分析处理MaxCompute、Hbase、阿里云分析型数据库(AnalyticDB,原ADS)C、半结构化数据存储:阿里云表格存储(TableStore,原OTS)D、非结构化数据存储:图片、视频【正确答案】:ABC38.以下()方法可以支持MaxCompute中受保护项目空间的数据流出。A、使用owner通过ACL授权B、使用owner通过policy授权C、设置例外(ExceptionPolicy)D、设置项目互信(TrustedProject)【正确答案】:CD39.MapReduce最早是由Google提出的分布式数据处理模型,随后受到了业内的广泛关注,并被大量应用到各种商业场景中。以下场景中,()适合用MapReduce来实现。A、交互式查询:基于海量数据的透视分析,用户可以通过上卷、下钻、切片等交互操作,了解数据集细节B、机器学习:监督学习、无监督学习、分类算法如决策树、SVM等C、文本统计分析:比如词频TFIDF分析;学术论文、专利文献的引用分析和统计;维基百科数据分析等D、Web访问日志分析;分析和挖掘用户在web上的访问、购物行为特征,分析用户访问行为【正确答案】:BCD40.在使用Maxcomputetunnel命令upload数据的时候,关于一些常见参数,说法正确的包括以下()项。A、-c本地数据文件编码,缺省为utf8B、-dfpDateTime类型数据格式,缺省为yyyyMMddHHmmssC、-cp指定是否在本地压缩后再上传,减少网络流量,缺省为trueD、-fd本地数据文件的列分隔符,缺省为逗号【正确答案】:ACD41.在ADS中,两个事实表进行join的充要条件包括以下()项。A、张表的hash分区数必须一致B、两个表在一个表组C、张表的joinkey至少有一列建立了hashmap索引D、两个表的joinkey是hash分区列【正确答案】:ABCD42.用大数据计算服务构建海量的数据仓库时,分区表是一种很常见的做法,对于分区表的描述正确的有()。A、支持hash分区、范围分区、列表分区及组合分区B、在通过SQL读取分区表中的数据时,可以通过指定分区的方法只读取一部分分组,减少IO开销C、可以单独处理指定分区中的数据,不会对其他分区数据产生影响D、对于过期的数据可以将对应的分区drop掉,不会影响其他分区中的数据【正确答案】:BCD43.DataWorks中任务的类型包括()。A、节点任务(nodetask)B、工作流任务(flowtask)C、内部节点(innernode)D、主控节点任务【正确答案】:ABC44.关于ADS多值列的说法正确的包括()。A、可以存入string类型的多个值,以逗号分隔B、可以直接在select中使用该列C、可以使用in,contains条件对该列的单个值进行查询D、不能在groupby中直接使用该列【正确答案】:ACD45.随着社会数据收集手段的不断丰富及完善,越来越多的行业数据被积累下来,数据规模已经增长到了传统软件行业无法承载的海量数据级别。大数据计算服务可以很多的利用存储和计算能力去处理、分析这些海量数据,发现价值。以下说法中正确的有()。A、大数据计算服务提供了高并发低延迟(毫秒级)的处理能力,对海量数据进行灵活分析B、大数据计算服务提供了高并发吞吐量上传下载工具,可以将外部数据源中的数据高效的同步到大数据计算服务中去C、大数据计算服务支持使用SQL或者MapReduce编程对海量数据进行处理D、大数据计算服务可以对海量数据进行基于复杂算法的分析,如聚类、分类、回归、主成分分析等。【正确答案】:BCD46.阿里云流计算可以直接读写下列()产品的数据。A、DataHubB、日志服务(SLS)C、RDSD、AnalyticDB【正确答案】:ABCD47.大数据计算服务(MaxCompute,原ODPS)中,使用CREATETABLELIKE语句创建新表时,原表的()属性会被复制到新表上。A、列注释B、分区C、表的生命周期属性D、表注释【正确答案】:ABD48.出于效率和成本的考虑,在使用MaxcomputeMR的时候,输入表最好应该只包含需要处理的字段,其余多余字段应该忽略。输入表wc_in包含10个字段,MR只对其中三个字段(c1,c2,c3)进行了处理,以下说法正确的是()。A、使用包com.aliyun.odps.data中的TableInfo类中的setCols()方法指定处理的列c1,c2,c3fromwc_in;同时调用MR的时候输入新表wc_in_newB、MR的输入为一个SQL查询:selectc1,c2,c3fromwc_in;C、重建一张表wc_in_new,只包含三个字段(c1,c2,c3),加载数据:insertintotablewc_in_newselectc1,c2,c3fromwc_in;同时调用MR的时候D、建一个视图v_wc_in,视图仅包括相应的三个字段:createviewv_wc_inselectc1,c2,c3fromwc_in;然后把视图v_wc_in作为MR的输入【正确答案】:CD49.对于ADS的特色功能,以下说法正确的是()。A、智能自动索引会自动为导入数据的每一列创建符合该列情况的索引类型,无需用户显式指定创建索引或索引类型B、聚集列能智能提升查询性能C、多值列支持in、contains等查询D、ADS采用高职能的基于规则的优化策略【正确答案】:ABC50.以下()大数据计算服务(MaxCompute,原ODPS)的SQL语句可以用户表user中找出用户名称username中包含’hu’的记录。A、select*fromuserwhereusernamerlike‘.*hu.*’B、select*fromuserwhereusernamelike‘%hu%’C、select*fromuserwhereusernamecontains(‘hu’)D、select*fromuserwhereusernamelike‘*hu*’【正确答案】:AB51.DRDS做平滑扩容的时候,现有的数据库中的表需要满足以下()要求。A、拆分表需要有主键B、拆分表需要删除主键C、单表需要做小表广播D、单表需有主键【正确答案】:AC52.下列关于流计算特点的描述中,正确的是()。A、实时且流式的B、数据是无界的C、事件触发D、用户触【正确答案】:ABC53.Maxcompute的自定义函数包括()类。A、自定义标量函数B、自定义聚合函数C、自定义表值函数D、自定义扩展函数【正确答案】:ABC54.大数据计算服务(MaxCompute,原ODPS)提供的是海量数据的存储和计算能力,和我们熟悉的关系型数据库存在较大的差别。以下说法中正确的是()。A、不支持事务B、不支持deleteC、不支持索引D、不支持压缩【正确答案】:ABC55.以下()情况不适合使用ODPSmapjoin。A、or连接关联条件B、关联表中有临时表C、两个表无条件关联D、两个大表关联【正确答案】:BCD56.大数据计算服务(MaxCompute,原ODPS)中的授权是指把某些对象的某些权限赋给一些指定的用户,必须包括以下()要素。A、操作(Action,比如读、写等)B、效果(Effect,比如同意、拒绝等)C、主体(Subject,可以是用户、角色等)D、客体(Object,可以是表、资源等)【正确答案】:ACD57.对于ADS的索引说法正确的是()。A、一个列可以设置列属性disableIndex=true,用于屏蔽ADS的默认列索引B、ADS弱化了索引的概念,用户无需亲自为自己的数据表配置索引C、ADS拥有高度智能的自动化索引机制,会搜集相关信息,去自动创建索引D、用户需要对某列进行hashJoin时,无论是事实表之间的join还是事实表和维度表的join,都需要考虑手工处理索引问题。【正确答案】:ABC58.MaxCompute授权操作一般涉及到以下几个要素:()。A、主体(Subject)B、客体(Object)C、操作(Action)D、选项(Option)【正确答案】:ABC59.Dataworks中,调度任务每次运行前都先将任务实例化,即生成实例,调度运行时实际上在执行相应的实例。周期性调度任务每天自动调度的实例都是在当天23:30开始生成的,以下说法正确的是()。A、任务task1是按天调度的周期性调度任务,2016年4月9日23点00分,把task1的定时时间从原来零点整改成8点30分,4月10日,task1的实例定时时间为8点30分B、任务task1是任务task2的上游任务,2016年4月9日11点30分,把task2的上游任务换成task3,当天task2的自动调度实例依赖的还是task1的实例C、2016年4月9日11点30分新增的按天调度的周期性调度任务,当天可以自动调度运行D、2016年4月9日11点30分新增的按天调度的周期性调度任务,4月10日可以自动调度运行【正确答案】:ABD60.大数据常见的计算方式有三种:离线计算(比如大数据计算服务提供的MR、SQL等)、流计算(阿里云的流计算StreamCompute)以及在线计算(分析型数据库AnalyticDB),关于这几种计算方式的说法正确的有()。A、流计算可以应用于实时数值统计、实时事件预警等领域B、离线计算的数据更新以定期的批量更新为主C、流计算是消息驱动的,数据更新一般是定时更新D、在线计算一般在用户发起请求时(比如查询)发生【正确答案】:ACD61.Dataworks中,调度系统提供了一些常用的时间参数,周期性调度任务使用这些参数后,在调度运行时参数会自动赋值为具体的时间,以下()参数是调度系统内置时间参数。A、${yyyymmdd}B、${date}C、${yyyy-mm-dd}D、${bdp.system.cyctime}【正确答案】:BD62.大数据计算服务(MaxCompute,原ODPS)中的MapReduce是一种编程模型,用于大规模数据集的并行运算,它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。其中,两个主要阶段Map和Reduce相互配合,可以完成对海量数据的处理。关于这两个阶段的关系,说法正确的有()。A、一个reduce的输入数据可能来自于多个map的输出B、一个MR处理可以不包括任何mapC、一个MR处理可以不包括任何reduceD、一个map的输出结果可能会被分配到多个reduce上去【正确答案】:ACD63.MapReduce本身源自于函数式语言,主要通过Map(映射)和Reduce(化简)这两个步骤来并行处理大规模的数据集。以下关于MR的优点,说法正确的有()。A、能处理大规模数据B、将很多分布式的细节隐藏,极大的简化了开发工作C、伸缩性好,易于扩展,即增加服务器到当前集群比较简单D、适应实时应用的需求【正确答案】:ABC64.OTS写操作具有以下特性()。A、原子性B、强一致性C、最终一致性D、事务一致性【正确答案】:AB65.大数据计算服务表fact_sale_detail的建表语句如下:createtablefact_sale_detail(sale_datedatetime,regionstring,amtdecimal)partitionedby(dtstring);包括dt=’20160229’,dt=’20160301’,dt=’20160302’,dt=’20160303’共四天的数据,每个分区中只包含当天的销售数据。Udf_substr为自定义的数据(UDF),功能和substr相同但是性能更好。现在想要统计3月份的按天销售汇总金额,以下()方式经过分区剪裁后只需要付3个分区的数据久可以完成计算。A、selectdt,sum(amt)fromfact_sale_detailwheredtlike‘201603%’groupbydt;B、selectdt,sum(amt)fromfact_sale_detailwheresubstr(dt,1,6)=‘201603’groupbydt;C、selectdt,sum(amt)fromfact_sale_detailwheredtin(‘20160301’,’20160302’,’20160303’)groupbydt;D、selectdt,sum(amt)from_sale_detaolwhereudf_substr(dt,1,6)=’201603’groupbydt;【正确答案】:ABCD66.以下场景中,适合使用MaxCompute解决的是()。A、电子商务网站的在线交易B、PB级离线曰志分析C、基于海量数据的用户特征和兴趣挖掘D、大型互联网企业的数据仓库和BI分析【正确答案】:BCD67.在大数据计算服务(MaxCompute,原ODPS)SQL中可以用逻辑运算连接多个条件,以下逻辑运算结果正确的有()。A、TrueorNULL=TrueB、FalseORFalse=FalseC、TrueANDFalse=FalseD、TrueANDTrue=True【正确答案】:ABCD68.以下()是MaxcomputeSQL的优点。A、相对于使用API或者SDK编程,MaxcomputeSQL的学习成本较低B、可将其他数据库中的SQL语句迁移到Maxcompute上来,无需修改或者重新开发C、提供了丰富的内置函数D、用户不需要了解分布式概念【正确答案】:ACD69.在使用DataWorks进行数据同步时,会因为数据质量问题,导致部分纪录无法从源表同步至目标表中去。任务Task1是从云数据库RDS(MySQL)表同步至大数据计算服务(MaxCompute,原ODPS)表中,可以通过设置以下()进行容错控制。A、设置“当出错的记录数超过”的值,即最大容错纪录条数B、设置作业速率上限C、设置切分键D、设置“错误百分比达到”的值,即最大容错纪录条数占总条数的比例【正确答案】:AD70.对于大数据计算服务(MaxCompute,原ODPS)内置绝对值函数abs描述正确的有()。A、当输入参数是bigint时,返回值是bigint类型B、当输入参数是string类型时,一定会导致异常C、输入类型是boolean则返回值是TrueD、当输入参数是double时,返回值是double类型【正确答案】:AD71.OTS的特点非常适合用来存储元数据,和使用RDS作为元数据管理工具相比,OTS具有以下()优点。A、支持更大的单表规模,可以超过百TBB、更易扩展,理论上无限容量C、更高并发量,十万级别QPSD、更高的可用性,可达99.9%【正确答案】:ABCD72.MaxCompute提供的Graph功能是一套面向迭代的图计算处理框架。图计算作业使用图进行建模。下列()属于常见的图计算的应用。A、PageRankB、二分图匹配BiPartiteMatchiingC、单源最短距离法D、K-means【正确答案】:ABCD73.为了保证应用获得可预期的性能,需要设置OTS表的()。A、预留存储空间B、预留处理内存C、预留写吞吐量D、预留读吞吐量【正确答案】:CD74.关于Maxcompute中tunnelupload的分隔符,说法正确的是()。A、列分隔符不能包含行分隔符B、支持多个字符的行列分隔符C、转义字符分隔符,在命令行方式下在只支持\r、\n和\tD、缺省为空格【正确答案】:BC75.大数据计算服务(MaxCompute,原ODPS)中,在做web日志分析时如果发现日志内容(对应字段log_content)中有“select'字符串,则有可能是恶意的SQL注入攻击,可以使用从日志表log中找出所有符合这种特征的访问()。A、select*fromlogwheretolower(log_content)like"%select%';B、select*fromlogwhereinstr(tolower(log_content,'elect')C、select*fromlogwhere'select'intolower(log_content);D、select*fromlogwhereregexp_instr(tolower(log_c
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 4000吨年无机碘化物生产项目可行性研究报告写作模板-申批备案
- 2025年全球及中国3-氨基苯磺酸行业头部企业市场占有率及排名调研报告
- 2025-2030全球噪声缓解系统行业调研及趋势分析报告
- 2025年全球及中国膀胱冲洗器行业头部企业市场占有率及排名调研报告
- 2025-2030全球多层双向穿梭车行业调研及趋势分析报告
- 2025-2030全球斗提机畚斗行业调研及趋势分析报告
- 2025-2030全球汽车双面胶带行业调研及趋势分析报告
- 2025-2030全球单立柱电动堆垛机行业调研及趋势分析报告
- 2025-2030全球柔印机网纹辊行业调研及趋势分析报告
- 2025-2030全球3-溴-4-氟苯甲酸行业调研及趋势分析报告
- Unit 7 第3课时 Section A (Grammar Focus -4c)(导学案)-【上好课】2022-2023学年八年级英语下册同步备课系列(人教新目标Go For It!)
- 2025年上半年长沙市公安局招考警务辅助人员(500名)易考易错模拟试题(共500题)试卷后附参考答案
- 2025河北邯郸世纪建设投资集团招聘专业技术人才30人高频重点提升(共500题)附带答案详解
- 慈溪高一期末数学试卷
- 《基于新课程标准的初中数学课堂教学评价研究》
- 贵州省黔东南州2024年七年级上学期数学期末考试试卷【附答案】
- 医院廉洁自律承诺书
- 胚胎移植术前术后护理
- 企业招聘技巧培训
- 学校校本课程《英文电影鉴赏》文本
- 华为HCSA-Presales-IT售前认证备考试题及答案
评论
0/150
提交评论