大数据建模练习(习题卷3)_第1页
大数据建模练习(习题卷3)_第2页
大数据建模练习(习题卷3)_第3页
大数据建模练习(习题卷3)_第4页
大数据建模练习(习题卷3)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:大数据建模练习大数据建模练习(习题卷3)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据建模练习第1部分:单项选择题,共39题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.过滤算子可以配置不同的条件,模糊匹配,筛选出任意位置没有输入字符的记录的条件是A)包含B)不包含C)在列表中D)等于答案:B解析:[单选题]2.过滤算子可以配置不同的条件,其中同时输入多个精确的值,用空格作为分隔符,可以实现批量精确排除的条件是A)不在列表中B)长度不等于C)在列表中D)开始以答案:A解析:[单选题]3.如果Python程序执行时,产生了?unexpectedindent?的错误,其原因是:A)代码中使用了错误的关键字B)代码中缺少?:?符号C)代码里的语句嵌套层次太多D)代码中出现了缩进不匹配的问题答案:D解析:[单选题]4.数据建模过程常经常用来比喻成做菜的过程,设定目标,准备好食材按一定流程进行加工处理,最终生成一道菜。这里提到的食材,比喻成建模的哪个要素?A)建模平台B)数据C)算法/算子D)流程答案:B解析:[单选题]5.以下哪项属于DDL操作()A)updateB)createC)insertD)delete答案:B解析:[单选题]6.在黑盒测试方法中,设计测试用例的主要根据是A)程序流程图B)程序内部逻辑C)程序外部功能D)程序数据结构答案:C解析:[单选题]7.组合多条SQL查询语句形成组合查询的操作符是()A)SELECTB)ALLC)LINKD)UNION答案:D解析:[单选题]8.以下哪项不属于DML操作()A)insertB)updateC)deleteD)create答案:D解析:[单选题]9.学生关系模式S(S#,Sname,Sex,Age),S的属性分别表示学生的学号、姓名、性别、年龄。要在表S中删除一个属性?年龄?,可选用的SQL语句是()。A)UPDATESAgeB)DELETEAgefromSC)ALTERTABLES?Age?D)ALTERTABLESDROPAge答案:D解析:[单选题]10.在视图上不能完成的操作是()A)查询B)在视图上定义新的视图C)更新视图D)在视图上定义新的表答案:D解析:[单选题]11.SELECT语句的完整语法较复杂,但至少包括的部分是()A)仅SELECTB)SELECT,FROMC)SELECT,GROUPD)SELECT,INTO答案:B解析:[单选题]12.根据需求做完数据分析后需要对数据进行标签标记,以下不能实现该需求的是A)缺失值处理B)添加字段C)字段值替换D)值映射答案:A解析:[单选题]13.关于数据组织的维度描述正确的是A)二维数据由对等关系的有序或无序数据构成B)高维数据由关联关系数据构成C)CSV是一维数据D)一维数据采用线性方式存储答案:D解析:[单选题]14.以下聚合函数求数据总和的是()A)MAXB)SUMC)COUNTD)AVG答案:B解析:[单选题]15.DECIMAL是()数据类型A)可变精度浮点值B)整数值C)双精度浮点值D)单精度浮点值答案:A解析:[单选题]16.下面哪个属于映射数据到新的空间的方法?A)傅立叶变换B)特征加权C)渐进抽样D)维归约答案:A解析:[单选题]17.主键的建立有()种方法A)一B)四C)二D)三答案:D解析:[单选题]18.在搭建同住人员模型时,在住宿信息表中,入住时间字段都是日期时间类型,需要计算同住宿人前后入住的时间差,可以使用列计算算子实现。前提是需要先将入住时间的字段类型进行转换成那种类型才能计算时间差。A)字符串型B)时间日期型C)数值型D)文本型答案:C解析:[单选题]19.对比分析,当统计项(度量)差异较大时,如亿级数据与百分比数据,选中那类图表比较合适?()A)柱状图B)条形图C)折线图D)双轴图答案:D解析:[单选题]20.视图是一种常用的数据对象,它是提供()和()数据的另一种途径,可以简化数据库操作A)插入,更新B)查看,检索C)查看,存放D)检索,插入答案:C解析:[单选题]21.已知数据中时间字段的格式为2021-01-0100:00:00,如果使用过滤算子,过滤出2021年5月1日以来的数据,以下哪个是正确的设置A)大于2021-05-0100:00:00B)小于2021-05-0100:00:00C)大于等于2021-05-0100:00:00D)小于等于2021-05-0100:00:00答案:C解析:[单选题]22.天算建模平台数据集市支持多种数据分类,可以对接大数据平台推送的数据、民警自己的个人数据、建模运行结果数据以及对接警种业务库。以下数据资源是所有账号都默认可以看到的。A)数据资源目录B)个人数据C)模型结果数据D)警种业务数据答案:A解析:[单选题]23.SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体,其中,CREATE、DROP、ALTER语句是实现哪种功能()A)数据操纵B)数据控制C)数据定义D)数据查询答案:C解析:[单选题]24.删除经销商1018的数据记录的代码为()fromdistributorswheredistri_num=1018A)droptableB)delete*C)dropcolumnD)delete答案:D解析:[单选题]25.在制作图表时,为了实现在单个图表中的穿透,可以通过增加()实现A)图层B)筛选器C)维度D)度量答案:A解析:[单选题]26.在select语句中,实现选择操作的子句是()A)selectB)groupbyC)whereD)from答案:C解析:[单选题]27.在建模过程中需要获取前科人员的铁路行程情况,可将前科人员数据表与铁路订票数据表进行()操作实现。A)交集B)并集C)差集D)自连接答案:A解析:[单选题]28.用Pyinstall工具把Python源文件打包成一个独立的可执行文件,使用的参数是:A)-DB)-LC)-iD)-F答案:D解析:[单选题]29.正则表达式的转义符是()A)\\B)\C);D)$$答案:A解析:[单选题]30.若用如下的SQL语句创建了一个表SC:()CREATETABLESC(S#CHAR(6)NOTNULL,C#CHAR(3)NOTNULL,SCOREINTEGER,NOTECHAR(20));向SC表插入如下行时,()行可以被插入。A)(NULL,?103?,80,?选修?)B)(?200823?,?101?,NULL,NULL)C)(?201132?,NULL,86,??)D)(?201009?,?111?,60,必修)答案:B解析:[单选题]31.向数据表中插入一条记录用以下哪一项()A)CREATEB)INSERTC)SAVED)UPDATE答案:B解析:[单选题]32.以下关于turtle库的描述,正确的是:A)在importturtle之后就可以用circle()语句,来画一个圆圈B)要用fromturtleimportturtle来导入所有的库函数C)home()函数设置当前画笔位置到原点,朝向东D)seth(x)是setheading(x)函数的别名,让画笔向前移动x答案:C解析:[单选题]33.在视图上不能完成的操作是()A)更新视图数据B)在视图上定义新的基本表C)在视图上定义新的视图D)查询答案:B解析:[单选题]34.请问,()是?按照数据结构来组织、存储和管理数据的仓库?,是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。A)数据表B)数据沼泽C)数据中台D)数据库答案:D解析:[单选题]35.某二叉树共有12个结点,其中叶子结点只有1个。则该二叉树的深度为(根结点在第1层)___________。A)8B)12C)6D)3答案:B解析:[单选题]36.以下聚合函数求个数的是()A)AVGB)SUMC)MAXD)COUNT答案:D解析:[单选题]37.存储过程是一组预先定义并()的Transact-SQL语句A)保存B)编写C)编译D)解释答案:C解析:第2部分:多项选择题,共27题,每题至少两个正确答案,多选或少选均不得分。[多选题]38.下列说法正确的是()A)在MySQL中,不允许有空表存在,即一张数据表中不允许没有字段。B)在MySQL中,对于存放在服务器上的数据库,用户可以通过任何客户端进行访问。C)数据表的结构中包含字段名、类型、长度、记录。D)字符型数据其常量标志是单引号和双引号,且两种符号可以混用。答案:AB解析:[多选题]39.HDFS是一种用于Hadoop应用程序的主存储系统,也是一个高容错性系统,适合部署在廉价机上,同时,HDFS能提高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS主要适合做什么?A)存储并管理PB级数据B)处理非结构化数据C)处理高吞吐量数据D)需要对文件的修改答案:ABC解析:[多选题]40.以下哪些不是常见的时间序列算法模型?()A)RSIB)MACDC)ARMAD)KDJ答案:ABD解析:[多选题]41.在天算建模平台中,当数据资源目录、公共资源数据资源无法满足建模情况时,可以使用?个人数据?功能,将自己的文件导入/接入到平台中,为建模使用。以下哪些文件类型是目前平台支持的格式。A)docB)txtC)csvD)excel答案:BCD解析:[多选题]42.文本挖掘的工具有()A)SPPTextMiningB)IBMDB2intelligentMinerC)SASTextMinerD)SPSSTextMining答案:BCD解析:[多选题]43.输出值是数值(scalar)类型的机器学习模型有()A)regressioB)简单线性回C)多重线性回归D)对数回归答案:ABC解析:[多选题]44.与传统的分布式程序设计相比,Mapreduce封装了()等细节,还提供了一个简单而强大的接口A)并行处理B)容错处理C)本地化计算D)负载均衡答案:ABCD解析:[多选题]45.在疫情防控阶段,经常通过建模来分析对象的通行和同住行为。现要对旅客住宿数据表进行建模,找出同住人员,可能需要用到以下哪些字段A)入住时间B)场所编码C)房间号D)证件号码答案:ABCD解析:[多选题]46.以下属于分类器评价或比较尺度的有:()A)预测准确度B)召回率C)模型描述的简洁度D)计算复杂度答案:ACD解析:[多选题]47.数据预处理方法主要有()A)数据清洗B)数据集成C)数据变换D)数据归约答案:ABCD解析:[多选题]48.数据库信息的运行安全采取的主措施有()。A)备份与恢复B)应急C)风险分析D)审计跟踪答案:ABCD解析:[多选题]49.在挖掘人员异常住宿行为时经常会过滤出异常时段入住记录,表中的时间字段格式为?yyyy-MM-ddHH:mm:ss,哪些算子可以实现小时的提取A)添加字段B)时间处理C)聚合D)无效数据过滤答案:AB解析:[多选题]50.当不知道数据所带标签时,下面哪些技术不能促使带同类标签的数据与带其他标签的数据相分离?()A)分类B)聚类C)关联分析D)隐马尔可夫链答案:ACD解析:[多选题]51.下列哪些数据是字符型数据。()A)中国B)?1+2?C)?can?t?D)?张三-李四?答案:BCD解析:[多选题]52.关于主键下列说法正确的是()A)可以是表中的一个字段,B)是确定数据库中的表的记录的唯一标识字段,C)该字段不可为空也不可以重复D)可以是表中的多个字段组成的。答案:ABCD解析:[多选题]53.下列不属于无监督学习的是:()A)kmeansB)svmC)最大熵D)crf答案:BCD解析:[多选题]54.基于二次准则函数的H-K算法较之于感知器算法的优点是()?A)计算量小B)可以判别问题是否线性可分C)其解完全适用于非线性可分的情况D)其解的适应性更好答案:BD解析:[多选题]55.VMware是一个虚拟PC的软件,可以在现有的操作系统上虚拟出一个新的硬件环境,相当于模拟出一台新的PC,以此来实现在一台机器上真正同时运行两个独立的操作系统。Vmware网络配置方式主要有?A)host-onlyB)natC)桥接D)链接答案:ABC解析:[多选题]56.现在需要对2020年、2021年两年的人口数据进行分析。已知目前上传了一份2020年数据到天算建模平台,需要再上传2021年的数据表,可以如何操作。A)删除2020年数据表,再上传2021年数据表B)直接上传2021年数据,再与2020年表进行合并C)追加导入D)平台不支持答案:BC解析:[多选题]57.下面对union的描述不正确的是()A)union只连接结果集完全一样的查询语句B)union可以连接结果集中数据类型个数相同的多个结果集C)union是筛选关键词,对结果集再进行操作D)任何查询语句都可以用union来连接答案:ACD解析:[多选题]58.对某个数据库进行筛选后,()。A)可以选出符合某些条件组合的记录B)不能选择出符合条件组合的记录C)可以选出符合某些条件的记录D)只能选择出符合某一条件的记录答案:AC解析:[多选题]59.簇状柱形图以二维柱形显示值。三维簇状柱形图以三维格式显示柱形,但是不使用第三个数值轴(竖坐标轴)。在有表示以下内容的类别时使用此图表:A)相等时间间隔(如月、季度或会计年度)下数据的趋势B)数值范围(例如项目计数)C)特定范围安排(例如,包含?完全同意?、?同意?、?中立?、?不同意?、?完全不同意?等条目的Likert范围)D)不采用任何特定顺序的名称(例如项目名称、地理名称或人名)答案:BCD解析:[多选题]60.您需要显示从2009年1月1日到2009年12月31日雇佣的所有职员的姓名和雇佣日期。职员信息表tblEmployees包含列Name和列HireDate,下面哪些语句能完成该功能()A)SELECTName,HireDateFROMtblEmployeesB)SELECTName,HireDateFROMtblEmployeesWHEREHireDate=?2009-01-01?OR?2009-12-31?C)SELECTName,HireDateFROMtblEmployeesWHEREHireDateBETWEEN?2008-12-31?AND?2010-01-01?D)SELECTName,HireDateFROMtblEmployeesWHEREsubstring(HireDate,1,4)=2009;答案:CD解析:[多选题]61.如果在线性回归模型中增加一个特征变量,下列可能发生的是()?A)R-squared增大,AdjustR-squared增大B)R-squared增大,AdjustR-squared减小C)R-squared减小,AdjustR-squared减小D)R-squared减小,AdjustR-squared增大答案:AB解析:[多选题]62.CNN能应用于playingGo的原因描述正确的是?A)第一层hiddenlayer用于检测图像的pattern,而大部分patter通常比整张图像的大小要小,对于一个neuron来说不用去看整张图像来检测patternB)同样pattern可能出现在图像的不同区域,而这些pattern代表同样的含义,可以共用同一个neuron同一组参数C)一幅图像可以做subsampling来减少图片的大小,从而减少参数D)对图片像素点进行行列抽取答案:AB解析:[多选题]63.观察样本次数如何影响过拟合()?注意:所有情况的参数都保持一致。A)观察次数少,容易发生过拟合B)观察次数少,不容易发生过拟合C)观察次数多,容易发生过拟合D)观察次数多,不容易发生过拟合答案:AD解析:[多选题]64.以下各项均是针对数据仓库的不同说法,你认为正确的有()A)数据仓库就是数据库B)数据仓库是一切商业智能系统的基础C)数据仓库是面向业务的,支持联机事务处理(OLTP)D)数据仓库支持决策而非事务处理E)数据仓库的主要目标就是帮助分析,做长期性的战略制定答案:BCDE解析:第3部分:判断题,共21题,请判断题目是否正确。[判断题]65.()!=和<>都代表不等于。A)正确B)错误答案:对解析:[判断题]66.从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法A)正确B)错误答案:错解析:[判断题]67.尽管可以使用import语句一次导入任意多个标准库或扩展库,但是仍建议每次只导入一个标准库或扩展库A)正确B)错误答案:对解析:[判断题]68.对于PCA处理后的特征,其朴素贝叶斯特征相互独立的假设一定成立,因为所有主成分都是正交的,所以不相关A)正确B)错误答案:错解析:[判断题]69.利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数A)正确B)错误答案:对解析:[判断题]70.()ALTERTABLE语句可以修改表中各列的先后顺序。A)正确B)错误答案:对解析:[判断题]71.()NULL和Null都代表空值。A)正确B)错误答案:对解析:[判断题]72.()UPDATE语句修改的是表中数据行中的数据,也可以修改表的结构。A)正确B)错误答案:错解析:[判断题]73.对数损失度量函数可以取负值A)正确B)错误答案:错解析:[判断题]74.()createtable语句中有定义主键的选项。A)正确B)错误答案:对解析:[判断题]75.对于大量列表的连接,extend()方法比运算符+具有更高的效率A)正确B)错误答案:对解析:[判断题]76.()用union上下连接的各个select都可以带有自己的orderby子句。A)正确B)错误答案:错解析:[判断题]77.假设re模块已成功导入,并且有pattern=pile('^'+'\.'.join([r'\d{1,3}'foriinrange(4)])+'$'),那么表达式pattern.match('03')的值为NoneA)正确B)错误答案:错解析:[判断题]78.数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。A)正确B)错误答案:对解析:[判断题]79.Python不允许使用关键字作为变量名,允许使用内置函数名作为变量名,但这会改变函数名的含义A)正确B)错误答案:对解析:[判断题]80.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则A)正确B)错误答案:错解析:[判断题]81.使用del命令或者列表对象的remove()方法删除列表中元素时会影响列表中部分元素的索引A)正确B)错误答案:对解析:[判断题]82.分类和回归都可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值A)正确B)错误答案:对解析:[判断题]83.文件对象的tell()方法用来返回文件指针的当前位置A)正确B)错误答案:对解析:[判断题]84.数据的前期调研是大数据治理很核心的一项前置工作,但是并不会影响后面的数据治理进度、是否返工、以及治理成效问题,根据相关的要求做好调研工作即可。A)正确B)错误答案:错解析:[判断题]85.BI工具不能实现行级数据权限()A)正确B)错误答案:错解析:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论