大数据建模练习(习题卷2)_第1页
大数据建模练习(习题卷2)_第2页
大数据建模练习(习题卷2)_第3页
大数据建模练习(习题卷2)_第4页
大数据建模练习(习题卷2)_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:大数据建模练习大数据建模练习(习题卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据建模练习第1部分:单项选择题,共134题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.在pandas中以下哪个方法用于向csv文件中实现写入工作?A)to_csv()B)read_csv()C)to_excel()答案:A解析:[单选题]2.在NumPy模块中,以下哪个函数不是算数函数?A)subtract()B)hypot()C)divide()答案:B解析:[单选题]3.执行如下代码importturtleastforiinrange(1,5):t.fd(50)t.left(90)在PythonTurtleGraphics中,绘制的是A)三角形B)正方形C)五边形D)五角星答案:B解析:[单选题]4.SQL语言的数据操纵语句包括SELECT、INSERT、UPDATE、DELETE等。其中最重要的,也是使用最频繁的语句是()。A)UPDATEB)SELECTC)DELETED)INSERT答案:B解析:[单选题]5.以某一图表中的项为单位对关联图表进行数据筛选,建立图表间联动关系的功能是?()A)全局筛选B)计量单位C)图表联动D)数据凸显答案:C解析:[单选题]6.条件年龄BETWEEN15AND35表示年龄在15至35之间,且()A)不包括15岁和35岁B)包括15岁但不包括35岁C)包括15岁和35岁D)包括35岁但不包括15岁答案:C解析:[单选题]7.以下哪项用来分组()A)ORDERBYB)ORDEREDBYC)GROUPBYD)GROUPEDBY答案:D解析:[单选题]8.数据库设计中,反映用户对数据要求的模式是A)内模式B)外模式C)设计模式D)概念模式答案:B解析:[单选题]9.主键的建立有()种方法A)一B)四C)二D)三答案:D解析:[单选题]10.以下哪项不属于DML操作()A)insertB)updateC)deleteD)create答案:D解析:[单选题]11.在Excel中,动态按钮可以实现对不同类型数据的选择性展示。图示为一种动态按钮。插入如图动态按钮,需要用到的工具为:A)复选框B)框C)切片器D)图表答案:C解析:[单选题]12.多用于展示两地点间数据流转(如迁徙)的图表是?()A)地图(面积)B)地图(气泡)C)地图(迁徙)D)地图答案:C解析:[单选题]13.BI工具中图表创建的常规步骤下述描述正确的是?()A)选择数据集-拖拽设置维度度量-选择图表-图表详细设置B)拖拽设置维度度量-选择数据集-选择图表-图表详细设置C)拖拽设置维度度量-选择图表-图表详细设置-选择数据集D)选择数据集-选择图表-拖拽设置维度度量-图表详细设置答案:A解析:[单选题]14.SQL语句中的条件用以下哪一项来表达()A)THENB)WHILEC)WHERED)IF答案:C解析:[单选题]15.()的工作内容是先收集初始数据,然后进行熟悉数据的各种活动,包括识别数据的质量问题,找到对数据的基本观察,或假设隐含的信息来检测出感兴趣的数据子集A)数据理解B)业务理解C)数据预处理D)建模答案:A解析:[单选题]16.完全不考虑程序的内部结构和内部特征,而只是根据程序功能导出测试用例的测试方法是A)错误推测法B)白箱测试法C)黑箱测试法D)安装测试法答案:C解析:[单选题]17.组合多条SQL查询语句形成组合查询的操作符是()A)SELECTB)ALLC)LINKD)UNION答案:D解析:[单选题]18.以下选项中,不是Python语言保留字的是:A)whileB)exceptC)doD)pass答案:C解析:[单选题]19.以下哪个是用来描述数据属性信息的数据,其使用目的在于识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效管理大量网络化数据。A)字段B)数据元C)元数据D)数值答案:C解析:[单选题]20.创建数据库使用以下哪项()A)createmytestB)createtablemytestC)databasemytestD)createdatabasemytest答案:D解析:[单选题]21.下面代码的输出结果是:forsin"HelloWorld":ifs=="W":continueprint(s,end="")A)HelloorldB)HelloC)WorldD)HelloWorld答案:A解析:[单选题]22.SQL是一种()语言。A)函数型B)高级算法C)关系数据库D)人工智能答案:C解析:[单选题]23.同时去掉字符串左边和右边空格的函数是:A)center()B)fomat()C)strip()D)count()答案:C解析:[单选题]24.当前现有的算子不满足实际使用需求时,可以直接使用自定义SQL算子来编写SQL语句,实现模型分析需要。比如需要查找相邻两条记录并拼接成一条数据,主要用到的函数是A)substr_indexB)splitC)lag…overD)rank…over答案:C解析:[单选题]25.以下关于文件的描述错误的选项是:A)readlines()函数读入文件内容后返回一个列表,元素划分依据是文本文件中的换行符B)read()一次性读入文本文件的全部内容后,返回一个字符串C)readline()函数读入文本文件的一行,返回一个字符串D)二进制文件和文本文件都是可以用文本编辑器编辑的文件答案:D解析:[单选题]26.数据透视表是汇总、分析、浏览和呈现汇总数据的方法。若要向数据透视表中添加字段,请在?数据透视表字段?窗格中选中字段名称()A)复选框B)工作表C)公式D)单元格答案:A解析:[单选题]27.在建模过程中常有这些情景,把某一字符串映射到数值,进而进行数值运算;或者把数值映射到字符串,进行字符串运算;或者用于对某个字段的数据打标签等情景。请问使用天算建模平台中哪个算子可以实现。A)列计算B)添加字段C)类型转换D)值映射答案:D解析:[单选题]28.SQL语言中,删除一个视图的命令是()A)REMOVEB)CLEARC)DELETED)DROP答案:D解析:[单选题]29.创建数据透视表的步骤有:①选择数据透视表放置位置;②选择要分析的数据;③选择要添加到报表的字段。下列选项中,对创建数据透视表步骤排序正确的是:A)①②③B)①③②C)②①③D)③①②答案:C解析:[单选题]30.输出算子可以将相应模型结果输出,以下关于输出算子描述不正确的是A)可以输出到外部数据库中B)可以同步在模型结果数据C)输出的路径只能是内置的,不能新增D)模型结果数据输出的结果数据量是跟着原模型输出的数据量更改的答案:C解析:[单选题]31.疫情管控模型中,利用确诊人员表的?身份证?字段和航班信息表中的?身份证?字段进行()操作,可以获得确诊人员乘坐航班情况。A)聚合B)自连接C)交集D)差集答案:C解析:[单选题]32.Oracle返回字符串长度的函数是()A)len()B)length()C)left()D)long()答案:B解析:[单选题]33.以下删除记录正确的()A)deletefromempwherename='dony';B)Delete*fromempwherename='dony';C)Dropfromempwherename='dony';D)Drop*fromempwherename='dony';答案:A解析:[单选题]34.返回多个值的Excel公式(也称为数组)都会将结果返回给相邻单元格。这种行为称为?溢出?。任何有可能返回多个结果的公式都可以称为()公式。A)静态数据B)动态数据C)静态数组D)动态数组答案:D解析:[单选题]35.假设有命令importnumpyasnpArray1=np.linspace(1,5,3,dtype=int)print(Array1)则,执行结果是A)[135]B)[125]C)[1.3.5.]D)[1.2.5.]答案:A解析:[单选题]36.关于赋值语句,以下选项中描述错误的是:A)赋值语句采用符号?=?表示B)赋值与二元操作符可以组合,例如&=C)a,b=b,a可以实现a和b值的互换D)a,b,c=b,e,a是不合法的答案:C解析:[单选题]37.以下关于异常处理的描述,正确的是:A)Python中允许利用raise语句由程序主动引发异常B)try语句中有except子句就不能有finally子句C)Python中,可以用异常处理捕获程序中的所有错误D)引发一个不存在索引的列表元素会引发NameError错误答案:A解析:[单选题]38.OLAM技术一般简称为?数据联机分析挖掘?,下面说法正确的是:A)OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性B)由于OLAM的立方体和用于OLAP的立方体有本质的区别C)基于WEB的OLAM是WEB技术与OLAM技术的结合D)OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作答案:D解析:[单选题]39.运行以下程序,输出结果的是:str1="NanjingUniversity"str2=str1[:7]+"Normal"+str1[-10:]<o:p></o:p>print(str2)A)NormalUB)NanjingNormalC)NormalUniversityD)NanjingNormalUniversity答案:A解析:[单选题]40.从数据表中查找记录用以下哪一项()A)UPDATEB)FINDC)SELECTD)CREATE答案:C解析:[单选题]41.以下关于随机运算函数库的描述,错误的是:A)random库里提供的不同类型的随机数函数是基于random.random()函数扩展的B)伪随机数是计算机按一定算法产生的,可预见的数,所以是?伪?随机数C)Python内置的random库主要用于产生各种伪随机数序列D)uniform(a,b)产生一个a到b之间的随机整数答案:D解析:[单选题]42.以下属于PythonHTML和XML解析的第三方库的是:A)DjangoB)NetworkxC)RequestsD)BeautifulSoup答案:D解析:[单选题]43.如需在出入境表中,筛选18岁以上的男性。其中的筛选条件之间的关系应该为A)与B)或C)与和或D)与或或答案:A解析:[单选题]44.DECIMAL是()数据类型A)可变精度浮点值B)整数值C)双精度浮点值D)单精度浮点值答案:A解析:[单选题]45.在select语句中,实现选择操作的子句是()A)selectB)groupbyC)whereD)from答案:C解析:[单选题]46.数据库管理系统,通常称为(),是数据库系统的核心组成部分,主要完成对数据库的操作与管理功能,实现数据库对象的创建、数据库存储数据的查询、添加、修改与删除操作和数据库的用户管理、权限管理等。A)DBAB)DBMSC)OSD)NoSQL答案:B解析:[单选题]47.以下属于Python脚本程序转变为可执行程序的第三方库的是:A)requestsB)pyinstallerC)numpyD)scrapy答案:B解析:[单选题]48.BI工具中,追加/替换数据中可新增字段的操作在哪一步中?()A)上传文件B)预览数据C)数据集设置D)字段匹配答案:D解析:[单选题]49.过滤算子可以配置不同的条件,其中同时输入多个精确的值,用空格作为分隔符,可以实现批量精确排除的条件是A)不在列表中B)长度不等于C)在列表中D)开始以答案:A解析:[单选题]50.若要撤销数据库中已经存在的表S,可用()。A)DELETETABLESB)DELETESC)DROPSD)DROPTABLES答案:D解析:[单选题]51.删除数据表用以下哪一项()A)DROPB)UPDATEC)DELETED)DELETED答案:A解析:[单选题]52.在用Excel处理数据时,若需要根据某个判断来得到一个值,或另外一个值,这个时候就需要使用if函数。单元格中保存的公式为"=IF(1=2,3,4)",显示的结果是A)1B)2C)3D)4答案:D解析:[单选题]53.以下对Python程序设计风格描述错误的选项是:A)Python中允许把多条语句写在同一行B)Python语句中,增加缩进表示语句块的开始,减少缩进表示语句块的退出C)Python可以将一条长语句分成多行显示,使用续航符?\?D)Python中不允许把多条语句写在同一行答案:D解析:[单选题]54.能将文本文件?data_txt.txt?读取到数组data1中的语句是:A)np.save('data_txt.txt',data1,fmt='%d')B)data1=np.load('data_txt.txt')C)np.savetxt('data_txt.txt',data1,fmt='%d')D)data1=np.loadtxt('data_txt.txt')答案:D解析:[单选题]55.在天算建模平台中,常用聚合算子实现对数据进行分组和统计。以下关于聚合函数算子的说法不正确的是A)统计某个时间段内购买车票总花费的金额数,需要用到?总和?函数。B)统计某个人入住宾馆的总次数,需要用到?总数?函数C)需要统计旅馆住宿的人群中,其中人员最小的年龄时,需要用到?最小?函数。D)需要统计某人某段时间在某个宾馆出现的次数时,需要用到?总和?函数答案:D解析:[单选题]56.在天算建模平台中,有两张数据表:?A市旅客住宿信息表?和?B市旅客住宿信息表?,通过()算子集合起来,可得到AB市的所有旅客住宿信息汇总表A)交集B)并集C)差集D)聚合答案:B解析:[单选题]57.在Excel中,数据透视表是汇总、分析、浏览和呈现汇总数据的方法。插入数据透视表之后,选择一个(),可以实现单元格区域的验证A)单元格B)表/区域C)公式D)文件答案:B解析:[单选题]58.学生关系模式S(S#,Sname,Sex,Age),S的属性分别表示学生的学号、姓名、性别、年龄。要在表S中删除一个属性?年龄?,可选用的SQL语句是()。A)UPDATESAgeB)DELETEAgefromSC)ALTERTABLES?Age?D)ALTERTABLESDROPAge答案:D解析:[单选题]59.在视图上不能完成的操作是()A)查询B)在视图上定义新的视图C)更新视图D)在视图上定义新的表答案:D解析:[单选题]60.以下程序的输出结果是:L1=['abc',['123','456']]L2=['1','2','3']print(L1>L2)A)FalseB)TypeError:'>'notsupportedbetweeninstancesof'list'and'str'C)1D)True答案:D解析:[单选题]61.数据建模时需要将数据预处理至完整,分析结果才会更精确有效。能够对数据表空值进行数据填充的算子时A)添加字段B)数据归一化C)无效数据过滤D)数据合并答案:A解析:[单选题]62.格式化日期的函数是()A)DATEDIFF()B)DATE_FORMAT()C)DAY()D)CURDATE()答案:B解析:[单选题]63.以下聚合函数求平均数的是()A)COUNTB)MAXC)AVGD)SUM答案:C解析:[单选题]64.哪个算子可以实现表增量数据的抽取,定时抽取数据表中的增量A)数据增量抽取B)数据对标C)要素提取D)时间处理答案:A解析:[单选题]65.以下聚合函数求个数的是()A)AVGB)SUMC)MAXD)COUNT答案:D解析:[单选题]66.如需通过?吸毒人员信息表?和?住宿信息表?关联出吸毒人员的住宿信息,应该用什么算子关联A)并集B)交集C)差集D)聚合答案:B解析:[单选题]67.MySQL中,预设的、拥有最高权限超级用户的用户名为()A)testB)AdministratorC)DAD)root答案:D解析:[单选题]68.以下哪项属于DDL操作()A)updateB)createC)insertD)delete答案:B解析:[单选题]69.以下删除表正确的()A)Delete*fromempB)DropdatabaseempC)Drop*fromempD)deletedatabaseemp答案:B解析:[单选题]70.有关系S(S#,SNAME,SAGE),C(C#,CNAME),SC(S#,C#,GRADE)。其中S#是学生号,SNAME是学生姓名,SAGE是学生年龄,C#是课程号,CNAME是课程名称。要查询选修?ACCESS?课的年龄不小于20的全体学生姓名的SQL语句是SELECTSNAMEFROMS,C,SCWHERE子句。这里的WHERE子句的内容是()。A)SAGE>=20andCNAME=?ACCESS?B)S.S#=SC.S#andC.C#=SC.C#andSAGEin>=20andCNAMEin?ACCESS?C)SAGEin>=20andCNAMEin?ACCESS?D)S.S#=SC.S#andC.C#=SC.C#andSAGE>=20andCNAME=?ACCESS?答案:D解析:[单选题]71.数据建模过程常经常用来比喻成做菜的过程,设定目标,准备好食材按一定流程进行加工处理,最终生成一道菜。这里提到的食材,比喻成建模的哪个要素?A)建模平台B)数据C)算法/算子D)流程答案:B解析:[单选题]72.条件?BETWEEN20AND30?表示年龄在20到30之间,且()A)包括20岁不包括30岁B)不包括20岁包括30岁C)不包括20岁和30岁D)包括20岁和30岁答案:D解析:[单选题]73.执行以下程序,输入la,输出结果是:la='python'try:s=eval(input('请输入整数:'))ls=s*2print(ls)except:print('请输入整数')A)pythonpythonB)laC)请输入整数D)python答案:A解析:[单选题]74.标准的大数据服务平台在大数据体系当中起到承上启下的作用,是一个统一的可授权、可做多维访问控制的全周期平台。以下关于大数据服务平台描述不正确的是()A)不支持第三方注册B)可以将数据资源转变为数据服务C)可以用服务构建服务D)可以统管模型答案:A解析:[单选题]75.查找条件为:姓名不是NULL的记录()A)WHERENAME!NULLB)WHERENAMENOTNULLC)WHERENAMEISNOTNULLD)WHERENAME!=NULL答案:C解析:[单选题]76.什么是KDD?A)数据挖掘与知识发现B)领域知识发现C)文档知识发现D)动态知识发现答案:A解析:[单选题]77.下列哪些语句对主键的说明正确()A)主键可重复B)主键不唯一C)在数据表中的唯一索引D)主键用foreignkey修饰答案:C解析:[单选题]78.SQL语言是()的语言,轻易学习。A)导航式B)过程化C)格式化D)非过程化答案:D解析:[单选题]79.为数据表创建索引的目的是()A)提高查询的检索性能B)归类C)创建唯一索引D)创建主键答案:A解析:[单选题]80.在MySQL中,建立数据库用()A)CREATETABLE命令B)CREATETRIGGER命令C)CREATEINDEX命令D)CREATEDATABASE命令答案:D解析:[单选题]81.例如数据库中有A表,包括学生,学科,成绩,序号四个字段,数据库结构为学生学科成绩序号张三语文601张三数学1002李四语文703李四数学804李四英语805上述哪一列可作为主键列()A)序号B)成绩C)学科D)学生答案:A解析:[单选题]82.以下哪个库主要是由运行于大数据平台之上的各类专题应用积累的资源数据组成,为业务模型分析提供的面向专业领域的知识性数据和规则模型。A)汇聚库B)知识库C)资源库D)业务库答案:D解析:[单选题]83.以下关于同步赋值语句描述错误的选项是:A)同步赋值能够使得赋值过程变得更简洁B)判断多个单一赋值语句是否相关的方法是看其功能上是否相关或相同C)设x,y表示一个点的坐标,则x=a;y=b两条语句可以用x,y=a,b一条语句来赋值D)多个无关的单一赋值语句组合成同步赋值语句,会提高程序可读性答案:D解析:[单选题]84.在数据管理技术发展过程中,文件系统与数据库系统的主要区别是数据库系统具有A)特定的数据模型B)数据无冗余C)专门的数据管理软件D)数据可共享答案:A解析:[单选题]85.在SQL语言中,子查询是()。A)选取单表中字段子集的查询语句B)选取多表中字段子集的查询语句C)返回单表中数据子集的查询语言D)嵌入到另一个查询语句之中的查询语句答案:D解析:[单选题]86.在Excel中,数据透视表是汇总、分析、浏览和呈现汇总数据的方法。创建数据透视表后,可以通过添加和排列数据透视表的()来更改其设计。A)字段B)数据C)文本D)公式答案:A解析:[单选题]87.以下关于数据维度的描述,错误的是:A)采用列表表示一维数据,不同数据类型的元素是可以的B)JSON格式可以表示比二维数据还复杂的高维数据C)二维数据可以看成是一维数据的组合形式D)字典不可以表示二维以上的高维数据答案:B解析:[单选题]88.为了提高测试的效率,应该A)集中对付那些错误群集的程序B)随机选取测试数据C)在完成编码以后制定软件的测试计划D)取一切可能的输入数据作为测试数据答案:A解析:[单选题]89.以下选项中,不是建立字典的方式是A)d={[1,2]:1,[3,4]:3}B)d={(1,2):1,(3,4):3}C)d={'张三':1,'李四':2}D)d={1:[1,2],3:[3,4]}答案:A解析:[单选题]90.使用SELECT语句随机地从表中挑出指定数量的行,可以使用的方法是()A)在LIMIT子句中使用RAND()函数指定行数,并用ORDERBY子句定义一个排序规则B)只要使用LIMIT子句定义指定的行数即可,不使用ORDERBY子句C)只要在ORDERBY子句中使用RAND()函数,不使用LIMIT子句D)在ORDERBY子句中使用RAND()函数,并用LIMIT子句定义行数答案:D解析:[单选题]91.数据建模时需要将数据预处理至完整,分析结果才会更精确有效。能够对数据表空值进行数据填充的算子时A)数据归一化B)无效数据过滤C)数据合并D)缺失值处理答案:D解析:[单选题]92.查找数据表中的记录用以下哪一项()A)ALTREB)UPDATEC)SELECTD)DELETE答案:C解析:[单选题]93.以下能够删除一列的是()A)altertableempremoveaddcolumnB)altertableempdropcolumnaddcolumnC)altertableempdeletecolumnaddcolumnD)altertableempdeleteaddcolumn答案:B解析:[单选题]94.matpltlib中绘制图形,通过更改绘图框的尺寸来设置相等的缩放比例的参数是()。A)scaledB)equalC)autoD)normal答案:A解析:[单选题]95.删除数据表中的一条记录用以下哪一项()A)DELETEDB)DELETEC)DROPD)UPDATE答案:B解析:[单选题]96.如果Python程序执行时,产生了?unexpectedindent?的错误,其原因是:A)代码中使用了错误的关键字B)代码中缺少?:?符号C)代码里的语句嵌套层次太多D)代码中出现了缩进不匹配的问题答案:D解析:[单选题]97.小A汇总统计了各省收入,并设置了降序排列,如何实现top10?()A)筛选器-精确筛选B)筛选器-条件筛选C)显示条目数D)无法实现答案:C解析:[单选题]98.使用CREATETABLE语句的()子句,在创建基本表时可以启用全文本搜索A)FULLTEXTB)ENGINEC)FROMD)WHRER答案:A解析:[单选题]99.计算机储存数据时都有对应的类型,比如字符型、整数型、日期型等等;针对不同的数据类型,都有不同的适用的计算公式和方法等。比如:日期数据在通过文件导入项目后的数据类型可能是字符型,字符之间是不能进行任何运算操作的,如果想计算时间间隔之类的,就有必要通过()算子将该数据转换为可计算的类型。A)列计算B)数据处理C)类型转换D)值映射答案:C解析:[单选题]100.以下表达降序排序的是()A)ASCB)ESCC)DESCD)DSC答案:C解析:[单选题]101.哪个选项是使用PyInstaller库对Python源文件打包的基本使用方法?A)pip-hB)pipinstall<拟安装库名>C)pipdownload<拟下载库名>D)pyinstaller需要在命令行运行:\>pyinstaller<Python源程序文件名>答案:D解析:[单选题]102.在有关数据仓库测试,下列说法不正确的是:A)在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试B)当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C)系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D)在测试之前没必要制定详细的测试计划答案:D解析:[单选题]103.表达式eval('500/10')的结果是:A)?500/10?B)500/10C)50D)50.0答案:D解析:[单选题]104.利用监督机器学习算法具有预先标记数据点的数据集这一事实。为了测试算法的有效性,会将这些数据划分。运用于机器学习建模的数据集被称为A)训练集B)测试集C)验证集D)样本集答案:A解析:[单选题]105.若用如下的SQL语句创建了一个表SC:()CREATETABLESC(S#CHAR(6)NOTNULL,C#CHAR(3)NOTNULL,SCOREINTEGER,NOTECHAR(20));向SC表插入如下行时,()行可以被插入。A)(NULL,?103?,80,?选修?)B)(?200823?,?101?,NULL,NULL)C)(?201132?,NULL,86,??)D)(?201009?,?111?,60,必修)答案:B解析:[单选题]106.对长度为n的线性表作快速排序,在最坏情况下,比较次数为___________。A)n(n-1)/2B)n(n-1)C)n-1D)n答案:A解析:[单选题]107.下面不属于软件需求分析阶段主要工作的是A)需求评审B)需求获取C)需求变更申请D)需求分析答案:C解析:[单选题]108.以下关于字符串类型的操作的描述,错误的是:A)str.replace(x,y)方法把字符串str中所有的x子串都替换成yB)想把一个字符串str所有的字符都大写,用str.upper()C)想获取字符串str的长度,用字符串处理函数str.len()D)设x=?aa?,则执行x*3的结果是?aaaaaa?答案:C解析:[单选题]109.以下语句错误的是()A)selectsal+1fromemp;B)selectsal*10,sal*deptnofromemp;C)不能使用运算符号D)selectsal*10,deptno*10fromemp;答案:C解析:[单选题]110.用来插入数据的命令是(),用于更新的命令是()A)INSERT,UPDATEB)CREATE,INSERTINTOC)DELETE,UPDATED)UPDATE,INSERT答案:A解析:[单选题]111.一张表的主键个数为()A)至多3个B)没有限制C)至多1个D)至多2个答案:C解析:[单选题]112.在视图上不能完成的操作是()A)更新视图数据B)在视图上定义新的基本表C)在视图上定义新的视图D)查询答案:B解析:[单选题]113.更新数据表中的记录用以下哪一项()A)DELETEB)ALTREC)UPDATED)SELECT答案:C解析:[单选题]114.在select语句的where子句中,使用正则表达式过滤数据的关键字是()A)likeB)againstC)matchD)regexp答案:D解析:[单选题]115.以下关于Python的控制结构,错误的是:A)每个if条件后要使用冒号(:)B)在Python中,没有switch-case语句C)Python中的pass是空语句,一般用作占位语句D)elif可以单独使用答案:D解析:[单选题]116.按照班级进行分组()A)ORDERBYCLASSESB)DORDERCLASSESC)GROUPBYCLASSESD)GROUPCLASSES答案:C解析:[单选题]117.以下关于组合数据类型的描述,错误的是:A)集合类型是一种具体的数据类型B)序列类似和映射类型都是一类数据类型的总称C)字典类型的键可以用的数据类型包括字符串,元组,以及列表D)python的集合类型跟数学中的集合概念一致,都是多个数据项的无序组合答案:C解析:[单选题]118.以下语句错误的是()A)altertableempdeletecolumnaddcolumn;B)altertableempmodifycolumnaddcolumnchar(10);C)altertableempchangeaddcolumnaddcolumnint;D)altertableempaddcolumnaddcolumnint;答案:A解析:[单选题]119.删除用户账号命令是()A)DROPUSERB)DROPTABLEUSERC)DELETEUSERD)DELETEFROMUSER答案:A解析:[单选题]120.支持子程序调用的数据结构是A)队列B)二叉树C)树D)栈答案:D解析:[单选题]121.SELECT语句的完整语法较复杂,但至少包括的部分是()A)仅SELECTB)SELECT,FROMC)SELECT,GROUPD)SELECT,INTO答案:B解析:[单选题]122.拼接字段的函数是()A)SUBSTRING()B)TRIM()C)SUM()D)CONCAT()答案:D解析:[单选题]123.近年来,随着新科技的不断普及,愈来愈多的个人数据被采集和存储了下来,个人信息网络化和透明化已经成为不可阻挡的趋势。那么,最突出的大数据环境是?A)物联网B)互联网C)综合国力D)自然资源答案:B解析:[单选题]124.在数据库体系中,结构化查询语言被称为(),是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。A)HTMLB)NoSQLC)SQLD)CSS答案:C解析:[单选题]125.天算建模平台数据集市支持多种数据分类,可以对接大数据平台推送的数据、民警自己的个人数据、建模运行结果数据以及对接警种业务库。以下数据资源是所有账号都默认可以看到的。A)数据资源目录B)个人数据C)模型结果数据D)警种业务数据答案:A解析:[单选题]126.pandas提供了对各种格式数据文件的读取和写入工具,其中不包括哪种?A)CSV文件B)文本文件C)工作簿文件D)EXE文件答案:D解析:[单选题]127.数据仓库是随着时间变化的,下面的描述不正确的是A)数据仓库随时间的变化不断增加新的数据内容B)捕捉到的新数据会覆盖原来的快照C)数据仓库随事件变化不断删去旧的数据内容D)数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合答案:C解析:[单选题]128.SQL语言集数据查询、数据操纵、数据定义和数据控制功能于一体,其中,CREATE、DROP、ALTER语句是实现哪种功能()A)数据操纵B)数据控制C)数据定义D)数据查询答案:C解析:[单选题]129.设x=10;y=20,下列语句能正确运行结束的是:A)max=x>y?x:yB)whileTrue:passC)min=xifx<yelseyD)if(x>y)print(x)答案:C解析:[单选题]130.以下关于程序控制结构描述错误的是:A)单分支结构是用if保留字判断满足一个条件,就执行相应的处理代码B)二分支结构是用if-else根据条件的真假,执行两种处理代码C)多分支结构是用if-elif-else处理多种可能的情况D)在Python的程序流程图中可以用处理框表示计算的输出结果答案:D解析:[单选题]131.deletefromemployee语句的作用是()A)删除当前数据库中整个employee表,包括表结构B)删除当前数据库中employee表内的所有行C)由于没有where子句,因此不删除任何数据D)删除当前数据库中employee表内的当前行答案:B解析:[单选题]132.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?A)根据内容检索B)建模描述C)预测建模D)寻找模式和规则答案:C解析:[单选题]133.运行以下程序,输出结果的是:str1="NanjingUniversity"str2=str1[:7]+"Normal"+str1[-10:]print(str2)A)NormalUB)NanjingNormalC)NormalUniversityD)NanjingNormalUniversity答案:D解析:[单选题]134.返回字符串长度的函数是()A)len()B)length()C)left()D)long()答案:B解析:第2部分:多项选择题,共97题,每题至少两个正确答案,多选或少选均不得分。[多选题]135.下列哪些算法可以用来够造神经网络()?A)kNNB)线性回归C)逻辑回归答案:BC解析:[多选题]136.有效抑制机器学习过拟合的方法是?()A)加大数据量B)减少数据量C)重新设计损失函数,引入平滑函数D)平滑损失函数答案:ACD解析:[多选题]137.CNN能应用于playingGo的原因描述正确的是?A)第一层hiddenlayer用于检测图像的pattern,而大部分patter通常比整张图像的大小要小,对于一个neuron来说不用去看整张图像来检测patternB)同样pattern可能出现在图像的不同区域,而这些pattern代表同样的含义,可以共用同一个neuron同一组参数C)一幅图像可以做subsampling来减少图片的大小,从而减少参数D)对图片像素点进行行列抽取答案:AB解析:[多选题]138.下列说法正确的是()A)在MySQL中,不允许有空表存在,即一张数据表中不允许没有字段。B)在MySQL中,对于存放在服务器上的数据库,用户可以通过任何客户端进行访问。C)数据表的结构中包含字段名、类型、长度、记录。D)字符型数据其常量标志是单引号和双引号,且两种符号可以混用。答案:AB解析:[多选题]139.下列哪一个逻辑运算符的优先级排列不正确()A)AND/NOT/ORB)NOT/AND/ORC)OR/NOT/ANDD)OR/AND/NOT答案:ACD解析:[多选题]140.基于二次准则函数的H-K算法较之于感知器算法的优点是()?A)计算量小B)可以判别问题是否线性可分C)其解完全适用于非线性可分的情况D)其解的适应性更好答案:BD解析:[多选题]141.关于select语句下列说法正确的是()A)select(name)fromtableperson:所有记录的name字段的值B)select(name)frompersonwhereage=12orname="aa";or或者C)select(name)fromtablepersonwhereage=12;查找age=12的记录的那个字段的值D)select(name,age)frompersonwhereage=12andname="aa";and并且答案:BD解析:[多选题]142.下面正确的说法是()A)关键字只能由单个的属性组成B)在一个关系中,关键字的值不能为空C)一个关系中的所有候选关键字均可以被指定为主关键字D)关键字是关系中能够用来惟一标识元组的属性答案:BCD解析:[多选题]143.下列哪些算法属于最优解算法()A)解析解B)最小二乘法C)梯度下降法D)最大似然估计答案:AC解析:[多选题]144.变量选择是用来选择最好的判别器子集,如果要考虑模型效率,我们应该做哪些变量选择的考虑?()A)多个变量是否有相同的功能B)模型是否具有解释性C)特征是否携带有效信息D)交叉验证答案:ACD解析:[多选题]145.以下不属于浮点型的是()A)smallintB)mediumintC)floatD)int答案:ABD解析:[多选题]146.当不知道数据所带标签时,下面哪些技术不能促使带同类标签的数据与带其他标签的数据相分离?()A)分类B)聚类C)关联分析D)隐马尔可夫链答案:ACD解析:[多选题]147.下面系统中属于关系数据库管理系统的是()A)B)MS_SQLSERVERB)A)OracleC)C)IMSD)D)DB2答案:ABC解析:[多选题]148.以下()属于线性分类器最佳准则?A)感知准则函数B)贝叶斯分类C)支持向量机D)Fisher准则答案:ACD解析:[多选题]149.簇有效性的面向相似性的度量包括()A)精度B)Rand统计量C)Jaccard系数D)召回率答案:BC解析:[多选题]150.下表是一个购物篮,假定支持度阈值为40%,其中()是频繁闭项集。ID项集1面包、牛奶、尿布2面包、牛奶、尿布、啤酒3牛奶、尿布、鸡蛋4面包、尿布、啤酒、鸡蛋5啤酒、鸡蛋A)面包、牛奶、尿布B)面包、啤酒C)尿布、啤酒D)啤酒、鸡蛋答案:AD解析:[多选题]151.我们希望减少数据集中的特征数量。你可以采取以下哪一个步骤来减少特征()?A)使用正向选择法(ForwardSelection)B)使用反向消除法(BackwardElimination)C)逐步选择消除法(Stepwise)D)计算不同特征之间的相关系数,删去相关系数高的特征之一答案:ABCD解析:[多选题]152.利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是()ID项集1面包、牛奶2面包、尿布、啤酒、鸡蛋3牛奶、尿布、啤酒、可乐4面包、牛奶、尿布、啤酒5面包、牛奶、尿布、可乐A)啤酒、尿布B)啤酒、面包C)面包、尿布D)啤酒、牛奶答案:BD解析:[多选题]153.下列正确的命令是()A)showtables;B)showcolumns;C)showcolumnsfromcustomers;D)showdatabases;答案:ACD解析:[多选题]154.以下哪项是事务特性()A)独立性B)持久性C)原子性D)一致性答案:ABCD解析:[多选题]155.下面关于CNNConvolution操作与FullyConnected的关系描述正确的是?()A)CNNConvolution输入图像和滤波器内积操作得到的矩阵的每一个元素将对应于FullyConnectedNetwork中每个神经元的输B)CNNConvolution操作filter(滤波器)中每一个元素对应FullyConnectedNetwork中要更新的参数w和bC)CNNConvolution操作得到的FeatureMap的所有元素共同sharedweightsD)CNNConvolution神经网络输入为一个3D-张量答案:ABCD解析:[多选题]156.关于DELETE和TRUNCATETABLE的说法,正确的是()A)两者都可以删除指定条目的记录B)前者可以删除指定条目的记录,后者不能C)两者都反回被删除记录的数目D)前者返回被删除记录数目,后者不返回答案:BD解析:[多选题]157.簇状柱形图以二维柱形显示值。三维簇状柱形图以三维格式显示柱形,但是不使用第三个数值轴(竖坐标轴)。在有表示以下内容的类别时使用此图表:A)相等时间间隔(如月、季度或会计年度)下数据的趋势B)数值范围(例如项目计数)C)特定范围安排(例如,包含?完全同意?、?同意?、?中立?、?不同意?、?完全不同意?等条目的Likert范围)D)不采用任何特定顺序的名称(例如项目名称、地理名称或人名)答案:BCD解析:[多选题]158.数据处理(DataProcessing)是对数据的采集、整理、存储、分类、排序、检索、维护、加工、统计和传输的一系列操作。简言之,数据处理是数据转换成信息的过程,它经历()等阶段。A)人工管理B)文件系统C)数据库系统D)面向对象系统答案:ABC解析:[多选题]159.以下几种模型方法属于判别式模型的有()A)混合高斯B)CRFC)区分度训练D)隐马尔科夫模型答案:BC解析:[多选题]160.下列说法正确的是()A)一张数据表一旦建立完成,是不能修改的。B)在MySQL中,用户在单机上操作的数据就存放在单机中。C)在MySQL中,可以建立多个数据库,但也可以通过限定,使用户只能建立一个数据库。D)要建立一张数据表,必须先建数据表的结构。答案:BCD解析:[多选题]161.数据透视表是一种可以快速汇总大量数据的交互式方法。可用于深入分析数值数据和回答有关数据的一些预料之外的问题。数据透视表专门针对以下用途设计:A)分类汇总和聚合数值数据B)展开和折叠数据级别以重点关注结果C)查看源数据的不同汇总D)执行筛选、排序、分组答案:ABCD解析:[多选题]162.机器学习中L1正则化和L2正则化的区别是?()A)使用L1可以得到稀疏的权值B)使用L1可以得到平滑的权值C)使用L2可以得到稀疏的权值D)使用L2可以得到平滑的权值答案:AD解析:[多选题]163.输出值是数值(scalar)类型的机器学习模型有()A)regressioB)简单线性回C)多重线性回归D)对数回归答案:ABC解析:[多选题]164.贝叶斯信念网络(BBN)有如下哪些特点()A)构造网络费时费力B)对模型的过分问题非常鲁棒C)贝叶斯网络不适合处理不完整的数据D)网络结构确定后,添加变量相当麻烦答案:AB解析:[多选题]165.下面系统中属于关系数据库管理系统的是()A)MS_SQLSERVERB)OracleC)IMSD)DB2答案:ABD解析:[多选题]166.在评价不平衡类问题分类的度量方法有如下几种:()A)F1度量B)召回率(recall)C)精度(precision)D)真正率(turepositiverate,TPR)答案:ABCD解析:[多选题]167.关系数据模型哪些优点?()A)结构简单B)有标准语言C)适用于集合操作D)可表示复杂的语义答案:ABC解析:[多选题]168.下列哪些属于CRF模型对于HMM和MEMM模型的优势()A)特征灵活B)速度快C)可容纳较多上下文信息D)全局最优答案:ACD解析:[多选题]169.关于OLAP和OLTP的区别描述,正确的是:()A)OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B)与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务C)OLAP的特点在于事务量大,但事务内容比较简单且重复率高D)OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的答案:ABD解析:[多选题]170.关系型数据库和常见的表格比较相似,关系型数据库中表与表之间是有很多复杂的关联关系的。常见的关系型数据库有Mysql,SqlServer等,虽然关系型数据库有很多,但是大多数都遵循SQL标准,常见的数据库操作包括()等。A)SELECTB)INSERTC)DELETED)UPDATE答案:ABCD解析:[多选题]171.噪声数据的产生原因主要有:()A)数据采集设备有问题B)在数据录入过程中发生了人为或计算机错误C)数据传输过程中发生错误D)由于命名规则或数据代码不同而引起的不一致答案:ABCD解析:[多选题]172.数据接入是认识数据的过程,通过认识数据,定义数据从获取、处理、存储、使用到消亡全生命周期的流转机制及各环节的流程、方法和程序;根据数据定义将数据读入大数据中心,并完成与数据提供方的数据对账。数据接入模块主要包含哪几部分的操作?A)数据探查B)数据定义C)数据读取D)数据对账答案:ABCD解析:[多选题]173.以下哪个聚类算法属于基于网格的聚类算法()A)STINGB)WaveClusterC)MAFIAD)BIRCH答案:ABC解析:[多选题]174.在天算建模平台中的连接算子用于把两张(或两张以上)表按照几种逻辑连接起来。这几种逻辑分别对应SQL语句中的innerjoin、leftjoin、rightjoin等。以下哪些是连接算子的连接方式。A)内连接B)自连接C)左连接D)右连接答案:ACD解析:[多选题]175.下面检索结果一定不是一行的命令是()A)selectdistinct*fromorders;B)select*fromorderslimit1,2;C)selecttop1*fromorders;D)select*fromorderslimit1;答案:ABC解析:[多选题]176.下列关于Ridge回归,说法正确的是()?A)若λ=0,则等价于一般的线性回归B)若λ=0,则不等价于一般的线性回归C)若λ=+∞,则得到的权重系数很小,接近于零D)若λ=+∞,则得到的权重系数很大,接近与无穷大答案:AC解析:[多选题]177.下列关于极大似然估计(MaximumLikelihoodEstimate,MLE),说法正确的是()?A)MLE可能并不存在B)MLE总是存在C)如果MLE存在,那么它的解可能不是唯一的D)如果MLE存在,那么它的解一定是唯一的答案:AC解析:[多选题]178.下列关于牛顿法描述正确的是()A)牛顿法是一种迭代算法,每一步都需要求解目标函数的Hessian矩阵的逆矩阵B)二阶收敛,收敛速度快C)函数要求苛刻(二阶连续可微,汉森矩阵可逆)D)牛顿法是局部收敛的,当初始点选择不当时,往往导致不收敛答案:ABCD解析:[多选题]179.在统计模式分类问题中,当先验概率未知时,可以使用()A)最小损失准则B)最小最大损失准则C)最小误判概率准则D)N-P判决答案:BD解析:[多选题]180.决策树中包含以下哪些结点()A)根结点(rootnode)B)内部结点(internalnode)C)外部结点(externalnode)D)叶结点(leafnode)答案:ABD解析:[多选题]181.下列哪些是专门用于可视化时间空间数据的技术:()A)等高线图B)饼图C)曲面图D)矢量场图答案:ACD解析:[多选题]182.Hadoop提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎。它是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理,以下哪些属于Hadoop架构的优点?A)高可靠性B)高可扩展性C)高容错性D)支持多种编程语言答案:ABCD解析:[多选题]183.下面关于数据粒度的描述正确的是:()A)粒度是指数据仓库小数据单元的详细程度和级别B)数据越详细,粒度就越小,级别也就越高C)数据综合度越高,粒度也就越大,级别也就越高D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量答案:ABD解析:[多选题]184.对某个数据库使用记录单,可以进行的记录操作有()A)删除B)新建C)还原D)插入答案:ABC解析:[多选题]185.以下否定语句搭配正确的是()A)notinB)innotC)notbetweenandD)isnotnull答案:ACD解析:[多选题]186.传统的网络安全结构把不同的网络(或者单个网络的一部分)划分为不同的区域,不同区域之间不会使用()进行隔离。每个区域都被授予某种程度的信任,它决定了哪些网络资源允许被访问。A)防火墙B)防水墙C)网关D)路由设备答案:BCD解析:[多选题]187.数据挖掘算法的组件包括:()A)模型或模型结构B)评分函数C)优化和搜索方法D)数据管理策略答案:ABCD解析:[多选题]188.我们知道二元分类的输出是概率值。一般设定输出概率大于或等于0.5,则预测为正类;若输出概率小于0.5,则预测为负类。那么,如果将阈值0.5提高,例如0.6,大于或等于0.6的才预测为正类。则准确率(Precision)和召回率(Recall)会发生什么变化()?A)准确率(Precision)增加或者不变B)准确率(Precision)减小C)召回率(Recall)减小或者不变D)召回率(Recall)增大答案:AC解析:[多选题]189.数据表字段间计算需要字段数据类型为数值等可计算类型,能够对字段进行类型变更的算子是A)表结构处理B)类型转换C)值映射D)缺失值处理答案:AB解析:[多选题]190.在下列关于关系的叙述中,正确的是()A)C)行在表中的顺序无关紧要B)A)表中任意两行的值不能相同C)D)列在表中的顺序无关紧要D)B)表中任意两列的值不能相同答案:ABC解析:[多选题]191.如需通过?吸毒人员信息表?和?住宿信息表?关联出吸毒人员的住宿信息,应该用什么算子关联A)并集B)差集C)连接D)交集答案:CD解析:[多选题]192.数据挖掘的主要功能包括概念描述、趋势分析、孤立点分析及()等方面A)挖掘频繁模式B)分类和预测C)聚类分析D)偏差分析答案:ABCD解析:[多选题]193.以下语句错误的是();SELECTrank,AVG(salary)FROMpeopleHAVINGAVG(salary)>1000GROUPBYrank;A)SELECTrank,AVG(salary)FROMpeopleGROUPBYrankHAVINGAVG(salary)>1000B)SELECTrank,AVG(salary)FROMpeopleHAVINGAVG(salary)>1000GROUPBYrank;C)SELECTAVG(salary)FROMpeopleGROUPBYrankHAVINGAVG(salary)>1000;D)SELECTrank,AVG(salary)FROMpeopleGROUPBYrankWHEREAVG(salary)>1000;答案:BD解析:[多选题]194.下列不属于无监督学习的是:()A)kmeansB)svmC)最大熵D)crf答案:BCD解析:[多选题]195.下列说法正确的是()A)altertableuserdropcolumnsex;B)altertableuseraddsexvarchar(20);C)altertableuserdropsex;D)altertableusermodifyidintprimarykey;答案:ABCD解析:[多选题]196.Excel可简化数字处理。基于数据获取图表建议,单击即可创建。还可通过数据栏、颜色编码和图标轻松发现趋势和模式。以下哪些属于Excel的功能模块?A)数据透视表B)图表C)宏D)排序和筛选答案:ABCD解析:[多选题]197.如果在线性回归模型中增加一个特征变量,下列可能发生的是()?A)R-squared增大,AdjustR-squared增大B)R-squared增大,AdjustR-squared减小C)R-squared减小,AdjustR-squared减小D)R-squared减小,AdjustR-squared增大答案:AB解析:[多选题]198.以下属于分类器评价或比较尺度的有:()A)预测准确度B)召回率C)模型描述的简洁度D)计算复杂度答案:ACD解析:[多选题]199.数据探查通过自动化的手段了解数据内容、背景、结构及路径分析,包括数据成分、业务规则合规分析、数据间关系及相关资源匹配等问题。那么数据探查的功能主要有哪些?A)业务含义探查B)字段探查C)数据集探查D)问题数据探查答案:ABCD解析:[多选题]200.在其他条件不变的前提下,以下哪些做法不容易引起机器学习中的过拟合问题()A)增加训练集量B)减少神经网络隐藏层节点数C)删除稀疏的特征D)SVM算法中使用高斯核/RBF核代替线性核答案:ABC解析:[多选题]201.下列哪些列类型是数值型的数据()。A)DOUBLEB)INTC)SETD)FLOAT答案:ABD解析:[多选题]202.HDFS是一种用于Hadoop应用程序的主存储系统,也是一个高容错性系统,适合部署在廉价机上,同时,HDFS能提高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS主要适合做什么?A)存储并管理PB级数据B)处理非结构化数据C)处理高吞吐量数据D)需要对文件的修改答案:ABC解析:[多选题]203.下面对union的描述不正确的是()A)union只连接结果集完全一样的查询语句B)union可以连接结果集中数据类型个数相同的多个结果集C)union是筛选关键词,对结果集再进行操作D)任何查询语句都可以用union来连接答案:ACD解析:[多选题]204.mySQL支持哪些逻辑运算符A)&&B)||C)NOTD)AND答案:CD解析:[多选题]205.以下有两张表,A是?所有口岸入境人员信息?,B是?吸毒人员基本信息?,现在对两张表的身份证号进行关联配置(配置相等条件),用()算子进行运算,可得到?吸毒人员的出入境信息?。A)自连接B)连接C)交集D)并集答案:BC解析:[多选题]206.对同一存储过程连续两次执行命令DROPPROCEDUREIFEXISTS,将会()A)第一次执行删除存储过程,第二次产生一个错误B)第一次执行删除存储过程,第二次无提示C)存储过程不能被删除D)最终删除存储过程答案:BD解析:[多选题]207.在聚类分析当中,()等技术可以处理任意形状的簇。A)MIN(单链)B)MAX(全链)C)组平均D)Chameleon答案:AD解析:[多选题]208.在数据库系统中,有哪几种数据模型?()A)实体联系模型B)关系模型C)网状模型D)层次模型答案:BCD解析:[多选题]209.以下说法正确的是()A)字符型既可用单引号也可用双引号将串值括起来B)字符型的87398143不参与计算的C)87398143不能声明为数值型D)数值型的87398143将参与计算答案:ABD解析:[多选题]210.基于内容的推荐生成推荐的过程主要依靠()A)内容分析器B)推荐系统C)文件学习器D)过滤部件答案:ACD解析:[多选题]211.数据仓库在技术上的工作过程是:()A)数据的抽取B)存储和管理C)数据的表现D)数据仓库设计答案:ABCD解析:[多选题]212.模式识别中,马式距离较之于欧式距离的优点是()A)平移不变性B)旋转不变性C)尺度不变性D)考虑了模式的分布答案:CD解析:[多选题]213.观察样本次数如何影响过拟合()?注意:所有情况的参数都保持一致。A)观察次数少,容易发生过拟合B)观察次数少,不容易发生过拟合C)观察次数多,容易发生过拟合D)观察次数多,不容易发生过拟合答案:AD解析:[多选题]214.在挖掘人员异常住宿行为时经常会过滤出异常时段入住记录,表中的时间字段格式为?yyyy-MM-ddHH:mm:ss,哪些算子可以实现小时的提取A)添加字段B)时间处理C)聚合D)无效数据过滤答案:AB解析:[多选题]215.()都属于分裂的层次聚类算法A)二分K均值B)MSTC)ChameleonD)组平均答案:AB解析:[多选题]216.关于检索结果排序,正确的是()A)关键字DESC表示降序,ASC表示升序B)如果指定多列排序,只能在最后一列使用升序或降序关键字C)如果指定多列排序,可以在任意列使用升序或降序关键字D)关键字ASC表示降序,DESC表示升序答案:AC解析:[多选题]217.数据清理中,处理缺失值的方法是?A)估算B)整例删除C)变量删除D)成对删除答案:ABCD解析:[多选题]218.MicrosoftExcel为对话框工作表提供了多个控件,启用?开发工具?选项卡后,这些控件可用于从列表中选择项目。在Excel中能插入以下哪些表单控件?A)组合框B)复选框C)数值调节钮D)列表框答案:ABCD解析:[多选题]219.现在需要对2020年、2021年两年的人口数据进行分析。已知目前上传了一份2020年数据到天算建模平台,需要再上传2021年的数据表,可以如何操作。A)删除2020年数据表,再上传2021年数据表B)直接上传2021年数据,再与2020年表进行合并C)追加导入D)平台不支持答案:BC解析:[多选题]220.VMware是一个虚拟PC的软件,可以在现有的操作系统上虚拟出一个新的硬件环境,相当于模拟出一台新的PC,以此来实现在一台机器上真正同时运行两个独立的操作系统。Vmware网络配置方式主要有?A)host-onlyB)natC)桥接D)链接答案:ABC解析:[多选题]221.对于显示操作以下说法正确的是()A)showdatabase;显示所有数据库B)showtable;显示所有表C)showtables;显示所有表D)showdatabases;显示所有数据库答案:BD解析:[多选题]222.对某个数据库进行筛选后,()。A)可以选出符合某些条件组合的记录B)不能选择出符合条件组合的记录C)可以选出符合某些条件的记录D)只能选择出符合某一条件的记录答案:AC解析:[多选题]223.Pandas提供的两个主要数据结构Series与DataFrame,可以处理金融、统计、社会科学、工程等领域里的大多数典型案例,并且Pandas是基于Numpy开发的,它可以与其他第三方科学计算库完美集成。那么Panads的功能有哪些优势?A)处理浮点与非浮点数据里的缺失数据,表示为NaNB)强大、灵活的分组统计(groupby)功能,即数据聚合、数据转换C)直观地合并(merge)、连接(join)数据集D)大小不可变,例如插入或删除不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论