大数据建模练习(习题卷2)_第1页
大数据建模练习(习题卷2)_第2页
大数据建模练习(习题卷2)_第3页
大数据建模练习(习题卷2)_第4页
大数据建模练习(习题卷2)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:大数据建模练习大数据建模练习(习题卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据建模练习第1部分:单项选择题,共39题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.例如数据库中有A表,包括学生,学科,成绩三个字段,数据库结构为学生学科成绩张三语文60张三数学100李四语文70李四数学80李四英语80如何统计最高分>80的学科()A)SELECTMAX(成绩)FROMAGROUPBY学科HAVINGMAX(成绩)>80;B)SELECT学科FROMAGROUPBY学科HAVING成绩>80;C)SELECT学科FROMAGROUPBY学科HAVINGMAX(成绩)>80;D)SELECT学科FROMAGROUPBY学科WHEREMAX(成绩)>80;答案:C解析:[单选题]2.在MySQL中,建立数据库用()A)CREATETABLE命令B)CREATETRIGGER命令C)CREATEINDEX命令D)CREATEDATABASE命令答案:D解析:[单选题]3.以下哪项用于左连接()A)JOINB)RIGHTJOINC)LEFTJOIND)INNERJOIN答案:C解析:[单选题]4.给出如下代码:DictColor={"seashell":"海贝色","gold":"金色","pink":"粉红色","brown":"棕色","purple":"紫色","tomato":"西红柿色"}以下选项中能输出?海贝色?的是A)print(DictColor.keys())B)print(DictColor["海贝色"])C)print(DictColor.values())D)print(DictColor["seashell"])答案:D解析:[单选题]5.数据建模时需要将数据预处理至完整,分析结果才会更精确有效。能够对数据表空值进行数据填充的算子时A)数据归一化B)无效数据过滤C)数据合并D)缺失值处理答案:D解析:[单选题]6.以下哪种操作能够实现实体完整性()A)设置唯一键B)设置外键C)减少数据冗余D)设置主键答案:B解析:[单选题]7.统计每个部门中人数()A)SELECTSUM(ID)FROMEMPGROUPBYDEPTNO;B)SELECTSUM(ID)FROMEMPORDERBYDEPTNO;C)SELECTCOUNT(ID)FROMEMPORDERBYDEPTNO;D)SELECTCOUNT(ID)FROMEMPGROUPBYDEPTNO;答案:D解析:[单选题]8.以下关于文件的描述错误的选项是:A)readlines()函数读入文件内容后返回一个列表,元素划分依据是文本文件中的换行符B)read()一次性读入文本文件的全部内容后,返回一个字符串C)readline()函数读入文本文件的一行,返回一个字符串D)二进制文件和文本文件都是可以用文本编辑器编辑的文件答案:D解析:[单选题]9.数据处理前不了解数据各类格式情况,需要把实际数据中的各类格式探查清楚,然后再进行有效处理,可以实现这个功能的是A)字段值清洗B)数据格式探查C)要素提取D)数据对标答案:B解析:[单选题]10.条件年龄BETWEEN15AND35表示年龄在15至35之间,且()A)不包括15岁和35岁B)包括15岁但不包括35岁C)包括15岁和35岁D)包括35岁但不包括15岁答案:C解析:[单选题]11.requests库的get()函数执行后会返回一个Response类型的对象,其text属性以()形式存储响应内容A)网页B)字符串C)整数D)文本答案:B解析:[单选题]12.更新数据表中的记录用以下哪一项()A)DELETEB)ALTREC)UPDATED)SELECT答案:C解析:[单选题]13.条件?BETWEEN20AND30?表示年龄在20到30之间,且()A)包括20岁不包括30岁B)不包括20岁包括30岁C)不包括20岁和30岁D)包括20岁和30岁答案:D解析:[单选题]14.查找数据库中所有的数据表用以下哪一项()A)SHOWDATABASEB)SHOWTABLESC)SHOWDATABASESD)SHOWTABLE答案:B解析:[单选题]15.在SELECT语句中,使用关键字()可以把重复行屏蔽A)TOPB)ALLC)UNIOND)DISTINCT答案:D解析:[单选题]16.查找数据表中的记录用以下哪一项()A)ALTREB)UPDATEC)SELECTD)DELETE答案:C解析:[单选题]17.耦合性和内聚性是对模块独立性度量的两个标准。下面叙述中正确的是A)降低耦合性提高内聚性有利于提高模块的独立性B)耦合性是指一个模块内部个元素间彼此结合的紧密程度C)提高耦合性降低内聚性有利于提高模块的独立性D)内聚性是模块间相互连接的紧密程度答案:A解析:[单选题]18.在数据管理技术发展过程中,文件系统与数据库系统的主要区别是数据库系统具有A)特定的数据模型B)数据无冗余C)专门的数据管理软件D)数据可共享答案:A解析:[单选题]19.一个简单的Series是由()的数据组成的A)两个数组B)三个数组C)一个数组D)四个数组答案:C解析:[单选题]20.完全不考虑程序的内部结构和内部特征,而只是根据程序功能导出测试用例的测试方法是A)错误推测法B)白箱测试法C)黑箱测试法D)安装测试法答案:C解析:[单选题]21.数据仓库是随着时间变化的,下面的描述不正确的是A)数据仓库随时间的变化不断增加新的数据内容B)捕捉到的新数据会覆盖原来的快照C)数据仓库随事件变化不断删去旧的数据内容D)数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合答案:C解析:[单选题]22.以下插入记录正确的()A)insertintoemp(ename,hiredate,sal)values(value1,value2,value3);B)insertintoemp(ename,sal)values(value1,value2,value3);C)insertintoemp(ename)values(value1,value2,value3);D)insertintoemp(ename,hiredate,sal)values(value1,value2);答案:A解析:[单选题]23.创建数据库使用以下哪项()A)createmytestB)createtablemytestC)databasemytestD)createdatabasemytest答案:D解析:[单选题]24.以下关于Python的控制结构,错误的是:A)每个if条件后要使用冒号(:)B)在Python中,没有switch-case语句C)Python中的pass是空语句,一般用作占位语句D)elif可以单独使用答案:D解析:[单选题]25.查找条件为:姓名不是NULL的记录()A)WHERENAME!NULLB)WHERENAMENOTNULLC)WHERENAMEISNOTNULLD)WHERENAME!=NULL答案:C解析:[单选题]26.通过线条起伏展示数据变化,并通过面积渲染引起对总值关注的图表是?()A)折线图B)面积图C)双轴图D)瀑布图答案:B解析:[单选题]27.在select语句的where子句中,使用正则表达式过滤数据的关键字是()A)likeB)againstC)matchD)regexp答案:D解析:[单选题]28.表达式print("{:.2f}".format(20-2**3+10/3**2*5))的结果是:A)55B)56C)22D)17.56答案:D解析:[单选题]29.查找表结构用以下哪一项()A)FINDB)SELETEC)ALTERD)DESC答案:D解析:[单选题]30.在Excel中,动态按钮可以实现对不同类型数据的选择性展示。图示为一种动态按钮。插入如图动态按钮,需要用到的工具为:A)复选框B)框C)切片器D)图表答案:C解析:[单选题]31.下列说法错误的是()A)GROUPBY子句用来分组WHERE子句的输出B)WHERE子句用来筛选FROM子句中指定的操作所产生的行。C)聚合函数需要和groupby一起使用D)HAVING子句用来从FROM的结果中筛选行答案:D解析:[单选题]32.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?A)分类B)聚类C)关联分析D)隐马尔可夫链答案:B解析:[单选题]33.下面代码的输出结果是:forsin"HelloWorld":ifs=="W":continueprint(s,end="")A)HelloorldB)HelloC)WorldD)HelloWorld答案:A解析:[单选题]34.执行以下程序,输入la,输出结果是:la='python'try:s=eval(input('请输入整数:'))ls=s*2print(ls)except:print('请输入整数')A)pythonpythonB)laC)请输入整数D)python答案:A解析:[单选题]35.以下程序的输出结果是:ss=list(set("jzzszyj"))ss.sort()print(ss)A)['z','j','s','y']B)['j','s','y','z']C)['j','z','z','s','z','y','j']D)['j','j','s','y','z','z','z']答案:B解析:[单选题]36.以下程序的输出结果是:L1=['abc',['123','456']]L2=['1','2','3']print(L1>L2)A)FalseB)TypeError:'>'notsupportedbetweeninstancesof'list'and'str'C)1D)True答案:D解析:[单选题]37.返回当前日期的函数是()A)curtime()B)adddate()C)curnow()D)curdate()答案:D解析:第2部分:多项选择题,共27题,每题至少两个正确答案,多选或少选均不得分。[多选题]38.如需在出入境表中,分性别统计出入境的人数,需要用到的算子和聚合函数是A)过滤B)聚合C)总数D)总和答案:BC解析:[多选题]39.对某个数据库使用记录单,可以进行的记录操作有()A)删除B)新建C)还原D)插入答案:ABC解析:[多选题]40.下列哪些列类型是数值型的数据()。A)DOUBLEB)INTC)SETD)FLOAT答案:ABD解析:[多选题]41.数据处理(DataProcessing)是对数据的采集、整理、存储、分类、排序、检索、维护、加工、统计和传输的一系列操作。简言之,数据处理是数据转换成信息的过程,它经历()等阶段。A)人工管理B)文件系统C)数据库系统D)面向对象系统答案:ABC解析:[多选题]42.下列正确的命令是()A)showtables;B)showcolumns;C)showcolumnsfromcustomers;D)showdatabases;答案:ACD解析:[多选题]43.关于select语句下列说法正确的是()A)select(name)fromtableperson:所有记录的name字段的值B)select(name)frompersonwhereage=12orname="aa";or或者C)select(name)fromtablepersonwhereage=12;查找age=12的记录的那个字段的值D)select(name,age)frompersonwhereage=12andname="aa";and并且答案:BD解析:[多选题]44.数据挖掘标准是指挖掘从大量数据中发现隐藏的、先前未知且可用的相互关系的数据过程规范;数据挖掘标准提出并规范了目前广泛接受应用的四种数据挖掘技术,分别为分类、聚类、()、(),可视的机器学习模式是不断优化而来的A)比对B)规则发现C)预测D)离散答案:BC解析:[多选题]45.Excel中有关数据库内容,描述正确的有()。A)每一个Excel数据库对应一个工作簿文件B)一列为一个字段,描述实体对象的属性C)Excel数据库属于?关系数据模型?,又称为关系型数据库D)一行为一个记录,描述某个实体对象答案:BCD解析:[多选题]46.在天算建模平台中,处理算子主要是解决当数据表或数据不符合建模的格式要求时,需要先对其进行预处理的情况。以下哪些算子是属于数据处理算子。A)缺失值处理B)值映射C)时间处理D)数据校验答案:ABCD解析:[多选题]47.数据逻辑结构是指反映数据元素之间的逻辑关系的数据结构,其中的逻辑关系是指数据元素之间的前后间关系,而与他们在计算机中的存储位置无关,数据逻辑结构包括()。A)集合B)线性结构C)树形结构D)图形结构答案:ABCD解析:[多选题]48.下列是MYSQL比较运算符的是()A)!=B)<>C)==D)>=答案:ABD解析:[多选题]49.下面正确的说法是()A)关键字只能由单个的属性组成B)在一个关系中,关键字的值不能为空C)一个关系中的所有候选关键字均可以被指定为主关键字D)关键字是关系中能够用来惟一标识元组的属性答案:BCD解析:[多选题]50.进入大数据时代,大量的信息泄露事件接踵而至,中国2000万顾客酒店开房信息泄露并被19万次下载,圆通速递近百万条快递单个人信息不仅网上有售,且单号数据信息还能24小时更新。因此,大数据的最显著特征是?A)数据规模大B)数据类型多样C)数据处理速度快D)数据价值密度高答案:ABCD解析:[多选题]51.SQL语言集几个功能模块为一体,其中包括()A)C.DCLB)DMLC)D.DNLD)A.DDL答案:ABD解析:[多选题]52.创建数据表时,下列哪些列类型的宽度是可以省略的。()A)DATEB)INTC)CHARD)TEXT答案:ABD解析:[多选题]53.下列关于PCA说法正确的是()?A)在使用PCA之前,我们必须标准化数据B)应该选择具有最大方差的主成分C)应该选择具有最小方差的主成分D)可以使用PCA在低维空间中可视化数据答案:ABD解析:[多选题]54.以下说法正确的是()A)一个服务器只能有一个数据库B)一个服务器可以有多个数据库C)一个数据库只能建立一张数据表D)一个数据库可以建立多张数据表答案:BD解析:[多选题]55.数据透视表是一种可以快速汇总大量数据的交互式方法。可用于深入分析数值数据和回答有关数据的一些预料之外的问题。数据透视表专门针对以下用途设计:A)分类汇总和聚合数值数据B)展开和折叠数据级别以重点关注结果C)查看源数据的不同汇总D)执行筛选、排序、分组答案:ABCD解析:[多选题]56.以下有两张表,A是?所有口岸入境人员信息?,B是?吸毒人员基本信息?,现在对两张表的身份证号进行关联配置(配置相等条件),用()算子进行运算,可得到?吸毒人员的出入境信息?。A)自连接B)连接C)交集D)并集答案:BC解析:[多选题]57.下面系统中属于关系数据库管理系统的是()A)B)MS_SQLSERVERB)A)OracleC)C)IMSD)D)DB2答案:ABC解析:[多选题]58.关于groupby以下语句正确的是()A)SELECTstore_nameFROMStore_InformationGROUPBYstore_nameB)SELECTSUM(sales)FROMStore_InformationGROUPBYsalesC)SELECTstore_name,priceSUM(sales)FROMStore_InformationGROUPBYstore_name,priceD)SELECTstore_name,SUM(sales)FROMStore_InformationGROUPBYstore_name答案:BCD解析:[多选题]59.数据探查通过自动化的手段了解数据内容、背景、结构及路径分析,包括数据成分、业务规则合规分析、数据间关系及相关资源匹配等问题。那么数据探查的功能主要有哪些?A)业务含义探查B)字段探查C)数据集探查D)问题数据探查答案:ABCD解析:[多选题]60.下面关于CNNConvolution操作与FullyConnected的关系描述正确的是?()A)CNNConvolution输入图像和滤波器内积操作得到的矩阵的每一个元素将对应于FullyConnectedNetwork中每个神经元的输B)CNNConvolution操作filter(滤波器)中每一个元素对应FullyConnectedNetwork中要更新的参数w和bC)CNNConvolution操作得到的FeatureMap的所有元素共同sharedweightsD)CNNConvolution神经网络输入为一个3D-张量答案:ABCD解析:[多选题]61.下面关于数据粒度的描述正确的是:()A)粒度是指数据仓库小数据单元的详细程度和级别B)数据越详细,粒度就越小,级别也就越高C)数据综合度越高,粒度也就越大,级别也就越高D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量答案:ABD解析:[多选题]62.语句select*fromproductswhereprod_namelike'%se%'结果集包括()A)检索products表中prod_name字段以'se'结尾的数据B)检索products表中prod_name字段以'se'开关的数据C)检索products表中prod_name字段包含'se'的数据D)检索products表中prod_name字段不包含'se'的数据答案:ABC解析:[多选题]63.下列语句错误的是()A)select*fromorderswhereordernameisnotnull;B)select*fromorderswhereordername<>null;C)select*fromorderswhereordernameisnull;D)select*fromorderswhereordernamenotisnull;答案:BD解析:[多选题]64.下列属于不同的有序数据的有:()A)时序数据B)序列数据C)时间序列数据D)事务数据E)空间数据答案:ABCE解析:第3部分:判断题,共21题,请判断题目是否正确。[判断题]65.DBSCAN是相对抗噪声的,并且能够处理任意形状和大小的簇A)正确B)错误答案:对解析:[判断题]66.并集算子的作用是将两张表纵向拼接成一张表,相当于Sql中的union语句A)正确B)错误答案:对解析:[判断题]67.在LogisticRegression中,如果同时加入L1和L2范数,可以做特征选择,并在一定程度上防止过拟合A)正确B)错误答案:对解析:[判断题]68.模型的具体化就是预测公式,公式可以产生与观察值有相似结构的输出,这就是预测值A)正确B)错误答案:对解析:[判断题]69.元组是不可变的,不支持列表对象的inset()、remove()等方法,也不支持del命令删除其中的元素,但可以使用del命令删除整个元组对象A)正确B)错误答案:对解析:[判断题]70.两个变量的Pearson相关性系数为零,但这两个变量的值同样可以相关A)正确B)错误答案:对解析:[判断题]71.关系型数据库模型是把复杂的数据结构归结为简单的二元关系(即二维表格形式)。在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关联表的表格分类、合并或连接等运算来实现数据的管理。A)正确B)错误答案:对解析:[判断题]72.聚类(clustering)是这样的过程:它找出描述并区分数据类或概念的模型(或函数),以便能够使用模型预测类标记未知的对象类。A)正确B)错误答案:错解析:[判断题]73.Python标准库threading中的Lock、RLock、Condition、Event、Semaphore对象都可以用来实现线程同步A)正确B)错误答案:对解析:[判断题]74.在Python3.5中运算符+不仅可以实现数值的相加、字符串连接,还可以实现列表、元组的合并和集合的并集运算A)正确B)错误答案:错解析:[判断题]75.OOP即面向对象,主要有三大特征:封装、继承、多态,封装对权限有一定的要求,可以是公共的也可以是私有的;继承可以是单继承,也可以是多继承;多态可以扩展业务。A)正确B)错误答案:错解析:[判断题]76.逻辑回归不能处理三分类问题A)正确B)错误答案:错解析:[判断题]77.()只能将表中的一个列定义为主键,不能将多个列定义为复合的主键。A)正确B)错误答案:错解析:[判断题]78.()LTRIM、RTRIM、TRIM函数既能去除半角空格,又能去除全角空格。A)正确B)错误答案:错解析:[判断题]79.定量属性可以是整数值或者是连续值A)正确B)错误答案:对解析:[判断题]80.元组的访问速度比列表要快一些,如果定义了一系列常量值,并且主要用途仅仅是对其进行遍历二不需要进行任何修改,建议使用元组而不使用列表A)正确B)错误答案:对解析:[判断题]81.过滤算子配置过滤条件,支持添加多条或多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论