版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1数据分析师(中级)认定考试复习题库-上(单选题汇总)一、单选题1.以下哪个选项不属于我行数据分析师的岗位职责?A、研究数据分析方法B、参与实施数据分析项目C、牵头数据分析项目业务需求研制D、推动数据分析成果业务应用答案:C2.大数据平台的入库原则是______。A、最小范围B、应入尽入C、全部入库D、用时再入答案:B3.在命令行中,Python提示符____就是键入代码的地方,按下Enter即可执行。A、>>>B、[]C、(D、)答案:A4.在SQL的查询语句中,GROUPBY选项实现对结果表的什么功能?A、分组统计B、插入C、删除D、查询答案:A5.在提交完数据使用申请后,平台管理员将提交的申请转至对应的___。A、项目负责人B、审批负责人C、项目管理员D、对口业务负责人答案:C解析:在提交完数据使用申请后,平台管理员将提交的申请转至对应的项目管理员。6.以下对于IPython说法不正确的是A、IPython是一个加强版的Python解释器B、IPython是一种不同于Python的新的编程语言C、IPython提供执行任意代码块的功能D、IPython提供执行整个Python脚本的功能答案:B7.下列选项中,不属于Python关键字的是____A、defB、classC、returnD、function答案:D8.银行面向客户经营时面临的最主要风险是____。A、市场风险B、操作风险C、信用风险D、流动性风险答案:C解析:信用风险是银行面向客户经营时面临的最主要风险。9.在GBase中,在处理文本字符串时,可以同时去除两端的空格的关键字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:A10.在Python中绘图时,可以用于绘制直方图的方法是____A、plot.hist()B、plot.density()C、plot.bar()D、plot.barh()答案:A11.在处理特征缩放时,如果x是一个独立的特征值(即某个数据点中的特征值),需要用到这个特征在整个数据集中的最小值和最大值,这种方法一般也被称为什么?A、min-max缩放B、特征标准化C、特征方差缩放D、l2归一化答案:A解析:在处理特征缩放时,如果x是一个独立的特征值(即某个数据点中的特征值),需要用到这个特征在整个数据集中的最小值和最大值,这种方法一般被称为min-max缩放12.在构建回归模型之前,需要对特征进行相关性分析,剔除相关性过高的特征,避免出现____的问题。A、过拟合B、欠拟合C、共线性D、模型复杂度过高答案:C13.在数据分析工作中,在____阶段,需要需统一语言和思想,用数据语言定义业务问题和想要达到的目标。A、数据收集B、数据处理C、明确分析目的和思路D、构建模型答案:C14.在mole中,以下关于节点的表述不正确的是____A、节点就是一系列算子B、节点是HDFS文件,只能用来保存数据C、不同的节点代表着不同的计算模式D、在节点上输入一个数据集合计算后得到一个新集合答案:B15.显示所有可用魔术命令的详细文档的IPython魔术命令___A、%magicB、%debugC、%pdbD、%reset答案:A16.在文献中,属性、维度(dimension)、特征(feature)、变量(variance)、因子(factor)都具有相同的含义。“”,一般用在机器学习中。A、维度(dimension)B、特征(feature)C、变量(variate)D、因子(factor)答案:B解析:在文献中,属性、维度(dimension)、特征(feature)、变量(variance)、因子(factor)都具有相同的含义。“维度”,一般用在数据仓库中。“特征”,一般用在机器学习中。17.在GBase中,对数据求最大值时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:C18.由商业银行经营、管理及其他行为或外部事件导致利益相关方对商业银行负面评价的风险,指的是____A、市场风险B、操作风险C、信用风险D、声誉风险答案:D19.以下数据已脱敏的是()A、某客户手机号:*******8568B、地址:城南西路66号C、注册资本5000万元D、存款余额50万余元答案:A解析:A为脱敏数据,已无法还原至原始数据,BCD为未脱敏数据。20.下列算法常用于聚类问题是______。A、K-meansB、逻辑回归模型C、决策树模型D、随机森林模型答案:A解析:本题考查机器学习的概念。k-means是聚类算法,属于无监督学习。21.商业银行通过____职能实现资本盈余与短缺之间的调剂。A、信用中介B、支付中介C、信用创造D、金融服务答案:A解析:商业银行通过信用中介职能实现资本盈余与短缺之间的调剂,并不改变货币资本的所有权,改变的只是其使用权。22.下列选项中,Python变量赋值正确的是____A、vara=2B、inta=2C、a=2D、variablea=2答案:C23.在数据分析挖掘平台Woody的笔记本(Notebook)中,假设已经使用Python语言定义好变量foo=100,执行以下哪条语句会显示foo的变量类型、取值等概要信息A、foo%B、foo!C、foo?D、foo答案:C24.下列执行数据的删除语句在运行时不会产生错误信息的选项是。A、Delete*FromAWhereB='6'B、DeleteFromAWhereB='6'C、DeleteAWhereB='6'D、eleteASetB='6'答案:B25.在Python中绘图时,可以用于绘制密度图的方法是____A、plot.hist()B、plot.density()C、plot.bar()D、plot.barh()答案:B26.GBASE不支持的字符型为____。A、CHARB、VARCHARC、TEXTD、STRING答案:D27.在GBase中,查询数据表时应使用下列哪种语句:A、select语句B、create语句C、insert语句D、rop语句答案:A28.下列哪项是商业银行最基本,也是最能反映其经营活动特征的职能?A、信用中介B、支付中介C、信用创造D、金融服务答案:A29.用户用来方便地对数据库中的数据对象进行定义的语言是____。A、数据操纵语言B、数据定义语言C、数据模型语言D、数据对象语言答案:B30.在采集数据后,如果数据质量低下,需要进行什么操作?A、数据建模B、数据预处理C、数据搜索D、数据转换答案:B31.在SQL聚集函数中,____的功能为确定表中行的数目。A、COUNT()B、SUM()C、AVG()D、MAX()答案:A32.分析全渠道交易量,柜面、掌银、ATM、POS等重点渠道交易特征,数据分析挖掘在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:C解析:决策支持定位于客户、产品、渠道的数据分析与监测,从数据趋势中揭示客户习惯、产品接受度、市场变化等业务特征,为银行各部门深入分析提供线索,为业务经营决策提供数据参考。33.下列SQL语句中,修改表结构的是____A、LTERB、CREATEC、UPDATED、INSERT答案:A34.欲往表中增加一条记录,应该用那一条SQL语句A、LTERTABLEB、INSERTINTOTABLE表明C、INSRERTINTO表名D、ROPTABLE答案:B解析:答案存疑35.在GBase中,在处理文本字符串时,可以去除字符串左边的空格的关键字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:C36.下列哪个是将csv文件读入DataFrame的正确选项?A、pd.to_csv()B、pd.write_csv()C、pd.read_csv()D、以上都不是答案:C37.在开展数据分析项目的过程中,关于敏感数据的使用,说法正确的是____A、归口管理部门审批即可B、随意使用C、须经主管业务数据的业务审批部门和归口管理部门联合审批D、主管业务数据的业务部门审批即可答案:C解析:在开展数据分析项目的过程中,关于敏感数据的使用,须经主管业务数据的业务审批部门和归口管理部门联合审批。38.在数据分析挖掘平台Woody的笔记本(Notebook)中,假设已经使用Python语言定义好函数add_numbers(a,b),那么执行add_numbers??的效果是以下哪个?A、显示函数的概要信息B、显示函数的源代码C、调试函数D、执行报错答案:B39.在数据分析挖掘平台Woody的笔记本(Notebook)中,执行哪个命令可以安装指定的包?A、!pipshowSomePackageB、!pipsearchSomePackageC、!pipinstallSomePackageD、!pipuninstallSomePackage答案:C40.在一个神经网络中,下面哪种方法可以用来处理过拟合A、DropoutB、批标准化(BatchNormalization)C、正则化(regularization)D、都可以答案:D41.在分类任务中,被分类器正确分类的样本占全部样本的比例称为______。A、准确率B、召回率C、精确率D、F1分数答案:A42.相关系数为正数表明两个随机变量____A、负相关B、正相关C、不相关D、以上都不对答案:B43.由于银行长期战略规划失当,导致遭受整体损失的不确定性,指的是____A、市场风险B、操作风险C、战略风险D、信用风险答案:C44.在GBase中,对数据求最小值时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:D45.在GBase中,删除数据表时应使用下列哪组关键字:A、selecttoB、deletefromC、insertintoD、eletein答案:B46.预测客户未来资产变化情况,指导客户经理寻找潜在目标客户,预防客户流失,属于数据分析在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:D47.箱型图中箱子中间的横线为____所在的位置A、平均数B、中位数C、众数D、方差答案:B48.在项目的___阶段,可以结合时间维度、空间维度来尽可能多地设计特征,后续基于算法来筛选出有效特征。A、特征降维B、特征选择C、数据清洗D、特征设计答案:D解析:在项目的特征设计阶段,可以结合时间维度、空间维度来尽可能多地设计特征,后续基于算法来筛选出有效特征。49.支持关系模型的数据库系统是____A、网状数据库B、层次数据库系统C、关系数据库系统D、以上均支持答案:C50.下列属于无监督学习的是______。A、k-meansB、SVMC、最大熵D、CRF答案:A51.下面哪个方法可以将多级索引的Series转化为普通索引的DataFrame?A、stack()B、unstack()C、index()D、sort()答案:B52.____应建立外部数据档案库,对立项材料、数据需求、合同协议、验收报告、应用评价等文本进行存档管理。A、数据管理部门B、法律合规部门C、客户部门D、技术实施部门答案:A解析:数据管理部门应建立外部数据档案库,对立项材料、数据需求、合同协议、验收报告、应用评价等文本进行存档管理。53.业务部门下载并填写申请使用数据分析挖掘平台的普通数据。A、《数据分析挖掘平台用户申请表》B、《数据分析挖掘平台数据申请表》C、《关于申请使用数据分析挖掘平台数据的函》D、《关于申请导出数据分析挖掘平台数据的函》答案:B54.相关系数的取值范围是____A、[-1,1]B、[0.5,0.75]C、[1,2]D、[0,1]答案:A55.以下哪个选项不是数据分析师的必备技能?A、懂业务B、懂数据C、熟悉机器学习D、熟悉CSS答案:D56.在SQL语言中,子查询是____。A、返回单表中数据子集的查询语言B、选取多表中字段子集的查询语句C、选取单表中字段子集的查询语句D、嵌入到另一个查询语句之中的查询语句答案:D57.Python中,下列选项哪个是正确的函数定义语句____A、deffunc()B、deffunc()C、functionfunc()D、functionfunc()答案:A解析:答案存疑58.在机器学习流程中,什么是数据和模型之间的纽带?A、特征B、编码C、数据库D、可视化工具答案:A59.下面哪个是Sigmoid函数的表达式____。A、f(x)=1/(1+exp(-x))B、f(x)=1/(1+exp(-2x))C、f(x)=exp(-x)D、f(x)=exp(-x)/(1+exp(-x))答案:A解析:本题考查的是激活函数Sigmoid的表达式。Sigmod函数f(x)=1/(1+exp(-x))将输入映射到0,1之间,且具有单调递增的性质,是早期神经网络经常使用的一个激活函数。60.相关系数最大值?A、0B、1C、3.1416D、2.7183答案:B61.现阶段,我行仍按照“集中为主,统分结合”的建设模式,持续完善“1+N”数据分析师队伍。其中,1是指____。A、总行信息管理部专职数据分析师B、总行业务部门兼职数据分析师C、一级分行科技部门专职数据分析师D、一级分行业务部门兼职数据分析师答案:A62.数据库中存储的基本对象是____。A、行B、列C、数据D、属性答案:C解析:数据是数据库中存储的基本对象,描述事物的符号记录称为数据。63.银行签发,承诺自己在见票时无条件支付确定的金额给收款人或者持票人,指的是____。A、银行汇票B、商业汇票C、银行本票D、支票答案:C64.下列哪个是将DataFrame导出为csv文件格式正确选项?A、pd.to_csv()B、pd.read_table()C、pd.read_csv()D、以上都不是答案:A65.在我行大数据服务体系工作框架中,解决数据“可不可用”的是____A、建设一个平台——实现数据集中存储、共享使用B、构建两类资源——对数据进行进一步整合加工C、夯实三项基础——做好数据标准、质量和安全工作D、打造四种服务——数据分析挖掘、经管信息服务、系统数据服务答案:C66.假设x1表示数组array([5,0,3,3,7,9]),在切片获取时,x1[:4]获取的子数组是?A、rray([5,0,3])B、Array([5,0,3,3])C、Array([0,3,3])D、Array([3,7,9])答案:B67.在构建理财精准营销模型中,不包括以下哪一步?A、特征设计B、线索排查C、数据清洗D、模型优化答案:B68.训练误差非常小,泛化误差特别大,这种现象称之为什么?A、过拟合B、欠拟合C、完美拟合D、随机拟合答案:A解析:训练误差非常小,而泛化误差特别大,这一现象称为“过拟合”。69.mole中数据探查可在____节点上进行。A、未执行节点B、执行成功节点C、正在执行的节点D、执行错误的节点答案:B解析:数据探查只能在执行成功的节点上操作。70.下面哪个是Tanh函数的表达式A、f(x)=1/(1+exp(-x))B、f(x)=max(0,x)C、f(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x))D、f(x)=exp(-x)/(1+exp(-x))答案:C71.在数据分析挖掘平台Woody的笔记本(Notebook)中,以下哪种操作可以建立一个三级标题A、在一个Markdown单元格中输入1.1.1heading并执行B、在一个Markdown单元格中输入#heading并执行C、在一个Raw单元格中输入1.1.1heading并执行D、在一个Raw单元格中输入#heading并执行答案:B72.业务人员通过标签中心开展精准营销的流程是:____。A、明确营销目标、确定业务规则、圈定客群、申请数据对接、开展实际应用B、圈定客群、分析客群概况、确定业务规则、申请数据对接、开展实际应用C、圈定客群、申请数据对接、开展实际应用、分析客群概况、确定业务规则D、申请数据对接、开展实际应用、圈定客群、分析客群概况、确定业务规则答案:A73.在数据分析挖掘平台Woody中,在以下哪个页面中可以启用插件?A、FilesB、RunningC、lustersD、Nbextensions答案:D74.下列选项哪个符合自定义的Python标识符的命令规则A、enddateB、3enddateC、2020enddateD、while答案:A75.由于很多模型对缺失值有容忍度或灵活的处理方法,可以采用不处理对待缺失值。以下哪个模型可以实现这个功能?A、逻辑回归B、聚类算法C、冒泡算法D、决策树答案:D解析:常见的能够自动处理缺失值的模型包括:KNN(忽略,缺失值不参与距离计算)、决策树(缺失值视为分布的一种状态,并参与到建模过程)、随机森林、神经网络、朴素贝叶斯。76.在mole模型列表界面中,当用户希望将已有的模型导入时,导入的文本为____格式。A、htmlB、jsonC、svD、xml答案:B77.在统计学中,下列哪个常用概率分布是连续分布?A、0-1分布B、二项分布C、正态分布D、泊松分布答案:C78.在Python中tup2=1,'abc','bank';那么print(tup2)的结果是____A、(1,'abc','bank')B、[1,'abc','bank']C、1D、报错答案:A79.我行金融科技业务的首要目的是________。A、服务母行B、服务股东C、服务客户D、服务中国经济答案:A80.在SQL的查询语句中,groupby选项实现对结果表的什么功能?A、分组统计B、求和C、查找D、排序答案:A81.在数据分析挖掘平台Woody中,使用R语言新建一个笔记本(Notebook)后,执行以下哪个命令可以连接数据库?A、INITB、INIT_WOODYC、INIT_WOODY_DBD、INIT_WOODY_R答案:D82.在GBase中,将表中的所有属性列都选出来,除了在SELECT语句后列出所有列名,还可以使用下列哪个方法:A、select/B、select*C、select%D、select#答案:B83.以下哪项不是数据挖掘平台可编辑的工具?A、MoleB、数据可视化C、SASD、Woody答案:C解析:数据挖掘平台可编辑的工具包括Woody、Mole、数据可视化84.在GBase中,在处理文本字符串时,可以返回字符串长度的关键字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:D85.下面哪个聚合函数可以计算方差?()A、varB、countC、minD、prod答案:A86.下列选项中,Python不支持的数据类型是____A、intB、floatC、harD、str答案:C87.在mole中的SQL节点上,可通过何种sql语句对数据集进行操作?A、Transact-SQLB、PL/SQLC、k-sqlD、Sparksql答案:D88.业务部门下载并填写____申请使用数据分析挖掘平台的敏感数据。A、《数据分析挖掘平台用户申请表》B、《数据分析挖掘平台数据申请表》C、《关于申请使用数据分析挖掘平台数据的函》D、《关于申请导出数据分析挖掘平台数据的函》答案:C89.项目管理员对数据使用申请中内容的必要性、可行性进行审核,审核通过的,由____实施数据授权。A、项目负责人B、审批负责人C、项目管理员D、对口业务负责人答案:C90.使用UPDATE语句更新数据库中的数据,以下说法正确的是____A、如果没有数据被更新,将提示错误信息B、更新数据时,必须带有WHERE条件子句C、每次只能更新一行D、每次可以更新多行数据答案:D解析:答案存疑91.在神经网络中,如果我们用了一个过大的学习率会发生什么____。A、神经网络会收敛B、神经网络不会收敛C、都有可能D、都不对答案:B92.在Woody中,向项目授权表的访问权限和回收权限的语句分别是:A、grant,removeB、grant,revokeC、revoke,grantD、grant,delete答案:B93.向他人出售或提供我行客户信息的行为____A、既违反行内规定,又违反国家法律B、只违反行内规定,不违反国家法律C、既不违反行内规定,也不违反国家法律D、没有相关内部规定和法律法规提及此事答案:A94.在GBase中,将数据插入数据表时应使用下列哪种语句:A、select语句B、create语句C、insert语句D、rop语句答案:C95.下面____选项属于bagging算法?A、GBDTB、XGBoostC、LightGBMD、RandomForest答案:D96.在下面的选项中与np.absolute函数功能相同的是哪个?A、np.expB、np.absC、np.powerD、np.sum答案:B97.我行数据中台建设的核心内容是打造以______为基础的“内容+管理+服务”的一体化平台。A、数据仓库B、业务C、分析平台D、大数据平台答案:D98.在mole中,若要计算模型的精确率和召回率,可拖拽何种节点到画布上?A、模型评估B、特征估计C、特征转化D、数据拆分答案:A99.在进行SQL多表连接查询时,用____表明连接的条件。A、FOR或WHILEB、FOR或WHEREC、WHERE或OND、JOIN或ON答案:C100.在mole中,____节点可以使数据集按某列排序后并选择前N个元素输出。A、JoinB、GroupByKeyC、TopND、ReduceByKey答案:C101.在数据分析工作中,在____阶段,对收集到的数据进行加工整理,使之形成适合数据分析的样式。A、数据收集B、数据处理C、明确分析目的和思路D、构建模型答案:B102.业务部门向归口管理部门发起____申请导出数据分析挖掘平台的普通数据。A、《数据分析挖掘平台用户申请表》B、《数据分析挖掘平台数据申请表》C、《关于申请使用数据分析挖掘平台数据的函》D、《关于申请导出数据分析挖掘平台数据的函》答案:D103.下面不属于集成学习方法的是____。A、BoostingB、aggingC、AprioriD、RandomForest答案:C104.在数据分析挖掘平台Woody项目主界面的Files页面中,若想使用文件检索功能,应开启哪个插件A、CellFilterB、TableofContentsC、TreeFilterD、highlighter答案:C105.在数据分析挖掘平台的管理中,总行____负责制定数据安全策略,负责平台数据安全和合规管理。A、信息管理部B、业务部门C、科技部门D、信息管理部或科技部门答案:A106.下面哪个是二进制类型?A、DATEB、VARCHARC、BLOBD、INT答案:C107.以下哪个函数不属于SQL文本处理函数:A、LEFT()B、SUM()C、AST()D、LENGTH()答案:B108.以下哪个函数不属于SQL数值处理函数:A、COS()B、SQRT()C、TAN()D、LOWER()答案:D109.下面属于聚类算法的是____。A、K-meansB、XGBoostC、AprioriD、RandomForest答案:A110.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?A、自然语言处理B、聚类C、关联分析D、隐马尔可夫链答案:B解析:本题考查的是聚类的定义。聚类是把整个数据库分成不同的群组,它的目的是使群与群之间的差别明显,而同一个群之间的数据尽量相似。111.因业务、技术发展战略发生重大变动导致项目无法继续开展的数据分析项目应该申请___A、项目终止B、项目结项C、项目延续D、无需操作答案:A112.在GBase中,对数据去重时可以使用下列哪个函数:A、SUMB、AVGC、DISTINCTD、COUNT答案:C113.以下哪个是分布式文件系统?A、HDFSB、SparkC、HBaseD、MLlib答案:A114.下列____选项不是公私联动区的数据资产范围。A、代发工资B、商户C、存款D、数字人民币答案:C115.在GBase中,使用alter语句修改数据表时,修改一列的名称要用到的关键字是:A、dropB、changeC、modifyD、rename答案:B116.现阶段,我行仍按照“集中为主,统分结合”的建设模式,持续完善“1+N”数据分析师队伍。其中,N是指____。A、总行各部门(除数据分析核心团队)、各分行数据分析师团队B、总行信息管理部数据分析师核心团队C、一级分行科技部门专职数据分析师D、一级分行业务部门兼职数据分析师答案:A117.在进行数据分析项目时,肯定会在数据分析挖掘平台上申请权限、使用数据,所以在申请数据使用前,一定要充分了解我行的___A、数据加密算法B、数据管理原则C、数据授权步骤D、数据删除规定答案:B118.下列的几个算法哪个不是分类算法?A、线性回归B、逻辑回归C、随机森林D、支持向量机答案:A119.在SQL中,建立表用的命令是?A、CREATETABLEB、CREATERULEC、REATEVIEWD、CREATEINDEX答案:A120.下面哪个选项不是Pandas的基本数据结构?A、SeriesB、DataFrameC、IndexD、NumPy答案:D121.在Woody中,向项目授权表的访问权限和回收权限的语句分别是:A、grant,removeB、grant,revokeC、revoke,grantSELECTD、grant,deleteSELECT答案:B122.以下____节点可提供聚类算法。A、逻辑回归B、随机森林C、GBDTD、K-means答案:D123.以下关于SQL的GROUPBY使用正确的是____A、SELECTstu_name,COUNT(stu_sex)FROMstudentGROUPBYstu_sex;B、SELECTstu_sex,COUNT(stu_sex)FROMstudentGROUPBYstu_sex;C、SELECTstu_nameFROMstudentGROUPBYstu_sex;D、SELECTstu_sex,COUNT(stu_name)FROMstudentGROUPBYstu_name;答案:B解析:GROUPBY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUPBY子句中指定相同的表达式。不能使用别名124.组合多条SQL查询语句形成组合查询的操作符是____。A、LLB、UNIONC、SELECTD、LINK答案:B125.下面哪些操作不需要拥有特殊权限?A、CREATETABLEB、DROPDATABASEC、SELECTD、ROPTABLE答案:C解析:CREATETABLE、DROPDATABASE、DROPTABLE都需要用户拥有对应的创建、删除权限方可进行。126.业务部门根据数据分析项目需要,可以向____申请数据分析挖掘平台用户。A、科技部门B、信息管理部C、业务部门D、科技部门或信息管理部答案:B127.下列选项,哪项不属于数据分析挖掘的应用?A、预防客户流失B、系统升级C、识别诈骗行为D、分析产品覆盖率答案:B128.以下_____属于分行数据集市共性区中间层数据。A、M_BDM_00PL_MID_TRST_PLAN_DVB、LH_00ABIS_APSC、IDX_P0063_HD、SCN_G2051_H答案:A129.相关系数为负数表明两个随机变量____A、负相关B、正相关C、不相关D、以上都不对答案:A解析:相关系数的取值在[-1,1]上,-1表示负相关,即变换相反,1表示正相关,0则表示不相关。130.在数据分析挖掘平台Woody的笔记本(Notebook)中,选中一个单元格后,如果需要执行该单元格,那么以下哪种操作方式是无效的?A、Ctrl+EnterB、EnterC、点击工具栏的“Run”按钮D、选择菜单栏Cell->RunCells答案:B131.在数据分析挖掘平台Woody的笔记本(Notebook)中,如何操作完成Python与R内核的切换?A、Kernel->InterruptB、Kernel->RestartC、Kernel->ChangekernelD、Kernel->Shutdown答案:C132.下列哪个选项是pandas索引器?A、lineB、ilocC、olumnsD、values答案:B133.在数据分析挖掘平台Woody的笔记本(Notebook)中,编辑模式下在代码单元格输入表达式时,按下Tab键的作用是____A、执行代码B、切换单元格C、切换到命令模式D、变量补全答案:D134.在SQL中,创建视图用____命令?A、CREATESCHEMAB、CREATETABLEC、REATEINDEXD、CREATEVIEW答案:D135.在文献中,属性、维度(dimension)、特征(feature)、变量(variate)、因子(factor)都可以互换的使用。以上哪一个,一般用在数据仓库中。A、维度(dimension)B、特征(feature)C、变量(variate)D、因子(factor)答案:A136.项目目标完成后,____负责审批并办理项目结项手续,归档相关项目资料。A、项目申请部门B、项目实施部门C、项目统筹管理部门D、业务部门答案:C137.下列____选项不是对公数据集市的上层应用A、CMMB、DCRMC、数据分析挖掘平台D、经营管理平台答案:B138.以下不属于我行大数据平台整体架构体系的是____。A、数据交换层B、数据处理层C、数据应用层D、数据架构层答案:D解析:我行大数据平台体系自下而上分别为源数据层、数据交换层、数据处理层、集市/资产层、数据服务层、数据应用层。139.在决策树中,用来表示类别的结点是____A、根结点B、叶结点C、内部结点D、以上都是答案:B140.下面的选项中表示排序的是?A、np.sortB、np.sumC、np.countD、np.mean答案:A141.我们通常所说的会计科目,来自____系统。A、BoEingB、C3C、IFARD、CRM答案:C142.下列聚集函数中正确的是____。A、SUM(*)B、MAX(*)C、OUNT(*)D、AVG(*)答案:C143.在Python中,下列哪种操作能够正确导入XGBoost库?A、importsklearnasxgboostB、fromsklearnimportxgboostasxgbC、importsklearn.xgboostasxgbD、importxgboostasxgb答案:D144.下列选项哪个不是绘图的库?A、NumPyB、SeabornC、MatplotlibD、pyecharts答案:A145.一国经济中最重要的金融中介机构是____。A、中央银行B、政策性金融中介机构C、非银行金融机构D、商业银行答案:D146.____是主管业务数据的业务审批部门和数据分析项目的需求申请部门。A、信息管理部B、项目申请部门C、科技部门D、信息管理部或科技部门答案:B解析:项目申请部门是主管业务数据的业务审批部门和数据分析项目的需求申请部门。147.噪声数据会对模型训练产生影响,哪个选项不是常用的处理噪声数据的方法?A、数据分箱B、调整学习率C、数据聚类D、人工检查答案:B148.下面哪种不属于数据预处理的方法?A、数据变换B、数据离散化C、数据清洗D、模型评估答案:D149.在数据分析挖掘平台Woody的笔记本(Notebook)中,使用Python,执行importnumpy后,再执行哪个命令可以获得numpy顶层函数中包含load的函数名列表A、numpy.load?B、numpy.*load*C、numpy.*load*?D、numpy.*load*??答案:C150.以下哪个是聚类算法____A、K-meansB、XGBoostC、AprioriD、RandomForest答案:A151.下面哪个函数的作用是删除缺失值?A、Fillna()B、Isnull()C、Notnull()D、ropna()答案:D152.在计算机信息组织和存储中,最基本的单位是____A、字节B、二进制位C、字D、双字答案:B153.由于某一国家或地区的经济、政治、社会文化及事件,导致该国家或地区借款人或债务人没有能力或者拒绝偿付商业银行债务,指的是____A、市场风险B、操作风险C、国别风险D、信用风险答案:C154.在数据分析挖掘平台的管理中,总行____负责制定平台管理制度,明确工作流程和职责。A、信息管理部B、业务部门C、科技部门D、信息管理部或科技部门答案:A155.在Markdown单元格中,通过什么符号,可以生成指向URL的超链接?A、()B、[]C、{}答案:B156.在GBase中,进行表关联时要用到的关键字是:A、join……inB、join……orC、join……onD、join……if答案:C157.下列哪些机器学习算法使用了Bagging学习方法思想?A、随机森林B、AdaboostC、GBDTD、XGBoost答案:A解析:本题考查Bagging算法的应用。集成学习主要有Bagging(套袋法)和Boosting(提升法)两种方法,两者在样本选择、样例权重、子分类器权重、并行计算等规则的设计上有所差异。Bagging的典型应用是随机森林算法(RandomForest),使用成百上千棵决策树开展并行预测,然后按照投票多数规则给出样本的最终分类结果。158.一般使用何种连接方式来替代从相同表中检索数据的子查询语句?A、自然连接B、内连接C、自连接D、外连接答案:C159.SQL从groupby分组的结果集中再次用条件表达式进行筛选的子句是____A、FROMB、ORDERBYC、HAVINGD、WHERE答案:C解析:HAVINGwhere_definition:使用GROUPBY子句对数据分组后,使用聚集函数计算各个分组的值,最后用HAVING子句过滤掉不符合条件的分组。160.下列选项中不属于分类算法的是______。A、线性回归B、逻辑回归C、随机森林D、支持向量机答案:A161.当日AUM余额、活期存款余额、理财月日均余额标签属于____主题。A、产品合约B、资产主题C、负债主题D、交易主题答案:B162.用于删除结果集中重复的行地关键词是?A、LLB、DISTINCTC、HAVINGD、NULL答案:B163.numpy中常用的聚合函数中,计算标准差的函数是____A、dB、np.varC、np.meanD、np.std答案:D164.下面哪个能查询平均成绩大于等于60分的学生名单?A、SELECTstu_idFROMstudentgroupbystu_idwhereAVG(score)>=60B、SELECTstu_idFROMstudentgroupbystu_idhavingAVG(score)>=60C、SELECTstu_idFROMstudentwhereAVG(score)>=60D、SELECTstu_idFROMstudenthavingAVG(score)>=60答案:B165.在数据分析挖掘平台Woody的笔记本(Notebook)中,若使用Python,在Raw单元格中输入print(1+1),执行该单元格后的效果是____A、单元格生成输出(output)域,输出显示结果为2B、单元格不生成输出(output)域,单元格显示结果为2C、单元格不生成输出(output)域,单元格显示结果为print(1+1)D、执行报错答案:C166.在GBase中,使用drop语句删除数据表时,使用___关键字,可以防止由于数据库不存在而报错。A、ifexistsB、existsC、havingD、ifexisting答案:A167.在SQL查询时,使用WHERE子句指出的是____A、查询目标B、查询条件C、查询视图D、查询结果答案:B168.下面哪个不属于关系完整性约束条件?A、关系完整性B、实体完整性C、参照完整性D、用户定义完整性答案:A169.在Woody中,新建一个文件夹应进行的操作是____A、New→TextFileB、New→FolderC、New→TerminalD、New→Python3答案:B解析:在Woody中,新建一个文件夹应进行的操作是New→Folder170.欲往表中增加一条记录,应该用那一条SQL语句____A、LTERTABLEB、INSERTINTOTABLE表名C、INSRERTINTO表名D、ROPTABLE答案:B解析:答案存疑171.下面哪个聚合函数可以计算分位数?()A、meanB、quantileC、ountD、prod答案:B172.下列哪个函数可以快速检查NumPy数组所有元素是否为True?A、np.any()B、np.sum()C、np.all()D、np.count()答案:C解析:答案存疑173.在数据分析挖掘平台的管理中,下列不是总行信息管理部的职责的是____。A、制订数据分析项目管理相关规章制度和标准规范,健全项目管理机制B、制定数据安全策略,负责平台数据安全和合规管理C、负责数据分析挖掘平台及分析挖掘工具的资源保障、运维及监控D、负责组织平台的应用推广工作答案:C解析:在数据分析挖掘平台的管理中,下列是总行信息管理部的职责的是制订数据分析项目管理相关规章制度和标准规范,健全项目管理机制、制定数据安全策略,负责平台数据安全和合规管理、负责组织平台的应用推广工作174.在Python中不满足条件返回True,满足条件则返回False的逻辑运算符是____。A、orB、notC、elseD、and答案:B解析:本题考查Python中的逻辑运算符。not条件:不满足条件返回True,满足条件则返回False。175.下列选项哪个不是绘图的库?A、NumPyB、SeabornC、MatplotlibD、以上都不是答案:A176.以下哪个选项不是常见的数据质量问题?A、数据不正确性B、数据不完整性C、数据不可复制性D、数据不一致性答案:C177.在GBase中,对数据计数时应使用下列哪个函数:A、SUMB、AVGC、DISTINCTD、COUNT答案:D178.下面有关SQL的HAVING子句描述错误的是____。A、HAVING子句应该与GROUPBY子句同时使用B、使用HAVING子句的同时不能使用WHERE子句C、使用GROUPBY子句对数据分组后,使用聚集函数计算各个分组的值,最后用HAVING子句过滤掉不符合条件的分组。D、HAVING子句在数据分组后进行过滤答案:B179.数据分析挖掘平台中点击哪个按钮可以进入指定项目?A、进入项目B、成员信息C、项目授权D、以上都不是答案:A180.指标______是对指标管理分工与要求的描述,具体包含主管部门、安全等级、发布系统。A、基本信息B、统计信息C、口径信息D、管理信息答案:D181.在Python中,字符串使用____定义A、一对单引号B、一对双引号C、一对单引号或一对双引号都可以D、以上都不对答案:C182.在GBase中,使用IN谓词的正确格式是:A、SELECTa,bFROMt2WHEREbIN;B、SELECTa,bFROMt2WHEREbIN(40,50);C、SELECTa,bFROMt2WHEREbIN[40,50];D、SELECTa,bFROMt2WHEREbINfrom[40,50];答案:B183.在无量纲化方法中,如果属性值服从正态分布,标准化后,其转换成标准正态分布。这个方法是什么?A、数据转换B、数据提取C、数据标准化D、数据去重答案:C184.在GBase中,对数据求平均值时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:B185.技术数据资产包含:A、系统B、表C、字段D、以上都对答案:D解析:数据全视图:作为我行所有数据资产的汇集中心,将收集我行各种技术数据资产(系统、表、字段)、业务数据资产(指标、报表、模型、标签)、管理数据资产(各系统服务目录、主数据)、流程数据(数据治理流程中产出的数据等)、以及行外一切对使用数据有用的数据资产186.在Woody中,想要查看知识库中的Woody操作手册,应当使用____A、案例库B、方法库C、操作库D、都不对答案:C187.在处理大型分类变量中,有哪种方法可以将一个可能无界的整数映射到一个有限的整数范围[1,m]中。A、分箱计数B、特征标准化C、特征散列化D、特征排序答案:C188.在数据分析挖掘平台Woody的笔记本(Notebook)中,若使用Python,在Code单元格中输入print(1+1),执行该单元格后的效果是____A、单元格生成输出(output)域,输出显示结果为2B、单元格不生成输出(output)域,单元格显示结果为2C、单元格不生成输出(output)域,单元格显示结果为print(1+1)D、执行报错答案:A189.我行自主研发的基于Spark架构的数据分析挖掘工具是____A、MolerB、MoleC、WoodyD、Wood答案:B190.下列哪个计划是服务于数据分析师队伍建设的?A、星辰计划B、繁星计划C、新芽计划D、新苗计划答案:B191.在神经网络中,下面哪种方法可以用来处理过拟合____。A、DropoutB、批规范化C、正则化D、都可以答案:D192.下列聚合函数中计算元素的方差的是?A、dB、np.varC、np.meanD、np.std答案:B193.相关系数为0表明两个随机变量____A、负相关B、正相关C、不相关D、以上都不对答案:C194.以下属于外部数据合作模式的是____。A、原始数据推送B、数据服务接口C、内外合作建模D、以上都是答案:D解析:外部数据合作模式可分为原始数据推送、数据服务接口、内外联合建模三种类型。195.下面属于有监督学习的是?A、数据统计B、分类C、聚类D、关联分析答案:B196.执行多行sql语句的Woody内建魔术命令是____A、%%sqlB、%sqlC、%sqlstrD、%magic答案:A197.以下哪个是分布式计算框架?A、HDFSB、SparkC、HBaseD、MLlib答案:B198.在数据资源汇集方面,我行数据中台将大数据平台提升优化为______,汇集行内系统数据和外部引入数据,从物理上打破数据孤岛,形成全行统一的数据中心,实现数据资源集成与共享。A、数据湖B、数据仓库C、数据池D、数据海答案:A199.在SQL语句中,与AGEBETWEEN20and30等价的表达式是____A、GE>=20andAGEB、AGE>20andxC、AGE>20andAGED、AGE>=20andAGE<=30答案:D200.预测股票价格属于____A、预测建模B、聚类分析C、关联分析D、异常检测答案:A201.在统计学中,下列哪个常用概率分布是离散分布?A、正态分布B、均匀分布C、0-1分布D、指数分布答案:C202.用户权限方面,标签中心采用____精准控制用户数据权限,根据用户所在机构层级和业务条线,控制用户的每一个标签权限。A、行控制B、列控制C、按机构D、权限矩阵答案:D203.在GBase中,对数据求和时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:A204.数据控制语言的缩写是____A、DDLB、DMLC、DCLD、BL答案:C解析:数据控制(DCL,DataControlLanguage)205.SQL使用什么关键字可以把重复行屏蔽____A、DISTINCTB、UNIONC、ALLD、TOP答案:A解析:Distinct命令可以对字段进行去重206.在数据加工中,准确的业务逻辑和口径规则由哪个部门提供____。A、归口管理部门B、业务部门C、科技部门D、内控合规部门答案:B解析:本题主要考查数据加工环节的质量管控。“业务部门负责提供准确的业务逻辑和口径规则。”207.在数据资产视图中,____展示大数据平台主库和数据集市的数据。A、基础数据目录B、指标报表目录C、挖掘模型目录D、以上都不对答案:A208.在数据分析挖掘平台Woody项目主界面的Files页面中,对正在运行(Running)的笔记本文件,不能执行以下哪种操作?A、复制(Duplicate)B、删除(Delete)C、停止(Shutdown)D、移动(Move)答案:D209.现阶段,我行仍按照“集中为主,统分结合”的建设模式,持续完善“1+N”数据分析师队伍。下列哪个选项不是其中的“N”?A、总行信息管理部数据分析师核心团队B、总行业务部门兼职数据分析师C、一级分行科技部门专职数据分析师D、一级分行业务部门兼职数据分析师答案:A解析:“1+N”数据分析师队伍。其中,1是指总行信息管理部数据分析师核心团队,N是指总行各部门(除数据分析师核心团队)、各分行数据分析师团队。210.在Python中,多行注释使用____表示A、三个单引号B、三个双引号C、三个单引号或三个双引号都可以D、以上都不对答案:C解析:本题考查的是Python的注释。单行用“#”注释,多行用一对三个单引号''',或者一对三个双引号"""。211.在mole中,以下何种节点用来计算两个父节点输出的差集?A、UnionB、SubstractC、MapD、FlatMap答案:B212.数据分析挖掘平台的____由归口管理部门管理,负责平台用户、项目、数据等管理工作。A、平台管理员B、总分行管理员C、项目管理员D、分析师用户答案:B解析:总行管理员:总行用户,负责总行用户权限审批、项目统筹管理,以及数据授权、分析成果应用的审批;分行管理员:分行用户,负责所属行的用户、项目、数据、成果应用管理。213.python中,以下那个不是比较运算符A、B、!=C、>=D、+答案:D214.defmax(a,b):ifa>b:returnaelse:returnb能成功调用该Python函数的语句是____A、max(,5)B、max(-1)C、max(5,-1)D、max(5,-1,3)答案:C215.GBASE中,复制table_nameB的表结构来创建表table_nameA语句是____A、CREATETABLEtable_nameALIKEtable_nameB;B、CREATETABLEtable_nameBLIKEtable_nameA;C、REATETABLEtable_nameAFROMtable_nameB;D、CREATETABLEtable_nameBFROMtable_nameA;答案:A解析:CREATETABLEtable_name1LIKEtable_name2:复制table_name2的表结构来创建表table_name1216.SQL语句,如果a表中id列有1万个空字符(取值为‘’),b表中id列也有1万个空字符串,则两个表关联时将产生1亿条记录,此类情况称为A、笛卡尔积B、等值连接C、自然连接D、外连接答案:A217.从数据趋势中揭示客户习惯、产品接受度、市场变化等业务特征,为银行各部门深入分析提供线索,为业务经营决策提供数据参考,属于数据分析在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:C218.SQL仅去除字符串中最左侧的空格的函数是____A、RTRIM(str)B、LTRIM(str)C、TRIM(str)D、以上都可以答案:B219.为加快数据分析师队伍的建设,总行启动____。A、星星计划B、跟班学习C、树苗计划D、繁星计划答案:D220.哪个表每日生成了我行全量客户的金融资产汇总表,并汇总了个人客户的金融资产和AUM的数据。A、个人金融资产汇总表B、掌银非金融性交易流水表C、借记卡信息表D、个人金融产品明细表答案:A221.Boeing面向合约的多账户余额类型、高度抽象通用的结算模块、新合约分录设计,能够完成对客账务处理,生成标准的交易明细记录数据,交由____系统完成初始确认和后续计量等会计核算处理。A、BISB、IFARC、BoeingD、CMS答案:B222.grid=np.arange(1,10).reshape((3,3)),则grid的结果是?A、[1,2,3,4,5,6,7,8,9]B、[[1,2,3],[1,2,3],[1,2,3]]C、[[1,2,3],[4,5,6],[7,8,9]]D、[[2,3,4],[5,6,7],[8,9,10]]答案:C223.Mole平台,拖拽一个____节点完成两个父节点的数据合并A、过滤B、UnionC、SubstractD、Map答案:B224.期货按照交易的标的物(也称基础资产)的不同可分为____。A、金融期货和股指期货B、商品期货和金融期货C、指数期货和外汇期货D、农产品期货和金属期货答案:B225.SQL中LTRIM()函数的作用是____。A、去掉字符串右边的空格B、返回字符串右边的字符C、去掉字符串左边的空格D、去掉字符串左右两边的空格答案:C226.SQL语言是一种____语言A、层次数据库B、网络数据库C、关系数据库D、非数据库答案:C227.Woody底层支持海量数据的存储、加工和数据分析的数据库是____A、GbaseB、OracleC、SQLServerD、B2答案:A解析:Woody底层支持海量数据的存储、加工和数据分析的数据库是Gbase228.区间缩放法,是利用____信息,将特征的取值区间缩放到某个特定的范围。A、特征值B、边界值C、观察值D、标签值答案:B229.数据挖掘任务可以分为预测性任务和描述性任务。____的目标是根据其他属性的值,预测特定属性的值。A、预测性任务B、描述性任务C、二者均是D、二者均不是答案:A230.监督学习__标签,无监督学习__标签。A、有,无B、有,有C、无,无D、无,有答案:A231.数据分析挖掘平台Woody底层使用哪种数据库来存储分析数据____A、OracleB、SybaseC、MySQLD、Gbase答案:D232.共性数据区的英文简称是____。A、DSB、ODSC、BDSD、GDS答案:D233.Python中,下列选项哪个是正确的while循环语句____A、whileloopaB、whilea<10:C、whilea<10D、whileloopa答案:B234.更改数据表时可以使用下列哪种语句:A、select语句B、create语句C、alter语句D、rop语句答案:C235.KS值的取值范围是____A、[0,1]B、[-1,1]C、[-1.0]D、[0.5,1]答案:A236.数据分析挖掘是非常有价值的,它与现实生活是密切相关的,以下哪些是在银行中的应用场景?A、信用卡的审批额度B、掌银对消费者的产品推荐C、贵宾客户的流失预测D、以上全是答案:D237.数据库系统是由数据库、____、应用程序和数据库管理员构成A、DBMSB、DBC、DBSD、BA答案:A238.DataFrame属于python的哪个包。A、pandasB、numpyC、sklearnD、xgboost答案:A239.SQL增加表的记录数使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:B240.mole支持何种语言进行自定义函数编写?A、PythonB、GoC、RD、Scala答案:D241.记录某个业务主题历史状态的数据表是____A、历史表B、切片表C、明细表D、拉链表答案:D242.使用SQL的UNION进行组合查询时需要注意以下哪条规则:A、UNION必须由两条或两条以上的SELECT语句组成,语句之间用关键字UNION分隔B、UNION中的每个查询必须包含相同的列、表达式或聚集函数C、列数据类型必须兼容D、以上三条都需遵守答案:D243.SQL语言中,条件“年龄BETWEEN40AND50”表示年龄在40至50之间,且。A、包括40岁和50岁B、不包括40岁和50岁C、包括40岁但不包括50岁D、包括50岁但不包括40岁答案:A244.出票银行签发,由其在见票时按照实际结算金额无条件支付给收款人或者持票人,指的是____A、银行汇票B、商业汇票C、银行本票D、支票答案:A245.Python中,执行什么语句之后,可以显示特征重要性。A、importnumpyasnpB、frommatplotlibimportpyplotaspltC、fromxgboostimportplot_importanceD、importpandasaspd答案:C解析:本题考查的是机器学习中特征重要性的展示方法,通常我们需要导入plot-importance,然后在算法中调用该函数就可以看到各个特征的重要性数值。246.SQL的聚集函数COUNT、SUM、MIN、MAX、AVG不允许出现在查询语句的____子句中A、SELECTB、HAVINGC、GROUPBYD、WHERE答案:C247.____的单条数据在一段时间区间内有效,一般采用起始日期startdate和截止日期enddate描述该条数据生效时点和失效时点。A、明细表B、切片表C、拉链表D、时间表答案:C248.外部数据引入与应用工作要以____为基本前提。A、稳定可靠B、合法合规C、节省成本D、权威近源答案:B249.Python中,下列哪个选项将字符串转换为浮点数?____A、int(x)B、long(x)C、float(x)D、str(x)答案:C250.当SQL查询获得的结果较多时,可以使用____语句显示少数几条数据A、WHEREB、HAVINGC、LIMITD、GROUPBY答案:C251.大数据服务体系的建设主线为____。A、数据资产管理—>数据服务应用—>数据价值实现B、数据资产管理—>数据价值实现—>数据服务应用C、数据服务应用—>数据资产管理—>数据价值实现D、数据服务应用—>数据价值实现—>数据资产管理答案:A252.______更多偏向于业务流程管控,将业务流程中共性的服务抽象出来,形成通用的服务能力。______则是抽象数据能力的共性形成通用数据服务能力。A、业务中台,数据仓库B、业务前台,数据仓库C、业务中台,数据中台D、业务前台,数据中台答案:C253.Woody平台,执行什么命令,安装指定的包A、!piplistB、!piplist-oC、!pipinstallSomePackageD、以上都不行答案:C254.SQL删除数据表用以下哪一项____A、DROPB、UPDATEC、DELETED、ELETED答案:A255.____负责根据相关安全管理要求确定数据分析挖掘平台脱敏策略及敏感数据字段清单。A、信息管理部B、科技部门C、业务部门D、各一级分行答案:A256.____是指通过具有已知值的变量来预测其他变量的值。A、关联B、回归C、聚类D、分类答案:B257.我行大数据平台体系分层自下而上排序正确的是____A、数据源层、数据集市层、大数据平台主库、数据应用层B、数据源层、数据集市层、数据应用层、大数据平台主库C、数据源层、大数据平台主库、数据应用层、数据集市层D、数据源层、大数据平台主库、数据集市层、数据应用层答案:D258.数据分析挖掘平台中点击哪个按钮可以查看项目成员?A、进入项目B、成员信息C、授权D、以上都不是答案:B259.熟悉行业知识、公司业务及流程,最好有自己独到的见解,指的是成为一名合格数据分析师的哪个前提?A、懂业务B、懂数据C、懂建模D、懂管理答案:A260.Python语句中一般以____作为语句的结束符A、新的一行B、分号C、句号D、逗号答案:A261.numpy中常用的聚合函数中,计算中位数的函数是____A、np.medianB、np.varC、np.meanD、np.std答案:A262.SQL使用GROUPBY完成分组后,利用____对分组结果进行排序。A、ORDERB、SORTBYC、SORTD、ORDERBY答案:D263.按照敏感程度,平台数据分为普通数据和____A、敏感数据B、历史数据C、行内数据D、机密数据答案:A264.python中,加法赋值运算符是____A、+B、+=C、=+D、=答案:B265.DataFrame中的columns属性表示的是?A、列名B、行名C、索引D、元素值答案:A266.Python中,表达式4.5%2的值为:____A、2.25B、2.35C、0.5D、0.25答案:C267.非结构化数据一般存储为____的数据格式。A、字符B、二进制C、数值D、十进制答案:B268.概念模型,也称信息模型,是按____的观点来对数据和信息建模,主要用于数据库设计。A、计算机系统B、现实世界C、数据D、用户答案:D269.____负责数据分析所需特征的设计以及特征数据的加工。A、项目实施部门B、项目申请部门C、总行办公室D、总行科技与产品管理局答案:A270.____是IFAR系统各项账务数据、报告数据组织的基本单位。A、报告主体B、账务主体C、核算主体D、会计主体答案:D271.SQL语句,以下将小写字符串转换为大写字符串的函数是____A、LOWER(str)B、LCASE(str)C、RTRIM(str)D、UPPER(str)答案:D272.SQL语言中,删除一个表的命令是?A、DELETEB、DROPC、LEARD、REMOVE答案:B273.对特征进行加,减,乘,除,生成新的特征,这种方法是什么?A、特征衍生B、特征选择C、特征归一化D、特征排序答案:A274.SELECT语句不显示设置ALL,DISTINCT和DISTINCTROW选项时,默认返回的是什么选项?A、LLB、DISTINCTC、DISTINCTROWD、NULL答案:A275.IFAR系统中,____是填制会计凭证、登记会计账簿、编制会计报表的基础,是对会计对象具体内容分门别类进行核算所规定的项目。A、主科目B、副科目C、会计科目D、报告科目答案:C276.SQL语句,如果列为主键,以下执行效率最高的是____A、count(列名)B、count(1)C、ount(*)D、全部答案:A解析:如果列为主键,count(列名)效率优于count(1)277.既可满足企业贸易往来的结汇、售汇需求,也可供市场参与者进行投资或投机的交易活动是____。A、外汇交易B、贵金属交易C、期货交易D、股票交易答案:A解析:外汇交易既可满足企业贸易往来的结汇、售汇需求,也可供市场参与者进行投资或投机的交易活动。278.假设x=np.array([1,2,3,4,5]),那么np.any(xA、rray([1,2,3,4,5])B、5C、FALSED、TRUE答案:D279.Boeing面向合约的多账户余额类型、高度抽象通用的结算模块、新合约分录设计,能够完成对客账务处理,生成标准的交易明细记录数据,交由新核算与报告系统系统完成初始确认和后续计量等会计核算处理,实现____的分离。A、交易与记账B、交易与核算C、记账与核算D、记账与计量答案:B280.Python标准库包含用于日期date和时间time数据的数据类型,而且还有日历方面的功能。函数datetime是以什么形式存储日期和时间的?A、年B、月C、日D、秒答案:D281.编程语言通常有固定的后缀,例如Golang文件是"test.go",Python文件的后缀通常定义为:____A、jsB、txtC、pyD、png答案:C282.Boeing指的是____。A、新一代核心银行系统B、新核算与报告系统C、信贷管理系统D、个人客户营销与管理系统答案:A解析:新一代核心银行系统,BlueOceanEngine蓝海引擎,简称BoEing。283.Woody平台点击那个按钮可以进入指定项目?A、打开B、成员C、授权D、以上都不是答案:A284.____是长期储存在计算机内,有组织的、可共享的大量数据的集合。A、数据库B、索引C、主键D、视图答案:A285.数据资产视图可以解决的问题有____A、有什么数据资产B、数据资产在哪里C、数据资产能怎么用D、以上都对答案:D286.假设x1表示数组array([5,0,3,3,7,9]),那么x1[-1]的结果是?A、5B、3C、7D、9答案:D287.____是要找到不同事物之间的关联程度,确定哪些事物会一起出现。A、预测建模B、聚类分析C、关联分析D、异常检测答案:C288.数据挖掘平台Woody工具里,执行什么命令,列出已安装的包?A、!piplistB、!piplist-oC、!pipinstallSomePackageD、以上都不行答案:A289.传统类数据服务的主要载体是展现经营管理状态和成果的____。A、报表与指标B、报表C、指标D、数据模型答案:A290.泊松分布的数学期望(均值)与其方差的关系?A、大于B、等于C、小于D、不一定答案:B291.Python中,执行什么语句之后,可以使用聚合函数max、min。A、importmax,minB、importxgboostC、frommatplotlibimportpyplotaspltD、importpandas答案:A292.合理规划信息系统数据架构是哪个部门的职责。____A、科技部门B、业务部门C、归口管理部门D、内控合规部门答案:A293.对于明确需要落地部署的数据分析模型,项目申请部门向____提出部署申请。A、项目统筹管理部门B、项目申请部门C、项目实施部门D、技术支持部门答案:A294.____是满足新会计准则下会计确认、计量和记录需要,满足面向资本市场和国内外准则编制财务会计报告需要,并为后续管理提供决策支持的一个财务会计信息系统,是我行财会核算与报告的基础平台。A、BISB、IFARC、BoeingD、CMS3答案:B295.可以查看数据同步作业情况的栏目是____A、运行中心B、最新同步清单C、调度中心D、公告答案:B296.从数据分析的角度看,分析报告编制中的做法不正确的是____A、数据分析一定要确认可靠的数据源,保证数据的完整性和准确性,获取数据后第一步是检查数据的完整性,关键指标数据需要与业务发布数据做交叉核验。B、数据分析过程中要灵活运用归纳推理和演绎推理的逻辑思维方法,不断深入对目标数据的认识,得出规律性的分析结论。C、数据分析专注做好数据分析即可,无需考虑业务场景,只需按表格要求填报数据。D、重视异动数据的原因分析,业务场景变化、系统生产变更、特殊事件影响等都是常见的异动原因。答案:C297.数据分析挖掘平台中,在项目结项、终止或被取消授权后,用户对该项目的____自动收回。A、数据授权B、模型授权C、代码授权D、全部授权答案:D298.如果想查看数据表的详细字段信息,可以使用数据分析挖掘平台的哪个工具?A、放大镜B、公告内容C、数据分析挖掘社区D、以上都不对答案:A299.将原始数据进行清理、转化是在以下哪个步骤的任务?A、数据收集B、数据处理C、模型评估D、构建模型答案:B300.python中,以下那个不是比较运算符A、B、!=C、>=D、+答案:D301.SQL语句,使用like进行模糊查询时,以下____会导致全表扫描。A、select*fromtable_1whereusernamelike‘%yue%’B、select*fromtable_1whereusernamelike‘yue%’C、select*fromtable_1whereusernamelike‘wang%’D、select*fromtable_1whereusernamelike‘li%’答案:A302.外部数据引入过程中的数据出行,要按照____原则,采取一定的安全保密措施。A、稳定可靠B、合法合规C、最小必要D、权威近源答案:C303.数据分析挖掘平台Woody环境采用GBase作为后台数据库,与传统关系型数据库不同,该数据库采用的存储方式是____。A、行存储B、列存储C、二维表存储D、键值存储答案:B解析:数据分析挖掘平台Woody环境采用GBase作为后台数据库,与传统关系型数据库不同,该数据库采用列存储的方式,并无主键(primarykey)的定义304.删除数据表时可以使用下列哪种语句:A、select语句B、create语句C、insert语句D、rop语句答案:D解析:DROP是删除数据表的命令305.SQL语句,在关联数据量较大的表,或者需要重复关联多张数据表后进行汇总加工时,可以考虑____提升查询效率。A、新建复制表B、多表内连接C、新建临时表D、多表外连接答案:C解析:在关联数据量较大的表,或者需要重复关联多张数据表后进行汇总加工,可以考虑新建临时表提升查询效率306.SQL语句,tA表中查询a字段在A0和B0之间的记录(不含A0和B0),以下
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论