数据分析师历年考试真题试题库(含答案)_第1页
数据分析师历年考试真题试题库(含答案)_第2页
数据分析师历年考试真题试题库(含答案)_第3页
数据分析师历年考试真题试题库(含答案)_第4页
数据分析师历年考试真题试题库(含答案)_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1数据分析师历年考试真题试题库(含答案)一、单选题1.数据分析挖掘平台的使用对象是____。A、总行的数据分析师B、总行及所有一级分行的数据分析师C、总行及境内一级分行的数据分析师D、总行及境内一级二级分行的数据分析师答案:C2.按照农业银行数据安全管理的有关规定(《数据安全管理办法》(试行)),使用境外机构采集和管理的数据,应符合_,经境外机构或总行系统主管部门同意。总行与境外机构签有协议的,遵照协议约定执行A、境外机构属地法规及监管要求B、境外机构属地法规C、境外机构属地监管要求D、境外机构属地监管要求及境外监管要求答案:A3.SQL关于多表联结查询,以下____描述是错误的。A、外联结查询返回的结果集行数可能大于所有符合联结条件的结果集行数B、多表联结查询必须使用到JOIN关键字C、内联结查询返回的结果是:所有符合联结条件的数据D、在WHERE子句中指定联结条件可以实现内联结查询答案:B4.从无重复记录的teacher表中选出姓李的老师数量,下列语句正确的是____A、selectcount(*)fromteacherwheretnamelike'李%';B、selectcount(*)fromteacherwheretnamelike'%李';C、selectcount(*)fromteacherwheretrim(tname)='李%';D、selectcount(*)fromteacherwheretrim(tname)like'%李';答案:A5.SQL的聚集函数COUNT、SUM、MIN、MAX、AVG不允许出现在查询语句的____子句中A、SELECTB、HAVINGC、GROUPBYD、WHERE答案:C6.下列执行数据的删除语句在运行时不会产生错误信息的选项是____。A、Delete*FromAWhereB='6'B、DeleteFromAWhereB='6'C、DeleteAWhereB='6'D、eleteASetB='6'答案:B7.在提交完数据使用申请后,平台管理员将提交的申请转至对应的___。A、项目负责人B、审批负责人C、项目管理员D、对口业务负责人答案:C8.由商业银行经营、管理及其他行为或外部事件导致利益相关方对商业银行负面评价的风险,指的是____A、市场风险B、操作风险C、信用风险D、声誉风险答案:D9.数据库的作用包括____A、存储数据B、检索数据C、生成新的数据D、以上全对答案:D10.在数据分析挖掘平台Woody的笔记本(Notebook)中,以下哪种操作可以建立一个三级标题A、在一个Markdown单元格中输入1.1.1heading并执行B、在一个Markdown单元格中输入#heading并执行C、在一个Raw单元格中输入1.1.1heading并执行D、在一个Raw单元格中输入#heading并执行答案:B11.由于某一国家或地区的经济、政治、社会文化及事件,导致该国家或地区借款人或债务人没有能力或者拒绝偿付商业银行债务,指的是____A、市场风险B、操作风险C、国别风险D、信用风险答案:C12.相关系数为负数表明两个随机变量____A、负相关B、正相关C、不相关D、以上都不对答案:A13.以下哪个选项不是数据分析师的必备技能?A、懂业务B、懂数据C、熟悉机器学习D、熟悉CSS答案:D14.我行的数据管理原则是____A、最小化授权原则B、数据分级管理、敏感数据脱敏、数据使用授权C、数据谁使用、安全谁负责、责任谁承担D、安全第一,服务第二答案:C15.执行单行sql语句的Woody内建魔术命令是____A、%%sqlB、%sqlC、%sqlstrD、%magic答案:B16.在GBase中,删除数据表时应使用下列哪组关键字:A、selecttoB、deletefromC、insertintoD、eletein答案:B17.支持关系模型的数据库系统是____A、网状数据库B、层次数据库系统C、关系数据库系统D、以上均支持答案:C18.根据是否需要标注数据,机器学习方法可以分为有监督学习和无监督学习。有监督学习中的训练集用于______。A、定量评价机器学习性能B、估算模型C、验证模型D、定性评价机器学习性能答案:B19.假设x=np.array([1,2,3,4,5]),那么np.any(x<3)的结果是?A、rray([1,2])B、12C、FALSED、TRUE答案:D20.Woody平台点击那个按钮可以进入指定项目?A、打开B、成员C、授权D、以上都不是答案:A21.数据分析挖掘可应用于哪些方面?A、产品营销B、决策支持C、风险管理D、以上全是答案:D22.____是指为实现特定业务目标,通过对数据的探索和挖掘,揭示数据背后的业务规律,为业务经营和管理决策提供支持的项目。A、应用研发类项目B、数据分析项目C、科技研究类项目D、工程实施类项目答案:B23.SQL增加表的记录数使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:B24.在mole中的SQL节点上,可通过何种sql语句对数据集进行操作?A、Transact-SQLB、PL/SQLC、k-sqlD、Sparksql答案:D25.SQL仅去除字符串中最右侧的空格的函数是____A、RTRIM(str)B、LTRIM(str)C、TRIM(str)D、以上都可以答案:A26.在GBase中,对数据求和时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:A27.Woody平台,执行什么命令,安装指定的包A、!piplistB、!piplist-oC、!pipinstallSomePackageD、以上都不行答案:C28.Python中,下列选项哪个是正确的if语句____A、ifa>=22:B、ifa>=22C、if(a>=22)D、if(a=>22)答案:A29.按照“贷款五级分类法”,不良贷款是指____。A、损失类贷款B、可疑类、损失类贷款C、次级类、可疑类、损失类贷款D、关注类、次级类、可疑类、损失类贷款答案:C30.分析全渠道交易量,柜面、掌银、ATM、POS等重点渠道交易特征,数据分析挖掘在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:C31.在数据分析挖掘平台Woody的笔记本(Notebook)中,若使用Python执行多行SQL语句,可以采用哪个魔术命令?A、%sqlB、%%sqlC、%df2dbD、%%excel2db答案:B32.下列哪个选项是pandas索引器?A、lineB、ilocC、olumnsD、values答案:B33.在项目的___阶段,可以结合时间维度、空间维度来尽可能多地设计特征,后续基于算法来筛选出有效特征。A、特征降维B、特征选择C、数据清洗D、特征设计答案:D34.数据分析挖掘流程的第一步是什么?A、数据收集B、数据处理C、明确分析目的和思路D、构建模型答案:C35.在GBase中,使用alter语句修改数据表时,修改一列的名称要用到的关键字是:A、dropB、changeC、modifyD、rename答案:B36.农业银行正在推进的数字化转型再造一个农业银行的战略坚持以____为中心。A、客户B、数据C、业务D、发展答案:A37.我行的数据管理原则遵循的原则是?A、数据谁使用、安全谁负责、责任谁承担B、随意使用C、无管理原则D、共用承担答案:A38.SQL增加表的列数使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:A39.SQL从groupby分组的结果集中再次用条件表达式进行筛选的子句是____A、FROMB、ORDERBYC、HAVINGD、WHERE答案:C40.SQL中,使用客户信息表CUST_INFO中的出生日期BIRTH字段更新为当前(2020年)年龄,应该使用的命令是____A、UPDATESETBIRTHWITH2020-BIRTHB、REPLACEBIRTHWITH2020-BIRTHC、UPDATECUST_INFOSETBIRTH=2020-BIRTHD、UPDATECUST_INFOBIRTHWITH2020-BIRTH答案:C41.在处理特征缩放时,如果x是一个独立的特征值(即某个数据点中的特征值),需要用到这个特征在整个数据集中的最小值和最大值,这种方法一般也被称为什么?A、min-max缩放B、特征标准化C、特征方差缩放D、l2归一化答案:A42.____是Spark集成的机器学习库。A、HadoopB、igTableC、MahoutD、MLlib答案:D43.(一)找到缺失值(二)分析缺失值在整体样本中的分布占比(三)决定采用哪种缺失值处理方法。将以上序号描述的是缺失值的处理思路,正确的排序是?A、三一二B、三二一C、一二三D、一三二答案:C44.以下哪项不是我行数据标准中的数据项标准内容__A、业务属性B、指标属性C、技术属性D、管理属性答案:B45.在GBase中,对数据求最小值时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:D46.在数据分析挖掘平台Woody项目列表页面不能执行以下哪种操作?A、打开项目B、查看项目成员C、管理项目成员D、数据授权答案:D47.为加快数据分析师队伍的建设,总行启动。____A、星星计划B、跟班学习C、树苗计划D、繁星计划答案:D48.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据分析的哪类问题?A、关联规则发现B、聚类C、分类D、自然语言处理答案:A49.____组织开展外部数据应用的后评价。A、数据需求部门B、客户部门C、技术实施部门D、数据管理部门答案:D50.XGBoost包中的____函数可以得到每个特征的特征重要度。A、feature_importanceB、f_importanceC、importanceD、feature_importances_答案:A51.下面哪个不属于关系完整性约束条件?A、关系完整性B、实体完整性C、参照完整性D、用户定义完整性答案:A52.KS是模型评价的区分度指标,KS指标计算公式是____A、KS=max(TPR-FPR)B、KS=min(TPR-FPR)C、KS=mean(TPR-FPR)D、KS=median(TPR-FPR)答案:A53.对公集市()加工基础指标数据,包括同比环比指标,均值,并按照账户、客户、机构、产品等重要维度进行分类汇总。A、缓冲层B、中间层C、应用层D、基础层答案:B54.数据控制语言的缩写是____A、DDLB、DMLC、DCLD、BL答案:C55.数据质量管理以什么为载体和基本单元____。A、报表B、指标C、信息系统D、数据表答案:C56.假设data=pd.series([0.25,0.5,0.75,1.0]),则data[1:3]的结果是?A、[0.25,0.5,0.75]B、[0.5,0.75]C、10.520.75D、[0.5,0.75,1.0]答案:C57.____应建立外部数据档案库,对立项材料、数据需求、合同协议、验收报告、应用评价等文本进行存档管理。A、数据管理部门B、法律合规部门C、客户部门D、技术实施部门答案:A58.识别农户贷款中担保人替农户还款等行为里潜藏的操作风险,属于数据分析在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:A59.在GBase中,使用drop语句删除数据表时,使用___关键字,可以防止由于数据库不存在而报错。A、ifexistsB、existsC、havingD、ifexisting答案:A60.SQL使用GROUPBY完成分组后,利用____对分组结果进行排序。A、ORDERB、SORTBYC、SORTD、ORDERBY答案:D61.用于删除结果集中重复的行地关键词是?A、LLB、DISTINCTC、HAVINGD、NULL答案:B62.假设x1表示数组array([5,0,3,3,7,9]),在切片获取时,x1[:4]获取的子数组是?A、rray([5,0,3])B、Array([5,0,3,3])C、Array([0,3,3])D、Array([3,7,9])答案:B63.python中,mean、std等聚合函数属于哪个库。A、seabornB、numpyC、sklearnD、xgboost答案:B64.mole中数据探查可在____节点上进行。A、未执行节点B、执行成功节点C、正在执行的节点D、执行错误的节点答案:B65.非结构化数据一般存储为____的数据格式。A、字符B、二进制C、数值D、十进制答案:B66.____是平衡银行流动性和盈利性的优良工具。A、贷款业务B、债券投资C、现金资产D、存款业务答案:B67.外部数据引入过程中的数据出行,要按照____原则,采取一定的安全保密措施。A、稳定可靠B、合法合规C、最小必要D、权威近源答案:C68.数据分析挖掘平台数据遵循____的原则实施分级管理。A、最大化授权B、自主化授权C、精准化授权D、最小化授权答案:D69.熟悉行业知识、公司业务及流程,最好有自己独到的见解,指的是成为一名合格数据分析师的哪个前提?A、懂业务B、懂数据C、懂建模D、懂管理答案:A70.在GBase中,对数据求和时应使用下列哪个函数:A、SUMB、AVGC、MAXD、MIN答案:A71.噪声数据会对模型训练产生影响,哪个选项不是常用的处理噪声数据的方法?A、数据分箱B、调整学习率C、数据聚类D、人工检查答案:B72.下列选项哪个不是绘图的库?A、NumPyB、SeabornC、MatplotlibD、pyecharts答案:A73.我行数据中台建设的核心内容是打造以______为基础的“内容+管理+服务”的一体化平台。A、数据仓库B、业务C、分析平台D、大数据平台答案:D74.____是主管业务数据的业务审批部门和数据分析项目的需求申请部门。A、信息管理部B、项目申请部门C、科技部门D、信息管理部或科技部门答案:B75.指标______是对指标数据结果范围的描述,具体包含机构范围、指标币种、数据频度、业务维度。A、基本信息B、统计信息C、口径信息D、管理信息答案:B76.数据挖掘平台Woody工具里,执行什么命令,列出已安装的包?A、!piplistB、!piplist-oC、!pipinstallSomePackageD、以上都不行答案:A77.Python中,字符串s=abc,那么执行表达式s+d后,输出结果为____A、bcB、abcdC、abc+dD、报错答案:B78.SQL是一种____语言A、函数型B、高级算法C、关系数据库D、人工智能答案:C79.在数据分析挖掘平台Woody的笔记本(Notebook)中,如何操作完成Python与R内核的切换?A、Kernel->InterruptB、Kernel->RestartC、Kernel->ChangekernelD、Kernel->Shutdown答案:C80.由于很多模型对缺失值有容忍度或灵活的处理方法,可以采用不处理对待缺失值。以下哪个模型可以实现这个功能?A、逻辑回归B、聚类算法C、冒泡算法D、决策树答案:D81.SQL中,下列哪个函数不属于聚集函数:A、RIGHT()B、MIN()C、MAX()D、SUM()答案:A82.当SQL查询获得的结果较多时,可以使用____语句显示少数几条数据A、WHEREB、HAVINGC、LIMITD、GROUPBY答案:C83.DataFrame的属性有哪些?A、intB、dataC、indexD、columns答案:C84.Python中,下列哪段代码能够正确的读取一个文件?____A、f=open(test.txt,read)B、f=open(r,test.txt)C、f=open(test.txt,r)D、f=open(read,test.txt)答案:C85.Python中,下列选项哪个是正确的while循环语句____A、whileloopa<10B、whilea<10:C、whilea<10D、whileloopa<10:答案:B86.在文献中,属性、维度(dimension)、特征(feature)、变量(variate)、因子(factor)都可以互换的使用。以上哪一个,一般用在数据仓库中。A、维度(dimension)B、特征(feature)C、变量(variate)D、因子(factor)答案:A87.____是IFAR系统各项账务数据、报告数据组织的基本单位。A、报告主体B、账务主体C、核算主体D、会计主体答案:D88.在数据分析挖掘平台的管理中,下列不是总行信息管理部的职责的是____。A、制订数据分析项目管理相关规章制度和标准规范,健全项目管理机制B、制定数据安全策略,负责平台数据安全和合规管理C、负责数据分析挖掘平台及分析挖掘工具的资源保障、运维及监控D、负责组织平台的应用推广工作答案:C89.____是指通过具有已知值的变量来预测其他变量的值。A、关联B、回归C、聚类D、分类答案:B90.下面哪个是Tanh函数的表达式A、f(x)=1/(1+exp(-x))B、f(x)=max(0,x)C、f(x)=(exp(x)-exp(-x))/(exp(x)+exp(-x))D、f(x)=exp(-x)/(1+exp(-x))答案:C91.数据分析项目结项或终止后,____在数据分析挖掘平台中实施项目归档、用户和数据权限回收等工作。A、超级管理员B、平台管理员C、项目管理员D、分析用户答案:B92.SQL语言中,条件年龄BETWEEN15AND35表示年龄在15至35之间,且____A、包括15和35岁B、不包括15和35岁C、包括15但不包括35岁D、包括35但不包括15岁答案:A93.SQL表示男副教授的表达式为A、职称='副教授'OR性别='男'B、职称='副教授'AND性别='男'C、BETWEEN'副教授'AND'男'D、IN('副教授','男')答案:B94.Python语言中一些已经被赋予特定意义的单词,如and、while、for等,叫做____A、关键字B、预留字C、预置字D、预置词答案:A95.HDFS是一套____框架。A、分布式计算B、分布式文件存储C、分布式数据库D、机器学习答案:B96.Python中,下列哪个关键字是用于给if语句添加其他条件语句的____A、elseifB、elseifC、elifD、以上都不是答案:C97.Python中,表达式9//2的值为:____A、2B、3C、4D、5答案:B98.在开展数据分析项目的过程中,关于敏感数据的使用,说法正确的是____A、归口管理部门审批即可B、随意使用C、须经主管业务数据的业务审批部门和归口管理部门联合审批D、主管业务数据的业务部门审批即可答案:C99.数据控制语言的缩写是____A、DDLB、DMLC、DCLD、BL答案:C100.在GBase中,在处理文本字符串时,可以同时去除两端的空格的关键字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:A101.数据分析挖掘平台的____指平台已注册用户,包括数据分析师和项目相关分析人员,负责数据分析项目实施工作。A、平台管理员B、业务审批员C、项目管理员D、分析师用户答案:D102.在mole模型列表界面中,当用户希望将已有的模型导入时,导入的文本为____格式。A、htmlB、jsonC、svD、xml答案:B103.如果使用填充法处理缺失值,以下哪种方法不是正确的处理方式?A、随机填充B、统计法填充C、模型填充D、专家经验补全答案:A104.在Python中不满足条件返回True,满足条件则返回False的逻辑运算符是____A、orB、notC、elseD、and答案:B105.在mole中,以下何种节点用来计算两个父节点输出的差集?A、UnionB、SubstractC、MapD、FlatMap答案:B106.GBASE不支持的字符型为____。A、CHARB、VARCHARC、TEXTD、STRING答案:D107.什么颜色状态下的文件才可以进行移动操作?A、绿色B、灰色C、红色D、黑色答案:B108.DB、DBS和DBMS三者的关系是____A、DB包括DBMS和DBSB、DBS包括DB和DBMSC、DBMS包括DBS和DBD、BS、DB和DBMS三者互不相关答案:B109.____的每一个分量必须是一个不可分的数据项A、概念B、属性C、关系D、元组答案:C110.下列哪一个命令可以删除sle数据库的tb_name表____A、deletefromtb_nameB、deletefromsle.tb_nameC、droptabletb_nameD、rop*fromsle.tb_name答案:C111.对于图像识别问题(比如识别照片中的猫),哪种神经网络模型结构更适合解决这类问题____A、多层感知器B、卷积神经网络C、循环神经网络D、BP神经网络答案:B112.下列选项中,Python变量赋值正确的是____A、vara=2B、inta=2C、a=2D、variablea=2答案:C113.SQL语言中,删除一个表的命令是?A、DELETEB、DROPC、LEARD、REMOVE答案:B114.defmax(a,b):ifa>b:returnaelse:returnb能成功调用该Python函数的语句是____A、max(,5)B、max(-1)C、max(5,-1)D、max(5,-1,3)答案:C115.不能擅自变更有明确限制性约定的数据使用目的、范围及方式,如有必要超出约定范围,应当另行取得________的授权A、数据主体B、外部数据提供方C、数据需求部门D、技术实施部门答案:A116.SQL语句,在关联数据量较大的表,或者需要重复关联多张数据表后进行汇总加工时,可以考虑____提升查询效率。A、新建复制表B、多表内连接C、新建临时表D、多表外连接答案:C117.根据一定的标准把一群对象划分成若干个组,组内对象之间具有很高的相似度,而不同组的对象之间存在显著差异的分析方法属于____。A、预测建模B、聚类分析C、关联分析D、异常检测答案:B118.支持关系模型的数据库系统是____A、网状数据库B、层次数据库系统C、关系数据库系统D、以上均支持答案:C119.银行签发,承诺自己在见票时无条件支付确定的金额给收款人或者持票人,指的是____。A、银行汇票B、商业汇票C、银行本票D、支票答案:C120.删除数据表时可以使用下列哪种语句:A、select语句B、create语句C、insert语句D、rop语句答案:D121.根据是否需要标注数据,机器学习方法可以分为有监督学习和无监督学习。有监督学习中的训练集用于______。A、定量评价机器学习性能B、估算模型C、验证模型D、定性评价机器学习性能答案:B122.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据分析的哪类问题?A、关联规则发现B、聚类C、分类D、自然语言处理答案:A123.SQL语句,如果列为主键,以下执行效率最高的是____A、count(列名)B、count(1)C、ount(*)D、全部答案:A124.业务部门下载并填写____申请使用数据分析挖掘平台的普通数据。A、《数据分析挖掘平台用户申请表》B、《数据分析挖掘平台数据申请表》C、《关于申请使用数据分析挖掘平台数据的函》D、《关于申请导出数据分析挖掘平台数据的函》答案:B125.在Python中,字符串使用____定义A、一对单引号B、一对双引号C、一对单引号或一对双引号都可以D、以上都不对答案:C126.Python语句中一般以____作为语句的结束符A、新的一行B、分号C、句号D、逗号答案:A127.在mole中,以下关于节点的表述不正确的是____A、节点就是一系列算子B、节点是HDFS文件,只能用来保存数据C、不同的节点代表着不同的计算模式D、在节点上输入一个数据集合计算后得到一个新集合答案:B128.下列属于无监督学习的是______。A、k-meansB、SVMC、最大熵D、CRF答案:A129.对于已经通过模型验证且可以落地应用的模型,由____组织开展模型的业务应用。A、总行信息科技部B、研发中心C、项目申请部门D、总行办公室答案:C130.假设x=np.array([1,2,3,4,5]),那么np.any(x<8)的结果是?A、rray([1,2,3,4,5])B、5C、FALSED、TRUE答案:D131.GBASE创建分布表,指定表中某一列为哈希列(Hash列)的语句是____A、HASHBYcolumn_nameB、DISTRIBUTEDBYcolumn_nameC、DISTRIBUTINGBYcolumn_nameD、HASHEDBYcolumn_name答案:B132.既可满足企业贸易往来的结汇、售汇需求,也可供市场参与者进行投资或投机的交易活动是____。A、外汇交易B、贵金属交易C、期货交易D、股票交易答案:A133.在GBase中,在处理文本字符串时,可以同时去除两端的空格的关键字是:A、TRIMB、RTRIMC、LTRIMD、LENGTH答案:A134.在Markdown单元格中,通过什么符号,可以生成指向URL的超链接?A、()B、[]C、{}D、<>答案:B135.下面属于有监督学习的是?A、数据统计B、分类C、聚类D、关联分析答案:B136.概念模型,也称信息模型,是按____的观点来对数据和信息建模,主要用于数据库设计。A、计算机系统B、现实世界C、数据D、用户答案:D137.在神经网络中,如果我们用了一个过大的学习率会发生什么____。A、神经网络会收敛B、神经网络不会收敛C、都有可能D、都不对答案:B138.训练误差非常小,泛化误差特别大,这种现象称之为什么?A、过拟合B、欠拟合C、完美拟合D、随机拟合答案:A139.在数据分析挖掘平台Woody中,在以下哪个页面中可以启用插件?A、FilesB、RunningC、lustersD、Nbextensions答案:D140.GBASE中,复制table_nameB的表结构来创建表table_nameA语句是____A、CREATETABLEtable_nameALIKEtable_nameB;B、CREATETABLEtable_nameBLIKEtable_nameA;C、REATETABLEtable_nameAFROMtable_nameB;D、CREATETABLEtable_nameBFROMtable_nameA;答案:A141.SQL聚集函数中不包括下列哪个选项:A、MAX()B、COUNT()C、LEFT()D、AVG()答案:C142.下面哪个聚合函数可以计算分位数?()A、meanB、quantileC、ountD、prod答案:B143.在数据分析挖掘平台Woody的笔记本(Notebook)中,假设已经使用Python语言定义好函数add_numbers(a,b),那么执行add_numbers??的效果是以下哪个A、显示函数的概要信息B、显示函数的源代码C、调试函数D、执行报错答案:B144.为银监会标准化等监管报送等上层应用提供基础数据,支撑我行大部分监管报送和内管指标的数据集市是____A、监管统计数据集市B、运营数据集市C、风险数据集市D、内控数据集市答案:A145.预测客户未来资产变化情况,指导客户经理寻找潜在目标客户,预防客户流失,属于数据分析在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:D146.数据分析挖掘平台Woody环境采用GBase作为后台数据库,与传统关系型数据库不同,该数据库采用的存储方式是____。A、行存储B、列存储C、二维表存储D、键值存储答案:B147.在统计学中,下列哪个常用概率分布是连续分布?A、0-1分布B、二项分布C、正态分布D、泊松分布答案:C148.python语言,以下语句正确的是____A、frompandasimportsvmB、fromnumpyimportsvmC、fromsklearnimportsvmD、fromxgboostimportsvm答案:C149.下面属于聚类算法的是____。A、K-meansB、XGBoostC、AprioriD、RandomForest答案:A150.在进行数据分析项目时,肯定会在数据分析挖掘平台上申请权限、使用数据,所以在申请数据使用前,一定要充分了解我行的___A、数据加密算法B、数据管理原则C、数据授权步骤D、数据删除规定答案:B151.在文献中,属性、维度(dimension)、特征(feature)、变量(variate)、因子(factor)都可以互换的使用。以上哪一个,一般用在机器学习领域中。A、维度(dimension)B、特征(feature)C、变量(variate)D、因子(factor)答案:B152.Python中,下列选项哪个是正确的if语句____A、ifa>=22:B、ifa>=22C、if(a>=22)D、if(a=>22)答案:A153.DataFrame属于python的哪个包。A、pandasB、numpyC、sklearnD、xgboost答案:A154.由商业银行经营、管理及其他行为或外部事件导致利益相关方对商业银行负面评价的风险,指的是____A、市场风险B、操作风险C、信用风险D、声誉风险答案:D155.若要“查询选修了C门以上课程的学生的学号”,则正确的SQL语句是A、selects_idfromSCgroupbys_idwherecount(*)>CB、selects_idfromSCgroupbys_idhavingcount(*)>CC、selects_idfromSCwherecount(*)>Corderbys_idD、selects_idfromSChavingcount(*)>C答案:B156.使用alter语句修改数据表时,修改一列的名称要用到的关键字是:A、ropB、changeC、modifyD、rename答案:B157.在命令行中,Python提示符____就是键入代码的地方,按下Enter即可执行。A、>>>B、[]C、(D、)答案:A158.SQL更新表中的已有数据的值使用的子句是____A、LTERB、INSERTC、UPDATED、ELETE答案:C159.分析全渠道交易量,柜面、掌银、ATM、POS等重点渠道交易特征,数据分析挖掘在____方面的应用。A、风险管理B、产品营销C、决策支持D、客户管理答案:C160.数据资产视图可以解决的问题有____A、有什么数据资产B、数据资产在哪里C、数据资产能怎么用D、以上都对答案:D161.下面不属于boosting算法的是____。A、GBDTB、XGBoostC、LightGBMD、RandomForest答案:D162.XGBoost包中的____函数可以得到每个特征的特征重要度。A、feature_importanceB、f_importanceC、importanceD、feature_importances_答案:A163.在命令行中,Python提示符____就是键入代码的地方,按下Enter即可执行。A、>>>B、[]C、(D、)答案:A164.____的单条数据在一段时间区间内有效,一般采用起始日期startdate和截止日期enddate描述该条数据生效时点和失效时点。A、明细表B、切片表C、拉链表D、时间表答案:C165.数据清洗在提升数据质量中扮演十分重要的角色,以下哪个选项不是因为数据清洗的作用?A、处理数据重复B、处理噪声数据C、处理离群点数据D、处理字符型数据为整数型答案:D166.数据分析挖掘平台Woody底层使用哪种数据库来存储分析数据____A、OracleB、SybaseC、MySQLD、Gbase答案:D167.DML,即DataManipulationLanguage,指的是____。A、数据操纵语言B、数据修改语言C、数据控制语言D、数据定义语言答案:A多选题1.以下常用的连续分布有____A、二项分布B、指数分布C、正态分布D、泊松分布答案:BC2.在Python中,标识符的命令规则包括A、可以以数字开头B、可以下划线开头C、除了开头,其他部分可以由字母、数字或下划线组成D、可以字母开头答案:BCD3.下面属于图的基本概念的是____。A、度B、路径C、连通D、词袋答案:ABC4.信用评分模型按照信贷整个生命周期,可分为哪三种类型A、申请评分B、行为评分C、催收评分D、交易评分答案:ABC5.关于GBDT与XGBoost的区别,下列选项中描述正确的是:____A、GBDT是机器学习算法,XGBoost是该算法的工程实现。B、GBDT采用CART作为基分类器,XGBoost支持多种类型的基分类器,比如线性分类器。C、GBDT在模型训练时只使用了代价函数的一阶导数信息,XGBoost对代价函数进行了二阶泰勒展开,可以同时使用一阶和二阶导数。D、GBDT在每轮迭代时使用全部的数据,XGBoost则采用了与随机森林相似的策略,支持对数据进行采样。答案:ABCD6.Customers1与Customers2表结构一致,以下SQL语句正确的有____A、SELECTcust_nameFROMCustomers1UNIONSELECTcust_nameFROMCustomers2B、SELECTcust_contactFROMCustomers1UNIONSELECTcust_name,cust_contactFROMCustomers2C、SELECT*FROMCustomers1UNIONSELECT*FROMCustomers2D、SELECTcust_nameFROMCustomers1UNIONSELECT*FROMCustomers2答案:AC7.标签板块不包括:____。A、零售B、对公C、账户D、商户答案:ABD8.Python嵌套就是一条语句里面还有另一条语句,以下正确的是____A、for中不能还有forB、while中不能还有whileC、for中可以有whileD、while中可以有for答案:CD9.GBASE表级组合压缩方式为____A、(0,0)B、(1,0)C、(1,3)D、(5,5)答案:ACD10.下列那些机器学习算法使用了Boosting学习方法思想?A、随机森林B、AdaboostC、GBDTD、XGBoost答案:BCD11.分析报告编制过程中“迭代完善”步骤的工作内容包括:A、团队根据数据情况和业务趋势讨论分析报告B、迭代完善报告框架C、迭代数据分析D、迭代报告完善答案:ABCD12.SQL是一种专门用来与数据库沟通的语言,集____功能于一体。A、数据建模B、数据操纵C、数据定义D、数据控制答案:BCD13.以下哪些问题适合使用深度学习模型?A、图片识别B、语音识别C、计算机视觉D、机器翻译答案:ABCD14.下面____选项属于树类算法?A、GBDTB、XGBoostC、LightGBMD、Adaboost答案:ABCD15.我行数据中台的逻辑框架中,会从以下几个方面进行建设。A、聚焦业务管理流程,迭代优化业务中台。B、汇聚打通全域数据,推进数据资产化。C、强化数据资产管理,提升数据供给效能。D、打造通用数据服务,快速赋能业务应用。答案:BCD16.以下的操作,会过滤空值的是____A、count(cid)B、count(distinctcid)C、ount(name)D、count(*)答案:ABC17.分析报告的工作步骤包括明确报告目的、报告框架、____、报告校稿及交付等步骤。A、数据分析B、报告初稿C、迭代完善D、报告图形化展示答案:ABCD18.知识图谱可以应用的领域包括A、反欺诈B、大数据风控C、推荐系统D、聊天机器人答案:ABCD19.F1分数是的以下哪些选项的加权调和平均____A、精确率B、召回率C、TPRD、FPR答案:AB20.以下哪些属于商业银行的中间业务____A、担保业务B、贷款业务C、承诺业务D、借款业务答案:AC21.《中国农业银行数据安全管理办法(试行)》将数据安全类别划分为____等。A、客户数据B、业务数据C、管理数据D、监管数据答案:ABCD22.所谓嵌套,就是一条语句里面还有另一条语句,Python语言允许____A、for中还有forB、while中还有whileC、for中有whileD、while中有for答案:ABCD23.传统的统计方法都比较抽象和深奥,一般人难于掌握,EDA(探索性数据分析)则更强调____与____。A、直观B、数据可视化C、假设检验D、数学公式答案:AB24.常见的能够自动处理缺失值的模型包括____。A、XGBoostB、决策树C、线性回归D、逻辑回归答案:AB25.调整超参数的方法有那些。A、手动调参B、网格搜索C、随机搜索D、自动超参数优化方法答案:ABCD26.在数据分析挖掘平台Woody项目中,可以新建选项中的哪些____A、Python笔记本(Notebook)B、文本文件(TextFile)C、文件夹(Folder)D、R笔记本(Notebook)答案:ABCD27.根据《中国农业银行数据分析师管理办法》,数据分析师的主要岗位职责包括。A、参与制定数据分析项目年度计划,参与数据分析项目业务需求研制和需求评审B、牵头或参与实施数据分析项目,开展数据分析挖掘模型建设C、对数据分析挖掘模型进行验证,并根据验证结果对模型进行优化、完善D、模型验证不属于数据分析师的职责,应该由业务人员完成答案:ABC28.业务部门可按需申请数据分析挖掘平台的数据使用权限,并对其获取数据的哪些数据处理行为承担安全保密责任?A、查询B、使用C、下载D、传输及销毁答案:ABCD29.EDA的特点有三个:____A、让数据说话B、分析方法灵活C、简单直观D、需要前提假设答案:ABC30.特征x=[0,0,1,1,2,2,2,2,3,3,3,3,4],则特征x的众数为____。A、0B、2C、3D、1答案:BC31.线上信贷产品的主要特征是____A、普惠化B、移动化C、智能化D、场景化答案:ABCD32.《中国农业银行数据安全管理办法(试行)》将数据安全类别划分为____等。A、客户数据B、业务数据C、管理数据D、监管数据答案:ABCD33.按照“贷款五级分类法”,不良贷款包括____A、关注B、次级C、可疑D、损失答案:BCD34.数据分析挖掘平台包含哪些工具?A、WoodyB、MoleC、SASD、Linux答案:AB35.数据质量管理的目标包括____。A、持续提升数据质量B、确保信息数据合法合规C、促进数据应用价值的充分发挥D、直接创造利润答案:ABC36.IFAR会计期间是根据会计制度的规定和管理核算的需要,对经济业务活动的会计核算、分期结算账目和编制财务会计报告一个周期的规定。包括标准____。A、月B、季度C、半年D、年度答案:ABCD37.常用的数据可视化方法有____图、____图、____图、____图等。A、概率密度图B、箱形图C、饼图D、散点图答案:ABCD38.指标规范内容包含指标的_______A、基本信息B、统计信息C、口径信息D、管理信息答案:ABCD39.以下符合个人集市定位的是____A、个人客户统一视图B、应用数据服务支撑C、数据挖掘分析支撑D、标签库建设答案:ABCD40.以下叙述正确的是____。A、目标变量(标签)是离散值,称为分类任务B、目标变量(标签)是连续值,称为回归任务C、垃圾邮件识别属于回归任务D、预测房屋价格属于回归任务答案:ABD41.Python中,a="hello",b="python",下列选项中属于正确字符串运算的是____A、[1:4]B、a*2C、hinaD、a+b答案:ABCD42.数据库系统的组成部分包括哪些A、数据库B、数据库管理系统C、应用程序D、数据库管理员答案:ABCD43.用于衡量连续数据的中心趋势的统计量有。____A、均值B、中位数C、众数D、方差答案:ABC44.在mole中,以下何种节点可以对两个数据集进行联接?A、reduceB、joinC、leftjoinD、map答案:BC45.以下哪些是我行的线上信贷产品?A、网捷贷B、随薪贷C、助业快e贷D、房抵贷答案:AC46.以下哪些方法用于处理数据缺失问题?A、统计法填充B、模型填充C、真值转换法D、专家补全答案:ABCD47.下列关于模型评估的说法,正确的有____A、评价模型的好坏只看KS值、AUC等参数就够了B、评价模型的好坏,也需要从业务角度评价模型是否符合业务逻辑C、对于机器学习模型的评价,要参考模型特征的可解释性D、如果模型在训练集的表现很好,但在测试集结果一般,说明模型存在过拟合的问题,需要修正答案:BCD48.监督学习基本等价于数据挖掘的预测任务,以下哪些数据监督学习?A、分类B、回归C、聚类D、数据统计答案:AB49.挑选入模变量要考虑的因素有____。A、变量之间的相关性B、变量是否容易生成和使用C、变量的强壮性D、变量在业务上的可解释性答案:ABCD50.根据农业银行员工行为守则,关于勤勉尽职的要求有____A、员工应具备岗位任职资格或能力,熟练掌握业务技能并树立终身学习理念,与时俱进,提升素质。B、员工应恪守制度要求和办事程序,勤奋努力,严谨审慎,精益求精,尽职尽责。C、员工应科学管理时间,提高工作效率。D、员工岗位变动或离职,应按规定妥善交接工作,遵守脱密和竞业限制约定,不得擅自带走所在机构的财物、工作资料和客户资源。答案:ABCD51.个人客户营销与管理系统的主要功能包括A、工作平台B、客户画像C、营销管理D、客户管理答案:ABCD52.数据集常将多个数据源中的数据结合成、存放在一个一致的数据存储,需要考虑可能产生问题?A、过拟合问题B、冗余问题C、数据排序D、数据值的冲突答案:BD53.总行数据分析师应在数据应用过程中发现____等数据问题,推动各领域数据治理。A、数据缺失B、数据不准确C、数据不一致D、数据不整合答案:ABCD54.数据挖掘平台目前提供的分析工具有____A、WoodyB、MoleC、SASD、Tableau答案:ABC55.对于模型部署评审环节,需要从角度进行评审?(包括但不限于)A、部署方案B、时间计划C、部署风险D、部署风险的应对建议答案:ABCD56.分类问题的主要评价指标有____A、准确率B、精确率C、召回率D、F1值答案:ABCD57.下面关于逻辑运算符的优先级,哪一个说法是正确的?A、逻辑运算符AND和OR可以用来连接多个查询条件B、AND的优先级低于ORC、小括号()可以改变优先级D、多个逻辑运算符,优先级从左至右依次增高答案:AC58.统一指标库建设的总体思路是____。A、数据图表化B、指标平铺化C、报表指标化D、指标层次化答案:CD59.下面____选项属于树类算法?A、ID3B、C4.5C、ART决策树D、随机森林答案:ABCD60.按照贷款期限,贷款可划分为____?A、短期贷款B、信用贷款C、担保贷款D、中长期贷款答案:AD61.以下哪类存款在存入时不约定存期?A、整存整取B、零存整取C、定活两便D、通知存款答案:CD62.常见的半结构化数据有____。A、XMLB、JSONC、音频D、文档答案:AB63.以下哪些是分布式计算框架?A、MapReduceB、SparkC、PythonD、R答案:AB64.在Woody开展数据分析项目的过程中,可以通过下列哪些方式查询数据表信息?A、Woody的放大镜B、数据资产视图C、showcreatetable命令D、数据服务目录答案:ABCD65.大数据平台数据应用方式包括____。A、各类数据集市B、注册用户查询C、分析挖掘平台D、数据临时提取答案:ACD66.我行数据标准按照针对的对象分为____和____两类。A、数据项标准B、指标规范C、技术属性D、管理属性答案:AB67.完整的公共集市数据服务需求研制流程,包含以下____环节。A、需求意向B、需求研制C、需求评审D、需求交付答案:ABCD68.下列哪些选项不是pandas索引器?A、locB、ilocC、olumnsD、values答案:CD69.在二分类任务中,根据真实类别与分类模型预测类别的组合,可以将预测结果分为______。A、真正例B、假正例C、真负例D、假负例答案:ABCD70.按照《巴塞尔协议》规定,银行的三大风险主要是____A、市场风险B、操作风险C、信用风险D、流动性风险答案:ABC71.XGBoost模型在通常待调的参数有____。A、学习轮数B、树的深度C、正则项系数D、学习率答案:ABCD72.对公集市的模型分为____A、缓冲层B、中间层C、应用层D、基础层答案:ABC73.在数据分析挖掘平台Woody的笔记本(Notebook)中,使用Markdown单元格可以实现哪些功能____A、定义目录级别B、编辑超链接C、编辑LaTeX数学公式D、执行Python代码答案:ABC74.以下属于图的基本概念的是____A、度B、路径C、连通D、词袋答案:ABC75.报表需求响应实施流程包括____。A、需求描述B、需求评审C、报表实施D、报表投产验收答案:ABCD76.下列关于协方差的说法中正确的有____A、如果两个变量相互独立,那么它们的协方差为零。B、如果两个变量的协方差不为零,那么它们一定是相关的。C、如果两个变量协方差为零,它们之间一定没有线性关系。D、虽然两个变量不相互独立,但是协方差有可能是零。答案:ABCD77.下列关于统计学知识的表述中正确的有:A、在统计学中,用概率分布(probabilitydistribution)来描述随机变量或一簇随机变量在每一个可能取到的状态的可能性大小。B、在统计学中,我们描述概率分布(probabilitydistribution)的方式取决于随机变量是连续的还是离散的。C、在统计学中,我们用概率密度函数(probabilitydensityfunction或pdf)描述连续型随机变量在每一个可能取到的状态的可能性大小。D、在统计学中,我们用概率质量函数(probabilitymassfunction或pmf)可以描述离散型随机变量在每一个可能取到的状态的可能性大小。答案:ABCD78.下列选项中,属于Python合法标识符的是____A、breakB、123_yearC、_age_30D、Year_123答案:CD79.以下哪些不属于数据分析模型场景范畴?A、应对内外部审计场景B、监管检查场景C、司法检查场景D、日常业务经营管理报表需求答案:ABCD80.在Python中,标识符的命令规则包括A、可以以数字开头B、可以下划线开头C、除了开头,其他部分可以由字母、数字或下划线组成D、可以字母开头答案:BCD81.对于敏感数据数据需求,业务部门填写《关于申请使用数据分析挖掘平台数据的函》,通过部室商办签报向哪两个部门提交申请?A、业务审批部门B、人资资源部门C、归口管理部门D、档案管理部门答案:AC82.以下哪些选项不是数据分析类项目的主要应用场景?A、信用卡分期精准营销B、应急提数C、IT系统投产前数据测试D、反欺诈关系图谱答案:BC83.Python函数的组成部分有____A、函数名B、形参列表C、函数体D、返回值答案:ABCD84.下面属于自然语言处理基本概念的是____。A、分词B、词性标注C、命名实体识别D、句法分析答案:ABCD85.以下哪些是集成学习方法?A、XGBoostB、LightGBMC、AprioriD、GBDT答案:ABD86.在CNN中,池化层的作用主要有A、降低数据的尺寸B、减小参数数量C、扩大感受视野D、增大参数数量答案:ABC87.____属于非结构化数据。A、文档B、图片C、视频D、数据库表格答案:ABC88.下列选项中属于python绘图工具的有哪些?A、scikit-learnB、matplotlibC、NumPyD、seaborn答案:BD89.下列关于数据安全面临的挑战的说法中,正确的有:A、数据量爆发式增长加大了数据泄露风险B、数据应用越来越灵活提升了事故发生概率C、大数据技术带来新的安全威胁,大数据分析使黑客的攻击更加精准D、数据安全保密的法律和政策日益严格答案:ABCD90.我行数据服务体系建设要实现的内容包括____。A、标准统一化B、加工自动化C、数据共享化D、服务多元化答案:ABCD91.DataFrame的属性有哪些?A、intB、dataC、indexD、columns答案:CD92.以下那些属于特征衍生的操作?A、将特征进行one-hot编码B、特征间进行加减乘除C、补充特征缺失值D、将特征进行标准化答案:AB93.数据分析挖掘流程不包括哪些?A、基层调查B、数据收集C、构建模型和模型评估D、分析师培养答案:AD94.以下哪些是集成学习方法?A、XGBoostB、LightGBMC、AprioriD、GBDT答案:ABD95.商业银行向中央银行借款有哪两种途径?A、贴现B、贷款C、再贴现D、再贷款答案:CD96.根据《中国农业银行总行数据分析类项目管理实施细则》,数据分析项为____提供支持A、业务经营B、管理决策C、监管检查D、司法检查答案:AB97.下列选项中,属于Python合法标识符的是____A、gb123B、_nameC、2BD、break答案:AB98.标签中心的主要数据来源包括:()。A、公共集市B、分行集市C、AI运行中心D、数据挖掘平台答案:ABCD99.以下属于社区发现的算法的是____A、标签传播法B、Girvan-Newman算法C、kNN算法D、派系过滤CPM算法答案:ABD100.在mole的随机森林模型中,在分类问题中的输出采用以下何种方式来得到?A、简单多数投票法B、单颗树输出结果的简单平均C、后一棵树将前一颗树的残差作为输入D、利用模型的负梯度值进行多轮迭代答案:AB101.数据分析挖掘平台敏感数据的使用须经____和____联合审批。A、主管业务数据的审批部门B、平台归口管理部门C、科技部门D、各一级分行答案:AB102.常见的半结构化数据有____。A、XMLB、JSONC、音频D、文档答案:AB103.数据分析项目实施管理除了数据准备和分析成果应用,还包括哪些活动____A、数据探查B、分析建模C、分析成果验证D、模型验证答案:ABC104.数据预处理阶段不包括____A、模型调参B、特征重要性排序C、异常值处理D、缺失值处理答案:AB105.在数据分析挖掘平台Woody的笔记本(Notebook)中,可以执行哪些内核(kernel)操作?A、中断(Interrupt)B、重启(Restart)C、切换(Changekernel)D、暂停(Pause)答案:ABC106.操作数据区(ODS),采用标准化的流程和规则,对源系统数据进行哪些操作?A、加载B、清洗C、转换D、汇总答案:ABC107.数据分析挖掘是非常有价值的,它在银行业的应用体现在哪些方面?A、信用卡的审批额度B、识别贷款业务中潜藏的操作风险C、贵宾客户的流失预测D、掌银对消费者的产品推荐答案:ABCD108.以下属于回归分析的是____。A、房屋价格预测B、信用卡违约预测C、股票价格预测D、垃圾邮件识别答案:AC109.SQL中,下列哪些函数属于聚集函数:A、RIGHT()B、LEFT()C、MAX()D、SUM()答案:CD110.Customers1与Customers2表结构一致,以下SQL语句正确的有____A、SELECTcust_nameFROMCustomers1UNIONSELECTcust_nameFROMCustomers2B、SELECTcust_contactFROMCustomers1UNIONSELECTcust_name,cust_contactFROMCustomers2C、SELECT*FROMCustomers1UNIONSELECT*FROMCustomers2D、SELECTcust_nameFROMCustomers1UNIONSELECT*FROMCustomers2答案:AC111.通常可以使用以下那些量来计算多个联系型特征之间的关系?A、协方差B、相关系数C、方差D、四分位数答案:AB112.在以下场景中,哪些场景会产生数据质量问题?A、前台工作人员为了省事,将所有用户年纪都输入为30岁B、在采集数据时,客户不愿意告知某些数据项,导致该数据项缺失C、客户填写家庭住址时使用虚假地址D、由于时效性,系统中的手机号客户已不再使用答案:ABCD113.在客户营销管理领域,鉴于对公客户及个人客户两方面在数量级别、管理方式、营销策略以及客户拓展方面有较大的不同,分别建设了__数据集市和__数据集市。A、运营B、监管C、个人D、对公答案:CD114.下列选项中不属于回归算法的是______。A、线性回归B、逻辑回归C、随机森林D、支持向量机答案:BCD115.农户小额贷款。农户小额贷款是对农户家庭内单个成员发放的小额自然人贷款,可用于哪些方面?A、农户生产经营B、农户消费C、农户购买住房D、农户购买股票答案:AB116.数据中台的汇聚整合能力,可以一定程度上解决导致数据孤岛的问题;提纯加工能力,可以加深对数据的理解,通过统一的数据标准和质量体系,形成标准数据资产体系;服务可视化能力,可以支持数据资产场景化能力的快速输出,以响应客户的动态需求。A、数据汇聚整合B、数据提纯加工C、数据服务可视化D、数据价值变现答案:ABC117.常见的特征衍生方式有哪些?A、特征扩展B、自动衍生C、合成特征D、特征组合答案:ABCD118.在数据分析挖掘平台Woody的笔记本(Notebook)中,有以下哪几种类型的单元格____A、CodeB、OutputC、MarkdownD、RawNBConvert答案:ACD119.项目申请部门提出数据分析项目需求意向,需求意向包括____等内容。A、背景意义B、业务目标C、需求交付时间D、期望项目实施周期答案:ABCD120.数据管理框架包含的内容有:A、数据域B、管理域C、服务域D、管理流程和机制域答案:ABCD121.以下哪些属于numpy中的聚合函数?A、sumB、minC、maxD、mean答案:ABCD122.商业银行的性质包括____A、以追求利润为目标B、以金融资产和负债为对象C、综合性、多功能D、金融企业答案:ABCD123.哪些是大数据平台典型的数据类型____A、拉链表B、明细表C、拼接表D、切片表答案:ABD124.可以用来描述中心趋势的度量有____A、均值B、中位数C、众数D、方差答案:ABC125.以下是我行数据标准体系构建策略内容的有________A、长短规划结合B、刚柔实施配套C、通过实践检查D、适时处置提高答案:ABCD126.以下哪些是个人客户敏感数据?()A、婚姻信息B、地址信息C、教育信息D、工作信息答案:ABCD127.在数据探查的过程中,主要针对____等情况进行探查。A、数据分布B、数据准确性C、数据相关性D、数据缺失答案:ABCD128.在二分类任务中,根据真实类别与分类模型预测类别的组合,可以将预测结果分为。______A、真正例B、假正例C、真负例D、假负例答案:ABCD129.SQL语句,以下语句不会导致全表扫描的是.A、selectidfromtwheresubstring(name,1,3)='cif'B、selectidfromtwherenamelike'cif%'C、selectidfromtable_1wherenum=10ornum=20D、selectidfromtwherecreatedate>='2005-11-30'andcreatedate<'2005-12-1'答案:BD130.在数据分析挖掘平台Woody的笔记本(Notebook)中,单元格的输出(Output)可以是选项中的哪些____A、数字B、文本C、表格D、图片答案:ABCD131.商业银行不可以从事下列哪些业务____A、代理收付款项及代理保险业务B、房地产投资C、证券经营D、汽车租赁答案:BCD132.Python中,a="hello",b="python",下列选项中属于正确字符串运算的是____A、[1:4]B、a*2C、hinaD、a+b答案:ABCD133.下列选项中用于NumPy数组排序的是?A、np.sort()B、np.argsort()C、np.sorted()D、np.argsorted()答案:AB判断题1.在SQL中,查询满足条件的元组可以通过WHERE子句实现。A、正确B、错误答案:A2.在开展数据分析项目的初期,申请数据时必须一次性提交所有数据表的申请,后期不可增补需求。A、正确B、错误答案:B3.日期和时间型的数据类型主要包括DATE、DATETIME、TIME、TIMEST四种。A、正确B、错误答案:A4.模型上线后,需要进行投产后验证、监控及运维等事项。A、正确B、错误答案:A5.SQL语句,MIN()返回指定列的最小值,且忽略列值为NULL的行。A、正确B、错误答案:A6.Gbase数据库采用行存储方式A、正确B、错误答案:B7.众数是数据集中出现最频繁的数值。可能最高频率对于多个不同值,导致出现多个众数,具有一个众数的数据集合分别称为单峰,具有两个或更多众数的数据集称为多峰。A、正确B、错误答案:A8.SQL语句,使用like进行模糊查询时,select*fromtablewhereusernamelike‘xu%’会导致全表扫描A、正确B、错误答案:B9.SQL比较运算可用于数字和字符串上A、正确B、错误答案:A10.机器学习是人工智能的一个分支。A、正确B、错误答案:A11.预测性数据挖掘包括分类、回归及时间序列等。A、正确B、错误答案:A12.Python中,可以使用if作为变量名。A、正确B、错误答案:B13.信息管理部是主管业务数据的业务审批部门和数据分析项目的需求申请部门。A、正确B、错误答案:B14.数据挖掘过程只是技术部门的职责,业务部门无需参与。A、正确B、错误答案:B15.公共集市需求意向阶段,如果各方对技术实现路径有争议,需通过研发中心架构办协调确定技术方案。A、正确B、错误答案:A16.视图是一种虚表,不存放实际的数据值A、正确B、错误答案:A17.SQL语句,一个表和它自身关联称为自连接。A、正确B、错误答案:A18.在风险识别领域,相比于精确率,我们更应该关心召回率。A、正确B、错误答案:A19.E-R模型是最常用的概念模型A、正确B、错误答案:A20.在深度学习中,添加dropout往往是改善神经网络性能的有效方法。A、正确B、错误答案:A21.大数据平台基础数据区采用标准化的流程和规则,对源系统数据进行清洗、转换和加载,尽量保持业务数据原貌。A、正确B、错误答案:B22.在NumPy一维数组中通过中括号指定索引获取第i个值。A、正确B、错误答案:A23.SQL语句,ORDERBY语句中可以通过设定DESC,依据某列降序排列A、正确B、错误答案:A24.数据分析挖掘的目的是把隐藏在一大批看似杂乱无章的数据中的有价值的信息进行整合并提炼出来,找出所研究对象的内在规律。A、正确B、错误答案:A25.分行数据集市是面向分行应用,由总行、分行共同开发,基于总行大数据平台,建设架构统一、模型统一、运维统一的基础数据服务云。A、正确B、错误答案:A26.SQL语句,xbetweenyandz等同于x>yandx<zA、正确B、错误答案:B27.集成学习研究的核心是如何产生并结合“好而不同”的个体学习器。A、正确B、错误答案:A28.为提升数据存储以及检索的有效性,数据分析过程中产生的大数据量的临时表建议采取哈希分布表的模式。A、正确B、错误答案:A29.聚类是把整个数据库分成不同的群组,它的目的是使群与群之间的差别明显,而同一个群之间的数据尽量相似。A、正确B、错误答案:A30.SQL语句,考虑到建表效率,创建临时表(尤其在插入数据量较大时)应避免采用createtabletable_nameselect..fromsource_table的方式A、正确B、错误答案:A31.分析报告明确目标后,首先应编制“报告框架”,并细化每部分的分析要点和分析思路,结合业务发展方向和问题提出数据需求。A、正确B、错误答案:A32.SQL当一个表所有行都被DELECT语句删除后,该表也同时被删除了A、正确B、错误答案:B33.SQL为了获得表中多个列的平均值,可以仅使用一个AVG()函数。A、正确B、错误答案:B34.数据挖掘平台是高效的计算平台,所以编写SQL语句时完全不需要考虑性能问题。A、正确B、错误答案:B35.Python中,定义函数时,如果没有显式地返回值,那么它会返回None。A、正确B、错误答案:A36.数据标准中的指标是本行日常业务开展过程中产生的基础性明细数据。A、正确B、错误答案:B37.select*fromtable_1whereusernamelike'yue%';会进行全表扫描。A、正确B、错误答案:B38.在选择理财精准营销模型时,由于前期产品刚上市,未积累购买产品的客户样本,可以先基于业务规则模型筛选潜在客户,后期基于积累样本使用机器学习模型,进一步筛选高潜力精准客群,提高营销转化率。A、正确B、错误答案:A39.众数是数据集中出现最频繁的数值。A、正确B、错误答案:A40.商业银行除了对股东和客户负责之外,还必须对整个社会负责。A、正确B、错误答案:A41.SQL语句,!=和<>都代表不等于A、正确B、错误答案:A42.在mole中,特征转化节点的数据分桶函数用来对数据进行分段处理。A、正确B、错误答案:A43.我国商业银行所发行的金融债券,是在全国银行间债券市场上发行和交易的。A、正确B、错误答案:A44.Pythonwhile语句用于循环执行满足判断条件的语句,直至条件不满足时退出循环。A、正确B、错误答案:A45.在不违反合同协议的前提下,应尽可能实现外部数据的行内存储与跨领域共享。A、正确B、错误答案:A46.数据质量管理的原则是“谁的系统谁管理、谁的业务谁负责”。A、正确B、错误答案:A47.SQL语句的truncate会删除表中所有记录,并且将重新设置所有的索引,不会记录日志,所以执行速度很快,但不能通过rollback撤消操作。A、正确B、错误答案:A48.Plot.bar()函数绘制的是柱状图。A、正确B、错误答案:A49.SQL语句,聚合函数COUNT(*)计算空值。A、正确B、错误答案:A50.分析报告编制过程中“报告图形化展示”的目的是提升报告可读性。A、正确B、错误答案:A51.在SQL数据库中,使用UPPER()可以将字符串全部转换为大写。A、正确B、错误答案:A52.纳入我行《中国农业银行数据分析项目管理办法》中模型部署管理的模型特指依托数据分析项目,并在数据分析挖掘平台完成建模、具有一定业务价值、需要在数据分析挖掘平台运行中心定期运行的模型。A、正确B、错误答案:A53.SQL语句,MIN()返回指定列的最小值,且忽略列值为NULL的行。A、正确B、错误答案:A54.在SQL中用于查询的语句是SELECT。A、正确B、错误答案:A55.数据资产管理平台包括:大数据平台和集市基础数据资产;数据中台指标、挖掘模型、挖掘特征、标签等数据资产。A、正确B、错误答案:A56.短期借款是指期限在一年或一年以下的借款。A、正确B、错误答案:A57.SQL语句,在SELECT语句中,子查询总是从内向外处理。A、正确B、错误答案:A58.基于分行数据服务云推广,分行实现本地特色数据自主入库分行集市个性区的试点。A、正确B、错误答案:A59.分行数据集市满足分行营销、管理、考核等分析型应用数据需求和特色业务创新需要。A、正确B、错误答案:A60.分行数据集市总行共性区的数据表来源只来自于大数据平台主库。A、正确B、错误答案:B61.《中华人民共和国民法总则》规定不得非法收集、使用、加工、传输他人个人信息,不得非法买卖、提供或者公开他人个人信息。A、正确B、错误答案:A62.统计学上用方差和标准差来度量多维数据的离散程度。A、正确B、错误答案:B63.do.while.是Python中流程控制语句的一种形式A、正确B、错误答案:B64.ROC曲线越靠近左上角性能越好。A、正确B、错误答

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论