数据分析师(中级)认定考试复习题库-下(多选、判断题)_第1页
数据分析师(中级)认定考试复习题库-下(多选、判断题)_第2页
数据分析师(中级)认定考试复习题库-下(多选、判断题)_第3页
数据分析师(中级)认定考试复习题库-下(多选、判断题)_第4页
数据分析师(中级)认定考试复习题库-下(多选、判断题)_第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1数据分析师(中级)认定考试复习题库-下(多选、判断题汇总)多选题1.个人集市的模型分为____A、缓冲层B、中间层C、应用层D、基础层答案:ABC2.按照农业银行数据安全管理的有关规定(《数据安全管理办法》(试行)),本行员工对其使用数据负有保护义务和保密责任,包括___。A、使用数据前,应事先确认数据主体,并征得主体的明示同意B、对履行职责中知悉的个人信息、隐私和商业秘密必须严格保密,未经有权人审批或授权,不得泄露、出售或者私自向知悉范围以外的单位和个人提供C、妥善保管本人信息系统密码,不得向任何人出借D、数据处理使用完毕后,及时归档、清理和销毁答案:BCD3.常见的半结构化数据有____。A、XMLB、JSONC、音频D、文档答案:AB4.下列属于无监督学习的算法有____A、聚类B、关联规则C、GBDTD、逻辑回归答案:AB5.以下常用的离散分布有____A、0-1分布B、泊松分布C、指数分布D、正态分布答案:AB6.常见的特征衍生方式有哪些?A、特征扩展B、自动衍生C、合成特征D、特征组合答案:ABCD7.知识图谱可以应用的领域包括A、反欺诈B、大数据风控C、推荐系统D、聊天机器人答案:ABCD8.下列哪几项是个人数据集市的上层应用?A、CMMB、DCRMC、经营管理平台D、PSCV答案:BCD9.下列哪些机器学习算法使用了Boosting学习方法思想?A、随机森林B、AdaboostC、GBDTD、XGBoost答案:BCD10.客户的资产信息主要包括哪些?A、月日均存款B、季日均AUMC、年日均AUMD、存款在AUM的占比答案:ABCD11.在Woody开展数据分析项目的过程中,可以通过下列哪些方式查询数据表信息?A、Woody的放大镜B、数据资产视图C、showcreatetable命令D、数据服务目录答案:ABCD12.E-R图提供了表示实体型、属性和联系的方法,分别用什么形状表示?A、圆形B、矩形C、椭圆形D、菱形答案:BCD13.BP神经网络包含哪些层____A、输入层B、隐藏层C、输出层D、卷积层答案:ABC14.以下哪些属于numpy中的聚合函数?A、leftB、minC、maxD、mean答案:BCD15.MLlib可以实现哪些数据分析操作?A、分类B、回归C、聚类D、降维答案:ABCD16.我行向借款人发放的,用于借款人购买住房的贷款,具有什么特点?A、期限长B、额度高C、利率优惠D、还款方式多样答案:ABCD17.SQL语句,以下语句不会导致全表扫描的是.A、selectidfromtwheresubstring(name,1,3)='cif'B、selectidfromtwherenamelike'cif%'C、selectidfromtable_1wherenum=10ornum=20D、selectidfromtwherecreatedate>='2005-11-30'andcreatedate答案:BD18.以下哪些是我行的线上信贷产品?A、网捷贷B、随薪贷C、助业快e贷D、房抵贷答案:AC19.以下哪些是数据可视化的方法?A、概率密度图B、箱形图C、饼图D、散点图答案:ABCD20.SQL语句,以下语句会导致全表扫描的是.A、selectidfromtwheresubstring(name,1,3)='abc'B、selectidfromtwherenamelike'abc%'C、selectidfromtwherenum/2=100D、selectidfromtwherenum=100*2答案:AC21.数据项技术属性描述数据与信息技术实现相关联的特性,是数据项在信息系统项目实现时统一的技术方面定义,包括____A、数据大小B、数据类型C、数据格式D、数据字段答案:BD22.在精准营销模型建模过程中,通常会使用以下哪些特征?A、客户账号B、客户信用卡数量C、客户AUMD、客户身份证号答案:BC23.Python中,a="hello",b="python",下列选项中属于正确字符串运算的是____。A、[1:4]B、a*2C、"h"inaD、a+b答案:ABCD24.如果一位老师的年纪是30岁,那么他可能会被下列那些语句筛选出来?A、select*fromteacherwheretagebetween30and40B、select*fromteacherwheretage>=30andtageC、select*fromteacherwheretagein('30','40')D、select*formteacherwheretage>30andtage<40答案:ABC25.商业银行向中央银行借款有哪两种途径?A、贴现B、贷款C、再贴现D、再贷款答案:CD26.可以用来描述散布的度量有____A、极差B、四分位差C、方差D、标准差答案:ABCD解析:散布度量:极差、方差、标准差、四分位数。27.以下哪些属于报表的要素?A、报表编码B、报表名称C、报表频度D、加工规则答案:ABCD28.计数数据可以无限度地快速增加。处理这类数据时,分析师常用的操作有哪些?A、二值化B、区间量化(分箱)C、多值化D、区间排序分类答案:AB29.数据集常将多个数据源中的数据结合成、存放在一个一致的数据存储,需要考虑可能产生问题?A、过拟合问题B、冗余问题C、数据排序D、数据值的冲突答案:BD解析:数据集成将多个数据源中的数据结合成、存放在一个一致的数据存储,如数据仓库中,存在冗余,数据值的冲突属性。30.哪些是大数据平台典型的数据类型____A、拉链表B、明细表C、拼接表D、切片表答案:ABD解析:拼接表不是大数据平台典型的数据类型31.在CNN中,池化层的作用主要有A、降低数据的尺寸B、减小参数数量C、扩大感受视野D、增大参数数量答案:ABC32.电子银行的渠道包括____。A、网上银行B、电话银行C、手机银行D、柜台答案:ABC解析:电子银行渠道主要包括:网上银行(利用计算机和互联网)、电话银行(利用电话等声讯设备和电信网络)、手机银行(利用移动电话和移动通信网络)、自动终端(多媒体自动终端、自助上网机等)。33.Woody工具中以下哪些操作会运行jupyter文件的单元格____A、选中单元格,按Ctrl+Enter键B、点击工具栏的“Run”按钮C、选择菜单栏Cell->RunCellsD、选中单元格,按Shift+Enter键答案:ABCD解析:Woody工具中以下操作会运行jupyter文件的单元格选中单元格,按Ctrl+Enter键、点击工具栏的“Run”按钮、选择菜单栏Cell->RunCells、选中单元格,按Shift+Enter键34.在图计算中,可用于社区发现的方法包括____。A、Girvan-Newman算法B、派系过滤CPM算法C、标签传播算法(LPA)D、最短路径算法(Dijkstra)答案:ABC35.在以下场景中,哪些场景会产生数据质量问题?A、前台工作人员为了省事,将所有用户年纪都输入为30岁B、在采集数据时,客户不愿意告知某些数据项,导致该数据项缺失C、客户填写家庭住址时使用虚假地址D、由于时效性,系统中的手机号客户已不再使用答案:ABCD36.《客户数据安全分级规范》规定了数据安全级别有____。A、关键敏感级B、敏感级C、内部级D、公开级答案:ABCD37.分类问题的主要评价指标有____A、准确率B、精确率C、召回率D、F1值答案:ABCD38.连续数据的另一组常用的统计描述是散布度量,以下是散布度量有____。A、极差B、方差C、标准差D、四分位数答案:ABCD39.以下那些属于数据预处理操作____。A、数据清洗B、数据变换C、数据标准化D、特征工程答案:ABC40.以下哪些是分布式计算框架?A、MapReduceB、SparkC、PythonD、R答案:AB41.数据分析类项目项目根据应用场景主要分为____等。A、精准营销类B、支持决策类C、案防风控类D、指标加工类答案:ABC42.信用评分模型按照信贷整个生命周期,可分为哪三种类型A、申请评分B、行为评分C、催收评分D、交易评分答案:ABC43.在Python中,循环语句有____和____,允许我们多次执行一个语句或语句组A、thenB、forC、whileD、when答案:BC44.以下哪些属于numpy中的聚合函数?A、sumB、minC、maxD、mean答案:ABCD45.下列关于我行的数据管理原则的说法正确的有____A、数据谁使用、安全谁负责、责任谁承担B、最小化授权C、没有明确要求D、数据申请得越多越好答案:AB解析:我行的数据管理原则遵循“数据谁使用、安全谁负责、责任谁承担”的原则,以此确保数据使用全过程的安全。按照机构层级,我行数据管理遵循“最小化授权”原则实施分层级管理,用户仅能使用所在机构及下辖机构数据,不能越级或跨机构使用数据。按照敏感程度,平台数据分为普通数据和敏感数据。敏感数据的使用须经主管业务数据的业务审批部门和归口管理部门联合审批。46.以下哪些不是分布式计算框架?A、MapReduceB、SparkC、HDFSD、MLlib答案:CD47.数据分析挖掘流程包括哪些?A、明确分析目的和思路B、数据收集C、构建模型和模型评估D、数据应用和报告撰写答案:ABCD48.卷积神经网络一般包含哪些层____A、输入层B、池化层C、输出层D、卷积层答案:ABCD解析:CNN卷积神经网络一般包括输入层、卷积层、池化层、全连接层、输出层等49.多个属性数据间常用的统计量有____A、协方差B、相关系数C、均值D、标准差答案:AB50.假设x=array([0,1,2,3,4,5]),获取子数组[0,1,2]的正确方法是?A、x[:3]B、x[0:3]C、x[:2]D、x[1:3]答案:AB51.以下关于IPython说法正确的有____A、是一个加强版的Python解释器B、支持变量补全C、支持语法高亮D、支持“bashshell”命令答案:ABCD解析:Python是一个加强版的Python解释器、支持变量补全、支持语法高亮、支持“bashshell”命令52.在数据分析挖掘平台Woody中,启动终端(Terminal)模式后可以成功执行以下哪些命令?A、pythonB、ipythonC、%sqlselect1+1D、ls答案:ABD53.商业银行不可以从事下列哪些业务____A、代理收付款项及代理保险业务B、房地产投资C、证券经营D、汽车租赁答案:BCD54.下列选项中不属于回归算法的是______。A、线性回归B、逻辑回归C、随机森林D、支持向量机答案:BCD解析:本题考查机器学习算法中分类和回归的概念。线性回归属于回归算法,逻辑回归、随机森林和支持向量机都属于分类算法。55.大数据平台数据入库驱动方式包括____。A、应用驱动B、数据驱动C、源头驱动D、技术驱动答案:AB56.数据分析挖掘平台Woody目前支持用户执行的语言有____A、PythonB、RC、SQLD、C#答案:ABC57.个人客户营销与管理系统包括以下哪几项?A、BMPSB、OCRMC、ACRMD、PSCV答案:ABCD解析:答案存疑58.标签板块不包括:____。A、零售B、对公C、账户D、商户答案:ABD解析:本题考查标签板块的内容。按照标签领域,标签分为个人标签、对公标签、商户标签等。59.在平台建设方面,总行部署了,实现全行主要业务数据的集中存储和管理。A、大数据平台B、数据湖C、数据仓库D、数据集市答案:AD60.商业银行的性质包括____A、以追求利润为目标B、以金融资产和负债为对象C、综合性、多功能D、金融企业答案:ABCD61.在mole中,以下何种节点可以对两个数据集进行联接?A、reduceB、joinC、leftjoinD、map答案:BC62.EDA的特点有三个:____A、让数据说话B、分析方法灵活C、简单直观D、需要前提假设答案:ABC63.特征选择的目的什么?A、减少特征数量B、使模型泛化能力更强C、减少过拟合D、增加特征数量答案:ABC64.下列哪些Woody内建魔术命令可以执行sql语句?A、%%sqlB、%sqlC、%sqlstrD、%magic答案:ABC65.标签中心的功能架构主要分为____。A、数据源层B、标签数据层C、标签服务层D、应用层答案:ABCD66.下列哪些选项不是pandas索引器?A、locB、ilocC、olumnsD、values答案:CD67.下面关于逻辑运算符的优先级,哪一个说法是正确的?A、逻辑运算符AND和OR可以用来连接多个查询条件B、AND的优先级低于ORC、小括号()可以改变优先级D、多个逻辑运算符,优先级从左至右依次增高答案:AC解析:B选项是AND的优先级高于OR;D选项逻辑运算符本身具有不同的优先级,不能按照顺序来判定优先级高低。68.智能报表提供___、___、___三种服务方式。A、固定行列报表B、机构纬度定列不定行报表C、固定机构报表D、行列都不定报表答案:ABC69.GBASE表级组合压缩方式为____A、(0,0)B、(1,0)C、(1,3)D、(5,5)答案:ACD70.数据预处理阶段不包括____A、模型调参B、特征重要性排序C、异常值处理D、缺失值处理答案:AB解析:数据预处理主要包括特征初筛、异常值处理、空值处理。71.数据分析挖掘平台包含哪些工具?A、WoodyB、MoleC、SASD、Linux答案:AB72.SQL语句,删除t0表中所有的数据的语句可以是A、truncatetablet0;B、deletefromt0;C、truncatefromt0;D、eletetablet0;答案:AB73.下面____选项属于树类算法?A、ID3B、C4.5C、ART决策树D、随机森林答案:ABCD74.一个常用指标通常由____、____和____三部分组成。A、业务维度B、单位C、度量D、通用维度(公共条件)答案:ACD75.下列选项中属于Python绘图工具的有哪些?A、scikit-learnB、matplotlibC、NumPyD、seaborn答案:BD76.在二分类任务中,根据真实类别与分类模型预测类别的组合,可以将预测结果分为______。A、真正例B、假正例C、真负例D、假负例答案:ABCD解析:根据真实类别与分类模型预测类别的组合,可以分为真正例(TruePositive,TP)、假正例(FalsePositive,FP)、假负例(FalseNegative,FN)、真负例(TrueNegative,TN)。其中TP是将正类预测为正类数,FP是将负类预测为正类数,FN是将正类预测为负类数,TN是将负类预测为负类数。77.在数据分析挖掘平台Woody的笔记本(Notebook)中,若使用Python,以下哪些命令可以将数据或文件导入数据库?A、%loadB、%tableC、%df2dbD、%excel2db答案:CD78.数据分析挖掘流程不包括哪些?A、基层调查B、数据收集C、构建模型和模型评估D、分析师培养答案:AD79.在精准营销模型建模过程中,通常会使用以下哪些特征?A、所属网点B、理财余额C、国债持有情况D、当月消费笔数答案:ABCD80.pip提供了对Python包的哪些管理功能?A、列出已安装的包B、查找指定的包C、安装指定的包D、卸载指定的包答案:ABCD解析:pip提供了对Python包的列出已安装的包、查找指定的包、安装指定的包、卸载指定的包管理功能81.个人客户营销与管理系统的主要功能包括A、工作平台B、客户画像C、营销管理D、客户管理答案:ABCD解析:个人客户营销与管理系统的主要功能包括:工作平台、客户画像、营销管理、客户管理、业绩管理、管理报表、系统管理等。82.根据农业银行员工行为守则,关于勤勉尽职的要求有____A、员工应具备岗位任职资格或能力,熟练掌握业务技能并树立终身学习理念,与时俱进,提升素质。B、员工应恪守制度要求和办事程序,勤奋努力,严谨审慎,精益求精,尽职尽责。C、员工应科学管理时间,提高工作效率。D、员工岗位变动或离职,应按规定妥善交接工作,遵守脱密和竞业限制约定,不得擅自带走所在机构的财物、工作资料和客户资源。答案:ABCD83.以下哪些不属于数据分析模型场景范畴?A、应对内外部审计场景B、监管检查场景C、司法检查场景D、日常业务经营管理报表需求答案:ABCD解析:我行数据分析模型不包括为应对内外部审计、监管检查、司法检查等进行的临时性数据提取需求以及日常业务经营管理报表和指标加工需求。84.在自然语言处理中,常用关键词提取算法有____。A、TF-IDFB、RNNC、LDAD、CNN答案:AC85.常见的文本预处理包括:_____。A、去除停用词B、去除高频词C、去除罕见词D、词干提取答案:ABCD解析:常见的文本预处理包括:去除停用词、基于频率过滤和词干提取。其中基于频率过滤又包括去除高频词和罕见词。86.在Woody中,常用的内建魔术命令正确的有____A、%sql执行多行sql语句B、%%sql执行单行sql语句C、%df2dbDataFrame导入数据库D、%excel2dbexcel文件导入数据库答案:CD87.在mole中,若当前节点的状态为running,则节点的下一状态可能为____A、finishedB、dirtyC、startD、error答案:AD88.公共集市数据需求填写需要明确____。A、最晚投产时间B、数据字段C、加工频率D、加工规则答案:BCD解析:填写《公共集市数据需求》,明确对公共集市的数据接口需求,主要写明应用系统需要的数据字段、加工频率、加工规则,保证数据集市数据加工的规范性和准确性。89.描述性数据挖掘包括哪些方法?A、数据总结B、时间序列C、聚类D、关联分析答案:ACD90.下列选项中,属于Python关键字的是____A、importB、reakC、returnD、and答案:ABCD91.下列选项中用于NumPy数组排序的是?A、np.sort()B、np.argsort()C、np.sorted()D、np.argsorted()答案:AB92.以下关于概率质量函数的说法错误的是?A、描述离散型随机变量B、在定义域内有限个点上的取值可以为负C、不一定是单调的D、在定义域上的求和必须小于1答案:BD93.以下哪些问题适合使用深度学习模型?A、图片识别B、语音识别C、计算机视觉D、机器翻译答案:ABCD94.根据输入数据样本是否带有标记,机器学习任务可分为______。A、有监督学习B、无监督学习C、半监督学习D、全监督学习答案:ABC95.C3总体架构已经建成两大基础平台,两大平台相辅相成、互为补充。A、全球信贷管理平台B、全球信贷支持平台C、全行信贷管理平台D、全行信贷支持平台答案:AB96.E-R模型是用E-R图来描述现实世界的概念模型。E-R图的组成元素有____A、关系B、实体C、属性D、视图答案:ABC97.处理个人信息的,应当遵循合法、正当、必要原则,不得过度处理,并符合下列条件____A、征得该自然人或者其监护人同意,但是法律、行政规另有规定的除外B、公开处理信息的规则C、明示处理信息的目的、方式和范围D、不违反法律、行政法规的规定和双方的约定答案:ABCD98.数据分析挖掘平台可以提供____。A、丰富的分析挖掘工具B、集成的算法库C、共享的数据分析知识库D、支撑计算与存储资源的统一管理与分配答案:ABCD99.在数据分析挖掘平台Woody的笔记本(Notebook)中,对于代码单元格的输出域(Output),以下说法a的是____A、可以隐藏输出B、无法清除输出C、可以展开输出D、可以折叠输出答案:ACD100.SQL进行组合查询时,下列关于UNION说法正确的是____。A、使用UNION很简单,所要做的只是给出每条SELECT语句,在各条语句之间放上关键字UNIONB、UNION几乎总是完成与多个WHERE条件相同的工作C、UNION从查询结果集中自动去除了重复的行D、如果想返回不去重的所有匹配行,应使用UNION而不是UNIONALL答案:ABC101.下面____选项属于boosting算法?A、GBDTB、XGBoostC、LightGBMD、RandomForest答案:ABC102.分析报告的工作步骤包括明确报告目的、报告框架、____、报告校稿及交付等步骤。A、数据分析B、报告初稿C、迭代完善D、报告图形化展示答案:ABCD103.关于元数据,以下说法正确的是____。A、是描述其他数据的数据B、是对数据及信息资源的描述性信息C、是指源系统采集到的数据D、是第一手的数据,最原始的业务交易数据答案:AB104.显示t2表中a字段去重后的结果,以下SQL语法正确的有____A、SELECTaFROMt2;B、SELECTDISTINCTaFROMt2;C、SELECTa,count(*)FROMt2groupbya;D、SELECTa,b,count(*)FROMt2groupbya,b;答案:BC105.在Python中,以下语句正确的是______。A、frompandasimportxgboostB、fromnumpyimportsvmC、fromsklearnimportsvmD、importxgboostasxgb答案:CD106.SQL包括____功能A、DCLB、DMLC、DDLD、TL答案:ABC107.对于需要落地部署的数据分析模型,项目统筹管理部门组织____进行评审,明确模型部署方案、部署时间计划、评估部署风险并提出应对建议。A、项目申请部门B、项目实施部门C、技术支持部门D、以上都不对答案:ABC108.以下是我行数据标准体系构建策略内容的有________A、长短规划结合B、刚柔实施配套C、通过实践检查D、适时处置提高答案:ABCD109.数据分析类项目实施管理包括。A、数据准备B、数据探查C、数据建模D、模型验证答案:ABCD110.大数据服务目录主要包含了哪些方面的内容:A、基础数据目录B、指标报表目录C、挖掘模型目录D、IT系统服务目录答案:ABC111.对公集市的模型分为____A、缓冲层B、中间层C、应用层D、基础层答案:ABC112.数据分析类项目实施管理除了数据准备和模型应用,还包括哪些活动____A、数据探查B、特征工程C、数据建模D、模型验证答案:ABCD113.下列选项中属于Pandas基本数据结构的是?A、NumPyB、seriesC、DataFrameD、index答案:BCD114.在机器学习中需要划分数据集,常用的划分测试集和训练集的划分方法有哪些______。A、留出法B、交叉验证法C、自助法D、评分法答案:ABC解析:本题考查机器学习的概念。常用的划分测试集和训练集的划分方法包括留出法、交叉验证法和自助法。115.数据集市可以分为两种类型,分别为__数据集市和__数据集市。A、独立型B、从属型C、关系型D、非关系型答案:AB116.SQL以下是比较操作符的是A、选项A是:!B、选项B是:!=C、选项C是:>=D、选项D是:==答案:BCD117.以下是DML语句的有A、insertB、updateC、deleteD、select答案:ABCD解析:insert、update、delete、select都为数据操纵语言。DML118.在神经网络中,如果模型欠拟合,可尝试的方法包括____。A、增加模型隐藏层数B、增加隐藏层神经元的个数C、DropoutD、批规范化(BN)答案:AB解析:本题考查神经网络的概念。在神经网络中,处理欠拟合的方法包括增加模型隐藏层数和增加隐藏层神经元的个数。119.监督学习基本等价于数据挖掘的预测任务,以下哪些数据监督学习?A、分类B、回归C、聚类D、数据统计答案:AB120.以下哪些方法用于处理数据缺失问题?A、统计法填充B、模型填充C、真值转换法D、专家补全答案:ABCD121.下列属于python的比较运算符的有____A、==B、>=C、!=D、=答案:ABC122.以下哪些属于大数据分析挖掘的过程?A、数据准备B、建立模型C、模型评估D、模型发布答案:ABCD解析:数据分析流程主要包括6个既相对独立又互有联系的阶段。它们是:明确分析目的和思路、数据收集、数据处理、构建模型、模型评估、数据应用和报告撰写。123.数据管理框架包含的内容有:A、数据域B、管理域C、服务域D、管理流程和机制域答案:ABCD124.集成学习包括哪两种学习方法?A、BaggingB、oostingC、LSTMD、SVM答案:AB125.个人集市应用数据区从加工层次看分为三层:__层、__层、__层。A、缓冲B、中间C、应用D、贴源答案:ABC解析:应用数据区从加工层次看分为三层:缓冲数据层、中间数据层、应用数据层。126.以下哪些属于numpy中的聚合函数?A、varB、minC、maxD、mean答案:ABCD127.操作数据区(ODS),采用标准化的流程和规则,对源系统数据进行哪些操作?A、加载B、清洗C、转换D、汇总答案:ABC128.以下哪个选项是我行数据分析师的必备技能?A、熟悉银行业务B、熟悉银行数据C、熟悉机器学习D、熟悉CSS答案:ABC129.关于GROUPBY子句,以下说法正确的是:A、HAVING子句中的每一个元素不必出现在SELECT列表中。HAVING子句限制的是分组,而不是行,因此可以使用聚合函数。B、GROUPBY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数)C、GROUPBY子句必须出现在WHERE子句与ORDERBY子句之后D、如果分组列中包含具有NULL值的行,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。答案:ABD130.IFAR会计期间是根据会计制度的规定和管理核算的需要,对经济业务活动的会计核算、分期结算账目和编制财务会计报告一个周期的规定。包括标准____。A、月B、季度C、半年D、年度答案:ABCD131.下列关于协方差的说法中正确的有____A、如果两个变量相互独立,那么它们的协方差为零。B、如果两个变量的协方差不为零,那么它们一定是相关的。C、如果两个变量协方差为零,它们之间一定没有线性关系。D、虽然两个变量不相互独立,但是协方差有可能是零。答案:ABCD132.数据中台的汇聚整合能力,可以一定程度上解决导致数据孤岛的问题;提纯加工能力,可以加深对数据的理解,通过统一的数据标准和质量体系,形成标准数据资产体系;服务可视化能力,可以支持数据资产场景化能力的快速输出,以响应客户的动态需求。A、数据汇聚整合B、数据提纯加工C、数据服务可视化D、数据价值变现答案:ABC解析:本题考查数据中台的核心能力内容,数据中台需要具备数据汇聚整合、数据提纯加工、数据服务可视化、数据价值变现4个核心能力,让企业员工、客户、伙伴能够方便地应用数据。133.以下哪些属于商业银行的中间业务A、担保业务B、贷款业务C、承诺业务D、借款业务答案:AC134.在woody平台中,以下SQL使用正确的是____。A、%sql多行语句B、%%sql单行语句C、%sql单行语句D、%%sql多行语句答案:CD135.下列关于农业银行员工行为守则的说法,正确的有____A、员工应自觉维护国家利益和金融安全B、员工应把个人职业生涯和农业银行发展有机结合起来C、员工应维护农业银行的形象和利益D、员工应践行爱国、敬业、诚信、友善的核心价值观答案:ABCD136.对商业银行来说,数据分析挖掘可应用于哪些方面?A、风险管理B、产品创新C、决策支持D、客户管理答案:ABCD解析:本题考查的是数据分析挖掘的应用范围,主要有产品营销、风险管理、客户管理、决策支持、产品创新等。137.以下可以进行特征排序的算法有哪些?A、决策树B、CNNC、XGBoostD、RNN答案:AC138.以下哪些领域是NLP经典应用领域?A、机器翻译B、情感分析C、文本分类D、智能问答答案:ABCD解析:本题考查NLP的应用领域,包括机器翻译,情感分析,文本分类,智能问答等领域。139.以下哪些是理财精准营销模型中可以加工的特征?A、客户的基本信息B、资产余额信息C、持有理财信息D、客户行为信息答案:ABCD解析:客户的基本信息、资产信息、理财信息、持有产品信息、行为信息、交易信息等信息均可以作为理财精准营销模型的特征140.XGBoost模型在通常待调的参数有____。A、学习轮数B、树的深度C、正则项系数D、学习率答案:ABCD141.数据清理中,处理缺失值的方法是______。A、估算B、整例删除C、变量删除D、成对删除答案:ABCD142.总行数据分析师应在数据应用过程中发现____等数据问题,推动各领域数据治理。A、数据缺失B、数据不准确C、数据不一致D、数据不整合答案:ABCD143.公共集市需求交付研发中心需提供以下材料()。A、大数据服务目录B、业务需求说明书C、XX项目数据需求D、模型说明书答案:BC144.下列选项中,属于Python合法标识符的是____A、gb123B、_nameC、2BD、break答案:AB145.线上信贷产品的主要特征是____A、普惠化B、移动化C、智能化D、场景化答案:ABCD146.____属于非结构化数据。A、文档B、图片C、视频D、数据库表格答案:ABC解析:非结构化数据是没有固定结构的数据,各种文档、图片、视频/音频等都属于非结构化数据。147.业务数据资产包括:A、指标B、报表C、模型D、标签答案:ABCD148.以下常用的连续分布有____A、二项分布B、指数分布C、正态分布D、泊松分布答案:BC149.在数据分析挖掘平台Woody项目列表页面,非项目管理员的项目成员可以执行哪些操作____A、打开项目B、查看项目成员C、管理项目成员D、项目清单筛选和排序答案:ABD150.以下哪些选项不是数据分析类项目的主要应用场景?A、信用卡分期精准营销B、应急提数C、IT系统投产前数据测试D、反欺诈关系图谱答案:BC151.数据分析挖掘是非常有价值的,它在银行业的应用体现在哪些方面?A、信用卡的审批额度B、识别贷款业务中潜藏的操作风险C、贵宾客户的流失预测D、掌银对消费者的产品推荐答案:ABCD152.以下属于图的基本概念的是A、度B、路径C、连通D、词袋答案:ABC153.数据挖掘平台目前提供的分析工具有____A、WoodyB、MoleC、SASD、Tableau答案:ABC154.在GBase中,计算时会默认忽略列值为NULL的行的函数有:A、VGB、SUMC、MAXD、MIN答案:ABCD155.XGBoost工具包能够实现的任务包括______。A、降维B、分类C、回归D、聚类答案:BC156.SQL是一种专门用来与数据库沟通的语言,集功能于一体。A、数据建模B、数据操纵C、数据定义D、数据控制答案:BCD157.业务部门可按需申请数据分析挖掘平台的数据使用权限,并对其获取数据的哪些数据处理行为承担安全保密责任?A、查询B、使用C、下载D、传输及销毁答案:ABCD158.商业银行的信用创造职能是在____和____职能的基础上产生的。A、信用创造B、信用中介C、支付中介D、金融服务答案:BC解析:答案存疑159.通常可以使用以下那些量来计算多个联系型特征之间的关系?A、协方差B、相关系数C、方差D、四分位数答案:AB160.整的公共集市数据服务需求研制流程,包含以下____环节。A、需求意向B、需求研制C、需求评审D、需求交付答案:ABCD161.对公数据区数据资产按技术架构分类,包括______数据。A、缓冲层B、中间层C、应用层D、基础层答案:ABC162.下列关于数据安全面临的挑战的说法中,正确的有:A、数据量爆发式增长加大了数据泄露风险B、数据应用越来越灵活提升了事故发生概率C、大数据技术带来新的安全威胁,大数据分析使黑客的攻击更加精准D、数据安全保密的法律和政策日益严格答案:ABCD163.对于数据分析挖掘平台的使用,以下做法正确的是____A、自己的用户可以给领导使用B、编写分析语句要考虑执行效率C、使用平台要有安全保密意识D、权限允许范围内合规使用数据答案:BCD解析:平台用户对该用户的系统及数据操作承担责任,在权限允许范围内合规使用数据,并对用户名及密码严格保密,严禁将用户账号提供他人使用。平台使用中出现违规违纪行为的,按照《中国农业银行员工违规行为处理办法》等有关规定对相关责任人进行处理。164.数据资产视图汇集的数据资产有____A、技术数据资产(系统、表、字段)B、业务数据资产(指标、报表、模型、标签)C、管理数据资产(各系统服务目录、主数据)D、流程数据(数据治理流程中产出的数据等)答案:ABCD165.数据库系统的组成部分包括哪些A、数据库B、数据库管理系统C、应用程序D、数据库管理员答案:ABCD解析:数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DataBaseAdministrator,DBA)组成的存储、管理、处理和维护数据的系统。166.数据分析过程中,以下选项哪些可以用于画图____A、EchartsB、MatplotlibC、SeabornD、NumPy答案:ABC167.会计主体是IFAR系统各项账务数据、报告数据组织的基本单位。目前系统中设置会计主体分别为。A、境内核算主体、境外核算主体B、境内并账主体、境外并账主体C、境内合并主体、境外合并主体D、汇总单元答案:ABCD168.Python函数的组成部分有____A、函数名B、形参列表C、函数体D、返回值答案:ABCD169.在数据探查的过程中,主要针对____等情况进行探查。A、数据分布B、数据准确性C、数据相关性D、数据缺失答案:ABCD170.下列哪几项属于“繁星计划”大数据分析人才培养方式?A、培训考试B、知识分享C、跟班学习D、技能竞赛答案:ABCD171.GBase中,SQL使用____函数可将字符串转换为大写。A、SOUNDEX()B、UPPER()C、UCASE()D、CONVERT()答案:BC172.在Woody中,不能实现的操作是____A、New→TextFileB、New→FolderC、New→XmlD、New→Html答案:CD173.个人客户数据集市的上层应用包括如下哪些系统?A、DCRMB、DC、PSCVD、ACRM答案:ABCD174.分类问题的评分指标有______。A、准确率B、召回率C、精确率D、F1分数答案:ABCD175.在GBase中,下列关于COUNT函数的说法正确的有:A、使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。B、使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。C、使用COUNT(DISTINCTcolumn)则会取消该列中的重复值。D、使用COUNT(column)默认不会取消该列中的重复值。答案:ABCD176.在客户营销管理领域,鉴于对公客户及个人客户两方面在数量级别、管理方式、营销策略以及客户拓展方面有较大的不同,分别建设了__数据集市和__数据集市。A、运营B、监管C、个人D、对公答案:CD177.SQL关于子查询,以下说法正确的是____。A、一般来说,表连接都可以用子查询替换B、一般来说,子查询都可以用表连接替换C、相对于表连接,子查询适合于作为查询的筛选条件D、相对于表连接,子查询适合于查看多表的数据答案:AC178.在数据分析挖掘平台Woody的笔记本(Notebook)中,单元格的输出(Output)可以是选项中的哪些____A、数字B、文本C、表格D、图片答案:ABCD179.在Python中,标识符的命令规则包括A、可以以数字开头B、可以下划线开头C、除了开头,其他部分可以由字母、数字或下划线组成D、可以字母开头答案:BCD180.下列关于统计学知识的表述中正确的有:A、在统计学中,用概率分布(probabilitydistribution)来描述随机变量或一簇随机变量在每一个可能取到的状态的可能性大小。B、在统计学中,我们描述概率分布(probabilitydistribution)的方式取决于随机变量是连续的还是离散的。C、在统计学中,我们用概率密度函数(probabilitydensityfunction或pdf)描述连续型随机变量在每一个可能取到的状态的可能性大小。D、在统计学中,我们用概率质量函数(probabilitymassfunction或pmf)可以描述离散型随机变量在每一个可能取到的状态的可能性大小。答案:ABCD181.以下的操作,会过滤空值的是A、count(cid)B、count(distinctcid)C、ount(name)D、count(*)答案:ABC182.以下SQL语句正确的有____A、SELECTcust_idFROMOrdersWHEREorder_numIN(SELECTcust_idFROMOrderItemsWHEREprod_id='RGAN01');B、SELECTcust_idFROMOrdersWHEREorder_numIN(SELECTorder_numFROMOrderItemsWHEREprod_id='RGAN01');C、SELECT*FROMOrdersWHEREcust_idIN(SELECTcust_idFROMOrderItemsWHEREprod_id='RGAN01');D、SELECT*FROMOrdersWHEREcust_idIN(SELECTorder_numFROMOrderItemsWHEREprod_id='RGAN01');答案:BC183.以下那些属于特征衍生的操作?A、将特征进行one-hot编码B、特征间进行加减乘除C、补充特征缺失值D、将特征进行标准化答案:AB解析:将特征进行one-hot编码、特征间进行加减乘除属于特征衍生的操作。184.在Pandas中,可以用于剔除和填充缺失值的有____A、isnull()B、notnull()C、dropna()D、fillna()答案:CD185.以下哪些是数据预处理的常见技术?A、数据清洗B、数据展示C、数据变换D、数据存储答案:AC186.以下叙述正确的是____。A、目标变量(标签)是离散值,称为分类任务B、目标变量(标签)是连续值,称为回归任务C、垃圾邮件识别属于回归任务D、预测房屋价格属于回归任务答案:ABD187.下列哪些选项属于机器学习建模流程的操作?A、数据清洗B、特征缩放/归一化C、训练模型D、交叉验证答案:ABCD188.我行的数据安全管理包括____A、敏感数据脱敏B、数据使用授权C、结果数据导出D、过期数据清理答案:ABCD189.明细表记录某一时间发生的业务信息,数据持续积累,新的数据不会影响以前的记录,以下哪些数据一般使用明细表存储?A、签约信息B、交易流水C、登录记录D、操作日志答案:BCD190.以下哪些不是数据分析类项目的主要应用场景?A、为实现特定业务目标对数据进行分析挖掘B、应对外部审计提数C、为司法监察进行提数D、经营管理报表加工指标答案:BCD191.在mole的随机森林模型中,在分类问题中的输出采用以下何种方式来得到?A、简单多数投票法B、单颗树输出结果的简单平均C、后一棵树将前一颗树的残差作为输入D、利用模型的负梯度值进行多轮迭代答案:AB192.GBASE支持的字符型为____A、CHARB、VARCHARC、TEXTD、STRING答案:ABC193.下列那些指标可以用来衡量算法预测误差。A、平均绝对误差B、加权平均绝对误差C、平均绝对百分误差D、均方根误差答案:ABCD194.在Gbase中,以下数据类型是数值型的有A、INTB、FLOATC、DECIMALD、OUBLE答案:ABCD195.下列哪几项和“繁星计划”相关?A、大数据分析集中培训班B、跟班学习C、成果经验交流D、同业交流答案:ABCD解析:总行启动“繁星计划”,加快数据分析师培训工作,包括面向全行组织多期大数据分析集中培训班、组织分行专职数据分析师到总行信息管理部数据分析核心团队跟班学习、同时不定期举行数据分析工作成果经验及与先进同业、互联网公司等的交流学习等,推进数据分析师队伍建设。196.数据质量管理的目标包括____。A、持续提升数据质量B、确保信息数据合法合规C、促进数据应用价值的充分发挥D、直接创造利润答案:ABCD197.在关系数据库中,如果一列是主键,那么该列A、任意两行的值都不同B、该列的值不允许修改或更新C、该列没有NULL值D、count(主键列名)效率优于count(*)答案:ABC解析:答案存疑198.IFAR会计期间分为。A、正常会计期间B、附属会计期间C、主会计期间D、副会计期间答案:AB199.下列不属于集成学习方法的有______。A、线性回归B、逻辑回归C、XGBoostD、LightGBM答案:AB200.对于敏感数据数据需求,业务部门填写《关于申请使用数据分析挖掘平台数据的函》,通过部室商办签报向哪两个部门提交申请?A、业务审批部门B、人资资源部门C、归口管理部门D、档案管理部门答案:AC201.在Python中逻辑运算符的关键字包括____A、ndB、ifC、orD、not答案:ACD202.数据中台是一种______。A、技术方案B、战略选择C、组织形式D、方法论答案:ABCD203.以下哪类存款在存入时约定存期?A、整存整取B、零存整取C、定活两便D、活期存款答案:AB解析:整存整取定期储蓄存款是存款时约定存期,一次存入本金,全部或部分支取本金和利息的业务。零存整取定期储蓄存款是存款时约定存期,按月定额存储,到期一次支取本息的业务。204.在数据分析挖掘平台Woody项目中,可以新建选项中的哪些____A、Python笔记本(Notebook)B、文本文件(TextFile)C、文件夹(Folder)D、R笔记本(Notebook)答案:ABCD205.根据《中国农业银行数据分析挖掘平台应用管理细则》,数据管理包括。A、数据分级管理B、敏感数据脱敏C、数据使用授权D、结果数据导出答案:ABCD206.调整超参数的方法有那些。A、手动调参B、网格搜索C、随机搜索D、自动超参数优化方法答案:ABCD解析:调整超参数的方法包括:手动调整超参数、自动超参数优化方法、网格搜索、随机搜索。207.SQL语句,tB表中查询a字段在D0和50之间的记录(包含D0和50),以下正确的是____A、SELECT*FROMtBWHEREaBETWEEND0AND50B、SELECT*FROMtBWHEREa>D0anda<50C、SELECT*FROMtBWHEREa>=D0andaD、SELECT*FROMtBWHEREain(D0,50)答案:AC208.总行的项目管理员由总行管理员根据项目需求设定,一般由归口管理部门数据分析师担任,负责哪些工作?A、指定平台管理员B、所负责的数据分析项目的用户管理C、所负责的数据分析项目数据授权的实施D、负责平台用户、项目、数据、模型、知识、资源等管理工作答案:BC209.对于信用评分而言,主要检验模型对好坏账户排队区分效果的是?A、交换曲线B、K-S指标C、拟合度曲线D、区分度曲线答案:AB解析:对于信用评分而言,主要检验模型对好坏账户排队区分效果的是交换曲线、K-S指标。210.常见的数据降维方法包括:____。A、SVDB、ICAC、PCAD、FA答案:ABCD解析:答案存疑211.下列选项中,属于Python合法标识符的是____A、breakB、123_yearC、_age_30D、Year_123答案:CD解析:本题考查Python标识符的命名规则。在Python中,标识符的命令规则如下:①以字母、下划线开头;②其他部分由字母、数字或下划线组成;③不能使用关键字命名;④常量一般全部是大写;⑤命名要有意义,不宜过长。212.我行引入外部数据的总体思路是____。A、统筹组织B、严控增量C、部门协同D、总分联动答案:ACD213.数据分析挖掘平台敏感数据的使用须经____和____联合审批。A、主管业务数据的审批部门B、平台归口管理部门C、科技部门D、各一级分行答案:AB解析:数据分析挖掘平台敏感数据的使用须经主管业务数据的审批部门和平台归口管理部门联合审批。214.标签中心数据标签根据加工逻辑的不同,分为:____。A、基础标签B、公共标签C、模型标签D、衍生标签答案:ACD215.对于必要的数据出行,应依据行内数据安全保密相关制度,对数据内容的____和____进行评估审查。A、敏感性B、连续性C、重要性D、技术特性答案:AC216.在mole中,以下哪些节点的父节点必须为特征和标签选择节点A、数据拆分B、朴素贝叶斯C、逻辑回归D、oneHot编码答案:BC217.以下属于社区发现的算法的是A、标签传播法B、Girvan-Newman算法C、kNN算法D、派系过滤CPM算法答案:ABD218.数据预处理主要包括____A、模型发布B、特征重要性排序C、异常值处理D、缺失值处理答案:CD219.数据挖掘吸纳了____等技术。A、统计学B、机器学习C、数据仓库D、分布式计算答案:ABCD解析:数据挖掘吸纳了统计学、机器学习、数据仓库、分布式计算等技术。220.对于XGBoost模型来说,____。A、不允许特征中存在缺失值B、缺失值比例过高会使得特征解释能力较弱C、允许特征中存在缺失值D、缺失值会引发报错答案:BC解析:答案存疑221.下列属于集成学习方法的有____A、线性回归B、逻辑回归C、XGBoostD、LightGBM答案:CD222.分类变量是用来表示类别或标记的。分类变量的编码方式有____A、one-hot编码B、虚拟编码C、效果编码D、以上都不对答案:ABC223.以下哪些不是聚类算法?A、GBDTB、K-meansC、AprioriD、RandomForest答案:ACD224.可以在数据分析挖掘平台进行的工作有?A、擅自下载数据集到本地B、擅自查询特定客户的信息,并泄露至行外C、以html格式导出笔记本文件D、分析我行资产质量情况答案:CD225.经营管理信息平台的通用性报表需求,需要满足以下哪些要求?A、由总行业务主管部门作为需求方提出B、需提出明确的定义、业务规则、度量、频度、机构等关键属性C、通常数据应用周期不少于一年D、符合技术实施原则答案:ABCD226.以下哪些属于商业银行的中间业务____A、担保业务B、贷款业务C、承诺业务D、借款业务答案:AC227.以下属于我行数据服务体系中夯实的三项基础的是。A、数据分析服务B、数据标准体系C、数据质量管控D、数据安全保护答案:BCD228.常用的数据可视化方法有____图、____图、____图、____图等。A、概率密度图B、箱形图C、饼图D、散点图答案:ABCD229.指标规范内容包含指标的_______A、基本信息B、统计信息C、口径信息D、管理信息答案:ABCD230.大数据平台数据应用方式包括____。A、各类数据集市B、注册用户查询C、分析挖掘平台D、数据临时提取答案:ACD231.以下哪些属于数据分析师需要熟悉的计算机技术?A、操作系统B、实时流计算C、开发语言D、数据分析与机器学习框架答案:ABCD解析:本题考查的是大数据分析相关的计算机技术,包括:操作系统(Linux、Shell等)、实时流计算(Spark、Storm)、海量数据处理(Hadoop、Hbase、Hive)、开发语言(C、++、Java、Scala等)、数据分析与机器学习框架(R、Python、TensorFlow、Mahout等)。232.在数据分析挖掘平台的管理中,下列是总行信息管理部的职责的是____。A、制定平台建设规划,牵头平台建设需求研制与统筹B、制定平台管理制度,明确工作流程和职责C、制定数据安全策略,负责平台数据安全和合规管理D、负责组织平台的应用推广工作答案:ABCD233.为提升SQL脚本效率,使用借记卡活期交易明细表时可从____字段进行过滤。A、省市代码B、交易日期C、交易代码D、交易渠道答案:ABCD234.公共集市需求意向阶段,可能涉及的部门包括____。A、大数据主库业务部门B、公共集市业务部门C、大数据主库技术部门D、公共集市技术部门答案:ABCD解析:答案存疑235.我行大数据平台整体架构体系包括____。A、数据交换层B、数据应用层C、数据架构层D、数据展现层答案:ABD236.在数据分析挖掘平台Woody项目中,假设已经写好一个Python脚本文件hello.py,哪些方式可以运行该脚本?A、在笔记本(Notebook)中执行%runhello.pyB、在笔记本(Notebook)中执行hello.pyC、在终端(terminal)中执行pythonhello.pyD、在终端(terminal)中执行hello.py答案:AC237.下列关于分析报告的说法,正确的有。A、报告的目的就是揭示问题,不要回避“不良结论”B、报告要回避“不良结论”C、数据分析报告尽量使用反映变化规律的图形化展示,提升报告可读性D、数据分析报告应该多使用文字,少使用图表答案:AC238.机器学习主要包含以下几类模式____A、监督学习B、无监督学习C、半监督学习D、强化学习答案:ABCD239.下列选项中属于决策树算法的有哪些?A、ID3算法B、C4.5算法C、ART算法D、Kmeans算法答案:ABC解析:本题考查决策树相关算法应用。典型应用包括ID3算法,C4.5算法,CART算法。240.以下选项中python探索性数据分析绘图工具包有____A、MatplotlibB、SeabornC、numpyD、sk-learn答案:AB241.下面哪些是文本处理函数?A、LEFT(str,len)B、RIGHT(str,len)C、UPPER(str)D、LOWER(str)答案:ABCD242.数据分析挖掘平台Woody的项目成员对其项目数据库中的表具备哪些SQL操作权限?A、读(select)B、更新(update)C、删除(delete)D、清空(truncate)答案:ABCD解析:数据分析挖掘平台Woody的项目成员对其项目数据库中的表具备读(select)、更新(update)、删除(delete)、清空(truncate)SQL操作权限243.以下关于概率密度函数的说法错误的是?A、必须是单调递增的B、在定义域上的求和必须为1C、描述连续型随机变量D、取值必须为正答案:ABD244.按照我行相关管理要求,下列哪些文件、资料,复制时必须经过审批____。A、明确标注“依申请公开”的监管工作文件、资料B、标注“内部信息注意保密”的我行资料C、明确标注“不予公开”的监管工作文件、资料D、明确标注“内部”或“不予公开”属性的监管工作文件、资料答案:BCD解析:答案存疑245.下列关于农业银行信息化概况的说法中正确的有____A、农业银行的信息化建设从无到有、从弱到强,一直坚定不移的走自主创新之路。B、我行信息技术基础设施已具规模,形成了全国集中的数据网络C、信息科技工作已经成为农业银行快速发展的重要驱动力和核心竞争力。D、近年来,农业银行牢牢把握金融科技创新发展动向,以科技创新助力全面助力数字化转型。答案:ABCD246.完整的公共集市数据服务需求研制流程,包含以下____环节。A、需求意向B、需求研制C、需求评审D、需求交付答案:ABCD解析:公共集市数据服务需求研制流程可支持业务主管部门、指标需求部门、标签需求部门及数据需求部门进行数据服务。相应业务需求部门有数据需求时,可参照以下流程展开数据的需求研制,提出需求意向、开展需求讨论会进行需求研制、应用ITA系统进行需求评审,最终交付实施。247.在CNN中,隐藏层通常包括哪些结构____。A、卷积层B、池化层C、全连接层D、输入层答案:ABC248.碳金融是指为满足低碳发展需求,在碳交易体系下,利用、优化、创建金融工具进行碳资产交易活动,主要分为____三大类。A、碳市场支持工具B、碳市场创新工具C、碳市场融资工具D、碳市场交易工具答案:ACD解析:答案存疑249.数据分析报告最重要的是明确报告目的,其中需要明确的两项内容包括:A、如何发现问题B、解决什么问题C、如何解决问题D、向谁汇报答案:BD解析:本题依据:案例--管理决策第一节“管理决策分析报告工作步骤”-明确报告目的。分析报告首先要明确报告目的,即需要解决什么业务问题,并明确报告汇报对象。250.决策树特征(划分)选择的准则主要包括?A、信息增益B、信息准确率C、增益率D、基尼系数答案:ACD251.在数据分析挖掘平台Woody的笔记本(Notebook)中,使用Markdown单元格可以实现哪些功能____A、定义目录级别B、编辑超链接C、编辑LaTeX数学公式D、执行Python代码答案:ABC解析:在数据分析挖掘平台Woody的笔记本(Notebook)中,使用Markdown单元格可以实现定义目录级别、编辑超链接、编辑LaTeX数学公式功能252.以下哪些是我国商业银行债券投资的对象?A、国债B、地方政府债券C、金融债券D、企业债券和公司债券答案:ABCD解析:商业银行债券投资的对象,与债券市场的发展密切相关。我国商业银行债券投资的对象主要包括国债、地方政府债券、金融债券、中央银行票据、资产支持证券、企业债券和公司债券等。253.在数据分析挖掘平台Woody中,可以启用哪些插件____A、目录(TableofContents)B、标题折叠(CollapsibleHeadings)C、代码折叠(Codefolding)D、高亮匹配(Highlightselectedword)答案:ABCD解析:在数据分析挖掘平台Woody中,可以启用目录(TableofContents)、标题折叠(CollapsibleHeadings)、代码折叠(Codefolding)、高亮匹配(Highlightselectedword)插件判断题1.函数pd.merge()和pd.concat()合并DataFrame的规则是一样的。A、正确B、错误答案:B解析:答案存疑2.Pandas用read_excel函数来读取excel文件A、正确B、错误答案:A3.SQL语句,使用like进行模糊查询时,select*fromtablewhereusernamelike‘%yue%’会导致全表扫描A、正确B、错误答案:A解析:由于yue前面用到了“%”,因此该查询必然进行全表扫描,除非必要,否则尽量避免在关键词前加“%”4.特征工程是机器学习流程中一个极其关键的环节,因为正确的特征可以减轻构建模型的难度,从而使机器学习流程输出更高质量的结果。A、正确B、错误答案:A5.个人集市提供基础数据、共性指标等数据服务,满足个人客户信息服务、个人客户营销管理、客户数据分析挖掘等数据需求。A、正确B、错误答案:A解析:提供基础数据、共性指标、共性分析模型等数据服务,满足个人客户信息服务、个人客户营销管理、客户数据分析挖掘、营销渠道分析、产品业务分析等数据需求。6.现阶段,我行仍按照“集中为主,统分结合”的建设模式,持续完善“1+N”数据分析师队伍。其中,1是指总行信息管理部数据分析师核心团队。A、正确B、错误答案:A解析:“1+N”数据分析师队伍。其中,1是指总行信息管理部数据分析师核心团队,N是指总行各部门(除数据分析师核心团队)、各分行数据分析师团队。7.数据分析挖掘平台放大镜是一个查询元数据的快捷入口。A、正确B、错误答案:A8.CMM是对公客户数据区的上层应用。A、正确B、错误答案:A解析:本题考查对公集市下游系统。9.将未签字后的申请凭证上传,并点击提交用户申请,由总行管理员审批后可开通权限。A、正确B、错误答案:B10.select*fromtable_1whereusernamelike'yue%';会进行全表扫描。A、正确B、错误答案:B解析:select*fromtable_1whereusernamelike‘%yue%’关键词%yue%,由于yue前面用到了“%”,因此该查询必然进行全表扫描,除非必要,否则尽量避免在关键词前加“%”11.统一指标库不支持下发至分行进行本地化应用。A、正确B、错误答案:B12.衍生标签指基于基础标签,按照一定的业务规则经过逻辑运算生成的数据标签。A、正确B、错误答案:A13.个人集市构建全方位个人客户统一视图,满足个人客户信息服务、营销管理等数据需求。A、正确B、错误答案:A解析:个人数据区即个人客户数据集市(简称个人集市)是以个人客户数据为基础,目标是构建我行个人存款、贷款、理财及信用卡等全体个人客户的产品、合约、交易、渠道、营销、服务及行外数据的全方位个人客户统一视图,提供基础数据、共性指标、共性分析模型等数据服务,满足个人客户信息服务、个人客户营销管理、客户数据分析挖掘、营销渠道分析、产品业务分析等数据需求。14.拉链表的起始日期startdate代表生效时点。A、正确B、错误答案:A15.数据主体,是指通过数据可以识别或者关联的机构。A、正确B、错误答案:B解析:数据主体,是指通过数据可以识别或者关联的组织和个人。16.数据分析挖掘平台Woody项目中的项目管理员可以把其他用户加入本项目。A、正确B、错误答案:A解析:数据分析挖掘平台Woody项目中的项目管理员可以把其他用户加入本项目。17.标签库构建了涵盖自然、交易、行为、资产、产品合约、风险、负债、价值、营销服务、社交商圈等十大一级主题的数据标签体系。A、正确B、错误答案:A18.在决策引擎开展A/B实验时,如果用户开展了100%的单组营销实验,则无法判断这个营销组的营销效果是否比其他组更好A、正确B、错误答案:A解析:本题考查A/B实验基本知识,如果用户开展了100%的单组营销实验,则因为没有任何对照组,所以无法判断这个单独的营销组,营销效果是否比其他组更好、更显著,因为没有设置对照组。19.数据资产管理平台是元数据的查询服务系统。A、正确B、错误答案:A解析:数据资产管理平台的系统定位。数据资产管理平台系统是数据表结构、字典、数据中台指标、数据中台标签等元数据的查询服务系统20.指标编号是指标的唯一识别码,在指标生命周期内不可更改,不可重复。A、正确B、错误答案:A解析:指标编号是指标的唯一识别码,在指标生命周期内不可更改,不可重复。21.对于数组x,x[:5]是指获取前5个元素。A、正确B、错误答案:A解析:本题考查NumPy数组函数22.在NumPy一维数组中通过中括号指定索引获取第i个值。A、正确B、错误答案:A23.数据分析挖掘平台由单点登录系统验证用户信息。A、正确B、错误答案:A解析:数据分析挖掘平台由单点登录系统验证用户信息。24.我行数据集市采用范式建模的方式。A、正确B、错误答案:B解析:在公共数据集市建设过程中,经过了深入分析维度模型、范式模型的优缺点,借鉴了同业已建设的范式模型设计方式在实际应用中的情况,结合我行数据量、业务特色,制定了符合我行特色的维度建模和范式建模相结合的建模方式。25.管理决策类分析项目的工作成果一般是分析报告,为各级经营管理人员提供决策参考。A、正确B、错误答案:A解析:本题依据:案例--管理决策本章综述。管理决策类分析项目的工作成果一般是分析报告,报告目的是为各级经营管理人员提供决策参考。26.数据资产管理平台包括:大数据平台和集市基础数据资产;数据中台指标、挖掘模型、挖掘特征、标签等数据资产。A、正确B、错误答案:A解析:按照数据服务产品线设置,以能够直接被用户使用的大数据产品为核心管理对象,对应进行了视图设计。包括:大数据平台和集市基础数据资产;数据中台指标、挖掘模型、挖掘特征、标签等数据资产。27.对于大数据平台数据应用于系统建设的场景,涉及使用敏感数据的,无需征得任何业务管理部门的同意。A、正确B、错误答案:B解析:对于应用系统建设的数据应用场景,其中涉及使用敏感数据的,须征得源头数据业务管理部门和大数据平台业务管理部门的同意。28.决策树是机器学习中一种用于分类的算法,不能用于回归。A、正确B、错误答案:B解析:答案存疑29.关键敏感级和敏感级数据统称为敏感数据。A、正确B、错误答案:A解析:本行将数据安全级别划分为关键敏感级、敏感级、内部级、公开级四个级别。其中,关键敏感级和敏感级数据统称为敏感数据。30.ROC曲线越靠近左上角性能越好。A、正确B、错误答案:A解析:ROC曲线越靠近左上角性能越好,左上角坐标为(0,1),即FPR=0,TPR=1,根据FPR和TPR公式可以得知,此时FN=0,FP=0,模型对所有样本分类正确。31.分析报告编制是个不断迭代完善的过程,需要结合数据情况、业务趋势变化、工作建议等情况不断迭代报告框架、数据分析、报告完善三个步骤,直至完成报告。A、正确B、错误答案:A解析:本题依据:案例--管理决策第一节“管理决策分析报告工作步骤”-迭代完善。报告初稿提交团队讨论,结合数据情况、业务趋势变化、工作建议等情况不断迭代报告框架、数据分析、报告完善三个步骤,直至基本定稿。32.在知识图谱中,可以同时定义多种类型的节点以及它们之间的关系。A、正确B、错误答案:A解析:本题考查知识图谱的概念。知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络,可以包含多种类型的节点和多种类型的边。33.可以通过Pandas的read_excel或read_csv函数将文件中的数据导入DataFrme,再通过魔术命令%df2db将数据导入数据库A、正确B、错误答案:A解析:可以通过Pandas的read_excel或read_csv函数将文件中的数据导入DataFrme,再通过魔术命令%df2db将数据导入数据库34.不能擅自向第三方提供数据,如有必要,需与第三方有真实业务关系,并且取得外部数据提供方及相关数据主体的明示同意。A、正确B、错误答案:A35.常见的区分度指标有KS和Gini系数A、正确B、错误答案:A解析:答案存疑36.内外联合建模是指外部数据提供方利用他们的数据优势、建模优势,与行内业务部门合作,联合开展数据分析建模,促进我行创新业务产品,优化业务模型。A、正确B、错误答案:A37.Q/ABC10845《产品编号》由六位编码构成。A、正确B、错误答案:A38.信息管理部是主管业务数据的业务审批部门和数据分析项目的需求申请部门。A、正确B、错误答案:B解析:项目申请部门是主管业务数据的业务审批部门和数据分析项目的需求申请部门。39.通常而言,训练集越多,得到的模型效果越好;测试集越多,得到的结论越可信。A、正确B、错误答案:A解析:答案存疑40.探索性数据分析简单、易懂,很早就成为了数据分析的分析框架之一。A、正确B、错误答案:A41.决策引擎平台不支持对已投放实验的回收数据进行分析与可视化展示A、正确B、错误答案:B解析:本题考查决策引擎的数据回收与后评价管理,决策引擎平台支持对已投放实验的回收数据进行分析与可视化展示,利用后评价页面的趋势分析图,平台用户能够对于通过决策引擎发送、并已开展营销推送的目标客群进行效果跟踪评价。42.预测性数据挖掘包括分类、回归及时间序列等。A、正确B、错误答案:A43.数据分析挖掘平台用户离职或变更的,原用户申请部门应及时通知归口管理部门注销用户。A、正确B、错误答案:A解析:用户所属机构负责对其辖内数据分析挖掘平台用户的操作行为和安全保密等进行监督与约束。平台用户离职或变更的,原用户申请部门应及时通知归口管理部门注销用户。44.税务、公积金等分布在省市县一级政府部门的数据,总行各条线应根据自身对外工作关系积极开展数据合作。A、正确B、错误答案:B45.业务部门可按需申请数据分析挖掘平台的数据使用权限,并对其获取数据的查询、使用、下载、传输及销毁等数据处理行为承担安全保密责任。A、正确B、错误答案:A46.在选择理财精准营销模型时,由于前期产品刚上市,未积累购买产品的客户样本,可以先基于业务规则模型筛选潜在客户,后期基于积累样本使用机器学习模型,进一步筛选高潜力精准客群,提高营销转化率。A、正确B、错误答案:A47.分析报告框架要清晰,好的分析报告要架构清晰,主次分明,有基础有层次,利于阅读。A、正确B、错误答案:A48.在GBase中,AVG函数在计算时会默认忽略列值为NULL的行。A、正确B、错误答案:A49.数据分析挖掘平台用户可以将自己的账号提供给他人使用。A、正确B、错误答案:B50.数据分析项目实施管理包括数据准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论