版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(图片大小可自由调整)2024年商业经济行业技能考试-项目数据分析师理论考试近5年真题集锦(频考类试题)带答案第I卷一.参考题库(共100题)1.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()A、层次聚类B、划分聚类C、非互斥聚类D、模糊聚类2.一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为()A、需求价格弹性B、供给价格弹性C、需求交叉弹性D、供给交叉弹性3.平滑系数a是指()A、越大越好B、越小越好C、取值范围在-1到1之间D、取值范围在0到1之间4.决策树中不包含一下哪种结点()A、根结点(rootnode)B、内部结点(internalnode)C、外部结点(externalnode)D、叶结点(leafnode)5.()是将现在时点的一定量现金按比率折算为未来某个时点的价值;()是指将未来某个时点一定量的现金按比率折算为现在时点的价值。6.市场调查的基本类型包括()。A、探测性调查B、描述性调查C、预测性调查D、因果性调查7.资金的时间价值是()。A、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额8.层次聚类的聚类方式有()A、凝聚方式聚类B、分解方式聚类C、Q型聚类D、R型聚类9.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()A、直线B、二次抛物线C、三次抛物线D、指数曲线10.理夫斯UP评估模型是一种大抽样评估模式,把样本分为两类,分别为()A、受广告影响者B、未受广告影响者C、受成本影响者D、未受成本影响者11.在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为()A、基于类的排序方案B、基于规则的排序方案C、基于度量的排序方案D、基于规格的排序方案12.先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。13.寻找和揭示隐含在数据中的规律性属于()数据分析。A、推断性B、探索性C、思考性14.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等宽划分(宽度为50)方法将它们划分成四个箱,求15在哪个箱子里?()A、第一个B、第二个C、第三个D、第四个15.以下关于皮尔森相关分析叙述正确的是()A、两变量独立,两者的皮尔森相关系数必然等于0B、两变量皮尔森相关系数不等于0,两者必然不独立C、皮尔森相关系数是否等于零,不能指明两变量是否独立D、两变量不独立,两者的皮尔森相关系数必然不等于016.项目第0年至第8年的净现金流量为:-800万元,-450万元,300万元,400万元,450万元,600万元,600万元,600万元,500万元。该项目静态投资回收期为()年。A、3.11B、3.08C、3.17D、4.1717.用于分类的离散化方法之间的根本的区别在于是否使用类信息。18.已知直线回归方程为y=2-1.5x,则变量x增加一个单位时()。A、y均增加1.5个单位B、y均增加2个单位C、y平均减少1.5个单位D、y均减少2个单位19.按购买行为细分的消费者市场要考虑消费者()等因素。A、消费者生活方式B、对商品的忠诚程度C、进入市场的程度D、对商品的购买数量20.决策树法分析问题的主要步骤包括()。A、结构化问题B、设计可能结果发生的概率C、设计结果的得益D、分析问题21.寻找数据集中的关系是为了寻找精确、方便并且有价值地总结了数据的某一特征的表示,这个过程包括了以下哪些步骤?()A、决定要使用的表示的特征和结构B、决定如何量化和比较不同表示拟合数据的好坏C、选择一个算法过程使评分函数最优D、决定用什么样的数据管理原则以高效地实现算法22.当置信水平一定时,置信区间的宽度()A、随着样本量的增大而减小B、随着样本量的增大而增大C、与样本量的大小无关D、先随着样本量的增大而减小,到一定程度后会随着样本量的增大而增大23.决策树中的InformationGain的计算是用来?()A、剪枝B、使树成长C、处理缺失值和异常值D、砍树24.一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。A、概率B、邻近度C、密度D、聚类25.允许误差应根据错误记录对整个系统可能带来的破坏来确定,通常正是那些低使用率的产品或不常使用的产品为库存误差带来很大麻烦,因此应结合数量方差百分比和绝对值方差来确定误差。26.一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。27.决策树中包含根结点、叶结点、内部结点和外部结点。28.可视化技术对于分析的数据类型通常不是专用性的。29.决策必须至少要有()以上备选方案A、一个B、两个C、三个D、四个30.在基于图的簇评估度量表里面,如果簇度量为proximity(Ci,C),簇权值为mi,那么它的类型是()。A、基于图的凝聚度B、基于原型的凝聚度C、基于原型的分离度D、基于图的凝聚度和分离度31.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?()A、分类B、聚类C、关联分析D、隐马尔可夫链32.下列关于年金说法正确的是()A、普通年金终值是每次支付的复利终值之和B、复利终值系数与复利现值系数互为倒数C、预付年金终值系数的倒数即是预付年金的现值系数D、只要各期的支付金额相同,无论是期初支付还是期末支付,其终值应是一致的33.市场调查收集资料的基本方法有()。A、访问法B、观察法C、实验法D、态度测量表法34.商业智能系统与一般交易系统之间在系统设计上的主要区别在于:后者把结构强加于商务之上,一旦系统设计完毕,其程序和规则不会轻易改变;而前者则是一个学习型系统,能自动适应商务不断变化的要求。35.智能健康手环的应用开发,体现了()的数据采集技术的应用。A、统计报表B、网络爬虫C、API接口D、传感器36.在ID3算法中信息增益是指()A、信息的溢出程度B、信息的增加效益C、熵增加的程度最大D、熵减少的程度最大37.以下哪项关于决策树的说法是错误的()A、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感D、寻找最佳决策树是NP完全问题38.NaiveBayes是属于数据挖掘中的什么方法?()A、聚类B、分类C、时间序列D、关联规则39.交互式定价是通过()来实现的。A、预消费B、谈判C、市场调节D、其他商家40.表示职称为副教授、性别为男的表达式为()A、职称=’副教授’ OR 性别=’男’B、职称=’副教授’ AND 性别=’男’C、BETWEEN ’副教授’ AND ’男’D、IN(’副教授’,’男’)41.扩大指标估算法是按照流动资金占某种基础数据的比率来估算流动资金。一般常用的基础数据有()。A、净现金流量
B、销售收入
C、经营成本
D、总成本费用42.下列关于财务基准收益率的表述,正确的有()A、财务基准收益率越高越好B、财务基准收益率越低越好,但不能低于银行贷款利率C、可以由投资者自行决定财务基准收益率D、可以采用国家有关部门或行业统一发布的财务基准收益率43.逻辑回归只能用于二分类问题,即输出只有两种,分别代表两个类别。44.某家长为了使孩子在第3-6年上大学的4年中,每年年初得到10000元助学基金,他应在2年前在银行存入多少钱?(年利率按5%计算)A、33771
B、30291
C、32163
D、4525645.样本容量是指从总体中抽取的个体。46.计算投资回收期时,根据是否考虑(),可分为静态投资回收期和动态投资回收期。A、资金的时间价值B、净现值C、累计净现金流量D、净收益47.定基发展速度与环比发展速度的关系有()。A、各环比发展速度之和等于相应的定基发展速度B、各环比发展速度之积等于相应的定基发展速度C、两个环比发展速度之商等于相应的定基发展速度D、两个定基发展速度之商等于相应的环比发展速度48.关于主成分数目的选取,正确的是()A、保留多少个主成分取决于累计方差在方差总和中所占百分比B、一般选择50%以上C、选择前两个就可以D、选择的数目和变量的个数一致49.在有关数据仓库测试,下列说法中正确的是()A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D、在测试之前可以不制定详细的测试计划,测试过程中实时调整50.当折现率发生变化,而其它条件不变时,不会受影响的指标是()A、净现值B、动态投资回收期C、内部收益率D、获利指数51.某公司下属两个分厂,一分厂从事家电生产,年销售收入为3000万元,现在二分厂也准备投资一个家电生产项目,预计该项目投产后给二分厂带来的年销售收入为2000万元,但由于与一分厂形成竞争,每年会使一分厂的销售收入减少400万元,那么,从该公司的角度出发,二分厂投资该项目预计的年现金流入为()万元。52.假设{BCE}为一频繁项目集(FrequentItemset),则根据AprioriPrinciple以下何者不是子频繁项目?()A、BCB、CEC、CD、CD53.假设检验中显著性水平是()A、推断时犯取伪错误的概率B、推断时取伪弃真的概率C、正确推断的概率D、是推断的可信度54.假设检验中,拒绝域的边界称为()A、临界值B、临界点C、置信水平D、边际值55.Apriori算法可用于分类预算。56.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是()A、数据越多越好B、尽可能多的适合的数据C、数据越少越好D、以上三条都不正确57.以下哪个类型的变量在作预测客户流失的模型中最有解释力度?()A、人口基本数据,比如年龄和性别B、基本社会状态数据,比如收入和职业C、业务数据,比如消费频次D、业务数据的衍生变量,比如最近3个月消费频次的变化情况58.当净现值>0时()。A、IRRB、IRR>iB、PI159.企业在产品投入期采取慢渗透策略的条件是()。A、消费者对价格很敏感B、产品已广为人知C、竞争者容易进入D、市场规模小但容量大60.下面给出的t检验的结果,()表明接受原假设,显著性水平为0.05。A、0.000B、0.039C、0.092D、0.12461.以下属于数据预处理的是()A、缺失值填充B、噪声数据剔除C、异常值识别D、数据可视化62.()都属于分裂的层次聚类算法。A、二分K均值B、MSTC、ChameleonD、组平均63.在建立线性回归(LinearRegression)之前我们可以利用何种方法挑选重要属性,以降低模型的复杂度?()A、皮尔森相关系数B、卡方检定C、T-检定D、Z-Score64.下列关系中,属于正相关关系的有()A、合理限度内,施肥量和平均单位产量之间的关系B、产品产量与单位产品成本之间的关系C、商品的流通费用与销售利润之间的关系D、流通费用率与商品销售量之间的关系65.设X={1,2,3}是频繁项集,则可由X产生()个关联规则。A、4B、5C、6D、766.聚类分析可以看作是一种非监督的分类。67.根据下面的购物篮,假定支持度阈值为40%,其中()是频繁闭项集。 TID 项 1 abc 2 abcd 3 bce 4 acde 5 deA、abcB、adC、cdD、de68.下列选项中属于现金流入的项目是()A、所得税B、建设投资C、经营成本D、营业收入69.在多元回归分析中,检验方程的拟合优度用调整后的R的平方效果更好。70.对客户的生命周期进行分类主要使用以下哪个方法?()A、聚类分析B、判别分析C、逻辑回归D、线性回归71.关于递延资金,下列说法中不正确的是()A、递延年金终值计算方法与普通年金终值计算方法相同B、递延年金无终值,只有现值C、递延年金终值大小与递延期无关D、递延年金的第一次支付是发生在若干期以后72.投资项目的数据分析具有以下特征()。A、项目的数据分析是以定量分析为主。B、项目的数据分析涉及经济学、数学、统计学和预测学,是一门边缘科学。C、项目的数据分析必须通过建立数学模型的方法进行分析。D、项目的数据分析是以定性分析为主要分析目的。73.某小区60%居民订晚报,45%订青年报,30%两报均订,随机抽一户。则至少订一种报的概率为()A、0.82B、0.85C、0.80D、0.7574.如果两个变量不独立,那这两者的相关系数必然不等于0。75.Apriori算法用下列哪个做项目集(Itemset)的筛选?()A、最小信赖度(Minimum Confidence)B、最小支持度(Minimum Support)C、交易编号(TransactionID)D、购买数量76.趋势模型的选择方法主要有()。A、定性分析法B、图形识别法C、差分法D、拟合优度比较法77.如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。78.数据挖掘技术包括三个主要的部分()A、数据、模型、技术B、算法、技术、领域知识C、数据、建模能力、算法与技术D、建模能力、算法与技术、领域知识79.在有关数据仓库测试,下列说法不正确的是()A、在完成数据仓库的实施过程中,需要对数据仓库进行各种测试.测试工作中要包括单元测试和系统测试B、当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D、在测试之前没必要制定详细的测试计划80.对计算期不同的项目进行比较,可以应用的方法有()A、增量收益分析法B、约定年数法C、最小公倍数法D、排列顺序法81.以下哪种方法不属于特征选择的标准方法:()A、嵌入B、过滤C、包装D、抽样82.时间序列分解法可以有乘法模型和加法模型两种表示方式,其中乘法模型都是相对值来表示预测值的,加法模型都是用绝对值来表示预测值的。83.以下两种描述分别对应哪两种对分类算法的评价标准?() a.警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准 b.描述有多少比例的杀人犯给警察抓了的标准A、Precision,RecallB、Recall,PrecisionC、Precision,ROCD、Recall,ROC84.对于数据挖掘中的原始数据,存在的问题有()A、不一致B、重复C、不完整D、含噪声E、维度高85.KANO模型定义的顾客需求层次有()A、兴奋型需求B、喜爱型需求C、基本型需求D、期望型需求86.分类模型的误差大致分为两种:训练误差(trainingerror)和泛化误差(generalizationerror)。87.下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。A、JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇B、JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇C、JP聚类是基于SNN相似度的概念D、JP聚类的基本时间复杂度为O(m)88.数据挖掘的目标不在于数据采集策略,而在于对于已经存在的数据进行模式的发掘。89.计算Ic=9,n=5时的100元年金的现值是多少()A、323.97B、388.97C、448.59D、598.4790.相关系数越接近±1,表明变量之间的线性相关程度()。A、越低B、一般C、越高D、不一定91.召回率反映的是预测为正中的样本中正例的概率。92.下列费用不是现金流出()A、原材料B、折旧C、工资D、管理费用93.计算Ic=7%,n=5时的一元年金终值系数。()A、5.75B、4.10C、4.44D、5.9894.投资决策中分析的市场预测一般应预测()。A、l-2年B、2-3年C、3-5年D、5-10年95.用Excel可创建的图表有()A、二维图表B、三维图表C、饼图D、雷达图96.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?()A、根据内容检索B、建模描述C、预测建模D、寻找模式和规则97.OLAP技术的核心是()A、在线性B、对用户的快速响应C、互操作性D、多维分析98.某公司投资一个新产品生产线项目,4年分次投入,每年年初投入780万元,预计第四年末建成投产。如贷款年利率为13%,4年后投产时的资产价值为()万元。A、2621.7B、3782.84C、1808.65D、4274.6199.概率为0的事件是不可能事件,概率为1的事件是必然事件。100.Apriori算法的计算复杂度受()影响。A、支持度阀值B、项数(维度)C、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度互联网企业债权转让与投资合作框架协议范本3篇
- 2024年度展览展示设备采购与安装合同2篇
- 2024年影视节目配音与字幕翻译服务合同2篇
- 2024版专利转让合同with专利信息、转让价格与转让方式3篇
- 2024年度动迁房买卖合同纠纷调解与仲裁条款3篇
- 2024年房地产项目销售代理与房地产投资顾问机构合作合同3篇
- 2024年度招生考试监考人员协议3篇
- 2024年版工地停工停建赔偿合同(甲方责任2024版)
- 2024年度企业人力资源总监全面合作协议3篇
- 2024年借款居间协议2篇
- 鱼骨图-PPT模板
- 肢体残疾课件(陈瑞光)
- 中国平安保险公司薪酬体系
- 机械制图基础知识
- 静脉治疗小组工作计划_
- 施工现场临时用电验收记录(新)2页
- 入团志愿书(2016版本)(可编辑打印标准A4)
- (完整word版)北师大版四年级数学上册运算律练习
- 浅谈测绘技术的应用及质量控制
- 电气设备安装及调试重要性分析
- 2019年12月六级第一套(含答案)
评论
0/150
提交评论