CPDA考试真题与答案完美_第1页
CPDA考试真题与答案完美_第2页
CPDA考试真题与答案完美_第3页
CPDA考试真题与答案完美_第4页
CPDA考试真题与答案完美_第5页
免费预览已结束,剩余8页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一"、 单选题1 . “大数据”是指规模超过1000TB的数据集。正确答案:X2 .概率为0的事件是不可能事件,概率为1的事件是必然事件。正确答案:X3 .将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽 样。正确答案:,4 .统计图中的散点图主要用来观察变量之间的相关关系。正确答案:,5 .抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。正确答案:X6 . Datahoop1.2版中K-means聚类分析要求输入的数据必须是数值型数据。正确答案:,7 .如果事件A,B互斥,且 P(A)>0,P(B)>0,则A, B独立。正确答案:X8

2、 .SQL中删除表的命令是“ DELETE TABLE。正确答案:X9 .聚类分析中,各变量的取值在数量级上不能有过大的差异。正确答案:,10 .如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。11 .需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。正确答案:X12 .使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索弓I。正确答案:V13 .线性回归模型的拟合优度可采用可决系数进行评判。可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。正确答案:x14 . 一个时间序列中包含长期趋势、季节变动、循环变动和

3、不规则变动,一般将四个因素 一分解之后进行分析。正确答案:X15 .决策树中包含根结点、叶结点、内部结点和外部结点。正确答案:X二、单选题1 .检查异常值常用的统计图形是()A、柱状图以箱线图C帕累托图D气泡图正确答案:B2 .什么是KDD ()A数据挖掘与知识发现以领域知识发现C文档知识发现D动态知识发现正确答案:A3 .东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡 听了撒Y子就跑。猪说:"你跑什么?"鸡叫道:"有本事主人买粉条的时候你小子别跑!"以上对话体现了数据分析方法中的()

4、A关联以聚类C分类D自然语言处理正确答案:A4 .假设检验中显著性水平 口是()A、推断时犯取伪错误的概率日推断时取伪弃真的概率C正确推断的概率D是推断的可信度正确答案:B5 .矩估计的基本原理是()A用样本矩估计总体矩日使得似然函数达到最大C使得似然函数达到最小D小概率事件在一次试验中是不可能发生的正确答案:A6 . SQL查询语句中 HAVING子句的作用是()A指出分组查询的范围日指出分组查询的值C指出分组查询的条件D指出分组查询的内容正确答案:C7 .以下哪项关于决策树的说法是错误的()A、冗余属性不会对决策树的准确率造成不利的影响日子树可能在决策树中重复多次C决策树算法对于噪声的干扰

5、非常敏感D寻找最佳决策树是NP完全问题正确答案:C8 .以下哪种方法不属于于监督学习模型()A、决策树日线性回归C关联分析D判别分析正确答案:C9 考虑下面的频繁 3-项集的集合:1, 2, 3, 1, 2, 4, 1, 3, 4, 1, 3, 5, 2, 3, 4, 2, 3, 5, 3, 4, 5假定数据集中只有 5个项,若采用合并策略,则由候选产生过程得到4-项集不包含()A、1, 2, 3, 4以 1, 2, 3, 5C 1, 2, 4, 5D 1, 3, 4, 5正确答案:C10 .下列不属于原始数据来源的是()A行政记录以统计调查C统计年鉴D实验正确答案:C11 .下列不属于分类算

6、法的是()A C4.5算法 以逻辑回归 C KNIW法 D TF-TDF 算法正确答案:D12 .相关分析与回归分析的一个重要区别是()A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示 日前者研究变量之间的变动关系,后者研究变量间关系的密切程度C两者都研究变量间的变动关系D两者都不研究变量间的变动关系正确答案:A13 .数据仓库是随着时间变化的,下面的描述不正确的是()A、数据仓库随时间的变化不断增加新的数据内容以捕捉到的新数据会覆盖原来的快照C数据仓库随时间变化不断删去旧的数据内容D数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合正确答

7、案:C14 .资金的时间价值是()A、同一资金在同一时点上价值量的差额 以同一资金在不同时点上价值量的差额 C不同资金在同一时点上价值量的差额 DK不同资金在不同时点上价值量的差额15 .描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是()A、极差 以标准差 C均值 D变异系数正确答案:B16 .下列有关Apriori算法的说法中不正确的是()A Apriori算法是关联分析中最常用的算法之一。以应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值。C应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据。D Apriori算法扫描数据库的次数依

8、赖于最大频繁项集中项的数量。正确答案:C17 .当置信水平一定时,置信区间的宽度()A、随着样本量的增大而减小 以随着样本量的增大而增大 C与样本量的大小无关D先随着样本量的增大而减小,到一定程度后会随着样本量的增大而增大。正确答案:A18 . 一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为()A需求价格弹性 以供给价格弹性 C需求交叉弹性 D供给交叉弹性正确答案:C19 .分类器效果检验中的准确率是指()A、预测正确的数据在总数据中的比例 以 预测为正的数据在总数据中的比例C预测为正的数据中实际为正的数据所占比例D实际为正的数据中被预测为正的数据所占比例正确答案:C20 .给

9、出下列结论:(1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好;(2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好;(3)在回归分析中,可用相关系数r的值判断模型的拟合效果,r越小,模型的拟合效果越好;(4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状 区域中,说明这样的模型比较合适.带状区域的宽度越宽,说明模型的拟合精度越高.以上结论中,正确的有()个.A、1日2C 3D 4正确答案:A21 .维度规约是在以下哪个步骤的任务?()A频繁模式挖掘日降维C数据预处理D数据流挖掘正确答案:C2

10、2 .假设属性income的最大最小值分别是 12000元和98000元。利用最大-最小规范化的方 法将属性的值映射到 0至1的范围内。对属性income的73600元将被转化为()A 0.751以 0.163C 0.457D 0.716正确答案:D23.假定用于分析的数据包含属性 age。数据元组中age的值如下(按递增序):13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 30, 33, 33, 35, 35, 36, 40, 45, 46, 52, 70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为 3。第二个箱 子值为

11、()A 15.7以 18.3C 19.7D以上都不对正确答案:B24 . EXCEL中,求标准差的函数是()A AVERAGEB MEDIANC MODE D STDEV正确答案:D25 .人们购买制冷用空调主要是为了在夏天获得凉爽空气,这属于空调产品整体概念中的A、Ek G)有形产品 直接产品 核心产品 主要产品 正确答案:C26 .贝叶斯决策是根据()进行决策的一种方法。A极大似然概率 日先验概率 C边际概率 D后验概率正确答案:D27 .某人欲为子女筹措 250000元的留学经费,预计在8年内的每年年初在银行存入一笔款项,如银行存款年利率为8%,每年应存入金额为()A 23502.87

12、以 23505.20 C 12698.6 D 21762.67正确答案:D28 .指数平滑法可以用以下哪种指标来反映对时间序列资料的修正程度()A平滑常数日指数平滑数初始值C跨越期D季节指数正确答案:A29 .某牙膏厂原来生产两面针药物牙膏,现在又增加牙刷生产,这属于()A同心多元化 日水平多元化 C集团多元化 D相关多元化正确答案:B30 .净现值、内部收益率、获利指数指标之间的数量关系是()A 当 NPV>0时,IRR>i , PI<1 以 当 NPV>0时,IRR>i , PI>1 C 当 NPV<0时,IRR>i , PI<1D 当

13、 NPV<0时,IRR>i , PI>1正确答案:B1.多选题以下关于皮尔森相关分析叙述正确的是(A、两变量独立,两者的皮尔森相关系数必然等于0以两变量皮尔森相关系数不等于0,两者必然不独立C皮尔森相关系数是否等于零,不能指明两变量是否独立D两变量不独立,两者的皮尔森相关系数必然不等于0正确答案:AB2 .在实际数据中,元组在某些属性上缺少值是常有的。描述处理该问题的各种方法有:( )A直接删除以 使用属性的平均值填充空缺值C使用一个全局常量填充空缺值D使用与给定元组属同一类的所有样本的平均值正确答案:ABCD3 .描述变量离期望值大小的指标是()A方差日变异系数C标准差D期

14、望正确答案:ABC4 .以下属于分类器评价或比较尺度的有()A、预测准确度日召回率C模型描述的简洁度D F1-Score正确答案:ABD5 .以下关于逻辑回归的说法正确的是()A、应用逻辑回归时,异常值会对模型造成很大的干扰。日 逻辑回归的自变量必须是分类变量,因此要对连续型变量进行离散化处理。C逻辑回归对模型中自变量的多重共线性较为敏感。D逻辑回归属于分类算法。6 .下列项目中,其变动可以改变盈亏平衡点位置的因素有(A、单价以单位变动成本C销量D固定成本正确答案:ABCD7 .关于基准收益率的表述,正确的是()A基准收益率越高越好以基准收益率越低越好,但不能低于银行贷款利率C可以采用项目加权

15、平均资金成本为基础确定基准收益率D可以采用国家有关部门或行业统一发布的行业基准收益率正确答案:CD8 .数据离散化是指为了数据分析的需要,将连续数据转换为离散型数据的过程。数据离散化的方法有()A随机取值以等距离散法C数值规约D等频离散法正确答案:BD9 .根据分析内容和侧重面不同,风险分析的方法有()A敏感性分析以概率分析C经济效益分析D盈亏平衡分析正确答案:ABD10 .以下说法正确的有()A、评价预测精度是通过测量与分析预测误差进行的以 绝对误差是实际观测值与预测值的离差C相对误差反映实际观测值与预测值之间差异的相对程度D平均误差反映实际观测值与预测值之间的平均差异正确答案:ABCD11

16、 .下列公式正确的是()A、流动资金=流动资产-流动负债日流动资产=应收账款+存货C流动负债=应付账款+预收账款D流动资金本年增加额=本年流动资金-上年流动资金12 .如下哪些不是基于规则的分类器的特点()A、规则集的表达能力远不如决策树好以基于规则的分类器都对属性空间进行直线划分,并将类指派到每个划分C无法被用来产生更易于解释的描述性模型D非常适合处理类分布不平衡的数据集正确答案:AC13 .以下有关随机森林算法的说法正确的是()A、随机森林算法的分类精度不会随着决策树数量的增加而提高。以随机森林算法对异常值和缺失值不敏感。C随机森林算法不需要考虑过拟合问题。D决策树之间相关系数越低、每棵决策树分类精度越高的随机森林模型的分类效果越好。正确答案:ABD14 .以下算法中对缺失值敏感的有()A Logistic 回归B SVIW法C CART决策树D朴素贝叶斯正确答案:AB15 .层次聚类的聚类方式有()A、凝聚方式聚类以分解方式聚类C Q型聚类D R型聚类正确答案:AB16 .方差分析的基本假设前提包括()A、各处理条件下的样本均来自正态总体以各处理条件下的样本相互独立C各处理条件下样本的方差都相等D各处理条件下样本均值相等,方差可以不等正确答案:ABC17 .按照性质,预测方法大致可分为()。A、定性预测日情景预测C时间序列预测D回归预测18 .下列关于统计量的表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论