2024年数据分析师LevelⅡ考试题库（含答案）

上传人：简*** IP属地：河北上传时间：2024-05-28 格式：PDF 页数：73 大小：18.07MB 积分：12 举报 版权申诉

已阅读5页，还剩68页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2024年数据分析师LevelII考试题库

(含答案)

一、单选题

1.将原始数据进行整合、变换、特征降维、缺失值处理是在以下哪个

步骤的任务

A、数据预处理

B、数据挖掘

C、分类和预测

D、模式发掘

参考答案：A

2.问卷测量通常可以从态度测量、能力测量等角度测试用户评分，一

般来说态度测量经常使用的量表是哪一类？

A、哥特曼(guttman)量表

B、李克特5点测量量表

C、李克特3点测量量表

D、李克特9点测量量表

参考答案：B

3.假设我们使用Logistic.回归模型分析n类分类问题，在这种情况

下，我们可以使用留一法(One-vs-rentmothoD.)。关于这个问题，下面

哪个选项是正确的

A、我们需要在n类分类问题中拟合n+1个模型

B、我们需要在n类分类问题中拟合1个模型

C、我们需要在n类分类问题中拟合n个模型

D、我们需要在n类分类问题中拟合nT个模型

参考答案：D

4.针对该公式y(t)=3xy(t-1)+2xy(t-3)是()阶的时间序列

A、1

B、3

C、2

D、4

参考答案：B

5.在逻辑回归输出与目标对比的情况下，以下评估指标中哪一项不适

用？

A、均方误差

B、AUC-ROC

C、Logloss

D、准确度

参考答案：A

6.能够用于总体估计的是

A、自愿抽样

B、滚雪球抽样

C、方便抽样

D、系统抽样

参考答案：D

7.某分析师希望通过聚类算法进行欺诈分析,发现结果不是很理想。

下列方法中哪项不能为聚类效果带来提升？

A、对变量进行主成分分析

B、对变量进行变量聚类

C、对变量进行分箱处理

D、对变量进行标准化

参考答案：C

8.在因子分析中，为了帮助解释因子,可以使用()

A、因子负载

B、因子得分

C、因子旋转

D、主成分分析

参考答案：C

9.以下哪种方法可以用于仓析面板数据

A、自回归法(A.R)

B、移动平均值法(MA.)

C、随机效应法(RM)

D、差分法

参考答案：C

10.多元线性回归中，检验异方差的方法是？

A、如果回归拟合值与自变量相关则存在异方差

B、如果回归残差与因变量相关则存在异方差

C、如果回归因变量与自变量相关则存在异方差

D、如果回归残差与自变量相关则存在异方差

参考答案：B

11.从两个总体中独立选取两个样本,两个总体的方差未知，但是样本

为大样本,则两个总体的平均值之差的估计需要用到

A、正态分布

B、卡方分布

C、F分布

D、t分布

参考答案：C

12.单因素方差分析中，计算F统计量,其分子与分母的自由度各为

A、r-n,n-r

B、n-r,r-l

C、r,n

D、r-l,n-r

参考答案：D

13.研究性别与是否失眠的相关性,可以用

A、偏度

B、卡方检验

C、F检验

D、T检验

参考答案：B

14.下面关于回归分析,说法错误的是？

A、按照自变量和因变量的函数关系来分类,可以分为线性回归分析和

非线性回归分析

B、非线性回归问题可以转化为线性回归

C、线性回归对异常值不敏感

D、按照自变量和因变量的个数来分类,可分为一元回归分析和多元回

归分析

参考答案：C

15.主成分分析法的主要作用是

A、剔除异常值

B、控制变量

C、正则化

D、降维

参考答案：D

16.在推导线性回归参数时，我们会做出以下哪些假设？（1）因变量y

和预测变量x之间的真实关系是线性的；（2）模型的误差在统计意义

上是独立的；⑶误差通常分布是均值为0,且标准差为常数；（4）预测

变量x是非随机的,而且不存在测量误差

A、1,2,3,4

B、1,2,3

C、1,3,4

D、1,2

参考答案：A

17.以下哪种情境更适合使用线性回归？

A、考察广告费对产品销售量的影响

B、考察目标客户的行为规则,做出用户画像

C、考察五个城市居民的有效收入的差异是否显著

D、考察哪些客户最终是否购买产品

参考答案：A

18.以下哪个不是分群标签的用途？

A、服务于产品和服务匹配策略

B、定位客户的需求

C、建立对客户的洞察

D、解决工作的效率问题

参考答案：D

19.主成分分析的前提条件是各变量之间应该满足

A、低度相关

B、相互独立

C、完全相关

D、高度相关

参考答案：A

20.某电商的年销售量呈现Xt=0.72Xt-l+0.81Xt-2+et,则xt为()

A、ARIMA(n,m)

B、AR(n)

C、MA(m)

D、ARMA(n,m)

参考答案：B

21.用户分层是在用户管理时最常被使用的标签类型，其中RFM模型

是指()

A、投入、效率、产出

B、成交率、客流、客单价

C、首次购买时间、消费频率、消费金额

D、最近购买时间、消费频次、消费金额

参考答案：D

22.在方差分析中，多重比较的目的是通过配对比较来进一步检验

A、哪两个样本均值之间有差异

B、哪两个样本方差之间有差异

C、哪两个总体方差之间有差异

D、哪两个总体均值之间有差异

参考答案：D

23.以下哪个不属于根据麦肯锡问题分析方法中的分类：

A、问题解决型问题

B、追求理想型问题

C、恢复原状型问题

D、防范潜在型问题

参考答案：A

24.时间序列MA(q)模型,其中q指的是()

A、时间序列的偏自相关系数是q阶截尾的

B、时间序列的自相关系数是q阶拖尾的

C、时间序列的偏自相关系数是q阶拖尾的

D、时间序列的自相关系数是q阶截尾的

参考答案：D

25.为了估计北京市使用华为品牌手机的市场占有率，在收集数据时,

最有可能采用的数据搜集方法是？

A、方便抽样

B、配额抽样

C、实验

D、随机抽样

参考答案：D

26.以下哪个不属于根据麦肯锡问题分析方法中的分类：

A、恢复原状型问题

B、防范潜在型问题

C、问题解决型问题

D、追求理想型问题

参考答案：C

27.回归模型犹如一列火车，引擎牵引的列车节箱数受速度、动力等因

素所限,并不能无限增加,否则这列火车会存在安全隐患，回归也存在

这类由维度(列车节箱)所引起的安全问题，因此，在数据挖掘的场景

中，认为自变量的维度最好不要超出15个，那么控制自变量个数的方

法主要是哪种？

A、因子分析

B、卡方分析

C、方差分析

D、相关分析

参考答案：A

28.关于K-MeA.ns算法,正确的描述是？

A、不能使用核函数

B、能找到任意形状的聚类

C、初始值不同，最终结果可能不同

D、每次迭代的时间复杂度是0(n2),其中n是样本数量

参考答案：C

29.一个一元线性回归模型的判定系数R2=0.8,那么下列解释中错误

的是()

A、在训练集中，因变量的估计精度上限为80%

B、自变量与因变量之间有着较强的线性关系

C、在因变量的变动中有80%是由自变量所决定的

D、因变量的变差中有80%的概率可以由自变量与因变量之间的线性

关系来解释

参考答案：A

30.多元线性回归中F检验的原假设是

A、所有回归系数都等于预估值

B、所有回归系数都不等于预估值

C、所有回归系数都不等于0

D、所有回归系数都等于0

参考答案：D

31.以下哪种方法可以用于分析面板数据

A、自回归法(AR)

B、差分法

C、随机效应法(RM)

D、移动平均值法(MA)

参考答案：C

32.以下关于一元线性回归分析y=bo+bix+s描述错误的是？

A、一元线性回归中F检验的检验统计量与t检验是一致的

B、若用于预测的x数值与样本中的自变量偏差很大,那么预测得到y

的可靠性也会降低

C、即便建立了一元线性回归,也不能直接认为x是y的原因

D、一元线性回归中F检验的作用与t检验是一致的

参考答案：A

33.假设我们使用Logistic回归模型分析类分类问题。在这种情况下,

我们可以使用留一法(One-vs-restmethod).关于这个问题，下面哪个

选项是正确的

A、我们需要在n类分类问题中拟合1个模型

B、我们需要在n类分类问题中拟合nT个模型

C、我们需要在n类分类问题中拟合n+1个模型

D、我们需要在n类分类问题中拟合n个模型

参考答案：B

34.对于一元线性回归，回归系数显著性检验需要用到

A、Z检验

B、t检验

C、卡方检验

D、F检验

参考答案：B

35.有一款产品的重量标准为10克,现在分别用A和B两个厂家来生

产这一产品，分别各随机抽取50个样品,A厂生产的样本重量的标准

差为

0.01,B厂生产的样本重量的标准差为

0.1,现在需要比较两家广商在产品重量指标是否有显著差异，我们应

该选择

A、单侧t检验

B、双侧t检验

C、单侧F检验

D、双侧F检验

参考答案：B

36.应用回归分析应注意的问题,下面说法错误的是？

A、回归分析的自变量选取要符合业务需要,选择合适的数据资料

B、回归分析的自变量必须是连续型数据

C、应用回归分析时，要注意时间窗口的一致性

D、因为回归分析是研究自变量与因变量的因果关系,所以要注意孰因

孰果

参考答案：B

37.在进行多元线性回归分析时,对于变量较多的情况下,可以选择变

量筛选方法,下列不正确的是

A、交叉验证法

B、向后剔除法

C、向前选择法

D、逐步法

参考答案：A

38.回归分析中定义的

A、解释变量和被解释变量都为非随机变量

B、解释变量为非随机变量,被解释变量为随机变量

C、解释变量和被解释变量都是随机变量

D、解释变量为随机变量,被解释变量为非随机变量

参考答案：B

39.若线性规划问题没有可行解,可行解集是空集,则此问题()

A、没有无界解

B、没有无穷多最优解

C、有无界解

D、没有最优解

参考答案：D

40.主成分分析的前提条件是各变量之间应该满足

A、低度相关

B、完全相关

C、相互独立

D、高度相关

参考答案：A

41.在时间序列分析中，指数平滑法的平滑系数

A.的取值

A、越小越好

B、取值范围在T到1之间

C、取值范围在0到1之间

D、越大越好

参考答案：C

42.以下关于系统聚类的描述中，错误的是()

A、系统聚类也叫层次聚类

B、系统聚类适用于数据量非常大或者变量非常多的项目

C、系统聚类法通常分为自底向上和自顶向下

D、系统聚类的过程非常清楚,会形成类似树状的聚类图谱,便于理解

和检查

参考答案：B

43.下列关于主成分分析的表述不正确的有()

A、所确定的几个主成分之间是高度相关的

B、所确定的几个主成分之间是互不相关的

C、使用主成分分析方法的前提是原来的多个指标之间是相关的

D、主成分分析的目的是寻找少数几个主成分代表原来的多个指标

参考答案：A

44.在系统聚类中，我们需要定义两个类之间的距离，下列哪种方法能

够缓解异常值对计算距离造成的影响？

A、离差平方和法

B、最短距离法

C、最长距离法

D、以上都不是

参考答案：A

45.多元线性回归中，检验异方差的方法是？

A、如果回归拟合值与自变量相关则存在异方差

B、如果回归残差与因变量相关则存在异方差

C、如果回归残差与自变量相关则存在异方差

D、如果回归因变量与自变量相关则存在异方差

参考答案：C

46.多元线性回归中检验的原假设是

A、对应单个回归系数等于0

B、对应单个回归系数不等于0

C、对应单个回归系数等于预估值

D、对应单个回归系数不等于预估值

参考答案：A

47.如果时间序列的各期增长量相等，

A、各期环比增长速度有升有降

B、环比增长速度逐期上升

C、各期的环比增长速度保持不变

D、环比增长速度逐期下降

参考答案：D

48.某电商的年销售量呈现Xt=O.72Xt-l+0.81Xt-et,则xt为()

A、RIMA(n,m)

B、MA(m)

C、ARMA(n,m)

D、AR(n)

参考答案：D

49.方差分析的主要目的是判断()

A、各样本数据之间是否有显著差异

B、分类型因变量对数值型自变量的影响是否显著

C、分类型自变量对数值型因变量的影响是否显著

D、各总体是否存在方差

参考答案：C

50.下面关于选择何种机器学习建损思路,说法错误的是？

A、当需要获得特征与目标间的关系时，需建立有监督模型

B、当需要获得特征与特征间的关系时，需建立无监督模型

C、在反欺诈领域，当没有反欺诈人群时,可用有监督模型来识别用户

D、在反欺诈领域，当已知有欺诈观测时，可用有监督模型来识别用户

参考答案：C

51.针对字段〃用户姓名”，下列方法最适宜的是()

A、需要编码为分类变量

B、需要编码为数值变量

C、需要编码为二分变量

D、需要编码为字符变量

参考答案：D

52.研究职业与收入的相关性可以使用

A、F检验

B、方差分析

C、t检验

D、皮尔逊相关系数

参考答案：C

53.市场调查主要用于解决的问题是以下哪一类？

A、关联问题

B、归因问题

C、预测问题

D、细分问题

参考答案：D

54.绩效考核问题中，不合理项的选择是多选项,如果并不强调择的个

数，而强调选择的题项，则使用的多选题编码方式为?如下图：项所示：

A、与项的设置相同

B、多重响应的多分法

C、多重响应的二分法

D、与开放题项的设置相同

参考答案：B

55.下面关于关系型数据库描述错误的是？

A、RDBMS指的是关系型数据库管理系统,RDBMS中的数据存储在被称

为表(tables)的数据库对象中

B、所有数据库系统均要求在每条SQL命令的末端使用分号,否则会运

行报错

C、SQL语言对大小写不敏感

D、SQL是指结构化查询语句,是一种ANS的标准计算机语言

参考答案：B

56.以下哪个不属于标签加工方式区分的分类？

A、行为标签

B、统计标签

C、模型标签

D、基础标签

参考答案：A

57.建立模型,拆分数据集为训练集和测试集的一般比例为？

A、5:5

B、7:3

C、9:1

D、6:4

参考答案：B

58.关于逻辑回归分析说法正确的是

A、逻辑回归中的因变量和自变量均为分类变量

B、逻辑回归中因变量为分类变量

C、逻辑回归中自变量为分类变量

D、逻辑回归中，因变量和自变量均为连续型变量

参考答案：B

59.下列哪项不是主成分分析的推荐应用？

A、作为线性回归的替代算法:对于大多数学习应用，主成分分析和线

性回归给出了基本相似的结果

B、数据压缩:减少输入数据的维数,并用于监督学习算法,能够使监督

学习算法运行得更快

C、数据可视化,减少输入数据的维数,能够将数据在2D平面中进行绘

制

D、数据压缩:减少输入数据的维数,使得数据占用更少的内存/磁盘空

间

参考答案：A

60.关于用户画像的说法错误的是()

A、用户标签必须描述客观的事实

B、用户画像本质上是应用用户标签做客群定位

C、用户画像的标签分为定量标签和定性标签

D、用户画像的应用场景有:产品设计,营销推荐,风险控制等

参考答案：A

61.总体方差未知情形下,进行两个总体均值差的假设检验,首先会判

别

A、总体均值是否相等

B、样本均值是否相等

C、总体方差是否相等

D、样本方差是否相等

参考答案：C

62.在方差分析中，多重比较的目的是通过配对比较来进一步检验()

A、哪两个样本方差之间有差异

B、哪两个样本均值之间有差异

C、哪两个总体方差之间有差异

D、哪两个总体均值之间有差异

参考答案：D

63.多元线性回归y=b0+blxl+b2x2...+bnxn+8进行线性关系检验时,

原假设是？

A、bo=bl=bn=0

B、bl=...=bn-0

C、bl..,bn中存在任意一个不为0

D、bO,bl..bn中存在任意一个不为0

参考答案：B

64.若你获得数据分析需求，需要分析同一客群,产品改造对客户是否

满意是否有显著差异，你可以使用什么方法？

A、单样本T检验

B、独立样本T检验

C、配对样本T检验

D、卡方检验

参考答案：C

65.下列对K-means聚类算法解释正确的是()

A、不能自动识别类的个数，随机挑选初始点为中心点计算

B、能自动识别类的个数,不是随机挑选初始点为中心点计算

C、不能自动识别类的个数,不是随机挑选初始点为中心点计算

D、能自动识别类的个数,随机挑选初始点为中心点计算

参考答案：A

66.针对5WHY,以下表述不正确的是

A、只是单纯地把Why重复5次以上是行不通的

B、随着问为什么的推进，内容必须变得更加具体、详细

C、要避免一切抽象、模糊的表达方式

D、5W就是要思考5个为什么

参考答案：D

67.在一次年级考试中随机抽取100名学生，并将数学成绩分成五

段:50-69,70-89,90To9,110T29130T50它的频率分布直方图如下，

则该批学生中成绩不低于90的人数是？

A、70

B、65

C、80

D、90

参考答案：B

68.对A.,B.两个总体方差比进行区间估计,在95%置信水平下,得到

的置信区间是(0.6,0.9),以下叙述正确的是()

A、如果希望降低估计误差，可以增加样本量

B、总体方差比应该等于0.65

C、(0.6,0.9)覆盖了总体方差比

D、提高置信水平，可以使得区间变小

参考答案：A

69.在系统聚类中R2是指()

A、组内离差平方和除以组间离差平方和

B、组间均方除以总均方

C、组间离差平方和除以总离差平方和

D、组间离差平方和除以组内离差平方和

参考答案：C

70.标准化残差图主要用于直观地判断

A、回归模型的线性关系是否显著

B、误差项等方差的假定是否成立

C、误差项服从正态分布的假定是否成立

D、回归系数是否显著

参考答案：C

71.变量之间的关系可以分为两大类

A、函数关系与相关关系

B、简单相关关系和复杂相关关系

C、线性相关关系和非线性相关关系

D、正相关关系和负相关关系

参考答案：A

72.关于K-means聚类算法的特点，下列说法错误的是()

A、K-means对于噪声比较敏感

B、当处理较大数据集时，无法保持可伸缩性和高效率

C、不能对变量进行聚类

D、当簇近似为正态分布时，效果较好

参考答案：C

73.在管理类鱼骨图中，“人”的因素一般放在哪个层次上?

A、大要因

B、中要因

C、孙要因

D、小要因

参考答案：A

74.用于描述数据的数据或关于数据的结构化数据的是？

A、主数据

B、元数据

C、数据元

D、交易数据

参考答案：B

75.当一元线性回归模型的残差出现异方差时,可以尝试哪项工作0

A、自变量做归一化处理

B、对自变量做非线性变换

C、对因变量做线性变换

D、对自变量做线性变换

参考答案：B

76.某学校组织投篮比赛,在预赛中每个同学需要投篮100次,成绩前

50%的将进入决赛，现在小明一共投中了48次,他希望评估自己是否

有希望参加决赛，因此将他的成绩与全校成绩的0进行比较是最合理

的。

A、平均数

B、中位数

C、众数

D、四分位差

参考答案：B

77.正态曲线下,从均数到+0。的面积为

A、0.95

B、0.35

C、不确定，和标准差有关

D、0.5

参考答案：D

78.如果我们拿到一份数据，直接对这组数据建模型肯定会造成一系

列的问题，因此是需要进行预分析,而关于预分析描述错误的是？

A、数据维度本身比较多，容易产生高维灾难问题，因此需要进行降维

B、数据可能会受到各种干扰，因此会产生各种误差，需要进行数据清

理

C、统计模型有很多假设，这些假设需要满足，因此需要做统计上的准

备工作

D、统计模型有固定的数据清理流程，不建议改变

参考答案：D

79.下面关于主成分分析,说法错误的是？

A、将大量相关变量转化成一组很少的不相关变量,这些无关变量称为

主成分

B、主成分分析是一种数据降维技术,能够过滤掉不相关变量

C、主成分是变量的线性组合

D、使用P

C.A.可将30个相关的变量转化为5个无关的变量,并且尽可能地保

留原始数据集的信息

参考答案：B

80.当我们对一份数据进行建模分析时，如果出现数据集变量数较多，

而对应的样本数相对较少的情况，下列哪种处理方法不能提升被型的

适用性：

A、主成分分析

B、样本聚类

C、增加样本量

D、变量聚类

参考答案：B

81.在二元线性回归模型Yi=B.0+B.IXu+B.2X2i+ui中，B.1表示

A、当xl不变时,x2每变动一个单位Y的平均变动

B、当xl和x2都保持不变时,Y的平均变动

C、当x2不变时,xl每变动一个单位Y的平均变动

D、当xl和x2都变动一个单位时,Y的平均变动

参考答案：C

82.时间序列M

A.(q)模型，其中q指的是()

A、时间序列的偏自相关系数是q阶拖尾的

B、时间序列的自相关系数是q阶截尾的

C、时间序列的偏自相关系数是q阶截尾的

D、时间序列的自相关系数是q阶拖尾的

参考答案：B

83.以下关于一元线性回归分析y=B.o+B.ix+描述错误的是？

A、一元线性回归中F检验的作用与t检验是一致的

B、一元线性回归中F检验的检验统计量与t检验是一致的

C、若用于预测的x数值与样本中的自变量偏差很大,那么预测得到y

的可靠性也会降低

D、即便建立了一元线性回归,也不能直接认为x是y的原因

参考答案：B

84.若想要对一个电商企业的产品销售状况和销售趋势进行数据可视

化,最佳的图表表示方式为()

A、直方图

B、条形图和趋势线组合图

C、饼图

D、气泡图

参考答案：B

85.如果x和Y在统计上独立,则相关系数等于

A、0

B、00

C、-1

D、1

参考答案：A

86.以下哪个不是分群标签的用途？

A、定位客户的需求

B、解决工作的效率问题

C、建立对客户的洞察

D、服务于产品和服务匹配策略

参考答案：B

87.K-MeA.ns聚类法要求自变量之间不存在共线性的原因是()

A、变量存在多重共线性时无法解释聚类结果

B、变量存在多重共线性时无法得到聚类结果

C、变量存在多重共线性时,得到的聚类结果是完全错误的

D、变量存在多重共线性时,相关变量会在距高计算中占据高的权重,

从而对聚类结果有负面的影响

参考答案：D

88.线性规划问题若有最优解,则一定可以在可行域的()上达到

A、内点

B、外点

C、几何点

D、顶点

参考答案：D

89.在方差分析中,检验统计量F是？

A、组间均方除以组内均方

B、组间平方除以总平方和

C、组间平方和除以组内平方和

D、组间均方除以总均方

参考答案：A

90.在方差分析中，检验统计量F是

A、组间均方除以总均方

B、组间均方除以组内均方

C、组间平方除以总平方和

D、组间平方和除以组内平方和

参考答案：B

91.对于因子分析说法错误的是

A、因子载荷绝对值越大代表相应的公共因子表达变量的信息越少

B、所有公共因子的因子载荷和随机因子的平方和越接近1,则说明因

子分析的效果越好

C、公共因子的方差贡献，即在所有变量中该公共因子的因子载荷的平

方和,可以衡量公共因子能提供多少信息

D、因子分析和主成分分析一样,都是一种降维的统计方法

参考答案：A

92.对于逻辑回归和SVM算法说法中不正确的是()

A、逻辑回归可以用于预测事件发生概率的大小

B、SVM可以有效避免模型过拟合

C、逻辑回归的目标是最小化后验概率

D、SVM的目标是最小化结构风险

参考答案：C

93.关于系统聚类,下列说法正确的是？

A、系统聚类之前需要先给出各个类别的初始类中心

B、系统聚类之后，模型能给出唯一的分类别数量

C、系统聚类之后，类别数量需要参考聚类过程给出

D、系统聚类之前需要先给出聚类的数量

参考答案：C

94.下列哪项不是主成分分析的推荐应用？

A、数据可视化:减少输入数据的维数，能够将数据在2D.平面中进行

绘制

B、作为线性回归的替代算法,对于大多数学习应用，主成分分析和线

性回归给出了基本相似的结果

C、数据压缩:减少输入数据的维数,使得数据占用更少的内存/磁盘空

间

D、数据压缩:减少输入数据的维数,并用于监督学习算法,能够使监督

学习算法运行得更快

参考答案：B

95.针对字段〃用户姓名”，下列方法最适宜的是？

A、需要编码为数值变量

B、需要编码为二分变量

C、需要编码为分类变量

D、需要编码为字符变量

参考答案：D

96.以下哪类不属于分层标签？

A、RFM

B、VIP客户级别

C、生命周期阶段

D、家庭状态

参考答案：D

97.线性规划模型不包括下列()要素

A、约束条件

B、决策变量

C、目标函数

D、状态变量

参考答案：D

98.在对某个多元线性回归模型的分析中，如果某自变量的VIF=1,这

说明()

A、此多元回归模型的R2=0

B、此模型存在非常严重的共线性

C、此自变量与因变量不存在线性相关性

D、此自变量与其他自变量不存在线性相关性

参考答案：D

99.在因子分析中，为了帮助解释因子,可以使用0

A、因子负载

B、主成分分析

C、因子旋转

D、因子得分

参考答案：C

100.两个变量y与x的回归模型中，分别选择了4个不同模型,它们

的决定系数R方如下,其中拟合效果最好的模型是()

A、R方=0.98

B、R方=0.50

C、R方=0.25

D、R方=0.80

参考答案：A

101.已知某一元线性回归模型的判定系数R2=0.64,则自变量与因变

量之间的相关系数为()

A、0.6

B、1.0

C、0.8

D、0.4

参考答案：C

102.某手机生产商希望研发一款新型的手机及配置选项，需要对全国

的目标用户进行调研，项目时间为一个月，经费20万,请问此时使用

哪种调研方式比较合适？

A、问卷调查6000人

B、定性访谈20人+问卷调查300人

C、定性访谈500人

D、定性访谈200人+问卷调查200人

参考答案：B

103.问题理解阶段事件还原工具是哪个？

A、关键事件

B、雷达图

C、绩效矩阵或严重度评估矩阵

D、流程图

参考答案：D

104.市场调研的量表中，量表中所表示的只能是差距关系和顺序关系,

不具备真正的零点的量表是？

A、顺序量表

B、等距量表

C、类别量表

D、等比量表

参考答案：B

105.已知某公司的广告投入和销售业绩复合y=564.23+0.59x（单位：

万）的形式,下面说法正确的是？

A、投入产出比大于1

B、投入产出比小于1

C、若广告每投入1万元,销售业绩增加59万元

D、如果没有广告投入,销售业绩为564.23百万元

参考答案：B

106.有关根因分析下列说法不正确的是？

A、异常事件严重度评估准则可以用理解问题

B、根因分析最后一步是提出改善措施，消除根原因

C、头脑风暴法常用于找到问题最可能的原因

D、只能用5WHY分析法确定根原因

参考答案：D

107.当我们对一份数据进行建模分析时，如果出现数据集变较多，而

对应的样本数相对较少的情况，下列哪种处理方法不能提升模型的适

用性

A、变量聚类

B、增加样本量

C、主成分分析

D、样本聚类

参考答案：D

108.关于主成分分析的特点,理解错误的是

A、前几个主成分的变异无法解释原多元数据中的所有变异

B、如果原始变量不相关，即协方差为0,则不需要做主成分分析

C、有多少个变量就会有多少个正交的主成分

D、主成分的变异之和等于原始变量的所有变异

参考答案：C

109.在建立线性回归模型时，因变量与自变量之间非线性相关，以下

做法正确的是？

A、剔除掉自变量的高杠杆点

B、对自变量进行变量变换

C、剔除掉自变量的离群点

D、对因变量进行变量变换

参考答案：B

110.关于混淆矩阵,下面说法错误的是？

A、预测为真，实际为假,标记为FN(FA.IseNegA.tive)

B、召回度(reC.A.11)计算公式为TP/(TP+FN),表示真实为真中有多

少被预测正确

C、预测为真，实际为真,标记为TP(TruePositive)

D、精准度(precision)计算公式为TP/(TP+FP),表示预测为真中有

多少真实为真

参考答案：A

111.关于K-Means算法，正确的描述是

A、不能使用核函数

B、每次选代的时间复杂度是0(n2),其中n是样本数量

C、能找到任意形状的聚类

D、初始值不同，最终结果可能不同

参考答案：D

112.线性规划问题是针对()求极值问题

A、约束

B、秩

C、目标函数

D、决策变量

参考答案：C

113.在线性回归分析中，当发现自变量之间相关性较强时,可以采用

A、Lasso回归

B、广义线性回归

C、非线性回归

D、逻辑回归

参考答案：A

114.在方差分析中，数据的误差是用平方和来表示的。其中反映一个

各观测值误差大小的平方和称为

A、水平项平方和

B、总平方和

C、组间平方和

D、组内平方和

参考答案：D

115.样本预设分类的情况下,通过样本的现有特征对样本进行分类的

方法称为()

A、关联规则发现

B、分类分析

C、描述性分析

D、聚类分析

参考答案：B

116.某客户为欺诈的概率为0.6,则优势比为？

A、0.6

B、1.5

C、0.085416667

D、0.4

参考答案：B

117.线性规划问题是针对()求极值问题

A、秩

B、目标函数

C、约束

D、决策变量

参考答案：B

118.基于对未来的预测和在可选策略集上得到的行动方案,称为

A、策略

B、信息

C、数据

D、知识

参考答案：A

119.以下说法不正确的是？

A、鱼骨图不只用于根原因定位，还用于分析对策

B、因果图包括传统鱼骨图和过程图，但是都是以鱼骨图的形式体现的

C、对策型的鱼骨图鱼头在右,特性值通常以“如何提高?〃来写

D、原因型鱼骨图的鱼头在右,特性值通常以“为什么？”来写

参考答案：C

120.在数据库设计的需求分析阶段,一般采用()表示业务流程分析的

结果

A、数据流图

B、程序结构图

C、E-R图

D、程序框图

参考答案：A

121.某商店为了计算商品的热销程度,可以通过计算商品的

A、偏度

B、平均数

C、众数

D、加权平均数

参考答案：A

122.全国性大规模调查，通常需要多种抽样方法，而多段集群抽样

(muti-stageclustersampling)提供了多种整合技术，据此说法正确

的是？

A、是指在第一个阶段先抽出一部分集群,然后在下一阶段选中的集群

中，再抽出一部分集群,到最后阶段再抽取若干基本单元（最小单位）

B、大规模抽样最多使用到两阶段抽样，因为误差无法控制

C、抽样阶段每增加一级,其抽样误差不变，因此最终对总体的估计与

简单抽样相同

D、如果是全国性调查的多段集群抽样,其最小单元只能是行政区块村,

不能是个人

参考答案：A

123.关于相关关系，下面说法正确的是？

A、相关关系必是因果关系，因果关系不一定是相关关系

B、完全不相关时，相关系数为0

C、从相关程度分为强相关和弱相关

D、相关关系按照方向分为线性相关和非线性相关

参考答案：B

124.5WHY分析法又被称为

A、矩阵分析法

B、因果分析法

C、头脑风暴法

D、五问分析法

参考答案：D

125.在鱼骨图分析中，以下哪个是正确的?

A、选取重要原因时，不要超过7项，且应标识在大要因层面

B、选取重要原因时，不要超过7项，且应标识在小要因层面

C、选取重要原因时，不要超过7项，且应标识在中要因层面

D、选取重要原因时,不要超过7项,且应标识在最未端原因

参考答案：D

126.根原因消除工具不包括哪个？

A、六项思考帽

B、价值树模型

C、系统发明思想

D、创造性解决问题理论

参考答案：B

127.据研究发现,身高服从正态分布。则在一次抽样中，取到的身高小

于等于中位数的概率为()

A、0.05

B、小于50%

C、大于50%

D、0.5

参考答案：D

128.方差分析表中用于检验总体模型假设的统计量是()

A、F

B、SSE

C、SST

D、SSM

参考答案：A

129.当时间序列的环比增长速度大体相同时,适宜拟合

A、直线

B、对数曲线

C、抛物线

D、指数曲线

参考答案：A

130.如果时间序列的各期增长量相等,则

A、各期的环比增长速度保持不变

B、环比增长速度逐期上升

C、环比增长速度逐期下降

D、各期环比增长速度有升有降

参考答案：C

131.研究性别与是否抽烟的相关性,可以用

A、卡方检验

B、皮尔逊相关系数

C、方差分析

D、t检验

参考答案：A

132.在假设检验问题中，原假设为H0,给定显著水平为a,则正确的是

A、P(接受HO|HO正确)=a

B、P(接受HO|HO不正确)=『a

C、P(拒绝HO|HO正确)=a

D、P(拒绝HO|HO不正确)=1-a

参考答案：C

133.5WHY分析法又被称为

A、矩阵分析法

B、头脑风景法

C、因果分析法

D、五问分析法

参考答案：D

134.相比获得全市员工名单而言，获取全市的企业名单会容易的多，

并以企业为单位随机抽样，重点调查某个企业,这样可以节省调研成

本，请问这是哪种抽样方法？

A、分群抽样(C.lustersA.mpling)

B、简单随机抽样(simplerA.nD.omsA.mpling)

C、系统抽样(systemA.tiC.sA.mpling)

D、分层随机抽样(strA.tifeD.rA.n

D.omsA.mpling)

参考答案：D

135.下列关于逻辑回归的说法正确的是

A、逻辑回归必须对缺失值做预处理

B、逻辑回归比决策树，更容易过度拟合

C、逻辑回归要求自变量和目标变量是线性关系

D、逻辑回归只能做2值分类，不能直接做多值分类

参考答案：A

136.研究性别与是否抽烟的相关性,可以用()

A、方差分析

B、卡方检验

C、皮尔逊相关系数

D、检验

参考答案：B

137.如何才能尽快掌握5W方法

A、凡事都问几个为什么

B、求教领导

C、邀请专家指导

D、参加培训

参考答案：A

138.K-Means聚类法要求自变量之间不存在共线性的原因是()

A、变量存在多重共线性时无法得到聚类结果

B、变量存在多重共线性时,相关变量会在距离计算中占据高的权重,

从而对聚类结果有负面的影响

C、变量存在多重共线性时,得到的聚类结果是完全错误的

D、变量存在多重共线性时无法解释聚类结果

参考答案：B

139.以下哪个不是根原因分析中问题原因头脑风暴的技术和工具？

A、绩效矩阵

B、是非矩阵

C、配对比较

D、名义群组技术

参考答案：A

140.按经典假设,线性回归模型中的解释变量应是非随机变量，且()

A、与随机误差项不相关

B、与被解释变量不相关

C、与回归值不相关

D、与残差项不相关

参考答案：A

141.下列说法错误的是

A、若原问题有可行解，但目标函数无界,其对偶问题无可行解

B、若原问题为mA.xZ=C.X,A.XsB.,x20,则对偶问题为

minW=YB.,YA,>=C.,Y>=0

C、任何线性规划问题都有一个与之对应的对偶问题

D、对偶问题无可行解时，其原问题的目标函数无界

参考答案：D

142.对相同的数据进行逻辑回归时,会节省时间、提高精度的做法是?

A、降低学习率,减少迭代次数

B、增加学习率,减少迭代次数

C、降低学习率,增加选代次数

D、提高学习率,增加送代次数

参考答案：B

143.当进行因子分析时,KMO值在()范围内，因子分析才是有效的

A、小于0

B、0.3-0.5

C、0-0.2

D、大于0.6

参考答案：D

144.根原因分析中解决方案实施阶段包括哪些技术和工具？

A、精益价值树和因果矩阵

B、力场分析和系统创新思维方法

C、精益价值树和力场分析

D、因果矩阵和系统创新思维方法

参考答案：C

145.关于回归分析和相关分析的区别和联系，下面说法错误的是?

A、为了了解两变量直线方向的密切程度,宜选用线性相关分析

B、回归方程y=kx+b中的k表示两变量间的相关程度

C、为了了解自变量对因变量的影响大小，宜选用线性回归分析

D、相关分析看的是因果关系

参考答案：D

146.目前收集110份问卷，数据质量控制良好，需要分析用户推荐指

数(1T00评分)的影响因素，其中包括行为类6个指标。请问一般使

用什么统计方法来解决这类归因问题？

A、logisti

C.回归模型

B、深层神经网络模型

C、结构方程模型

D、线性回归模型

参考答案：A

147.箱线图的矩形中间的横线表示的是这组数据的()

A、上四分位数

B、下四分位数

C、中位数

D、平均数

参考答案：C

148.检验两个群体老年人口比例差,用

A、t检验

B、卡方检验

C、F检验

D、z检验

参考答案：D

149.多元线性回归中F检验的原假设是?

A、所有回归系数都等于0

B、所有回归系数都等于预估值

C、所有回归系数都不等于0

D、所有回归系数都不等于预估值

参考答案：A

150.当对多元线性回归y=bn+bln+b2nt+—+bnxn+E,进行线性关系检

验时，原假设可以设为0

A、bo,bl,...bn中在任意一个不为0

B、bl,……,bn中存在任意一个不为0

C、bl...-bn-0

D、b0=bl=...bn=0

参考答案：C

151.研究性别与是否失眠的相关性,可以用

A、偏度

B、卡方检验

C、t检验

D、F检验

参考答案：B

152.两个变量y与x的回归模型中，通常用R方来刻画回归的效果,

下列叙述正确的是0

A、R方越大，残差平方和越大

B、R方越小，残差平方和越小

c、R方与残差平方和无关

D、R方越小，残差平方和越大

参考答案：D

153.回归分析中定义的

A、解释变量和被解释变量都是随机变量

B、解释变量和被解释变量都为非随机变量

C、解释变量为随机变量,被解释变量为非随机变量

D、解释变量为非随机变量,被解释变量为随机变量

参考答案：D

154,主成分分析需要考虑样本的

A、协方差矩阵

B、方差

C、权重矩阵

D、关联矩阵

参考答案：A

155.用于描述数据的数据或关于数据的结构化数据的是()

A、交易数据

B、数据元

C、主数据

D、元数据

参考答案：D

156.在线性回归分析中，发现两个变量之间存在正向线性相关，则

pearson相关系数应:

A、r=0

B、r<0

C、r>0

D、r!=0

参考答案：C

157.对于数据仓库的特点下列说法中错误的是？

A、将来自多个数据源的数据进行整合

B、主要功能就是用来存储数据的

C、数据仓库一般支撑数据和修改

D、数据仓库通过ETL将数据进行清洗整合

参考答案：C

158.问题理解阶段事件还原工具是哪个？

A、流程图

B、雷达图

C、关键事件

D、绩效矩阵或严重度评估矩阵

参考答案：A

159.如果多元线性回归模型中残差不等于0,而是一个常数,那么（）

A、这个常数应该包含在常数项

B、应该去除常数项

C、型有效

D、应该去除残差项

参考答案：A

160.下面关于选择何种机器学习建模思路,说法错误的是？

A、当需要获得特征与特征间的关系时，需建立无监督模型

B、在反欺诈领域，当已知有欺诈观测时，可用有监督模型来识别用户

C、在反欺诈领域，当没有反欺诈人群时,可用有监督模型来识别用户

D、当需要获得特征与目标间的关系时，需建立有监督模型

参考答案：C

161.关于用户画像的说法错误的是0

A、用户画像的标签分为定量标签和定性标签

B、用户画像本质上是应用用户标签做客群定位

C、用户标签必须描述客观的事实

D、用户画像的应用场景有:产品设计,营销推荐,风险控制等

参考答案：C

162.关于下图描述错误的是？

A、横坐标x和纵坐标Y之间是正相关的

B、横坐标X和纵坐标Y之间很大可能是非线性关系

C、分析两者之间的关系可用逻辑回归模型

D、这些散点中存在异常点

参考答案：C

163.统计软件处理的数据类型通常包括文本型、数值型、日期型等格

式,那么分析师录制数据时,通常以哪种录入方式为主？

A、不进行任何编码,保持原始问卷格式,这样可以保证原始信息不变

性

B、数值编码后，保持协方差格式录入,这种格式可以改善运行时间

C、文本编码后,保持一行表示一条观测数据

D、数值编码后,保持一行表示一条观测数据

参考答案：D

164.对于逻辑回归和SVM算法,说法中不正确的是()

A、SVM的目标是最小化结构风险

B、SVM可以有效避免模型过拟合

C、逻辑回归可以用于预测事件发生概率的大小

D、逻辑回归的目标是最小化后验概率

参考答案：D

165.移动平均法用于测定

A、季节趋势

B、循环变动

C、长期趋势

D、短期变化

参考答案：C

166.对于不平稳的序列进行时间序列分析可以

A、差分

B、微分

C、积分

D、不能使用

参考答案：A

167.一元线性回归方程y=3+4x,当x增加一个单位，以下哪个表述最

准确？

A、y平均增加7个单位

B、y增加7个单位

C、y增加4个单位

D、y平均增加4个单位

参考答案：D

168.对一元线性回归y=bO+blxl+e进行F检验,其结果与对回归系

数bl做t检验得到的结果()

A、相同

B、相反

C、无法确定

D、无关

参考答案：A

169.近因分析阶段(现状问题描述)不能使用的图表类型是？

A、帕累托图

B、折线图

C、柱状图

D、雷达图

参考答案：B

170.对于一元线性回归，回归系数显著性检验需要用到

A、F检验

B、T检验

C、Z检验

D、卡方检验

参考答案：B

171.数据被称为()的原材料

A、元数据

B、信息

C、知识

D、策略

参考答案：B

172.关于主成分分析的特点,理解错误的是

A、有多少个变量就会有多少个正交的主成分

B、前几个主成分的变异无法解释原多元数据中的所有变异

C、如果原始变量不相关，即协方差为0,则不需要做主成分分析

D、主成分的变异之和等于原始变量的所有变异

参考答案：A

173.样本预设分类的情况下,通过样本的现有特征对样本进行分类的

方法称为()

A、分类分析

B、关联规则发现

C、聚类分析

D、描述性分析

参考答案：A

174.下列哪一项不属于5W分析的注意事项

A、注意现象只记录事实

B、先入为主

C、注意层和层间的相关性，不要跳步

D、避免找原因牵涉到了人的心理

参考答案：D

175.在假设检验问题中，原假设为H0,备择假设为H1,则错误可以表

示为

A、p｛接受HO|HO为真｝

B、p｛拒绝HO|HO为真｝

C、p｛接受H1|HO为真｝

D、p｛接受HO|H1为真｝

参考答案：D

176.主成分分析算法认为数据的信息是包含在()中

A、均值

B、极值

C、误差

D、方差

参考答案：D

177.在时间序列分析中，指数平滑法的平滑系数a的取值()

A、取值范围在0至U1之间

B、越大越好

C、取值范围在T到1之间

D、越小越好

参考答案：A

178.以下哪个是快速聚类法

A、系统聚类法

B、层次聚类法

C、两步聚类法

D、K-me

A.ns聚类法

参考答案：D

179.对某商品抽样调查，抽取其中400个商品，其中98%的商品合格,

以下描述正确的是

A、整个商品的合格率为98%

B、整个商品的合格率大于98%

C、根据以上信息,我们不知道整个商品的合格率比值

D、整个商品的合格率小于98%

参考答案：C

180.如果多元线性回归模型中残差不等于0,而是一个常数,那么()

A、模型有效

B、应该去除常数项

C、这个常数应该包含在常数项

D、应该去除残差项

参考答案：C

181.根据马斯洛需求层次理论,其中最低层次是()

A、安全需要

B、地位和收入尊重需要

C、感情和归属需要

D、生理需要

参考答案：D

182.根原因分析的工具箱包括以下哪个数据近因分析阶段的工具

A、根原因识别

B、问题原因头脑风暴、数据收集、数据分析

C、根原因消除

D、问题理解

参考答案：A

183.应用回归分析应注意的问题,下面说法错误的是？

A、应用回归分析时，要注意时间窗口的一致性

B、因为回归分析是研究自变量与因变量的因果关系,所以要注意孰因

孰果

C、回归分析的自变量选取要符合业务需要,选择合适的数据资料

D、回归分析的自变量必须是连续型数据

参考答案：D

184.下列关于主成分分析的描述错误的是？()

A、是一类常用的针对连续变量的降维方法

B、我们一般保留的前k个主成分累计能够解释数据80%以上的变异

C、各主成分之间的方向夹角需要尽可能的大

D、我们一般保留的前k个主成分中最后一个主成分对应的不应小于

参考答案：C

185.多元线性回归y=b0+blxl+b2x2+..+bnxn+&进行线性关系检验时,

原假设是

A、bl=..bn=0

B、b0=bl=..=0

C、bl,..,bn中存在任意一个不为0

D、bO,bl,..,bn中存在任意一个不为0

参考答案：A

186.下面关于回归分析,说法错误的是？

A、线性回归对异常值不敏感

B、按照自变量和因变量的函数关系来分类,可以分为线性回归分析和

非线性回归分析

C、按照自变量和因变量的个数来分类,可分为一元回归分析和多元回

归分析

D、非线性回归问题可以转化为线性回归

参考答案：A

187.在进行多元线性回归模型的分析中，如果自变量的VIF=1,这说明

A、此自变量与其他自变量不存在线性相关性

B、此多元回归模型的R2=0

C、此模型存在非常严重的共线性

D、此自变量与因变量不存在线性相关性

参考答案：A

188.若线性规划问题没有可行解,可行解集是空集,则此问题0

A、没有最优解

B、有无界解

C、没有无穷多最优解

D、有无界解（重复选项）

参考答案：A

189.统计分析涉及高维运算，因此需要对高维空间中的数据结构进行

探索，以发现其内部的模式，但高维探索特别困难,所以因子分析可以

将高维空间进行降维,然后探索其内部结构。下面有关因子分析说法

错误的是？

A、因子分析与主成分分析都是数据降维的主要手段

B、数据结构探索是因子分析功能之一

C、降维是因子分析的功能之一

D、因子分析在探索问题上，常用于效度分析

参考答案：B

190.两个随机变量的线性相关系数为0,说明

A、两个变量线性无关

B、两个变量独立

C、至少有一个变量是0

D、两个变量无关

参考答案：A

191.某奶茶店为了预测每天订单数，建立了一个线性回归模型，其中

有一个自变量为天气类型（分类变量），分为晴、阴、雨、雪等4种类

型,请问如何处理这种变量？

A、直接作为自变量使用

B、设置哑变量

C、剔除变量

D、变量标准化

参考答案：B

192.对于因子分析说法错误的是

A、因子分析和主成分分析一样,都是一种降维的统计方法

B、所有公共因子的因子载荷和随机因子的平方和越接近1,则说明因

子分析的效果越好

C、因子载荷绝对值越大代表相应的公共因子表达变量的信息越少

D、公共因子的方差贡献，即在所有变量中该公共因子的因子载荷的平

方和,可以衡量公共因子能提供多少信息

参考答案：C

193.以下说法不正确的是？

A、对策型的鱼骨图鱼头在右,特性值通常以〃如何提高〃来写

B、鱼骨图不只用于根原因定位，还用于分析对策

C、因果图包括传统鱼骨图和过程图，但是都是以鱼骨图的形式体现的

D、原因型鱼骨图的鱼头在右,特性值通常以〃为什么〃来写

参考答案：A

194.某分析师希望通过聚类算法进行欺诈分析,发现结果不是很理想。

下列方法中哪项不能为聚类效果带来提升？

A、对变量进行变量聚类

B、对变量进行标准化

C、对变量进行主成分分析

D、对变量进行分箱处理

参考答案：D

195.市场调研的量表中，量表中所表示的只能是差距关系和顺序关系,

不具备真正的零点的量表是()

A、等比量表

B、等距量表

C、类别量表

D、顺序量表

参考答案：B

196.检验两个群体老年人口比例差,用()

A、Z检验

B、t检验

C、F检验

D、卡方检验

参考答案：A

197.在系统聚类中R2是指()

A、组内离差平方和除以总离差平方和

B、组内离差平方和除以组间离差平方和

C、组间离差平方和除以总离差平方和

D、组间离差平方和除以组内离差平方和

参考答案：C

198.在进行策划时，按照一定的程序进行精准营销策划的方法是

A、程序法

B、案例法

C、计划法

D、模型法

参考答案：A

199.在进行策划时，按照一定的程序进行精准营销策划的方法是

A、程序法

B、计划法

C、模型法

D、案例法

参考答案：A

200.数据被称为（）的原材料

A、信息

B、策略

C、元数据

D、知识

参考答案：A

二.多选题

1.回归分析中多重共线性的处理方法有

A、逐步回归

B、变量标准化

C、工具变量

D、岭回归

参考答案：AD

2.因果图的分析要点有哪些？

A、如果某种原因可同时归属于两种或两种以上因素,请以关联性最强

者为准

B、脑力激荡时，应尽可能多而全地找出所有可能原因，而不仅限于自

己能完全掌控或正在执行的内容,对人的原因，宜从行动而非思想态

度面着手分析

C、大要因必须用中性词描述（不说明好坏），中、小要因必须使用价值

判断（如••不良）

D、确定大要因时，现场作业一般从“人、机、料、法、环〃着手，管理

类问题一般从〃人、事、时、地、物〃层别，应视具体情况决定

参考答案：ABCD

3.反映回归直线拟合优度的指标有()

A、样本决定系数

B、回归系数

C、相关系数

D、剩余变差(或残差平方和)

参考答案：ACD

4.下列属于线性回归假设的是()

A、解释变量之间不能强线性相关

B、解释变量和被解释变量之间存在线性关系

C、抗动项独立同分布

D、解释变量和扰动项不能相关

参考答案：CD

5.线性规划模型包括的要素有()

A、环境变量

B、目标函数

C、决策变量

D、状态变量

参考答案：BC

6.多元线性回归中，内生性的解决方法有？

A、变量别除

B、联立方程

C、工具变量

D、变量转换

参考答案：ACD

7.以下属于线性回归基本假设的有

A、误差项£相互独立

B、误差项E服从正态分布

C、误差项e的期望等于1

D、误差项e的方差等于1

参考答案：AB

8.根原因分析中问题理解的常用工具包括（）

A、雷达图

B、关键事件

C、绩效矩阵

D、流程图

参考答案：ABCD

9.现希望获得某地区32所小学中，所有学生的数学成绩状况,总人数

为6800名，但项目费用有限,前提限定了抽样样本不能超过600个,

通过调查发现,全市小学分成3个地区（根据师资、人口等因素），学生

人数分别为1700,2266,2834,并且平均调查费用比为5,2:1,预调查

样本标准差为12、8、14（分别对应地区一三三），下列选项说法不正确

的是0

A、需要分群抽样和简单抽样两项计算才能完成样本搜集工作

B、分层抽样技术可以完成样本搜集工作

C、可以使用简单随机抽样技术完成样本搜集工作

D、使用系统抽样技术完成样本搜集工作

参考答案：ACD

10.在层次聚类中，可以用来定义两个类之间距离的方法有

A、离差平方和法

B、中间距离法

C、最短距离法

D、类平均距离法

参考答案：ABCD

11.因果图的分析要点有哪些？

A、确定大要因时，现场作业一般从〃人、机、料、法、环〃着手,管理类

问题一般从〃人、事、时、地、物〃层别，应视具体情况决定

B、脑力激荡时，应尽可能多而全地找出所有可能原因，而不仅限于自

己能完全掌控或正在执行的内容,对人的原因，宜从行动而非思想态

度面着手分析

C、大要因必须用中性词描述（不说明好坏），中、小要因必须使用价值

判断（如、.・不良）

D、如果某种原因可同时归属于两种或两种以上因素,请以关联性最强

者为准

参考答案：ABCD

12.给定独立同分布的随机变量,期望为u,方差为o2当样本容量趋近

于无穷时，以下正确的是

A、样本均值的分布与n有关

B、样本的平均值的分布近似服从正态分布

C、样本的均值也是随机变量

D、样本的均值也是随机变量样本的平均值趋近于H?

参考答案：BCD

13.RFM模型是衡量客户价值和客户创利能力的重要工具和手段，以下

属于RFM模型分析指标的是()

A、消费金额

B、消费趋势

C、消费频率

D、最近一次消费

参考答案：ACD

14.线性规

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2024年数据分析师LevelⅡ考试题库（含答案）

文档简介

温馨提示

最新文档

评论

2024年数据分析师LevelⅡ考试题库（含答案）

文档简介

温馨提示

最新文档

评论

相关文档