




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试题说明
本套试题共包括1套试卷
每题均显示答案和解析
大数据挖掘技术练习练习题及答案4(500题)
大数据挖掘技术练习练习题及答案4
L[单选题](),用于显示树状结构数据。
A)矩形式树状结构图;
B)平行结构树
C)垂直结构树
答案:A
解析:
2.[单选题]非参数检验是针对()分布情况做的假设。
A)总体
B)局部
C)个体
答案:A
解析:
3.[单选题]GSM网络中用于传递并且识别用户的唯一标识是
A)MSISDN
B)IMEI
C)IMSI
答案:C
解析:
4.[单选题]MGW与RNC的连接介质采用
A)IP传输
B)PCM传输
C)ATM传输
答案:C
解析:
5.[单选题]数据预处理的任务不包括()。
A)数据清洗
B)数据规范化和离散化
C)数据分类
D)特征提取与特征选择
答案:c
解析:
6.[单选题]MME具备以下功能
A)只有控制面功能
B)只有用户面管理功能
C)同时有控制面和用户面管理功能
D)用户面和控制面功能都不具备
答案:A
解析:
7.[单选题]分类器效果检验中的准确率是指0
A)预测正确的数据在总数据中的比例
B)预测为正的数据在总数据中的比例
C)预测为正的数据中实际为正的数据所占比例
D)实际为正的数据中被预测为正的数据所占比例
答案:C
解析:
8.[单选题]SQL语句中进行空值运算时,需要用到的短语是_
A)NULL
B)ISNULL
C)=NULL
D)=ISNULL
答案:B
解析:
9.[单选题]下面哪种不属于数据预处理的方法?
A)变量代换
B)离散化
C)聚集
D)估计遗漏值
答案:D
解析:
10.[单选题]下面哪个不是Python合法得标识浮。
A)int32
B)40XL
C)self
D)_name_
答案:B
解析:
11.[单选题]设*=0忱0是一个频繁项集,则最多可由X产生()个关联规则。
A)4
B)5
06
D)7
答案:C
解析:
12.[单选题]以下不是数据挖掘工具的是()
A)WEKA
B)KNIME
C)Comnos
D)Matlab
答案:C
解析:
13.[单选题]如果说人工智能是一座高大上的房子,那么()就是它的基石
A)新技术
B)资金
C)大数据
D)需求
答案:C
解析:
14.[单选题]如果对属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则为
A)无序规则
B)穷举规则
C)互斥规则
D)有序规则
答案:B
解析:
15.[单选题]“大数据+云计算”将会带来信息产业革命的第()个高峰
A)一
B)二
C)三
D)四
答案:C
解析:
16.[单选题]lr.fit(X_train,ytrain)语句的目的为()
A)建立LR模型
B)导入数据并观察
C)查看数据框
D)用处理好的数据训练模型
答案:D
解析:
17.[单选题]BeautifulSoup库在进行标签树下行遍历时,以列表形式返回儿子节点的代码是哪个?
A)content
B)children
C)descendants
D)string
答案:A
解析:
18.[单选题]矩估计的基本原理是0
A)用样本矩估计总体矩
B)使得似然函数达到最大
C)使得似然函数达到最小
D)小概率事件在一次试验中是不可能发生的
答案:A
解析:
19.[单选题]多维空间中最适合的异常点检测方法是
A)正态分布图
B)等价图
C)马氏距离
D)散点图
答案:C
解析:
20.[单选题]在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证一个测试记录都
是由覆盖它的“最好的”规格来分类,这种方案称为()
A)基于类的排序方案
B)基于规则的排序方案
C)基于度量的排序方案
D)基于规格的排序方案。
答案:B
解析:
21.[单选题]下面列出的条目中,下列不是数据仓库基本特征的是:()
A)数据仓库是面向主题的
B)数据仓库的数据是集成的
C)数据仓库的数据是非时变的
D)数据仓库的数据是非易失的
答案:C
解析:
22.[单选题]以下哪个聚类算法不属于基于网格的聚类算法()。
A)STING
B)WaveCluster
C)MAFIA
D)BIRCH
答案:D
解析:
23.[单选题]某小区60%居民订晚报,45%订青年报,30%两报均订,随机抽一户。则至少订一种报的
概率为()
A)0.82
B)0.85
00.80
D)0.75
答案:D
解析:
24.[单选题]()是一个观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产
生的。
A)边界点
B)质心
C)离群点
D)核心点
答案:C
解析:
25.[单选题]下面哪个属于映射数据到新的空间的方法?
A)傅立叶变换
B)特征加权
C)渐进抽样
D)维归约
答案:A
解析:
26.[单选题]下列算法中,不属于外推法的是()。
A)移动平均法
B)回归分析法
C)指数平滑法
D)季节指数法
答案:B
解析:
27.[单选题]在TDLTE网络中,EnodeB到MME的接口是
A)S1
B)X2
C)S6a
D)S8
答案:A
解析:
28.[单选题]有关数据抽取工具的叙述中正确的是()
A)只能使用数据仓库开发工具所提供的数据抽取工具
B)只能使用开发人员自己开发的数据抽取工具
C)根据实际需要确定是否自己开发数据抽取工具
D)以上都不对
答案:C
解析:
29.[单选题]以下哪个指标不是用来评估分类模型()
A)准确率(Accuracy)
B)召回率(Recall)
C)轮廓系数(SilhouetteScore)
D)Fl-score
答案:C
解析:
30.[单选题]LTE中的TA概念哪个是错误的()
A)TAI由MCC+MNC+TAC三部分组成
B)TAC的FQDN格式为:tac-hb〈xlx2>.tac-lb<x3x4>.tac.epc.mnc<MNC>.mcc<MCC>.3gppnetwork.org
C)TAC与LAC可重叠使用
D)一个TA可由一个或多个小区构成
答案:B
解析:
31.[单选题]Zookeeper是Hadoop和()的重要组件
A)Hive
B)HBASE
C)MapReduce
D)HDFS
答案:B
解析:
32.[单选题]在集团公司四维十轮网络质量评估体系中,下列哪项不是评估移动业务感知的指标:
A)重点保障场景VoLTE接通率(%)
B)4G客户网络质量满意度
C)HTTP下载速率(Mbps)
D)家庭宽带网络质量满意度
答案:D
解析:
33.[单选题]下面哪项是集中性能管理面向终端专题()
A)2/3G高流量小区迁移
B)终端在网质量评估分析
C)客户投诉溯源分析
D)网络实时性能监控
答案:D
解析:
34.[单选题]关于混合模型聚类算法的优缺点,下面说法正确的是()
A)当簇只包含少量数据点,或者数据点近似协线性时,混
合模型也能很好地处理。
B)混合模型比K均值或模糊C均值更一般,因为它可以使用各种类型的分布。
C)混合模型很难发现不同大小和椭球形状的簇。
D)混合模型在有噪声和离群点时不会存在问题。
答案:B
解析:
35.[单选题]除输入层外,每一层都有一个偏置值,其值在()之间
A)[0,1]
B)[-1,0]
O-1.0.1
D)[-1,1]
答案:A
解析:
36.[单选题]为了可以把多个评估器链接成一个复合评估器,sklearn中提供了Pipeline机制,下
面关于
Pipeline描述不正确的是()
A)管道中的最后一个评估器一定要是一个实现了predict方法的学习器
B)管道中的所有评估器,除了最后一个评估器,管道中的所有评估器必须都是转换器。
C)管道中的评估器参数可以通过〈estimator》—语义来访问
D)管道中的评估器可以通过索引或名称访问
答案:A
解析:
37.[单选题]下列关于等距离分箱的说法中错误的是()。
A)等距离分箱能使每个区间内包含的取值个数大致相同
B)若区间个数为k,每个区间的间距为1=(max-min)/k
C)等距离分箱可能导致属于某些的取值非常多,而某些又非常少
D)又称为等宽度分箱
答案:A
解析:
38.[单选题]个人信息保护影响评估报告和处理情况记录应当至少保存()年。
A)一
B)十
C)五
D)三
答案:D
解析:
39.[单选题]以下有关贝叶斯信念网络(BBN)的叙述中错误的是()
A)BBN是一个有向无环图
B)BBN中每个结点代表一个随机变量
C)BBN中每条有向边表示变量之间的依赖关系
D)BBN中最多只有一个输出结点
答案:D
解析:
40.[单选题]关于OLAP的特性,下面正确的是:()(1)快速性(2)可分析性(3)多维性(4)信
息性⑸共享性
A)(l)
B)(2)
0(1)
D)(l)
答案:D
解析:
41.[单选题]《视频业务端到端业务质量分析》应用落地手册中定义的视频业务用户感知KQI指标不
包括0
A)视频播放等待时长
B)视频播放成功率
C)视频播放清晰度
D)视频停顿次数
答案:A
解析:
42.[单选题]在数据预处理中,将数据转换为易于进行数据挖掘的数据存储形式,如数据规格化,这一
过程称为()
A)数据提取
B)数据变换
C)数据清理
D)数据加载
答案:B
解析:
43.[单选题]关于回归分析,下列说法中错误的是()
A)作回归分析的变量之间要有实际意义,不能把毫无关联的两种现象随意进行回归分析,要结合专业
知识对两事物之间是否存在因果关系作出合理解释和结论。
B)在进行线性回归分析进行的数据准备的时候,要求因变量y和自变量x都是符合总体正态的随机
变量。
C)回归直线不要随意外延
D)所有非线性回归都可以转化为线性回归
答案:D
解析:
44.[单选题]S6a接口基于以下哪个协议
A)GTP
B)SCTP
C)Diameter
D)S1-AP
答案:C
解析:
45.[单选题]如下表所示,
交易号(D)商品(terns)
1beer,diaper,nuts
2beer,biscuit,diaper
3bread,butter,cheese
4beer,cheese,diaper,nuts
5beer,butter,cheese,nuts
3)如下表所示,使用FP-Growth计算其频繁集,给定最小支持度为40%,频繁模式树(树)有(
)个结点。(不包括根结点)。
A)10
B)9
08
D)5
答案:B
解析:
46.[单选题]打开一个已有文件,然后在文件末尾添加信息,正确的打开方式为()。
A)r
B)w
C)a
D)w+
答案:C
解析:R表示只读方式。
W表示只写方式,如果文件存在,则清空文件;如果文件不存在,则创建文件。
A表示追加的模式,以只写的形式打开文件,只允许在文件的末尾追加数据。
W+表示写入更新模式,如果文件已经存在,则清空文件
47.[单选题]无监督学习,应用最广的是()算法
A)聚类算法;
B)降维算法;
C)关联规则算法;
D)文本挖掘
答案:A
解析:
48.[单选题]将两个簇的邻近度定义为不同簇中任意两点的最短距离,它是一种()连接方式。
A)单链接
B)全链接
C)组平均
D)质心距离
答案:A
解析:
49.[单选题]os的下列函数中,用来给文件重命名的是?
A)remove()
B)rename()
C)systemO
D)listdir()
答案:B
解析:
50.[单选题]假设检验中,拒绝域的边界称为()
A)临界值
B)临界点
C)置信水平
D)边际值
答案:A
解析:
51.[单选题]对于人工智能认知错误的是()
A)人工智能应该是人类用来改造世界的技术手段,是辅助性的工具,而不是对人类进行了替代
B)目前人工智能还处于初级阶段,算是弱人工智能,AI技术还是离不开大数据
C)人工智能在计算方面,超过人类。在部分感识方面,可与人类相媲美。但在认知方面,人工智能
还处于几乎空白阶段,而这恰恰是我们人类的最大优势
D)人工智能会毁灭人类
答案:D
解析:
52.[单选题]用于将Python程序打包成可执行文件的工具是。
A)Panda3D
B)cocos2d
C)pip
D)Pylnstaller
答案:D
解析:
53.[单选题]DBSCAN最大时间复杂度的是
A)0(m)
B)0(m2)
C)0(logm)
D)0(m*logm)
答案:B
解析:
54.[单选题]面对人工智能存在的诸多伦理道德问题,下列不应当采取的行动为()
A)思考如何将人类的价值观和规范嵌入人工智能系统,赋予AI以人性的光辉
B)开展人工智能伦理的研究和顶层设计,促进民生福祉改善,推进行业健康发展,掌握新一轮技术
革命的主动权
C)人工智能的伦理,实际上是人的问题。国家和机构需要重视,共同做出更多的努力
D)发展人工智能时面对有问题的地方不去发展
答案:D
解析:
55.[单选题]下列说法错误的是()
A)相关系数矩阵是一个对称矩阵,其中对角线上的元素都是1,表示自相关系数
B)非对角线元素表示互相关系数,每个元素的绝对值都小于等于0,反应变量变化趋势的相似程度
C)相关系数的绝对值越大,表示两个信号互相影响的程度越大
D)如果的相关系数矩阵中非对角线元素大于0,表示两个信号正相关,其中一个信号变大时另一个信
号也变大,变化方向一致
答案:B
解析:
56.[单选题]以下哪个指标属于无线网络结构指标
A)即时通信响应成功率
B)重叠覆盖小区占比
C)4G占网时长占比
D)网络质量综合满意度
答案:B
解析:
57.[单选题]关联规则是反映事物之间的依赖关系,典型例子是购物篮分析,常见算法有Apriori关联
算法和()算法。
A)贝叶斯算法
B)线性回归
C)F.P-growth关联算法
D)聚类算法
答案:C
解析:
58.[单选题]当置信水平一定时,置信区间的宽度()
A)随着样本量的增大而减小
B)随着样本量的增大而增大
C)与样本量的大小无关
D)先随着样本量的增大而减小,到一定程度后会随着样本
量的增大而增大。
答案:A
解析:
59.[单选题]有一条关联规则为A一
B,此规则的信心水平(confidence)为60%,则代表()
A)买B商品的顾客中,有60%的顾客会同时购买A
B)同时购买
A,B两商品的顾客,占所有顾客的60%
C)买A商品的顾客中,有60%的顾客会同时购买B
D)两商品
A.B在交易数据库中同时被购买的机率为60%
答案:c
解析:
60.[单选题]通过聚集多个分类器的预测来提高分类准确率的技术称为
A)组合
B)聚集
C)合并
D)投票
答案:A
解析:
61.[单选题]利用"linearmodel.LinearRegression()”训练模型时调用.fit()方法需要传递的
,第二个参数是OO
A)是否考虑计算截距
B)样本权重
C)样本特征X
D)样本标签Y
答案:D
解析:
62.[单选题]以下哪些算法是基于规则的分类器()
A)C4.5
B)KNN
C)NaiveBayes
D)ANN
答案:A
解析:
63.[单选题]LTE中,对于频分双工(FDD)的操作,定义了4中随机接入的前导格式,其中格式3的
Tcp()us
A)203.13
B)406.26
O101.3
0)684.38
答案:D
解析:
64.[单选题]在图集合中发现一组公共子结构,这样的任务称为
A)频繁子集挖掘
B)频繁子图挖掘
C)频繁数据项挖掘
D)频繁模式挖掘
答案:B
解析:
65.[单选题]下面关于数据粒度的描述不正确的是:()
A)粒度是指数据仓库小数据单元的详细程度和级别;
B)数据越详细,粒度就越小,级别也就越高;
C)数据综合度越高,粒度也就越大,级别也就越高;
D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量.
答案:C
解析:
66.[单选题]统计档案表中学生来自多少个城市,下面SQL语句正确的是o
A)SELCETSUM(DISTINCT家庭住址)FROM档案表;
B)SELCETDISTINCT家庭住址FROM档案表;
OSELCETCOUNT(家庭住址)FROM档案表;
D)SELCETCOUNT(DISTINCT家庭住址)FROM档案表;
答案:D
解析:
67.[单选题]利用"linear_model.LinearRegressionO”训练模型时调用.fit()方法需要传递的第
一个参数是()O
A)是否考虑计算截距
B)样本权重
C)样本特征X
D)样本标签Y
答案:C
解析:
68.[单选题]SELECT语句中的WHERE用于说明。
A)查询数据
B)查询条件
C)查询分组
D)查询排序
答案:B
解析:
69.[单选题]Hbase是哪种数据库?
A)关系型数据库
B)Nosql数据库
C)网状数据库
D)层次数据库
答案:B
解析:
70.[单选题]下面选项中t不是s的子序列的是()
A)S=<{2,4},{3,5,6},{8}>t=<⑵,{3,6},⑻>
B)S=<{2,4},{3,5,6},{8}〉t=<{2},{8}>
C)S=<{1,2},{3,4}>t=<{l},{2}>
D)S=<{2,4},{2,4}>t=<{2},{4}>
答案:C
解析:
71.[单选题]自然语言理解是人工智能重要应用领域,下面()不是人工智能要实现的目标
A)理解人讲的话
B)对自然语言表示的信息分析概括
C)欣赏音乐
D)机器翻译
答案:C
解析:
72.[单选题]下列关于数据重组的说法中,错误的是0
A)数据重组是数据的重新生产和重新采集
B)数据重组能够使数据焕发新的光芒
C)数据重组实现的关键在于多源数据融合和数据集成
D)数据重组有利于实现新颖的数据模式创新
答案:A
解析:
73.[单选题]以下哪个聚类算法不是属于基于原型的聚类
A)CLIQUE
B)模糊C均值
OEM算法
D)S0M
答案:A
解析:
74.[单选题]以下0LAP操作中()的作用是改变维的层次,变换分析的粒度。
A)切块
B)平移
C)钻取
D)切片
答案:C
解析:
75.[单选题]分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题
A)关联规则挖掘
B)分类与回归
C)聚类分析
D)时序预测
答案:A
解析:
76.[单选题]以下哪个聚类算法不属于基于网格的聚类算法
A)BIRCH
B)WaveCluster
C)STING
D)MAFIA
答案:A
解析:
77.[单选题]P(22,1,42,10),Q(20,0,36,8)为两个向量对象,这两个对象的欧几里得距离是()。
A)根号下45
B)ll
06
D)三次根号下233
答案:A
解析:
78.[单选题]能够完全匹配字符串“gogo”和“kittykitty”,但不能完全匹配"gokitty”的正
则表达
式()
A)r“\b(\w+)\b\s+\l\b”
B)R“\w{2,5}\s*\l"
C)r"(\S+)\s+\l”
D)r”(\S{2,5})\S{1,}\1"
答案:D
解析:
79.[单选题]若数据量较大,下面哪种方式比较适合()
A)系统聚类
B)快速聚类(k-means)
C)A和B都可以
D)A和B都不可以
答案:B
解析:
80.[单选题]()框架是大数据的核心框架
A)集中式计算
B)隔离式计算
C)分布式计算
D)混合式计算
答案:C
解析:
81.[单选题]下列哪种调制方式抗干扰能力最强
A)BPSK
B)QPSK
C)16QAM
D)64QAM
答案:A
解析:
82.[单选题]在SQL语句中,可使用的通配符'税(百分号)”表示—
A)一个字符
B)纯数字
C)计算百分数
D)0到多个字符
答案:D
解析:
83.[单选题]主成分分析方法PCA属于属于python中的哪个包()。
A)sklearn
B)numpy
C)scipy
D)pandas
答案:A
解析:
84.[单选题]在Python中有
S=E'a'.'b']
S.append([1,2])
S.insert(1,7);
执行以上代码后,s值为()
A)'a',7,1,2]
2],7,'a','b']
C)[l,2,'a',7','b']
D)['a',7.'b'2]]
答案:D
解析:
85.[单选题]下面哪个属于映射数据到新的空间的方法?
A)傅立叶变换
B)特征加权
C)渐进抽样
D)维归约
答案:A
解析:
86.[单选题]开始将N个样品各自作为一类,将规定样品之间的距离和类与类之间的距离,然后将距离
最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次减少一
类,直至所有的样品合并为一类,此种聚类方法是()
A)K-means
B)SOM聚类
C)系统聚类
D)有序聚类
答案:C
解析:
87.[单选题]下面哪个关键字用来定义函数?
A)def
B)define
C)function
D)class
答案:A
解析:
88.[单选题]大数据技术由。公司首先提出来的
A)腾讯
B)谷歌
C)阿里巴巴
D)微软
答案:B
解析:
89.[单选题]如下哪些不是最近邻分类器的特点
A)它使用具体的训练实例进行预测,不必维护源自数据的模型
B)分类一个测试样例开销很大
0最近邻分类器基于全局信息进行预测
D)可以生产任意形状的决策边界
答案:C
解析:
90.[单选题]决策树算法有多个实现方式,下面哪个算法是基于基尼指数计算得到的()
A)ID3
B)C4.5
C)C5.0
D)CART
答案:D
解析:
91.[单选题]以下哪种方法不属于特征选择的标准方法:()
A)嵌入
B)过滤
C)包装
D)抽样
答案:D
解析:
92.[单选题]以下哪个APP主要使用的是HTTPS协议
A)优酷
B)微信
C)百度搜索
D)王者荣耀
答案:C
解析:
93.[单选题]2016年,集团公司提出了()内容质量保障体系
A)四维三步法
B)三维三步法
C)四维四步法
D)四维五步法
答案:A
解析:
94.[单选题]下列方法,用于向文件写入内容的是()
A)write
B)read
C)open
D)close
答案:A
解析:Write:文件写入
Read:读文件
Open:文件的打开
Close:文件的关闭
95.[单选题]给定一个置信概率和置信区域,若误差超过置信区域,则认为误差不是随机误差引起,视
为异常值的判别方法()。
A)聚类判别法;
B)回归判别法
C)抽样判别法
D)统计判别法
答案:D
解析:
96.[单选题]考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。
队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队
1的主场进行队1获胜的概率为
A)0.75
B)0.35
C)0.4678
D)0.5738
答案:C
解析:
97.[单选题]以下哪些不是业务质量指标KQI
A)页面响应成功率
B)视频下载速率
C)及时通信接入时延
D)Attach成功率
答案:D
解析:
98.[单选题]()打开了自动驾驶的天花板
A)驾驶员驾驶技术提升
B)汽车刹车性能增强
C)人工智能的理论和实践的突破
D)汽车制造商转型
答案:C
解析:
99.[单选题]大数据科学关注大数据网络发展和运营过程中()大数据的规律及其与自然和社会活动
之间的关系。
A)大数据网络发展和运营过程
B)规划建设运营管理
C)规律和验证
D)发现和验证
答案:D
解析:
100.[单选题]通过代码"fromsklearn.clusterimportKMeansn引入Kmeans模块,生成模型对象
“kmeans=KMeans(_clusters=2)w后,对于数据X训|练时要调用的方法是()□
A)kmaens.fit()
B)kmeans.fit()
C)kmaens.train()
D)kmeans.train()
答案:B
解析:
101.[单选题]假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法
将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:
A)0.821
B)1.224
01.458
D)0.716
答案:D
解析:
102.[单选题]sum([i*iforiinrange(3)])的计算结果是?
A)3
B)5
C)2
D)4
答案:B
解析:
103.[单选题]示例程序如下importurllib.request
response=urllib.request,urlopen('http://python.
Org')print(response.getcodeO)若上述示例程序正常运行成功,则程序输出的结果为____。
A)200
B)304
0403
D)500
答案:A
解析:
104.[单选题]在数据库中已建立了tBook表,若查找图书编号是“TP1134”和“TP1138”的记录,则
SELECT查询
的WHERE条件为o
A)图书编号=打「1134"AND"TP1138"
B)图书编号NOTINCTP1134","TP1138")
C)图书编号IN("TP1134","TP1138")
D)图书编号N0TCTP1134"AND"TP1138")
答案:C
解析:
105.[单选题]以下()不是影响时间序列变化的要素。
A)长期趋势
B)季节变动
C)循环波动
D)有规则变化
答案:D
解析:
106.[单选题]语音识别的突破在()
A)用人类思维去做,让机器认识每个音节音素,然后通过音节音素去分辨字和单词
B)研发过程中,计算机工程师与科学家围绕着语言学家进行工作
C)开创了统计学的模式,抛弃了模仿人类思维方式,不再通过总结思维规则的老路,研发过程中极
少语言学家的参与,更多是计算机科学家与数学家的合作
D)图灵测试
答案:C
解析:
107.[单选题]一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。
A)概率
B)邻近度
C)密度
D)聚类
答案:C
解析:
108.[单选题]个人信息的收集、处理和利用应当遵循()的原则,不得违反法律、法规的规定和双方
的约定收集、处理和利用个人信息。()
A)正规、合法、必要
B)合法、正当、必要
C)合法、合规、正当
D)合法、合理、合规
答案:B
解析:
109.[单选题]Sl-basedhandover流程中建立临时数据转发通道时,数据传输方向是
A)SourceENB->SourcePGW->TargetPGW->TargetENB
B)TargetENB->TargetSGW->SourceSGW->SourceENB
C)SourceSGW->TargetSGW->TargetENB
D)SourceENB->SourceSGW->TargetSGW->TargetENB
答案:D
解析:
110.[单选题]requests库获取HTTP请求获得reponse对象,该对象对应的()属性,用于判断网页
请求状
态。
A)status_code
B)enconding
C)apprence_enconding
D)headers
答案:A
解析:status_code:服务器返回的状态码
111.[单选题]已知:
d={123:1Tom*,'age':18,fscore1:[91,92,93]}
print(d[123][1],d[*agef],d[1score1][-1])
输出的结果是:
A)T,18,91
B)o,18,91
C)T,18,92
D)o,18,93
答案:D
解析:
112.[单选题]eSRVCC方案相对于SRVCC方案的增强在于减少了切换时长,eSRVCC切换时长小于()
A)20ms
B)40ms
C)160ms
D)300ms
答案:D
解析:
113.[单选题]Requests库中,下面哪个属性代表了从服务器返回HTTP协议头所推荐的编码方式?
A)headers
B)apparent_encoding
C)text
D)encoding
答案:D
解析:题型:
114.[单选题]数据正规化(DataNormalization)是在知识发掘处理
(KnowledgeDiscoveryProcess)中的哪一个阶段进行?
A)数据清洗
B)数据选择
C)数据编码
D)数据扩充
答案:C
解析:
115.[单选题]用信息增益方法作为属性选择度量建立决策树时,已知某训练样本集的4个条件属性的
信息增益分别为:G(收入)=0.940位,G(职业)=0.151位,G(年龄)0.780位,G(信誉)=0.048位,则应该选
择()属性作为决策树的测试属性。
A)收入
B)职业
C)年龄
D)信誉
答案:A
解析:
116.[单选题]数据挖掘是从数据中发掘知识的过程,在这个过程中()可以作为挖掘工具,数据可
以被看作是土壤,云平台可以看作是承载数据和挖掘算法的基础设施。
A)锄头
B)数据库服务器
C)聚类分析
D)人工智能和数据库技术
答案:D
解析:
117.[单选题]对原始数据进行聚集、抽样、违归约等是哪个步骤的任务
A)数据预处理
B)业务理解
C)数据理解
D)数据量挖掘
答案:A
解析:
118.[单选题]人工智能的目的是让机器能够()
A)具有完全的智能
B)完全和人脑一样考虑问题
C)完全替代人
D)模拟、延伸和扩展人的智能
答案:D
解析:
119.[单选题]VBA语言中,声明变量的关键字是()。
A)SET;
B)C.ONST
C)PRIVATE
D)D.IM
答案:D
解析:
120.[单选题]考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这
两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。
A)平方欧几里德距离
B)余弦距离
C)直接相似度
D)共享最近邻
答案:D
解析:
121.[单选题]在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是:
A)有放回的简单随机抽样
B)无放回的简单随机抽样
C)分层抽样
D)渐进抽样
答案:D
解析:
122.[单选题]以下有关回归分析与时间序列分析的叙述中正确的是0
A)时间序列分析方法明确强调变量值顺序的重要性,而回归分析方法不是
B)时间序列各观测值之间存在一定的依存关系,而回归分析一般要求每一变量各自
独立
C)时间序列是一组随机变量的一次样本实现,而回归分析的样本值一般是对同一随
机变量进行多次独立重复实验的结果
D)以上都是正确的
答案:D
解析:
123.[单选题]下列选项中,属于结构化数据的是
A)图像
B)文本
C)办公文档
D)JSON
答案:D
解析:
124.[单选题]设有一个回归方程为y=2-2.5x,则变量x增加一个单位时()
A)y平均增加2.5个单位
B)y平均增加2个单位
C)y平均减少2.5个单位
D)y平均减少2个单位
答案:C
解析:
125.[单选题]CRISP-DM模型中Evaluation表示对建立的模型进行评估,重点具体考虑得出的结
果是否符合()的商业目的。
A)第二步
B)第三步
C)第一步
D)最后一步
答案:C
解析:
126.[单选题]目前业务流量占比最高的业务大类是
A)即时通信
B)邮件
C)视频
D)下载
答案:C
解析:
127.[单选题]表示职称为副教授、性别为男的表达式为()
A)职称='副教授'OR性别='男'
B)职称='副教授'AND性别='男'
C)BETWEEN'副教授'AND'男'
D)IN('副教授','男')
答案:B
解析:
128.[单选题]下列属于维归约常用的线性代数技术的有()
A)主成分分析
B)特征提取
C)特征加权
D)离散化
答案:A
解析:
129.[单选题]以下两种描述分别对应哪两种对分类算法的评价标准?
(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。
(b)描述有多少比例的小偷给警察抓了的标准。
A)Precision,Recall
B)Recall,Precision
C)Precision,ROC
D)Recall,ROC
答案:A
解析:
130.[单选题]假设某分类器在一个测试数据集上的分类结果的混淆矩阵如下所示,该分类器的精确
率为()。
Predicted
yesno
Actualyesl55
nol020
A)75%
B)80%
060%
D)70%
答案:C
解析:
131.[单选题]字符串是一个连续的字符序列,哪个选项可以实现打印字符信息的换行?
A)使用\n
B)使用转义符\\
C)使用空格
D)使用“\换行”
答案:A
解析:
132.[单选题]以下叙述中()是正确的。
A)分类和聚类都是有指导的学习
B)分类和聚类都是无指导的学习
C)分类是有指导的学习,聚类是无指导的学习
D)分类是无指导的学习,聚类是有指导的学习
答案:c
解析:
133.[单选题]大数据是指()
A)一个图书馆内的书籍信息
B)无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才
能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
C)城市管理信息
D)Facebook用户信息
答案:B
解析:
134.[单选题]以下哪个不是数据清理的方法()
A)填充缺失值
B)光滑噪声
C)识别离群点
D)数据变换
答案:D
解析:
135.[单选题]东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了
撒丫子就跑。猪说:"你跑什么?"鸡叫道:"有本事主人买粉条的时候你小子别跑!"
以上对话体现了数据分析方法中的()
A)关联
B)聚类
C)分类
D)自然语言处理
答案:A
解析:
136.[单选题]通过代码"fromsklearnimportlinear_modelw引入线性模型模块,并通过代码
"reg=linearmodel.LinearRegression()w构造回归器对象后,在训练时要调用的方法是
(B),在训练后做预测时要调用的方法是(D)。
A)reg.train()
B)reg.fit()
C)reg.learn()
D)reg.predict()
答案:B
解析:
137.[单选题]假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,
92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内(
)
A)第一个
B)第二个
C)第三个
D)第四个
答案:B
解析:
138.[单选题]如果一个分类模型经训练后,能在训练集上达到99%的准确率,但在测试集上仅能达
到75%左
右,这说明()
A)欠拟合
B)过拟合
C)正常现象
D)模型选择不合适
答案:B
解析:
139.[单选题]下列说法不正确的是()
A)归纳是从特殊到一般的“泛化”,演绎是从一般到特殊的“特化”
B)对于西瓜来说,若色泽、根蒂、敲声皆有3种取值,加上某种属性什么都不取和没有好瓜这个概念
,则好瓜的假设空间共有4X4X4+1=65种假设(规则)
C)与训练集一致的假设的集合称为“版本空间”
D)对新样本,不同假设可能输出不同结果,在正确假设的选取上,模型(学习器)不一定需要偏好
,学习算法和归纳偏好也可有可无
答案:D
解析:
140.[单选题]视频业务流程可以分为播放准备阶段和播放阶段,其中属于播放阶段KQI指标有()
A)停顿次数
B)视频播放等待时长
C)初始缓冲成功率
D)初始缓冲时长
答案:A
解析:
141.[单选题]以下哪些网元不是VOLTE特有网元
A)MGCF
B)S-CSCF
OMME
D)SBC
答案:C
解析:
142.[单选题]设置hadoop启动环境变量的文件是?
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)hadoop-env.sh
答案:D
解析:
143.[单选题]维度规约是在以下哪个步骤的任务?()
A)频繁模式挖掘
B)降维
C)数据预处理
D)数据流挖掘
答案:C
解析:
144.[单选题]某牙膏厂原来生产两面针药物牙膏,现在又增加牙刷生产,这属于()
A)同心多元化
B)水平多元化
C)集团多元化
D)相关多元化
答案:B
解析:
145.[单选题]weka系统汇集了最前沿的机器学习算法和数据预处理工具,提供的主要应用程序不包
括
A)Explorer
B)KnowledgeFlow
C)Experimenter
D)Conclusion
答案:D
解析:
146.[单选题]为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?()
A)探索性数据分析
B)建模描述
C)预测建模
D)寻找模式和规则
答案:B
解析:
147.[单选题]在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都
是由覆盖它的“最好的”规格来分类,这种方案称为
A)基于类的排序方案
B)基于规则的排序方案
C)基于度量的排序方案
D)基于规格的排序方案。
答案:B
解析:
148.[单选题]下列不属于浏览器开发者模式面板的为()
A)Elements
B)Console
C)Sources
D)headers
答案:D
解析:headers是请求头信息
149.[单选题]在OLAP的基本操作中,在给定的数据立方体的两个或更多个维上进行选择操作得到一个
子立方体,这个操作称为()
A)切块
B)转轴
C)上卷
D)下钻
答案:A
解析:
150.[单选题]eNodeB对哪种类型的数据进行完整性保护()
A)RRCsignalling
B)NASsignalling
C)Userplanedata
D)SystemInformation
答案:C
解析:
151.[单选题]字符串是一个字符序列,给字符串s,以下表示s从右侧向左第三个字符的是:
A)s[-3]
B)s[:-3]
Os[3]
D)s[0:-3]
答案:A
解析:字符串有正向递增和反向递减两套序号体系
152.[单选题]关于混合模型聚类算法的优缺点,下面说法正确的是()。
A)当簇只包含少量数据点,或者数据点近似协线性时,混合模型也能很好地处理。
B)混合模型比
C)混合模型很难发现不同大小和椭球形状的簇。
D)混合模型在有噪声和离群点时不会存在问题。
答案:B
解析:
153.[单选题]以下叙述中正确的是()
A)OLAP是针对特定事务联机数据访问
B)如果一个维是多层次的,那么该维的维成员就是相同维层次的取值的组合
OOLTP存储的是历史数据,不可更新,但可周期性地刷新
D)OLAP的特点是能够对多维信息进行快速分析
答案:D
解析:
154.[单选题]以下哪种方法不属于特征选择的标准方法:
A)嵌入
B)过滤
C)包装
D)抽样
答案:D
解析:
155.[单选题]逻辑回归适用于以下哪种问题()
A)回归问题
B)二分类问题
C)聚类问题
D)关联规则
答案:B
解析:
156.[单选题]某超市研究销售记录发现,购买奶的很概率会购买包,这种属于数据挖掘的哪类问
题?()
A)聚类分析
B)关联规则
C)分类分析
D)自然语言处理
答案:B
解析:
157.[单选题]()是统计学的基础,是统计学里面最重要的概率分布
A)正态分布;
B)静态分布
C)动态分布
D)稳态分布
答案:A
解析:
158.[单选题]关于统计学和大数据之间的关系,一下说法错误的是()。
A)面临大数据,统计学的研究对象有所改变;
B)在大数据环境中,需要首先将未知的问题转化为可用的统计方法;
C)在大数据分析过程中,传统的统计分析过程“定量-定位-再定性”转变为“定量-定性”;
D)在大数据环境中,需要将统计研究的对象范围扩展到一切数据。
答案:A
解析:
159.[单选题]《中华人民共和国数据安全法》中的数据,是指任何以电子或者其他方式对()的记录
O
A)数据
B)信息
C)文件
D)知识
答案:B
解析:
160.[单选题]选择在3行4列的子图中第2个的子图
A)pit.subplot(3,4,1)
B)pit.subplot(3,4,2)
C)pit.subplot(4,3,1)
D)pit.subplot(4,3,2)
答案:B
解析:
161.[单选题]人工智能不会()
A)听(语音识别、机器翻译),看(图像识别、文字识别)
B)说(语音合成、人机对话),思考(人机对弈、定理证明等)
C)学习(机器学习、知识表示等),行动(机器人、自动驾驶汽车等)
D)表达感情
答案:D
解析:
162.[单选题]下面不属于人工智能研究基本内容是()
A)机器感知
B)机器学习
0自动化
D)机器思维
答案:C
解析:
163.[单选题]可用作数据挖掘分析中的关联规则算法有()。
A)决策树、对数回归、关联模式
B)K均值法、SOM神经网络
C)Apriori算法、FP-Tree算法
D)RBF神经网络、K均值法、决策树
答案:C
解析:
164.[单选题]下面哪种不属于数据预处理的方法?
A)变量代换
B)离散化
C)聚集
D)估计遗漏值
答案:D
解析:
165.[单选题]LTE支持灵活的系统带宽配置,以下哪种带宽是LTE协议不支持的
A)5M
B)10M
C)20M
D)40M
答案:D
解析:
166.[单选题]贝叶斯决策是根据()进行决策的一种方法。
A)极大似然概率
B)先验概率
C)边际概率
D)后验概率
答案:D
解析:
167.[单选题]KNN的英文全写为()
A)k-NearerNeighbor
B)k-NearestNeighbor
C)k-NearNeighbors
D)k-NearestNeighbors
答案:B
解析:
168.[单选题]一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。
A)概率
B)邻近度
C)密度
D)聚类
答案:C
解析:
169.[单选题]使用等距离分箱法进行数据离散化,数据范围为20,40,50,58,65,80,80,82,
86,90,96,105,120,200,区间个数为4。下列属于4个箱的区间是()。
A)[20,65]
B)(155,200]
C)[110,155)
D)(65,110)
答案:C
解析:
170.[单选题]给定df是一个DataFrame对象,对df所有字段进行描述性统计,可以利用的方法为(
)O
A)df.describe()
B)df.statistics()
C)df.mean()
D)df.summary()
答案:A
解析:
171.[单选题]关于字符编码的类型中,用于指明浏览器可接受简体中文的是()
A)gb2312
B)iso-8859-l
C)utf-8
D)utf
答案:C
解析:
172.[单选题]分布式存储框架的配置信息在哪个文件中
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)hadoop-env.sh
答案:B
解析:
173.[单选题]下面的代码其功能为()>>>x=[range(3*i,3*i+5)foriinrange(2)]>>>x=
list(map(list,x))»>x=list(map(list,zip(*x)))
A)首先生成一个随机的列表,然后生成矩阵
B)首先生成一个包含列表的列表,然后生成矩阵
C)首先生成一个包含列表的列表,然后模拟矩阵转置
D)首先排序列表,然后模拟矩阵转置
答案:C
解析:
174.[单选题]下列度量不具有反演性的是()
A)系数
B)几率
C)Cohen
D)兴趣因子
答案:D
解析:
175.[单选题]某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖
掘的哪类问题?
A)关联规则发现
B)聚类
C)分类
D)自然语言处理
答案:A
解析:
176.[单选题]下列解析技术中,用于解析JS0N文档的是_
A)XPath
B)JSONPath
C)BeautifulSoup
D)正则表达式
答案:B
解析:
177.[单选题]某终端换机用户识别的需求中,需对使用体验和用户使用需求不匹配的用户进行识别
,挖掘重度游戏迷等用户画像,使用哪类算法最合适
A)决策树
B)最小二乘法
C)时间序列
D)贝叶斯判别
答案:A
解析:
178.[单选题]物联网端到端定界分析()法,可实现物联网端到端业务质量全流程无死角的分析
A)四元四阶
B)七元四阶
C)五元五阶
D)六元四阶
答案:B
解析:
179.[单选题]下面关于数据粒度的描述不正确的是:()
A)粒度是指数据仓库小数据单元的详细程度和级别
B)数据越详细,粒度就越小,级别也就越高
C)数据综合度越高,粒度也就越大,级别也就越高
D)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量
答案:C
解析:
180.[单选题]以下哪个APP主要使用的是HTTP协议
A)淘宝
B)今日头条
C)阴阳师
D)汽车之家
答案:B
解析:
181.[单选题]()将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层
次聚类技术。
A)MIN(单链)
B)MAX(全链)
C)组平均
D)Ward方法
答案:D
解析:
182.[单选题]考虑下面的频繁3-项集的集合:
{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项
,采用合并策略,由候选产生过程得到4-项集不包含()
A)l,2,3,4
B)l,2,3,5
01,2,4,5
D)1,3,4,5
答案:C
解析:
183.[单选题]在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录
都是由覆盖它的“最好的”规格来分类,这种方案称为()
A)基于类的排序方案
B)基于规则的排序方案
C)基于度量的排序方案
D)基于规格的排序方案。
答案:B
解析:
184.[单选题]在SQL中,创建数据库用的命令是()
A)CREATESCHEMA
B)CREATETABLE
C)CREATEVIEW
D)CREATEDATABASE
答案:D
解析:
185.[单选题]为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?
A)探索性数据分析
B)建模描述
C)预测建模
D)寻找模式和规则
答案:B
解析:
186.[单选题]网络建设大类的标签中不包括
A)4G弱覆盖
B)宽带未覆盖
C)宽带需光改
D)4G发展不足
答案:D
解析:
187.[单选题]Apriori算法是最基本的一种关联规则算法,它采用布尔关联规则的挖掘频繁项集的算
法,利用()搜索的方法挖掘频繁项集。
A)逐层
B)逐级
0自底向上
D)自上而下
答案:A
解析:
188.[单选题]在利用skiearn,cluster.凝聚聚类时,使用的默认距离
度量是()。
A)曼哈顿距离
B)马氏距离
C)余弦距离
D)欧氏距离
答案:D
解析:
189.[单选题]下列关于聚类挖掘技术的说法中,错误的是()
A)不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别
B)要求同类数据的内容相似度尽可能
C)要求不同类数据的内容相似度尽可能
D)与分类挖掘技术相似的是,都是要对数据进行分类处理
答案:B
解析:
190.[单选题]DBSCAN在最坏情况下的时间复杂度是()。
A)0(m)
B)0(m2)
C)0(logm)
D)0(m*logm)
答案:B
解析:
191.[单选题]下列不是金融科技公司的是()
A)诺亚财富
B)高盛公司
C)文艺复兴公司
D)中国平安
答案:A
解析:
192.[单选题]在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位
数
A)曼哈顿距离
B)平方欧几里德距离
C)余弦距离
D)Bregman散度
答案:A
解析:
193.[单选题]为什么BeautifulSoup库叫这个名字?
A)原因不详,第三方库起名原因多种多样,没必要深究
B)之前有类似的库叫类似的名字
C)PythonSoftwareFoundation要求开发者叫这个名字
D)开发者喜欢煲汤
答案:A
解析:题型:
194.[单选题]在某文章很多话中部分或全部提到了顾客的年龄,性别,收入和工作地点,想查找这四个
词之间的联系以及联系的强弱,可以用()
A)回归方法
B)分类方法
C)聚类方法
D)关联分析
答案:D
解析:
195.[单选题]有关数据仓库的开发特点,不正确的描述是:()
A)数据仓库开发要从数据出发;
B)数据仓库使用的需求在开发出去就要明确;
C)数据仓库的开发是一个不断循环的过程,是启发式的开发
D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处
理更灵活,且没有固定的模式
答案:A
解析:
196.[单选题]根据中国移动统一DPI设备技术规范-LTE信令采集解析服务器接口规范,S1-MME接口信
息的XDR中,ProcedureType取值范围为:
A)0-32
B)1-33
00-33
D)1-32
答案:B
解析:
197.[单选题]从购物篮商品集中找出商品与商品之间的关系,有助于发现同商品之间的联系()
A)聚类
B)分类
C)预测
D)关联
答案:D
解析:
198.[单选题]以下哪个指标不是家客数据端到端指标
A)网页首屏时延
B)网页打开成功率
C)视频平均播放卡顿次数
D)4G占网时长占比
答案:D
解析:
199.[单选题]什么是KDD?()
A)数据挖掘与知识发现
B)领域知识发现
C)文档知识发现
D)动态知识发现
答案:A
解析:
200.[单选题]Lasso回归与传统的线性回归最主要的区别是()
A)增加L1正则项
B)增加L2正则项
C)无区别
D)Lasso回归是线性方程在sigmoid函数上的嵌套
答案:A
解析:
201.[单选题]EXCEL中,求标准差的函数是()
A)AVERAGE
B)MEDIAN
OMODE
D)STDEV
答案:D
解析:
202.[单选题]以下指标中,与终端性能无关的指标是
A)http响应时延
B)TCP2、3次握手成功率
C)4G用户附着成功率
D)视频缓冲时长
答案:A
解析:
203.[单选题]在基本DBSCAN的参数选择方法中,点到它的K个最近邻的距离中的K选作为哪一个参数
()
A)Eps
B)MinPts
C)质心
D)边界
答案:B
解析:
204.[单选题]如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作()
A)极大匹配
B)二分匹配
C)完美匹配
D)极小匹配
答案:C
解析:
205.[单选题]Byte代表一个字节,及()的数值范围。
A)0^100
B)0~155
C)0~200
D)0~255
答案:D
解析:
206.[单选题]在事先不知道数据分类的情况下,根据数据之间的相似程度进行划分,目的是使得同类
别的数据对象之间的差别尽可能的小,不同类别的数据对象之间的差别尽可能的大。属于()
A)聚类
B)分类
C)预测
D)关联
答案:A
解析:
207.[单选题]在哪里能下载到hadoop软件
A)apache网站或者捐献给apache使用的公开服务器
B)oracle官网
C)hadoop公司官网
D)linux官网
答案:A
解析:
208.[单选题]检测一元正态分布中的离群点,属于异常检测中的基于
()的离群点检测
A)统计方法
B)邻近度
C)密度
D)聚类技术
答案:A
解析:
209.[单选题]MME附着用户数的指标来源是
A)网管系统
B)网优平台
C)集中性能平台
D)大数据平台
答案:A
解析:
210.[单选题]实现多项式回归时,数据需要进行多项式转换,其目的是()
A)数据进行升维
B)数据进行降维
C)数据有噪音
D)数据不够平滑
答案:A
解析:
211.[单选题]给定历史时间数据,通过拟合时序模型,分析研究时序数据的发展变化规律,得出观测数
据的历史统计特征,再据此进行外推预测目标的分析方法是()。
A)聚类;
B)回归
C)时间序列
D)汇总统计
答案:C
解析:
212.[单选题]DPI规范中,流量流向统计字段AppType=0x03代表()
A)所有流量
B)某个应用大类
C)某个应用小类
D)某个协议类别
答案:B
解析:
213.[单选题]朴素贝叶斯分类中得到条件概率的方法错误的是()。
A)对于定量属性,将取值离散化变为区间,再当做定性属性处理
B)对于定性属性,将转化为定量属性,再计算相应的概率
C)对于定量属性,假设变量服从某种概率分布,通过训练数据集估计分布的参数
D)对于定性属性,计算某一类别的样本中某种属性取该值的样本所占比例来近似
答案:B
解析:
214.[单选题]协同过滤算法解决的是数据挖掘中的哪类问题()
A)分类问题
B)聚类问题
C)推荐问题
D)自然语言处理问题
答案:C
解析:
215.[单选题]如果我使用数据集的全部特征并且能够达到100%的准确率,但在测试集上仅能达到
70%左右,这
说明()
A)欠拟合
B)模型很棒
C)过拟合
D)算法不好
答案:C
解析:
216.[单选题]通过(),计算频数、众数、中位数等一个或多个数据指标,探索数据的分布结构。
A)概率统计法
B)汇总统计法
C)可视化法
D)分类统计法
答案:B
解析:
217.[单选题]数据挖掘是从数据中发掘知识的过程,在这个过程中()可以作为挖掘工具,数据可
以被看作是土壤,云平台可以看作是承载数据和挖掘算法的基础设施。
A)锄头
B)数据库服务器
C)聚类分析
D)人工智能和数据库技术
答案:D
解析:
218.[单选题]下面哪个说法是不正确的?
A)一个HTML文档与BeautifulSoup对象等价
B)标签树上除了标签外,节点还可能是字符串(NavigableString)类型。
C)一个HTML文档与一个标签树等价
D)一个HTML文档可以包含多个标签树
答案:D
解析:题型:
219.[单选题]在TDLTE网络中,负责用户鉴权及密钥管理的网元是?
A)MME
B)SAEGateway
C)PDNGateway
D)HSS
答案:A
解析:
220.[单选题]可以对按城市汇总的销售数据进行(),来观察按国家总的数据。
A)上卷
B)下钻
C)切片
D)切块
答案:A
解析:
221.[单选题]关联规则的评价指标是:()。
A)均方误差、均方根误差
B)Kappa统计、显著性检验
C)支持度、置信度
D)平均绝对误差、相对误差
答案:C
解析:
222.[单选题]以下()不是影响聚类算法结果的主要因素。
A)已知类别的样本的质量
B)聚类结束条件
C)描述属性的选取
D)对象的相似性度量
答案:A
解析:
223.[单选题]以下哪些算法是基于规则的分类器()
A)C4.5
B)KNN
C)Naive
D)ANN
答案:A
解析:
224.[单选题]有关朴素贝叶斯分类算法的叙述中正确的是()
A)朴素贝叶斯分类算法是一种精确的分类算法
B)采用朴素贝叶斯分类算法将一个样本分到某个类别中,表示它100%属于该类别
C)朴素贝叶斯分类算法是一种基于概率的分类算法
D)以上都不对
答案:C
解析:
225.[单选题]协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些
用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(),并将这些用户喜欢的项
推荐给有相似兴趣的用户。
A)相似
B)相同
C)推荐
D)预测
答案:D
解析:
226.[单选题]使用离差平方和法聚类时,计算样品间的距离必须
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年瑞幸考试试题及答案
- 2025年双奥之城面试题及答案
- 2025年单招面试题及答案云南
- 2025年助产技术理论考试题及答案
- 2025年文化项目面试试题及答案
- 2025年工厂检验考试题及答案
- 2025年初中专业知识试题及答案
- 2025年期中统计学试题及答案
- 2025年糖栗子趣味测试题及答案
- 2025年幼儿教师大赛试题及答案
- 自动贩卖机方案
- 《茎和叶》名师课件
- 电网公司QC小组太阳能光伏发电降温增效装置的研制
- 混流式水轮发电机组导水机构A级检修作业指导书
- GB/T 15622-2023液压缸试验方法
- 110kV升压站构支架组立施工方案
- 2014年林产化工松香深加工行业分析报告
- 前厅月工作计划
- wav2lip-288的预训练模型
- 2023机场海关旅检岗位练兵练习试题及答案
- 沉淀滴定法-沉淀滴定法原理
评论
0/150
提交评论