《探索大数据与人工智能》习试题库完整_第1页
《探索大数据与人工智能》习试题库完整_第2页
《探索大数据与人工智能》习试题库完整_第3页
《探索大数据与人工智能》习试题库完整_第4页
《探索大数据与人工智能》习试题库完整_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、探索大数据与人工智能习题库单选1、Spark Streaming 是什么软件栈中的流计算?A Spark B Storm C Hive D Flume2、下列选项中,不是大数据发展趋势的是?A 大数据分析的革命性方法出现 B 大数据与与云计算将深度融合C 大数据一体机将陆续发布 D 大数据未来可能会被淘汰3、2011 年 5 月是哪家全球知名咨询公司在 Big data: The next frontier for innovation, competition and productivity 研究报告中指出,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A 比尔恩门 B

2、 麦肯锡 C 扎克伯格 D 乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用?A 精准广告 B 网络管理C 网络优化 D 客服中心优化5、以下哪个不属于大数据在电信行业的应用?A 数据商业化 B 物流网络 C 企业运营D 客户关系管理6、2012 年 7 月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台”战略,并推出大型的数据分享平台。A 首席数据官 B 首席科学家C 首席执行官 D 首席架构师7、下列选项中,不是 kafka 适合的应用场景是?A 日志收集 B 消息系统 C 业务系统 D流式处理8、下列选项中,哪个不是 HBASE 的特点?A

3、面向行 B 多版本 C 扩展性 D 稀疏性9、在数据量一定的情况下,MapReduce 是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?A 数量越多处理时间越长 B 数量越多处理时间越短B 数量越小处理时间越短 D没什么关系10、在 Spark 的软件栈中,用于机器学习的是A Spark Streaming B Mllib C GraphX DSparkSQL11、Spark 是在哪一年开源的?A 1980 B 2010 C 1990 D 200012、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之一的是? A 结构化数据 B 非结构化数据 C 半结构化数据 D

4、 全结构化数据13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A 机器性能 B 语言歧义性 C 知识依赖 D 语境14、语音识别常用的应用有四个,下列不是常用应用的是?A 聊天 B 拨号 C 导航 D 设备控制15、以下哪种学习方法不属于人工智能算法?A迁移学习 B 对抗学习 C 强化学习 D自由学习16、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A 模型 B 表结构 C 结果 D 报表17、总体来说,人工智能发展的未来趋势是?A 上升 B 下降 C 不动 D 大幅度下降18、中国移动自主研发、发布的首个人工智能平台叫做()A

5、 九天 B OneNET C 移娃 D大云19、以下数据单位从小到大排列的顺序是?A GBBKB B BKBMB C KBZBPB DBMBKB20、以下数据单位换算错误的是?A 1KB=1024B B 1GB=1024MB C 1TB=1000GB D 1MB=1024KB21、以下不是非结构化数据的项是?A 图片 B 音频 C 数据库二维表数据 D 视频22、整个 MapReduce 的过程大致分为 Map、Shuffle、Combine、()?A Reduce B Hash C Clean D Loading23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系

6、统的一门新的技术科学,请问它的英文缩写是?A AI B BI C AL D AF24、下列选项中,哪项是由谷歌开发的人工智能算法框架?A Kafka B Tensorflow C Caffe DTorch25、BP 神经网络的学习规则是?A 梯度上升法 B 梯度下降法 C 梯度提升法 D 梯度曲线法26、语音识别产品体系有四部分,下列哪项不是体系之一?A 语音合成 B 语音播放 C 语音识别 D 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A Tez B Spark C Pig DMapReduce28、Spark 是基于什么的迭代计算框架?它适用于需要多次操作特定数据集

7、的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A 内存 B 硬盘 C 磁带 D 显卡29、下列选项中,哪项是分布式文件存储系统?A HDFS B Flume C Kafka D Zookeeper30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?A 1987 B 1997 C2007 D 201731、学习没有标签的数据集的机器学习方法是?A 监督学习 B 无监督学习 C 半监督学习 D 强化学习32、当前世界产生的数据总量的单位是?A KB B ZB C GB D TB33、下列选项中正确说明价值密度低的是

8、?A100TB 数据中有 50TB 有效数据 B 1TB 数据中有 1KB 有效数据C100PB 数据中有 100PB 有效数据 D 10EB 数据中有 10EB 有效数据34、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。A 精灵 B 阿尔法蛋 C 小度 D 移娃35、IBM 的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。A AlphaGo B 深蓝C 图灵机模型 D 深度学习机器人36、在 HDFS 中存在 NameNode、DataNode、Client,而 NameNode 是管理者,DataNode是文件存

9、储者,那么 Client 是什么呢?A 连接器 B 客户端 C 接口提供者 D 数据采集37、mapreduce 计算模型适用于哪种任务?A 多线程处理 B 有关联的行处理 C 批处理 D 实时数据变化处理38、大数据特征有几种(不包括 IBM 提出的新特征)?A1 B2 C3 D439、Hadoop 是()年诞生的?A1985-1985 B1995-1996 C2005-2006 D2015-201640、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A 精准广告 B网络管理 C营销洞察 D大数据检测和决策41、传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学

10、习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A 给定标签 B离散 C分类 D回归42、下列选项中,正确描述 Flume 对数据源的支持的是?A 只能使用 HDFS 数据源 B可以配置数据源 C不能使用文件系统 D不能使用目录方式43、IBM 提出的大数据 5V 特征包括()、更快(Velocity)、更多(Variety)、更值钱(Value)和更真实(Veracity)A 更有效 B更大(Volume C更充分 D更直观44、下列选项中,不是大数据的一部分的是?A海量计算 B大量数据管理 C数据分析 D单机计算45、Flume 采用了三层架构,分别为 ag

11、ent,collector 和()A Map Bstorage CShuffle DHash46、HBASE 的特点不包括?A面向列 B稀疏性 C多版本 D低可靠性47、mapreduce 计算模型适用于哪种任务?A多线程处理 B 有关联的行处理 C 批处理 D实时数据变化处理48、最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商?A 谷歌 B 百度 C 360 D bing49、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会产生理论级别的突破。而哪项技术将继续成为大数据智能分析的核心技术

12、?A 机器学习 B 智能物流 C 脑科学 D 智能终端50、下列选项中,正确描述 Flume 对数据源的支持的是?A 只能使用 HDFS 数据源 B 可以配置数据源 C 不能使用文件系统 D 不能使用目录方式51、HBASE 的特点不包括哪些?A 面向行 B 稀疏性 C 多版本 D 高可靠性52、下列选项中,不是用于数据存储的技术是哪一个?A MongoDB B MySQL C HDFS D Java53、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工智能称为()A 高人工智能 B 低人工智能 C 强人工智能 D 弱人工智能54、下列选项中,不是人工智能的基础设施的是?A CPU 服

13、务器 B GPU 服务器 C 专用芯片D 游戏显卡54、以下不是大数据特征的是?A 数据体量大 B 数据种类多 C 价值密度高 D 处理速度快55、以下应用没有使用你的地理位置信息的是?A美团 B 滴滴 C 高德地图 D word56、下列选项中,不是 Flume 的特点的是?A 可靠性 B 集中式架构 C 可扩展性 D 可管理性57、在 Spark 的软件栈中,用于交互式查询的是A SparkSQL B Mllib C GraphX D Spark Streaming58、下列选项中,不是大数据的一部分的是?A 海量计算 B 大量数据管理 C 数据分析 D 单机计算59、人工智能、机器学习、

14、深度学习的包含关系是()A 机器学习深度学习人工智能 B 人工智能深度学习机器学习C人工智能机器学习深度学习 D 深度学习人工智能机器学习60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A 机器性能 B 语言歧义性 C 知识依赖 D 语境61、BP 神经网络模型拓扑结构不包括A输入层 B 隐层 C 输出层 D 显层62、以下哪个不是语音识别的范畴?A 语音听写 B 语音合成 C 语音转写 D 语音唤醒63、Alpha Go 是第一个击败人类职业()选手的人工智能程序。A 国际象棋 B 围棋 C 中国象棋 D 五子棋64、随着闭源软件在数据分析领域的地盘不断缩小,老牌 IT 厂商

15、正在改变商业模式,向着什么靠拢?A 闭源 B 开源 C 独立 D 封闭65、“大数据”是需要新处理模式才能具有更强的决策力 、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。A 海量 B 少数 C 小量 D 结构化66、Spark Streaming 是什么软件栈中的流计算?A Spark B Storm C Hive D Flume67、客服中心是运营商和客户接触较为频繁的通道 ,我们可以利用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。A 大数据技术 B 客户画像 C 客户状态 D 客户心情67、下列选项中正确说明价值密度低的是?A100T

16、B 数据中有 50TB 有效数据 B 1TB 数据中有 1KB 有效数据C100PB 数据中有 100PB 有效数据 D 10EB 数据中有 10EB 有效数据68、学习没有标签的数据集的机器学习方法是?A 监督学习 B 无监督学习 C 半监督学习 D 强化学习69、当前世界产生的数据总量的单位是?A KB B ZB C GB D TB70、对抗学习中两个网络互相竞争,一个负责生成样本,那么另一个负责做什么?A 判别样本 B 计算样本 C 统计样本 D 生成样本71、hdfs 中 namenode 的 metadata 的作用是?A 描述数据的存储位置等属性 B存储数据 C调度数据72、rdd

17、 是由多个什么组成?a. partition puter c.action d.transformation73、IBM 提出的大数据 5V 特征包括更大(Volume)、更快(Velocity)、更多(Variety)、更值钱(Value)和()A 更有效 B 更充分 C 更真实(Veracity) D 更直观74、在 Spark 的软件栈中,用于流计算的是?A GraphX B Mllib C Spark Streaming D SparkSQL75、以下数据量可以称为大数据的是?A 100MB B 100KB C 100PB D 100MB76、学习没有标签的数据集的机器学习方

18、法是?A 监督学习 B 无监督学习 C 半监督学习 D 强化学习77、大数据的数据来源于方方面面,下列不可以作为数据源的是?A APP 应用 B 地理信息C 一块石头 D 商店订单78、数据采集的基本步骤(ETL)中不包括哪项?A 抽取转换 B 加载 C 计算79、整个 MapReduce 的过程大致分为 Map、Shuffle、Combine、()?A Reduce B Hash C Clean D Loading80、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?A 图片识别 B 语音识别 C 自动驾驶 D 消费金融81、“大数据”是需要新处理模式才能具有更强的决策力 、洞察发

19、现力和流程优化能力来适应()、高增长率和多样化的信息资产。A 海量 B 少数 C 小量 D 结构化82、Hadoop2 系列版本中默认的 HDFS 的 block 是多大?A 32MB B 64MB C 128MB D 16MB83、以下哪个场景可以称为大数据场景?A 故宫游客人数 B故宫门票收入 C美团 APP 的定位信息 D文章内容84、下列选项中,不是人工智能的算法中的学习方法的是?A 重复学习 B深度学习 C迁移学习 D对抗学习85、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A 精准广告 B网络管理 C营销洞察 D大数据检测和决策86、在Spark的软件栈中,用于图计算的是

20、()ASpark StreamingBMllibC GraphXDSparkSQL多选1、自然语言处理需要解决的难点有哪些?A 语言歧义性 B 语言鲁棒性 C 知识依赖 D语境2、人工智能目前在以下哪三个领域有了长足的发展?A 健康 B 教育 C 探索太空 D 理财3、下列选项属于人工智能的基本概念有:A 机器学习 B 深度学习 C BP 神经网络 D卷积神经网络4、大数据的业务应用处理需要经过哪些流程?A 数据采集 B 数据清洗 C 数据建模 D数据加工5、在数据清洗的过程中,总共可以归为三个阶段,它们分别是?A数据加工 B 数据质量C 数据校对 D 数据标准化6、麦肯锡全球研究所对大数据的

21、定义是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有以下哪些特征?A 海量的数据规模 B 快速的数据流转 C 多样的数据类型 D 价值密度低7、人工智能关键技术框架主要包括哪两层?A 基础设施 B 算法 C 技术 D 人员8、大数据应用领域成就有哪些?A 金融 B 互联网电子商务 C 工业生产 D 没有明显成就9、以下哪些属于大数据在电信行业的应用?A 网络管理和优化 B 数据商业化 C 客户关系管理 D 企业运营管理10、以下哪两个属于大数据特征?A 数据体量大 B 价值密度高 C 数据种类多 D 处理速度慢11、在非电信领域,大数据可被应用到的

22、以下哪些方面?A 公共安全 B 无明显应用 C 智能运输 D 智能建筑12、HBASE 的特点不包括哪两项?A 面向行 B 稠密性 C 多版本 D 高可靠性13、那么下列哪些技术适合流处理?A Spark Streaming B Storm C Hbase D MapReduce14、以下哪两项是人工智能发展的标志性产品?A 深蓝 B alphago C 智能门禁 D 智能手机15、使用有监督学习的问题可以被分为哪两类?A 回归问题 B 抽样问题 C 聚类问题 D分类问题16、HDFS 在哪些场景中表现很差?A 大量小文件 B 随机读取 C 修改文件 D 存储和管理 PB 级别数据17、世界经

23、济论坛以“大数据的回报与风险”主题发布了全球信息技术报告(第 13 版),通过该报告,各国政府逐渐认识到大数据在哪些方面有重大意义?A 推动经济发展 B 改善公共服务 C 增进人民福祉 D 保障国家安全18、电信行业的网络管理和优化包含了两部分的优化 ,下列选项中不在这两项优化之内的是?A 基础设施建设的优化 B 网络速度的优化 C 并发性的优化 D 网络运营管理及优化19、通过地理位置信息可以分析出哪些信息?A 颜值 B 家庭住址 C 工作地址 D 体重20、人工智能按照发展层级划分可以分为哪三层?A 计算智能 B 感知智能 C 认知智能D 人工智能21、使用有监督学习的问题可以被分为哪两类

24、?A 回归问题 B 抽样问题 C 聚类问题 D分类问题22、Flume 采用了三层架构,每一层均可以水平扩展,它们分别是?A agent B collector C storage D source23、人工智能的技术方向一共有三种,他们分别是?A 语音识别 B计算机视觉 C自然语言 D复杂编程24、Spark 适用于那些场景?A 计算量大 B数据量大 C效率要求高 DCRM 系统业务受理25、关于 RDD,说法正确的两项是?A RDD 不能由多个分区(partition)组成 B弹性、集中式内存集C .RDD 能生成 childrenRDD D是一个容错的、并行的数据结构26、业务运营监控,

25、可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情况?A 网络 B业务 C气候 D用户27、Yarn 架构在 Hadoop 生态圈中有哪些作用?A 资源分配 B调度 C保证协同 D计算数据28、以下数据量不能说成大数据的是?A100MB B1000KB C100PB D1EB29、自动驾驶中的人工智能技术包括下面哪三项?A 环境感知 B行为决策 C运动控制 D温度控制30、以下用到语音识别技术的应用包括:A 苹果手机 Siri B微信 C百度地图 Dword31、监督学习的回归方法包括:A 线性回归 B逻辑回归 C多项式回归 D单一回归32、人工智能技术的基础设施不包括哪两部分?A

26、 系统应用 B 机器学习算法 C 基础硬件 D 算法框架33、HDFS 适用于哪些场景?A 大量小文件 B 存储和管理 PB 级别数据 C 一次写入,多次读取 D 低延迟读取34、自然语言处理的主要难点不包括以下哪两项:A 语言独立性 B 语言歧义性 C 多国语言 D 语境35、以下哪两个属于大数据特征?A 数据体量大 B 价值密度高 C 数据种类多 D 处理速度慢36、以下应用使用了你的地理位置信息的是?A 滴滴 B 百度地图 C word D excel37、BP 神经网络模型拓扑结构包括()、()和输出层(output layer)。A 输入层(input) B隐层(hidden lay

27、er) C 卷积层(convolutional layer) D 池化层(pooling layer)38、自动驾驶中的人工智能技术包括下面哪三项?A 环境感知 B 行为决策 C 运动控制D 温度控制39、数据建模目前有两种比较通用的方式,分别是?A 通用建模 B 专属建模 C 范式建模D 维度建模40、下列选项中,是大数据发展趋势的是?A 开源大数据商业化进一步深化 B 打包的大数据行业分析应用开拓新市场B 大数据细分市场规模进一步增大 D 大数据推动公司并购的规模和数量进一步提升41、2010 年12 月,工信部发布的物联网十二五规划上,把信息处理技术作为4 项关键技术创新工程之一被提出来,其中包括了哪些大数据的重要组成技术?A 海量数据存储 B 数据挖掘 C 图像视频智能分析 D python42、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什么?A 运算力不足 B人员不足 C技术瓶颈 D费用太高43、电信行业的网络管理和优化包含了两部分的优化,这两项优化是?A基础设施建设的优化 B网络速度的优化 C并发性的优化 D网络运营管理及优化44、人工智能技术的基础设施不包括哪两部分?A 系统应用 B 机器学习算法 C 基础硬件 D

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论