版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
欧阳学创编欧阳学创编欧阳学创编欧阳学创编《探索大数据与人工智能》习题库时间:2021.03.03创作:欧阳学单选1、 SparkStreaming是什么软件栈中的流计算?A.SparkB.StormC.HiveD.Flume2、 下列选项中,不是大数据发展趣势的是?A.大数据分析的革命性方法出现B.大数据与与云计算将深度鬲虫合C.大数据一体机将陆续发布D.大数据未来可能会被淘汰3、 2011年5月是哪家全球知名咨询公司在《Bigdata:Thenextfrontierforinnovation,competitionandproductivity》研究报吿中指出,数据已经渗透到毎一个行业和业务职能之中,逐渐成为童要的生产因素的?A.比尔•思门B.麦肯锡C.扎克伯格D.乔图斯4、 以下哪个属于大数据在电信行业的数据商业彳匕方面的应用?A.耕准广告B.网络管理C.网络优化D.客服中心优化5、 以下哪个不属于大数据在电信行业的应用?A.数据商业化B.物流网络C.企业运营D.客户关系管理6、 2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责全面推进“数据分享平台"战略,并推出大型的数据分享平台。A.首席数据官B.首席科学家C.首席执行官D.首席架构师7、 下列选项中,不是kafka适合的应用场景是?A.日志收集B.消息系统C.业务系统D.流式处理8、 下列选项中,哪个不是HBASE的特点?A.面向行B.多版本C.扩展性D.稀疏性9、 在数据量一定的情况下,MapReduce是一个线性可扩展模型,请问服务器数量与处理时间是什么关系?数量越多处理时间越长B.数量越多处理时间越短数量越小处理时间越短D.没什么关系10、 在Spark的软件栈中,用于机器学习的是a.SparkStreamingB.MllibC.GraphXD.SparkSQL11、 Spark是在哪一年开源的?a.1980B.2010C.1990D.200012、 大数据的多样性丁吏耀数据披分为三种数据结构,那么以下不是三种数据结构之一的是?A结构化数据B.非结构化数据C.半结构化数据D.全结构化数据13、 自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B.语言歧义性C.知识依赖D.语境14、语音识别常用的应用有四个,下列不是常用应用的是?A.聊天B.拨号C.导航D.设备控制25、 以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D.自由学习26、 机器学习研究如诃通过计算的手段,利用经验来改善系统自身的9生育邑,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D.报表17、总体来说,人工智能发展的未来趋势是?A.上升B.下降C.不动D.大幅度下降28、 中国移动自主研发、发布的首个人工智矣巨平台叫做()a.九天B.OneNETC.移娃D.大云29、 以下数据单位从小到大排列的顺序是?a.GB、B、KBB.B、KB、MBC.KB、ZB、PBD.B.MB、KB20、 以下数据单位换算错误的是?a.1KB=1O24BB.1GB=1024MBC.1TB=1000GBD.1MB=1O24KB21、 以下不是非结构化数据的项是?a.图片B.音频C.数据库二维表数据D.视频22、 整个MapReduce的过程大致分为Map、Shuffle、Combine、()?a.ReduceB.HashC.CleanD.Loading23、 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?a.AlB.BIC.ALD.AF24、 下列选项中,哪项是由谷歌开发的人工智能算法框架?a.KafkaB.TensorflowC.CaffeD.Torch25、 BP神经网络的学习规则是?a.梯度上升法B.梯度下降法C.梯度提升法D.梯度曲线法26、 语音识别产品体系有四部分,下列哪项不是体系之一?A.语音合成B.语音播放C.语音识别D.语义理解27、 数据生态中,算法模型分为两代,那么笫一代算法模型是?a.TezB.SparkC.PigD.MapReduce28、 Spark是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小但是计算密集度较大的场合,受益就相对较小;A.内存B.硬盘C.石玆帯D.显卡29、 下列选项中,哪项是分布式文件存储系统?a.HDFSB.FlumeC.KafkaD.Zookeeper30、 工信部官网正式发布大数据产业"十三五“发展规划是在哪一年?a.1987B.1997C.2007D.20173[、学习没有标签的数据集的机器学习方法是?A.监督学习B.无监替学习C.半监督学习D.强化学习32、 当前世界产生的数据总量的单位是?a.KBB.ZBC.GBD.TB33、 下列选项中正确说明价值密度低的是?A.l00TB数据中有50TB有效数据B.1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D.10EB数据中有10EB有效数据34、 中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。A.楙灵B.阿尔法蛋C.小度D.移娃35、 IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。a.AlphaGoB.深蓝C.图灵机模型D.深度学习机器人36、 在HDFS中存在NameNode、DataNodeClient,而NameNode是管理者,DataNode是文件存储者,那么Client是什么呢?a.连接器B.客户端C.接口提供者D.数据采集37mapreduce计算模型适用于哪种任务?A.多线程处理B.有关耳关的行处理C.批处理D.实时数据变化处理38、 大数据特征有几种(不包括IBM提出的新特征)?A」B.2C.3D.439、 Hadoop是()年诞生的?A.1985-1985B.1995-1996C.2005-2006D.2015-201640、 以下哪个不属于大数据在电信行*业的数据商业T匕方面的应用?A.精准广告B.网络管理C.营销洞察D.大数据检测和决策41、 传统的机器学习方法包括监替学习、无监替学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A.给定标签B.离散C.分类D.回归42、 下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配宣数据源C.不能使用文件系统D.不能使用目录方式43、 IBM提出的大数据5V特征包括()、更快(Velocity).更多(Variety)、更值钱(Value)和更真实(Veracity)a.更有效B.更大(Volume)C.更充分D.更直观44、 下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D.单机计算45、 Flume采用了三层架构,分别为agent,collector口()a.MapB.storageC.ShuffleD.Hash46、 HBASE的特点不包括?A.面向列B.稀疏性C.多版本D.低可靠性47、 mapreducevf算模型适用于哪种任务?A.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理4&最初的大数据概念还比较模糊,只是隐约的知道像个性化推荐、搜索弓I擎之类的处理需理需要大量数据,那么在搜索弓I擎方面,谁是世界上最大的厂商?A.谷歌B.百度C.360D.bing49、 今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可育邑会产生理论级别的突破。而哪项技术将继续成为大数据智能分析的核心技术?A.机器学习B.智能物流C.脑科学D.智能终端50、 下列选项中,正确描述Flume对数据源的支持的是?A.只能使用HDFS数据源B.可以配宣数据源C.不能使用文件系统D.不能使用目录方式51、 HBASE的特点不包括哪些?A.面向行B.稀疏性C.多版本D.高可靠性52、 下列选项中,不是用于数据存储的技术是哪一个?a.MongoDBB.MySQLC.HDFSD.Java53、 属于“人造智能”,具有意识,达到或超越人类智葱水平的人工智能称为()A.高人工智能B.低人工智能C.强人工智能D.弱人工智能54、 下列选项中,不是人工智能的基础设施的是?A.CPU服务器B.GPU服务器C.专用芯片D.游戏显卡54、 以下不是大数据特征的是?A.数据体量大B.数据种类多C.价值密度髙D.处理速度快55、 以下应用没有使用你的地理位宣信息的是?A.美团B.滴滴C.高徳地图D.word56、 下列选项中,不是Flume的特点的是?A.可靠性B.集中式架构C.可扩展性D.可管理性57、 在Spark的软件栈中,用于交互式查询的是a.SparkSQLB.MllibC.GraphXD.SparkStreaming58、 下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析D单机计算59、 人工智能、机器学习、深度学习的包含关系是()A.机器学习〉深度学习>人工智能B.人工智能〉深度学习〉机器学习C.人工智能〉机器学习>深度学习D.深度学习〉人工智能〉机器学习60、 自然语言处理难点目前有四大类,下列选项中不是其中之一的是?A.机器性能B.语言歧义性C.知识依赖D.语境61、 BP神经网络模型拓扑结构不包括A.输入层B.隐层C.输出层D.显层62、 以下哪个不是语音识别的范畴?A.语音听写B.语音合成C.语音转写D.语音唤醍63、 AlphaGo是笫一个击败人类职业()选手的人工智能程序。A.国际象棋B.田棋C.中国象棋D.五子棋64、 随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模式,向着什么靠拢?A.闭源B.开源C.独立D.封闭65、 “大数据”是需要新处理模式才能具有更强的决菜力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信息资产。A.海量B.少数C.小量D.结构化66、 SparkStreaming是什么软件栈中的流计算?A.SparkB.StormC.HiveD.Flume67、 客月艮中丿《是运营商和客户扌妾鬲虫较为频繁的通道,我们可以利用()在后端给客服中心恣立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。A.大数据技术B.客户画像C.客户状态D.客户心情67、 下列选项中正确说明价值密度低的是?A.lOOTB数据中有50TB有效数据B.1TB数据中有1KB有效数据C.100PB数据中有100PB有效数据D.10EB数据中有10EB有效数据68、 学习没有标签的数据集的机器学习方法是?A.监替学习B.无监督学习C.半监督学习D.强化学习69、 当前世界产生的数据总量的单位是?a.KBB.ZBC.GBD.TB70、 对抗学习中两个网络互相竞争,一个负责生成样本,那么另一个负责做什么?A.判别样本B.计算样本C.统计样本D.生成样本71、 hdfs中namenode的metadata的作用是?a.描述数据的存储位宣等属性B.存储数据C.调度数据72、 rdd是由多个什么组成?a.partitionputerc.actiond.transformation73、 IBM提出的大数据5V特征包括更大(Volume).更快(Velocity)、更多(Variety)、更值钱(Value)和()a.更有效B.更充分C.更真实(Veracity)D.更直观74、 在Spark的软件栈中,用于流计算的是?a.GraphXB.MllibC.SparkStreamingD.SparkSQL75、 以下数据量可以称为大数据的是?a.100MBB.100KBC.100PBD.100MB76、 学习没有标签的数据集的机器学习方法是?A.监督学习B.无监替学习C.半监督学习D.强化学习77、 大数据的数据来源于方方面面,下列不可以作为数据源的是?a.APP应用B.地理信息C.一块石头D.商店订单78、 数据采集的基本步骤(ETL)中不包括哪项?A.抽取转换B.加载C.计算79、 整个MapReduce的过程大致分为Map、Shuffle、Combine、()?A.ReduceB.HashC.CleanD.Loading80、 人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?A.图片识别B.语音识别C.自动驾驶D.消费金融81、 “大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应()、高增长率和多样化的信岚资产。A.海量B.少数C.小量D.结构化82、 Hadoop2系列版本中默认的HDFS的block是多大?A.32MBB.64MBC.128MBD.16MB83、 以下哪个场景可以称为大数据场景?a.故宫游客人数B.故宫门票收入C.美团APP的定位信息D.文章内容84、 下列选项中,不是人工智能的算法中的学习方法的是?A.堇复学习B.深度学习C.迁移学习D.对抗学习85、 以下哪个不属于大数据在电信行业的数据商业f匕方面的应用?A.精准广吿B.网络管理C.营销洞察D.大数据检测和决策86、 在Spark的软件栈中,用于图计算的是()A.SparkStreamingB.MllibC.GraphXD.SparkSQL多选1、 自然语言处理需要解决的难点有哪些?A.语言歧义性B.语言鲁棒性C.知识依赖D.语境2、 人工智能目前在以下哪三个领域有了长足的发展?A.健康B.教育C.探索太空D.理财3、 下列选项属于人工智能的基本概念有:A.机器学习B.深度学习C.BP神经网络D.卷积神经网络4、 大数据的业务应用处理需要经过哪些流程?A.数据采集B.数据清洗C.数据理模D.数据加工5、 在数据清洗的过程中,总共可以归为三个阶段,它们分别是?A.数据加工B.数据质量C.数据校对D.数据标准化6、 麦肯锡全球研究所对大数据的定义是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范田的数据集合,具有以下哪些特征?A.海量的数据规模B.快速的数据流转C.多样的数据类型D.价值密度低7、 人工智能关键技术框架主要包括哪两层?A.基础设施B.算法C.技术D.人员8、 大数据应用领域成就有哪些?A.金融B.互联网电子商务C.工业生产D.没有明显成就9、 以下哪些属于大数据在电信行业的应用?A.网络管理和优化B.数据商业化C.客户关系管理D.企业运营管理20、以下哪两个属于大数据特征?A.数据体量大B.价值密度高C.数据种类多D.处理速度慢ir在WE电信领域,大数据可披应用到的以下哪些方面?A.公共安全B.无明显应用C.智能运输D.智能建筑12、 HBASE的特点不包括哪两项?A.面向行B.稠密性C.多版本D.高可靠性13、 那么下列哪些技术适合流处理?a.SparkStreamingB.StormC.HbaseD.MapReduce24、以下哪两项是人工智能发展的标志性产品?A.深蓝B.alphagoC.智能门禁D.智能手机25、 丁吏用有监替学习的问题可以被分为哪两类?A.回归问题B.抽样问题C.聚类问题D.分类问题26、 HDFS在哪些场景中表现很差?A.大量小文件B.随机读取C.修改文件D.存储和管理PB级别数据27、 世界经济论坛以“大数据的回报与风险"主题发布了《全球信岚技术报告(第13版)》,通过该报吿,各国政府逐渐认识到大数据在哪些方面有童大意义?A.推动经济发展B.改苦公共服务C.增进人民福祉D.保障国家•安全18、 电信行业的网络管理和优f匕包含了两部分的优f匕,下列选项中不在这两项优化之内的是?A.基础设施建设的优化B.网络速度的优化C.并发性的优化D.网络运营管理及优化19、 通过地理位宣信息可以分析出哪些信息?A.颜值B.家庭住址C.工作地址D.体童20、 人工智能按照发展层级划分可以分为哪三层?A.计算智能B.感知智能C.认知智能D.人工智能21、 T吏用有监替学习的问题可以被分为哪两类?A.回归问题B.抽样问题C.聚类问题D.分类问题22、 Flume采用了三层架构,每一层均可以水平扩展,它们分别是?a.agentB.collectorC.storageD.source23、 人工智能的技术方向一共有三种,他们分别是?A.语音识别B.计算机视觉C.自然语言D.复杂编程24、 Spark适用于那些场景?A.计算量大B.数据量大C.效率要求高D.CRM系统业务受理25、 关于RDD,说法正确的两项是?a.RDD不能由多个分区(partition)组成B.弹性、集中式内存集C.RDD能生成childrenRDDD.是一个容错的、并行的数据纟吉构26、 业务运营监控,可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情况?A.网络B.业务C.气候D.用户27、 Yarn架构在Hadoop生态圈中有哪些作用?A.资源分配B.调度C.保证协同D.计算数据28、 以下数据量不能说成大数据的是?A」00MBB.1000KBC.100PBD.1EB29、 自动驾驶中的人工智矣邑技术包扌舌下面哪三项?A.环境感知B.行为决茉C.运动控制D.温度控制30、 以下用到语音识别技术的应用包括:a.苹果手机SiriB.微信C.百度地图D.word31、 监督学习的回归方法包括:A.线性回归B.逻辑回归C.多项式回归D.单一回归32、 人工智矣邑技术的基础设施不包括哪两部分?A.系统应用B.机器学习算法C.基础硬件D.算法框架33、 HDFS适用于哪些场景?A.大量小文件B.存储和管理PB级别数据C.一次写入,多次读取D.低延迟读取34、 自然语言处理的主要难点不包括以下哪两项:A.语言独立性B.语言歧义性C.多国语言D.语境35、 以下哪两个属于大数据特征?A.数据体量大B.价值密度高C.数据种类多D.处理速度慢36、 以下应用使用了你的地理位宣信息的是?a.滴滴B.百度地图C.wordD.excel37、 BP神经网络模型拓扑结构包括()、()和输出层(OUtpUtlayer)oa.输入层(input)B.隐层(hiddenlayer)C.卷积层(convolutionallayer)D.池化层(poolinglayer)38、 自动驾驶中的人工智矣岂技术包括下面哪三项?A.环境感知B.行为决策C.运动控制D.温度控制39、 数据恣模目前有两种比较通用的方式,分别是?A.通用建模B.专属建模C.范式理模D.维度寒模40、 下列选项中,是大数据发展趋势的是?开源大数据商业彳匕进一步深彳匕B.打包的大数据行业分析应用开拓新市场大数据细分市场规模进一步增大D.大数据推动公司并购的规模和数量进一步提升41、 2010年12月,工信部发布的物联网十二五规划上,把信息处理技术作为4项关键技术创新工程之一披提出来,其中包括了哪些大数据的童要组成技术?A.海量数据存储B.数据挖掘C.图像视频智能分析D.python42、 在人工智芳邑发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什么?A.运算力不足B.人员不足C.技术瓶颈D.费用太高43、 电信行业的网络管理和优彳匕包含了两部分的优彳匕,这两项优化是?A.基础设施建设的优化B.网络速度的优化C.并发性的优化D.网络运营管理及优彳匕44、 人工智矣邑技术的基础设施不包括哪两部分?A.系统应用B.机器学习算法C.基础硬件D.算法框架45、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024购销合同锦集
- 2024钢筋采购合同范本
- 2025年度离婚后房产共有权处理协议3篇
- 2024消防整改工程环保合规性审查及整改协议3篇
- 2024年高端餐饮经营管理转让合同
- 2025年度生态农业园区草坪除草与农产品质量安全合同3篇
- 2025年度绿色建筑节能改造补充施工合同范本3篇
- 2024年高端医疗服务合同的服务内容
- 2025年度智慧能源管理系统承包经营合同范本3篇
- 2024年高校毕业生就业协议
- 第2课 各种各样的运动(说课稿)-2023-2024学年三年级下册科学教科版
- 北京2025年首都医科大学附属北京友谊医院招聘140人历年参考题库(频考版)含答案解析
- 股权质押权借款合同模板
- 《工商管理专业毕业实习》课程教学大纲
- 代理记账有限公司简介(5个范本)
- 云南省就业创业失业登记申请表
- 油气储存企业安全风险评估指南(试行)
- UL_标准(1026)家用电器中文版本
- 快速了解陌生行业的方法论及示例PPT课件
- 南京邮电大学通达学院学生成绩复核申请表
- GIS设备带电补气作业指导书QXL2015
评论
0/150
提交评论