版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《探索大数据与人工智能》题库《探索大数据与人工智能》题库/《探索大数据与人工智能》题库《探究大数据与人工智能》习题库一、 单项选择题1、SparkStreaming 是什么软件栈中的流计算 ?A.SparkB.StormC.HiveD.Flume2、以下选项中,不是大数据发展趋向的是 ?A.大数据剖析的革命性方法出现B.大数据与与云计算将深度交融C.大数据一体机将陆续公布D.大数据将来可能会被裁减3、2011年5月是哪家全世界著名咨询公司在《Bigdata:Thenextfrontierforinnovation,competitionandproductivity》研究报告中指出,数据已经浸透到每一个行业和业务职能之中,渐渐成为重要的生产要素的?A.比尔·恩门B.麦肯锡C.扎克伯格D.乔图斯4、以下哪个属于大数据在电信行业的数据商业化方面的应用 ?A.精确广告B. 网络管理C.网络优化D. 客服中心优化5、以下哪个不属于大数据在电信行业的应用 ?A.数据商业化B. 物流网络C. 公司营运D.客户关系管理6、2012年7月,为发掘大数据的价值,阿里巴巴公司在管理层建立()一职,负责全面推动“数据分享平台”战略,并推出大型的数据分享平台。A.首席数据官B. 首席科学家C.首席履行官D. 首席架构师7、以下选项中,不是kafka合适的应用途景是?A.日记采集B. 信息系统C. 业务系统D.流式办理8、以下选项中,哪个不是HBASE的特色?A.面向行B. 多版本C. 扩展性D. 稀少性9、在数据量必定的状况下,MapReduce是一个线性可扩展模型,请问服务器数目与办理时间是什么关系?A.数目越多办理时间越长B.数目越多办理时间越短B.数目越小办理时间越短D.没什么关系10、在Spark的软件栈中,用于机器学习的是A.SparkStreamingB. Mllib 11、Spark是在哪一年开源的?A.1980B. 2010C.1990D.200012、大数据的多样性使得数据被分为三种数据构造 ,那么以下不是三种数据构造之一的是?A构造化数据B. 非构造化数据C. 半构造化数据D. 全构造化数据13、自然语言办理难点目前有四大类 ,以下选项中不是此中之一的是 ?A.机器性能B. 语言歧义性C. 知识依靠D. 语境14、语音辨别常用的应用有四个 ,以下不是常用应用的是?A.聊天B. 拨号C. 导航D. 设备控制15、以下哪一种学习方法不属于人工智能算法 ?A.迁徙学习B. 抗衡学习C. 加强学习D.自由学习16、机器学习研究怎样经过计算的手段,利用经验来改良系统自己的性能,请问机器学习利用数据训练出什么?A.模型B. 表构造C. 结果D. 报表17、整体来说,人工智能发展的将来趋向是 ?A.上涨B. 降落C. 不动D. 大幅度降落18、中国挪动自主研发、公布的首个人工智能平台叫做 ()A.九天B.OneNETC. 移娃D.大云19、以下数据单位从小到大摆列的次序是 ?A.GB、B、KBB.B、KB、MBC.KB、ZB、、MB、KB20、以下数据单位换算错误的选项是 ?A.1KB=1024BB.1GB=1024MBC.1TB=1000GBD.1MB=1024KB21、以下不是非构造化数据的项是 ?A.图片B. 音频C. 数据库二维表数据 D. 视频22、整个MapReduce的过程大概分为 Map、Shuffle、Combine、()?A.ReduceB.HashC.CleanD.Loading23、人工智能是研究、开发用于模拟、延长和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,请问它的英文缩写是?A.AIB.BIC.ALD.AF24、以下选项中,哪项是由谷歌开发的人工智能算法框架 ?A.KafkaB. Tensorflow 25、BP神经网络的学习规则是?A.梯度上涨法B. 梯度降落法 C.梯度提高法D. 梯度曲线法26、语音辨别产品系统有四部分 ,以下哪项不是系统之一?A.语音合成B. 语音播放C. 语音辨别D. 语义理解27、数据生态中,算法模型分为两代,那么第一代算法模型是?A.TezB.SparkC.PigD. MapReduce28、Spark是鉴于什么的迭代计算框架?它合用于需要多次操作特定数据集的应用途合。需要频频操作的次数越多,所需读取的数据量越大,得益越大,数据量小可是计算密集度较大的场合,得益就相对较小;A.内存B.硬盘C. 磁带D. 显卡29、以下选项中,哪项是散布式文件储存系统 ?A.HDFSB.FlumeC.KafkaD.Zookeeper30、工信部官网正式公布大数据家产”十三五“发展规划是在哪一年 ?A.1987B.1997C.2007D. 201731、学习没有标签的数据集的机器学习方法是 ?A.监察学习B. 无监察学习C. 半监察学习D. 加强学习32、目前生界产生的数据总量的单位是 ?A.KBB.ZBC.GBD.TB33、以下选项中正确说明价值密度低的是 ?A.100TB数据中有50TB有效数据B.1TB数据中有1KB有效数据数据中有100PB有效数据D.10EB数据中有10EB有效数据34、中国挪动研发了智能客服问答机器人(),使业务流程自动化,更为智能的回答用户解决业务咨询、业务办理、流量查问等问题。A.精灵B.阿尔法蛋C.小度D.移娃35、IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。A.AlphaGoB. 深蓝C.图灵机模型D. 深度学习机器人36、在 HDFS中存在 NameNode、DataNode、Client, 而 NameNode是管理者,DataNode是文件储存者,那么Client是什么呢?A.连结器B.客户端C.接口供给者D.数据采集37、mapreduce计算模型合用于哪一种任务 ?A.多线程办理B. 相关系的行办理 C. 批办理D. 及时数据变化办理38、大数据特色有几种(不包含 IBM提出的新特色)?A.1B.2C.3D. 439、Hadoop是()年出生的?40、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精确广告B.网络管理C.营销洞察D.大数据检测和决议41、传统的机器学习方法包含监察学习、无监察学习和半监察学习,此中监察学习是学习给定标签的数据集。请问标签为失散的种类,称为分类,标签为连续的种类,称为何?A.给定标签B.失散C.分类D.回归42、以下选项中,正确描绘 Flume对数据源的支持的是?A.只好使用HDFS数据源B.能够配置数据源C.不可以使用文件系统D.不可以使用目录方式43、IBM提出的大数据 5V特色包含()、更快(Velocity) 、更多(Variety) 、更值钱(Value)和更真切(Veracity)A.更有效B.更大(Volume)C.更充足D.更直观44、以下选项中,不是大数据的一部分的是?A.海量计算B.大批数据管理C.数据剖析D.单机计算45、Flume采纳了三层架构,分别为 agent,collector 和()46、HBASE的特色不包含?A.面向列B.稀少性C.多版本D.低靠谱性47、mapreduce计算模型合用于哪一种任务 ?A.多线程办理B. 相关系的行办理 C. 批办理D.及时数据变化办理48、最先的大数据观点还比较模糊,不过隐约的知道像个性化介绍、搜寻引擎之类的办理需理需要大批数据,那么在搜寻引擎方面,谁是世界上最大的厂商?A.谷歌B.百度C.360D.bing49、今年,大数据剖析将出现革命性的新方法 ,以前的好多算法和基础理论可能会产生理论级其他打破。而哪项技术将持续成为大数据智能剖析的中心技术 ?A.机器学习B. 智能物流C. 脑科学D. 智能终端50、以下选项中,正确描绘Flume对数据源的支持的是?A.只好使用HDFS数据源B.能够配置数据源C.不可以使用文件系统D.不可以使用目录方式51、HBASE的特色不包含哪些?A.面向行B. 稀少性C. 多版本D. 高靠谱性52、以下选项中,不是用于数据储存的技术是哪一个 ?A.MongoDBB.MySQLC.HDFSD.Java53、属于“人造智能”,具存心识,达到或超越人类智慧水平的人工智能称为()A.高人工智能B.低人工智能C.强者工智能D.弱人工智能54、以下选项中,不是人工智能的基础设备的是?A.CPU服务器B.GPU服务器C. 专用芯片D.游戏显卡54、以下不是大数据特色的是 ?A.数据体量大B. 数据种类多C. 价值密度高D. 办理速度快55、以下应用没有使用你的地理地点信息的是 ?A.美团B. 滴滴C. 高德地图D. word56、以下选项中,不是Flume的特色的是?A.靠谱性B. 集中式架构C. 可扩展性D. 可管理性57、在Spark的软件栈中,用于交互式查问的是A.SparkSQLB.MllibC.GraphXD.SparkStreaming58、以下选项中,不是大数据的一部分的是 ?A.海量计算B. 大批数据管理C. 数据剖析D单机计算59、人工智能、机器学习、深度学习的包含关系是 ()A.机器学习>深度学习>人工智能B.人工智能>深度学习>机器学习C.人工智能>机器学习>深度学习D.深度学习>人工智能>机器学习60、自然语言办理难点目前有四大类 ,以下选项中不是此中之一的是 ?A.机器性能B. 语言歧义性C. 知识依靠D. 语境61、BP神经网络模型拓扑构造不包含A.输入层B. 隐层C. 输出层D. 显层62、以下哪个不是语音识其他范围 ?A.语音听写 B.语音合成C. 语音转写D. 语音唤醒63、AlphaGo是第一个击败人类职业 ()选手的人工智能程序。A.国际象棋 B.围棋C. 中国象棋D. 五子棋64、跟着闭源软件在数据剖析领域的地盘不停减小式,向着什么聚拢?A.闭源B.开源C. 独立D. 关闭
,老牌
IT
厂商正在改变商业模65、“大数据”是需要新办理模式才能拥有更强的决议力、洞察发现力和流程优化能力来适应()、高增加率和多样化的信息财产。A.海量B.少量C.小量D.构造化66、SparkStreaming 是什么软件栈中的流计算 ?A.SparkB.StormC.HiveD.Flume67、客服中心是营运商和客户接触较为屡次的通道,我们能够利用()在后端给客服中心成立宏大的知识库,供接线员们使用帮忙他们迅速精确的找到答案。大数据技术B.客户画像C.客户状态D.客户心情67、以下选项中正确说明价值密度低的是 ?A.100TB数据中有50TB有效数据B.1TB数据中有1KB有效数据数据中有100PB有效数据D.10EB数据中有10EB有效数据68、学习没有标签的数据集的机器学习方法是 ?A.监察学习B. 无监察学习C. 半监察学习D. 加强学习69、目前生界产生的数据总量的单位是 ?A.KBB.ZBC.GBD.TB70、抗衡学习中两个网络相互竞争 ,一个负责生成样本,那么另一个负责做什么?A.鉴别样本B.计算样本C.统计样本D.生成样本71、hdfs中namenode的metadata的作用是?A.描绘数据的储存地点等属性B.储存数据C.调动数据72、rdd是由多个什么构成?a.partition73、IBM提出的大数据5V特色包含更大(Volume)、更快(Velocity)、更多(Variety)、更值钱(Value)和()A.更有效B.更充足C.更真切(Veracity)D.更直观74、在Spark的软件栈中,用于流计算的是?A.GraphXB.MllibC.SparkStreamingD.SparkSQL75、以下数据量能够称为大数据的是 ?A.100MBB.100KBC.100PBD.100MB76、学习没有标签的数据集的机器学习方法是 ?A.监察学习B. 无监察学习C. 半监察学习D. 加强学习77、大数据的数据根源于方方面面 ,以下不可以够作为数据源的是 ?A.APP应用B. 地理信息C.一块石头D. 商铺订单78、数据采集的基本步骤(ETL)中不包含哪项?A.抽取变换B. 加载C. 计算79、整个MapReduce的过程大概分为 Map、Shuffle、Combine、()?A. ReduceB.HashC.CleanD.Loading80、人工智能经过输入的图片 ,分析出图片的内容,这类技术叫什么?图片辨别B.语音辨别C.自动驾驶D.花费金融81、“大数据”是需要新办理模式才能拥有更强的决议力、洞察发现力和流程优化能力来适应()、高增加率和多样化的信息财产。A.海量B.少量C.小量D.构造化82、Hadoop2系列版本中默认的 HDFS的block是多大?A.32MBB.64MB C. 128MBD.16MB83、以下哪个场景能够称为大数据场景?A.故宫旅客人数 B.故宫门票收入 C.美团APP的定位信息 D.文章内容84、以下选项中,不是人工智能的算法中的学习方法的是?A.重复学习 B.深度学习 C.迁徙学习 D.抗衡学习85、以下哪个不属于大数据在电信行业的数据商业化方面的应用?A.精确广告 B.网络管理 C.营销洞察 D.大数据检测和决议86、在Spark的软件栈中,用于图计算的是()A.SparkStreaming B.MllibC. 二、多项选择题1、自然语言办理需要解决的难点有哪些 ?A.语言歧义性B. 语言鲁棒性C. 知识依靠D.语境2、人工智能目前在以下哪三个领域有了长足的发展 ?A.健康B. 教育C. 探究太空D. 理财3、以下选项属于人工智能的基本观点有 :A.机器学习B. 深度学习C. BP神经网络D.卷积神经网络4、大数据的业务应用办理需要经过哪些流程 ?A.数据采集B. 数据冲洗C. 数据建模D.数据加工5、在数据冲洗的过程中,总合能够归为三个阶段,它们分别是?A.数据加工B. 数据质量C.数据校正D. 数据标准化6、麦肯锡全世界研究所对大数据的定义是一种规模大到在获得、储存、管理、分析方面大大高出了传统数据库软件工具能力范围的数据会合 ,拥有以下哪些特征?A.海量的数据规模 B. 迅速的数据流转 C. 多样的数据种类 D. 价值密度低7、人工智能重点技术框架主要包含哪两层 ?A.基础设备B. 算法C. 技术D. 人员8、大数据应用领域成就有哪些 ?A.金融B. 互联网电子商务 C. 工业生产D. 没有显然成就9、以下哪些属于大数据在电信行业的应用 ?A.网络管理和优化 B. 数据商业化C. 客户关系管理D. 公司营运管理10、以下哪两个属于大数据特色 ?A.数据体量大B. 价值密度高C. 数据种类多D. 办理速度慢11、在非电信领域,大数据可被应用到的以下哪些方面 ?A.公共安全B. 无显然应用C. 智能运输D. 智能建筑12、HBASE的特色不包含哪两项?A.面向行B. 浓密性C. 多版本D. 高靠谱性13、那么以下哪些技术合适流办理 ?A.SparkStreaming B. StormC.HbaseD.MapReduce14、以下哪两项是人工智能发展的标记性产品 ?A.深蓝B. alphagoC.智能门禁D. 智好手机15、使用有监察学习的问题能够被分为哪两类 ?A.回归问题B. 抽样问题C. 聚类问题D.分类问题16、HDFS在哪些场景中表现很差?A.大批小文件B. 随机读取C. 改正文件D. 储存和管理PB级别数据17、世界经济论坛以“大数据的回报与风险”主题公布了《全世界信息技术报告(第13版)》,经过该报告,各国政府渐渐认识到大数据在哪些方面有重要意义?A.推动经济发展B.改良公共服务C.增进人民福祉D.保障国家安全18、电信行业的网络管理和优化包含了两部分的优化,以下选项中不在这两项优化以内的是?A.基础设备建设的优化 B. 网络速度的优化 C. 并发性的优化 D. 网络营运管理及优化19、经过地理地点信息能够剖析出哪些信息 ?A.颜值B. 家庭地址C. 工作地点D. 体重20、人工智能依据发展层级区分能够分为哪三层?A.计算智能B.感知智能C.认知智能D.人工智能21、使用有监察学习的问题能够被分为哪两类 ?A.回归问题B. 抽样问题C. 聚类问题D.分类问题22、Flume采纳了三层架构,每一层均能够水平扩展,它们分别是?A.agentB. collector C.storage D.source23、人工智能的技术方向一共有三种,他们分别是?A.语音辨别B.计算机视觉C.自然语言D.复杂编程24、Spark合用于那些场景?A.计算量大B.数据量大C.效率要求高系统业务受理25、对于RDD,说法正确的两项是?A.RDD不可以由多个分区(partition )构成B.弹性、集中式内存集C.RDD能生成childrenRDDD.是一个容错的、并行的数据构造26、业务营运监控,能够鉴于大数据剖析从以下哪三个维度为营运商监控管道和客户营运状况?A.网络B.业务C.天气D.用户27、Yarn架构在Hadoop生态圈中有哪些作用?A.资源分派B.调动C.保证共同D.计算数据28、以下数据量不可以说成大数据的是?29、自动驾驶中的人工智能技术包含下边哪三项?A.环境感知B.行为决议C.运动控制D.温度控制30、以下用到语音辨别技术的应用包含:A.苹果手机Siri B.微信C.百度地图31、监察学习的回归方法包含:A.线性回归B.逻辑回归C.多项式回归D.单调回归32、人工智能技术的基础设备 不包含哪两部分?A.系统应用B. 机器学习算法C. 基础硬件D. 算法框架33、HDFS合用于哪些场景?A.大批小文件B.储存和管理PB级别数据C.一次写入,多次读取D.低延缓读取34、自然语言办理的主要难点 不包含以下哪两项:A.语言独立性B. 语言歧义性 C.多国语言D. 语境35、以下哪两个属于大数据特色A.数据体量大B. 价值密度高
?C.
数据种类多
D.
办理速度慢36、以下应用使用了你的地理地点信息的是A.滴滴B. 百度地图C.wordD.excel
?37、BP神经网络模型拓扑构造包含 ()、()A.输入层(input) B.隐层(hiddenlayer)
和输出层(outputlayer)C.卷积层(convolutional
。
layer)
D.池化层(poolinglayer)38、自动驾驶中的人工智能技术包含下边哪三项 ?A.环境感知B. 行为决议C. 运动控制D.温度控制39、数据建模目前有两种比较通用的方式A.通用建模B. 专属建模C. 范式建模
,分别是?D.维度建模40、以下选项中,是大数据发展趋向的是?A.开源大数据商业化进一步深入 B. 打包的大数据行业剖析应用开辟新市场B.大数据细分市场规模进一步增大 D. 大数据推动公司并购的规模和数目进一步提高41、2010年12月,工信部公布的物联网十二五规划上,把信息办理技术作为4项重点技术创新工程之一被提出来,此中包含了哪些大数据的重要构成技术?A.海量数据储存B.数据发掘C.图像视频智能剖析D.python42、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原由是什么?A.运算力不足B.人员不足C.技术瓶颈D.花费太高43、电信行业的网络管理和优化包含了两部分的优化,这两项优化是?A.基础设备建设的优化B.网络速度的优化C.并发性的优化D.网络营运管理及优化44、人工智能技术的基础设备不包含哪两部分 ?A.系统应用B. 机器学习算法C. 基础硬件D. 算法框架45、计算机视觉包含了诸多不一样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教版八年级物理上册《第五章透镜及其应用》章末测试卷含答案
- 高一化学达标训练:第二单元食品中的有机化合物
- 2024届随州市重点中学高考临考冲刺化学试卷含解析
- 吉林省吉林市普通中学2024-2025学年高三上学期二模试题 数学
- 2024高中地理第三章自然地理环境的整体性与差异性章末知识整合学案湘教版必修1
- 2024高中物理第四章电磁感应6互感和自感达标作业含解析新人教版选修3-2
- 2024高考地理一轮复习专练95旅游地理含解析新人教版
- 2024高考地理一轮复习专练61森林湿地的开发和保护含解析新人教版
- 2025高考数学考二轮专题过关检测六 解析几何-专项训练【含答案】
- 乡村建设工程施工组织设计
- 人教版历史2024年第二学期期末考试七年级历史试卷(含答案)
- 预算法及实施条例测试题(含答案)
- 2024届新高考数学大题训练:数列(30题)(解析版)
- 四年级数学下册计算题(每日一练13份)
- 虚拟现实技术应用
- 项目风险记录及跟踪表
- DL∕T 1802-2018 水电厂自动发电控制及自动电压控制技术规范
- 50以内加减法口算题卡(1000道打印版)每日100道
- 黑龙江省2025届高三最后一卷历史试卷含解析
- 《生物发酵行业智能制造第2部分:生物反应器》
- GB/T 4008-2024锰硅合金
评论
0/150
提交评论