农业大数据技术与应用智慧树知到期末考试答案章节答案2024年黑龙江农业经济职业学院_第1页
农业大数据技术与应用智慧树知到期末考试答案章节答案2024年黑龙江农业经济职业学院_第2页
农业大数据技术与应用智慧树知到期末考试答案章节答案2024年黑龙江农业经济职业学院_第3页
农业大数据技术与应用智慧树知到期末考试答案章节答案2024年黑龙江农业经济职业学院_第4页
农业大数据技术与应用智慧树知到期末考试答案章节答案2024年黑龙江农业经济职业学院_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

农业大数据技术与应用智慧树知到期末考试答案+章节答案2024年黑龙江农业经济职业学院web上的一些内嵌于HTML标记中的数据,称为结构化数据。()

答案:错用饼图呈现数据时,可以不需要考虑数据类目的多少()

答案:错信息记录是指将海量的信息记录成文字或图形()

答案:对在命令行环境中输入mongod便可以启动MongoDB。()

答案:错数据加载方式包括全量加载和增量加载两种.()

答案:对Spark是基于内存计算的框架。()

答案:对MapReduce的运行前提是HSDS的正确配置和启动。()

答案:对从农业数据角度出发,农业大数据是指与农民实际生产操作相对应的所有数据。()。

答案:对Excel可以进行各种数据的处理、统计分析、数据可视化显示及辅助决策操作,因此它属于一种数据可视化软件()。

答案:对Hbase是列式存储数据库。()

答案:对DataFrame的结构由()组成。

答案:索引###数据大数据多样化特征主要体现在()。

答案:种类多样化###来源多样化以下关于大数据、云计算和物联网之间的关系,论述正确的是()。

答案:云计算、大数据和物联网三者紧密相关,相辅相成###物联网可以借助于云计算实现海量数据的存储###物联网可以借助于大数据实现海量数据的分析在设置数据透视表位置时,包含以下哪两个选项()。

答案:现有工作表###新工作表数据分析流程中,包含以下哪些阶段?()

答案:数据分析###数据展示###明确目的与思路Hadoop生态系统包括下列哪些组件()?

答案:Spark###YARN###HDFS###MapReduce大数据中的“多样化”非结构化数据形式包括()

答案:图片音视频等感知数据###网页数据###社交媒体数据###文本数据Pandas中有两个主要的数据结构:()。

答案:DataFrame###Series以下属于SparkSQL的执行流程的是()?

答案:解析###生成RDD###优化###执行下列选项返回True的是()

答案:“bac”>“abc”###“abc”>“aac”###“abc”==“abc”以下哪些内容是常见的数据清洗问题()

答案:重复数据###日期、时间格式不一致###数值为空,有缺失###有影响指标计算的非法字符,如英文逗号、空格等数据清洗(Datacleaning)是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。其主要处理类型有()。

答案:错误数据###重复数据###残缺数据Sqoop工具的支持以下哪几项操作()。

答案:Export###Import大数据的定义是()

答案:任何超过了一台计算机处理能力的数据量###指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合数据可视化可以()

答案:协助人类进行思考###增强人类的认知能力###作为大量工作记忆的外界辅助###让人们使用感知代替认知下列选项中,不是地理信息数据可视化分析的应用是()

答案:自动计算异常的轨迹MongoDB服务的默认端口号是()

答案:27017shape返回()

答案:tuple下列关于模型评价与优化的说法正确的是()

答案:模型评价的目的是为了确认模型的有效性MongoDB文档类似于()对象。()

答案:数据库中的一行Sqoop工具的导入关键词是()。

答案:ImportMongoDB是由()语言编写的,是一个基于分布式文件存储的开源数据库系统。

答案:C++以下哪句话可以说明数据可视化的作用()

答案:一图胜千言大数据技术的未来发展趋势不会()

答案:以数据应用为中心转变为以业务为中心以下聚合函数求数据总和的是()。

答案:SUMMapReduce的基本设计思想是()。

答案:计算向数据靠拢MongoDB查询时,使用()只查询符合条件的一个文档()

答案:findOne以下哪个现象不属于大数据的典型特征()。

答案:数据包含噪声及缺失值数据可视化的目标是()

答案:理解数据从数据、数据清洗、数据整合、数据组织、数据分析到最终的知识获取,可视化在这个链条的每个环节中都发挥着互助互利的作用。()

答案:对使用散点图能找到自变量与因变量之间的函数关系()。

答案:对信息分析是指将信息以可视化的方式呈现给用户,引导用户从可视化的结果中分析和推理出有用的信息。()

答案:对HDFS设置副本数量的属性是Replication。()

答案:对Matplotlib属于Python语言的可视化程序库()

答案:对地图是空间信息可视化的最主要和最常用的形式()

答案:对已知s=“学习”,则执行s[0]=‘复’后s中存储的字符串被修改为“复习”()

答案:错在大数据、物联网、云计算等现代信息技术高速发展的今天,传统农业正在逐步向智慧农业转型升级()

答案:对数据分析可以划分为()

答案:探索性数据分析###描述性数据分析.###验证性数据分析数据清洗由哪些目的?()

答案:删除重复信息###提供数据一致性###纠正存在的错误下列选项中属于Python循环结构关键字的是()

答案:for###while下列选项属于“农业播种面积产量分析”案例技术结构的是()

答案:数据采集###数据存储###数据可视化###数据处理及分析一般认为高质量的数据是能够满足应用需求的数据,影响数据质量的因素包括()。

答案:一致性###完整性###可信性###时效性###准确性大数据的5V特征是指()。

答案:Veracity(真实)###Variety(多样化)###Value(价值)###Velocity(高速)###Volume(大量)Sqoop工具支持的数据传输模式有()。

答案:mysql-->Hive###mysql-->Hbase###mysql<–>HDFS以下属于MongoDB数据类型的是()

答案:Date###int###null对采集好数据,进行数据清洗的注意事项有()

答案:完成数据的数据清洗后,需要录入数据。###对所有数据源的质量进行初步审核。###对数据进行编码。关于大数据的来源,以下理解正确的是()

答案:我们每个人都是数据的制造者###当今的世界,基本上一切都可以用数字表达,所以叫数字化的世界。###大数据是数据量变积累达到质变的结果多选以下哪些指标是衡量大数据应用成功的标准()

答案:风险更低###成本更低###质量更高###速度更快下列选项中属于静态网页特点是()

答案:更新不方便,但是访问速度快。###用户无论何时何地访问,网页都会显示固定的信息,除非网页源代码被重新修改上传。常见的关系型数据库有()。

答案:VF###SQLServe###ACCESS###MySQL下面那个方法是计算算数平均值()

答案:mean以下哪个命令是创建数据库()?

答案:createdatabase在MongoDB中查询时,可以使用()方法来跳过指定数量的数据。()

答案:skip以下选项哪个是MapReduce正确的运行模型()

答案:Map-Shuffle-Reduce以下选项哪个是HDFS的名称节点()

答案:NameNodeSparkSQL的前身是()

答案:Shark想要将行和列位置调换,可以用以下哪个属性()

答案:T在MongoDB中,当一个key有多个value时,需要使用数组,数组使用()括起来。

答案:中括号CSV文件是以()形式存储表格数据。

答案:纯文本MySQL服务的默认端口号是()

答案:3306HDFS是B/S模式的架构。()

答案:错数据清理时一件非常耗时费力的工作,最佳的工作方式就是制定计划,重视细节且不急不躁。()

答案:对Spark是运行速度比Hadoop平台慢。()

答案:错下列选项中,哪一个是获取数据的方式?()。

答案:企业产生的数据###政府/机构公开的数据###爬取的网络数据###数据平台购买的数据访问网页的步骤有哪些?()

答案:浏览器通过DNS服务器查找域名对应的IP地址###Web服务器响应请求,发回HTML页面###向IP地址对应的WEB服务器发送请求###浏览器解析HTML内容,并显示出来。Hadoop平台可以应用在()。

答案:智慧医疗###大数据农业###在线旅游###电子商务农业大数据的特点主要有()

答案:涵盖面广###复杂度高###数据链长###规模、类型多###采集困难以下属于Spark生态圈的组件有()

答案:MLib###SparkStreaming###SparkSQL###GraphX下列属于数据分析应用场景的是()。

答案:码头货物吞吐量预测###产品销量分析###计算机硬盘使用寿命预测下列选项中运算符优先级最高的前两项是()

答案:+###括号运算下列选项中属于Python算数运算符的是()

答案:+、-、*、/###**=、+=、-=、/=数据库中实体之间常见的关系有()。

答案:1对多###多对多###1对1HDFS是以下哪个词语的缩写()?

答案:HadoopDistributedFileSystemMongoDB查询时可以传入多个键(key),每个键(key)以()隔开

答案:逗号下列关于计算机存储容量单位的说法中,错误的是()。

答案:一个汉字需要一个字节的存储空间网络新闻属于什么类型数据?()

答案:非结构化以下数据库是非关系数据库的是()。

答案:HBaseMongoDB数据库中的文档与关系型数据库中()相对应。

答案:行在MongoDB中,$lt表示()

答案:小于Json是一种轻量级的数据交换格式()

答案:对感知设备数据采集是指通过传感器、摄像头和其他智能终端自动采集信号、图片或录像来获取数据()

答案:对CSV字段间的分隔符,最常见的是()

答案:逗号###制表符数据清洗一般遵循以下哪些原则()

答案:数据量小的数据连入时,先合并.联接数据后再清洗###在大规模数据计算前,先执行数据清洗matplotlib能绘制()。

答案:柱状图###饼图###散点图###直方图下列MonggoDB支持的平台有()

答案:Linux###macOS###Windows不符合要求的数据主要是指?()

答案:错误的数据###重复的数据###不完整的数据以下不属于可视化的作用的是()

答案:数据采集在HDFS文件操作中,上传文件的命令是()

答案:put在计算机中表示存储容量时,下列描述中正确的是()

答案:1MB=1024KBMongoDB查询数据使用的命令是()

答案:findHDFS存储文件是默认的副本数是()?

答案:3小米摄像头记录下来的10分钟视频属于哪类数据?()

答案:非结构化对于来自同一个世界的某一实体,在不同的数据库中可能有不同的属性值,这样就会产生表示的差异。例如,某一表示长度的属性在一个数据库中用“厘米”表示,而另一个数据库中用“分米”表示,表明数据存在哪种问题。()

答案:数据存在冲突Kettle工具做数据抽取时具有高效性和稳定性。()

答案:对农业大数据的来源广泛、类型多样、结构复杂、具有潜在价值()

答案:对MySQL数据库的常见操作方法有()。

答案:Navicat可视化工具模式###命令行模式MySQL数据库的特点是()。

答案:开放源码###操作简单###安全###跨平台大数据的三架马车是指()。

答案:分布式文件系统GFS###NOSQL数据库架构BigTable###大数据分布式计算框架MapReduce下列选项中具有删除列表元素功能的是()

答案:clear()###pop()###remove()数据可视化的输出是()

答案:视觉形式SQL是哪种类型的语言()。

答案:关系型数据库下面程序的输出结果是()score=80ifscore<60:print(f"成绩为{score}")print("不及格")

答案:不及格农业大数据具有规模巨大、类型多样、价值密度高、处理速度快、精确度高、复杂度高等基本特征。()

答案:错农业大数据融合了农业地域性、季节性、多样性、周期性等自身特征()

答案:对MongoDB不区分类型和大小写。()

答案:错Hadoop2.x默认的文件数据块大小为64M。()

答案:错折线图常用来分析随时间推移而发生的变化趋势()

答案:对HDFS是Hadoop使用python语言实现的分布式文件系统。()

答案:错Hadoop平台namenode的端口号是50070。()

答案:对MongoDB文档中的值只可以是在双引号里面的字符串。()

答案:错饼图常用来描述比例等信息()

答案:对查看Hadoop平台是否启动成功使用jps命令。()

答案:对信息是现代企业的重要资源,是企业运用科学管理、决策分析的基础。()

答案:对传统意义上统计出来的数据属于非结构化数据。()

答案:对图表分析方法中常见的图表不包括()

答案:折线图###饼图###柱形图###散点图SQL语言的DML操作有()。

答案:Insert###Update###Select###DeleteHadoop平台的优点是()。

答案:高灵活性###高容错性###高扩展性###高收益性数据处理的主要步骤包括数据清理、数据集成、数据归约和数据变换,下面关于数据处理的主要任务说法正确的包括()。

答案:数据集成是将数据由多个数据源合并成一个一致的数据存储(如数据仓库)###数据清理可以用来清除数据中的噪声,纠正不一致下列属于ETL过程的是?()

答案:数据转换###数据抽取###数据加载以下命名正确的是()

答案:user_name###abc###user123以下哪些数据是非结构化数据?()

答案:微博上的数据###图像文件###视频文件数据按照结构化的程度分为()。

答案:非结构化数据###结构化数据###半结构化数据下列选项属于“农业播种面积产量分析”系统模块的是()

答案:数据统计模块###数据管理模块、算法分析模块###数据采集模块、清洗转换模块###数据可视化模块大数据时代的五个无处不在,具体指的是软件无处不在、()。

答案:服务无处不在###大数据无处不在###计算无处不在###网络无处不在下列选项属于动态网页特点的是()

答案:显示的内容则会随着用户操作和时间的不同而变化。###可以和服务器数据库进行实时的数据交换下列选项中属于Python元组特点的是()

答案:元组的元素是有序的###元组是不可变数据类型###元组内的元素可以是任意类型###可以使用len函数测试元组的中元素的个数下列关于pandas数据读/写说法正确的是()

答案:read_sql能够读取数据库的数据###to_csv函数能够将结构化数据写入.csv文件###to_excel函数能够将结构化数据写入.Excel文件下列选项中符合Python字典类型特点是()

答案:字典中键值对中的健必须是不可变数据类型###字典的元素是无序的###可以通过健获取对应的值现实世界的数据一般是不完整的、有问题的数据,一般数据清理的操作包括()。

答案:缺失值填充###替换异常值###纠正数据不一致###删除重复数据HDFS的架构组成有()。

答案:Client###NameNode###SecondaryNameNode###DataNode农业大数据应用主要有()

答案:农产品产销对接###农情监测预警###舆情监测分析###遥感大数据监测分析常用的地图图表包括()

答案:区域地图###点地图###组合地图###流向地图ETL是()的过程。

答案:转换(Transform)###装载(Load)###数据抽取(Extract)###清洗(Cleaning)python数据分析常用的工具库有哪些?()

答案:numpy###pandas大数据的主要应用领域包括()

答案:金融行业###医疗行业###零售行业###农业领域以下属于Spark特点的有()

答案:容易使用###通用性好###运算速度快###运行方式多E-R图的三要素是()。

答案:实体###属性###关系下列选项中符合Python导入模块语法的是()

答案:import模块名1,模块名2...,模块名n###from模块名import成员名###from模块名import*###import模块名大数据应用可以分为哪些层次()。

答案:描述性分析应用###指导性分析应用###预测性分析应用MySQL数据库的获取数据的方式()。

答案:创建数据库和表,导入数据###创建数据库和表,输入数据下列数据不属于非结构化数据的是()。

答案:mysql中的数据下列属于Kettle中文名的是()

答案:水壶Python的优点不包括()

答案:强制缩进录入后的应该如何清理数据?()

答案:利用计算机处理数据数据、信息与知识三者之间的变化趋势是()

答案:价值递增数据可视化的输入是()

答案:数据大数据的起源是()。

答案:互联网下列演示方式中,不属于传统统计图方式的是()。

答案:网络图MYSQL数据库的管理员用户是()

答案:rootSQL语言不包括以下哪个部分?()

答案:数据检查语言在EXCEL中,数据源发生变化时,相应的图表()

答案:自动跟随变化以下说法错误的是哪项?()

答案:大数据的英文名称是largedata使用的比较运算符进行MongoDB查询时,大于号表示为()符号。

答案:$gt物联网是新一代信息技术的重要组成部分,主要是指()

答案:物联网就是物物相联的互联网结构化数据存储在哪种类型的数据库中()。

答案:关系型数据库MongoDB中指定数据库路径的启动参数是()

答案:dbpathsql是以下哪个选项的缩写()?

答案:structuredquerylanguageMongoDB查询时,如果你需要以易读的方式来读取数据,可以使用()方法

答案:pretty电子邮件是什么类型数据?()

答案:非结构化规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是()。

答案:大数据下列选项中,执行时会报错的语句是()

答案:int(‘a’)HDFS是主从模式,master/()?

答案:Slave在excel中,获取外部数据的来源不包括()

答案:来自word以下哪些选项是“农业播种面积产量分析案例”使用的技术()

答案:ORACLEDV###HDFS###Spark###mysqlSqoop可以把MySQL数据库中的数据导入到HDFS中。()

答案:对“农业播种面积产量分析案例”补全后的数据,与原始的关联数据对比,数据质量有所提升。()

答案:对Mapreduce的执行结果不可以下载和查看。()

答案:错数据清洗模块主要完成了哪些工作任务()

答案:去除业务需求不相关数据###转换不统一的数据格式###去除不符合数据格式的数据###去除异常数据以下哪些组件属于Hadoop生态圈()

答案:Sqoop###HDFS###HiveSpark诞生于()

答案:美国加州大学伯克利分校的实验室“农业播种面积产量分析案例”算法分析采用的是spark技术。()

答案:对“农业播种面积产量分析案例”关联后的数据错误率较大。()

答案:对Hadoop核心主要由()部分组成

答案:HDFS###MapReduce通常情况下随机森林效果优于决策树。()

答案:对Python已经提供了机器学习库,可以直接使用随机森林算法进行训练和预测。()

答案:对利用机器学习进行预测的准确率可以达到100%。()

答案:错进行数据处理时,如果一行或一列中绝大部分数据缺失,那么该行或列应该如何处理。()

答案:删除缺失值所在的行或列2021年我国进行了第3次全国国土调查,我国耕地面积约为()

答案:19.19亿亩Pandas中实现排序的函数为()

答案:sort_values()精耕细作的小农经营模式已经不能使用激励的市场竞争。()

答案:对机器学习技术在使用时,需要经过哪些阶段()

答案:数据处理###训练阶段###数据抓取###预测阶段从2017年的分析结果中可以看出全国种植面积最多的省份为()

答案:黑龙江在农业耕地面积分析案例中,farmingdata.csv文件个的数据出现了哪些问题()。

答案:缺失值在图表中,通常使用垂直Y值作为()。

答案:数值轴下面哪种图形是用柱子表示数据间的比较关系()。

答案:柱形图数据可视化的目标主要包含信息记录、信息分析、信息传播()。

答案:对数据可视化就是以一种更直观的方式展现和呈现数据()。

答案:对图表可以将枯燥的数字展现为生动的图像,帮助人们理解和记忆()。

答案:对在数据透视表中,下面哪个选项可以实现分页筛选功能()

答案:筛选器从影响因素来看,农业大数据涵盖农业生产过程的哪些要素()

答案:环境要素###投入要素###管理要素###宏观要素维基百科对大数据的定义突出地强调:大数据是无法用现在数据管理的一-些通用的手段和方法技术进行有效管理()。

答案:对在图表中,能反映出同一属性数据变化趋势的图表类型是()。

答案:折线图更改图表类型命令在哪个选项卡下面()

答案:设计数据分析的目的在于将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据。()

答案:对使用describe()方法会输出Pandas对象的多个统计指标。()

答案:对关于Anaconda的说法中,下列描述错误的是()

答案:Anaconda是完全开源的、付费的下列关于分组聚合的说法错误的是()。

答案:pandas提供的分组和聚合函数分别只有一个数据清洗方法不包括()

答案:逻辑错误处理数据分析是一个有目的地收集和整合数据的过程。()

答案:错Pandas是Python的一个()分析包。

答案:数据描述性数据分析中常见的数据你分析方法有()

答案:对比分析法在DataFrame中每列的数据都可以看作是一个Series对象。()

答案:对下面列出的数据分析库中,用于绘制数组的2D图形的是()

答案:Matplotlib关系型数据库使用的数据模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论