大数据基础(习题卷2)_第1页
大数据基础(习题卷2)_第2页
大数据基础(习题卷2)_第3页
大数据基础(习题卷2)_第4页
大数据基础(习题卷2)_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:大数据基础大数据基础(习题卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据基础第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.关于OLAP和OLTP的区别描述,不正确的是:()A)OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B)与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务C)OLAP的特点在于事务量大,但事务内容比较简单且重复率高D)OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的答案:C解析:[单选题]2.下面哪个不属于数据的属性类型:()A)标称B)序数C)区间D)相异答案:D解析:[单选题]3.大数据的最显著特征是()。A)数据规模大B)数据类型多样C)数据处理速度快D)数据价值密度高答案:A解析:[单选题]4.大数据的简单算法与小数据的复杂算法相比()A)更有效B)相当C)不具备可比性D)无效答案:A解析:[单选题]5.如下哪些不是最近邻分类器的特点()A)它使用具体的训练实例进行预测,不必维护源自数据的模型B)分类一个测试样例开销很大C)最近邻分类器基于全局信息进行预测D)可以生产任意形状的决策边界答案:C解析:[单选题]6.下列关于数掲交易市场的说法中,错误的是()A)数据交易市场是大数据产业发展到一定程度的产物B)商业化的数据交易活动催生了多方参与的第三方数据交易市场C)数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D)数据交易市场是大数据资源化的必然产物答案:C解析:[单选题]7.设X={1,2,3}是频繁项集,则可由X产生()个关联规则。A)4B)5C)6D)7答案:C解析:[单选题]8.信息时代的三大定律不包括()A)牛顿定理B)摩尔定律C)麦特卡尔夫定律D)吉尔德定律答案:A解析:[单选题]9.以下哪些分类方法可以较好地避免样本的不平衡问题()A)KNNB)SVMC)BayesD)神经网络答案:A解析:[单选题]10.用于分类与回归应用的主要算法有:()A)Apriori算法、HotSpot算法B)RBF神经网络、K均值法、决策树C)K均值法、SOM神经网络D)决策树、BP神经网络、贝叶斯答案:D解析:[单选题]11.社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的(),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。A)地址B)行为C)情绪D)来源答案:C解析:[单选题]12.有关数据仓库的开发特点,不正确的描述是:()A)数据仓库开发要从数据出发B)数据仓库使用的需求在开发出去就要明确C)数据仓库的开发是一个不断循环的过程,是启发式的开发D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式答案:A解析:[单选题]13.()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。A)MIN(单链)B)MAX(全链)C)组平均D)Ward方法答案:C解析:[单选题]14.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为()A)0.75B)0.35C)0.4678D)0.5738答案:C解析:[单选题]15.在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A)曼哈顿距离B)平方欧几里德距离C)余弦距离D)Bregman散度答案:A解析:[单选题]16.智能健康手环的应用开发,体现了()的数据采集技术的应用。A)统计报表B)网络爬虫C)API接口D)传感器答案:D解析:[单选题]17.只有非零值才重要的二元属性被称作:()A)计数属性B)离散属性C)非对称的二元属性D)对称属性答案:C解析:[单选题]18.假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()A)0.821B)1.224C)1.458D)0.716答案:D解析:[单选题]19.大数据时代,数据使用的关键是()。A)数据收集B)数据存储C)数据分析D)数据再利用答案:D解析:[单选题]20.一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。A)概率B)邻近度C)密度D)聚类答案:C解析:[单选题]21.建立在相关关系分析法基础上的预测是大数据的()A)基础B)前提C)核心D)条件答案:C解析:[单选题]22.数据清洗的方法不包括()A)噪声数据清除B)一致性检查C)重复数据记录处理D)缺失值处理答案:C解析:[单选题]23.列国家的大数据发展行动中,集中体现?重视基础、首都先行?的国家是()。A)美国B)日本C)中国D)韩国答案:D解析:[单选题]24.中国互联网购物者占互联网使用者的比例为:A)0.5B)0.55C)0.56D)0.57答案:C解析:[单选题]25.云计算是对()技术的发展与运用。A)并行计算B)分布式计算C)网格计算D)以上都是答案:D解析:[单选题]26.大数据的本质是()A)洞察B)采集C)统计D)联系答案:A解析:[单选题]27.智能手环的应用开发,体现了()的数据采集技术的应用。A)网络爬虫B)API接口C)传感器D)统计报表答案:C解析:[单选题]28.数据、信息、知识三者之同的变化趋势是()A)价值递减B)价值递增C)价值先增后减D)价值不交答案:B解析:[单选题]29.BIRCH是一种()。A)分类器B)聚类算法C)关联分析算法D)特征选择算法答案:B解析:[单选题]30.下列哪项通常是集群的最主要瓶颈()。A)内存B)CPUC)网络D)磁盘1/0答案:D解析:[单选题]31.下面哪个属于映射数据到新的空间的方法?()A)傅立叶变换B)特征加权C)渐进抽样D)维归约答案:A解析:[单选题]32.一切可连,任何数据之间逗辑上都有可能存在联系,这体现了大数据思雄中的()A)相关思维B)因果思维C)定量思维D)实验思维答案:A解析:[单选题]33.下列关于舍恩伯格对大数据特点的说法中,错误的是()。A)数据规模大B)数据类型多样C)数据处理速度快D)数据价值密度高答案:D解析:[单选题]34.大数据的本质是()。A)挖掘B)联系C)搜集D)洞察答案:D解析:[单选题]35.()将两个簇的邻近度定义为两个簇合并时导致的平方误差的增量,它是一种凝聚层次聚类技术。A)MIN(单链)B)MAX(全链)C)组平均D)Ward方法答案:D解析:[单选题]36.数据的精细化程度是指(),越细化的数据,价值越高。A)规模B)活性C)颗粒度D)关联性答案:C解析:[单选题]37.考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()A)1,2,3,4B)1,2,3,5C)1,2,4,5D)1,3,4,5答案:C解析:[单选题]38.对大数据使用进行正规评测及正确引导,可以为数据使用者带来什么切实的好处()A)他们无须再取得个人的明确同意,就可以对个人数据进行二次利用。B)数据使用者不需要为敷衍了事的评测和不达标准的保护措施承担法律责任。C)数据使用者的责任不需要强制力规范就能确保履行到位。D)所有项目,管理者必须设立规章,规定数据使用者应如何评估风险、如何规避或减轻潜在伤害。答案:A解析:[单选题]39.个性化推荐系统是建立在海量数据挖据基础上的一种高级商务智能平台,以帮助()为其顾客购物提供完全个性化的决策支持和信息服务。A)公司B)单位C)电子商务网站D)跨国企业答案:C解析:[单选题]40.大数据元年是()A)2010年B)2011年C)2012年D)2013年答案:D解析:[单选题]41.下列国家的大数据发展行动中,集中体现?重视基础都先行?的国家是()A)美国B)中国C)日本D)韩国答案:D解析:[单选题]42.在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于()为其行为承担责任。A)数据使用者B)数据提供者C)个人许可D)数据分析者答案:A解析:[单选题]43.检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。A)统计方法B)邻近度C)密度D)聚类技术答案:A解析:[单选题]44.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()A)层次聚类B)划分聚类C)非互斥聚类D)模糊聚类答案:B解析:[单选题]45.下列说法错误的是()。A)大数据是一种思维B)大数据不仅仅是数的体量大C)大数据的英文1argedataD)大数据会带来机器智能答案:C解析:[单选题]46.关于OLAP和OLTP的说法,下列不正确的是:()A)OLAP事务量大,但事务内容比较简单且重复率高B)OLAP的最终数据来源与OLTP不一样C)OLTP面对的是决策人员和高层管理人员D)OLTP以应用为核心,是应用驱动的答案:A解析:[单选题]47.大数据的最明显特点是()。A)数据类型多样B)数据规模大C)数据价值密度高D)数据处理速度快答案:B解析:[单选题]48.如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作()A)极大匹配B)二分匹配C)完美匹配D)极小匹配答案:C解析:[单选题]49.下面属于数据集的一般特性的有()。A)维度B)稀疏性C)分辨率D)以上都有答案:D解析:[单选题]50.关联规则的评价指标是:()。A)均方误差、均方根误差B)Kappa统计、显著性检验C)支持度、置信度D)平均绝对误差、相对误差答案:C解析:[单选题]51.下列关于数据交易市场的说法中,错误的是()。A)数据交易市场是大数据产业发展到一定程度的产物B)商业化的数据交易活动催生了多方参与的第三方数据交易市场C)数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D)数据交易市场是大数据资源化的必然产物答案:C解析:[单选题]52.下列关于云计算和数据库的说法中,错误的是():A)获取样本的代价很高B)获取足够大的样本数据乃至全体数据非常容易C)比抽样调查数据更全面D)比抽样调查更能反映整个群体的特征与规律答案:A解析:[单选题]53.随着数据科学家的崛起,()的地位将发生动摇。A)国家领导人B)大型企业C)行业专家和技术专家D)职业经理人答案:C解析:[单选题]54.下面哪种不属于数据预处理的方法?()A)变量代换B)离散化C)聚集D)估计遗漏值答案:D解析:[单选题]55.噪声数据处理的方法主要有()。A)分类B)聚类C)回归D)以上都有答案:D解析:[单选题]56.以下哪些算法是分类算法()A)DBSCANB)C4.5C)K-MeanD)EM答案:B解析:[单选题]57.关于OLAP的特性,下面正确的是:()(1)快速性(2)可分析性(3)多维性(4)信息性(5)共享性A)(1)(2)(3)B)(2)(3)(4)C)(1)(2)(3)(4)D)(1)(2)(3)(4)(5)答案:D解析:[单选题]58.在Bigtable中,()主要用来存储子表数据以及一些日志文件A)GFSB)ChubbyC)SSTableD)MapReduce答案:A解析:第2部分:多项选择题,共26题,每题至少两个正确答案,多选或少选均不得分。[多选题]59.Apriori算法的计算复杂度受()影响。A)支持度阀值B)项数(维度)C)事务数D)事务平均宽度答案:ABCD解析:[多选题]60.噪声数据的产生原因主要有:()A)数据采集设备有问题B)在数据录入过程中发生了人为或计算机错误C)数据传输过程中发生错误D)由于命名规则或数据代码不同而引起的不一致答案:ABCD解析:[多选题]61.大数据行业就业三大方向是:A)大数据系统研发类人才B)大数据应用开发类人才C)大数据分析类人才D)管理大数据的人才答案:ABC解析:[多选题]62.联机分析处理包括()基本分析功能。A)聚类B)切片C)转轴D)切块答案:BCD解析:[多选题]63.噪声数据处理的方法主要有:()A)分箱B)聚类C)关联分析D)回归答案:ABD解析:[多选题]64.大数据的定义是:A)指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合B)任何超过了一台计算机处理能力的数据量C)技术D)商业答案:AB解析:[多选题]65.大数据是描述()所发生的行为。A)未来B)现在C)过去D)实时答案:BC解析:[多选题]66.基于内容的推荐生成推荐的过程主要依靠()A)内容分析器B)推荐系统C)文件学习器D)过滤部件答案:ACD解析:[多选题]67.数据挖掘的挖掘方法包括:()A)聚类分析B)回归分析C)神经网络D)决策树算法答案:ABCD解析:[多选题]68.关于数据的潜在价值,说法正确的是()。A)数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。B)判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。C)在基本用途完成后,数据的价值仍然存在,只是处于休眠状态D)数据的价值是其所有可能用途的总和答案:ABCD解析:[多选题]69.精准营销三要素是:A)人B)位置C)物D)性别答案:ABC解析:[多选题]70.数据建立信心的作用需具备的条件包括()。A)可靠数据源B)多方的数据源C)合适的数据分析D)信得过的第三方单位答案:AD解析:[多选题]71.大数据的4V个特征包括()A)海量化B)快速化C)价值化D)多样化答案:ABCD解析:[多选题]72.()是大数据运用的基础。A)有用的数据B)覆盖率C)隐私问题D)数据统计有效性答案:ABCD解析:[多选题]73.()都属于分裂的层次聚类算法。A)二分K均值B)MSTC)ChameleonD)组平均答案:AB解析:[多选题]74.云计算的服务方式有()A)IaaSB)RaasC)PaaSD)SaaS答案:ACD解析:[多选题]75.关于脏数据说法正确的是()?A)格式不规范B)数据不完整C)编码不统D)意义不明确答案:ABCD解析:[多选题]76.以下属于机器学习的是:A)监督式学习B)非监督式学习C)半监督式学习D)强化学习答案:ABCD解析:[多选题]77.寻找数据集中的关系是为了寻找精确、方便并且有价值地总结出数据的某一特征的表示,这个过程包括了以下哪些步骤?()A)选择一个算法过程使评分函数最优B)决定如何量化和比较不同表示拟合数据的好坏C)决定要使用的表示的特征和结构D)决定用什么样的数据管理原则以高效地实现算法答案:ABCD解析:[多选题]78.下面例子属于大数据技术公司的是()A)四大机票预订系统之一的ITASoftwareB)与各行各业的公司合作应用高级无线感应技术来收集数据,然后对这些数据进行分析的埃森哲咨询公司。C)微软研究中心与华盛顿中心医院合作分析了多年来的匿名医疗记录D)在对冲基金工作的金融工程师杰夫?贝索斯创建了网上书店亚马逊。答案:ABCD解析:[多选题]79.以下选项中属于数据的作用的是()。A)沟通B)验证假设C)建立信心D)欣赏答案:ABC解析:[多选题]80.()都属于簇有效性的监督度量。A)轮廓系数B)共性分类相关系数C)熵D)F度量答案:CD解析:[多选题]81.数据再利用的意义在于()。A)挖掘数据的潜在价值B)实现数据重组的创新价值C)利用数据可扩展性拓宽业务领域D)优化存储设备,降低设备成本E)提高社会效益,优化社会管理答案:ABC解析:[多选题]82.传统数据密集型行业积极探索和布局大数据应用的表现是()。A)投资入股互联网电商行业B)打通多源跨域数据C)提高分析挖掘能力D)自行开发数据产品E)实现科学决策与运营答案:BCE解析:[多选题]83.大数据人才整体上需要具备()等核心知识。A)数学与统计知识B)计算机相关知识C)马克思主义哲学知识D)市场运营管理知识E)在特定业务领域的知识答案:ABE解析:[多选题]84.下列关于大数据的说法中,错误的是()。A)大数据具有体量大、结构单一、时效性强的特征B)处理大数据需采用新型计算架构和智能算法等新技术C)大数据的应用注重相关分析而不是因果分析D)大数据的应用注重因果分析而不是相关分析E)大数据的目的在于发现新的知识与洞察并进行科学决策答案:AD解析:第3部分:判断题,共16题,请判断题目是否正确。[判断题]85.K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。答案:错解

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论