大数据应知应会试题及答案_第1页
大数据应知应会试题及答案_第2页
大数据应知应会试题及答案_第3页
大数据应知应会试题及答案_第4页
大数据应知应会试题及答案_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据应知应会试题及答案一、大数据(单选)I、题目:大数据是指不用随机分析法这样的捷径,而采用0的方法[单选题]*A.所有数据(正确答案B.绝大部分数据C.适量数据D.少量数据2、题目:大数据环境下的隐私担忧,主要表现为0[单选题]*A.个人信息的被识别与暴露三礁答案)B.用户画像的生成C.恶意广告的推送D.病毒入侵3、题目:大数据基于云计算进行数据的分析,那么云计算按照提供的服务类型进行分类,包括laaS、PaaS、()[单选题]*A.XenB.SaaSiIE确答案.)C.KVMD.Docker4、题目:以下哪个不是海量大数据的常用处理工具()[单选题1*A.HadoopB.Excel正确答案)C.SparkD.Hive5、题目:当前社会中,最为突出的大数据环境是()[单选题]*A.互联网(正确答案।B.物联网C.综合国力D.自然资源6、题目:根据电信客户的特征对客户进行打标分类主要用到()算法[单选题]*A.分类B.聚类(正确答案)C.降维D.回归7、题目:以下哪一项属于非结构化数据()[单选题]*A.视频监控数据(正确答案)B.企业ERP数据C.财务系统数据D.日志数据8、题目:大数据的起源是()[单选题]*A.金融B.电信C互联网(正确答案)D.公共管理9、题目:统计分组时,若某标志值刚好等于相邻两组上下限数值时()[单选题]*A.将此数值归入上限所在组B.将此数值归入下限所在组(正确空案।C.归入这两组中任意一组均可D.另立一组10、题目:有200家公司每位职工的工资资料,如果要调查这200家区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是()。[单选题]*A.普查B.典型调查C抽样调查D.重点调查(正确答案)11、题目:某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为()[单选题]*A.260B.215C.230IZ确答案)D.18512、题目:当一组数据属于左偏分布时.则()[单选题]*A.平均数、中位数与众数是合而为一的B.众数在左边、平均数在右边C.众数的数值较小,平均数的数值较大D.众数在右边、平均数在左边王礁答案)13、题目:要通过移动平均法消除季节变动得到趋势值,则移动平均项数()[单选题]*A.应选择奇数B.应和季节周期长度一致三确空案)C.应选择偶数D.可取4或1214、题目:不重复抽样平均误差()。[单选题]*A.总是大于重复抽样平均误差B.总是小于重复抽样平均误差E确答案।C.总是等于重复抽样平均误差D.以上情况都可能发生15、题目:如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用0[单选题1*A.均值B.中位数C.众数(正确答案)D.四分位数16、题目:某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度0【单选题1*A.乡村较大B.城市较大正确答案।C.城市和乡村一样D.不能比较17、题目:重点调查的实施条件是()[单选题]*A.被调查的单位总数相当多B.存在少数举足轻重的单位(正确答案।C.调查结果能够用于推算总体数据D.被调查的现象总量在各总体单位之间的分布极其不均匀18、题目:抽样平均误差与极限误差间的关系是()【单选题1*A.抽样平均误差大于极限误差B.抽样平均误差等于极限误差C抽样平均误差小于极限误差D.抽样平均误差可能大于、等于或小于极限误差[确笔案।19、题目:进行单侧检验时,利用P值进行判断,拒绝原假设的条件是0[单选题]*A.P值(正确答案)B.P值,C.P值D.P值>220、题目:假设检险中,第二类错误的概率表示()【单选题1*A.为真时拒绝的概率B.为真时接受的概率C.不真时拒绝的概率D.不真时接受的概率(正确答案)21、题目:时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为0[单选题1*A.趋势:王碓答案)B.季节性C周期性D.随机性22、题目:根据各处的季度数据计算季节指数,各季节指数的平均数应等于()[单选题]*A.100%正确答案)B.400%C.25%D.023、题目:如下哪些不是最近邻分类器的特点。()[单选题]*A.它使用具体的训练实例进行预测,不必维护源自数据的模型B.分类一个测试样例开销很大C.最近邻分类器基于全局信息进行预测 :案।D.可以生产任意形状的决策边界24、题目:推荐系统为客户推荐商品,自动完成个性化选择商品的过程、满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、()、推测客户将来可能的购买行为。[单选题]*A.客户的朋友B.客户的个人信息C.客户的兴趣爱好D.客户过去的购买行为和购买记录(王确答案)25、题目:()的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。【单选题1*A.数据清洗B.数据集成C.数据变换D.数据归约(正确答案26、题目:某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()[单选题]*A.关联规则发现正哨答案)B.聚类C.分类D.自然语言处理27、题目:以下两种描述分别对应哪两种对分类算法的评价标准?()(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。[单选题]*A.Precision,RecallIE确答案)B.RecalLPrecisionPrecision,ROCRecalLROC28、题目:将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?0[单选题1*A.频繁模式挖掘B.分类和预测C.数据预处理(正确答案)D.数据流挖掘29、题目:当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?0[单选题]*A.分类B.聚类(正确答案)C.关联分析D.隐马尔可夫链30、题目:建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?0【单选题1*A.根据内容检索B.建模描述C.预测建模(正确答案)D.寻找模式和规则31、题目:下面哪种不属于数据预处理的方法?()[单选题]*A.变量代换B.离散化C.聚集D.估计遗漏值确答案)32、题目:假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?0[单选题1*A.第一个B.第二个(正确答案)C.第三个D.第四个33、题目:下面哪个不属于数据的属性类型()[单选题]*A.标称B.序数C.区间D.相异(正确答案)34、题目:只有非零值才重要的二元属性被称作()[单选题]*A.计数属性B.离散属性C.非对称的二元属性E确答案।D.对称属性35、题目:以下哪种方法不属于特征选择的标准方法:()[单选题]*A.嵌入B.过滤C包装D.抽样(正确答案)36、题目:下面不属于创建新属性的相关方法的是:()[单选题]*A.特征提取B.特征修改C.映射数据到新的空间D.特征构造(正确答案)37、题目:下面哪个属于映射数据到新的空间的方法?()[单选题]*A.傅立叶变换ZZ碓答案)B.特征加权C.渐进抽样D.维归约38、题目:假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到。至1的范围内。对属性income的73600元将被转化为:()[单选题]*A.0821(正确答案)1.2241.458D.0.71639、题目:一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年级110人。则年级属性的众数是:()|单选题]*A.一年级,正确答案B.二年级C.三年级D.四年级40、题目:下列哪个不是专门用于可视化时间空间数据的技术()[单选题]*A.等高线图B.饼图(正确答案)C.曲面图D.矢量场图41、题目:在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是0[单选题1*A.有放回的简单随机抽样B.无放回的简单随机抽样C.分层抽样D.D渐进抽样(正确答案)42、题目:数据仓库是随着时间变化的.下面的描述不正确的是()[单选题]*A.数据仓库随时间的变化不断增加新的数据内容B.捕捉到的新数据会覆盖原来的快照C.数据仓库随事件变化不断删去旧的数据内容।正确笔案।D.数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合43、题目:下面关于数据粒度的描述不正确的是()[单选题1*A.粒度是指数据仓库小数据单元的详细程度和级别B.数据越详细,粒度就越小,级别也就越高C.数据综合度越高,粒度也就越大,级别也就越高IZ峰空案।D.粒度的具体划分将直接影响数据仓库中的数据量以及查询质量44、题目:有关数据仓库的开发特点.不正确的描述是:0[单选题]*A.数据仓库开发要从数据出发正确答案)B.数据仓库使用的需求在开发出去就要明确C.数据仓库的开发是一个不断循环的过程、是启发式的开发D.在数据仓库环境中、并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活.且没有固定的模式45、题目:关于OLAP的特性,下面正确的是()[单选题]*A.(l)(2)(3)B.(2)(3)(4)C.(D(2)(3)(4)D.(l)(2)(3)(4)(5)(正确答案)46、题目:关于OLAP和OLTP的区别描述,不正确的是:()[单选题]*A.OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B.与OLAP应用程序不同QLTP应用程序包含大量相对简单的事务C.OLAP的特点在于事务量大,但事务内容比较简单且重复率高—D.OLAP是以数据仓库为基础的.但其最终数据来源与OLTP一样均来自底层的数据库系统.两者面对的用户是相同的47、题目:关于OLAP和OLTP的说法,下列不正确的是:()[单选题]*A.OLAP事务量大,但事务内容比较简单且重复率高确丝案)B.OLAP的最终数据来源与OLTP不一样C.OLTP面对的是决策人员和高层管理人员D.OLTP以应用为核心,是应用驱动的48、题目:设X={1,2,3}是频繁项集,则可由X产生()个关联规则。()[单选题]*A.4B.5C.6E确答案)D.749、题目:考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()[单选题]*A.1,2,3,4B.1,2,3,5C.1,2,4,5(正确答案)D.1,3,4,550、题目:在图集合中发现一组公共子结构,这样的任务称为()[单选题]*A.频繁子集挖掘B.频繁子图挖掘(正确答案)C.频繁数据项挖掘D.频繁模式挖掘51、题目:下列度量不具有反演性的是()[单选题1*A.系数B.几率C.Cohen度量D.兴趣因子正确答案)二、大数据(多选)1、题目:数据质量的问题体现在()*A.完整性正确答案B.一致性正确答案C.合法性正确答案)D.精确性(正确答案2、题目:大数据平台建设原则为()*A.统一数据入湖:全网数据统一采集到大数据湖,利用大数据分布式计算、存储能力实现跨域数据处理正确答案)B.统一技术架构:采用全网统一的PaaS架构构建大数据平台,统一组件标准,通过全网统一调度管控两级资源正确答案)C.统一数据服务:对外提供统一数据服务,通过API、标签、模型、指标、卡片等方式全网开放使用(正确答案)D.统一开发平台:提供基于专区、AI、跨域数据的统一开发平台,打造全网生态化大数据应用敏捷开发生态正二角答案)3、题目:大数据平台的业务目标为()*A.全面、客观、真实、及时反映业务运营情况,为各级领导提供企业经营的决策依据正确答案)B.快速支撑精确管理、精准营销、精细服务等各类需求正确答案)c.实现企业数据和应用的有效共享,降本增效(E确答案)D.建立数据全生命周期的安全保障体系,降低数据泄露的风险已匕然;案।4、题目:下列指标属于离散变量的有()*A.客户移动上网流量B.员工年龄正确答案)C.基站电费D.基站数量(正确答案5、题目:目前中国电信企业级大数据平台包含()等架构()*A.大数据平台采集系统王礁答案)B.大数据平台基础能力系统正确答案)C.大数据平台核心处理能力系统E烧答案।D.大数据平台安全管理系统正确答案IE.大数据应用三确答案)6、题目:大数据在电信行业有哪些应用()*A.网络运维优化一确空案।B.网络规划建设;正确”案)C.太空通信D.市场推送(正确答案)7、题目:以下关于非频繁模式说法,正确的是()*A.其支持度小于阈值正确答案)B.都是不让人感兴趣的C.包含负模式和负相关模式D.对异常数据项敏感8、题目:以下属于分类器评价或比较尺度的有:()*A.预测准确度工确答案।B.召回率(正确答案)C.模型描述的简洁度D.计算复杂度工确答案)9、题目:贝叶斯信念网络(BBN)有如下哪些特点。()*A.构造网络费时费力E确答案)B.对模型的过分问题非常鲁棒三确专案।C.贝叶斯网络不适合处理不完整的数据D.网络结构确定后,添加变量相当麻烦10、题目:以下属于聚类算法的是()。*A.K-Means3.W答案।B.DBSCAN笞案।C.AprioriD.KNN11、题目:()都属于簇有效性的监督度量。0*A.轮廓系数B.共性分类相关系数C炳(正确答案)D.(正确答案)F度量12、题目:()这些数据特性都是对聚类分析具有很强影响的。()*A.高维性(正确答案B.规模(正确答案)C.稀疏性(正确答案)D.噪声和离群点(正确答案)13、题目:在聚类分析当中,()等技术可以处理任意形状的簇。()*A.MIN(单链)(正确答案)B.MAX(全链)C.组平均D.Chameleon磔答案।14、题目:()都属于分裂的层次聚类算法。()*A.二分K均值(正确答案)B.MST(正确答案)C.ChameleonD.组平均15、题目:数据挖掘的挖掘方法包括:()*A.文本总结正确答案)B.文本分类(正确答案C.文本聚类(正确答案)D.关联规则正确答案)16、题目:基于内容的推荐生成推荐的过程主要依靠()*A.内容分析器王礁答案)B.推荐系统C.文件学习器正确答案)D.过滤部件正确答案i17、题目:云计算的服务方式有()*A.IaaS正确答案)B.RaasC.PaaS(正确答案)D.SaaSi王礁答案)18、题目:数据预处理方法主要有()。*A.数据清洗(正确答案)B.数据集成(正确答案C数据变换(正确答案)D.数据归约(正确答案)19、题目:与传统的分布式程序设计相比,M叩reduce封装了()等细节,还提供了一个简单而强大的接口。()*A.并行处理(正确答案)B.容错处理(正确答案C.本地化计算E确答案)D.负载均衡正确答案)三、大数据(判断)1、题目:预测肿瘤细胞是良性还是恶性属于回归问题。()[单选题1*A.正确B.错误确答案।2、题目:大数据平台安全管理系统的功能为:从各系统获取曰志,同时为各系统提供安全控制策略。0[单选题1*A.正确正确答案)B.错误3、题目:大数据平台基础能力系统的功能为:作为整个大数据平台的基础框架,为其他系统提供二次开发、管理的工具和组件。0[单选题]*A.正确正确答案)B.错误4、题目:对于大数据而言,最基本、最重要的要求就是减少错误)、保证质量。因此,大数据收集的信息量要尽量精确。0[单选题]*A.正确B.错误(正确答案)5、题目:有监督学习不需要进行数据标注。0[单选题]*A.正确B.错误(正确答案)6、题目:数据分析时,数据维度越多越好。0[单选题]*A.正确B.错误(正确答案)7、题目:信息化主要是产生和整合数据,大数据是把对经验的挖掘和利用做到极致,智能化的核心是会学习的机器、可对未知的事件进行模拟。0【单选题1*A.正确正确答案)B.错误8、题目:运营商大数据不能识别记录手机终端型号。0【单选题1*A.正确B.错误(正确答案)9、题目:运营商数据整合困难,数据都是短期的,不稳定的。0[单选题]*A.正确B.错误(正确答案)10、题目:大数据平台核心处理能力系统的功能为:对接口层数据进行加工处理,形成按照主题域组织的整合层数据和按照客户和企业管理视角组织的中间层数据。0[单选题1*A.正确正确答案)B.错误11、题目:企业级大数据平台可实现统一调度任务管理、加工流程、监控分析、跨集群、跨租户的调度能力进行封装打包产品化,形成可订阅的大数据产品能力,提供给开发用户及合作伙伴使用。0【单选题1*A.正确正确答案)B.错误12、题目:数据来源多处,可以避免数据完整性问题。0[单选题]*A.正确B.错误正确答案)13、题目:大数据与云计算两者结合起来,将给世界带来一场深刻的管理技术革命和社会治理创新。0[单选题1*A.正确正确答案)B.错误14、题目:企业级的数据中心,基于“集中、开放、云化”原则,按照平台与应用分离的设计思路,打造企业级的大数据平台,有序推进企业的大数据战略。0[单选题]*A.正确正确答案)B.错误15、题目:数据科学的关键要素包括数据源、模型和计算能力及广泛的应用场景。0[单选题]*A.正确正确答案)B.错误16、题目:数据按每分钟提供,就是满足数据的及时性要求。0[单选题]*A.正确B.错误(王确答案।17、题目:中国电信基于云网一体的大数据湖,建设逻辑统一、物理分散中国电信特色的大数据平台,汇聚融合IT、CT全域数据,实现“大数据+AI”开发生态全网统一赋能、平台统一管理、全网PaaS平台统一、全网数据统一接入、全网应用共建共享,助力企业数字化转型。0【单选题1*A.正确(正确答案)B.错误18、题目:信息化、大数据、智能化是相辅相成的。0[单选题]*A.正确正确答案)B.错误19、题目:大数据平台采集系统的功能为:汇聚不同来源的数据,接口数据清洗、稽核校脸、模型规范后,将数据规整到相关域,统一存放在大数据平台指定地方,形成接口层数据。0[单选题]*A.正确(正确答案)B.错误20、题目:大数据和AI的方法最终目的是使得整个社会的运转效率显著提高。0[单选题1*A.正确正确答案)B.错误21、题目:深度学习是机器学习的一部分,机器学习又是人工智能的一部分。0[单选题]*A.正确正确答案)B.错误22、题目:对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大。0[单选题]*A.正确B.错误(正确答案)23、题目:当前,企业提供的大数据解决方案大多基于Hadoop开源项目。0【单选题1*A.正确正确答案)B.错误24、题目:中国电信的疫情防控行程查询助手为翼知疫行,为政府及个人提供了包括区域风险查询、疫情预测查询、返程报告查询、行程查询和接触查询等功能。0【单选题1*A.正确正确答案)B.错误25、题目:大数据平台专区是基于集团大数据平台为省公司打造的一站式数据应用开发平台,能够为各省开发者提供从底层(计算、存储、工具能力)、中间(OpenAPI,模型)到上层应用快速数据科学探索的一条龙服务。0[单选题1*A.正确正确答案)B.错误26、题目:数据存储是大数据平台的根本,没有存储平台,数据也就没有了载体。0【单选题1*A.正确正确答案)B.错误27、题目:大数据平台数据管理系统的功能为:为核心处理能力系统提供监控管理、调度管理等功能,并为采集系统和应用提供相应的数据质量、主数据管理等功能支持。0[单选题]*A.正确(正确答案)B.错误28、题目:中国电信大数据平台数据沙箱为一站式大数据和数据科学实训竞赛平台。0[单选题]*A.正确正确答案)B.错误29、题目:对存在上升或下降趋势的时间序列,季节比率大于1,表明在不考虑其他因素影响时,由于季节因素的影响使实际值高于趋势值。0[单选题1*A.正确正确答案)B.错误30、题目:在大量观察的情况下,系统性误差在数据汇总后可相互抵消。0【单选题1*A.正确B.错误王确答案I31、题目:评价点估计的有效性是指:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更一致。0【单选题1*A.正确正确答案)B.错误32、题目:相关系数r为。表示两个变量之间不存在任何关系。0【单选题1*A.正确B.错误(正确答案)33、题目:对季度数据序列,用移动平均法测定其长期趋势值时,可采用四项移动平均。0[单选题1*A.正确正确答案)B.错误34、题目:统计学这一名词是由威廉配第最早提出的。0[单选题1*A.正确B.错误(正确答案)35、题目:若要通过随机抽样调查了解某大学在校学生的通讯费用支出情况,抽样框可以是全部在校学生的手机号码,也可以是全部在校学生的学号。0[单选题]*A.正确B.错误(正确答案)36、题目:算术平均数易受数列中极端值的影响,中位数次之,众数几乎不受极端值的影响。0[单选题1*A.正确正确答案)B.错误37、题目:峰度是用于衡量分布的不对称程度或偏斜程度的指标。0[单选题]*A.正确B.错误(正确答案)38、题目:所谓小概率原理,即指概率很小的事件实际上不可能出现;这种事件称为“实际不可能事件:0[单选题1*A.正确B.错误(正确答案)39、题目:分类是预测数据对象的离散类别,预测是用于数据对)象的连续取值。0[单选题1*A.正确正确答案)B.错误40、题目:时序预测回归预测一样,也是用已知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。0[单选题]*A.正确B.错误(正确答案)41、题目:数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。0[单选题1*A.正确正确答案)B.错误42、题目:对遗漏数据的处理方法主要有:忽略该条记录;手工填补遗漏值;利用默

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论