大数据CDA考试(习题卷1)_第1页
大数据CDA考试(习题卷1)_第2页
大数据CDA考试(习题卷1)_第3页
大数据CDA考试(习题卷1)_第4页
大数据CDA考试(习题卷1)_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:大数据CDA考试大数据CDA考试(习题卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据CDA考试第1部分:单项选择题,共118题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.Hbase的Region是由个服务进程来管理的?()A)HRegionserverB)ZookeeperC)HMasterD)DataNode答案:A解析:[单选题]2.Hbase中以下对于LSM的描述正确的是()。A)LSM的读操作和写操作是独立B)LSM的读操作和写操作不是独立C)LSM井不区分读和写D)LSM中读写是同一种操作答案:A解析:[单选题]3.针对聚类分析,下面说法错误的是()。A)一定存在一个最优的分类B)聚类分析是无监督学习C)聚类分析可以用于判断异常值D)聚类分析即:物以类聚,人以群分答案:A解析:[单选题]4.关于HDFS集群中的DataNode的描述不正确的是?A)一个DataNode上存储的所有数据块可以有相同的B)存储客户端上传的数据的数据块C)DataNode之间可以互相通信D)响应客户端的所有读写数据请求为客户端的存储和读取数据提供支撑答案:A解析:[单选题]5.预测股票价格属于A)预测建模B)聚类分析C)关联分析D)异常检测答案:A解析:[单选题]6.随机抽取一家企业的25个产品样品,测得样品长度为60厘米。已知产品长度分布服从正态分布,且总体标准差为5厘米。那么该批产品平均长度的置信区间为()注:置信水平为95%,z0.025=1.96A)(58.04,B)(55,C)(54.45,D)(54.46,答案:A解析:>[单选题]7.在Flask框架中,找不到与路由匹配的视图函数会返回()错误。A)500B)404C)302D)200答案:B解析:[单选题]8.根据一定的标准把一群对象划分成若干个分组,组内对象之间具有很高的相似度,而不同组的对象之间存在显著差异,这种分析方法叫做。A)自然语言处理B)回归分析C)聚类分析D)关联分析答案:C解析:[单选题]9.Kafka集群在运行期间,直接依赖于下面哪些组件?A)sparkB)zookeeperC)hdfsD)hbase答案:B解析:[单选题]10.设某工厂甲、乙、丙三个车间生产同一产品,产量依次占全厂的45%,35%,20%。且各车间的次品率依次为4%,2%,5%。现从待出厂的产品中抽取1个产品,该产品是次品的概率是()A)0、035B)0、04C)0、045D)0、05答案:A解析:设,,分别表示甲、乙、丙三厂生产;表示该产品是次品的概率[单选题]11.以下有关主成分分析,正确的是()。A)保留多少个主成分取决于累计方差在方差总和中所占百分比B)一般选择50%以上C)选择前两个就可以D)选择的数目和变量的个数一致答案:A解析:[单选题]12.三个逻辑回归模型A、B、C,AUC分别为0.53,0.72,0.8。那么我们一般认为这三个模型哪个的预测能力更强()A)AB)BC)CD)无法判断答案:C解析:AUC越接近1,表明模型预测能力越强。[单选题]13.关于为什么要计算均值估计的置信区间说法正确的是()A)用于判断总体有多大的百分比的个体,其数值等于均值的点估计B)用以决定随机抽样的类型C)用以评价随机抽样的有效性D)用以评价点估计的可靠性答案:D解析:区间估计的核心作用。[单选题]14.下列关于数据交易市场的说法中,错误的是()。A)数据交易市场是大数据产业发展到一定程度的产物B)商业化的数据交易活动催生了多方参与的第三方数据交易市场C)数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助D)数据交易市场是大数据资源化的必然产物答案:B解析:[单选题]15.?将总体中的所有单位()按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其它样本单位?,这种抽样方法称为()A)多阶段抽样(systematicB)分层随机抽样(stratifiedC)集群抽样(clusterD)系统抽样(systematic答案:D解析:根据定义。[单选题]16.关于相关关系有误的是()。A)按相关的程度分为完全相关、不完全相关和不相关B)按相关的特点分为单相关和多相关C)按相关的方向分为正相关和负相关D)按相关的形式分为线性相关和非线性相关。答案:B解析:[单选题]17.如果一组数据不是对称分布,按照切比雪夫不等式,至少约有()的观测值落在距均值4个标准差的区间范围内。A)75%B)89%C)94%D)98%答案:C解析:至少有75%的数据落在平均数加减2个标准差的范围之内至少有89%的数据落在平均数加减3个标准差的范围之内至少有94%的数据落在平均数加减4个标准差的范围之内[单选题]18.Hadoop-2.x集群中的HDFS的默认的副本块的个数是?A)3B)2C)1D)4答案:A解析:[单选题]19.下面哪种数据属于面板数据()。A)2010-2018年某网站年访问量数据B)2010-2017年全国各乡镇绿化面积年度数据C)2016年五一期间北京市地铁旅客接待总数D)2010-2017年某航空公司接待乘客人数的月度数据答案:B解析:面板数据,是指在时间序列上取多个截面。[单选题]20.在Flink技术架构中,以下哪项是流处理和批处理的计算引擎?A)StandaloneB)RuntimeC)FlinkCoreD)Datasteam答案:B解析:[单选题]21.在Zookeeper和Yarn的协同工作中,当ActiveResourcemanager产生故障时,StandbyResourcemanager会从以下哪些目录中获取Application相关信息?()A)metastoreB)StatestoreC)StatestoreD)Warehouse答案:B解析:[单选题]22.下面不属于面访式问卷调查优势的是()A)可提高调查的回答率B)可提高调查数据的质量C)能调节数据搜集所花费的时间D)适合于样本单位十分分散的情况答案:D解析:D是电话调查的优势。[单选题]23.下面哪一个循环会导致死循环?A)for(intk=0;k<0;k++)B)for(intk=10;k>0;k--)C)for[intk=0;k<10;k--)D)for(intk=0;k>0;k++)答案:C解析:[单选题]24.Kafka集群在运行期间,直接依赖于下面那些组件?A)HbaseB)SparkC)ZookeeperD)HDFS答案:C解析:[单选题]25.部署FusioninsightHD时,同一集群内的FlumeServer节点建议至少部署几个?A)7B)3C)4D)2答案:D解析:[单选题]26.统计图形中,常用于检查异常值的是()。A)Q-Q图B)箱线图C)帕累托图D)气泡图答案:B解析:[单选题]27.簇评估的作用有()。①确定数据集的聚类趋势。②确定正确的簇个数。③比较两个簇集,确定那个更好。④不引用附加信息,评估聚类分析结果对数据拟合情况A)①②B)②③④C)①②③D)①②③④答案:D解析:[单选题]28.在fusionlnsigh产品中关于kafka的topic.以下描述不正确的层A)topic的partition数量可以创建时配置B)每个topic只能被分成一个partition区C)每条发布到kafka的消息都有一个类别,这个类别被称为topic.也可以理解为一个存储消息的队列D)每个partition在存储层面对应一个10g文件,10g文件中记录了所有的消息数据答案:B解析:[单选题]29.以下对于zookeeper中的角色描述错误的是()A)Leader:负责进行投票的发起和决议。B)Follower:接受客户请求并向客户端返回结果C)Observer:接收客户端请求,参加投票D)Client:请求发起方答案:C解析:[单选题]30.在Spark生态组件中,那个产品可用于复杂的批量数据处理。()A)SparkCoreB)SparkSqlC)SparkStreamingD)MLlib答案:A解析:[单选题]31.以下不属于因子分析计算过程的步骤有()A)估计因子载荷矩阵B)进行因子旋转C)估计特殊因子得分D)估计公共因子(因子得分)答案:C解析:因子分析的计算过程大致可分为三步:①估计因子载荷矩阵,②进行因子旋转,③估计公共因子(因子得分)。特殊因子是指每个变量的个性部分,不是因子分析的内容。[单选题]32.以下关于一元线性回归分析中(y=b0+b1x+ε),描述错误的是()。A)一元线性回归中F检验的作用与t检验是一致的B)一元线性回归中F检验的检验统计量与t检验是一致的C)即便建立了一元线性回归,也不能直接认为x是y的原因D)如果用来预测的x,与样本中的自变量偏差很大,那么预测得到y的可靠性也会很低。答案:B解析:D选项是正确的,这是因为自变量远离样本中的x,置信区间就会很大,可靠性就会降低。[单选题]33.查询student表中记录数可以使用如下语句()A)selectB)selectC)selectD)select答案:B解析:在sql中用count语句进行记录数统计,count(*)表示统计所有记录数。[单选题]34.下列关于Java语言的特点,描述错误的是()A)Java是跨平台的编程语言B)Java支持分布式计算C)Java是面向过程的编程语言D)Java支持多线程答案:C解析:[单选题]35.参照以下信息选择能够正确创建orderinfo表的语句A)createB)createC)createD)create答案:A解析:本题考查SQL语句中建表、字段约束条件以及字段数据类型相关知识。其中建表语句结构为createtable表名(…),字段的约束条件为非空=notnull、唯一=unique、主键=primarykey。定长字符串类型为char,可变长字符串类型为varchar,小数类型通常使用float,但?金额?这类对数据精度要求较高的情况,应考虑使用decimal,整数类型为int。所以综合以上内容,本题的正确答案为A。[单选题]36.以下对众数的说法中,不对的是()。A)众数是出现的次数B)众数是一组数据中出现次数最多的数据数C)一组数据中的众数可能不存在D)D一组数据中可能存在多个众数答案:A解析:当有几个数的个数相等而且在这组数中是个数最多的数时,众数可能是某几个数而不一定仅仅是某一个数。[单选题]37.定义问题时通常使用以下哪种方法。()A)波特五力竞争分析B)5W2H分析法C)描述性统计分析D)决策树答案:B解析:[单选题]38.Hadooptnryarnschedulercapacity.root.Queueafinim.m-user-limit-percent设置为50,下面说法错误的是?A)一个用户提交任务,可以使用Queue的100%的资源。B)如果Queue中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源。C)Queue中必须保障每个用户至少得到50%的资源D)ueuea中的每个用户最多只能获得50%的资源答案:D解析:[单选题]39.有一段java应用程序,它的主类名是a1,那么保存它的源文件名可以是A)a1.javaB)a1.classC)a1D)都对答案:A解析:[单选题]40.关于fusionInsightHDStreaming的Supervisor描述正确的是?A)Supervisor是在Topology中接受数据然后执行处理的组件B)Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的Worker进程C)Supervisor负责资源分配和任务调度D)supervisor是运行具体处理逻辑的过程答案:B解析:[单选题]41.下列不可作为java语言标识符的是A)a1B)$1C)_1D)11答案:D解析:[单选题]42.()表示在先决条件X发生的情况下,由关联规则?X→Y?推出Y的概率。即在含有X的项集中,含有Y的可能性。A)置信度B)支持度C)关联度D)以上都不是答案:A解析:[单选题]43.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A)一个map读取64MB,另外一个map读取11MBB)64MBC)75MBD)128MB答案:A解析:[单选题]44.下列属于推断性统计分析的方法是()。A)大数定律B)中心极限定理C)相关分析D)回归分析答案:D解析:[单选题]45.找出这组数据:23、29、20、32、24、21、33、25的中位数。()A)23B)24C)27D)29答案:B解析:[单选题]46.查看kafka某Topic的partition详细信息时,使用如下那个命令?A)bin/kakfa-topicssh--createB)bin/kakfa-topicssh--deleteC)bin/kakfa-topics.sh-listD)bin/kakfa-topicssh--describe答案:D解析:[单选题]47.下面哪些场景不是Flink组件擅长的?A)批处理B)迭代计算C)流处理D)数据存储答案:B解析:[单选题]48.Hbase的某张表的Rowkey划分splitkey为9.E.a.2.请问表里面有几个Region?A)6B)3C)5D)4答案:C解析:[单选题]49.在数据分析工作中,在阶段,需要需统一语言和思想,用数据语言定义业务问题和想要达到的目标。A)数据收集B)数据处理C)明确分析目的和思路D)构建模型答案:C解析:[单选题]50.下面哪种方法更适合于对稀少群体和特定群体研究()A)滚雪球抽样B)配额抽样C)判断抽样D)多阶段抽样答案:A解析:这是滚雪球抽样的优势。[单选题]51.Hive中以下操作不正确的是()。A)loaddatainpathintotablenameB)insertintotablenameC)insertoverwritetablenameD)insertoverwriteintotablename答案:D解析:[单选题]52.是Spark集成的机器学习库。A)HadoopB)BigTableC)MahoutD)MLlib答案:D解析:[单选题]53.分析师小A在对他的模型进行评估时,更倾向选用调整R²作为指标。因为相比较R²,调整R²对拟合度的估计更加()A)高估B)低估C)一样D)不确定答案:B解析:调整R²能够有效的改进这种对于拟合度的高估,如果在模型中存在不重要的变量,那么调整R²将会降低。[单选题]54.YARN中设置队列Queue的最大使用资源里,需要配置哪个参数?A)yarn.scheduler.capacity.root.QueueA.user-limit-factorB)yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC)yarn.scheduler.capacity.root.QueueA.stateD)yarn.scheduler.capacity.root.QueueA.maxirnum-capacity答案:D解析:[单选题]55.以下哪个是分布式计算框架?A)HDFSB)SparkC)HBaseD)MLlib答案:B解析:[单选题]56.缺失数据(NullValue)的具体处理方法有很多种,下列哪种方法可得到较准确的结果?()A)填入一个通用的常数值,例如填入未知/UnknownB)把填补遗缺值的问题当作是分类或预测的问题C)填入该属性的整体平均值D)填入该属性的整体中位数答案:B解析:[单选题]57.关联规则的评价指标是()。A)均方误差、均方根误差B)Kappa统计、显著性检验C)支持度、置信度D)平均绝对误差、相对误差答案:C解析:[单选题]58.YARN中默认的资源调度器是?A)FIFO调度器B)容量调度器C)Fair调度器D)以上全不是答案:B解析:[单选题]59.HDFS中Namenode的主备仲裁是由哪个组件控制的()A)HDFSClientB)NodemanagerC)ResourcemanagerD)ZookeeperFailoverController答案:D解析:[单选题]60.Apriori算法使用哪个指标筛选项目集(Itemset)?()A)交易编号(TransactionID)B)最小支持度(MinimumSupport)C)最小信赖度(MinimumConfidence)D)购买数量答案:B解析:[单选题]61.检验单总体均值的过程中,如果是小样本,但总体标准差已知,检验统计量应该选择()。A)B)C)D)答案:A解析:见单总体均值检验概念[单选题]62.存在什么情况时,Wald检验不再有效()A)变量过多B)共线性C)异方差D)过拟合答案:B解析:当变量存在共线性时,Wald检验结果不可靠。[单选题]63.分析影响变压器正常运行的因素,预测变压器是否有故障,若有故障,故障为放电故障、过热故障、短路故障等的哪一种。这属于()算法的应用。A)分类B)聚类C)关联D)回归答案:A解析:[单选题]64.使用SQLAIchemy完成指定规则过滤记录的方法是A)filter()B)group0C)limit(D)order_by(答案:A解析:[单选题]65.常用的分箱方法错误的是()。A)等深分箱法B)等宽分箱法C)等距分箱法D)用户自定义区间法答案:C解析:[单选题]66.下列哪种异常是检查型异常,需要在编写程序时声明()A)NullPointerExceptionB)ClassCastExceptionC)FileNotFoundExceptionD)IndexOutOfBoundsException答案:C解析:[单选题]67.分析师在研究中发现ABC公司的销售额满足公式y()=3×y()+2×y()。那么请问这是一个几阶的时间序列呢()A)1B)2C)3D)4答案:C解析:时间序列方程中最多包含到y(t-p)项,则这个时间序列是p阶的。[单选题]68.从数据表中查找记录用以下哪一项()A)UPDATEB)FINDC)SELECTD)CREATE答案:C解析:[单选题]69.开始将N个样品各自作为一类,并规定样品之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其他类的距离,重复进行两个最近类的合并,每次少一类,直至所有的样品合并为一类,此种聚类方法是()。A)K-meansB)SOM聚类C)系统聚类D)有序聚类答案:C解析:系统聚类法(hierarchicalclustermethod)一译?分层聚类法?。聚类分析的一种方法。其做法是开始时把每个样品作为一类,然后把最靠近的样品(即距离最小的群品)首先聚为小类,再将已聚合的小类按其类间距离再合并,不断继续下去,最后把一切子类都聚合到一个大类。[单选题]70.分类模型评估指标呈现中,表示用了模型跟不用模型之间的差异的曲线叫做()。A)ROC曲线B)Lift曲线C)KS曲线D)捕获率曲线答案:B解析:[单选题]71.关于Dataset,下列说法不正确的是?A)Dataset不需要反序列化就可执行大部分操作B)Dataset是一个由特定域的对象组成的强类型集合C)Dataset与RDD高度类似性能比RDD好D)Dataset执行sort,filter,shuffle登操作需要进行反序列化答案:D解析:[单选题]72.在创建对象时必须A)先声明对象,然后才能使用对象B)先声明对象,为对象分配内存空间,然后才能使用对象C)先声明对象,为对象分配内存空间,对对象初始化,然后才能使用对象D)上述说法都对答案:C解析:[单选题]73.以下关于主键的描述正确的是()。A)标识表中唯一的实体B)创建唯一的索引,允许空值C)只允许以表中第一字段建立D)表中允许有多个主键答案:A解析:主键是表中的一个或多个字段,它的值用于惟一地标识表中的某一条记录。一个表中只能有一个主键,可以由一个或多个列组成的单主键或组合主键,主键的列不允许为空,主键列的值不能重复,Image和text类型的列不能设为主键。[单选题]74.FusioninsightManager用户权限管理不支持个配置?A)给用户配置角色B)给用户组配置角色C)给角色配置权限D)给用户组配置权限答案:D解析:[单选题]75.下列有关数据分析说法正确的是()。A)数据分析规定其操作流程分为5步B)SEMMA是数据挖掘项目方法论的名称C)数据分析只是针对大数据情形,小数据是没有意义的D)数据分析中模型的精度是第一位的答案:B解析:A项,没有明确规定的步骤数量;C项两类数据各有用处;D项,数据分析需要权衡成本、精度、效率等。[单选题]76.关于HBaseshell命令,哪个命令是使表无效。()A)alertB)disableC)dropD)以上都不是答案:B解析:[单选题]77.使用ORM模型插入数据时,需要将实例化对象添加到用户会话,使用的代码是(1。A)db.add(B)db.session.add()C)db.session()D)add.session()答案:B解析:[单选题]78.在MapReduce中,()组件是用户不指定也不会有默认的。A)CombinerB)OutputFormatC)PartitionerD)InputFormat答案:A解析:[单选题]79.在做前期样本规划时,训练集(Train)、验证集(Validation)和检验集(Test)样本量分配方案哪个比较适合?()A)训练50%,验证0%,检验50%B)训练100%,验证0%,检验0%C)训练0%,验证100%,检验0%D)训练60%,验证30%,检验10%答案:D解析:[单选题]80.以下不属于监督学习模型的是()A)支持向量机B)朴素贝叶斯C)关联分析D)线性回归答案:C解析:[单选题]81.小王为了运用逻辑回归进行反欺诈识别,直接从数据库中运用简单随机抽样的方法进行抽样,并得到了10000条样本,其中7000作为训练,3000作为测试,在测试集中小王的正负样本整体预测准确率为99.7%,下面表述错误的是()A)模型的整体预测准确率很高,因此可以认为模型结果是可靠的B)有必要进一步查看混淆矩阵C)有必要查看正负样本比例D)反欺诈问题中,运用简单随机抽样是欠妥的答案:A解析:反欺诈问题中,正负样本一般都是非对称的。不能直接抽样,需要处理样本比例。[单选题]82.下哪种不是Hive支持的数据类型()。A)tructB)ntC)apD)ong答案:D解析:[单选题]83.下列哪个是合法的Java标识符?A)Tree&GlassesB)FirstJavaAppletC)*theLastOneD)273.5答案:B解析:[单选题]84.如果需要对HBase表中的数据进行列表查看,可以使用()命令进行操作。A)countB)scanC)putD)get答案:B解析:[单选题]85.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A)用于存储Kafka数据的磁盘配置(如磁盘数目、磁盘大小等)无法满足当前业务数据流里,导致磁盘使用率达到上限B)数据保存时间配置过长,数据累积达到磁盘使用率上限C)业务规划不合理,导致数据分配不均,使部分盘达到使用率上限D)Broker节点故障导致答案:D解析:[单选题]86.()图形主要用于表示一个样本中各组成部分的数据占全部数据的比例,多用于研究结构性问题。A)饼图B)条形图C)折线图D)堆积图答案:A解析:[单选题]87.以下命令组成错误的是()A)vim/etc/profileB)source/etc/profileC)hadoopnamenode-formatD)bin/hadoopfs-cat/hadoopdata/y/txt答案:D解析:[单选题]88.一群人中,吃东北大米的占60%,吃原阳大米的占45%,两种均吃的30%,随机抽一人。则至少吃一种米的概率为()。A)0.82B)0.85C)0.8D)0.75答案:D解析:[单选题]89.Flume用于收集数据,其传输的数据基本单位是?A)SplitB)BlockC)EventD)Packet答案:C解析:[单选题]90.关于HBase下面说法正确的是()。A)HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列B)每个值是一个未经解释的字符串,没有数据类型,程序员要自己去对它进C)用户在表中存储数据,每一行都有一个可排序的行键和任意多的列D)以上说法都正确答案:D解析:[单选题]91.大数据的核心价值是(0A)数据交易B)数据分析C)数据融合D)数据处理答案:B解析:[单选题]92.以下针对缺失值的处理方法中,当一个连续变量缺失值超过85%,则哪种最合理?()A)直接使用该变量B)根据是否缺失,生成指示变量,仅使用指示变量作为解释变量C)使用多重插补的方法进行缺失值填补D)直接删除该变量答案:B解析:[单选题]93.建模前的数据准备和数据处理将占整个数据分析流程的时间。A)20%左右B)60%左右C)80%左右D)99%左右答案:C解析:[单选题]94.以下选项哪个不属于分类算法?()A)KNN算法B)逻辑回归C)C4.5算法D)TF-TDF算法答案:D解析:[单选题]95.存在关联规则为A→B,此规则的confidence为80%,则代表()。A)买B商品的顾客中,有80%的顾客会同时购买AB)同时购买A,B两商品的顾客,占所有顾客的80%C)买A商品的顾客中,有80%的顾客会同时购买BD)两商品A,B在交易数据库中同时被购买的机率为80%答案:C解析:[单选题]96.关于逻辑回归(Logisticregrssion)因变量和自变量的说法中,正确的是()。A)逻辑回归的因变量为数值变量B)逻辑回归的因变量为定性变量C)逻辑回归的自变量是定性变量D)逻辑回归的因变量只能有两种取值答案:B解析:[单选题]97.已知中国的成人平均身高服从正态分布。则在一次抽样中,取到的身高小于等于中位数的概率为()。A)5%B)50%C)小于50%D)无法计算答案:B解析:对称分布,中位数和均值重合。[单选题]98.以下哪种不是Hive支持的数据类型?A)StructB)IntC)MapD)Long答案:D解析:[单选题]99.Hive是以()技术为基础的数据仓库。A)HDFSB)MAPREDUCEC)HADOOPD)HBASE答案:C解析:[单选题]100.以下不能进行系统日志数据采集的工具是()。A)HadoopB)PythonC)ScribeD)Flume答案:B解析:Scribe是Facebook开源的日志收集系统[单选题]101.以下哪种说法不是K-Means算法的优点。()A)收敛较快B)选代次数一般为几次,较神经网络简单C)中心点的个数,通常值是在3-5个之间D)算法可能收敛到局部最优点答案:D解析:[单选题]102.HadoopMapReduce支持多种语言编程,下列说法不正确的是()。A)可以用JAVA语言编写MapReduce应用程序B)可以用C/C++语言编写MapReduce应用程序C)可以用Python语言编写MapReduce应用程序D)可以用javascript语言编写MapReduce应用程序答案:D解析:[单选题]103.HBase分布式模式最好需要()个节点?A)1B)2C)3D)最少答案:C解析:[单选题]104.Hbase中数据存储的文件格式是什么?A)HlogB)TextfileC)HFlleD)sequencerlle答案:C解析:[单选题]105.每月例会报告的经营指标汇总,属于哪类数据分析。()A)客户行为的数据挖掘报告B)描述性数据分析报告C)产品和行为倾向报告D)以上都不对答案:B解析:按照惯例经营指标汇总,通常是报告业绩指标的数量、金额、百分比或排名等信息,这类分析多数归属于描述性数据分析,而且是单变量分析的内容。AC项涉及行为特点和商品特征的关系,属于多变量分析的内容。多选题共20题,共40.0分[单选题]106.对Apriori算法,下列选项中表述有误的是()。A)Apriori算法是关联分析中最常用的算法之一。B)应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等闻值。C)应用Apriorl算法时,输入的数据可以是连续型数据也可以是离散型数据。D)Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量答案:C解析:[单选题]107.使用Hbase客户端批量写入10条数据,某个Hregionserver节点上包含该表的2个Region,分别为A和B,10条数据中有6条属于A,4条属于B,请问写入这10条数据需要向该HregionServer发送几次RPC请求?A)10B)6C)2D)1答案:D解析:[单选题]108.HBase依靠()存储底层数据A)HDFSB)HadoopC)MemoryD)MapReduce答案:A解析:[单选题]109.以下有关数据清洗的表述中,正确的是()。A)运用验证数据集中变量的统计量对训练集中的变量进行数据清洗B)运用验证数据集中变量的统计量对验证集中的变量进行数据清洗C)运用训练数据集中变量的统计量对验证集中的变量进行数据清洗D)以上均不对答案:C解析:[单选题]110.Hbase的主Master是如何选举的?A)由Regionserver进行裁决B)Master为双模式,不需要进行裁决C)通过Zookeeper进行裁决D)随机选举答案:C解析:[单选题]111.下图横轴为X,纵轴为Y,则关于下图描述错误的是()A)X和Y之间很大可能是非线性关系B)这些散点中存在异常点C)X和Y之间是正相关的D)分析两者之间的关系可用逻辑回归模型答案:D解析:都是数值变量,不能用逻辑回归。[单选题]112.实际应用中,如果想要研究单个指标的方差对结果的影响,在做主成分分析的时候应该选择使用()A)协方差矩阵B)相关系数矩阵C)关联矩阵D)三者皆可答案:A解析:主成分分析时可以使用协方差矩阵或者相关系数矩阵。相关系数矩阵就是随机变量标准化后的协方差矩阵。通过随机变量的标准化,相关系数矩阵剥离了单个指标的方差,仅保留指标间的相关性。而协方差矩阵更适用于研究单个指标的方法对结果的影响。[单选题]113.有一款产品的尺寸标准长度为10cm,现在分别用A和B两台设备来生产这一产品,分别各随机抽取100个样品,A设备生产的样本长度标准差为0.01,B设备生产的样本长度标准差为0.011,现在需要比较两台设备在产品长度指标上的稳定性是否有显著差异?我们应该选择()A)单侧t检验B)双侧t检验C)单侧F检验D)双侧F检验答案:D解析:是否有显著差异=双侧,比较方差用F。[单选题]114.如果希望某个变量只可以被类本身访问和调用,则应该使用下列那一种访问控制修饰符A)privateB)protectedC)privateprotectedD)public答案:A解析:[单选题]115.以下关于继承的叙述正确的是()A)在Java中类只允许单一继承B)在Java中一个类只能实一个授口C)在Java中一个类不能同时继承-个类和实现个接口D)在Java中接口只允许单一继承答案:A解析:[单选题]116.HBase的Region组成中,必须要有以下一项。A)StoreFileB)MemStoreC)HFileD)MetaStore答案:B解析:[单选题]117.为什么要在类神经网络中计算误差值?()A)调整输入值B)调整隐藏层个数C)调整权重(Weight)D)调整真实值答案:C解析:[单选题]118.满足最小支持度阈值(minsup)的所有项集称为()。A)项B)项集C)频繁项集D)频繁K项集答案:C解析:第2部分:多项选择题,共74题,每题至少两个正确答案,多选或少选均不得分。[多选题]119.HadoopHDFS的设计目标包括()。A)兼容廉价的硬件设备B)支持大数据集C)支持简单的文件模型D)跨平台性答案:ABCD解析:[多选题]120.大数据人才整体上需要具备()等核心知识。A)数学与统计知识B)计算机相关知识C)马克思主义哲学知识D)市场运营管理知识答案:AB解析:[多选题]121.目前Fusioninsight有哪些子产品()A)FusionInsightHDB)FusionInsightFarmerC)FusionInsightMinerD)FusionlnsightMPPDB答案:ABCD解析:[多选题]122.宁家骏委员指出,()主导了21世纪。A)云计算B)移动支付C)大数据D)物联网答案:ACD解析:[多选题]123.层次聚类的聚类方式有()。A)凝聚方式聚类B)分解方式聚类C)Q型聚类D)R型聚类答案:AB解析:[多选题]124.以下关于华为大数据解决方案说法正确的是()A)GAUSSDB是一款开源数据库产品B)Farmer是数据服务框架C)FusionInsightManager是一个分布式系统管理框架,管理员可以通过多接入点操控分布式集群D)FusioninsightHD是基于开源大数据软件Hadoop的增强版本答案:ABCD解析:[多选题]125.以下有关误差的说法中,正确的是()。A)相对误差反映实际观测值与预测值之间差异的相对程度B)平均误差反映实际观测値与预测值之间的平均差异C)评价预测精度是通过测量与分析预测误差进行的D)绝对误差是实际观测值与预测值的离差答案:ABCD解析:[多选题]126.SparkContext可以从哪些位置读取数据A)本地磁盘B)webC)hdfsD)内存答案:ACD解析:[多选题]127.大数据的价值体现在()A)大数据给思维方式带来了冲击B)大数据为政策制定提供科学依据C)大数据助力智慧城市提升公共服务水平D)大数据实现了精准营销答案:ABCD解析:[多选题]128.大数据产生的经历了哪些阶段。()A)数据积累阶段B)运营式系统阶段C)用户原创内容阶段D)感知式系统阶段答案:BCD解析:[多选题]129.数据分析级别包括以下哪几种()A)即席查询B)多维分析(又称为钻取或者OLAP)C)统计分析与警报D)与业务人员协商知识点答案:ABC解析:考察数据分析的八个层次,需要在理解的基础上加以记忆。[多选题]130.决策树法分析问题的主要步骤为()。A)结构化问题B)设计可能结果发生的概率C)设计结果的得益D)分析问题答案:ABCD解析:[多选题]131.Master的ElectedLeader事件后不做哪些操作()A)通知driverB)通知workerC)注册applicationD)直接ALIVE答案:ABC解析:[多选题]132.Logistic建模时,如果变量Area=C时,Y取值均为1,无法确定是否出现的是哪个问题()。A)共线性B)异常值C)拟完全分离(Quasi-completeseparation)D)缺失值答案:ABD解析:[多选题]133.YARN客里调度器的主要特点有哪些?A)容里保证B)灵活比C)多重租赁D)动态更新配置文件答案:ABCD解析:[多选题]134.维归约即摒弃掉不重要的特征,用少数的关键特征来描述数据。常用的维归约处理方法有()。A)主成分分析B)特征提取C)奇异值分解D)特征加权答案:AC解析:[多选题]135.数据流如何Transformation之间传输数据,数据流可以分为那些类型?A)一对一流B)distributing流C)一对多流D)redistributing流答案:AC解析:[多选题]136.调研分析可以采用以下哪种思路。()A)相关分析法B)总分总C)归因分析法D)抽样法答案:BC解析:[多选题]137.下列哪些分类预测方法可适用有连续型变量的自变量?()A)逻辑回归B)神经网络C)SVM算法D)C4.5算法答案:ABC解析:[多选题]138.下列感些选项是安装HBase前所必须安装的?CA)操作系统B)JDKC)ShellScriptD)JavaCode答案:AB解析:[多选题]139.聚类模型构建时,通常采用的相似性统计量计算方法为()。A)绝对距离B)欧式距离C)夹角余弦D)相关系数答案:AB解析:[多选题]140.可以用于分类指标呈现的方式有以下哪些。()A)混淆矩阵B)ROC曲线C)气泡图D)增益图答案:ABD解析:[多选题]141.Hbase集群定时执行Compaction的目的是什么?A)减少同一个Region同个Columnfamily下的文件数目B)减少同一个Region的文件数目C)提升数据读取牲能D)提升数据写入能力答案:ABCD解析:[多选题]142.下列属于描述性统计中,用来度量离散程度的有()。A)标准差B)协方差C)四分位差D)异众比率答案:ACD解析:协方差是度量相关性的[多选题]143.Flume适用于以下哪些场景的数据收集?()A)Thrift,Avro,Syslog,Kafka等数据源上收集数据B)本地文件数据采集C)应用系统产生的日志采集D)大量数据的实时数据采集答案:ABC解析:[多选题]144.Hadoop集群中关于机架配置的描述正确的是()。A)如果一个机架出问题,不会影响数据读写B)写入数据的时候会写到不同机架的DataNode中C)写入数据的时候会写到随机机架的DataNode中D)MapReduce会根据机架获取离自己比较近的网络数据答案:ABD解析:[多选题]145.MLlib包括A)分类模型B)聚类模型C)特征抽取D)统计模型答案:ABCD解析:[多选题]146.下面对LSM结构描述正确的是?A)顺序存储B)直接写硬盘C)需要将数据Flush到磁盘D)是一种搜索平衡树答案:AC解析:[多选题]147.大数据有()特点。A)数据量大B)速度快、时效高C)类型多D)价值密度低、含量大答案:ABCD解析:[多选题]148.HBase构建二级索引的实现方式有哪些?A)MapReduceB)CoprocessorC)BloomFilterD)Filter答案:AB解析:[多选题]149.可以用于企业竞争环境和行业分析的方法有()。A)4P理论B)PEST分析法C)SWOT分析法D)波特五力竞争分析答案:BCD解析:[多选题]150.HBase性能优化包含下面的哪些选项?A)读优化B)写优化C)配置优化D)JVM优化答案:ABCD解析:[多选题]151.有关假设检验说法正确的是()A)采用反证法的逻辑B)应用了小概率原理C)不同的问题需要使用不同的检验统计量D)显著性水平是一个概率值,表示原假设为真时,拒绝原假设的概率答案:ABCD解析:这些都是假设检验的核心概念[多选题]152.Cloudera提供哪几种安装CDH的方法?A)ClouderamanagerB)TarbalC)YumD)Rpm答案:ABCD解析:[多选题]153.数据分析报告一般分为哪些层次。()A)需求层B)数据层C)分析层D)输出层答案:ABCD解析:[多选题]154.flink支持的时间操作类型包括以下哪些选项?A)结束时间B)处理时间C)采集时间D)事件时间答案:BD解析:[多选题]155.Hadoop的核心组件包括()。A)MapReduceB)HDFSC)HiveD)Pig答案:AB解析:[多选题]156.HBase读数据时需要读取哪几部分数据()?A)HFileB)HlogC)MemStoreD)HDFS答案:AC解析:[多选题]157.Hbase的数据文件HFile中一个Keyvalue格式包括哪些信息?A)keyB)valueC)TimestampD)KeyType答案:BC解析:[多选题]158.Loader可以实现以下哪些转换规则?A)长整型时间转换B)拼接转换C)增量转换D)空值转换答案:ABCD解析:[多选题]159.与开源sqoop相比,loader具有哪些增强特性?()A)高可靠性B)高性能C)安全性D)图形化答案:ABCD解析:[多选题]160.ResoureManager主要作用是什么()?A)调度器B)应用程序管理器C)节点资源管理D)节点资源管理答案:AC解析:[多选题]161.执行Hbase读数据业务,需要读取哪几部分数据?A)HLogB)HMasterC)HfileD)Memstore答案:CD解析:[多选题]162.下面哪些选项正确描述了HBase的特性?A)4高可靠性B)高性能C)面向列D)可伸缩答案:ABCD解析:[多选题]163.时间序列预测方法分为()。A)平滑法预测B)ARIMA模型预测C)Winter法D)不能确定答案:AB解析:[多选题]164.回归平方和(ESS)是指()。A)被解释变量的实际值与平均值的离差平方和B)被解释变量的回归值与平均值的离差平方和C)被解释变量的总变差与剩余变差之差D)解释变量变动所引起的被解释变量的变差答案:BCD解析:[多选题]165.以下关于主成分分析的描述正确的有()A)主成分分析选取能够最大化解释数据变异的成分B)在主成分分析中,对应最大特征值的特征向量,其方向正是协方差矩阵变异最大的方向C)主成分分析算法中第一个主成分对应的不应超过1D)我们一般使得保留的前k个主成分累计能够解释数据80%以上的变异答案:ABD解析:在主成分分析算法中,我们一般要求最后一个主成分对应的不应小于1。[多选题]166.数据分析挖掘流程包括哪些?A)明确分析目的和思路B)数据收集C)构建模型和模型评估D)数据应用和报告撰写答案:ABCD解析:[多选题]167.以下关于对应分析的表述,正确的是()A)对应分析的实质是通过降维投射,把列联表中的信息在低维图中进行展示B)对应分析是一种在主成分分析基础上发展而来的多元统计分析方法C)对应分析更关心行与列之间关系的发现D)在进行对应分析时,一般情况下信息的保留程度不应该低于80%答案:ABCD解析:[多选题]168.主成分分析中确定主成份个数是关键步骤,其大致原则包括()。A)特征根值大于B)特征根值大于0.8C)累积特征根值加总占总特征根值的80%以上D)累积特征根值加总占总特征根值的90%以上答案:AC解析:[多选题]169.以下选项中可以用于预测Y为分类变量的方法有()。A)伽玛回归B)泊松回归C)Logistic回归D)Probit回归答案:CD解析:[多选题]170.一个理想的决策树需要满足的条件是()。A)叶子结点数最少B)叶子结点深度最小C)叶子结点数最多D)叶子结点深度最大答案:AB解析:[多选题]171.常用的数据挖掘编程工具有()。A)SASB)StataC)MatLaBD)R答案:ABCD解析:[多选题]172.在Fusioninsight集群中,Spark主要与以下哪些组件进行交互?)A)ABDB)YARNC)HiveD)Zookeeper答案:ABD解析:[多选题]173.以下哪些是Kafka实际的应用场景?A)网站活性跟踪B)日志收集C)聚合统计系统运营数据(监控数据D)资源管理答案:ABC解析:[多选题]174.SparkRdd转换算子有()A)mapB)filterC)mapPartitionsD)collect答案:ABC解析:[多选题]175.以下对SPARK的描述,正确的是()?A)高性能内存迭代计算框架B)内存计算一站式解决方案C)性能差D)支持多语言快速开发应用答案:ABD解析:[多选题]176.以下关于DBSCAN算法说法正确的是()。A)可以对任意形状的稠密数据集进行聚类B)样本集的密度不均匀时,聚类质量较好C)可以在聚类的同时发现异常点,对数据集中的异常点不敏感D)聚类结果没有偏倚答案:ABC解析:[多选题]177.按照涉及自变量的多少,可以将回归分析分为()A)线性回归分析B)非线性回归分析C)一元回归分析D)多元回归分析答案:CD解析:[多选题]178.FusioninsightHD系统使用Streaming客户端Shell命令查看拓扑或者提交拓扑失败,以下哪些定位手段是正确的()?A)查看Supervisor运行日志,判断是否Superisor异常B)查看Worker运行日志C)查看主Nimbus的运行日志判断是否Nimbus服务端异常D)看客户端异常堆栈,判断是否客户端使用问题答案:CD解析:[多选题]179.Excel是MicrosoftOffice的组件之一,可以实现(A)数据处理B)统计分析C)数据可视化显示D)辅助决策答案:ABCD解析:[多选题]180.下面属于Hadoop生态圈组件的是()。A)MapReduceB)HiveC)HBaseD)Java答案:ABC解析:[多选题]181.以下关于Fusioninsight中carborData说法正确的有?()A)使用Carbon的目的是对大数据即席查询提供超快速响应。B)Carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据可以减少60%-80%数据存储空间,大大节省硬件存储成本。C)Cabonr是一种新型ApacheHadoop本地文件格式,使用先进的列式存储,索引,压缩和编码技木,以提高计算效率有助于加速超过PB数量级的数据查询,可用于更换的交互查询。D)Carbon也是一种将数据源与Spark集成的高性能分析引擎答案:ABCD解析:[多选题]182.HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。A)是byte[]数组B)没有固定的结构C)数据的大小是定长的D)有固定的结构答案:AD解析:[多选题]183.关于HadoopHDFS块的概念,下面说法正确的是(A)块是HDFS的核心概念,HDFS为了分摊磁盘读写的开销,也就是在大量数B)Hadoop1.x中,默认为64MB可以调大,但不是越大越好,块的大小设C)Hadoop1.x中,默认为128MB,可以调大,越大越好,块的大小设定不受D)HDFS的一个块通常要比普通文件大的多答案:ABD解析:[多选题]184.以下哪些数据源可以通过Loader实现与FusionlnghtHD的数据交换?()A)NoSQLB)FTPServerC)SFTPServerD)MySQL答案:ABCD解析:[多选题]185.预测性数据挖掘包括哪些方法?A)分类B)数据总结C)回归D)时间序列答案:ACD解析:[多选题]186.数据清理中,处理缺失值的方法是?A)估算B)整例删除C)变量删除D)成对删除答案:ABC解析:[多选题]187.变量?行业?的类型有?制造?、?金融?、?通信?、?其他?,如果将?行业?转为哑变量,某企业属于金融行业,那么下面对于这个企业的行业类型记录正确的是()A)B)C)D)答案:BCD解析:哑变量对应的变量数=分类数-1[多选题]188.关于数据副本的存放策略正确的有些?A)第三个副本:与第一个副本相同机架的其他节点上;B)更多副本:随机节点。C)第一个副本,放置在上传文件的数据节点:D)第二个副本,放置在与第一个副本不同的机架的节点上;答案:ABCD解析:[多选题]189.Hadoop的三种安装模式包括以下哪种?A)两分式模式B)完全分布式模式C)伪分布模式D)单机模式答案:BCD解析:[多选题]190.Hadoop系统中YARN支持哪些资源类型的管理?A)内存B)CPUC)网络D)磁盘空间答案:AB解析:[多选题]191.下面哪些属数据库事务的ACID特性A)唯一性B)一致性C)隔离性D)持久性答案:BCD解析:[多选题]192.HBase官方版本可以安装在()操作系统上。A)CentOSB)UbuntuC)RedHatD)Windows答案:ABC解析:第3部分:判断题,共68题,请判断题目是否正确。[判断题]193.驱动型source是flume周期性主动去获取数据。A)正确B)错误答案:错解析:[判断题]194.在Flink中,checkpoint机制能明在运行过程中出现失败时,从某一个检查点恢复,在此过程中,流快照是根据数据流入依次创建的。A)正确B)错误答案:对解析:[判断题]195.FP-growth算法是一种于分类预算方法。A)正确B)错误答案:错解析:[判断题]196.一个Java源程序文件中可以定义若干个类A)正确B)错误答案:对解析:[判断题]197.在数据分析中,我们发现通常重要的结果只占其中一小部分,约20%,其余80%尽管是多数,却是次要的。这个法则叫帕累托法则。A)正确B)错误答案:对解析:[判断题]198.在噪声数据中,波动数据比离群点数据偏离整体水平更大。A)正确B)错误答案:错解析:[判断题]199.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,并不会保存消息。A)正确B)错误答案:错解析:[判断题]200.屋声值处理方法主要有分箱、分类和聚类。A)正确B)错误答案:错解析:[判断题]201.Mapreduce过程中、默认情况下,一个分片就是一个块,也是一个maptask..A)正确B)错误答案:对解析:[判断题]202.topology的处理逻辑都在Bolt中()A)正确B)错误答案:对解析:[判断题]203.scala中基本数据类型和java完全一致A)正确B)错误答案:错解析:[判断题]204.Channel的作用类似队列,用于临时缓存进来的数据,当Sink成功地将数据发送到下一跳的Channel或最终目的,数据会从Channe1移除()A)正确B)错误答案:对解析:[判断题]205.无论是低维数据还是高维数据,DBSCAN的空间复杂度始终都是O(m)。A)正确B)错误答案:对解析:[判断题]206.在数据缺失严重时,会对分析结果造成较大影响,因此对剔除的异常值以及缺失值,要采用合理的方法进行填补,常见的方法有平均值填充、K最近距离法、回归法、极大似线估计法等。A)正确B)错误答案:对解析:[判断题]207.HBase系统适合进行多表联合查询以及复杂性读写操作。()A)正确B)错误答案:错解析:[判断题]208.KafkaProducer读数据总体流程是,Producer连接任意存活的Broker,请求制定Topic、Partition的Leader元数据信息,然后直接与对应的Broker直接连接,发布数据。A)正确B)错误答案:错解析:[判断题]209.相比神经网络算法来看,决策树算法的可解释性较差。A)正确B)错误答案:错解析:[判断题]210.解决汉诺塔的问题使用的思想是函数的递归。()A)正确B)错误答案:对解析:[判断题]211.支持度是对关联规则的准确度的衡量。A)正确B)错误答案:错解析:[判断题]212.赋值运算中的左值必须是变量A)正确B)错误答案:对解析:[判断题]213.随机二次抽样法是通过多次重复的使用交叉检验法,来得到一组准确率等效果的指标。A)正确B)错误答案:错解析:[判断题]214.编译后的Java应用程序可由Java.exe解释执行A)正确B)错误答案:对解析:[判断题]215.server,channels.chi,transactioncapacity表示事务大小,即当前channe支持事务处理的事件个数,可和source的batchsize设置为同样大小,但不小于batchsize()A)正确B)错误答案:对解析:[判断题]216.饼图一般将最大部分设置在12点指针的左边以强调其重要性,将第二大部分设置在12点的右边,其余的逆时针方向跟进,最小的切片就会落在靠近图表底部-最不重要的位置。A)正确B)错误答案:错解析:[判断题]217.Spark任务的每个stage可划分为job,划分的标记是shuffleA)正确B)错误答案:错解析:[判断题]218.建立回归模型之前,必须先进行主成分分析。A)正确B)错误答案:错解析:[判断题]219.HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置由DataNode确定A)正确B)错误答案:错解析:[判断题]220.数据主动产生是在用户原创内容阶段。A)正确B)错误答案:对解析:[判断题]221.数据是指对客观事件进行记录并可以鉴别的数字。A)正确B)错误答案:错解析:[判断题]222.DBSCAN算法会把包括噪声点的所有点划分到各自的簇中。A)正确B)错误答案:错解析:[判断题]223.在Flask项目中定义路由时,只能使用装饰器的方法()。A)正确B)错误答案:错解析:[判断题]224.spark的onyarnclient模式启动命令为s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论