




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:大数据挖掘技术练习大数据挖掘技术练习(习题卷17)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据挖掘技术练习第1部分:单项选择题,共51题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.通过4G信令+宽带信令+掌厅APP数据关联分析,可以对用户终端连接WIFI识别的行为不包括A)移动终端WIFI连移动宽带B)移动终端WIFI连异网宽带C)异网终端WIFI连移动宽带D)异网终端WIFI连异网宽带答案:D解析:[单选题]2.()博士和洪小文一起构建了世界上第一个大词汇量、非特定人、连续语音A)瑞迪B)李开复C)吴军D)弗雷德答案:B解析:[单选题]3.EPC核心网网元SGW主要功能不包括()A)移动性及切换支持B)计费C)IP地址分配D)合法监听答案:C解析:[单选题]4.在计算时,取其中,是()A)一个学习率,取值为0~1B)一个学习率,取值为-1~1C)一个阈值,取值为0~1D)一个阈值,取值为一1~1答案:A解析:[单选题]5.有些数据挖掘算法,要求数据属性是标称类别,当数据中包含数值属性时,为了使用这些算法需要将数值属性转换成标称属性。通过采取各种方法将数值属性的值域划分成一些小的区间,并将这连续的小区间与离散的值关联起来,每个区间看作一个类别。例如,某个问题中的年龄属性一种可能的划分成类别操作是:[0…11]→儿童,[12…17]→青少年,[18…44]→青年,[45…69]→中年,[69…∞]→老年。这种将连续变量划分成不同类别的过程通常称为()。A)特征化B)优化C)标准化D)离散化答案:D解析:[单选题]6.只有非零值才重要的二元属性被称作A)计数属性B)离散属性C)非对称的二元属性D)对称属性答案:C解析:[单选题]7.容量估算与()互相影响A)链路预算B)PCI规划C)建网成本D)网络优化答案:A解析:[单选题]8.GY口通过什么消息进行能力协商A)CER/CEAB)CER/CCAC)DWR/DWAD)RAR/RAA答案:A解析:[单选题]9.RFM方法中的F说明客户的()A)兴趣度B)粘性C)当前价值D)未来价值答案:A解析:[单选题]10.关于OLAP和OLTP的区别描述,不正确的是:()A)OLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同B)与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务C)OLAP的特点在于事务量大,但事务内容比较简单且重复率高D)OLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的答案:C解析:[单选题]11.在数据预处理中,将错误的、不一致的数据予以更正或删除,以免影响挖掘结果的正确性,这一过程称为()A)数据提取B)数据转换C)数据清理D)数据加载答案:C解析:[单选题]12.()是统计学的基础,是统计学里面最重要的概率分布A)正态分布;B)静态分布C)动态分布D)稳态分布答案:A解析:[单选题]13.在基本K均值算法里,当邻近度函数采用()的时候,合适的质心是簇中各点的中位数。A)曼哈顿距离B)平方欧几里德距离C)余弦距离D)Bregman散度答案:A解析:[单选题]14.()是K-Means内部指标A)Jaccard系数B)FM指数C)DB指数D)Rand(兰德)指数答案:C解析:[单选题]15.物联网业务的DNS解析环节DNS解析返回的错误码为Resultcode=1,代表何种含义A)成功B)格式错误,无法解析C)域名服务器错误D)DNS不支持该请求答案:B解析:[单选题]16.关于OLAP和OLTP的说法,下列不正确的是:A)OLAP事务量大,但事务内容比较简单且重复率高.B)OLAP的最终数据来源与OLTP不一样.C)OLTP面对的是决策人员和高层管理人员.D)OLTP以应用为核心,是应用驱动的.答案:A解析:[单选题]17.IP报文头中固定长度部分为多少字节()A)10B)20C)30D)40答案:B解析:[单选题]18.在数据分析和处理方面具有分析方法丰富、分析模型扩展差、数据挖掘能力强等特点的分析工具是()。A)WekaB)SPSSC)SASD)R答案:B解析:[单选题]19.LTE中的TA概念哪个是错误的()A)TAI由MCC+MNC+TAC三部分组成B)TAC的FQDN格式为:tac-hb<x1x2>.tac-lb<x3x4>.tac.epc.mnc<MNC>.mcc<MCC>.3C)TAC与LAC可重叠使用D)一个TA可由一个或多个小区构成答案:B解析:[单选题]20.下列选取节点的表达式中,代表着从根节点开始选取的是____。A)/B)//C)nameD)@答案:A解析:[单选题]21.有关OnRetDw系统的叙述中正确的是()A)OnRetDW系统是一个实现在线交易的系统B)OnRetDW系统是一个可以完成任意商品信息分析的系统C)OnRetDW系统是一个面向特定主题的数据仓库系统D)以上都不对答案:C解析:[单选题]22.资金的时间价值是()A)同一资金在同一时点上价值量的差额B)同一资金在不同时点上价值量的差额C)不同资金在同一时点上价值量的差额D)不同资金在不同时点上价值量的差额答案:B解析:[单选题]23.请问以下何者属于时间序列的问题?A)信用卡发卡银行侦测潜在的卡奴B)基金经理人针对个股做出未来价格预测C)电信公司将人户区分为数个群体D)以上均不是答案:B解析:[单选题]24.在Scikit-learn模块下,不同分类模型在预测时,调用的方法名称()。A)相同B)视情况而定C)不知道D)不同答案:A解析:[单选题]25.要求满足连接条件的记录,以及连接条件左侧表中的记录都包含在结果中,应使用______。A)左连接B)右连接C)内部连接D)完全连接答案:A解析:[单选题]26.什么是KDD?A)数据挖掘与知识发现B)领域知识发现C)文档知识发现D)动态知识发现答案:A解析:[单选题]27.在比较模型的拟合效果时,甲、乙、丙、丁四个模型的决定系数R^2的值分别约为0.96、0.85、0.80和0.7,则拟合效果好的模型是()。A)丁B)乙C)丙D)甲答案:D解析:[单选题]28.关于python说法错误的是()A)python字典中的?健?可以是元组B)python集合中元素不允许重复C)python字典中的?值?不允许重复D)python集合中的元素可以是列表答案:D解析:[单选题]29.有关朴素贝叶斯分类算法的叙述中正确的是()A)朴素贝叶斯分类算法是一种精确的分类算法B)采用朴素贝叶斯分类算法将一个样本分到某个类别中,表示它100%属于该类别C)朴素贝叶斯分类算法是一种基于概率的分类算法D)以上都不对答案:C解析:[单选题]30.以下哪个指标不能用于线性回归中的模型比较()A)R方B)调整R方C)AICD)BIC答案:A解析:[单选题]31.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?A)根据内容检索B)建模描述C)预测建模D)寻找模式和规则答案:C解析:[单选题]32.在上题中,属于定量的属性类型是:A)标称B)序数C)区间D)相异答案:C解析:[单选题]33.UE和MME间的RRC连接以及s1连接释放后,UE的EMM和ECM状态正确的是A)Deregistered;idleB)Registered;ConnectedC)Registered;idleD)Deregistered;Connected答案:A解析:[单选题]34.运行以下代码?importmatplotlib.pyplotasplt?引入plt后,要绘制折线图,需要利用的函数为()。A)plt.pie()B)plt.hist()C)plt.plot()D)plt.bar()答案:C解析:[单选题]35.准备好数据,进行深度学习建模时,第一步需要做的是()A)确定激活函数B)选择网络结构C)定义学习目标D)选择优化算法答案:B解析:[单选题]36.人工智能时代来临,新竞技将更加残酷,在商场上可行的是()A)不放弃既原有市场,寄望通过专利保护来阻挡新技术B)面对革命性的技术出现,依然固守传统思维与产品C)退出商场D)开放的心态迎接人工智能的到来,积极适应新市场,学习创造新技术答案:D解析:[单选题]37.设X={1,2,3}是频繁项集,则可由X产生____个关联规则。A)4B)5C)6D)7答案:C解析:[单选题]38.对MOLAP和ROLAP的比较中错误的是()A)MOLAP的查询能力一般较好,而在ROLPA中进行查询,往往很难预料查询结果B)MOLAP所需要的数据加载时间较长,而ROLAP的数据加载时间比MOLAP短C)ROLAP比MOLAP的分析速度要快很多D)MOLAP在分析过程中精度较高,具有分析的优势答案:C解析:[单选题]39.有关数据抽取工具的叙述中正确的是()A)只能使用数据仓库开发工具所提供的数据抽取工具B)只能使用开发人员自己开发的数据抽取工具C)根据实际需要确定是否自己开发数据抽取工具D)以上都不对答案:C解析:[单选题]40.迈克尔·波特的?五力模型?中,五种竞争力量中不包括()A)新进入者B)供应商议价能力C)其他利益相关者力量D)行业中现有竞争者答案:C解析:[单选题]41.数值预测用于连续变量的取值,常用的预测方法是()A)关联B)聚类C)回归分析D)分类答案:C解析:[单选题]42.在进行VOLTE端到端八元六阶定界时,下列哪个不属于六阶A)附着B)TAUC)eSRVCC切换D)语音质量答案:B解析:[单选题]43.Logistic回归是在商业领域上使用最广泛的预测模型,常用于()分类变量预测和概率预测。A)四值B)三值C)二值D)一值答案:C解析:[单选题]44.OLAP的含义是()A)面向对象分析处理B)面向过程分析处理C)联机事务处理D)联机分析处理答案:D解析:[单选题]45.三层神经网络中,()可以有一层或多层。A)输入层B)输出层C)隐藏层D)前馈层答案:C解析:[单选题]46.关于SQLServer分析服务的叙述中正确的是()A)SQLServer分析服务是关系数据库开发工具限B)SQLServer分析服务可以用于OLAPC)SQLServer分析服务是操作型数据库系统开发工具D)以上都不对答案:B解析:[单选题]47.在FP-GROWTH算法中,已构造FP-Tree如图则项I5的条件模式基为A)<(I1,I2:1)>、<I1,I3:1>B)<(I2,I1:1)>、<I2,I1,I3:1>C)<(I2,I1:1)>、<I1,I3,I2:1>D)<(I1,I2:1)>、<I2,I1,I3:1>答案:B解析:[单选题]48.当时间序列数据点的一阶差分近似为一常数,可配合以下哪种预测模型()A)直线B)二次抛物线C)三次抛物线D)指数曲线答案:A解析:[单选题]49.来自集中性能管理系统的指标是A)4G最差小区占比(%)B)交通枢纽VoLTE接通率(%)C)高利用率MGCF占比(%)D)网络安全重大事件次数(次)答案:B解析:[单选题]50.哪个是在后续平行节点中返回一个a标签的方法?A)find('a')B)find_previous_sibling(a)C)find_next_siblings('a')D)find_next_sibling('a')答案:D解析:题型:[单选题]51.模型构建指基于()数据构建数据挖掘模型。A)线上B)线下C)实时D)历史答案:D解析:第2部分:多项选择题,共17题,每题至少两个正确答案,多选或少选均不得分。[多选题]52.预处理的任务有哪些()。A)特征提取与特征选择B)数据清洗C)数据规范化D)数据离散化答案:ABCD解析:[多选题]53.以下说法正确的有()A)评价预测精度是通过测量与分析预测误差进行的B)绝对误差是实际观测值与预测值的离差C)相对误差反映实际观测值与预测值之间差异的相对程度D)平均误差反映实际观测值与预测值之间的平均差异答案:ABCD解析:[多选题]54.以下算法中对缺失值敏感的有()A)Logistic回归B)SVM算法C)CART决策树D)朴素贝叶斯答案:AB解析:[多选题]55.TD-LTE室内覆盖面临的挑战()A)覆盖场景复杂多样B)信号频段较高,覆盖能力差C)双流模式对室分系统工程改造要求较高D)与WLAN系统存在复杂的互干扰问题答案:ABCD解析:[多选题]56.噪声数据处理的方法主要有:()A)分箱B)聚类C)关联分析D)回归答案:ABD解析:[多选题]57.界面整体规划设计时涉及的工作包括A)确定主题B)选择合适制作工具C)收集材料D)制作DEMO答案:ABCD解析:[多选题]58.以下关于非频繁模式说法,正确的是()A)其支持度小于阈值B)都是不让人感兴趣的C)包含负模式和负相关模式D)对异常数据项敏感答案:AD解析:[多选题]59.构造线性模型时在发现(Var1和Var2,Var2和Var3,Var3和Var1)变量间的相关系数分别是-0.98,0.45,1.23,则下述说法正确的是A)Var1和Var2非常相关B)Var和Var2可以去除其中一个C)Var3和Var1的相关系数是错误的D)Var2和Var3不存在相关性答案:ABC解析:[多选题]60.视频业务流程可以分为播放准备阶段和播放阶段,其中播放准备阶段KQI指标包括()A)播放成功率B)视频播放等待时长C)初始缓冲成功率D)初始缓冲时长答案:ABCD解析:[多选题]61.敏感个人信息划定依据()A)与人格尊严相关B)与人身.财产安全相关C)不满十四周岁未成年人的个人信息D)与公司管理要求相关答案:ABC解析:[多选题]62.下列对于IP地址的描述正确的是A)主机部分全为?1?的IP址址称为有限广播B)0.x.y.z表示本网络的指定主机C)一个A类网的IP址址x.0.0.0表示x这个网络D)IP地址~55属于保留地址答案:BCD解析:[多选题]63.贝叶斯信念网络(BBN)有如下哪些特点。()A)构造网络费时费力B)对模型的过分问题非常鲁棒C)贝叶斯网络不适合处理不完整的数据D)网络结构确定后,添加变量相当麻烦答案:AB解析:[多选题]64.下列哪些指标用于聚类模型的估计()A)silhouette_scoreB)calinski_harabaszC)R2D)F1答案:AB解析:[多选题]65.PCRF支持的逻辑接口包括A)RxB)GxcC)GxD)X2答案:ABC解析:[多选题]66.以下有关随机森林算法的说法正确的是()A)随机森林算法的分类精度不会随着决策树数量的增加而提高。B)随机森林算法对异常值和缺失值不敏感。C)随机森林算法不需要考虑过拟合问题。D)决策树之间相关系数越低.每棵决策树分类精度越高的随机森林模型的分类效果越好。答案:ABD解析:[多选题]67.随机抽样方法有()A)等距随机抽样B)综合随机抽样C)简单随机抽样D)分群随机抽样答案:ACD解析:[多选题]68.下面哪些属于可视化高维数据技术()A)矩阵B)平行坐标系C)星形坐标D)散布图E)Chernoff脸答案:ABCE解析:第3部分:判断题,共20题,请判断题目是否正确。[判断题]69.在AGNES算法中,两个簇合并的条件是两个簇的数据点间最小距离是所有簇中最小的。A)正确B)错误答案:对解析:[判断题]70.在一元线性回归模型中,变量显著性检验与方程显著性检验都要进行,不能相互替代。A)正确B)错误答案:错解析:[判断题]71.创建BeautifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。A)正确B)错误答案:错解析:[判断题]72.数据根据计量尺度不同可以分为分类数据和数值型数据。A)正确B)错误答案:错解析:[判断题]73.字典中键必须唯一,但值不必。A)正确B)错误答案:对解析:[判断题]74.如果事件A,B互斥,且P(A)>0,P(B)>0,则A,B独立。A)正确B)错误答案:错解析:[判断题]75.k近邻方法不需要事先学习分类模型,当需要预测的时候,根据预测样本的特性和已知训练数据集中的数据进行类别的判断。A)正确B)错误答案:对解析:[判断题]76.回归分析主要确定变量之间是否存在相关关系,而相关关系是一种确定性的关系。A)正确B)错误答案:错解析:[判断题]77.数据库类型是按照数据存取的方法来划分的。A)正确B)错误答案:错解析:[判断题]78.聚类分析的过程中,聚类效果较好时属于同一个簇的对象相似度很高,而属于不同簇的对象相似度很低。A)正确B)错误答案:对解析:[判断题]79.线性回归模型的拟合优度可采用可决系数进行评判。可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。A)正确B)错误答案:错解析:[判断题]80.使用正则表达式对字符串进行分割时,可以指定多个分隔符,而字符串对象的split()方法无法做到这一点。A)正确B)错误答案:对解析:[判断题]81.已知x为非空列表,那么表达式sorted(x,reverse=True)==list(reversed(x))的值一定是True。A)正确B)错误答案:错解析:[判断题]82.Python字典和集合属于无序序列。A)正确B)错误答案:对解析:[判断题]83.提取声波的频率,是数据挖掘任务。A)正确B)错误答案:错解析:[判断题]84.给定最小支持度阈值minsup,一个频繁项集的所有非空子集都是频繁的。A)正确B)错误答案:对解析:[判断题]85.假设x为列表对象,那么x.pop()和x.pop(-1)的作用是一样的。A)正确B)错误答案:对解析:[判断题]86.SVM是这样一个分类器,他寻找具有最小边缘的超平面,因此它也经常被称为最小边缘分类器(minimalmarginclassifier)()A)正确B)错误答案:错解析:[判断题]87.Python标准库os中的方法startfile()可以启动任何已关联应用程序的文件,并自动调用关联的程序。A)正确B)错误答案:对解析:[判断题]88.datahoop中输入的数据必须是数值型的。A)正确B)错误答案:错解析:第4部分:问答题,共12题,请在空白处填写正确答案。[问答题]89.在sklearn中,为了展示某个因子的不同取值对算法的性能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机电工程2025年项目管理试题及答案
- 网络技术与企业发展关系试题及答案
- 信息系统项目管理师研究方法试题及答案
- 深入探讨2025年西方政治制度改革的试题及答案
- 机电工程行业背景试题及答案总结
- 美国与欧洲政治体制比较试题及答案
- 全面掌握网络工程师考试试题及答案
- 项目进度管理中的工具与方法试题及答案
- 客户关系管理 试卷 A卷答案
- 网络安全技术的应用与探索试题及答案
- 《无脊椎动物的演化》课件
- 建筑施工资料员培训课件:提升工程档案管理技能
- 全域旅游视角下浙江白水洋镇乡村旅游发展路径优化研究
- 2024北京西城区五年级(下)期末数学试题及答案
- 【课件】2025年安全生产月主题宣讲(一)
- 燕舞集团招聘试题及答案
- 2024园艺师考试栽培方法试题及答案
- 工程结算审核实务:重点难点解析及解决方案
- 小学数学课堂互动教学模式探究
- 外架承包合同完整版
- CHINET2024年全年细菌耐药监测结果
评论
0/150
提交评论