




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:大数据挖掘技术练习大数据挖掘技术练习(习题卷1)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据挖掘技术练习第1部分:单项选择题,共51题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.考虑两队之间的足球比赛:队0和队1。假设65%的比赛队0胜出,剩余的比赛队1获胜。队0获胜的比赛中只有30%是在队1的主场,而队1取胜的比赛中75%是主场获胜。如果下一场比赛在队1的主场进行队1获胜的概率为A)0.75B)0.35C)0.4678D)0.5738[单选题]2.语句SELECT*FROMstudent;中?*?号表示______。A)student表的一个字段B)student表的全部字段C)student表的一条记录D)student表的全部记录[单选题]3.下列选项中属于现金流入的项目是()A)所得税B)建设投资C)经营成本D)营业收入[单选题]4.决策树分类方法中,ID3算法使用的分裂准则是:()A)信息增益B)增益比率C)基尼指数D)分类错误率[单选题]5.以下叙述中()是正确的。A)分类和聚类都是有指导的学习B)分类和聚类都是无指导的学习C)分类是有指导的学习,聚类是无指导的学习D)分类是无指导的学习,聚类是有指导的学习[单选题]6.《视频业务端到端业务质量分析》应用落地手册中定义的视频业务用户感知KQI指标不包括()A)视频播放等待时长B)视频播放成功率C)视频播放清晰度D)视频停顿次数[单选题]7.下面关于聚类分析说法错误的是()A)一定存在一个最优的分类B)聚类分析是无监督学习C)聚类分析可以用于判断异常值D)聚类分析即:物以类聚,人以群分[单选题]8.eSRVCC方案相对于SRVCC方案的增强在于减少了切换时长,eSRVCC切换时长小于()A)20msB)40msC)160msD)300ms[单选题]9.当数据样本的特征属性为自然数时,应采用以下那种算法进行分类()A)多项式朴素贝叶斯B)高斯朴素贝叶斯C)贝努利朴素贝叶斯D)K均值算法[单选题]10.根据聚类形成的簇的特点,如果有交集的簇之间必然存在包含关系,这种聚类称为()。A)重叠聚类B)层次型聚类C)划分型聚类D)以上均不是[单选题]11.大数据起源是()A)金融B)电信C)互联网D)公共管理[单选题]12.使用人工智能,面对数据被记录,隐私被泄漏的风险,应该()A)宁愿放弃便捷,也要选择隐私B)完全不担心隐私泄露C)不放弃数据带来便捷和智能,但是互联网公司要像银行一样,有责任保护我们的数据安全D)无所谓[单选题]13.根据《中国移动统一DPI设备技术规范》,数据上报接口采用什么协议进行数据传输A)SDTPB)TCPC)UDPD)GTP[单选题]14.关于Tableau的特点,以下说法错误的是()A)学习成本低,简单易用;B)图表精美;C)开发快速,分享便捷;D)需要IT大量人员参与[单选题]15.在LTE下,eNodeB通过()接口连接MME。A)S1-UB)S1-MMEC)S6aD)S1-MME[单选题]16.考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是)A)2B)3C)3.5D)5[单选题]17.如果规则集中的规则按照优先级降序排列,则称规则集是A)无序规则B)穷举规则C)互斥规则D)有序规则[单选题]18.通过代码?fromsklearnimportlinear_model?引入线性模型模块,并通过代码?reg=linear_model.LinearRegression()?构造回归器对象后,在训练时要调用的方法是()。A)reg.learn()B)reg.predict()C)reg.train()D)reg.fit()[单选题]19.以下OLAP操作中()的作用是改变维的层次,变换分析的粒度。A)切块B)平移C)钻取D)切片[单选题]20.缺失值处理方法中错误的是()。A)对于分类属性,使用同类对象属性值的均值B)转换为分类问题或数值预测问题C)对于离散属性或定性属性,使用众数D)对于所有属性都可以使用均值[单选题]21.给定一个置信概率和置信区域,若误差超过置信区域,则认为误差不是随机误差引起,视为异常值的判别方法()。A)聚类判别法;B)回归判别法C)抽样判别法D)统计判别法[单选题]22.在中移动的集中性能管理应用落地-物联网端到端业务质量分析手册中,其定界流程是基于:A)八元六阶B)七元五阶C)六元四阶D)五元三阶[单选题]23.正则表达式字符集中,()表示单词字符。A)\dB)\DC)\sD)\w[单选题]24.以下哪个不是构造直方图的数据集划分方式A)组距分组B)分位数分组C)多变量分组D)均值-标准差分组[单选题]25.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?A)关联规则发现B)聚类C)分类D)自然语言处理[单选题]26.连接控制、流控制、报文分段等属于哪一层的功能A)物理层B)数据链路层C)网络层D)传输层[单选题]27.list=['a','b','c','d','e']下列操作会正常输出结果的是:A)list[-4:-1:-1]B)list[:3:2]C)list[1:3:0]D)list['a':'d':2][单选题]28.KNIME数据处理过程不包括A)提取B)转换C)加载D)计算[单选题]29.提升决策树法训练效率的措施包括A)增加树的深度B)减少数的深度C)增加学习率D)减少树的个数[单选题]30.关于谷歌浏览器开发者工具描述错误的是()A)元素面板可查看元素在页面的对应位置B)源代码面板可以查看HTML源码C)网络面板可以查看HTML源码D)网络面板可以查看HTTP头部信息[单选题]31.CRISP-DM是跨行业数据挖掘过程标准,下述哪项工作是在datapreperation阶段完成A)数据收集B)数据清洗C)建立模型D)数据理解[单选题]32.什么是KDD?A)数据挖掘与知识发现B)领域知识发现C)文档知识发现D)动态知识发现[单选题]33.分类器效果检验中的准确率是指()A)预测正确的数据在总数据中的比例B)预测为正的数据在总数据中的比例C)预测为正的数据中实际为正的数据所占比例D)实际为正的数据中被预测为正的数据所占比例[单选题]34.自动化高级分析实验室,实现与统一数据资源库互联,实现数据的自助组表、自助分析功能,满足不同层级、不同水平的用户需求的是()A)初级分析;B)综合分析C)典型分析D)高级分析[单选题]35.以下哪个APP主要使用的是HTTPS协议A)优酷B)微信C)百度搜索D)王者荣耀[单选题]36.《中华人民共和国数据安全法》中的数据,是指任何以电子或者其他方式对()的记录。A)数据B)信息C)文件D)知识[单选题]37.DPI采集中,需要获取LTE切换信息,不需要采集的接口是()A)S1-MMEB)X2C)S11D)S6a[单选题]38.假设所分析的的数据包括属性age,它在数据元组中的值(以递增序)为13,15,16,16,19,20,21,22,22,25,25,25,25,30,33,33,35,35,35,35,36,40,45,46,52,70,它的中位数是多少A)25B)30C)29.963D)35[单选题]39.以下哪个不是移动网数据XDR内容A)公共信息B)移动网通用信息C)特定业务信息D)信令信息[单选题]40.某出行公司寻求商务合作希望提升其调度效率,网络大数据可以提供何种类型的规划分析服务A)人脉关系B)用户标签C)位置D)消费能力[单选题]41.以下关于字典类型的描述,正确的是()A)字典类型可迭代,即字典的值还可以是字典类型的对象//不可B)表达式forxind:中,假设d是字典,则x是字典中的键值对//键C)字典类型的键可以是列表和其他数据类型//不可为列表D)字典类型的值可以是任意数据类型的对象[单选题]42.下列哪种调制方式效率最高A)BPSKB)QPSKC)16QAMD)64QAM[单选题]43.以下关于字典操作的描述,错误的是()A)del用于删除字典或者元素B)clear用于清空字典中的数据C)len方法可以计算字典中键值对的个数D)keys方法可以获取字典的值视图[单选题]44.指数平滑法可以用以下哪种指标来反映对时间序列资料的修正程度()A)平滑常数B)指数平滑数初始值C)跨越期D)季节指数[单选题]45.主成分分析的步骤是()。A)计算协方差矩阵-计算主成分矩阵-计算特征根-中心化数据集-得到降维后的数据集B)中心化数据集-计算主成分矩阵-计算协方差矩阵-计算特征根-得到降维后的数据集C)中心化数据集-计算协方差矩阵-计算特征根-计算主成分矩阵-得到降维后的数据集D)计算协方差矩阵-计算特征根-中心化数据集-计算主成分矩阵-得到降维后的数据集[单选题]46.下面哪个说法是不正确的?A)一个HTML文档与BeautifulSoup对象等价B)标签树上除了标签外,节点还可能是字符串(NavigableString)类型。C)一个HTML文档与一个标签树等价D)一个HTML文档可以包含多个标签树[单选题]47.下面关于Jarvis-Patrick(JP)聚类算法的说法不正确的是()。A)JPB)JPC)JPD)JP[单选题]48.支持向量机是一种二分类模型,其基本模型定义为特征空间上的间隔最大的(),其学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。A)环形分类器B)线性分类器C)回归分类器D)非线性分类器[单选题]49.时间序列对象一般使用pandas的()生成A)concat()函数B)append()方法C)date_range()函数D)time()函数[单选题]50.对于开通4G业务的用户,如果需要使用VoLTE业务,是否需要更换手机卡,是否需要更换VoLTE终端?A)不需要更换手机卡,需要使用VoLTE终端B)不需要更换手机卡,不需要使用VoLTE终端C)需要更换手机卡,需要使用VoLTE终端D)需要更换手机卡,不需要使用VoLTE终端[单选题]51.MME具备以下功能A)只有控制面功能B)只有用户面管理功能C)同时有控制面和用户面管理功能D)用户面和控制面功能都不具备第2部分:多项选择题,共17题,每题至少两个正确答案,多选或少选均不得分。[多选题]52.物联网端到端定界分析?七元四阶?法中四阶包括()A)网络接入B)业务接入C)网络切换D)业务使用质量[多选题]53.TD-LTE终端形态包括()A)手机B)数据卡C)MiFiD)CPE[多选题]54.数据挖掘汇聚了许多学科的知识,其主要的挖掘技术包括A)统计方法B)机器学习方法C)数据库方法D)神经网络方法[多选题]55.下列对学生的描述属性中,标称属性的属性是:A)婚姻状况B)头发颜色C)身高D)学号[多选题]56.对视频播放等待时长指标质差问题进行下钻定界时,可以进一步分析以下哪些指标?A)TCP建链时B)GET响应时长C)初始缓冲时长D)下载速率[多选题]57.大数据在今天这个时间点上爆发的原因有哪些?()A)各种传感器无时无刻不在为我们提供大量的数据B)各种监控设备无时无刻不在为我们提供大量的数据C)各种智能设备无时无刻不在为我们提供大量的数据D)互联网的收集和积累[多选题]58.与空值查询有关的运算符是______。A)NULLB)ISNULLC)=NULLD)=ISNULL[多选题]59.下面给出的t检验的结果,()表明接受原假设,显著性水平为0.05。A)0.000B)0.039C)0.092D)0.124[多选题]60.人工网络学习的两个相似的算法:()A)梯度下降法则B)感知器训练法则C)遗传算法D)连接分析[多选题]61.下列属于机器学习工具包Scikit-learn包含的基本功能的是:A)数据预处理B)回归C)分类D)聚类[多选题]62.配合一元线性回归方程须具备下列前提条件()A)现象间确实存在数量上的相互依存关系B)现象间的关系是直线关系,这种直线关系可用散点图来表示C)具备一组自变量与因变量的对应资料,且能明确哪个是自变量,哪个是因变量D)两个变量之间不是对等关系[多选题]63.对于一个二分类问题,现在已经建立好了模型,该模型通过设置概率估计的阈值输出0或1。初始时设概率估计阈值为0.5,超过0.5判别为1,否则就判别为0;如果现在用另一个大于0.5的阈值,那么模型评估指标将发生什么变化()A)模型分类的召回率会降低或不变B)模型分类的召回率会升高C)模型分类精确率(Precision)会升高或不变D)模型分类精确率(Precision)会发生变化,但不能确定是升高还是降低[多选题]64.基础能力建设是2017年集中性能重点工作,具体工作指A)DPI规则库运营B)O域数据能力开放C)数据质量治理大会战D)应用拓展能力[多选题]65.某款终端支持的频段列表为1/3/5/8/38/39/40/41,则该终端能在下列哪些基站上进行通信A)FDD800M基站B)FDD900M基站C)WCDMA2000M基站D)现网TD-LTE所有类型基站[多选题]66.关于聚类下列说法正确的是()。A)聚类可以发现偏离多数数据对象的孤立点。B)聚类有着广泛的应用。C)聚类可以作为其他数据挖掘分析过程的一个基础处理步骤。D)聚类和分类没有区别。[多选题]67.从研究现状上看,下面属于云计算特点的是A)超大规模B)虚拟化C)私有化D)高可靠性[多选题]68.以下各项均是针正确数据仓库的不同说法,你认为正确的有()。A)数据仓库就是数据库B)数据仓库是一切商业智能系统的基础C)数据仓库是面向业务的,支持联机事务处理(OLTP)D)数据仓库支持决策而非事务处理E)数据仓库的主要目标就是帮助分析,做长期性的战略制定第3部分:判断题,共20题,请判断题目是否正确。[判断题]69.归纳法是一种从个别到一般的推理方法。A)正确B)错误[判断题]70.K均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。A)正确B)错误[判断题]71.urlopen()函数返回的是一个文件对象,需要调用read()方法一次性读取。A)正确B)错误[判断题]72.K均值聚类算法,簇的个数由算法自动地确定。()A)正确B)错误[判断题]73.对于带有else子句的循环语句,如果是因为循环条件表达式不成立而自然结束循环,则执行else子句中的代码。A)正确B)错误[判断题]74.数据预处理可能是整个知识发现过程中最耗时的步骤。()A)正确B)错误[判断题]75.模式为正确数据集的全局性总结,它正确整个测量空间的每一点做出描述;模型则正确变量变化空间的一个有限区域做出描述。A)正确B)错误[判断题]76.Python字典和集合支持双向索引。A)正确B)错误[判断题]77.如果对象p从对象q出发时是直接密度可达的,则对象q从对象p出发时也是直接密度可达的。A)正确B)错误[判断题]78.Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息.A)正确B)错误[判断题]79.多种属性相似度的综合度量,可以先对单个属性进行相似度度量,然后求所有属性相似度的均值作为整个对象相似度。A)正确B)错误[判断题]80.通过requests库发送的HTTP请求,返回一个response对象。A)正确B)错误[判断题]81.离群点是一个实际观测值,它与其他观测值的差别如此之大,以至于怀疑它是由不同的机制产生的。A)正确B)错误[判断题]82.先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。A)正确B)错误[判断题]83.聚类算法运行的条件需要所有的训练样本都有类别标签。()A)正确B)错误[判断题]84.使用resquests库向网站发送HTTP请求时,如果网站限制了python程序的爬取,可以通过添加Headers参数将其伪装为浏览器访问。A)正确B)错误[判断题]85.已知列表x=[1,2,3,4],那么表达式x.find(5)的值应为-1。A)正确B)错误[判断题]86.在UTF-8编码中一个汉字需要占用3个字节。A)正确B)错误[判断题]87.离散属性总是具有有限个值。A)正确B)错误[判断题]88.基于熵的方法可以被看做是自顶向下的分裂方法,ChiMerge则属于自底向上的合并方法。A)正确B)错误第4部分:问答题,共12题,请在空白处填写正确答案。[问答题]89.表达式sorted([111,2,33],key=lambdax:-len(str(x)))的值为__。[问答题]90.网络爬虫又称网页蜘蛛或()[问答题]91.一元线性回归分析相关性检验的步骤如下:(1)提出原假设H0:y与x存在显著的线性相关关系(2)根据样本值计算统计量r的值(3)给定显著性水平a,按自由度n-2查相关系数表,求出临界值(4)做判断.若,则__________H0,即认为在给定显著性水平a下y与x的线性相关关系较___________;若,则___________________H0,认为y与x的线性相关关系_____________[问答题]92.SelectFromModel是一个元转换器,它根据特征的重要性选择特征,要求使用的模型评估器经过Fit后一定要带有______或者______属性。[问答题]93.字典中每个元素的?键?与?值?之间使用________分隔开[问答题]94.表达式re.search(r?\w*?(?P\b\w+\b)\s+(?P=f)\w*??,?BeautifulisisbetterthanUgly.?).group(0)的值为_。[问答题]95.字典对象的___________方法可以获取指定?键?对应的?值?,并且可以在指定?键?不存在的时候返回指定值,如果不指定则返回None[问答题]96.10000个人购买了产品,其中购买A产品的人是1000个,购买B产品的人是2000个,AB同时购买的人是800个。则规则A=>B的支持度为_____,置信度为_____,提升度为____。[问答题]97.下面是一个超市某种商品连续24个月的销售数据(单位为百元):21,16,19,24,27,23,22,21,20,17,16,20,23,22,18,24,26,25,20,26,23,21,15,17.(1)使用等宽(等距离)方法对数据进行分箱;(2)使用等深(等频率)方法对数据进行分箱;[问答题]98.从机器学习的观点,分类技术是一种()学习,即每个训练样本的数据对象已有类标识,通过学习可以形成表达数据对象与类标识间对应的知识。[问答题]99.____表示XML路径语言,能够确定XML树结构中某一部分的位置。[问答题]100.Python语句s=?abcdefg',则s[::-1]的值是________________。1.答案:C解析:2.答案:B解析:3.答案:D解析:4.答案:A解析:5.答案:C解析:6.答案:A解析:7.答案:A解析:8.答案:D解析:9.答案:B解析:10.答案:B解析:11.答案:C解析:12.答案:C解析:13.答案:A解析:14.答案:D解析:15.答案:B解析:16.答案:C解析:17.答案:D解析:18.答案:D解析:19.答案:C解析:20.答案:D解析:21.答案:D解析:22.答案:C解析:23.答案:D解析:24.答案:C解析:25.答案:A解析:26.答案:D解析:27.答案:B解析:28.答案:D解析:29.答案:B解析:30.答案:C解析:网络面板可以查看网页请求头信息31.答案:B解析:32.答案:A解析:33.答案:C解析:34.答案:D解析:35.答案:C解析:36.答案:B解析:37.答案:D解析:38.答案:A解析:39.答案:D解析:40.答案:C解析:41.答案:D解析:42.答案:D解析:43.答案:D解析:44.答案:A解析:45.答案:C解析:46.答案:D解析:题型:47.答案:D解析:多选题48.答案:B解析:49.答案:C解析:50.答案:A解析:51.答案:A解析:52.答案:ABCD解析:53.答案:ABCD解析:54.答案:ABCD解析:55.答案:ABD解析:56.答
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 客服外包合同范本
- 垃圾分类设备维护合同
- 护士操作培训计划
- 培训评估方案
- 制作护理计划单
- 员工培训课件模板
- 新能源行业月报:2025年3月报新能源入市刺激抢装光伏涨价风电淡季不淡
- 陇东学院《可持续建设》2023-2024学年第二学期期末试卷
- 陕西国防工业职业技术学院《中外文化交流史》2023-2024学年第二学期期末试卷
- 陕西旅游烹饪职业学院《妇产科学B》2023-2024学年第二学期期末试卷
- 煤矿防治水细则释义详解版(一)
- GB/T 44144-2024有声读物
- 《桥本氏甲状腺炎》课件
- 6.3.1化学能转化为电能-高一《化学》同步课堂(苏教版2019必修第二册)
- 2024年重庆市中考语文试卷真题B卷(含答案逐题解析)
- 农机服务运营方案
- 长安汽车使用说明书
- 初一英语完形填空练习(50篇)
- 2024年上海公安机关文职辅警招聘笔试参考题库附带答案详解
- 【SRAM电路设计与版图实现12000字(论文)】
- 《干簧管基础知识》课件
评论
0/150
提交评论