北京语言大学《大数据技术与应用》作业4答卷_第1页
北京语言大学《大数据技术与应用》作业4答卷_第2页
北京语言大学《大数据技术与应用》作业4答卷_第3页
北京语言大学《大数据技术与应用》作业4答卷_第4页
北京语言大学《大数据技术与应用》作业4答卷_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

21秋《大数据技术与应用》作业4-00001试卷总分:100得分:100一、单选题(共15道试题,共60分)用训练好的随机森林对样本进行类别预测的语句是fromsklearn.treeimportDecisionTreetClassifierclf=DecisionTreetClassifier()clf.fit(Xtrain,Ytrain)predictions=clf.predict(Xtest)答案:D2.以下不是数据可视化工具库的是()pandasmatplotlibmatlabseaborn答案:C3.数据集{1,2,3,5,7,8,9}的中位数是3574答案:B4.下面代码能够提取模糊C均值聚类算法类簇中心特征的语句是fromfcmeansimportFCMfcm=FCM(n_clusters=4)fcm.fit(X)fcm_centers=fcm.cednters答案:D5.局部异常因子(LOF)算法属于基于统计的异常值检测方法基于密度的异常检测方法基于聚类的异常值检测基于决策树的异常检测答案:B6.逻辑回归中的“逻辑”是指规则Sigmoid函数学者名字以上都不对答案:B7.数据集{1,2,2,2,3,4}的众数是1234答案:B8.利用pandas处理数据缺失值时,用于发现缺失值的函数为isnullheadtailinfo答案:A9.利用pandas处理数据缺失值时,用于填充缺失值的函数为isnullheadfillnadropna答案:C10.关联规则最基础的元素是项项集超项集子项集答案:A11.fromsklearn.neighborsimportKNeighborsClassifiernknn=KNeighborsClassifier(n_neighbors=3)n上面代码中可以看出,KNN分类器的k值设置为1234答案:C12.决策树生成过程中,以信息增益率作为特征选择准则生成决策树的算法是ID3C4.5CART以上都不对答案:B13.决策树生成过程的停止条件当前结点包含的样本全属于同一类别,无需划分当前属性集为空,或是所有样本在所有属性上取值相同,无法划分当前结点包含的样本集合为空,不能划分以上都不对答案:A14.用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句fromsklean.neighborsimportLocalOutlierFactorclf=LocalOutlierFactor(n_neighbors=20)y_pred=clf.fit_predict(X)X_scores=clf.negative_outlier_factor_答案:C15.处理缺失值的方法有删除和()替换复制修改屏蔽答案:A二、多选题(共5道试题,共20分)16.常用的分类方法包括朴素贝叶斯分类器决策树KNN以上都不对答案:ABC17.定性数据包括有序数据无序数据定类等级数据定性等级数据答案:ABCD18.数据挖掘(DataMining)则是知识发现(KDD)的核心部分,它指的是从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,这些信息的表现形式为规则概念规律模式答案:ABCD19.异常检测的难点不能明确定义何为正常,何为异常,在某些领域正常和异常并没有明确的界限数据本身存在噪声,致使噪声和异常难以区分正常行为并不是一成不变,也会随着时间演化,如正常用户被盗号之后,进行一系列的非法操作难以获取标记数据,没有数据,再好的算法也是无用答案:ABCD20.分箱法包括等深分箱众数分箱等宽分箱以上都不对答案:AC三、判断题(共5道试题,共20分)21.众数在一组数据中只有一个答案:错误22.因为Bayes理论能够帮助理解基于概率估计的复杂现况,所以它成为了数据挖掘和概率论的基础答案:错误23.下四分位数是指数据从大到小排列排在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论