北京语言大学《大数据技术与应用》作业2答卷_第1页
北京语言大学《大数据技术与应用》作业2答卷_第2页
北京语言大学《大数据技术与应用》作业2答卷_第3页
北京语言大学《大数据技术与应用》作业2答卷_第4页
北京语言大学《大数据技术与应用》作业2答卷_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

21秋《大数据技术与应用》作业2-00001试卷总分:100得分:100一、单选题(共15道试题,共60分)用训练好的LOF实例判断数据是否异常,正常样本用1表示,异常样本用-1表示的语句fromsklean.neighborsimportLocalOutlierFactorclf=LocalOutlierFactor(n_neighbors=20)y_pred=clf.fit_predict(X)X_scores=clf.negative_outlier_factor_答案:C2.利用pandas处理数据缺失值时,用于填充缺失值的函数为isnullheadfillnadropna答案:C3.决策树生成过程中,以信息增益作为特征选择准则生成决策树的算法是ID3C4.5CART以上都不对答案:A4.决策树的生成是一个递归过程,在决策树基本算法中,满足哪种情形,会导致递归过程返回停止特征选择次数超过一定限制当前属性集为空,或所有样本在所有属性上取值相同决策树深度超过2以上都不对答案:B5.:fromsklearn.treeimportDecisionTreeClassifiernclf=DecisionTreeClassifier()nclf.fit(Xtrain,Ytrain)npredictions=clf.predict(Xtest)n上面代码第4行中Xtest表示训练数据集测试数据集训练数据的类别标签数组测试数据的类别标签数组答案:A6.以下不属于大数据分析方法的是()统计分析数学模型机器学习人工智能答案:B7.用训练好的孤立森林isolationforest实例对数据进行异常值检测的语句是fromsklean.ensembleimportIsolationForestLocalOutlierFactorclf=IsolationForest(max_samples=100,random_state=0)clf.fit(X_train)y_pred=clf.fit_predict(X)y_pred_test=clf.predict(X_test)答案:D8.用训练好的模糊C均值聚类实例对数据进行聚类操作的语句是fromfcmeansimportFCMfcm=FCM(n_clusters=3)fcm.fit(X)fcm_labels=fcm.u.argmax(axis=1)答案:D9.数据集{1,2,2,2,3,4}的众数是1234答案:B10.不包含任何项的项集是指项空集超项集子项集答案:B11.利用Sklearn构建KNN分类器,用于KNN分类器训练的程序为knn.fit(X_train,y_train)y_pred=knn.predict(X_test)knn=KNeighborsClassifier(n_neighbors=k)以上都不对答案:A12.数据集{2,2,4,4,4,4,6,6,8,8,12,14,16,20,22,28,30,44}的中四分位数为2468答案:D13.关联规则X→Y表示中X称为前件后件中间件以上都不对答案:A14.从软件库中导入模糊C均值聚类算法类的语句是fromfcmeansimportFCMfcm=FCM(n_clusters=3)fcm.fit(X)fcm_labels=fcm.u.argmax(axis=1)答案:A15.如果一个项集包含K个项,则该项集称为项空集超项集K项集答案:D二、多选题(共5道试题,共20分)16.数据集中趋势分析的常用指标包括平均值中位数众数四分位数答案:ABCD17.以下哪些是数据可视化图表柱状图折线图饼图散点图答案:ABCD18.分箱法包括等深分箱众数分箱等宽分箱以上都不对答案:AC19.在数据清洗过程中,用于处理噪声值的方法包括盖帽法分箱法聚类法以上都不对答案:ABC20.定性数据包括有序数据无序数据定类等级数据定性等级数据答案:ABCD三、判断题(共5道试题,共20分)21.回归算法的目的是寻找决策边界答案:错误22.描述性数据分析属于比较高级复杂的数据分析手段答

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论