版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
MOOC金融数据挖掘(双语)-合肥工业大学中国大学慕课答案第一章测验1、问题:根据性别划分公司的顾客是数据挖掘任务。()选项:A、正确B、错误正确答案:【错误】2、问题:计算公司的总销售额是数据挖掘任务。()选项:A、正确B、错误正确答案:【错误】3、问题:对天猫某一件商品的评论进行客户细分是数据挖掘任务。()选项:A、正确B、错误正确答案:【正确】第二章测验1、问题:标称、序数、区间、比率四种属性类型中,是定量属性类型的有()?选项:A、标称B、序数C、区间D、比率正确答案:【区间#比率】2、问题:标称、序数、区间、比率四种属性类型中,是定性属性类型的有()?选项:A、标称B、序数C、区间D、比率正确答案:【标称#序数】3、问题:Thesameattributecanbemappedtodifferentattributevalues.()选项:A、正确B、错误正确答案:【正确】4、问题:Differentattributescannotbemappedtothesamesetofvalues.()选项:A、正确B、错误正确答案:【错误】5、填空题:计算文档d1=(5,0,3,0,2,0,0,2,0,0),d2=(3,0,2,0,1,1,0,1,0,1)的余弦相似度(结果保留小数点后两位)正确答案:【0.94】第三章单元测验1、问题:决策树包含以下哪些结点?()选项:A、根结点B、叶结点C、内部结点D、外部结点正确答案:【根结点#叶结点#内部结点】2、问题:以下哪些是构建决策树的算法?()选项:A、CARTB、C4.5C、ANND、ID3正确答案:【CART#C4.5#ID3】3、问题:增益率越大表示划分纯度越高。()选项:A、正确B、错误正确答案:【正确】4、问题:分类是一种无监督学习。()选项:A、正确B、错误正确答案:【错误】5、问题:分类问题的训练集中,应该包含类别属性。()选项:A、正确B、错误正确答案:【正确】6、问题:基尼系数越大表示划分纯度越高。()选项:A、正确B、错误正确答案:【错误】7、填空题:考虑上图二元分类的数据集,请问划分之前数据集的GINI指标值为()。(结果保留小数点后四位)正确答案:【0.48##%_YZPRLFH_%##0.4800】8、填空题:考虑上图二元分类的数据集,请问按照属性A划分之后的GINI指标值为()。(结果保留小数点后四位)正确答案:【0.3429】9、填空题:考虑上图二元分类的数据集,请问按照属性B划分之后的GINI指标值为()。(结果保留小数点后四位)正确答案:【0.3167】10、填空题:考虑上图二元分类的数据集,请问按照GINI指标,将会选择属性()进行划分。(请填写A或者B)正确答案:【B】第四章单元测验1、问题:给定规则R,如果规则R的前件与数据对象x的属性相匹配,则称规则R()数据对象x选项:A、覆盖B、触发C、匹配D、以上都错误正确答案:【覆盖】2、问题:给定规则R,如果规则R的前件与数据对象x的属性相匹配,则称数据对象x()规则R选项:A、覆盖B、触发C、匹配D、以上都错误正确答案:【触发】3、问题:规则的左边是属性测试条件的合取项()。选项:A、正确B、错误正确答案:【正确】4、问题:规则的右边称为规则前件()选项:A、正确B、错误正确答案:【错误】5、问题:规则集不存在两条规则被同一数据对象触发的性质是穷举性质()。选项:A、正确B、错误正确答案:【错误】6、问题:对于属性值的任一组合,规则集中都存在一条规则能够覆盖的性质是穷举性质()。选项:A、正确B、错误正确答案:【正确】7、问题:顺序覆盖算法产生规则之后要删除规则覆盖的所有正例样本()。选项:A、正确B、错误正确答案:【正确】8、问题:顺序覆盖算法产生规则之后要删除规则覆盖的所有负例样本()。选项:A、正确B、错误正确答案:【正确】9、填空题:给定训练集包含100个正例和500个反例,规则R1:A—+(覆盖5个正例1个反例),请问规则的覆盖率为()。(结果以小数形式展示)正确答案:【0.06】10、填空题:给定训练集包含100个正例和500个反例,规则R1:A—+(覆盖5个正例1个反例),请问规则的正确率为()。(结果保留四位小数)正确答案:【0.8333】第五章测验1、问题:朴素贝叶斯分类器的工作机制是假设类条件概率条件独立()。选项:A、正确B、错误正确答案:【正确】2、问题:朴素贝叶斯工作机制下,所有属性A的类条件概率可以被分解为类条件概率的加和()。选项:A、正确B、错误正确答案:【错误】3、问题:朴素贝叶斯进行分类时,先验概率的大小并不重要()。选项:A、正确B、错误正确答案:【错误】4、问题:在进行属性条件概率的估算时,针对连续属性,只有离散化一种方式。()选项:A、正确B、错误正确答案:【错误】5、填空题:假设银行进行客户评级,评级一般的客户中已婚的比例是15%,评级优秀的客户中已婚的的比例是23%。如果客户中评级一般的占80%,其余的是评级优秀,那么已婚客户属于评级一般的概率为()。(结果保留小数点后四位)正确答案:【0.7229】6、填空题:假设银行进行客户评级,评级一般的客户中已婚的比例是15%,评级优秀的客户中已婚的的比例是23%。如果客户中评级一般的占80%,其余的是评级优秀,请问已婚客户属于评级优秀的概率为()。(结果保留小数点后四位)正确答案:【0.2771】7、填空题:假设银行进行客户评级,评级一般的客户中已婚的比例是15%,评级优秀的客户中已婚的的比例是23%。如果客户中评级一般的占80%,其余的是评级优秀,随机选择一个客户,那么他属于评级()的概率更大。(请填一般或者优秀)正确答案:【一般】8、填空题:假设银行进行客户评级,评级一般的客户中已婚的比例是15%,评级优秀的客户中已婚的的比例是23%。如果客户中评级一般的占80%,其余的是评级优秀。假设30%的评级优秀客户的收入为低,50%的评级一般客户的收入为低。如果一个客户已婚且收入为低,按照朴素贝叶斯算法,那么他(她)属于评级()的概率更大。(请填一般或者优秀)正确答案:【一般】9、填空题:假设银行进行客户评级,评级一般的客户中已婚的比例是15%,评级优秀的客户中已婚的的比例是23%。如果客户中评级一般的占80%,其余的是评级优秀。假设30%的评级优秀客户的收入为低,50%的评级一般客户的收入为低。请问按照朴素贝叶斯算法,已婚且收入为低的客户属于评级一般的概率为()(结果保留小数点后四位,四舍五入)正确答案:【0.8130##%_YZPRLFH_%##0.813】10、填空题:假设银行进行客户评级,评级一般的客户中已婚的比例是15%,评级优秀的客户中已婚的的比例是23%。如果客户中评级一般的占80%,其余的是评级优秀。假设30%的评级优秀客户的收入为低,50%的评级一般客户的收入为低。请问按照朴素贝叶斯算法,已婚且收入为低的客户属于评级优秀的概率为()(结果保留小数点后四位,四舍五入)正确答案:【0.187##%_YZPRLFH_%##0.1870】第六章测验1、问题:贝叶斯网络是一种概率图模型。()选项:A、正确B、错误正确答案:【正确】2、问题:贝叶斯信念网络是一个有向有环图。()选项:A、正确B、错误正确答案:【错误】3、问题:在贝叶斯信念网络中,如果从结点X到结点Y有一个有向边,则结点X称为结点Y的父结点。()选项:A、正确B、错误正确答案:【正确】4、问题:在贝叶斯信念网络中,如果从结点X到结点Y有一个有向边,结点Y称为结点X的父结点。()选项:A、正确B、错误正确答案:【错误】5、问题:在贝叶斯信念网络中,如果某结点的父结点已知,那么该结点对于其非子孙结点,是条件独立的。()选项:A、正确B、错误正确答案:【正确】6、填空题:P(Ms=married,Income=high,Insurance=yes,Refund=yes)=?正确答案:【0.0324】7、填空题:P(Ms=married,Income=high,Insurance=yes,Refund=no)=?正确答案:【0.0036】8、填空题:P(Ms=married,Income=high,Insurance=no,Refund=no)=?正确答案:【0.004】9、填空题:P(Refund=yes|Ms=married)=?正确答案:【0.66】10、填空题:P(Refund=yes|Income=high)=?正确答案:【0.82】第七章测验1、问题:训练误差表示的是模型在测试集上的误差。()选项:A、正确B、错误正确答案:【错误】2、问题:过拟合通常会导致模型泛化能力过强。()选项:A、正确B、错误正确答案:【错误】3、问题:拟合不足通常会导致模型泛化能力过弱。()选项:A、正确B、错误正确答案:【正确】4、问题:过拟合通常在模型学习能力过强的时候出现。()选项:A、正确B、错误正确答案:【正确】5、问题:拟合不足通常在模型学习能力过强的时候出现。()选项:A、正确B、错误正确答案:【错误】6、问题:偏差是指预测结果与真实值之间的差异。()选项:A、正确B、错误正确答案:【正确】7、问题:偏差可以衡量预测值之间的离散程度。()选项:A、正确B、错误正确答案:【错误】8、问题:泛化误差,也叫样本外误差,是指模型在未知记录上的期望误差。()选项:A、正确B、错误正确答案:【正确】9、填空题:如图所示,我们有一个子树,包含两个分枝,如果采用乐观方法估计泛化误差,最终的结论是()。(请填写剪或者不剪)正确答案:【不剪】10、填空题:如图所示,我们有一个子树,包含两个分枝,如果采用乐观方法估计泛化误差,修剪后的泛化误差为()。(请用小数表示)正确答案:【0.4】11、填空题:如图所示,我们有一个子树,包含两个分枝,如果采用乐观方法估计泛化误差,修剪前的泛化误差为()。(请用小数表示)正确答案:【0.2】第八章测验1、问题:给定如下图中的混淆矩阵,请计算模型的正确率为()。(假设yes为正类)选项:A、5/7B、0.7C、5/6D、10/13正确答案:【0.7】2、问题:给定如下图中的混淆矩阵,请计算模型的精度(precision)为()。(假设yes为正类)选项:A、5/7B、5/6C、0.7D、10/13正确答案:【5/7】3、问题:给定如下图中的混淆矩阵,请计算模型的召回率(recall)为()。(假设yes为正类)选项:A、0.7B、5/7C、10/13D、5/6正确答案:【5/6】4、问题:给定如下图中的混淆矩阵,请计算模型的F1度量为()。(假设yes为正类)选项:A、5/6B、10/13C、5/7D、0.7正确答案:【10/13】5、问题:保持方法中,训练集和测试集能有重合的部分。()选项:A、正确B、错误正确答案:【错误】6、问题:分类模型的ROC曲线越接近右上方,表示模型的表现越优。()选项:A、正确B、错误正确答案:【错误】7、问题:分类模型的正确率越高就代表模型性能越好。()选项:A、正确B、错误正确答案:【错误】8、问题:成本矩阵中的C(i|j)表示的是将j错分为i要付出的代价。()选项:A、正确B、错误正确答案:【正确】9、问题:ROC曲线计算中的真正率与混淆矩阵中的召回率是相等的。()选项:A、正确B、错误正确答案:【正确】10、问题:ROC曲线中,连接(0,0)和(1,1)对角线的直线表示随机猜测的模型。()选项:A、正确B、错误正确答案:【正确】第九章测验1、问题:降低频繁项集产生的复杂度的方法有()。选项:A、减少候选项集的数目B、减少项集支持度阈值C、减少候选项集与事务之间的比对次数D、减少事务的个数正确答案:【减少候选项集的数目#减少候选项集与事务之间的比对次数#减少事务的个数】2、问题:Apriori算法的整个过程中,影响复杂度的因素包括()。选项:A、项数B、支持度阈值C、事务数D、事务的平均宽度正确答案:【项数#支持度阈值#事务数#事务的平均宽度】3、问题:关联规则表示的是同时发生的关系,也表示因果关系。()选项:A、正确B、错误正确答案:【错误】4、问题:关联分析中,先验原理是指如果一个项集是频繁的,那么它的所有子集都是频繁的。()选项:A、正确B、错误正确答案:【正确】5、问题:基于先验原理,我们可以得知一个项集的支持度绝对会超过它的子集的支持度。()选项:A、正确B、错误正确答案:【错误】6、问题:关联规则中,置信度也具备反单调性。()选项:A、正确B、错误正确答案:【错误】7、问题:极大频繁项集不一定都是闭频繁项集。()选项:A、正确B、错误正确答案:【错误】8、填空题:下表是一个购物篮数据集,请问{Bread,Eggs}二项集的支持度计数为()。正确答案:【2】9、填空题:下表是一个购物篮数据集,请问Bread--Eggs规则的支持度为()。(请填写小数)正确答案:【0.4】10、填空题:下表是一个购物篮数据集,请问Bread--Eggs规则的置信度为()。(请填写小数)正确答案:【0.5】第十章测验1、问题:1.给定图中的购物篮数据集,假设最小支持度阈值为0.6,请问在构建FP过程中,需要丢弃的非频繁项包括()。选项:A、BreadB、AppleC、EggsD、MilkE、Juice正确答案:【Apple#Juic
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴工学院《量子力学》2022-2023学年第一学期期末试卷
- 淮阴工学院《传统空间装饰》2022-2023学年第一学期期末试卷
- 2024天津市总工会集体合同样本范文
- 舌尖上的安全健康教案
- 第18课 美国的独立 课件
- 2025届河南省高三语文上学期期中试卷(附答案解析)
- 2024中考语文作文备考:挫折类
- 线性规划的应用举例
- 2024至2030年中国工业吊瓶行业投资前景及策略咨询研究报告
- 2024至2030年中国大黄苏打片行业投资前景及策略咨询研究报告
- 马王卫生院医疗质量提升攻坚年行动部署落实情况汇报
- GB/T 18029.1-2024轮椅车第1部分:静态稳定性的测定
- 【化归思想在中学数学中的应用探究6600字(论文)】
- 国家开放大学《个人与团队管理》期末考试题库及答案
- 科普版四年级上册英语全册同步练习
- 2024年监狱民警述职报告范文(3篇)
- 铁路局客运段考核判断题题库与答案
- TD/T 1049-2016 矿山土地复垦基础信息调查规程(正式版)
- 热烈欢迎领导莅临指导模板
- 大学生涯发展展示
- 一年级排队问题专项归纳练习和答案
评论
0/150
提交评论