《数据挖掘与客户管理》期末试卷_第1页
《数据挖掘与客户管理》期末试卷_第2页
《数据挖掘与客户管理》期末试卷_第3页
《数据挖掘与客户管理》期末试卷_第4页
《数据挖掘与客户管理》期末试卷_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷代号:7563 A卷浙江广播电视大学2006年1月期末考试试题《数据挖掘与客户管理》期末考试试卷(试卷总分:100分,考试时间:120分钟)题号一二三四总分分数一、名词解释(每题4分,共20分)1.数据挖掘:2.过度拟合:3.过抽样:4.辛普森差异系数(基尼系数):5.数据仓库:二、填空题(每空2分,共30分)1.数据挖掘的三大支柱分别是、和。2.互动循环过程有四个业务过程,这四个过程循环往复,分别是理解业务问题、将数据转换成可执行的决策、和。3.预测模型成功应用的三个假定分别是、和。4.数据仓库的优点是和。5.数据仓库可由多个数据中心构成,数据仓库设计者们安排好这些数据中心的最主要挑战是要建立合适的。6.使用无监督的数据挖掘方法必须。7.为了确保输入数据早于输出结果,可以用方法对数据时间元素进行处理。8.分段输入组合模型和模型分段组合模型的最大区别在于。9.客户流失的原因,大致可以分为两类:自愿流失和。三、单项选择题(每题2分,共20分)1.企业所建立的预测模型的好坏取决于模型在()上的表现效果。A得分集B训练集C测试集D评价集2.客户在经济活动中具有多重身份,下面哪一种不是其身份之一()。A行为身份B所有权身份C学习身份D决策身份3.下列四条描述中,正确的一条是()。A企业实施数据挖掘,必须要有数据仓库。B企业要实施数据挖掘最好的方式是请编外专家。C企业购买现成数据挖掘模型的一个先决条件是:该企业的产品、客户、市场定位和所买来的现成模型设计之初的假设相吻合。D在建模的时侯,增益最高的模型就是最好的模型。4.数据挖掘算法以()形式来组织数据。A行B列C记录D表格5.企业要建立预测模型,需准备建模数据集,以下四条描述建模数据集正确的是()。A数据越多越好。B尽可能多的适合的数据。C得分集数据是建模集数据的一部分。D以上三条都正确。6.K—均值类别侦测要求输入的数据类型必须是()。A整型B数值型C字符型D逻辑型7.在决策树和累计增益图的关系转化过程图中,决策树上某一页节点的增益与累计增益图上的()相对应。A线段长度 B线段斜率C相对应的线段长度D相对应的线段斜率8.企业为提升每个客户的价值,应实现()最优化。A促销活动 B预算最优化 C客户最优化D三者都不是9.数据挖掘的经典案例“啤酒与尿布试验”最主要是应用了()数据挖掘方法。A分类B预测 C组合或关联法则 D聚类10.企业成功实施数据挖掘,需要以下()知识或技术A预先的规划B对商业文体的理解 C综合商业知识和技能D都需要四、简答题(每题6分,共30分)1.数据挖掘的六种常用算法和技术分别是什么?2.实现数据挖掘技术在企业中专业化应用的四种有效途径?3.一般认为有哪几种方法可以提升客户的价值?4.数据挖掘中的数据需要采用哪些格式?5.预测模型的建立过程有哪些?《数据挖掘与客户管理》期末考试试卷答案(试卷总分:100分,考试时间:120分钟)一、名词解释(每题4分,共20分)1.数据挖掘:是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的就是发现其中有意义的模式和规律。2.过度拟合:预测模型对训练集和测试集的模式记忆太深,而不能很好地、一般化地对未来数据进行预测。3.过抽样:多抽取稀有事件,少抽取常见结果,以建立模型集的过程。目的是调整模型集中稀疏数据与一般数据间的比例关系,使之保持在15%-30%.4.辛普森差异系数(基尼系数):衡量度量总体的差异程度。解释为从总体中有放回地随机取得两个样品属于不同类别的概率。公式为:2×P1×(1-P1),其中P1是属于第一类的概率。5.数据仓库:是从关系型数据库中发展起来的,是一个面向主题的、集成的、反映历史变化的和相对稳定的数据集合。二、填空题(每空2分,共30分)1.数据挖掘技术与算法、无所不在的数据、建立有效的预测模型2.决策实施、评价决策模型3.过去是将来的预言家、数据是可以获得的、数据中应包括我们的预期目标4.数据仓库是从一个点上观察整个企业,而不是许多小定义的“地下仓库”的拼凑集合、数据挖掘记录的是最令人感兴趣的详细的数据5.纬度和事实6.人机交互7.将时间范围附加到时间字段上8.数据的分段是预先知道的还是模型决定的9.非自愿流失三、单项选择题(每题2分,共20分)1.A2.C3.B4.D5.B6.B7.D8.C9.C10.B四、简答题(每题6分,共30分)1.数据挖掘的六种常用算法和技术分别是什么?①分类:处理结果是离散的②估计:处理的是连续的结果③预测:任何的预测都可以被认为是分类或估计。不同之处在于你强调的是什么:可以对分类后的结果加以检验;但在预测中,检验只能等待事物发生后才能确定。④组合或关联分析⑤聚类:其与分类的区别是聚类不依赖于事先确定好的组别。⑥描述与可视化:“女性比男性更支持民主党”。2.实现数据挖掘技术在企业中专业化应用的四种有效途径?①购买与企业的商业问题配套的评分机制②购买数据挖掘软件这类整体解决方案③聘请外部专家完成预测模型的建立④组织内部掌握数据挖掘技能3.一般认为有哪几种方法可以提升客户的价值?一般认为,有如下三种方法可以提升客户的价值:①对客户已有产品,增添新功能,或者说提升产品的购买价值。②向客户出售更多、更容易升级的产品。③使客户能长期购买本公司的产品。4.数据挖掘中的数据需要采用哪些格式?数据挖掘中的数据需要采用以下格式:①所有数据应该在一个表格/数据库视图中②每一行对应于与业务问题相关的一个案例③忽略具有单一值/几乎单一值的列④忽略所有行的值都不同的列⑤删除所有同义列⑥对于预测模型,目标列必须

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论