




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.wd.wd.wd.?商务智能?课程设计报告班级:信管131学号:3130561025姓名:姚丹妮同组人: 赵咪 杨乔指导教师:王建仁/李明 日期:2016.01.04-2016.01.08目录 TOC o 1-3 h z u HYPERLINK l _Toc4120333051需求分析 PAGEREF _Toc412033305 h 3HYPERLINK l _Toc4120333062数据理解 PAGEREF _Toc412033306 h 3HYPERLINK l _Toc4120333073挖掘或分析数据准备 PAGEREF _Toc412033307 h 4HYPERLINK l _
2、Toc4120333084数据挖掘或分析过程 PAGEREF _Toc412033308 h 5HYPERLINK l _Toc4120333094.1挖掘算法与挖掘软件选择 PAGEREF _Toc412033309 h 5HYPERLINK l _Toc4120333104.2 数据预处理 PAGEREF _Toc412033310 h 5HYPERLINK l _Toc4120333114.3挖掘过程说明 PAGEREF _Toc412033311 h 6HYPERLINK l _Toc4120333125结果展示与评价 PAGEREF _Toc412033312 h 18HYPERLI
3、NK l _Toc4120333136总结 PAGEREF _Toc412033313 h 19HYPERLINK l _Toc4120333146.1 设计中遇到的主要问题及解决方法 PAGEREF _Toc412033314 h 19HYPERLINK l _Toc4120333156.2设计方案的主要优点及缺乏 PAGEREF _Toc412033315 h 19HYPERLINK l _Toc4120333166.3 收获及建议 PAGEREF _Toc412033316 h 19HYPERLINK l _Toc412033317参考文献 PAGEREF _Toc412033317 h
4、 19连锁酒店顾客信用度分析方案设计1需求分析一个连锁酒店的经营与不同客户息息相关。酒店不仅需要每天面对不同的新增客户,也需要维系老客户。所以对于已消费的顾客的信用度的分析尤为重要。不同顾客信用度之间存在诸多差异。好坏之分也影响了酒店的经营状况。一个信用度良好的客户对于酒店来说是好事,但如果一个顾客信用度底下,那么极有可能出现拖欠房费等状况,这会严重损坏酒店利益。因此我会采用分类分析的方法。利用决策树模型构建顾客信用度分析体系,并进展相关预测,以便于酒店日后的经营以及对顾客的服务,对于那些信用度良好的顾客可以给予一定优惠,而对于那些信用度较差的顾客,那么要防止在酒店再次进展消费而又不付款的情况
5、。2数据理解为建设决策树,需要事先建设数据挖掘所需数据库或数据表,即顾客信用数据表。将顾客相关信用度的信息输入表中,以便分析。输入的信息均具有代表性。不重复不冗余,如假设不然,可再进展数据预处理。所需数据如以以下图所示:3挖掘或分析数据准备首先需要在数据库中建设“数据挖掘实验“数据库,并在数据库中建设表“顾客信用数据表11设计“顾客信用数据表1,表构造如以以下图所示:设置“顾客编号为主键。2编辑表的前200行,输入表中信息。注意输入的信息一定要具有代表性,防止冗余与重复4数据挖掘或分析过程4.1挖掘算法与挖掘软件选择算法:分类分析算法决策树 软件:microsoft visual studio
6、 20084.2 数据预处理由于表“顾客信用数据表1中的数据存在冗余缺失等问题,所以需要对表中数据进展数值化处理,离散化处理等相应的预处理操作,并将预处理之后的信息存入新表“顾客信用数据表2中。具体步骤如下所示:1将年龄属性列的数据进展离散化处理,设置区域范围,分别为30、=50三个范围,并将表中“年龄属性列中的信息按照其对应的范围进展修改,以便于决策树的生成2将年收入属性列的数据进展归一化处理,将每个数据值除以100000,缩小数据,以便观察。同时要修改表中“年收入属性列的数据类型,由int改为float3将信用等级属性列进展数值化处理,等级“A/B/C/D/E分别对应“1/2/3/4/5,
7、将表中“信用等级属性列中的信息按照其对应的数值进展修改,以便于决策树的生成预处理之后的表的构造及内容如以以下图所示:表构造:表中具体内容:4.3挖掘过程说明1翻开挖掘软件,点击“新建,建设“顾客信用分析的挖掘工程。2定义数据源。在页面右方点击新建“数据源,点击“下一步。将服务器名改为“localhost,选择使用windows身份验证,选择“数据挖掘实验数据库。点击“下一步。选择“使用服务账户,点击“下一步。然后完成。3定义数据源视图。在页面右方点击新建“数据源视图,点击“下一步。选择“数据挖掘实验,点击“下一步。选择“与主键同名,点击“下一步。选择“顾客信用数据表2已经进展过数据预处理的表,
8、点击“下一步。然后完成。4创立挖掘构造。在页面右方点击新建“挖掘构造,点击“下一步。选择“从现在关系数据库或数据仓库,点击“下一步。选择“决策树类型,点击“下一步。点击“下一步。点击“下一步如下所示,顾客编号为主键,年龄、年收入、信用等级、性别、职业为可输入,信用等级为可预测。点击“下一步。设置“测试数据百分比,点击“下一步。点击“完成。定义数据源,数据源视图,新建挖掘构造以后,如以以下图所示。5设置相关参数。右键点击“设置算法参数选择不同的算法参数会带来不同的决策树模型参数设置如以以下图所示,可根据自己的需求设置不同参数。6进展部署,实施挖掘。点击“运行,进入下一步。处理完成,可以到主界面查
9、看挖掘模型。5结果展示与评价决策树模型如以以下图所示:依赖关系如下所示:由上边所生成的决策树可知,信用等级与年龄、职业、性别和年收入都具有相辅相成的关系。其中依赖关系最强的是年龄和年收入。根据“数据挖掘实验数据库中的信息,所生成的决策树显示,当年收入=1.178并且1.472,职业不为销售员的顾客信用程度相对较高。而职业为销售员且年龄小于30岁的人信用程度那么是中等偏下。其他那么分布不均。6总结6.1 设计中遇到的主要问题及解决方法课程设计中遇到的最多的问题就是数据库建设不对,以至于后续进展挖掘无法实现。由于要建设两个表,并且两者关系为预处理与未预处理的表,所以两者之间在数据类型与内容上都有很
10、多相似性。但也存在极个别属性的数据类型并不一样,这也是数据预处理的关键所在,所以前期建设表的啥时候一定要慎重小心,否那么很难挽回,需要删除重建。另一个问题就是在进展数据挖掘时,挖掘参数寻那么不正确,也导致了无法得出正确的挖掘模型,后来又重新进展设置,才得出正确的决策树。6.2设计方案的主要优点及缺乏本次课程设计最大的缺点与缺乏在于数据库中所存储数据不够多,以至于挖掘出来的结果不一定具有代表性。由于是课程设计,所以输入数据有限。如果运用于实践之中,在挖掘过程中那么可以根据实际数据库进展挖掘分析,想必结果更具有可信度。6.3 收获及建议通过对商务智能的学习和课程设计,使我对数据库有了一个更加全面的认识与理解。在商务智能课程设计的过程中,从不懂到理解,虽然经历了很多问题,但是在教师和同学的帮助下,这些问题都得以解决。完成之后,我也体会到了数据库的严谨性和数据挖掘以及后续数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年托福口语模拟测试卷:心理健康与心理支持系统试题
- 2025年统计学期末考试题库:综合案例分析题解法精讲与答案
- 2025年小学英语毕业考试模拟卷(笔试综合)英语听力技巧训练与解析
- 2025年造价工程师案例分析模拟试卷:建筑工程造价预算编制试题
- 2025年统计学专业期末考试题库:深入解析统计调查设计方法
- 能源管理离散效率提升
- 宣传水知识及节水工作的重要性
- 膀胱癌居家的自我护理
- 肺脓肿病例治疗
- 二零二五年度办公室资产互换及增值服务协议
- 机械维修类设备采购 投标文件(技术方案)
- 科技成果转化成熟度评价规范
- 人工智能技术对社区治理的影响
- 人名调解员培训课件
- 水利工程中的水利法规与政策体系
- 20s206自动喷水与水喷雾灭火设施安装
- 能源托管服务投标方案(技术方案)
- 工业机器人操作与安全防护培训
- 臀部脓肿的护理查房
- 光伏-施工安全培训
- 儿童环内环内置式包皮
评论
0/150
提交评论