数据仓库与数据挖掘决策树试验_第1页
数据仓库与数据挖掘决策树试验_第2页
数据仓库与数据挖掘决策树试验_第3页
数据仓库与数据挖掘决策树试验_第4页
数据仓库与数据挖掘决策树试验_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、word完美格式实验3决策树一、实验目的1. 了解决策树的基本概念。2. 掌握决策树挖掘分析的操作步骤。二、实验内容对三国志4武将数据.xls中的数据进行决策树分析。三、实验仪、设备计算机、visual studio 2008、分析用数据、数据库服务四、实验步骤准备工作:三国志 4武将数据.xls 数据导入数据库中。(1) 打开visual studio 2008,新建项目,选择 商业智能项目,analysis services项目图1新建项目(2)在解决方案资源管理器中,右键单击数据源,选择新建数据源欢迎使用数据源向导淒用此向耳创崖新数据源°数据澹表养到数謹的瘗接°数据涯

2、不提供缓存无数据、涼加关系、沥加计建和添加批注等功能.若要刘數据 送应用这墜功能请使用此向导来创建逊据腮,芒后使用魏据齊祝門向导来也遂 包含相应功能的视圍口图2数据源向导(3)在该界面中选择 新建,进行数据源具体设置图3新建数据源(4)在服务器名中填写要连接的数据库服务器名称,或者单击服务器名右方下拉按钮进行选择;勾选使用windows身份验证;选择或输入一个数据库名中填写将要分析数据所在的数据库或者单击右方下拉按钮进行选择图4数据源具体设置(5)确定后配置完的数据源已显示在窗口上,继续下一步图5完成数据源具体设置(6) 勾选使用服务账户,继续下一步图6模拟信息设置(7) 数据源名称 保持默认

3、,完成精心整理学习帮手图7完成数据源设置向导(8) 在解决方案资源管理器中,右键单击数据源视图,选择新建数据源视图欢迎使用数据源视图向导便用此向耳创建新的數据源视團° 从关系数据库的表和视窗中创逹数据诉视图.数据淅握供与黄裁据庫的简单葩.可以僥用數据遞视團执行更事高翅功噩I 址鶴存元埶据、添加壬杀.创律计算和设置谨辑犍.图8数据源视图向导C-X选择数据源选择规有的关累数据頭,就新連亠个关系数据源口关系.数据縛®:数据源属性(£):值Data SourceIniti&l C».hxhIntegra td .SSPIProvi tierSQLOLED

4、E. 1图9选择数据源(10)在可用对象 中,将要分析数据所在表添加到 包含的对象 中,继续下一步选择表和视图从姜包含在数据澹视團中的关系数据库中选挥对象°可用对象包含的对象;名称名帝1 dbo.三国吉4$类型类型1 dbo.三国吉4$奘型奘型图11选择包含对象(11 )默认名称,完成图12完成数据源视图向导(12)在解决方案资源管理器中,右键单击挖掘结构,选择新建挖掘结构图13数据挖掘向导(13)勾选从现有关系数据库或数据仓库,继续下一步图14选择定义方法图15创建数据挖掘模型结构(14) 选择microsoft 决策树,继续 下一步(15)下一步担据向导担据向导选择为挖西结构提供

5、数皓的数据縛视图选择数摒源视图选择数据源视图选择为挖掘结构提供数据的数据縛视图可用数据憑视團®:可用数据憑视團®:表:表:dbo.三园志4Hdbo. X国志图16选择数据源视图(16)勾选事例,继续下一步指定表类型指是劳析吋姜使用的裏类型.0>辑入表(X):表爭例嵌喜禪1三国志屯$X ill anil naahm:iim miiiiii Hma «tutn 图17指定表类型(17)在键列勾选序号码,在输入列勾选出身、国别、魅力、统御、武力、政治、智慧、 忠诚,在可预测列勾选身份,继续下一步图18指定定型数据(18)下一步图19指定内容和数据类型(19)勾选允

6、许钻取,完成煤敎据挖握向导-完成向导“一肯挖掘结构提供名称,从而完成数据挖掘向导- 卜身削力愣瀏力爭洽苗 出国魅畠统武序政智挖掘结构名称追)允许钻取(T)预览通图21完成数据挖掘向导(20) 单击挖掘模型查看器图22完成设置(21) 询问是否部署项目,是图23部署项目(22) 询问是否继续,是图24处理模型(23)单击运行图25运行挖掘项目(24)待处理完成后,关闭外理讲度匸姮区-对抠宪结枸a5®£4''的处理已成功完成-爲幵始时间;知勺知;56:錯束时间;SOI2-ie-4 G;3T:W;0;00:03 对挖掘模型“三固志巒的处邂已战功完成°叶匕

7、刘迤S 吒国超 2序号即 的处理己戍功芫成.-j对雾誰数花毎“三圍志! -tic"的坯理已成功爲成念”开拍时间.201121 9.3T.S7 :结束时问:2012-12-4 9:3T 5T ;持续时问.0:00.00 ”卜也时度绘值爼11 丫吓汕吐则1解"理巳捷功芫成*94 4. li£i+J血h血甘1设计起彌T* X号掘结枸1%氏掘1S型J.甩掘很过程疳辭运|蜃庖圖兰田更1辛报畫環型文测三右4僭mttism以说飯己煜萍片怔克辱犁片內客.T曲甘f代馆JS碉多闷咼|百禺: 島2跌认扩展3于姣别朋缺可楽取価苗立才因談型:6 ;青晟-全卸爭例r |是示壘剔ILux i

8、LuajiN«h. daq建皓激樹曲毎3 Hah” dir丄FE18猎构A,三国茗4號亍J杂顼回格奉 回军师图26处理结果(25)关闭处理窗口后,就可在 挖掘模型查看器 的决策树中看到系统经过分析得出的结果图27分类关系图依赖关系网络:图27分类剖面图(26)在挖掘模型 中,右键单击挖掘模型可以设置算法参数三歸【畫计| Jbdl.dSF 谁计1 稣页*挖掘皓构| %挖須屆挖瘟血査署器 g 挖戛准确性閔蓋I。挖搦根週a 己我疹X绪构7出扁国别魅力三噪AB武力序昱応智著处理挖基结构他) 处理蟆型O .XInput曬性嘔|图28算法参数(27)算法参数的意义COMPLEXITYPENALT

9、禁止决策树生长。减少此值会增加拆解的可能性,而增加此值则会减 少拆解的可能性。FORCE_REGRESSOt制算法使用的数据行作为回归公式的回归输入变量,而不考虑其在算法计算中的重要性为何。MAXIMU MN PUT_ATTRIBUT ES定在叫用功能选项之前, 算法可以处理输入属性的最大数目。 maximum_output_attribuT指定在叫用功能选项之前,算法可以处理输出属性的最大数 目。MINIMUM_SUPPOR指定分叶节点必须包含的最小个例数目SCORE METHOD定用来计算分割准则的方法。SPLIT_METHOD旨定用来节点分杈的模式。图29设置算法参数(28)设定完算法后

10、,再次点击 挖掘模型查看器 进行数据处理,处理完成后所得出的结果 就是设置算法后的结果。奉数疋);CWmiTif PENALTir值戢认值范围10. 0Q. 0H .)1.3 J1.3MIJnMUN_SUPPOET SCORE METHO:i SrmjlETHDB五、实验心得体会通过这次关于决策树的实验, 的学习提供了一个好的铺垫,让我对决策树的应用有了相对具体的理解, 并且为决策树 在学习过程中,决策树中的算法由于利用系统本身, 所以并没有具体理解ID3这个算法的具体运转环节, 但是有了这次实验的铺垫,使自己能够更加容易之后的ID3算法的学习。六、思考题决策树对数据分类的正确率是否可以达到100%?答:不可以达到100%决策树一般都是自上而下来生成的。决策树由一个决策图和可能的结果(包括资源成本和风险)组成,用来创建到达目标的规划。每个决策或事件都可能引出两个或多个事件,导 致不同的结果,把这种决策分支画成图形很像一棵树的枝干,所以称作决策树。对于那些各类别样本数量不一致的数据,在决策树当中信息增益的结果偏向于那些具有更多数值的特征。决策树的这种明确性可能带来误导。决策树分类准确率极限理论:定理1:有经验风险和结构风险时,决策树分类准确率的极限不存在。定理2:无经验风险、有结构风险时,决策树分类准确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论