统计分析-函数拟合-自然指数函数_第1页
统计分析-函数拟合-自然指数函数_第2页
统计分析-函数拟合-自然指数函数_第3页
统计分析-函数拟合-自然指数函数_第4页
统计分析-函数拟合-自然指数函数_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ExpMiner(版本号: 2.0.3.1 ) 软件使用说明书ExpMiner目录一、软件介绍 4ExpMiner软件的主要功能 4数据分析介绍4数据分析中要点 4项目6项目说明6项目一新建 6项目一打开 6项目一删除7文件打开 错误!未定义书签。二、数据编辑功能 8文件一打开8文件一保存8编辑一复制 8编辑一粘贴 8编辑删除8编辑撤销8编辑一恢复9编辑一插入一样本编号 9编辑一插入若干歹U 9编辑一插入一若干彳丁 9编辑-数据格式标准化9编辑寻找10编辑一替换10样本升序排列10样本降序排列10样本类别交换10样本类别定义11样本抽取样本形成新数据集 -按变量范围抽取 11样本抽取样本形成新

2、数据集 -按变量取值 11样本测试样本集 12变量一函数12变量组合13变量一生成13三、数据预处理 15变量白化变换 15变量一主成份变换 17变量一对折变换 18变量一超多面体法筛选变量 19变量嫡法筛选变量 21变量投票法筛选变量 21变量最大相关最小冗余 22变量重要性 23四、统计分析24统计分析统计量 24统计分析相关性 25统计分析频度图 25统计分析卡方分布检验 26统计分析散点图 27统计分析因子分析 28统计分析实验分析 29统计分析一方差分析30统计分析均值检验 31统计分析函数拟合指数函数 32统计分析函数拟合修正指数函数 32统计分析函数拟合倒数函数 32统计分析函数

3、拟合自然指数函数 33统计分析函数拟合一哥函数 33统计分析一函数拟合一 Mitscherlich 函数 34统计分析一函数拟合一 Richards 函数 34统计分析函数拟合阿伦尼乌斯函数 35五、数据建模36模式识别主成份分析 36模式识别判别矢量 36模式识别球形映照 37模式识别一偏最小二乘 38模式识别最佳投影 39模式识别超多面体 40分类最近邻41分类一支持向量机分类 42分类一决策树ID343分类一决策树C4.543分类贝叶斯决策 43分类一K均值聚类 44分类一模糊 HKmeans44回归一偏最小二乘建模 44回归一多元线性回归 45回归一逐步多元线性回归 45回归一神经网络

4、 45回归一支持向量机回归 46六、附加功能 47图形功能47显示47设置49选取样本50数据分析结果(数据挖掘结果)使用 51实验设计一正交设计 54文档输出54七、常问问题 58什么是复杂数据? 58EXPMINE瞅件的特点和作用是什么? 58EXPMINE瞅件提供了这么多的数据处理算法,应用的时候怎么选择? 58数据处理过程有没有规律可遵循? 58线性回归方法的优点和局限性是什么? 58怎样快速判断样本集能否用线性回归方法建模? 58人工神经网络的优点和局限性是什么? 59模式识别方法的优点和局限性是什么? 59怎样将模式识别方法和其它数据挖掘方法结合起来应用? 59多目标的模式识别问题

5、如何解决? 59用EXPMINE瞅件建模对于数据对象有什么要求? 60BP人工神经网络结构中的隐节点的数目可以任意设定吗? 60如果人工神经网络计算结果不收敛怎么办? 60如何处理复杂数据? 60怎样进行复杂数据集的自变量筛选? 61数据文件的格式是怎样的? 63如何选择合适 的正交表? 64正交设计应用实例 6467、软件介绍ExpMiner软件的主要功能ExpMiner软件的主要功能:数据分析。数据分析又包括:项目管理、电子表格编辑、样 本处理、变量处理、统计分析、模式识别、分类建模、回归建模等功能。用户可以在进行变 量处理、统计分析、模式识别、分类建模、回归建模的过程中按“F1”获得帮助

6、信息。开始界面 区|ExpMiner数据分析,实监管理实晚设计图1-1 ExpMiner软件的启动界面数据分析介绍数据分析中要点点击图1-1中的“数据分析”按钮打开数据分析界面。启动界面开始后15秒也会自动进入数据分析界面。界面主要分为两个部分:数据和处理结果显示区域和处理过程显示区域。图1-2数据分析主界面数据文件的格式如下:NO.ClassYX1X2X3X4X5122.98470.130.626.152351.98211.04550.130.9811.126012.56310.61840.230.606.442063.48410.40400.270.916.833361.16522.137

7、30.140.726.012851.91622.33050.110.918.352712.36710.67330.230.635.021171.19822.25100.110.6010.081412.65910.62210.133.197.466892.541011.54930.160.606.501551.321121.86410.130.517.337963.45数据第一列是编号,第二列是类别信息(主要用于分类问题)第三列是应变量(目标值),其后是自变量。项目项目说明程序在关闭当前项目时,程序会提示是否保存状态。如果保存,程序会记录数据分析界 面左边的信息,下次打开项目时,会自动打开这些信

8、息对应的窗口。项目一新建功能:新建一个项目,开始新的工作。为了便于用户管理自己所做的工作,EXPMINE软件以项目为单位将用户所做的工作自动管理起来。开始一个新项目的数据处理工作前,必须 先给项目取一个名称,EXPMINER件以你的项目名称新建一个文件夹,你的原始数据、训练 样本集、重要计算结果等可以分门别类地保存在该文件夹的子文件夹中。操作:点击本菜单,出现对话框,给你的新项目取一个名称,再点击“确认”按钮即可 (见图1-3)。图1-3新建一个项目的输入界面项目打开功能:打开一个已建立的项目。打开已建的项目后,你可以方便地找到有关该项目的数 据,继续你的工作。操作:点击本菜单,出现对话框,在

9、项目列表框中选取一个名称,再点击“确认”按钮 即可(见图1-4)。图1-4打开一个项目的输入界面项目一删除功能:将不再需要的项目删除。操作:点击本菜单,出现对话框,点击“确认”按钮可以删除列表框显示的项目。(图1-5)。图1-5项目删除的界面二、数据编辑功能文件-打开打开一个已有的数据文件。操作:点击本菜单,出现对话框,选取一个文件名称,再点击“确认”按钮即可,支持 的文件类型包括文本文件,CS臧据文件,Excel数据文件;其中文本文件中的数据需用“Tab” 键分割,具体可参见示例文件(在 Example文件夹下)中的格式。文件-保存保存一个已有的数据文件。编辑-复制功能:将电子表格中选定的内

10、容复制至粘贴板。操作:用鼠标选取电子表格中的内容,然后点击本菜单即可。编辑-粘贴功能:将粘贴板中的内容复制至当前电子表格中。操作:用鼠标点击电子表格中的一个单元格作为粘贴的起始位置,然后点击本菜单即可编辑-删除功能:将电子表格中选定的行或列删除。操作:用鼠标选取电子表格中的行或列(可以是多行或多列),然后点击本菜单即可编辑-撤销功能:撤销刚才所做的编辑功能。编辑-恢复功能:恢复撤销所做的编辑功能编辑-插入-样本编号功能:在当前电子表格的第一列前插入一列,其内容为自然数序列,目的是给表格中的 样本编号。操作:点击本菜单即可。编辑插入若干列功能:在当前电子表格的选定列前插入若干列空白的列。操作:用

11、鼠标点击插入列的位置,然后点击本菜单,输入欲插入的列数,再点击“确认” 按钮即可。编辑插入若干行功能:在当前电子表格的选定行前插入若干空白的行。操作:用鼠标点击插入行的位置,然后点击本菜单,输入欲插入的行数,再点击“确认” 按钮即可。编辑-数据格式标准化功能:为数据添加编号、类别信息或目标值图2-1数据格式标准化编辑-寻找功能:在当前电子表格中寻找用户指定的字符申。操作:点击本菜单,输入欲寻找的字符串,再点击“确认”按钮即可编辑-替换功能:在当前电子表格中将寻找到的字符用以用户指定的字符串替换。操作:执行编辑-寻找功能后,光标将停留在找到的字符串上,然后点击本菜单即可 更方便的操作是直接在对话

12、框上点击“替换”按钮。样本-升序排列功能:按照表格中某列的内容,以字符或数字从小到大的顺序排列表中的纪录。 操作:点击字段名称选中表格中某列,再点击本菜单。样本降序排列功能:按照表格中某列的内容,以字符或数字从大到小的顺序排列表中的纪录。操作:先点击某一字段名称,再点击本菜单。样本-类别交换功能:将表格中样本的类别进行交换,如“ 1”类样本变为“ 2”类样本,“2”类样本则 变为“1”类样本。操作:点击本菜单,出现对话框,对话框默认设置是“ 1”类样本和“2”类样本的交换, 若不作修改,点击“确定”按钮即可。样本-类别定义功能:根据样本目标变量(应变量)的范围来定义样本的类别。操作:点击本菜单

13、,出现对话框,输入目标值的分布范围后,点击“确定”按钮即可样本抽取样本形成新数据集-按变量范围抽取功能:根据样本某个变量(自变量或目标变量)的范围抽取样本。操作:点击本菜单,出现对话框,确定变量名称和分布范围后,点击“确定”按钮即可(图 2-2)。图2-2按变量范围抽取样本样本抽取样本形成新数据集-按变量取值功能:根据样本某个变量(自变量或目标变量)的特定值抽取样本。操作:点击本菜单,出现对话框,确定变量名称和特定取值后,点击“确定”按钮即可(图 2-3)。图2-3按变量名称抽取样本样本-测试样本集功能:将当前表格中的数据纪录分解为两部分,一部分为训练样本,另一部分为测试样 本。操作:点击本菜

14、单,出现对话框,确定测试样本数目占全部样本的比例后,再点击“确 定”按钮即可。聿 测试样本集的超成修当前 译本集部分,一部先作加训嵯样本集.另一部分作为测试 胃又狗(I试呼本更进彳面装.10请输入测试样本案中样本敝目占总样本期的百分比(%)关闭图2-4形成测试样本集变量一函数功能:在当前电子表格中计算出某自变量的函数。操作:点击本菜单,出现对话框,确定原变量、新变量名称、新变量位置后,再点击 “函数名称"按钮即可(图2-5)图2-5 计算自变量的函数变量-组合功能:在当前电子表格中将两列变量组合起来形成一个新的变量。操作:点击本菜单,出现对话框,确定原始变量、组合变量名称、组合系数后

15、,再点击 “确定”按钮即可。型变量的组合刁回区电个名各的以以量任可用中你采两在认意以爵变本知委的、数也 -系, (定称 尊名 通中量 ¥框变膏义蒸苻定唯翼自合合 目目 百目 T- I ,选 量中 I 的表系散变量名称运算符系数 变量名称1 ST新变量名称HF1关闭福定图2-6将两列变量组合起来形成一个新的变量变量一生成功能:在当前电子表格中通过写表达式方法生成新自变量。操作:点击本菜单,出现对话框,填写新表达式。填写完后,点击“验证”按钮,通过 后再点击“确定”按钮即可。图2-7生成新变量三、数据预处理变量一白化变换功能:将当前表格中的样本集进行 白化变换处理。操作:点击本菜单,出现

16、对话框(图 3-1),确认自变量和目标变量。如果不修改参数, 按“确定”即可。要修改参数,点击“参数设置”按钮,出现对话框(图 3-3),设置参数。再点击“确定” 按钮即可(图3-2)。也可用鼠标点击参数说明区域,若允许修改参数,就出现参数设置的窗 口。设置完参数,点击“确定”,回到图3-2窗口,再按“确定”即可。图3-1数据窗口变量选择与参裁设置?|fx变堂 变量名称自变量 目标变里注释变量t E0al0a200a5 a4忧类样本:1计算卷数设置导入参裁1取消图3-2变量选择和参数设置窗口图3-3参数设置的窗口保存给果故据图示保用鲤短说理BAI(J =+0, 2952【al卜。.2307 a

17、2-0.09145 131 +0. 3050 M=。.62slKC :力二+,一a-,”i +三.一:._,;:旧入仃+,- ,z : :4L:-,日BAI(3) =W. 7032al+2.B44a2-0.13fila3-0.OB694I-2. TOCiB1I (4) =-l. 203 all+l. 136【a2】M. 2297(a3)+3. 379 a4-7.870裾 E=EKplinEr (Lab> TcBp2D8T52 L DMZTZbai. dat匠|叵区文件编辑样不堂里统计分析模式识别分美回归柒成学习工具栏 g笫雨 > 第5列7.田&芯4 : .显 7 为noe1

18、1/1BAIBAI(2)BAI (3)1八1193-O.23247790.09645191-0.004217894(2196W. 22T3E430.3414e420.067438713197-O. 2263324-0.14621690.010Lf6Q一4197-0.21336J6-0.SBSTO3-Cl 06072-o6280-a 2141071-0.3387224-0.喊32646T6280F. 1924331-0.1463206-0.6660798-7276-0.1B13764-0.1421909-0.6264362-8270-0.1M1081-0.1443103-0.9437881-92

19、66-0.143B618-0.1419837-0.9064E1-102ao-0.1616337-0.1446047-1. 11S466-11276-O. 23287670.096439150. 5514661(12270-0. 20607730.34204740.BB44427132TO-0. 2576719_0.33B61321.CS798v样本数:花列数:7图3-4白化变换的结果显示(方程和数据)变量-主成份变换功能:将当前表格中的样本集进行 主成份变换处理。操作:点击本菜单,出现对话框,确认自变量和目标变量后,输入主成分个数,再点击 “确定”按钮即可(图3-5)。变量选择与参数设置区图3

20、-5主成份变换窗口保存给鬼数据图示保存模型投考方程FCAtl) =-2.0L6 all+2.4S0 b2-0.026C6 a3-1.4?2 *44-2.0MFCA(2二坨.1954 al +2, 654 a2埼,B9B aS +2.刘 £ a4-0. 7E0PCA =W.0 323d alj-l. 400 a© +10. 480 a3 -1. SOd ad +2, 29。FCA (4 )=+L 649 il+2- M -1.。18 g a CtiB 闻4 514分分分分曲能成成主王主主笔弟第弟贡献率 0, 3564 0. 3366 a 2172 a 0698累计贡献率6 3

21、554d 59300. 9L021.0000E: EEpEiitE:E <Lab) TcbpJ T7e&i36ZZ72_pca. dst文件姆辑摔本受重统计分析模式识别分类回归集成学习工具栏no1 CI1 tPCA(l)PCA(2)"a LJ92650.3903091-1.758256F. 03618225102600.45051m1,9105070. 03057120112751. 569131CL 9772416F. 212397 7122701,4647352,1761540, 518410213Z?0bSUlSl2,432090,嚣5第Q6142651. 220

22、3351. 260677F. 3S9607L152601. 27472L 4356犯-0-5732B516275L T523add 6593135L 5G383B v怦本能相图3-6主成份变换结果变量-对折变换功能:将当前表格中的样本集进行 对折变换处理。操作:操作步骤同变量-白化变换。图3-7对折变换结果变量-超多面体法筛选变量功能:用超多面体方法的建模效果筛选变量。操作:点击本菜单,出现对话框,确认自变量和目标变量及删除变量终止条件后,再点 击“确定”按钮即可。图3-8超多面体法筛选变量图3-9超多面体法筛选变量结果变量-嫡法筛选变量功能:对于“包络型”数据文件,用变量的信息量大小来筛选变

23、量 操作:操作步骤同变量-白化变换(图3-2)。图3-10嫡法筛选变量结果变量-投票法筛选变量功能:对于“偏置型”数据文件,提供 3种判断变量重要性的方法,根据3种计算结果, 采用投票方式筛选变量。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可。变量选择和参数设置叼图3-11投票法筛选变量值检票法箭诜变量的结果t域用干倡置型戴棍文件二回区保存结果对于隔苴型数据文件,可以采用三种适用于偏置型数据文件处理的方法分别判断变量的重要性.然后根据三投想法维论是12这个要堂炭不重要,用户可以去试闱具删除,和算法所得结果进行V投黑未决以筛选变至,下面列出三种算法的计算结果供爹考

24、:(变量搜重要性降序棒 列)主成分回归变量a3 -0. 230M Oh 161al O.OB5a2 0.0&I Frincip al Coitpcment对应胫回归系疑KefrBssiatnrPCE)的信勇:偏酷小二弟叵1 归(Paitil Least Square Realession< FL5K)的结果:变量aS -0.1S64 0.173 al Oh 106 a2 0.027对应的叵1归系能果纳曲572泗731郡区2.LD.7>变Maaal泡对应的回1归系数图3-12投票法筛选变量结果变量-最大相关最小冗余功能:用变量间的信息量大小来筛选变量操作:操作步骤同投票法筛选

25、变量。之墨大相关最小冗余篇通变聿保存结果保存模型捏或变至隼髭大相关痛选变量II好32虱alas1蛉0. 200372&4O. 02640303F. 031234al-0.5133说明.0, 2OO3T21(X OG360SL30.017664770.0135 L929最大相关隈冗余赧选变量II阱变量排位越界孤跳月蓼量越重要.t邙蓑区考虑目F型痫臾绷同信曷川目美幕小冗余害虑自交量和尖附间、自空壁间的诘息图3-13最大相关最小冗余筛选变量结果变量-重要性功能:计算当前表格中的样本集变量的相对重要性 操作:操作步骤同投票法筛选变量。保存结耳.图不保存学平忤取交量焦嘲重要性图示5 0113 1

26、 82氯3L33图尼保存颜色20150-102 Mdia3变量名称图3-14重要性结果重要性大小四、统计分析统计分析-统计量功能:计算当前表格中的样本集各变量的平均值、标准方差、最大值和最小值,并按样 本属性分别计算。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可。,变量透料选择变量名称E1ral式a3虫关闭群定图4-1统计量变量选择N城计图形保存前色伯伯伯M 犬均.!唯 聚平景标 =:至都样本爱别为1的样本类别为2的样本曼大值L2001,200'1,100最、值Or 1000。10000.1000平均值Ol 51110 5g国0.456851 丈1图4-

27、2统计量结果显示统计分析-相关性功能:将当前表格中的样本集的相关系数。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可 对话框界面与图4-1相同。,相差性困图松保存薮色al al b4 券垦名薪相关性大小第砒图,共殍图保存-0 40B1651570。聚8692也胸263Or 02696 395图4-3相关性分析结果显示统计分析频度图功能:将自变量从小到大划分为十个区间,且各区间上含有相同数目的样本,统计计算各区间中“1”类样本出现的几率,同时计算出各区间上目标变量的平均值。操作:点击本菜单,出现对话框,再点击“确认”按钮即可。对话框界面与图4-1相同计算结果见图4-

28、4 o图4-4 频度图统计分析-卡方分布检验功能:检验变量的卡方分布检验。操作:点击本菜单,出现对话框,再点击“确认”按钮即可统计分析一散点图图4-5分布的卡方检验功能:将变量与变量依次组合,构成二维图像。操作:点击本菜单,出现对话框,再点击“确认”按钮即可图4-6散点图的变量选择恚融点图TiHlx保存图像显示设置样本选取97.0092.3067. eo82.9078.2073.5068. B064.W59.4054.7050.00相关系数:口 1054图4-7散点图统计分析因子分析功能:将数据在表中的纪录序号设定为时间序列号,可以考察目标变量和自变量的变化 趋势。操作:点击本菜单,出现对话框

29、(图 4-8),点击“确认”按钮即可。图4-8因子分析的变量选择窗口图4-9因子分析的结果显示统计分析-实验分析功能:根据单变量分析结果,给出变量的最优取值。数据要求:实验数据最好是正交设计表。操作:点击本菜单,出现对话框,点击“确认”按钮即可图4-10实验分析变量选择图4-11实验分析结果统计分析一方差分析功能:检验自变量对目标变量的影响(包括单因素、双因素方差分析)变量选择和参教设置IX图4-12方差分析变量选择单因素方差分析F1 施界直=1.952211接受服设:al对t影第不显著1± 二殳 源蹑 塞昌和福绝 我方组组总Fir拒方差平方和 6083.031 6486.625 1

30、25皿 66T51291 我对t意啕显著I自由度244771脸鸵俱2.死日把4方差源方差平方和组内12045.06组间52408总和12569.66Fl临界值=2, 739402接受假设:益对t影响不显著自由度陶墟值3710.9800252图4-13单因素方差分析结果统计分析-均值检验功能:检验两组实验数据均值是否有显著性差异说明:实验数据通过类别列来判断是否同组。不同组的实验数据应该有不同的类别值。统计分析-函数拟合-指数函数功能:用指数函数拟合X和丫。按钮即可操作:点击本菜单,出现对话框,选择 X列和Y列的值,点击“图4-14指数函数统计分析-函数拟合-修正指数函数操作步骤同指数函数拟合图

31、4-15修正指数函数统计分析-函数拟合-倒数函数操作步骤同指数函数拟合图4-16倒数函数统计分析-函数拟合-自然指数函数操作步骤同指数函数拟合图4-17自然指数函数统计分析-函数拟合-备函数操作步骤同指数函数拟合图4-18幕函数统计分析一函数拟合一Mitscherlich 函数操作步骤同指数函数拟合图 4-19 Mitscherlich 函数统计分析一函数拟合一Richards函数操作步骤同指数函数拟合图 4-20 Richards 函数统计分析-函数拟合-阿伦尼乌斯函数操作步骤同指数函数拟合图4-21阿伦尼乌斯函数五、数据建模模式识别-主成份分析功能:用主成份方法计算并将计算结果用投影图表示

32、出来。操作:操作步骤同变量-白化变换。结果界面见图5-1。图5-1主成份分析图模式识别-判别矢量功能:用FISHERY别矢量方法计算并将计算结果用投影图表示出来。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可 对话框界面与图3-2相同。结果界面见图 5-2。图5-2判别矢量图模式识别-球形映照功能:用球形映照方法计算并将计算结果用投影图表示出来。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可 对话框界面与图3-2相同。结果界面见图 5-3。图5-3球形映照图模式识别-偏最小二乘功能:用偏最小二乘方法 计算并将计算结果用投影图表示出来。

33、操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可 对话框界面与图3-2相同。结果界面见图 5-4。图5-4偏最小二乘法投影图模式识别-最佳投影功能:用最佳投影方法计算并将计算结果用投影图表示出来。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可 对话框界面与图3-2相同。结果界面见图 5-5。图5-5最佳投影图模式识别-超多面体功能:用超多面体方法计算并将计算结果用投影图表示出来。操作:点击本菜单,出现对话框(图 3-2),确认自变量和目标变量后,再点击“确定” 按钮即可。图5-6超多面体方法结果分类-最近邻功能:用最近邻方法考察样本分布

34、的局部结构。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可受量透群与李航诳置区装里受里名称目变型目标装惮在程变量匚EH回al叵0式回0占3回回氯回理法样式;回建立模型口其法细节。枪喊模型交叉哈证)o值魄模型片电扳据)计算|多数港苴导区爹施取消图5-7最近邻方法的变量选择图5-8最近邻方法参数设置步近邻法rnlfx错误分类的样本24516精谟率0.152777E混合矩阵3202居的60而/ < 4£4- iL T /eJi分夹为正例分夷为负例实际为正例|25买标为荀闹G336查全率:O.E92s查港率:0LT5能Fl苴:0.B19772保存结臬数据保

35、存模型糊艮ED确分堂的苴结果 样本A31830435767E9101112131415132021222324即2627四3133343536373839404144454647辐49B051546558即6061626364656667图5-9最近邻方法的结果分类-支持向量机分类功能:用支持向量机分类 建立目标变量和自变量之间定性关系。操作:点击本菜单,出现对话框(图 5-10),确认自变量和目标变量后,再点击“确定” 按钮即可。图5-10支持向量机分类参数设置分类-决策树ID3功能:用决策树ID3建立目标变量和自变量之间定性关系。按钮即可操作:点击本菜单,出现对话框,确认自变量和目标变量后

36、,再点击“确定” 对话框界面与图5-7相同。图5-11决策树ID3参数设置分类决策树C4.5功能:用决策树C4.5建立目标变量和自变量之间定性关系。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定” 对话框界面与图5-7相同。按钮即可图5-12决策树C4.5参数设置分类-贝叶斯决策功能:用贝叶斯决策建立目标变量和自变量之间定性关系。按钮即可操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定” 对话框界面与图5-7相同。分类K均值聚类功能:用K均值聚类建立目标变量和自变量之间定性关系。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可

37、对话框界面与图5-7相同。图5-12 K均值聚类参数设置分类模糊 HKmeans功能:用模本HKmean建立目标变量和自变量之间定性关系。操作:点击本菜单,出现对话框,确认自变量和目标变量后,再点击“确定”按钮即可 对话框界面与图5-7相同。图5-13模糊Hkmeans#数设置回归一偏最小二乘建模功能:用偏最小二乘方法 建立目标变量和自变量之间定量关系。操作:点击本菜单,出现对话框(图 5-7),确认自变量和目标变量后,再点击“确定” 按钮即可。回归一多元线性回归功能:用多元线性回归方法 建立目标变量和自变量之间定量关系。操作:点击本菜单,出现对话框(图 5-7),确认自变量和目标变量后,再点

38、击“确定” 按钮即可。回归一逐步多元线性回归功能:用逐步多元线性回归方法 建立目标变量和自变量之间定量关系。操作:点击本菜单,出现对话框(图 5-7),确认自变量和目标变量,再点击“确定”按 钮即可。图5-14逐步多元线性回归参数设置回归一神经网络功能:用人工神经网络 方法建立目标变量和自变量间的定量关系。操作:点击本菜单,出现对话框(界面与图5-7相同),确认目标变量和自变量后,再点 击“确认”按钮。图5-15人工神经网络参数设置回归一支持向量机回归功能:对数据样本进行支持向量机回归,并给出模型参数和示意图操作:点击本菜单,出现对话框(界面与图 5-7相同),确认目标变量和自变量后,再点击“

39、确认”按钮。出现支持向量机回归涉及的参数对话框,请于此输入您确定的参数,然 后点击“确认”按钮即可(图5-16)图5-16支持向量机回归参数设置六、附加功能图形功能显示以散点图为例,可以显示序号、类别、变量信息、图形符号图6-1显示序号图6-2显示变量信息图6-3显示图形符号(正方形和圆形)设置设置颜色、图形,散点的0图6-4改变颜色和形状图6-5改变后显示图例图6-6图例选取样本点击“画圆形”或 键,样本被圈中图“画矩形”菜单图6-7,在要选取样本的附近按下鼠标左键,拖动鼠标,再放开鼠标左6-8。再点击“选取样本”菜单。出现选取的样本的数据结果见图6-9。散点困保存图像显示设置样本选和横刺

40、画矩形取消上次选择I取消上¥爆制97.0093.30渚除所画框图选取样本(区域内)'选取样本f区域外)87.60图6-7点击图形帮点阐保存图像显示设置样本选取横轴图6-8鼠标按键和移动保存图像显示设置样本选取横轴 mv纵轴图例荚别37.0092.30E7.60 -图6-9选取样本(区域内)计算结果(数据挖掘结果)使用以偏最小二乘法结果(建模)为例需最小二乘法50 0054.7559 40641066 SO 73 50 7S 20 盟 9Q B7 SO 92 3097 0Q保存结果数据图示保存模型葩报分析偏最小二乘法计算结果样本数:”误差表误差名称相对误差葩对误差瓯误差1总误差

41、二10. 54215799.416117.00885平均误差*14,64187%1L 1032X62341%均方根误差(RMSE);12.6770¥ 方检验(Q2);0.079418图6-10计算结果总览点击菜单“图示”(图6-10),显示计算值和实验值(图 6-11),左下方的相关系数越大,说明计算值和实 验值相差越小。保存图像显示设直样本选取 t (Caln)97.0092.30 az.eo 眨如73 2073.50 gs.eo &4.1059.40 5JJO50.00相关系敷:D.ZSIG图6-11计算值和实验值点击菜单“保存模型”(图6-10),保存模型(图6-12)

42、31祝相ad常数项标准北系数0X1062O.O2T16-0.1S470.17340原始系数3.5901. 715-32.1819.55rMY5L5QL图6-12保存模型点击菜单“预报”(图6-10),选择预报的数据文件(格式同训练文件)(图6-13)图6-13选择预报的数据文件点击菜单“分析”(图6-10),出现贡献和权重图(图 6-14)。事权重图W拭窿旗变量名称乐宜大小权重大小BQ604Q20。 0 封常数项图6-14贡献和权重图敏感性图的使用支持向量机回归、分类、人工神经网络、最近邻都可以生成敏感性图。以支持向量机回归(建模)的结果为例,点击支持向量机回归计算结果窗口(类似图6-10)中

43、的“分析”菜单,出现敏感性图(图 6-15)。图6-15敏感性图点击菜单“变量-修改变量值”出现界面(图 6-16)。拖动蓝色框下的三角形滑块,改变变量值,敏感性图 中的图形会随之改变。图6-16修改变量值实验设计一正交设计功能:打开正交设计对话框(向导),选择正交表,填写因素名和水平后,自动形成符 合正交设计原理的试验数据表格。详见常见问题正交设计应用实例部分。文档输出功能:把数据分析界面中左边的树状结果中显示的窗体内容(数据和图片)输出到 Word 文件。操作步骤:点击数据分析界面上的“汇总到 Word文件”,选择保存文件名称,点击“输出”(图6-17到6-19)。图片保存在与文件同名的文

44、件夹下。容 EEplinKr项目文件视图分析而报ZZ72二偏最小二乘法回归L露最小二乘法:实验伍与计其值ta mi给出迓度-0 2汇层到匈工收件汇总概要到Hdi皎件配置ala2a4 常数项图6-17选择菜单lx提示:把当前项目下打开的窗口的内粉出到收。夜档.输出前,请关闭所有打开的Wor收档E:ExpMiner(Lab)zz72. doc选择文件输出配言lSEJ打开文件关闭图6-18输出过程提示:把当前项目下打开的窗口的内粉出到收。夜档.输出前,请关闭所有打开的Wor磔E:ExpMiner(Lab)zz?2. doc选择文件输出配言叮开二件关闭图6-19输出完成参数保存和导入以“模式识别-主成

45、分分析”为例,点击“参数设置”按钮,出现模式识别参数设置的界面(图6-20)。点击“保存参数”按钮,出现保存参数界面见图6-21。输入相关信息后,点击“创建”按钮,保存参数。图 6-20图6-21保存参数在图6-20中,点击“导入参数”按钮,出现导入参数界面 (图6-22),选择相应保存的参数。 点击“导入”, 导入选定的参数;点击“设为默认”,就把选定的参数作为该算法的默认参数。图6-22导入参数七、常问问题什么是复杂数据?复杂数据一般具有多变量、非线性、强噪声、自变量相关、非正态分布、非均匀分布等 全部或部分特征。EXPMINE软件的特点和作用是什么?和国际上多数软件主要只用一、二种方法不

46、同,EXPMINER件是把多种模式识别方法、人工神经网络方法、线性和非线性回归方法结合起来,互相取长补短,力图形成一个信息处 理流程,来对付各种复杂数据。因此,EXPMINE软件特别适用于处理复杂数据,既可作定量 分析,又可做半定量和定性分析。EXPMINE软件提供了这么多的数据处理算法,应用的时候怎么选择?一般来说,先选择简单的算法,在简单算法不能解决问题的时候再采用复杂算法,甚至 将多种方法结合起来灵活使用,必要时进行变量筛选和样本筛选后,尝试应用各种算法,并 对计算结果进行比较和分析。为了用户使用上方便,EXPMINER件提供了若干行之有效的处理复杂数据的手段。数据处理过程有没有规律可遵

47、循?由于数据处理对象千变万化,因此,数据处理过程不应是个一成不变的简单过程,应该 是根据数据处理对象的不同、数据处理的要求不同,具体问题具体分析,才能得到有实际意 义的数据处理结果。一般说来,数据处理过程是一个由粗到细,由表及里的过程,通常数据 处理需要经过数据预处理、统计分析、样本筛选、变量筛选、定量或定性建模等全部或部分 环节,建模方法可先后尝试回归建模、模式识别、人工神经网络等方法。线性回归方法的优点和局限性是什么?线性回归方法是建立在传统的统计学理论基础上的回归建模方法,在数据样本点足够多、满足正态分布、自变量间线性无关、且目标变量和自变量之间确实遵循线性规律的情况下, 则线性回归方法

48、能得到很好的模型,且非常容易解释实验事实。在科学规律上,最简单的才 是最美的,因此,我们不应该用复杂的算法代替简洁的线性回归方法。线性回归方法的局限性是不适用于解决复杂数据的数据挖掘问题。事实证明,我们在实 际工作中遇到的数据多半不能用线性回归方法得到令人满意的建模结果。怎样快速判断样本集能否用线性回归方法建模?理论上尚没有严格的定义判断样本集能否用线性回归方法建模,通常只能用线性回归方 法的建模结果来衡量样本集能否用线性回归方法建模,为此,EXPMINER件根据近百套不同 类型的数据的处理结果,得到一个经验性的近似判据,即用 PLS方法对样本集建模,若所得 标准化数据的预报残差平方和(PRESS对样本平均后的值小于 0.3 ,则该样本集可用线性 回归方法建模。人工神经网络的优点和局限性是什么?人工神

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论