数据的图形化展示_第1页
数据的图形化展示_第2页
数据的图形化展示_第3页
数据的图形化展示_第4页
数据的图形化展示_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一页,共九十六页,编辑于2023年,星期六第20章数据的图形化展示2第二页,共九十六页,编辑于2023年,星期六本章的主要内容图表类型图表的创建使用图表散点图的显示条形图的绘制绘制直方图收集图显示多重散点图网络图显示评估节点图时间散点图的显示图20-1图形节点选项板第三页,共九十六页,编辑于2023年,星期六20.1图表类型层叠图三维图动画效果图第四页,共九十六页,编辑于2023年,星期六20.1.1层叠图第五页,共九十六页,编辑于2023年,星期六图20-2以颜色为层次的图图20-3以大小为层次的图第六页,共九十六页,编辑于2023年,星期六图20-4以颜色、大小、形状和透明度为层次的图图20-5以面板图为层次的图第七页,共九十六页,编辑于2023年,星期六20.1.2三维图像有两种创建3-D图像的方法:(1)将信息绘制在三维坐标轴上(真正的3-D图像)。(2)将图像用3-D效果显示。这两种方法对于散点图和收集图(如图20-6所示)来说都是可用的。图20-6三维收集图

第八页,共九十六页,编辑于2023年,星期六将信息绘制在一个三维坐标轴上步骤如下:在图表节点对话框中,选择“散点图”页签。单击“3-D”图标按钮启动Z轴的选项。使用“字段选取器”图标按钮来为Z轴选择一个字段。在一些情况下,只可以使用符号字段。字段选取器将显示合适的字段。如果要对图像加3-D效果显示。可以在已经创建图表的输出窗口中选择“图形”对象,单击“3-D”图标按钮来将视图转换为三维图像。第九页,共九十六页,编辑于2023年,星期六20.1.3动画效果散点图、多重散点图和直方图可以被设计为动画形式。使用带有三个类别的变量的动画点图如图20-7所示。一旦用户已经作出了一个带有动画效果的图像,就可以用各种方式使用动画工具:(1)在任何时点暂停动画按钮。(2)使用拖动滑块在想要观看的点处观看。第十页,共九十六页,编辑于2023年,星期六图20-7动画散点图第十一页,共九十六页,编辑于2023年,星期六20.2图表的创建对于所有图形类型,用户都可以为生成的文件名和显示方式指定以下选项。●输出到屏幕:选择在一个Clementine窗口内产生并显示图像。●输出到文件:选择将生成的图像保存为一个文件,此文件的类型是文件类型下拉列表中给定的。●文件类型:可用的文件类型有:(1)Bitmap(.bmp)(2)JPEG(.jpg)(3)PNG(.png)(4)HTMLdocument(.hml)(5)Vizml(.xml)(6)Outputobject(.cou).●文件名:指定生成的图所用的文件名。使用自定义(…)按钮来指定一个文件及其位置。第十二页,共九十六页,编辑于2023年,星期六图20-8散点图对话框输出设置

第十三页,共九十六页,编辑于2023年,星期六对于除了条形图以外的所有图来说,用户可以在图创建之前或者探索已生成图时指定外观选项。如图20-9所示为散点图对话框外观页签。图20-9散点图对话框外观设置

第十四页,共九十六页,编辑于2023年,星期六相关参数的说明如下:设置用于:使用下拉列表来选择“标题”、“说明”或“标签”。X(Y)标签:只可用于“标签”中,用户可选择“定制”来为X(Y)轴指定一个常用标注。Z标签:可以选择“定制”来为Z轴指定一个常用标注。显示网格线:这个选项是默认选定的,它在点或图后面显示出网格线使得用户可以更容易的确定区域和带的分割点。网格线常常显示为白色,除非图像背景也是白色的,这时它们显示为灰色。第十五页,共九十六页,编辑于2023年,星期六用户创建图形后,可用一些方法制定和操作我们创建的图形,允许的操作方式包括:使用鼠标来选择一个图表区域以便进行更深入的操作。使用菜单栏中可用的选项。不同的图表可能有不同类型的可用菜单和选项。在选定区域上右击鼠标右键,给这个区域提供可用的内容菜单,如图20-10所示。第十六页,共九十六页,编辑于2023年,星期六图20-10在已选定区域中带有内容菜单的散点图第十七页,共九十六页,编辑于2023年,星期六还可以依据已创建图表的不同类型来执行下述操作:使用鼠标高亮度表示划定的矩形数据区域。通过点击图像区域,高亮度表示直方图和收集图上的数据带。识别并标注用户的数据子集。基于图表上选定的区域来生成操作节点。第十八页,共九十六页,编辑于2023年,星期六图20-11图形窗口文件菜单和工具栏

第十九页,共九十六页,编辑于2023年,星期六20.3散点图的显示图20-12散点图节点的设置

第二十页,共九十六页,编辑于2023年,星期六相关参数的说明如下:X(Y)字段:从列表中选择一个字段并显示在X(Y)轴上,也被称为水平(垂直)轴或者横(纵)坐标。Z字段:当用户点击“3-D”图标按钮()时,第三个字段变得可用,用户可以从列表中选择一个字段并显示在Z轴上。交叠字段:包括颜色、大小、形状、面板、动画、透明度等。交叠函数:选择指定一个已知函数,将其比作实际的数值。第二十一页,共九十六页,编辑于2023年,星期六20.4.3使用散点图使用层叠,将会用图示说明在申报(值或数字)和谷物的类型之间是否存在一定的关系。如图20-13所示。图20-13反映变量值和需求关系的散点图第二十二页,共九十六页,编辑于2023年,星期六20.3.1定义一个区域

使用鼠标来定义一个区域的步骤:●在图中某个地方点击鼠标的左键来定义区域的一角。●为了定义区域的另一个对角,将鼠标拖动到需要的位置。结果得到的矩形不能超过轴的边界。●放开鼠标按键来为这个区域创建一个永久矩形。新创建的区域被默认称为区域N,如图20-14所示。图20-14定义一个区域第二十三页,共九十六页,编辑于2023年,星期六按照以下方式使用鼠标,这样可以在图像窗口中产生反馈信息。●在数据点上方停留鼠标可以提供此点所特有的信息,如图20-15所示。●在一个区域中右击并按住鼠标按钮,以提供关于此区域边界的信息,如图20-16所示。●直接在一个区域内右击鼠标来弹出一个带有更多选项的内容菜单,比如产生过程节点。第二十四页,共九十六页,编辑于2023年,星期六图20-15提示区域内某点特有的信息图20-16提示区域边界信息第二十五页,共九十六页,编辑于2023年,星期六20.3.2删除已创建的区域●在已定义区域的任何地方点击鼠标右键。●从内容菜单中,选择“删除区域”选项。如果用户已经定义了一个区域,那么用户可以选择一组记录,选择的标准是它们是否被包括在一个特定区域里或者在几个区域中。通过生成一个导出节点来标记记录——标记的标准是它们是否被包括在一个区域中,用户还可以为一条记录合并区域信息。第二十六页,共九十六页,编辑于2023年,星期六20.3.3编辑图像区域选择“编辑”/“图形区域”菜单,即可打开如图20-17所示的编辑图形区域对话框来编辑。图20-17编辑图形区域对话框第二十七页,共九十六页,编辑于2023年,星期六用户可以用以下方式编辑图像区域。●在区域名称栏输入对已定义区域名的调整。●手动的通过调整X,Y的最小值,最大值来指定区域边界。●通过指定名称和边界来加入新的区域。然后按下回车键来开始新的一行。●通过在表格中选定一个区域,并单击删除按钮来删除一个区域。第二十八页,共九十六页,编辑于2023年,星期六20.4条形图的绘制一个条形图像表现的是,在一个数据集中,符号型(非数值型)变量值的发生情况。条形图节点的一个典型用途是展示出数据中的不平衡。这种不平衡是可以通过在建构一个模型之前使用平衡节点来调整的。用户可以利用一个条形图形窗口中的内容菜单来自动生成一个平衡节点。第二十九页,共九十六页,编辑于2023年,星期六图20-18条形图节点设置

第三十页,共九十六页,编辑于2023年,星期六相关的参数设置如下:散点图:选择“选定字段”单选按钮可以指出选定字段的分布。选择“所有标志字段”单选按钮可以为数据集中的标记字段指出其真实值的分布。字段:用来显示变量值的分布。交叠字段:在上面已经选定字段的每个变量值中说明它的变量值分布。颜色:选择按比例决定条形,以使得所有条形能占满整个图形的宽度。排序:选择在条形图中用来显示变量值的方法。比例尺:选择按比例决定的变量值分布。第三十一页,共九十六页,编辑于2023年,星期六图20-19反应儿童反应数量的条形图图20-20条形图生成菜单选项第三十二页,共九十六页,编辑于2023年,星期六其下一级子菜单选项说明如下:选择节点:从图像中选择任何一个单元来为这个类别产生一个选择节点。导出节点:从图形中选择任何一个单元来为这个类别产生一个导出标志节点。平衡节点(增加):这个节点将增大较小数据子集的规模。平衡节点(减少):使用这个选项来生成一个平衡节点,这个节点将减小较大数据子集的规模。重新分类节点(组):这个节点将按组分类以减少数据子集的规模。重新分类节点(值):这个节点将按值分类以减少数据子集的规模。第三十三页,共九十六页,编辑于2023年,星期六从一个条形图中选择并且复制变量值,具体步骤如下:单击并按住鼠标左键不放,同时拖动鼠标来选择一组变量值。用户可以使用“编辑”菜单来选择所有变量值。在“编辑”菜单中,选择“复制”命令。贴到剪贴板上或者到想要放置的应用程序中即可。第三十四页,共九十六页,编辑于2023年,星期六20.5绘制直方图图20-21直方图的参数设置

第三十五页,共九十六页,编辑于2023年,星期六相关的设置参数如下:字段:选择一个数值型字段,展示这个字段变量值的分布。交叠字段:选择一个符号型字段来为以上选定的字段显示变量值的类别。直方图有3种层叠方式,分别是:颜色、面板、动画。第三十六页,共九十六页,编辑于2023年,星期六20.5.1定义变量值的区域点击直方图中的任何一个位置,设置一条线来定义一个变量值的区域。或者,单击工具栏中的“区域”图标按钮,将图像分成相等的区域。这种方法为工具栏添加了更多选项,用户可以使用这些选项来指定大量的相等区域。如图20-22所示。第三十七页,共九十六页,编辑于2023年,星期六通过以下方式用鼠标在图像窗口中生成一个反馈信息:●将鼠标放在条柱上不动,可以提供关于条柱的特定信息。●通过在一个区域中右击鼠标并阅读窗口底部的反馈显示屏,可以检查一个区域的变量值范围。●简单地在一个区域中右击鼠标,可以弹出一个带有更多选项的内容菜单,比如生成过程节点。●通过在一个区域中右击鼠标并选择“重命名带状区域”可以为区域重新命名。区域的名字被预设为区域N,这里的N等于从x轴左端到x右端的区域个数。●通过用用户的鼠标选定一条区域线并将它移动到x轴上所希望放置的位置,可以移动一个区域的边界线。●通过在一条线上右击鼠标并选定“删除带状区域”选项,可以删除区域。第三十八页,共九十六页,编辑于2023年,星期六20.5.2在一个特定段中选择或标记记录在区域中单击鼠标右键。注意区域的详细信息是显示在图形下部的反馈信息显示屏中的。从内容菜单中选择“生成带状区域的选择节点”选项或者“生成带状区域的导出节点”选项。“选择节点”选项选定的是在区域中的所有记录。而“导出节点”选项则是为变量值落入区域的记录生成一个标记。标记的字段名称与区域名称是相对应的,对于在区域内部的记录设置标记为T,而对于在外部的记录则设置标记为F。第三十九页,共九十六页,编辑于2023年,星期六20.5.3为所有区域中的记录生成集合从图像窗口的“生成”菜单中选择“导出节点”选项一个新的导出设置节点出现在带有选项的流程区域中,这些选项是为了给每个记录创建一个新的被称为“区域”的字段而设置的。这个字段的变量值等于每个记录落入的区域名称。第四十页,共九十六页,编辑于2023年,星期六20.5.4编辑图型区域选择“编辑”菜单的“图形带状区域”,打开编辑区域对话框,如图20-23所示。●在“带状区域名称”栏用户可以给已经定义的区域名键入调整值。●用户可以通过调整X和Y的最大值和最小值来手动地指定区域的边界通过指定名称和边界来加入新的区域。然后按下回车键来开始新的一行。●通过在表格中选择一个段并且点击“删除”按钮来删除段。图20-23编辑图形带状区域对话框第四十一页,共九十六页,编辑于2023年,星期六20.6收集图显示图20-24收集图节点的参数设置第四十二页,共九十六页,编辑于2023年,星期六相关设置的参数如下:收集:选择一个字段,其变量值将在“超出”中被聚集,并显示在下面给定字段的变量值范围中。只有尚未被定义为符号型的字段才能被列出。超出:选择一个字段,其变量值将被用来显示上面指定的收集图字段。由:在创建一个3-D图像时被激活,这个选项允许用户选择一个用来按类别显示收集图字段的设定或标记字段。操作:选择收集图中的每个条柱都分别代表什么。选项包括“合计”、“平均值”、“最大值”、“最小值”、“标准差”。交叠字段:选择一个符号型字段来指示上述已选定字段的变量值的类别。选择一个转换收集图的交叠字段,可为每个类别都建立不同颜色的多重条柱。交叠方式有:颜色、面板、动画。第四十三页,共九十六页,编辑于2023年,星期六图20-253-D收集图第四十四页,共九十六页,编辑于2023年,星期六图20-26二维收集图第四十五页,共九十六页,编辑于2023年,星期六一旦用户已经创建了一个收集图节点,图像窗口中的一些选项就可用了。例如,用户可以:●将X轴上的数值范围划分为区段。●以是否包含在一个特殊段的数值范围内为依据,生成一个选择或导出标记节点。●选择一个导出集合节点,它可以指示出哪个区段包含一个记录的变量值。●生成一个平衡节点来纠正资料中的不均衡状况。第四十六页,共九十六页,编辑于2023年,星期六20.7多重散点图节点多重散点图是一种特殊类型的散点图,它显示的是一个单独的X字段对应多个Y字段的情况。Y字段被绘制成带有颜色的线,而且每条线都与一个Y模式被设置为线、X模式被设置为“排序”的散点图节点等价。当用户有时间序列数据,并希望能发掘出某些变量在一定时间内的波动状况时,多重散点图时十分有用的。第四十七页,共九十六页,编辑于2023年,星期六图20-27多重散点图节点对话框第四十八页,共九十六页,编辑于2023年,星期六相关设置参数如图所示:X字段:选择一个沿着X轴显示的字段。Y字段:从列表中选择一个或多个字段来显示Y字段变量值的整个范围。交叠字段:有两种方式:面板和动画。标准化:此选项是为了能在图上显示而将所有Y变量值按比例缩小到0和1之间。标准化可以帮助用户发掘图中没有清楚显示出来的线条之间的关系。图20-28、20-29所示分别为标准化前和标准化后的多重散点图。第四十九页,共九十六页,编辑于2023年,星期六图20-28未标准化时的多重散点图图20-29标准化后的多重散点图第五十页,共九十六页,编辑于2023年,星期六●交叠字段函数:选择指定一个已知函数,将其比作实际的数值。●当记录数大于:指定一个绘制大规模数据集的方法。用户可以指定一个最大的数据集规模或者使用默认的2000个点。●间隔:当数据集包含多于指定数目的记录时,选择进行间隔储存。间隔就是在真正绘制和计算每个格子单元中出现点的数目之前,将图像划分出适当的格子。在最终的图像中,一个点将会被绘制每个的间隔质心上的单元中。●样本:按照文本框中的记录数随机对数据进行抽样。第五十一页,共九十六页,编辑于2023年,星期六20.8网络图显示网络图节点显示的是两个或两个以上符号型字段之间关系的强弱程度。这种图像通过使用各种不同类型的线条指示联系的强度来显示关系。例如,农业研究者可以使用一个网络图节点来研究各种农作物与地区和土质之间的关系。第五十二页,共九十六页,编辑于2023年,星期六图20-30网络图节点对话框第五十三页,共九十六页,编辑于2023年,星期六相关设置的参数如下所示:网络:选择创建一个网络图图像,可以阐明所有指定字段之间的关系强度。导向网络:选择创建一个有向网络图,可以阐明多个字段和一个字段变量值之间的关系强度,例如性别和信仰。当这个选项被选定时,“结束字段”输入框将被激活而且下面的字段控制部分将被重新命名为“源字段”以使之更加清晰。结束字段:选择一个标志或设置字段,用于一个有向网络。只有尚未被明确设置为数值型的字段才能被列出。源字段:选择字段来创建一个网络图图像。只有尚未被明确设置为数值型的字段才能被列出。第五十四页,共九十六页,编辑于2023年,星期六仅显示真值标志:选择对一个标记字段只显示真值的标志。这个选项简化了网络图显示,并且经常被用在正值的发生率具有特殊重要性的数据里。线值为:从下拉列表中选择一个域值类型,分别为:绝对值、总体百分比、“目标“字段/值的百分比、“源”字段/值的百分比。粗连接较重:这是被默认选定的查看字段间连接的标准方法。弱连接较重:此选项颠倒了粗体线条显示的连接的意义。这个选项被频繁地用在欺诈行为侦察或外来人员检查中。第五十五页,共九十六页,编辑于2023年,星期六网络图节点被用来显示两个或两个以上符号型字段变量值之间关系的强度。关系被显示在一个图中,这个图用各种不同类型的线条来指示强度渐增的关联。用户可以使用网络图节点,例如,探究胆固醇水平、血压以及在治疗病人疾病方面十分有效的药品三者之间的关系。如图20-31所示:图20-31胆固醇水平、血压和药品之间的网络图节点第五十六页,共九十六页,编辑于2023年,星期六说明:强链接用加黑线条表示:这显示出两个变量值具有很强的关联,进而应深入的研究。中等链接用一条普通线条表示。弱链接用一条虚线表示。如果两个变量值之间没有任何线条链接,那么这就意味着两个变量值从未在同一记录中出现过,或者也可能这种联合是在网络图节点对话框里给定的域值范围之外的一些记录中出现的。如果用户已经创建了一个网络图节点,那么这里有一些选项可以调整图像的显示,并且为深层分析而生成节点。第五十七页,共九十六页,编辑于2023年,星期六对于网络节点和有向网络节点两者来说,用户可以:●改变网络图显示的布局。●隐藏某些点以简化显示。●改变控制线条类型的域值。●突出显示变量值之间的线条来指示出一个“经过选择的”关系。●对于一个或多个“经过选择的”记录生成一个选择节点,或者生成一个与网络图中一个或多个关系向关联的导出标志节点。第五十八页,共九十六页,编辑于2023年,星期六在一个点上单击鼠标并将它拖动到新的位置。

在网络图的一个点上右击鼠标并且从内容菜单中选择“隐藏”或“隐藏并重新计划”选项。所有被隐藏的点,从图像窗口中的“网络”菜单里选择“全部显示并重新计划”选项,这样就可以显示所有的点。20.8.1调整点第五十九页,共九十六页,编辑于2023年,星期六20.8.2为单一关系选择或标记记录在代表所感兴趣的关联的那条线上右击鼠标。从内容菜单中,选择“生成链接的选择节点”或者“生成链接的导出节点”选项。选择节点将选定所有具有特定链接的记录。导出节点生成一个标记,这个标记将指示出对于在整个数据集中的记录来说,选定的链接是否为真值。标志字段是通过合并链接中的两个变量值来命名的。第六十页,共九十六页,编辑于2023年,星期六20.8.3为关联选择或标志记录在代表所感兴趣的链接的网络图里选择线条。从图像窗口中的“生成”菜单,选择“选择节点(与)”,“选择节点(或)”,“导出节点(与)”,“导出节点(或)”选项。第六十一页,共九十六页,编辑于2023年,星期六20.8.4调整网络图阈值在用户已经创建了一个网络图以后,用户可以使用工具栏滑块来调整控制线条类型的阈值,以改变最小的可视线条。用户也可以通过点击工具栏上的黄色双箭头图标按钮来查看更多的阈值选项,以扩展网络图形窗口,如图20-32所示。第六十二页,共九十六页,编辑于2023年,星期六图20-32带有显示和阈值选项的扩展窗口第六十三页,共九十六页,编辑于2023年,星期六相关设置的参数如下所示:阈值为:在网络图节点对话框中显示创建过程中被选定阈值的类型。绝对值:以包含每一对数值的记录个数为基础的绝对值阈值。网络显示:为在输出图像中控制链接规模而指定选项。大小连续变化:选择显示一系列以真实数据值为基础的、反映链接强度变化的链接规模。大小显示强/正常/弱类别:选择显示三种强度的关系——强、正常和弱。以上粗链接:为强关联(加重线)和规则关联(正常线)指定一个阈值。以下弱链接:为弱关联(点线)和规则关联(正常线)指定一个数字。第六十四页,共九十六页,编辑于2023年,星期六20.9.5创建一个网络图汇总用户可以创建一个列出强、中等和弱链接的网络图汇总文件,这个文件是通过点击工具栏上的黄色双箭头按钮来扩展网络图图像。然后选择“汇总”页签来查看每种类型的链接表。对每个表使用触发按钮可以进行表的扩展或隐藏,如图20-33所示。第六十五页,共九十六页,编辑于2023年,星期六图20-33引出各字段之间关联的网络图汇总第六十六页,共九十六页,编辑于2023年,星期六20.9评估节点图图20-34评估节点的设置项第六十七页,共九十六页,编辑于2023年,星期六相关参数说明如下:图表类型:提供5种类型包括——收益图、响应图、提升图、利润图、投资回报图。积累散点图:选择建立一个积累的图表。积累图中的变量值将被绘制为每个分位点与所有更高点相加的和。包含基线:选择在图中包括一个基线。散点图:从下拉列表中选择将要绘制在图表中的分位点的大小。样式:选择“线”或者“点”单选按钮。点类型:通过下拉选项选择其中一个来指定点的类型,其包括:矩形、三角形、五角形、六角形、点、加号、星形等。第六十八页,共九十六页,编辑于2023年,星期六评估图展示了模型在预测某些特殊结果时是如何执行的,具体实现的步骤如下:以预测值和对预测的置信度为基础来为记录分类。将记录划分为同样大小的组。由高到低的为每一个分位点绘制商业标准的变量值。多个模型在图中被表示为多条相互独立的线。第六十九页,共九十六页,编辑于2023年,星期六20.9.1收益图表收益被定义为在每个分位点上的成功总数的一定百分比。它是用公式“(百分点位上的成功数/总的成功数)*100%”来计算的。收益图表如图20-35所示。图20-35收益图表第七十页,共九十六页,编辑于2023年,星期六20.9.2响应图表响应就是简单的分位点中的成功数占记录数的百分比。它是用公式“(分位点中的成功数、分位点中的记录数)*100%”来计算的。用线表示的响应图表如图20-36所示。图20-36响应图表第七十一页,共九十六页,编辑于2023年,星期六20.9.3提升图表提升是将在每个分位点中成功数占记录数的百分比与在训练数据中成功数所占百分比做比较。它是用公式(分位点中成功数/分位点中记录数)/(总成功数/总记录数)来计算的。提升图表如图20-37所示。图20-37提升图表第七十二页,共九十六页,编辑于2023年,星期六20.9.4利润图表利润等于每个记录的收入减去此记录的成本。一个分位点的利润就是分位点中所有记录利润的简单加总。利润通常被假设为只能应用于成功,但成本却可以应用于所有记录。利润和成本可以被固定或者按照数据中的字段被定义。利润是用公式“(分位点中所有记录收入总和-分位点中所有记录成本总和”来计算的。用线表示的利润图如图19-38所示。图20-38利润图表第七十三页,共九十六页,编辑于2023年,星期六20.9.5投资回报率图表投资回报率与利润是相似的,它们都包括了收入和成本的定义。投资回报率是将分位点中的利润与成本作比较。它是用公式“(分位点中的利润/分位点中成本)*100%”来计算的。投资回报率图表如图20-39所示。图20-39投资回报率图表第七十四页,共九十六页,编辑于2023年,星期六20.9.6读取模型评估的结果20.9.6.1收益图表累积收益图表从左端到右端以0%为起点,以100%为终点。对于一个好的模型来说,收益图表将陡峭地升高到100%然后渐渐变得平缓。而一个没有提供任何信息的模型将从较低的左端以斜对角线形状上升到较高的右端。

第七十五页,共九十六页,编辑于2023年,星期六20.9.6.2响应图表累积响应图表基本上与提升图表相似。只是缩放比例尺有所不同。响应图表通常是从100%附近开始,逐渐下降直到它们到达了图表右端的整体响应率为止。对于一个好的模型来说,这条线在左端将从100%附近或恰好在100%上开始,当用户向右移动时能够保持一个较高的稳定状况,然后在图表右端突然急剧地下降到整体响应率。对没有提供任何信息的模型来说,整个图像中曲线将一直在整体响应率附近围绕。第七十六页,共九十六页,编辑于2023年,星期六20.9.6.3提升图表累积提升图表趋向于从左到右,以高于1.0为起始逐渐下降直到到达1.0为止。图表的右端边缘代表的是整个数据集,因此,累积图的分位点中成功数与数据中成功数的比率为1.0。对于一个好的模型来说,应该是恰好从左端高于1.0处开始,当用户移动到右边时能够保持在一个高度稳定的水平上,然后到图像右端时突然急剧地减小到1.0。而对于一个没有提供任何信息的模型来说,整个图像中曲线将一直在1.0附近围绕。第七十七页,共九十六页,编辑于2023年,星期六20.9.6.4利润图表累积利润图表显示的是当用户从左端移动到右端,来增加选定样本的规模是利润的总和。利润图表通常是从0附近开始,随着用户移动到右端稳定的增加,直到它们在中部达到一个最高点或平稳段,然后向表右端边缘逐渐下降。对于一个好的模型来说,利润图表将会在图表中部的某个地方展现一个定义得很好的最高点。对于一个没有提供任何信息的模型来说,这条线将会相对地比较直。并且依据所应用的成本/收入结构的不同可能是渐增的、渐减的或水平的。第七十八页,共九十六页,编辑于2023年,星期六20.9.6.5投资回报率图表积累投资回报率图表趋向于与响应图表和提升图表相似,除了缩放比例有所不同。投资回报图表通常从高于0%开始,逐渐下降直到它们到达整个数据集的整体投资回报率为止。对于一个好的模型来说,这条线应该恰好在0%以上开始,随着用户向右端移动能够保持一个较高的平稳状态,然后急剧地变小到图表右端的整体投资回报率。对于一个没有提供任何信息的模型来说,这条线应该在整体投资回报率附近围绕。第七十九页,共九十六页,编辑于2023年,星期六20.10时间散点图的显示图20-40时间散点图节点参数设置第八十页,共九十六页,编辑于2023年,星期六相关参数说明如下:系列:选择系列。在单独面板上显示系列:选择此项,表示如果有两个或多个以上序列时,那么这些序列图将显示在不同的图上,而不是共同坐标轴。标准化:此项是为了能在图表上显示而将所有X,Y变量值按比例缩小到0和1之间。显示:提供3种显示方式(线、点和平滑线)。限制记录可绘制的最大记录数:用户可以自定义画点图是需要的记录数的最大值。第八十一页,共九十六页,编辑于2023年,星期六图20-53一张时间散点图第八十二页,共九十六页,编辑于2023年,星期六20.11状态检测范例例20-1:利用Clementine系统提供的数据集cond1n,对一台机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论