orange实现逻辑回归-Orange-开源机器学习交互式数据分析工具_第1页
orange实现逻辑回归-Orange-开源机器学习交互式数据分析工具_第2页
orange实现逻辑回归-Orange-开源机器学习交互式数据分析工具_第3页
orange实现逻辑回归-Orange-开源机器学习交互式数据分析工具_第4页
orange实现逻辑回归-Orange-开源机器学习交互式数据分析工具_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

orange实现逻辑回归_Orange——开源机器学习交互式数据分析⼯具Orange为新⼿和专家提供开源机器学习和数据可视化。使⽤⼤型⼯具箱交互式数据分析⼯作流程。交互式数据可视化Orange的全部内容都是关于数据可视化,帮助发现隐藏的数据模式,提供数据分析过程背后的直觉或⽀持数据科学家与领域专家之间的交流。可视化窗⼝⼩部件包括散点图,箱形图和直⽅图,以及特定于模型的可视化,例如树状图,轮廓图和树可视化,仅举⼏例。许多其他可视化功能可⽤于附加组件,包括⽹络,词云,地理地图等的可视化。我们注意使橙⾊可视化交互:您可以从散点图,树中的节点,树状图中的分⽀中选择数据点。任何这样的交互都会指⽰可视化来发出与所选部分可视化对应的数据⼦集。考虑下⾯的散点图和分类树的组合。散点图显⽰所有数据,但突出显⽰与分类树中选定节点对应的数据⼦集。丰富的可视化橙⾊包括许多标准的可视化。散点图⾮常适合可视化⼀对属性之间的相关性,⽤于显⽰基本统计数据的框图,⽤于提供整个数据集概述的热图,以及⽤于绘制多维数据的MDS等投影图。除了数据挖掘套件中的可视化之外,Orange还包含⼀些其他软件包中可能没有的额外功能。其中包括⽤于分析聚类结果的轮廓图的⼩部件,⽤于发现特征交互的马赛克和Sieve图以及⽤于分类树和森林的毕达哥拉斯树可视化。探索性数据分析交互式可视化⽀持探索性数据分析。可以直接从图表,图表和数据表中选择有趣的数据⼦集,并将它们挖掘到下游的⼩部件中。例如,从层次聚类树状图中选择⼀个聚类并将其映射到MDS图中的⼆维数据表⽰。或者检查数据表中的值。或者观察其特征值在箱形图中的传播。⼀次打开所有这些窗⼝,看看选择中的更改如何影响其他⼩部件。或者,⼜例如,在数据集上交叉验证逻辑回归并将⼀些错误分类映射到⼆维投影。将Orange变成⼀种⼯具很容易,即使领域专家缺乏对基础统计数据或机器学习的见解,领域专家也可以探索他们的数据。智能可视化有时候有太多的选择。⽐如说,当数据具有许多特征时,我们应该在散点图中将哪些特征对形象化以提供⼤多数信息?智能可视化来拯救!在Orange的散点图中,这称为分数图。当提供课程信息时,ScorePlots会找到具有最佳课程分类的投影。考虑棕⾊选择的数据集(带有橙⾊)及其79个功能。有3,081(79*78/2)个不同的特征对,⼿动检查它们的⽅式太多,但只有少数特征组合会产⽣很好的散点图。分数图找到他们全部,并允许我们浏览它们。报告最后,我们只需单击⼀下即可将关于模型的最重要的可视化,统计数据和信息纳⼊报告。Orange包含巧妙的报告,您可以直接从报告中访问每个窗⼝⼩部件和可视化的⼯作流历史记录。可视化编程对于初学者以及专家型数据科学家来说,Orange是⼀款出⾊的数据挖掘⼯具。由于其⽤户界⾯,⽤户可以专注于数据分析⽽不是费⼒的编码,从⽽简化复杂数据分析流⽔线的构建。基于组件的数据挖掘在Orange中,数据分析是通过将组件堆叠到⼯作流中完成的。每个组件(称为⼩部件)都嵌⼊了⼀些数据检索,预处理,可视化,建模或评估任务。在⼯作流中组合不同的⼩部件可以让您随时构建全⾯的数据分析模式。有了⼀个⼤型的⼩部件库,你不会被选中。其他⼩部件可通过附加组件获得,并允许进⾏更专注和⾯向主题的研究。交互式数据探索橙⾊的⼩部件相互沟通。他们接收有关输⼊的数据并发送过滤或处理的数据,模型或⼩部件在输出中执⾏的任何操作。⽐⽅说,从⼀个File⼩部件开始,它读取数据并将其输出连接到另⼀个⼩部件,例如数据表,并且您有⼀个正常⼯作的⼯作流程。改变⼀个⼩部件的任何变化,这些变化即时通过下游⼯作流传播。更改File⼩部件中的数据⽂件将触发所有下游⼩部件中的响应。如果这些⼩部件是开放的,并且您可以⽴即看到该数据中的任何更改的结果,交互式可视化中的⽅法或选择的参数,那么这⾮常有趣。例如,在下⾯的简单⼯作流程中,在电⼦表格中选择数据传播到散点图时,通过选择合适的⼩部件及其连接,很容易为各种数据分析任务构建复杂的⼯作流程。智能的⼯作流设计界⾯即使是完全新⼿,橙⾊也很容易使⽤。从File⼩部件开始,Orange将⾃动建议可以连接到它的下⼀个⼩部件。例如,Orange知道在设置Distances⼩部件后,您可能需要HierarchicalClustering。⼩部件中的所有其他默认设置也可以进⾏简单分析,即使不了解统计信息,机器学习或探索性数据挖掘的⼤量情况。界⾯概览在“⽂件”⼩部件中加载和编辑您的数据。分类器的交叉验证和评分。在散点图中的数据选择在箱形图中可视化。交互式梯度下降。数据可以包含对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论