《数据挖掘与机器学习》 课件5.2 构建加工厂玻璃类别识别模型_第1页
《数据挖掘与机器学习》 课件5.2 构建加工厂玻璃类别识别模型_第2页
《数据挖掘与机器学习》 课件5.2 构建加工厂玻璃类别识别模型_第3页
《数据挖掘与机器学习》 课件5.2 构建加工厂玻璃类别识别模型_第4页
《数据挖掘与机器学习》 课件5.2 构建加工厂玻璃类别识别模型_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

构建加工厂玻璃类别识别模型加工厂玻璃类别识别——决策树、随机森林任务描述对于玻璃加工厂来说,对生产出来的玻璃进行分类识别,有助于提高生产效率、降低生产成本和提高产品质量。随着人工智能技术的不断发展,自动化生产已成为工业发展的趋势。为了响应科技强国政策,某玻璃加工厂需要对不同玻璃的类别进行自动识别。任务要求使用sklearn库构建决策树模型。决策树决策树决策树是一种常见的分类和回归模型,其基本思想是通过一系列的问答,将数据逐步分类或回归至最终结果。要坚持问题导向,问题是时代的声音,回答并指导解决问题是理论的根本任务。什么是决策树?苹果红色绿色硬软硬软好苹果坏苹果坏苹果好苹果在决策树模型中,每个节点表示一个特征或属性,分支表示这个特征或属性的取值,叶子节点表示最终的分类或回归结果。通过不断地对数据进行分类或回归,决策树可以逐步划分出不同的类别或预测结果。决策树决策树生成过程1特征选择:选择最优的特征或属性作为当前节点,以使得每个子节点的纯度或信息熵最大化。信息中排除了冗余后的平均信息量称为“信息熵”。2树的生成:根据选择的特征或属性,将数据集划分为不同的子集,生成子节点。递归生成子树:对每个子节点重复特征选择和树的生成,直到满足停止条件,如到达预定的树的深度、叶子节点数量达到预定值等。3决策树使用sklearn库中的DecisionTreeClassifier类建立决策树模型,其基本使用格式如下。classsklearn.tree.DecisionTreeClassifier(*,criterion='gini',splitter='best',max_depth=None,min_samples_split=2,min_samples_leaf=1)决策树DecisionTreeClassifier类常用的参数及说明如下。参数名称说明min_samples_split接收int或float,表示进行划分的最小样本数。默认值为2min_samples_leaf接收int或float,表示叶子节点最少样本数。默认值为1criterion接收str,表示决策树的衡量标准。可以是"gini"或"entropy"。默认值为"gini"splitter接收str,表示决策树节点的拆分策略,默认为"best"max_depth接收int,表示树的最大深度。默认为"None"决策树篮球世界杯是全球篮球迷引领狂欢的盛宴,但由于决赛阶段的参赛队伍数量有限,许多球队最终只能在预选赛中结束征程,对于这些国家的球迷而言预选赛的比赛结果尤为重要。但是篮球比赛的结果常常难以预测,往往需要在比赛的最后几分钟才能决定胜负。因此,在篮球运动中,对于胜负的预测较为困难。体育强国,篮球是最为重要的元素之一,促进群众体育和竞技体育全面发展。通过运用决策树算法,可以对各支队伍的胜负进行预测和分析。决策树下表是关于篮球各队得分与胜负的数据集,PTS(visitor)表示客队获胜,PTS(home)表示主队获胜,win/lose表示客队获胜与否,获胜为1失败为0。PTS(visitor)PTS(home)win/lose871050100108011311211001030831110使用DecisionTreeClassifier类构建决策树模型,对篮球胜负进行预测。决策树决策树模型的优点是易于理解和解释,同时可以处理非线性关系。它还可以处理多分类问题和连续性特征的数据。此外,决策树还可以在训练集上进行有效的特征选择,剔除掉冗余的特征,提高模型的泛化能力。然而,决策树模型也存在一些缺点:容易过拟合,特别是当树的深度很大或训练样本数量不足时;决策树模型对数据中的噪声和异常值比较敏感;决策树模型生成的树可能很复杂,难以解释和可视化。在实际应用中,为了克服决策树模型的缺点,通常会采用剪枝策略、集成学习、随机森林等技术进行改进和优化,从而提高决策树模型的性能和鲁棒性。决策树模型优缺点决策树导入开发库拆分训练集和测试集构建模型评估决策树模型构建加工厂玻璃类别识别模型主要通过以下4个步骤实现。使用import和from导入train_test_split、DecisionTreeClassifier、accuracy_score、recall_score、confusion_matrix等开发类库.使用train_test_split类拆分为训练集和测试集使用sklearn库的DecisionTreeClassifier类建立决策树模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论