人工智能基础与应用(第2版)(微课版)课件 模块4 分门别类:帮你“分而治之”_第1页
人工智能基础与应用(第2版)(微课版)课件 模块4 分门别类:帮你“分而治之”_第2页
人工智能基础与应用(第2版)(微课版)课件 模块4 分门别类:帮你“分而治之”_第3页
人工智能基础与应用(第2版)(微课版)课件 模块4 分门别类:帮你“分而治之”_第4页
人工智能基础与应用(第2版)(微课版)课件 模块4 分门别类:帮你“分而治之”_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4-1分类器模块❹分门别类:帮你“分而治之”目录CONTENTS什么是分类器01分类器如何工作02一.什么是分类器1.概念分类器:分类是人工智能的一种重要方法,是在已有数据的基础上学习出一个分类函数或构造出一个分类模型,该函数或者模型就是一个能完成分类任务的人工智能系统,即人们通常所说的分类器。。数据集分类器给定的某个类型二.分类器如何工作1.一般工作过程三个关键要素:1样本特征2正负样本3分类器类型二.分类器如何工作2.三个概念(1)样本特征。样本特征提取是分类器工作的首要任务,如果待分类对象没有提取特征,也就没有分类的依据,就无从辨别对象的种类。综合考虑关联对象的差异,提取出有效的特征,让分类器准确工作。(2)正、负样本。针对分类问题,正样本是指想要正确分类出的类别所对应的样本,负样本是指不属于这一类别的样本。既要考虑正样本,又要根据实际工作场景,合理选取足够多的负样本,保证模型训练效果。(3)分类器。分类器通过学习得到一个目标函数或模型(以下统称为模型),它能把样本的特征集X映射到一个预先定义的类别号y。二.分类器如何工作2.三个概念那么,机器学习中,常见的分类器有哪些呢人工智能基础与应用Thankyouverymuch!4-2几种主要的分类器模块❹分门别类:帮你“分而治之”目录CONTENTS决策树01k近邻分类器03贝叶斯分类器02神经网络05支持向量机04一.决策树概念决策树(decisiontree):用于决策的一棵“树”,它从根节点出发,通过决策节点对样本的不同特征进行划分,按照结果进入不同的选择分支,最终到达某一叶子节点,获得分类结果。垃圾邮件分类决策树:二.贝叶斯分类器1.概念贝叶斯分类器(bayesclassifier):就是对于给定的分类项,利用贝叶斯定理,求解该分类项在预先给定条件下各类别中出现的概率,哪个概率最大,就将其划分为哪个类别。贝叶斯定理公式:二.贝叶斯分类器2.举例用贝叶斯分类器来判定垃圾邮件:

x=[1,0]分别表示正常邮件和垃圾邮件E:由n个关键词组成的邮件三.k近邻分类器概念k近邻(k-NearestNeighbor,KNN)分类器:把每个具有n个特征的样本看作n维空间的一个点,对于给定的新样本,先计算该点与其他点的距离(相似度),然后将新样本指派为周围k个最近邻的多数类。什么形状的物体四.支持向量机1.概念支持向量机(SupportVectorMachine,SVM):基本思想是通过非线性映射,把样本空间映射到一个高维的特征空间,将原本样本空间线性不可分的问题,转化成在高维空间通过线性超平面将样本完全划分开的问题。不可分:可分:四.支持向量机1.原理超平面离直线两边的数据的间隔越大,对训练集的数据的局限性或噪声有最大的容忍能力,也就是所谓的鲁棒性。支持向量机就是要找到使这个间隔最大的决策超平面。五.神经网络1.概念‌神经网络(NeuralNetwork)‌是一种模仿动物神经网络行为特征进行分布式并行信息处理的算法数学模型。权重值w激活函数φ加权求和及函数sgn处理神经网络基本结构:人工智能基础与应用Thankyouverymuch!4-3项目1—识别猫狗模块❹分门别类:帮你“分而治之”目录CONTENTS提出问题01预备知识03解决方案02任务1—样本数据预处理04任务3—评估模型效果06任务2—构建及训练KNN模型05一.提出问题问题描述

对于人类来说,可以很容易识别身边的猫和狗,这是人类视觉经千万年演变进化的结果。但对于计算机而言,想让它识别一个图像上的猫和狗就不那么容易了。如何能让计算机识别出下图中的猫和狗呢?二.解决方案1.选择分类器选用KNN其核心思想是:如果一个样本在特征空间中的k个最近邻中的多数属于某个类别,则该样本也属于这个类别。通常采用欧氏距离来计算两样本之间的距离大小,并据此找到某样本的k个最近邻。猫或狗?K个最近邻中,多数是猫K个最近邻中,多数是狗二.解决方案2.解决方案三.预备知识1.图像灰度化灰度化实现代码:三.预备知识2.欧氏距离点X与点Y之间的欧氏距离等于各特征值之差的平方和的平方根用KNN算法计算两个样本之间的距离,以此来判定某个样本周围哪些邻居离它是最近的或者是最相似的。欧氏距离是常用的一种计算公式。样本X与样本Y之间的欧氏距离等于各特征值之差的平方和的平方根三.预备知识3.

KNN算法的主要参数点X与点Y之间的欧氏距离等于各特征值之差的平方和的平方根三.预备知识4.分类性能度量指标(1)真正(TruePositive,TP):被模型预测为正的正样本。(2)假正(FalsePositive,FP):被模型预测为正的负样本。(3)假负(FalseNegative,FN):被模型预测为负的正样本。(4)真负(TrueNegative,TN):被模型预测为负的负样本。(1)真正(TruePositive,TP):被模型预测为正的正样本。(2)假正(FalsePositive,FP):被模型预测为正的负样本。(3)假负(FalseNegative,FN):被模型预测为负的正样本。(4)真负(TrueNegative,TN):被模型预测为负的负样本。三.预备知识4.分类性能度量指标(1)精确率(2)正确率(3)召回率(4)F1值四.任务1——样本数据预处理1.将图像信息转存为向量(1)导入相关的库(2)定义转换函数img2array将图像数据转换成一维向量四.任务1——样本数据预处理1.将图像信息转存为向量(3)调用函数生成向量保存灰度图像信息的向量内容四.任务1——样本数据预处理2.批量生成样本数据(1)生成所有样本的特征值和标签值四.任务1——样本数据预处理2.批量生成样本数据(2)样本数据的归一化处理归一化数据生成训练集和测试集四.任务2——构建及训练KNN模型1.构建KNN模型上述代码定义一个KNN模型knn,模型中参数n_neighbors=13(采用训练样本数量的平方根的一半)、p=2表示使用欧氏距离来计算样本相似度大小,weights='distance'表示权重与距离成反比,即更近的近邻有更高的权重。四.任务2——构建及训练KNN模型2.训练模型(1)用训练集x_train、y_train来训练模型(2)观察模型训练效果训练效果不错,在测试集上是否任然有很好的表现?四.任务3——评估模型效果1.

测试模型性能模型性能测试报告评价精度为63%狗的召回率62%猫的召回率64%什么原因导致模型不理想?四.任务3——评估模型效果2.通过交叉表了解模型的错分情况(1)直观分析:四.任务3——评估模型效果2.通过交叉表了解模型的错分情况(2)交叉表分析:正确识别36个错误划分34个四.任务3——评估模型效果2.通过交叉表了解模型的错分情况如何去改善模型的性能例如尝试改变模型参数K人工智能基础与应用Thankyouverymuch!3-4项目2—辅助诊断乳腺癌模块❹分门别类:帮你“分而治之”目录CONTENTS提出问题01预备知识03解决方案02任务1—准备训练集和测试集04任务3—评估模型诊断效果06任务2—构建和训练模型05一.提出问题问题描述随着医疗AI在医疗领域的投入使用,如今智慧医疗科技的新纪元已经开启,如图4-17所示,借助“人工智能大脑”,AI辅助诊疗新时代正在到来。而现在AI辅助诊断技术的应用,能够很大程度地提高医疗机构、医生的工作效率,降低医生的工作强度,降低漏诊率。那么,AI是如何辅助医生进行病情诊断的呢二.解决方案1.问题本质从活检数据中判断患者是有病还是没病,本身是一个二分类问题,另外,活检数据稀有、获取成本高,符合SVM的适用条件,为此,采用SVM进行分类。采用SVM求解问题二.解决方案2.解决方案三.预备知识1.SVM的最优分界面H0则是最优分界面,因为它到两边临界分界面的距离最大,具有较强的抗噪声能力和较小的泛化误差。三.预备知识2.SVM模型参数核函数K(x,y)变换线性不可分线性可分SVM模型的常用参数三.预备知识3.解读数据集其中id列是编号,无实际意义。诊断列diagnosis取值[M|B],分别表示诊断为恶性或良性。其他30个列由细胞核的10个不同特征的平均值、标准差、最差值等构成。四.任务1——准备训练集和测试集1.按比例生成训练集和测试集8:2比例降为1维四.任务1——准备训练集和测试集2.观察测试集的分布情况用数据预测是否患病五.任务2——构建和训练模型1.用训练样本训练SVM模型训练模型构建模型用支持向量机svm构建预测模型,核函数为rbf,惩罚参数C取值为1五

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论