归纳和分析学习的结合

上传人：姚*** IP属地：广东上传时间：2023-04-07 格式：PPT 页数：27 大小：1.37MB 积分：18 举报 版权申诉

已阅读5页，还剩22页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

归纳和分析学习的结合2003.12.181第1页，共27页，2023年，2月20日，星期四2003.12.182概述纯粹的归纳学习方法通过在训练样例中寻找经验化的规律来形成一般假设纯粹的分析方法使用先验知识演绎推导一般假设本章考虑将归纳和分析的机制结合起来的方法，并获得两者的优点：有先验知识时获得更高的泛化精度和依赖训练数据克服先验知识的不足所得到的结合的方法比纯粹的归纳方法和分析方法的性能都要高第2页，共27页，2023年，2月20日，星期四2003.12.183动机归纳学习寻找拟合训练数据的一般假设，分析学习寻找拟合先验知识的一般假设，同时使它覆盖训练数据归纳方法和分析方法对假设的论证方法有根本区别，因此优缺点互为补充，将它们结合起来有可能得到更强有力的学习方法纯粹的分析学习方法的优缺点优点：可用先验知识从较少的数据中更精确地泛化以引导学习缺点：当先验知识不足或不正确时，可能产生误导纯粹的归纳学习方法的优缺点优点：不需要显示的先验知识，主要基于训练数据学习规律缺点：训练数据不足时，会失败，会被其中隐式的归纳偏置所误导第3页，共27页，2023年，2月20日，星期四2003.12.184表12-1纯粹的分析学习和纯粹的归纳学习的比较归纳学习分析学习目标拟合数据的假设拟合领域理论的假设论证统计推理演绎推理优点需要很少先验知识从稀少的数据中学习缺陷稀少的数据，不正确的偏置不完美的领域理论第4页，共27页，2023年，2月20日，星期四2003.12.185动机（2）图12-1概述了学习问题的分布范围，它随着可获得的先验知识和训练数据不同而变化在一个极端，有大量的训练数据，但没有先验知识在另一个极端，有很强的先验知识，但训练数据很少多数实际学习问题位于这两个极端之间，通常可以从近似的先验知识开始本章考虑的问题是：什么样的算法，使用近似的先验知识结合可用数据来形成一般的假设第5页，共27页，2023年，2月20日，星期四2003.12.186动机（3）即使使用最纯粹的归纳学习算法，仍有机会基于特定学习任务的先验知识来选择设计方案通常设计者将领域特定的知识嵌入到学习算法中，但我们感兴趣的是一个系统能将先验知识和训练数据作为显示的输入给学习器概括而言，我们感兴趣的是领域无关算法，这种算法使用显示输入的领域相关的知识，这种算法具备以下的属性：如果没有领域理论，它至少能像纯粹的归纳方法一样有效学习如果没有完美的领域理论，它至少能像纯粹的分析方法一样有效学习如果领域理论和训练数据都不完美，它应能结合两者的长处，比单纯的归纳或分析方法的性能要好它应能处理训练数据中未知程度的差错它应能处理领域理论中未知程度的差错这里列出的期望目标很难达到，目前没有算法能以一般化的方式满足所有这些约束第6页，共27页，2023年，2月20日，星期四2003.12.187学习的归纳-分析途径本章考虑的学习问题已知一个训练样例集合D，可能包含差错一个领域理论B，可能包含差错候选假设的空间H求解一个最好地拟合训练样例和领域理论的假设最好地拟合训练样例和领域理论的确切定义第7页，共27页，2023年，2月20日，星期四2003.12.188学习的归纳-分析途径（2）确定先验知识和数据权值的一种解决方法是使用贝叶斯观点贝叶斯定律描述了怎样计算给定训练数据D时假设h的后验概率贝叶斯定律基于观察到的数据D以及先验知识计算后验概率，以P(h),P(D)和P(D|h)的形式表示我们可以把P(h),P(D)和P(D|h)看作是某种形式的背景知识贝叶斯理论可看作一种为领域理论加权的方法，它与观察到的数据D一起，赋予h的后验概率为P(h|D)贝叶斯公式提供了为先验知识和观察到数据的贡献加权的方法但是，贝叶斯公式隐含假定了关于P(h),P(D),P(D|h)概率分布的完美知识贝叶斯公式没有提供将这些近似已知的概率分布与观察数据结合起来的方法第8页，共27页，2023年，2月20日，星期四2003.12.189假设空间搜索大多数学习任务可以刻画为假设空间上的搜索任务,而决定这个搜索任务的4个参数是：假设空间H搜索的初始假设h0定义单个搜索步的搜索算子集合O指定搜索目标的判据G本章探索了3种方法，它们用先验知识来改变纯归纳方法执行的搜索使用先验知识推导出搜索起步的初始假设：Kbann使用先验知识来改变假设空间搜索的目标：Ebnn使用先验知识改变可用的搜索步：Focl第9页，共27页，2023年，2月20日，星期四2003.12.1810使用先验知识得到的初始假设KBANN技术：一种使用先验知识的方法是将假设初始化为完美拟合领域理论，然后按照需要归纳地精化初始假设以拟合训练数据这种技术的动机是：如果领域理论是正确的，初始假设将正确分类所有训练样例，而无需再修正；如果初始假设不能完美地分类训练样例，那么它需要被归纳精华，以改进它在训练样例上的拟合度在纯粹归纳的反向传播算法中，权值一般被初始化为小的随机值，KBANN的含义是：即使领域理论是近似正确的，将网络初始化为拟合领域理论，比初始化为随机值有更好的近似开端第10页，共27页，2023年，2月20日，星期四2003.12.1811KBANN算法KBANN假定领域理论用一组命题形式的非递归的Horn子句来表示，输入和输出如下：已知：一组训练样例由非递归命题型Horn子句组成的领域理论求解：一个拟合训练样例的被领域理论偏置的人工神经网络KBANN算法包含两个阶段创建一个完美拟合领域理论的人工神经网络使用反向传播算法来精化初始网络以拟合训练样例第11页，共27页，2023年，2月20日，星期四2003.12.1812表12-2KBANN算法KBANN(Domain_Theory,Training_Examples)Domain_Theory：非递归命题型Horn子句集Training_Examples：目标函数的<input,output>对的集合分析步：创建一个等价于领域理论的初始网络对每个实例属性创建一个网络输入对Domain_Theory的每个Horn子句，创建如下的网络单元连接此单元的输入到此子句的先行词测试的属性对子句的每个非负先行词，赋予权值W给对应的sigmoid单元输入对子句的每个负先行词，赋予权值-W给对应的sigmoid单元输入设置此单元的阈值w0为-(n-0.5)W，其中n为子句的非负先行词的数目在网络单元之间增加附加的连接，连接深度为i的每个网络单元到深度为i+1的所有网络单元的输入层上，赋予这些附加的连接为接近0的随机权值归纳步：精化此初始网络应用反向传播算法来调整初始网络权值以拟合Training_Examples第12页，共27页，2023年，2月20日，星期四2003.12.1813举例表12-3Cup学习任务领域理论训练样例在KBANN算法的第一步，构建一个与领域理论一致的初始网络，见图12-2对领域理论中每个Horn子句建立一个sigmoid单元对该Horn子句的每个先行词，建立其对应的Sigmoid单元作为输入对于每个对应于非负先行词的输入，权值被设置为某正常量W，对每个对应于负先行词的输入，权值为-W单元的阈值权w0设为-(n-0.5)W，其中n为非负先行词的数目附加许多输入到每个阈值单元，它们的权值设置为近似0，从而允许网络能够学习到超出领域理论的依赖关系在KBANN算法的第二步，使用训练样例和反向传播算法来精化网络权值图12-3在归纳步发现了全新的依赖关系第13页，共27页，2023年，2月20日，星期四2003.12.1814KBANN算法说明KBANN的好处和局限好处：在给定近似正确领域理论时，能够比反向传播有更高的泛化精度，特别是在训练数据稀少时局限：只能使用命题领域理论，如果给予很不精确的领域理论，KBANN也可能被误导，从而其泛化精度变得低于反向传播第14页，共27页，2023年，2月20日，星期四2003.12.1815使用先验知识改变搜索目标将先验知识合并到梯度下降中需最小化的误差判据，这样网络需要拟合的是训练数据和领域理论的组合函数TangentProp算法TangentProp算法接受的领域知识被表示为对应于其输入变换的目标函数的导数例如，对每个实例xi描述为一个实数，那么每个训练样例的形式可能是<xi,f(xi),>图12-5，基于3个训练样例学习目标函数f，通过拟合训练值f(xi)的同时拟合相应的导数，学习器能够实现更好的泛化概括而言，包含训练导数的效果是为了克服反向传播算法中的归纳偏置，将其替换为所希望的导数的显示输入信息？？？P248-P249第15页，共27页，2023年，2月20日，星期四2003.12.1816TangentProp举例Simardetal.提供了TangentProp的泛化精度与纯归纳反向传播之间的比较结果针对任务是为单个数字0到9的图像做标注给予TangentProp的先验知识是：数字的分类不因图像的水平和垂直平移而改变表12-4，显示TangentProp的泛化精度高于纯反向传播算法第16页，共27页，2023年，2月20日，星期四2003.12.1817TangentProp的说明TangentProp使用的先验知识形式为目标函数对应其输入变换的所希望的导数TangentProp通过使一个指标函数最小化来结合先验知识和观察到的训练数据，这个指标函数同时度量了网络对应训练样例值的误差和网络对应于导数的误差值决定了网络在中个误差中拟合这两部分的程度，它由设计者选择TangentProp的不足：对于先验知识中的错误健壮性不强，而且不能预先知道训练导数中的错误出现程度，因而不能很好地选择常量以确定拟合训练值和训练导数的相对重要程度第17页，共27页，2023年，2月20日，星期四2003.12.1818TangentProp的说明（2）TangentProp和反向传播的搜索方法比较TangentProp通过改变梯度下降最小化的指标函数来影响假设搜索，相当于改变了搜索目标如果训练样例和先验知识都正确，并且目标函数可用ANN精确表示，那么满足TangentProp指标的权向量集合将为满足反向传播指标的权向量集合的子集，一些不正确的假设会被TangentProp剔除掉对目标函数的训练导数拟合的另一种方法是，简单地将观察到的训练样例附近的附加训练样例综合起来，使用已知的训练导数来估计这些附近的实例的训练值第18页，共27页，2023年，2月20日，星期四2003.12.1819EBNN算法EBNN是基于解释的神经网络，它用两种方式改进了TangentProp算法它不依靠用户提供训练导数，而是对每个训练样例自行计算训练导数，计算方法是通过用一套给定的领域理论来解释每个训练样例涉及了如何确定学习过程中归纳和分析部分相对重要程度的问题，的值是对每个训练样例独立选择的，它基于一个启发式规则，考虑领域理论能否精确预测特定样例的训练值因此，对于那些能由领域理论正确解释的训练样例，学习的分析成分被强化，而对不能正确解释的样例，分析成分被弱化第19页，共27页，2023年，2月20日，星期四2003.12.1820EBNN算法（2）EBNN的输入包括：形式为<xi,f(xi)>的一组训练样例，不包含训练导数一组领域理论，表示为一组预先训练过的神经网络，而不是KBANN采用的Horn子句EBNN的输出：一个能逼近目标函数f的新的神经网络，学习到的网络能够拟合训练样例以及从领域理论中抽取的f的训练导数图12-7，图的上面部分显示的是目标函数Cup的领域理论，每一方块表示领域理论中一个神经网络，图的下面是要学习的新神经网络，称为目标网络第20页，共27页，2023年，2月20日，星期四2003.12.1821EBNN算法（3）EBNN通过执行TangentProp算法来学习目标网络EBNN把接收到的输入训练值<xi,f(xi)>和从领域理论中计算出的导数提供给TangentPropEBNN计算训练导数的方法？？？第21页，共27页，2023年，2月20日，星期四2003.12.1822EBNN算法的说明概括地说，EBNN算法使用的领域理论被表示为一组预先学习到的神经网络，然后领域理论与训练样例一起训练其输出假设对每个训练样例，EBNN使用其领域理论来解释它，然后从此解释中抽取训练导数对实例的每个属性计算出一个训练导数，以描述按照领域理论，目标函数值是怎样被属性值的微小变化影响的Prolog-EBG与EBNN的区别EBNN能够处理不完美的领域知识，而Prolog-EBG不能Prolog-EBG学习到逐渐增长的Horn子句集，而EBNN学习到固定大小的神经网络第22页，共27页，2023年，2月20日，星期四2003.12.1823使用先验知识来扩展搜索算子FOCL是纯归纳算法FOIL的一个扩展，它们的区别在于：搜索单个Horn子句的一般到特殊过程中候选假设生成的方法FOIL生成每个候选特化式是通过加入一个新文字到子句前件中得到的FOCL使用同样的方法产生候选特化式，但还基于领域理论生成了附加的特化式操作型文字和非操作型文字操作型文字：当一个文字可被用于描述一个输出假设非操作型文字：只出现在领域理论中作为中间特征但不是实例的原子属性的文字第23页，共27页，2023年，2月20日，星期四2003.12.1824FOCL算法FOCL使用下面两种算子扩展当前假设h对不是h一部分的每个操作型文字，创建h的一个特化式，方法是加入文字到前件中按照领域理论，创建一个操作型的且是目标概念的逻辑充分条件，将这组文字加入到h的当前前件中，最后修剪h的前件，移去对于训练数据不需要的文字，具体过程如下：首先选择一条领域理论子句，它的头部匹配目标概念，如果有多个这样的子句，选择其中子句体关于训练样例有最高信息增益的所选子句的前件形成了目标概念的一个逻辑充分条件，在这些充分条件中，再次使用领域理论，每个非操作型文字被替换掉，将子句前件代入到子句后件中这个展开的过程持续到充分条件被表述为操作型文字，如果有多个可选的展开，那么用贪婪法选择有最大信息增益的一个最后，修剪充分条件。对表达式中的每个文字，除非文字的移除会降低训练样例上的分类精度，否则它被移去上面的讨论很容易扩展到一阶表示中，类似第10章第24页，共27页，2023年，2月20日，星期四2003.12.1825FOCL的说

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

归纳和分析学习的结合

文档简介

温馨提示

最新文档

评论

归纳和分析学习的结合

文档简介

温馨提示

最新文档

评论

相关文档