版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、12021-11-16类神经网络,类似人类神经元结构。神经元的主要功能是接受刺激和传递信息。神经元通过传入神经接受来自体内外环境变化的刺激信息,并对这些信息加以分析、综合和储存,再经过传出神经把指令传到所支配的器官和组织,产生调节和控制效应。第1页/共39页22021-11-16yVj第2页/共39页3 类神经网络和回归分析不同,没有任何假设的概率分布,是模式识别和误差最小化的过程,在每一次经验中提取和学习信息。 类神经网络可以处理连续型和类别型的数据,对数据进行预测。 神经网络是有监督学习。神经网络的特点:神经网络的特点:第3页/共39页二、类神经网络的架构二、类神经网络的架构 类神经网络主
2、要结构是由神经元(neuron)、层(layer)和网络(network)三个部份所组成。 整个类神经网络包含一系列基本的神经元,通过权重(weight)相互连接。 这些单元以层的方式组织,每一层的每个神经元和前一层、后一层的神经元连接。4第4页/共39页后向传播神经网络后向传播神经网络输入层输入层隐藏层隐藏层(可多层可多层)输出层输出层(决策层决策层)5神经元第5页/共39页什么是后向传播?什么是后向传播? 后向传播是一种按误差逆传播算法训练的多层前馈网络的学习算法。这个神经网络包括输入层、隐藏层和输出层。 这种学习算法下的神经网络是一组连接的输入/输出单元,其中每个连接都与一个权相连。它的
3、学习规则是使用最速下降法,按照误差纠正规则反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,从而使得能够预测输入样本的正确类标号。 前向传播:在前向传播过程中,神经网络中的所有突触的权重都是固定不变的。6第6页/共39页 不同的信息流向导致不同类型的网络,可区分为”前馈神经网络”(feed forward neural network)和”反馈式神经网络”(feedback neural network)。7什么是前馈神经网络:什么是前馈神经网络:第7页/共39页 前馈神经网络是指信息只朝一个方向流动,也就是数据在神经元之间的流动方向是单向的,没有循环。 这种网络而在分类过程中数据只
4、能向前传送,直到到达输出层,层间没有向后的反馈信号,因此被称为前馈网络。 后向传播是在多层前馈神经网络上学习的。8第8页/共39页 反馈式神经网络是指数据在神经元之间的流动方向是双向关系,神经元会输出到其他所有的神经元,也会接收其他神经元的输出成为输入。9什么是反馈式神经网络?第9页/共39页什么是自组织网络 ( SOM ,Self-Organizing Neural Networks ) 自组织神经网络是一种无监督学习网络。它通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变网络参数与结构。10第10页/共39页11 类神经网络的分为输入层、输出层和隐藏层,三层连结形成一个神经网络
5、。 输入层只从外部环境接收信息,该层的每个神经元相当于自变量,不完成任何计算,只为下一层传递信息。 输出层生成最终结果,为网络送给外部系统的结果值。什么是层?什么是层?第11页/共39页12 隐藏层介于输入层和输出层之间,这些层完全用于分析,其函数联系输入层变量和输出层变量,使其更拟合(fit)资料。 隐藏层的功能主要是增加类神经网络的复杂性,以能够模拟复杂的非线性关系。 隐藏层的多少要适当,过多容易过度拟合。 一层加权神经元的网络称单层感知器,多层加权神经元的网络称多层感知器(multi-layer perceptrons)。第12页/共39页一一个输个输出元出元的两的两层神层神经网经网络络
6、13神经网络的形式:神经网络的形式:第13页/共39页14一个输出元的三层神经网络第14页/共39页多个输出元的三层神经网络多个输出元的三层神经网络15第15页/共39页三、神经元的结构三、神经元的结构16 一个神经元 j,有阈值,从上一层连接的神经元得到n个输入变量X,每个输入变量附加一个链接权重w。 输入变量将依照不同权重加以合并(一般是加权总和),链接成组合函数(combination function),组合函数的值称为电位(potential);然后,启动(转换、激活、赋活)函数(activation function)将电位转换成输出信号。第16页/共39页j1njijijiIw
7、o n表示变量的个数 Oi表示第i个输入值(X) Wij表示第j个神经元的第i个输入值的权重:o1o2onw1jw2jwnjOjIjf(Ij)ixix17 是第j个神经元的偏置(偏差):偏差有增大或者减小激活函数的净输入的作用,取决于该偏差是负值还是正值。 表示第j个神经元的输入值(组合函数)。f()是神经元的启动(激活或赋活)函数Oj=f(Ij)是第j个神经元的输出值(Y)。jjI第17页/共39页四、四、启动函数启动函数f()类型类型 181、线性启动函数:启动函数就是负责将神经元接受的输入脉冲总和,转换成输出脉冲,但是人类神经在处理外部刺激时,输出信号是有极限的,否则可能会因为输出信号过
8、强而造成对神经元的伤害。因此,类神经网络在选取启动函数时,不能够使用传统的线性函数,通常来说会选择兼具正向收敛与负向收敛的函数。jjfII第18页/共39页191,1 1,00,0jjjIf II 1,01,0jjjIf II ,0,0jjjIf II0, 12.阶梯(step)启动函数的一般形式:阶梯启动函数又称阈值(threshold)启动函数。当 时,得到当 时,得到对称阶梯函数。即:第19页/共39页对称阶梯函数+1-10阶梯函数120第20页/共39页3.Sigmoid(或称S型)启动函数Sigmoid启动函数输出值界于-1和1,或是0和1之间,是单调递增函数,函数型数有许多种,最常
9、用的是Logistic函数。式中是正常数(一般为零),Sigmoid启动函数是最常用启动函数,非线性函数,但是易于微分和了解。2111jjIfIe第21页/共39页+1S 函数022第22页/共39页4、分段线性启动函数、分段线性启动函数23 1,1,010,0jjjjjIf IIII分段线性函数+10第23页/共39页242jIVjfIejI5、高斯启动函数钟型曲线(bell-shaped curve),输出值在0和1之间,其中, 是均值,V是函数事先定义的方差。第24页/共39页五、类神经网络的训练五、类神经网络的训练25 类神经网络学习前,必须建立出一个训练样本(training pat
10、tern)使类神经网络在学习的过程中有一个参考,训练样本的建立来自于实际系统输入与输出或是以往的经验。 例如:洗衣机洗净衣服的时间,与衣服的质料、数量、肮脏的程度有关,因此我们必须先针对不同质料、数量、肮脏的程度的衣服统计出洗衣所需的时间,建立训练样本。不同衣服的质料、数量、肮脏程度就是类神经网络的输入,而洗衣所需的时间则为类神经网络的目标值(target),也就是类神经网络的参考输出。第25页/共39页26 神经网络学习就是不断调整权重的过程。 训练之前,必须将数据集分为训练数据集和测试数据集,将权重指定给第一层的神经元。 大多数软件包使用向后传播方法(Back propagation),任
11、何一种后向传播算法的最重要部分都是使用误差度量来调整权重。第26页/共39页 后向传播神经网络通过更新权重和偏置使得网络预测的误差达到最小。具体步骤如下: 通过输入节点将输入变量加以标准化,标准化后的变量数值落在0和1之间,或者是-1和1之间。 将网络权重初始值设定为0(或随机产生)。通过各节点的函数,估计数据的目标变量值。27六、六、权重和偏置的调整权重和偏置的调整第27页/共39页 比较实际值和估计值之间的误差,并根据误差值重新调整各权重和偏置。 重新执行第二步骤,反复执行,一直到实际值和估计值之间的误差值最小,此时才停止学习,此时获得最佳权重。28第28页/共39页29举例说明举例说明权
12、重和偏置的调整过程权重和偏置的调整过程第29页/共39页 1、首先利用随机的方式,产生各神经元间的权重,以及隐藏层与输出层神经元的偏置。30w14w15w24w25w34w35w46w560.2--0.50.2-0.3-0.2456-第30页/共39页2、根据输入信号,计算各隐藏层神经元的输出信号,假设输入的样本是(X1,X2,X3,Y)=(1,0,1,1)。 神经元4: 神经元5:314441*0.20*0.4 1*( 0.5)0.40.7iiiIw O 总输入信号:440.711=0.3321+1+IOee转换输出信号:5551*( 0.3)0*0.1
13、1*iiiIw O总输入信号:550.111=0.5251+1+IOee转换输出信号:jijijiIw O总输入信号:1=1+jjIOe转换输出信号:第31页/共39页3、根据隐藏层输出信号,计算输入层神经元的输出信号。 神经元632566640.332*( 0.3)0.525*( 0.2)0.10.105iiiIw O 总输入信号:660.10511=0.4741+1+IOee转换输出信号:第32页/共39页4、此时,输出值0.474与真值1不一致,我们可以计算神经元6的误差项。 神经元6的误差项:5、将此误差项反馈至隐藏层,此时可以计算隐藏层神经元误差值。 神经元4误差项
14、: 神经元5误差项:3366666=(1)()0.474(1 0.474)(1 0.474)0.1311ErrorOOTO4444=(1)0.332(1 0.332)*0.1311*( 0.3)0.0087iiiErrorOOErrorw5555=(1)0.525(1 0.525)*0.1311*( 0.2)0.0065kkkErrorOOError w=(1)()jjjjjkErrorOOTOError=(1)jjjkjkkErrorOOError w第33页/共39页6、最后根据神经元误差项,更新各神经元的权重以及偏置,假设学习速率为0.9。34*14*15*24*25*34*35*460
15、.20.9(0.0087)*10.2080.30.9(0.0065)*10.2940.40.9(0.0087)*00.40.1 0.9(0.0065)*0(0.0087)*10.4920.20.9(0.0065)*10.2060.30.9(0.1311)*0.3320.339wwwwwww *56*4*5*60.20.9(0.1311)*0.5250.1380.40.9(0.0087)0.3920.20.9(0.0065)0.2060.1 0.9(0.1311)0.218w *ijjiijijijjjjjjwError OwwwError学习速率:通常是介于01之间,当其数值
16、越大,每次权数的修正量就越大。不能太小或太大。经验设置为1/t,t为迭代次数。目前调整权重的方法是一种最陡坡降法。第34页/共39页 如此,即达成一个学习循环的类神经网络权重修正,接下来持续此步骤,使得输出值越来越接近真值,从而达到建立模型的目的。 另外,根据理论当学习时间无限长时,误差应该会无限接近于零。但事实上,如果当模型训练越久,就有可能出现过度拟合的问题,因此一般有两种方法来处理: 设定阀值。 使用测试样本。一般,测试组误差一开始会随着上述误差的减小而减小,但当过度拟合现象发生时,测试组的误差会开始从小到大变化。35第35页/共39页七、类神经网络的优点七、类神经网络的优点 类神经网络可以建构非线性的模型,模型的准确度高。 类神经网络有良好的推广性,对于未知的输入亦可得到正确的输出。 类神经网络可以接受不同种类的变量作为输入,适应性强。 类神经网络可应用的领域相当广泛,模型建构能力强。 类
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年煤矿开发深度合作协议模版版B版
- 安徽省淮北市五校联考2022-2023学年八年级下学期第一次月考历史试题(解析版)
- 2024年物业服务管理合同(智能化系统)
- 2024年水果订购合同:柑橘专篇
- 期中检测题(2)(解析版)
- 2024年度文化产业股权并购委托转让协议6篇
- 2024年度文艺晚会导演聘用合同正式版本3篇
- 2025超市管理咨询居间的合同范本
- 2024年标准协议模板版B版
- 2024年土地平整工程与现代农业装备合作合同3篇
- 企业消防应急演练评估报告
- 监控系统合同范本
- 企业组织架构表
- (完整版)中医传统五音疗法
- 贾平凹《泉》阅读练习及答案(二)
- 盆腔炎中医临床路径住院表单
- 施工现场安全自查自纠表
- 2023年最新的社会团体登记管理条例最新修订版
- 预应力锚索(杆)张拉锁定施工记录表
- 先心病相关性肺动脉高压治疗策略课件
- 建筑工程质量检验评定标准
评论
0/150
提交评论