




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第八讲第八讲神经网络(神经网络(1 1)2生物神经元生物神经元3人工神经元人工神经元 v1, ,vs为输入为输入“树突树突”的各信号的各信号; 它们按照连接权它们按照连接权w1j, ,wsj ,通过神经元内的组合函数,通过神经元内的组合函数j()组合成组合成uj ; uj再通过神经元内的激活函数再通过神经元内的激活函数Aj()得到输出得到输出zj,沿,沿“轴突轴突” 传送给其他神经元。传送给其他神经元。4人工神经网络人工神经网络最常用的神经网络是如图所示的多层感知器。最常用的神经网络是如图所示的多层感知器。5人工神经网络人工神经网络 各个自变量通过输入层的神经元输入到网络各个自变量通过输入层
2、的神经元输入到网络; 输入层的各个神经元和第一层隐藏层的各个神经元连接输入层的各个神经元和第一层隐藏层的各个神经元连接; 每一层隐藏层的各个神经元和下一层每一层隐藏层的各个神经元和下一层(可能是隐藏层或输出层可能是隐藏层或输出层)的各个神经元相连接的各个神经元相连接; 输入的自变量通过各个隐藏层的神经元进行转换后,在输出输入的自变量通过各个隐藏层的神经元进行转换后,在输出层形成输出值作为对因变量的预测值。层形成输出值作为对因变量的预测值。6神经网络可以对一个或多个因变量进行预测。神经网络可以对一个或多个因变量进行预测。神经网络的因变量神经网络的因变量例如,如果因变量是有例如,如果因变量是有K种
3、取值种取值(K2)的分类变量,通常的分类变量,通常在输出层使用在输出层使用K-1个神经元个神经元;再如,因变量可以是多个相关联的连续变量,甚至是不再如,因变量可以是多个相关联的连续变量,甚至是不同类型的变量。同类型的变量。7单个神经元的组合函数单个神经元的组合函数单个神经元常用的组合函数为线性组合函数:单个神经元常用的组合函数为线性组合函数:其中其中bj是神经元是神经元j的偏差项。的偏差项。也可以假设对同一层的也可以假设对同一层的J个神经元而言,对个神经元而言,对vr的连接权的连接权wrj的值都一样,而只有偏差项的值都一样,而只有偏差项bj不一样不一样(j=1, ,J)。8单个神经元的激活函数
4、单个神经元的激活函数单个神经元最常用的激活函数是单个神经元最常用的激活函数是S型函数,它们能将组合型函数,它们能将组合函数产生的可能无限的值通过连续单调的非线性转换变成有限函数产生的可能无限的值通过连续单调的非线性转换变成有限的输出值,的输出值,这也是试图模拟生物神经元的结果。这也是试图模拟生物神经元的结果。9激活函数激活函数常用的常用的S型函数列举如下型函数列举如下:Logistic函数函数:10激活函数激活函数Tanh函数函数:Elliott函数函数:Arctan函数函数:11激活函数激活函数各各S型激活函数的输出范围不一样型激活函数的输出范围不一样:Logistic函数的输出范围在函数的
5、输出范围在0到到1之间之间;其他三个函数的输出范围在其他三个函数的输出范围在-1到到1之间。之间。各各S型激活函数输入变量的有效范围也不一样。当型激活函数输入变量的有效范围也不一样。当u的值偏的值偏离离0时时:Tanh函数很快就达到边界值函数很快就达到边界值;Logistic函数相对而言更慢达到边界值函数相对而言更慢达到边界值;Elliott和和Arctan函数变化则更加缓慢。函数变化则更加缓慢。12激活函数激活函数还有一些激活函数将可能无限的输入值通过连续但不单调还有一些激活函数将可能无限的输入值通过连续但不单调的非线性转换变成有限的输出值的非线性转换变成有限的输出值: :高斯函数高斯函数:
6、补高斯函数补高斯函数:高斯函数和补高斯函数都是关于高斯函数和补高斯函数都是关于u=0对称的,高斯函数在对称的,高斯函数在u=0处达到最大值,而补高斯函数在处达到最大值,而补高斯函数在u=0处达到最小值。处达到最小值。13激活函数激活函数正弦和余弦函数关于正弦和余弦函数关于u都是周期性的。都是周期性的。正弦函数正弦函数:余弦函数余弦函数:14激活函数激活函数其它一些激活函数有其它一些激活函数有:指数函数指数函数:Softmax函数函数:对同一层的对同一层的J个神经元而言,对个神经元而言,对j=1, ,J,Softmax函数保证了同一层的函数保证了同一层的J个神经元的输出值加和为个神经元的输出值加
7、和为1。15激活函数激活函数恒等函数恒等函数:倒数函数倒数函数:平方函数平方函数:16神经网络模型(一)神经网络模型(一)多层感知器多层感知器多层感知器通常在隐藏层使用线性组合函数和多层感知器通常在隐藏层使用线性组合函数和S型激活函型激活函数数,在输出层使用线性组合函数和与,在输出层使用线性组合函数和与因变量相适应的激活函因变量相适应的激活函数数。多层感知器可以形成很复杂的非线性模型。多层感知器可以形成很复杂的非线性模型。17神经网络模型(一)神经网络模型(一)多层感知器多层感知器例如,在上图中,如果隐藏层使用线性组合函数和例如,在上图中,如果隐藏层使用线性组合函数和Logistic激活函数,
8、那么两个隐藏神经元的输出为:激活函数,那么两个隐藏神经元的输出为:18神经网络模型(一)神经网络模型(一)多层感知器多层感知器如果输出层使用线性组合函数和指数激活函数,那么整个如果输出层使用线性组合函数和指数激活函数,那么整个网络的输出为:网络的输出为:19神经网络模型(一)神经网络模型(一)多层感知器多层感知器多层感知器是一种通用的近似器多层感知器是一种通用的近似器(Universal Approximator),只要给予足够的数据、隐藏神经元和训练时间,含一个隐藏层只要给予足够的数据、隐藏神经元和训练时间,含一个隐藏层的多层感知器就能够以任意精确度近似自变量和因变量之间几的多层感知器就能够
9、以任意精确度近似自变量和因变量之间几乎任何形式的函数。乎任何形式的函数。更多的隐藏层可能减少隐藏神经元和参数的数目,提高模更多的隐藏层可能减少隐藏神经元和参数的数目,提高模型的可推广性。型的可推广性。20神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络径向基函数网络径向基函数网络(Radio Basis Network Function,简称,简称RBNF) 是另一种常用的神经网络。是另一种常用的神经网络。它通常只含有一层隐藏层,其中各隐藏神经元使用径向组它通常只含有一层隐藏层,其中各隐藏神经元使用径向组合函数合函数:其中,其中,(W1j, ,Wsj)是第是第j个隐藏神经元的中
10、心个隐藏神经元的中心; j和和j是高是高度和精度参数,也可以假设对各隐藏神经元而言,度和精度参数,也可以假设对各隐藏神经元而言, j或或j的取值的取值都一样。都一样。21神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络各隐藏单元的激活函数为指数函数或各隐藏单元的激活函数为指数函数或Softmax函数。函数。 若使用指数函数,隐藏神经元若使用指数函数,隐藏神经元j的输出值为:的输出值为:这正比于一个多元正态分布的概率密度函数这正比于一个多元正态分布的概率密度函数; 若使用若使用Softmax函数,这些输出值在隐藏层进行了正则化,使函数,这些输出值在隐藏层进行了正则化,使得各隐藏神
11、经元的输出值加和为得各隐藏神经元的输出值加和为1。径向基函数网络的输出层通常采用径向基函数网络的输出层通常采用线性组合函数线性组合函数和与因变和与因变量相适应的激活函数。量相适应的激活函数。22神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络径向基函数网络也可以形成很复杂的非线性模型,它近径向基函数网络也可以形成很复杂的非线性模型,它近似函数的功能和多层感知器类似。似函数的功能和多层感知器类似。例如,在上图中,如果隐藏层使用径向组合函数和例如,在上图中,如果隐藏层使用径向组合函数和Softmax激活函数,那么两个隐藏神经元的输出为:激活函数,那么两个隐藏神经元的输出为:23神经
12、网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络如果输出层使用线性激活函数和指数激活函数,那么整如果输出层使用线性激活函数和指数激活函数,那么整个网络的输出为:个网络的输出为:24神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络隐藏层使用指数激活函数的径向基函数网络被称为普通径隐藏层使用指数激活函数的径向基函数网络被称为普通径向基数网络向基数网络(Ordinary RBNF,简称,简称ORBNF),其中各隐藏神经,其中各隐藏神经元应不使用高度参数元应不使用高度参数j ,否则它们与隐藏神经元到输出单元的,否则它们与隐藏神经元到输出单元的连接权形成冗余参数。连接权形成冗
13、余参数。25神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络举例而言,如果前图中的隐藏单元的激活函数为带高度举例而言,如果前图中的隐藏单元的激活函数为带高度参数的指数函数,那么两个隐藏神经元的输出为:参数的指数函数,那么两个隐藏神经元的输出为:26整个网络的输出为:整个网络的输出为:神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络很明显,我们只能估计很明显,我们只能估计11(或或22)而根本无法单独估计而根本无法单独估计1和和1(或或2和和2),于是它们形成冗余。,于是它们形成冗余。27隐藏层使用隐藏层使用Softmax函数的径向基函数网络称为正则化径向函数的径
14、向基函数网络称为正则化径向基函数网络基函数网络(Normalized RBNF,简称,简称NRBNF),这时可使用高,这时可使用高度参数度参数j。神经网络模型(二)神经网络模型(二)径向基函数网络径向基函数网络28神经网络模型的优点神经网络模型的优点优点优点1:神经网络模型的结构具有很大的灵活性。神经网络模型的结构具有很大的灵活性。每一层的各个神经单元并非一定要全部连接到下一层的各每一层的各个神经单元并非一定要全部连接到下一层的各个神经单元,可以去掉一些连接个神经单元,可以去掉一些连接;输入神经元也并非一定要连接到隐藏神经元再连接到输出输入神经元也并非一定要连接到隐藏神经元再连接到输出神经元,
15、而可以跳过隐藏层直接连接到输出神经元。神经元,而可以跳过隐藏层直接连接到输出神经元。优点优点2:神经网络模型能够很好地近似自变量与因变量之间神经网络模型能够很好地近似自变量与因变量之间的任意函数关系。的任意函数关系。29神经网络模型的缺点神经网络模型的缺点因为自变量与因变量之间的关系是复杂而非线性的,神经因为自变量与因变量之间的关系是复杂而非线性的,神经网络模型的一大缺点是很难进行解释。网络模型的一大缺点是很难进行解释。30神经网络模型与广义线性模型神经网络模型与广义线性模型一些典型的神经网络模型可以看作是广义线性模型的推广。一些典型的神经网络模型可以看作是广义线性模型的推广。令令表示因变量表
16、示因变量Y分布的位置参数。分布的位置参数。广义线性模型:系统成分使用连接函数广义线性模型:系统成分使用连接函数=g()。再令。再令=+xT。神经网络模型神经网络模型:如果在输出层使用线性组合函数,可令如果在输出层使用线性组合函数,可令为组合之后的值为组合之后的值:其中其中h为隐藏层各神经元的输出值组成的向量。为隐藏层各神经元的输出值组成的向量。31神经网络模型与广义线性模型神经网络模型与广义线性模型神经网络模型相当于与广义线性模型使用了同样的连接函神经网络模型相当于与广义线性模型使用了同样的连接函数,但却用数,但却用x的函数的线性组合替代了广义线性模型中的函数的线性组合替代了广义线性模型中x的
17、线性的线性组合组合(注意到向量注意到向量h所含的每一个隐藏神经元的输出值都是输入所含的每一个隐藏神经元的输出值都是输入x的函数的函数)。设输出层的激活函数为设输出层的激活函数为A,并令神经网络的输出值为,并令神经网络的输出值为=A()。如果让。如果让A等于等于g的逆函数,那么:的逆函数,那么:=A-1()=g()=。3232误差函数误差函数设数据集为设数据集为(xi, yi), i=1, ,N,i为与观测为与观测i对应的对应的值。值。根据根据i与与yi的差异可定义误差函数,误差函数越小,模型拟的差异可定义误差函数,误差函数越小,模型拟合效果越好。合效果越好。一种常用的误差函数是对数似然函数的负
18、值一种常用的误差函数是对数似然函数的负值;当当Y的分布属的分布属于指数族分布时,还可使用偏差来定义误差函数。于指数族分布时,还可使用偏差来定义误差函数。下面根据因变量的不同取值类型讨论神经网络模型输出层下面根据因变量的不同取值类型讨论神经网络模型输出层的误差函数,具体可参照广义线性模型一节内容。的误差函数,具体可参照广义线性模型一节内容。3333情形一情形一:因变量为二值变量因变量为二值变量与逻辑回归相对应与逻辑回归相对应:不失一般性,设因变量不失一般性,设因变量Y的取值为的取值为0或或1。神经网络的输出神经网络的输出代表代表Y取值为取值为1的概率。的概率。Y满足参数为满足参数为的的伯努力分布
19、,没有刻度参数。伯努力分布,没有刻度参数。输出层的激活函数采用输出层的激活函数采用Logistic函数,也就是逻辑连接函数函数,也就是逻辑连接函数逆函数逆函数:343434情形二情形二:因变量为名义变量因变量为名义变量与多项逻辑回归相对应与多项逻辑回归相对应: 令令(l)表示表示Y取值为取值为l的概率的概率l=(1, ,K),它们满足,它们满足(l) + (K) =1。对。对l=1, ,K ,令:,令: 因变量因变量Y的取值为的取值为1, ,K,各取值之间是无序的。,各取值之间是无序的。那么那么(Y(l) , ,Y(K)满足参数为满足参数为(1, (l), ,(K)的多项分布,的多项分布,没有
20、刻度参数。没有刻度参数。神经网络的输出层含神经网络的输出层含K-1个输出单元,激活函数采用恒等个输出单元,激活函数采用恒等函数。网络输出值函数。网络输出值l (l=1, ,K-1)表示:表示:35353535情形三情形三:因变量为定序变量因变量为定序变量与定序逻辑回归相对应与定序逻辑回归相对应:因变量因变量Y的取值为的取值为1, ,K,但各取值之间是有序的。,但各取值之间是有序的。神经网络的输出层含神经网络的输出层含K-1个输出单元,输出值个输出单元,输出值(l)表示表示Y取值取值小于或等于小于或等于l的概率的概率(l=1, ,K-1),它们满足,它们满足0(1)(2) (K-1)(K)=1。
21、对。对l=1, ,K,令:,令:那么那么(Y(1) , ,Y(K)满足参数为满足参数为 (1, (1),(2)-(1), , 1-(K-1)的的多项分布,没有刻度参数。多项分布,没有刻度参数。36情形三情形三:因变量为定序变量因变量为定序变量输出层的组合函数为斜率相等的线性组合函数输出层的组合函数为斜率相等的线性组合函数:输出层的激活函数采用输出层的激活函数采用Logistic函数,也就是逻辑连接函数函数,也就是逻辑连接函数的逆函数的逆函数:37情形四情形四:因变量为计数变量因变量为计数变量与泊松回归相对应与泊松回归相对应:因变量因变量Y的取值为的取值为1,2, ,代表某事件发生的次数。代表某
22、事件发生的次数。神经网络的输出神经网络的输出代表代表Y的均值。设的均值。设Y满足泊松分布,没有满足泊松分布,没有刻度参数。刻度参数。输出层的激活函数采用指数函数,也就是对数连接函数的输出层的激活函数采用指数函数,也就是对数连接函数的逆函数逆函数:38情形五情形五:因变量为非负连续变量因变量为非负连续变量因变量因变量Y的取值连续非负的取值连续非负(例如,收入、销售额例如,收入、销售额)。类似于广。类似于广义线性模型的各种情况,义线性模型的各种情况,Y的分布可能是泊松、伽马或正态分布。的分布可能是泊松、伽马或正态分布。神经网络的输出神经网络的输出代表代表Y的均值。的均值。输出层的激活函数采用指数函数,也就是对数连接函数的输出层的激活函数采用指数函数,也就是对数连接函数的逆函数逆函数:39情
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 整合知识体系2024年足球裁判员等级考试试题及答案
- 模具设计中的环保意识试题及答案
- 农作物种子繁育应关注的技术动向试题及答案
- 模具设计师备考资料分享试题及答案
- 模具设计师资格认证考试必考试题及答案
- 2024年农业植保员考试中的问题讲解与讨论试题及答案
- 用电安全教学课件下载
- 2024年模具设计师资格考试问答试题及答案
- 生产过程中的员工激励措施计划
- 幼儿园教研小组的有效运作计划
- 企业经营管理课件
- 区域病理信息管理系统需求说明
- 学做小小按摩师(课件)全国通用三年级上册综合实践活动
- 通信工程杆路工程施工规范
- 建筑电气隐蔽工程验收记录案例
- (完整版)高清米字格(A4打印版)
- 八年级国家义务教育质量监测德育考核试题
- 苦地丁中生物碱成分研究
- 八年级物理下册《实验题》专项练习题及答案(人教版)
- 急诊科品管圈主题拟定课件
- 第八讲 发展全过程人民民主PPT习概论2023优化版教学课件
评论
0/150
提交评论