




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、人工智能及识别技术 本栏目责任编辑 :李桂瑾1引言早在上世纪 60年代末 , 人脸识别即引起了研究者的强烈兴 趣 . 但早期的人脸识别一般都需要人的某些先验知识 , 无法摆脱人 的干预 。 进入上世纪 9O 年代 , 由于高速度 、 高性能计算机的出现 , 人脸识别的方法有了重大突破 , 进入了真正的机器自动识别阶 段 , 人脸识别研究得到了前所未有的重视 。 人脸识别方法有很多 种 :(1 特征脸方法 。 这种方法起源于图像描述技术 。 采用特征脸识 别方法有良好的稳定性 、 位移不变性 、 特征向量与图像的高度成 比例变化以及转置不变性 。 不足之处是受表情变化 、 光照角度强 度变化和视
2、角变化等严重影响 , 鲁棒性较差 。 (2 隐马尔可夫模型 方法 (Hidden Markov Mode1 是用于描述信号统计特征的一组统计 模型 。 HMM 的基本理论是由 Baum 和 Welch 等人在 20世纪 6O 年代末 70年代初建立 , 在语音识别中应用较多 。 在 HMM 中 , 节点 表示状态 , 有向边表示状态之间的转移 。 一个状态可以具有特征 空间中的任一特征 , 对同一特征 , 不同状态表现出这一特征的概 率不同 。 (3 弹性图匹配方法 。 弹性图匹配方法是一种基于动态连 接结构的方法 。 它将人脸用格状的稀疏图表示 。 (4 神经网络方法 。 人工神经网络是由多
3、个神经元按照一定的排列顺序构成的 , 是一 个非线性动力学系统 , 其特色在于信息的分布式存储和并行协同 处理 。 虽然单个神经元的结构极其简单 , 功能有限 , 但由大量冲经 元所构成的网络系统却能够实现复杂丰富的功能 。 神经网络系统 除了具有集体运算的能力和自适应的学习能力外 , 还有根强的容 错性和鲁棒性 . 善于联想 、 综合和推广 。神经网络模型各种各样 。 它们是从不同的角度对生物神经系 统不同层次的描述和模拟 。 有代表性的网络模型有感知器 、 多层 映射 BP 网络 、 RBF 网络等 。 目前 , 在人工神经网络的实际应用中 , 绝大部分的神经网络模型都是采用 BP 网络及
4、其变化形式 , 它也 是前向网络的核心部分 , 是人工神经网络最精华的部分 。 BP 网络 主要用于函数逼近 、 模式识别 、 数据压缩等领域 。2BP 神经网络的人脸识别BP 神经网络用于人脸识别一般应先对输入图像实行图像预 处理 , 然后进行特征提取 , 接下来就是 BP 网络训练 , 最后用训练好 的网络进行识别 , 获得识别结果 。 图像预处理的目的是便于特征提 取 , 而特征提取是去相关过程 , 将图像中大量的冗余信息去除 , 即实 现数据压缩 , 同时也降低了神经网络结构的复杂度 , 提高了神经网 络的训练效率和收敛率 。 本文以 ORL 人脸图像数据库为研究对 象 , 将输入图像
5、进行图像压缩 、 图像抽样 、 输入矢量标准化等图像 预处理后 , 送入 BP 神经网络训练 , 经过竞争选择 , 获得识别结 果 。 下面分别叙述其处理过程 。2.1人脸图像预处理(1 图像压缩输入图像一般精度比较高 , 存在大量的冗余信息 。 为避免神经 网络结构过于复杂 , 在输入神经网络之前必须进行图像压缩 。 图像 压缩通常采用插值算法 , 包括近邻插值 、 双线性插值和双立方插 值 。 插值算法的好坏关系到图像的失真程度 , 插值函数的设计是插 值算法的核心问题 。(2 图像抽样所谓图像抽样即为将压缩后的二维图像矩阵 一 行 接 一 行 拉 成一维列矢量 , 其目的是便于后续神经网
6、络的输入 。(3 输入矢量标准化图像抽样的输出是一维列矢量 , 其元素的值域范围为 0,255。 如果直接将该列矢量输入神经网络进行训练 , 由于数值较大 , 势 必影响计算效率和收敛率 。 因此 , 在将该列矢量输入神经网络之 前 , 应实行输入矢量标准化 。2.2BP 神经网络及训练策略2.2.1BP 神经网络介绍BP 网络是一种前向网络 。 一般包括输入层 、 中间层和输出 层 。 中间层可以有一层 、 二层甚至更多层以便于分析各因素间的 相互作用 , 每一层由若干个神经元组成 , 相邻两层的每一个神经 元之间均有权值联系 , 权值的大小反映了这两个神经元之间的连 接强度 , 整个网络的
7、计算过程是由输入层到中间层再到输出层单 向进行 , 所以称为前向网络 。2.2.2学习算法(1 每层神经元的输出算法 (sigmoid 函数 M i =1/(1+e -Z i Z i =ni =1! W ij T j 为 从 输 入 层 (或 中 间 层 到 中 间 层 (或输出层 的结点净输入 , n 表示中间层 (或输出层 的个数 , T j 表示输入层 (或中间层 第 j 个量 , Wij是权值 。(2 权值 W ij 修正理论上 Wij的初始值可以是随机数 (或根据经验自己确定 , 但如果权值不符合要求就要进行修正 。从输出层反向传递到中间层 , 公式为W ij (t+1=W ij (
8、t+j M i +W ij (t-W ij (t-1W ij (t 是 t 时刻从神经元 i 到上一层 (输入层或中间层 神经元 j (中间层或输出层 的连接权 。 M i 是神经元 j 在 t 时刻的实际输出 。 是步长调整因子 , (0, 1 , 是平滑因子 (0, 1 , j是误 差权重调因子 。(下转第 188页 神经网络在人脸识别中的应用刘广亮 , 马晓普 , 张哲(南阳师范学院计算机与信息技术学院 , 河南 南阳 473061摘要 :将 BP 神经网络用于人脸识别 , 并建立了人脸识别模型 , 该识别模型包括图像压缩 、 图像抽样 、 输入矢量标准化 、 BP 神经网络与 竞争选择
9、处理过程 , 具有简单 , 识别率较高的特点 。关键词 :图像压缩 ; 图像抽样 ; 神经网络 ; 人脸识别中图分类号 :TP183文献标识码 :A 文章编号 :1009-3044(200713-30181-01Face Recognition Based on Neural NetworkLIU Guang-liang, MA Xiao-pu , ZHANG Zhe(The school of Computer and Information Technology of Nanyang Normal University,Nanyang 473061,ChinaAbstract:The BP
10、 neural network is applied in face recognition.A face recognition model is established , and its designed includes image compression , image sampling , input vector standardization , BP neural network and competition selection. The recognition model is simple and has a high recognition rate.Key word
11、s:Image compression;Image extraction;Neural network;Face recognition收稿日期 :2007-05-21作者简介 :刘广亮 (1978- , 男 , 安徽阜南人 , 研究方向为人工智能 。181人工智能及识别技术本栏目责任编辑 :李桂瑾 电脑知识与技术(上接第 181页 (3 误差分析选取网络相对误差函数 E E k =(M k0-M k /M k0M k0为实际输出值 , M k 为预测的网络输出值 。一般情况下如果误差 E k 不大于网络的误差允许值 , 就可以认 为模型的计算不存在误差 , 如果 E k 大于网络误差允许值
12、, 要回溯 到第二步调整权值后再进行计算 。八十年代 Robert Hecht -Nielson 已证明 , 一个三层 BP 神经 网络可以实现任意精度 、 近似任何连续函数 。 BP 网络能够实现一 种特殊的非线性映射 , 将输入空间变换到由输出所张成的空间 , 使 在这个空间分类问题变得简单易行 。 目前 , BP 网络已广泛应用于 函数逼近 、 模式识别 、 分类 、 数据压缩等方面 。 BP 网络用于人脸识 别时 , 网络的每一个输入节点对应样本的一个特征 , 而输出节点数 等于类别数 , 一个输出节点对应一个类 。 在训练阶段 , 如果输入训 练样本的类别标号是 i, 则训练时的期望
13、输出假设第 i 个节点为 1, 而其余输出节点均为 0。 在识别阶段 , 当一个未知类别样本作用到 输入端时 , 考察各输出节点的输出 , 并将这个样本类别判定为具有 最大值的输出节点对应的类别 。 如果具有最大值的输出节点与其 它输出节点之间的距离较小 (小于某个阈值 , 则作出拒绝判断 。在 BP 网络样本训练过程中 , 如果采取适当的训练策略能有 效地提高系统的识别率 。 可以有样本采样训练 、 样本批量训练和 样本完整训练三种策略 。 所谓样本采样训练指的是对训练集中的 样本按间隔进行采样 , 并对所得样本独立地进行训练 , 直至所有 样本训练完为止 。 至于采样间隔的选择应根据训练集
14、中的样本数 来确定 。 所谓样本批量训练指的是取训练集中的一批样本一同进 行训练 , 训练完之后再取下一批 , 直到训练完为止 。 批量大小也应 根据训练集中的样本数来确定 。 所谓样本完整训练指的是将训练 集中的样本一次性进行训练 。 采取不同的训练策略对 BP 网络权 值和阈值的调节会产生完全不同的结果 , 继而影响系统的识别率 。2.3竞争选择BP 网络的输出是一维列矢量 , 所谓竞争选择 , 是将 BP 网 络 的输出映射成一个具体的类别 。 其实现过程是 , 选择 BP 网络具有 最大值的输出节点所在的位置标号 , 则该位置标号对应一个具体 的输出类别 。 如果 BP 网络输出节点同
15、时存在多个最大值 , 则作出 拒绝判断 。3识别策略本文研究的原始图像取自 ORL 人脸数据库 。 该数据库由 40人 、 每人 10幅 、 大小为 112×92、灰度级为 256的人脸图像所组成 。 训练集由每人前 8幅共 320幅人脸图像所组成 , 测试集由每人后 2幅共 80幅人脸图像所组成 , 且训练集和测试集中的人脸图像互不 重叠 。 训练集的样本排列结构为第 1类别样本的 8幅图像 ; 第 2类 别样本的 8幅图像 ; .; 第 40类别样本的 8幅图像 。 输入图像经压缩处理后 , 将 112×92维图像转变为 8×7维 。 BP 网络输入层节点 数
16、为 56, 隐含层节点数为 70, 输出层节点数为 40。 实验时 , 样本采 样训练 、 样本批量训练和样本完整训练三种策略配合使用 。方案 I 实行样本完整训练 。方案 II 先实行样本批量训练 , 再实行样本完整训练 。 批量训 练时将训练集中相同类别的样本一道训练 , 即以同一类别的 8幅 图像为一组进行训练 。方案 III 先实行样本采样训练 , 再实行样本完整训练 。 采样间隔取为 4。即先对第 1类别样本的第 1幅图像进行训练 , 接着对第 1类别样本的第 5幅图像进行训练 , 然后对第 2类别样本的第 1幅图像进行训练 , 依次类推 , 直到第 40类别样本的第 1幅图像训 练
17、完为止 。 最后进行样本完整训练 。方案 I 每次所得样本均为不同类别 , 采样间隔较大 。方案 II 的 批量大小固定在相同类别的样本数上 。下面表 1是实验中各种方案训练集和 测 试 集 的 错 误 率 及 其 拒判率的结果 。表 1识别结果对比从上面的表中可以看到训练集和测试集的拒判率都是 0, 训 练集的错误率也是 0, 其中方案 III 的识别率是 94.9%, 识 别 率 最 高 , 这说明 BP 网络不断对新类别样本进行学 习 , 网 络 性 能 较 好 。 方案 II 的识别率处于方案 I 和方案 III 之间 , 而方案 I 的识别率最 底 , 说明训练样本逐步加入 , 比一
18、次性加入网络调节性能要好 。 常 规训练方法一般采用方案 I , 如果将方案 I 使用的样本完整训练 策略与其它训练策略相配合 , 如方案 III, 则识别率将大大提高 。4结束语本文将 BP 神经网络用于人脸识别 , 建立了简单识别模型 , 模 型用的数据库是 ORL 人脸数据库 , 并采用了适当的训练策略 , 从 而达到了识别人脸的目的 。参考文献 :1苏剑波 , 徐波 . 应用模式识别技术导论 人脸识别与语音 识别 M. 上海 :上海交通大学出版社 , 2001.2金忠 . 人脸图像特征抽取与维数研究 博士学位论文 D. 南 京 :南京理工大学 ,1999.3宋刚 , 艾海舟 , 徐光 . 纹理约束下的人脸特征点跟踪 J. 软件 学报 , 2004(15,11.4边 肇 祺 , 张 学 工 . 模 式 识 别 M. 北 京 :清 华 大 学 出 版 社 ,2000.sl(; qhy(;k=k2;m=m2;i1=i2;j1=j
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省宿迁市沭阳县2022-2023学年高一下学期期中生物试题(含答案)
- 汽车美容师竞争优势建立试题及答案
- 浙江省杭州市萧山区萧山城区八校期中考试联考2023-2024学年八年级下学期4月期中英语试题(含答案)
- 2024年二手车评估师考试经济学基础知识试题及答案
- 康复护理在临床中的应用
- 手术室护无菌技术操作
- 骑车驾驶考试题及答案
- 提升药理学考试成绩的方法试题及答案
- 食品质检员考前模拟题及答案
- 健康家庭测试题及答案解析
- 2025年二级建造师矿业工程真题卷(附解析)
- 2025年太原城市职业技术学院单招职业技能测试题库必考题
- 2025年上半年第二次商务部国际贸易经济合作研究院招聘7人重点基础提升(共500题)附带答案详解
- 【初中语文】第16课《有为有不为》教学课件2024-2025学年统编版语文七年级下册
- (一模)青岛市2025年高三年级第一次适应性检测地理试卷(含标准答案)
- 2025年铁岭卫生职业学院单招职业技能测试题库学生专用
- 2025年公务员遴选考试公共基础知识必考题库170题及答案(九)
- 广告投放预算分配情况统计表(按预算项目)
- 2025年高考预测猜题 化学 信息必刷卷01(新高考 通 用)(解析版)
- 压疮的六个分期及护理措施
- 沪教版(五四学制)(2024)六年级数学下册 第六章 圆和扇形 单元测试题(含解析)
评论
0/150
提交评论