版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、西北工业大学明德学院本科毕业设计论文摘要基于惯性传感器的运动识别系统是模式识别的一个新兴领域,克服了传统基于视频的动作识别的诸多缺点和限制,具有更高的可操作性和实用性。所以本文首先着重介绍了如何利用惯性传感器进行动作的分类,及其原理。在对运动进行识别的算法中,比较常用的算法有神经网络、支持向量机、隐马尔科夫模型等,这些算法不是很直观,而且相对来说比较复杂,因此本文采用的是k-means均值聚类算法,本文的工作流程如下:首先通过握在被测实验对象手中的惯性传感器采集动作信息,然后通过无线传输模块将数据传输到 PC 机,进而对数据进行动作自动截取和动作特征提取,最后利用选定的识别算法对动作进行识别。
2、在本文中,用于实现动作识别的几种动作为向上、向下、向左、向右和画圈,随后对该动作进行动作捕捉,并采用快速傅里叶变换(Fast Fourier Transform, FFT)进行特征提取,最后采用K-means均值聚类进行识别,识别率为69%。本文的重点在于数据的特征提取,及惯性传感器的运动识别,分别用到了快速傅里叶变换,及K-mean均值聚类两种算法。关键词:惯性传感器,K-means均值聚类, FFTABSTRACTInertial sensor based motion recognition system is an emerging field. It overcomes the di
3、sadvantage of traditional video based gesture recognition, and has higher maneuverability and practicability. So this article introduces how to classify motions with inertial sensor, and its working principle.The most common algorithm for motion recognition is Neural Networks (NN), support vector ma
4、chine (SVM), hidden Markov models (HMM), etc. These algorithms are not so intuitive and relatively complex in algorithm. So this paper adopts k-means clustering for inertial sensor based motion recognition. The workflow is as flows: first of all, the inertial sensor fixed in subjects hand is used to
5、 collect motion information; and then, the data is transmitted to PC by wireless transmission module, followed by data preprocessing, feature extraction and selection. Finally, the motion is recognized by k-means clustering,This paper exploits the inertial sensors for the recognition of the followin
6、g motions: up, down, left, right and the circle. The algorithm used for feature selection is Fast Fourier Transform (FFT), and the algorithm for recognition is K-means clustering.So this article is focused on feature extraction, and motion recognition. The corresponding algorithms are fast Fourier t
7、ransform, and K-means clustering algorithm.KEY WORDS:Inertial sensors, K-means clustering, FFT目录第一章前言41.1研究的背景和意义41.2基于惯性传感器的运动识别国内外现状51.3传感器的分类61.4本文的组织结构10第二章数据采集和特征提取算法122.1 惯性传感器的结构122.2 数据采集122.3 数据的特征提取132.4 离散傅里叶变换(DFT)162.4.1 快速傅里叶变换(FFT)172.4.2快速傅里叶变换FFT 的应用182.4.3 算法基本原理19第三章基于惯性传感器的运动识别21
8、3.1 运动识别主要算法213.2K-means算法介绍223.3Kmeans 文本聚类算法优化233.4 初始聚类中心的选择243.5K一均值聚类算法的算法流程243.6 SOM算法介绍253.7 实验内容273.8 实验结果30第四章结论34参考文献34第一章 前言1.1研究的背景和意义 由于加速度现象在生活中无处不在,例如,刷牙、洗脸、走路、跑步等人体的日常活动都会产生加速度。因此,在众多的传感器中,利用加速度传感器测量的加速度信号来识别人的运动状态(或活动)受到世界各地研究人员的广泛重视。 所谓“加速度信号”是指人们在日常生活中由于身体运动产生的人体动作信号。通过对这种运动信号进行有效
9、的处理,就可以判断产生该信号的是哪一种动作,从而判断做出这种动作的人的意图。基于加速度传感器的人体运动模式识别除了应用于智能人机交互外,还可应用于智能监控、健康监控、基于手持设备的上下文感知及人体运动能量消耗评估等领域,有着非常广阔的应用前景。 伴随着微型机电系统(MEMS)技术的不断发展与成熟,价格低廉、体积小、灵敏度高的 MEMS 加速度传感器开始广泛地应用于手机、笔记本、游戏机等嵌入式电子消费产品。2007 年苹果公司的 iPhone 手机、任天堂的 Wii 游戏机火爆销售一度轰动业界,这其中,加速度传感器功不可没,它所带来的全新使用体验以及独特的人机交互方式不仅造就了产品本身的巨大成功
10、,更是给日趋同质化的电子整机市场注入了新鲜血液。同时,这种加速度传感器可以精确的获取手持嵌入式设备用户的运动加速度信号,为基于加速度传感器的人体运动模式识别提供了数据方便获取的保障。 随着人们对惯性传感器研究的不断深入,基于惯性传感器的人体动作分析已然成为新的研究领域,受到国内外研究者的广泛关注,并进行了卓有成效的研究。基于惯性传感器的人体运动分析与识别在以下方面有着重要意义: (1)游戏动画与电影制作 通过采集人体的各种动作的相关数据,再通过相关软件技术将这些数据加载到电脑动画中,从而实现动画制作和相关游戏开发。同时,基于惯性传感器的动作分析与识别在电影制作中也有广泛的应用,尤其很多电影中的
11、一些高难度动作,根据人体动作数据通过电脑技术制作出这些动作,效果也很好。 (2)体育竞技 人体动作分析与识别在体育相关领域应用也相当广泛,特别是在我们这样的体育强国中。通过对各种运动中动作的研究,把采集到的相关动作数据加以科学的分析和利用,不仅能够对运动员的训练水平和技术动作产生促进作用,有效减小运动伤害,而且对运动员损伤的治疗也有一定的帮助。如在国家举重队,利用高速摄像机采集举重运动员的动作信息,通过SIMI等动作分析软件或惯性传感器动作捕捉配套软件研究他们的动作,从而对运动员动作做出科学有效的改进。 (3)临床应用 临床应用主要体现在医疗保健和康复训练两个方面2。随着生活质量的提高,人们越
12、来越关注医疗保健。通过长时间采集记录人的运动数据,分析人体运动规律和能量消耗等指标,从而为人们提供健康方案。同时,人体运动分析在康复训练方面也有广泛应用。通常,手术后的肢体康复训练对医疗效果影响很大,医生通过分析人体运动,对正在进行康复训练的病人的动作情况、训练时间和强度等进行分析,随时了解他们的恢复情况,及时对康复方案进行改进。另外,通过佩戴在老年人身上的惯性传感器可以识别他们的动作,对跌倒等突发性事件作出反应,及时发出信号求助。 1.2基于惯性传感器的运动识别国内外现状 惯性传感器采集到的信号除了人们想要的动作信息外,还包含有噪声。所以首先要对采集的信息进行预处理,之后才能进行下一步工作。
13、在基于惯性传感器的动作识别中,预处理一般有重采样、加窗、滤波、归一化等。Khan A.M 等人12在其研究中,就利用3阶滑动平均滤波器来对加速度信号进行噪声滤除。而文献13中对原始信号的处理采用了重采样技术,达到了规整数据的目的。 近年来,在基于传感器数据的动作识别中,特征提取方法主要有三种方法:时域分析法、频域分析法和时频分析法。常用的时域特征有:均值、方差或标准差、均方根、及时域积分等频域特征主要有:FFT系数、能量、能谱密度、频域熵等。此外还有时频分析法,例如,Wang等人在其研究中就使用了小波分解来提取他们需要的特征。随着人体动作识别研究的不断深入,也出现了一些新的特征,例如,研究者就
14、提取了四分位间距作为其识别的特征,使用HMM分类时,提出了一种谱系数特征。 分类就是通过分类算法将某一未知类别样本匹配到某一已知类别中,从而确定该未知样本的类别。常见的分类算法有:最近邻法、贝叶斯(Bayes)分类法、BP 神经网络分类法、决策树算法、支持向量机(SVM)算法、隐马尔科夫(HMM)算法等。 在基于惯性传感器的动作识别领域,这些传统分类方法仍然得到了很多研究者的青睐,并在实际应用中证明了其可靠的识别率。2006 年,Daniel Olgu 等人就在基于传感器的动作识别中引入了 HMM 算法,他们分别在 3 名受试者的右手、左臀、胸3个部位固定了3个加速度计,对坐、跑、蹲、走、站立
15、、爬行、躺下动作进行了识别,识别率达到92.13%。2007 年,Piero Zappi27等人通过穿戴在双臂上的19个三轴加速度计,利用贝叶斯分类器对修车工人的基本修车动作进行了识别,识别率高达98%。2008 年,Jhun-Ying Yang28等人选取了7个测试者,研究了日常生活中的站、坐、走、跑、吸尘、洗衣服、刷牙7种动作,分别采用人工神经网络分类器和最近邻算法进行了识别,达到了95.24%和87.17%的识别率。同年,Zhenyu He29等人准备了一部内置了三轴加速度计的手机,测试了67个受试者手持手机时的17种动作,使用了支持向量机分类器,识别率达到了87.36%。2010年,Y
16、u-Jin Hong30等人将3个三轴加速度计分别固定在15名受试者的大腿、腰部、前臂三个部位,采用决策树分类器对站、坐、走、跑、挥手等 18 种日常动作进行了识别,识别率达到 92.58%。Ling Bao31和 Dean M. Karantonis32等人也分别用决策树分类器对人体跌倒进行了识别,识别率也到达了 80%以上。 1.3传感器的分类 传感器是将物理、化学、生物等自然科学和机械、土木、化工等工程技术中的非电信号转换成电信号的换能器。相应的英文单词为Sensor或Transducer。注意,若在英文文献中Sensor和Transducer,甚至还有Actuator同时出现时,则Tr
17、ansducer应译为“换能器”,是指将自然科学和工程技术中的非电能量转换成电能的设备。而Actuator应译成“执行器”,定义为将电信号转换成物理、化学、生物等自然科学和机械、土木工程技术中的非电信号的换能器或转换为实际动作(如平动、转动、通断、发光、发声、发热等)的设备。传感器可从不同角度分类。从被测量不同,分为几何机械量(例如尺寸、角度、表面参数、位移、速度、加速度、角位移、角速度等),热工量(例如温度压力、流量、密度、黏度、质量等),光学量(强度、功率、波长、频率、相位、速度、脉宽、延迟、折射率、束散角等),声学量,生物参数,医学量(生理参数)等。从传感器的输出不同,可分为模拟信号(连
18、续波和脉冲波),数字信号,电压和电流等传感器。大致分为1)光纤传感器;(2)集成传感器;(3)MEMS传感器;(4)模糊传感器;(5)智能传感器;(6)多功能传感器;(7)模型传感器;(8)网络传感器;(9)生物传感器;,本文用到的是MEMS惯性传感器。传感技术的发展从产品结构来说经历了由利用物理学中场的定律和运动定律等构成的结构型传感器,到利用物质法则构成的物性型传感器,再到如今采用微电子和微机械加工技术制造出来的新型MEMS传感器的几十年发展过程.MEMS传感器的门类品种繁多,分类方法也很多。按其工作原理,可分为物理型、化学型和生物型三类。按照被测的量又可分为加速度、角速度、压力、位移、流
19、量、电量、磁场、红外、温度、气体成分、湿度、pH值、离子浓度、生物浓度及触觉等类型的传感器。综合两种分类方法的分类体系如图1。其中每种MEMS传感器MEMS传感器具有体积小、质量轻、响应快、灵敏度高、易批产、成本低、可测量各种物理量、化学量和生物量等优势,在航天、航空、航海、兵器、机械、化工等领域又有多种细分方法。如微加速度计,按检测质量的运动方式划分,有角振动式和线振动式加速度计;按检测质量支承方式划分,有扭摆式、悬臂梁式和弹簧支承方式;按信号检测方式划分,有电容式、电阻式和隧道电流式;按控制方式划分,有开环和闭环式。MEMS传感器不仅种类繁多,而且用途广泛。作为获取信息的关键器件, MEM
20、S传感器对各种传感装备的微型化发展起着巨大的推动作用,已在太空卫星、运载火箭,航空航天设备、飞机、各种车辆、生物医学及消费电子产品等领域中得到了广泛的应用。制造技术的日益精进使MEMS传感器的参数指标和性能不断提高,与多种学科的交叉融合又使传感器不断推陈出新,应用领域不断拓宽。MEMS传感器的发展以20世纪60年代霍尼韦尔研究中心和贝尔实验室研制出首个硅隔膜压力传感器和应变计为开端。压力传感器是影响最为深远且应用最广泛的MEMS传感器,其性能由测量范围、测量精度、非线性和工作温度决定。从信号检测方式划分, MEMS压力传感器可分为压阻式、电容式和谐振式等;从敏感膜结构划分,可分为圆形、方形、矩
21、形和E形等。进入21世纪以来,在市场引导、科技推动、风险投资和政府介入等多重作用下, MEMS传感器技术发展迅速,新原理、新材料和新技术的研究不断深入, MEMS传感器的新产品不断涌现。目前, MEMS传感器正向高精度、高可靠性、多功能集成化、智能化、微型化和微功耗方向发展。借助新型材料,如SiC、蓝宝石、金刚石及SOI开发出的各种新型高可靠MEMS传感器,如温度传感器、气体传感器和压力传感器具有耐高温、耐腐蚀和防辐照等性能,进一步提高了MEMS传感器的精度和可靠性。纳米管、纳米线、纳米光纤、光导、超导和智能材料也将成为制作纳米传感器的材料。MEMS传感器向纳米级发展将产生多种传感器,如气体、
22、生物和化学传感器,使MEMS传感器的种类更加多样化。新的加工技术,如先进的MEMS制作和组装技术使MEMS传感器体积更小、功耗更低且性能更高,如具有耐振动和抗冲击的能力。利用专门的集成设计和工艺,如与CMOS兼容的MEMS加工技术和芯片上集成系统(SoC)技术可把构成传感器的敏感元件和电路元件制作在同一芯片上,能够完成信号检测和信号处理,构成功能强大的智能传感器,满足传感器微型化和集成化的要求。传感器集成化是实现传感器小型化、智能化和多功能的重要保证。MEMS传感器一直是研究的热点和重点,是各国大力发展的核心和前沿技术,引起了各国研究机构、大学和公司的高度重视,欧美和日本等国显示出了明显的领先
23、优势。国内的一些高校和研究机构已着手MEMS传感器技术的开发和研究,但在灵敏度、可靠性及新技术能力提升方面与国外相比还存在较大差距。许多MEMS传感器品种尚未具备批量生产的能力,离产品的实用化和产业化还很远,有待于进一步提高和完善。MEMS传感器是利用集成电路技术工艺和微机械加工方法将基于各种物理效应的机电敏感元器件和处理电路集成在一个芯片上的传感器。MEMS是微电子机械系统的缩写,一般简称微机电。图2为MEMS的原理图 MEMS传感器主要用于控制系统。利用MEMS技术工艺将MEMS传感器、MEMS执行器和MEMS控制处理器都集中在一个芯片上,则所构成的系统称为MEMS芯片控制系统。图3表示了
24、MEMS控制系统。微控制处理器的主要功能包括A/D和D/A转换,数据处理和执行控制算法。微执行器将电信号转换成非电量,使被控对象产生平动、转动、声、光、热等动作。系统接口单元便于同高层的管理处理器通信,以适合远程分布测控. 图2 MEMS惯性传感器原理图 图3 MEMS控制系统原理框图1.4本文的组织结构本文主要对惯性传感器的数据采集及模式识别进行了研究,首先深入研究了国内传感器的运动识别的相关状况和国内传感器的运动识别的应用。接着,在理解并掌握惯性传感器的运动识别系统的理论基础上,对系统模型的数据采集和特征提取算法及运动识别主要算法进行介绍。然后对惯性传感器的运动识别识别系统进行了详细推导阐
25、述,并进行了实验验证对比分析。最后,对复杂的惯性传感器的运动识别识别系统模型,并通过K-means算法算法对系统模型的参数进行辨识。论文的主要工作安排如下:第一章书写了目录,第二章首先简单介绍课题的提出及研究的意义,然后对惯性传感器的运动识别国内外现状的研究现状进行了阐述,最后介绍本文各章节的结构安排。第三章,主要介绍了数据采集和特征提取算法,首先是惯性传感器的内部结构,之后就是工作的流程,由于本项目中惯性传感器的采样频率为100 Hz, 远大于人体运动时的频率。为了提高运算速度和对运动的主要特征进行分析,所以本文中采用傅里叶变换对运动数据进行提取。简要介绍惯性传感器的运动识别,包括当今的对运
26、动识别算法的主要方法例如支持向量机、隐马尔科夫模型等,本文主要用k-mean均值聚类算法,最后介绍了SOM辨识方法。利用polt画出5幅动作图,画出表格,给出各个姿势的正确率并进行分析。最后,课题总结与展望。对全文分析和总结,提出一些仍需要解决的问题,并对课题的前景做出展望。第二章 数据采集和特征提取算法2.1 惯性传感器的结构本文所使用惯性传感器的内部结构如下图所示。该惯性传感器由两个双轴的加速度计和一个三轴的陀螺仪组合而成。在进行数据采集时,采样频率设为100 Hz。工作时被测对象的各种参量通过传感器的适当转换后,再通过信号跳理,采样,量化,编码,传输等步骤传到控制器的过程,并且数据采集器
27、具有数据采集、数据传送、数据删除和系统管理等功能。图2-1 惯性传感器内部结构图。2.2 数据采集 图2-2 工作流程图 数据采集是指被测对象的各种参量通过传感器的适当转换后,再通过信号跳理,采样,量化,编码,传输等步骤传到控制器的过程。数据采集的目的是为了测量被测对象的动作信息,数据采集系统整合了信号、传感器、信号调理、数据采集设备和应用软件主要流程包括,惯性传感器蓝牙接收器数据采集数据自动截取数据处理运动识别。2.3 数据的特征提取本项目中惯性传感器的采样频率为100 Hz, 远大于人体运动时的频率。为了提高运算速度和对运动的主要特征进行分析,本文中采用傅里叶变换对运动数据进行提取。 下图
28、为上下左右画圈圈动作的时域图。图 2-3 画圈图2-4 向下 图2-5 十字图2-6 向左图2-7 向右2.4 离散傅里叶变换(DFT) 在信号处理中,DFT 的计算具有举足轻重的地位,信号的相关、滤波、谱估计等等都可通过 DFT 来实现。然而,由DFT 的定义式可以看出,求一个N点的DFF要N 2次复数乘法和N (N-1)次负数加法。当N 很大时,其计算量是相当大。 傅立叶变换是信号分析和处理的重要工具。离散时间信号x (n)的连续傅立叶变换定义为 = (2-1)式中 X(e j )是一个连续函数,不能直接在计算机上做数字运算。为了在计算机上实现频谱分析,必须对 x(n)的频谱作离散近似。有
29、限长离散信号x(n),n=0, 1, , N-1的离散傅立叶变换(DFT)定义为 X(k) = (2-2)式中 (N= , n=0, 1, , N-1。其反变换定义为 (2-3)将DFT 变换的定义式写成矩阵形式,得到 X=A· x。其中DFT 的变换矩阵A为 (2-4)2.4.1 快速傅里叶变换(FFT) 快速傅里叶变换(FFT)是 1965 年 J.W.Cooley 和J.W.Tukey 巧妙地利用 WN 因子的周期性和对称性,构造了DFT 的快速算法,即快速离散傅里叶变换(FFT)。在以后的几十年中,FFT 算法有了进一步的发展,目前较常用的是基2算法和分裂基算法. 在讨论图像
30、的数学变换时,我们把图像看成具有两个变量x, y的函数。首先引入二维连续函数的傅里 叶变换,设f (x, y)是两个独立变量x, y的函数,且满足 ,则定义为傅立叶反变换。 (2-5)傅里叶变换的振幅谱、相位谱和能量谱分别为 (2-6) (2-7) (2-8)式中 R(u, í), I(u, í)分别表示傅里叶变换的实部和虚部。下图是几种典型信号傅里叶变换的振幅谱。 连续信号f (x, y)经过抽样后成为二维离散信号f (m, n),其中0mM-1,0nN-1,相应地定义二维离散傅里叶变换(DCT)及其反变换为 (2-9) (2-10)2.4.2快速傅里叶变换FFT 的应用
31、 图3是模拟远程高空卫星照片,图4 是利用Matlab 5.3中的图像处理工具箱(Image Processing Toolbox)提供的图像处理函数89 将图像信号读入,经傅里叶变换将空间域图像信号变换到空间频率域信号,使快速卷积、目标识别等许多算法易于实现,然后对图像信号的频谱分布进行分析,用Butterworth带通滤波器和二维维纳滤波进行滤波处理,去除图像信号中的低频干扰信号和噪声信号,然后利用傅里叶反变换将信号还原,所得到的模拟远程高空卫星照片。从图4可看到,整个模拟远程高空卫星轮廓清晰可见,达到了较为理想的效果。对下一步利用光学系统装置采集的远程目标的进一步识别提供了有利的条件。
32、2.4.3 算法基本原理 有限长序列X(n)及其频域表示X(k)可由以下离散傅立叶变换得出 0kN-1 (2-11) 0nN-1 (2-12) 其中,第一个称为离散傅立叶正变,第二个称为离散傅立叶反变换,、X(n)与X(k) 构成了离散傅立叶变换对。根据上述公式,计算一个X(k),需要N次复数乘法和N-1一次复数加法,而计算全部X(k)(0KN-1),共需要,次复数乘法和N(N-1)一次复数加法实现一次复数乘法需要四次实数乘法和两次实数加法,一次复数加法需要两次实数加法,因此直接计算全部共需要4次实数乘法和2N(N-1)次实数加法.当N较大时,对实时信号处理来说,对处理器计算速度有十分苛刻的要
33、求,于是如何减少计算离散傅里叶变换运算量的问题变得至关重要. 为减少运算量,提高运算速度,就必须改进算法。计算DFT过程中需要完成的运算的系数里,存在相当多的对称性。通过研究这种对称性,可以简化计算过程中的运算,从而减少计算DFT所需的时间. 具有以下固有特性 (1) 的周期性: (2-13) (2) 的对称性: (2-14) (3)的可约性: (2-15)另外, , (2-16)利用的以上特性,将X(n)或X(k)序列按一定规律分解成短序列进行运算,这样可以避免大量的重复运算,提高计算的运算速度算法形式有很多种,但基本上可以分为两大类,即按时间抽取,FFT算法和按频率抽取FFT算法。 FFT
34、谱的频率分辨率为,与采样频率成正比,与采样点数成反比,N为一定时,频率分辨率无法再提高。时间序列X(t)中己含有从0至的频域信息,所以如果用连续的傅里叶变换对谱进行计算 (2-17) (2-18) 这时频率分辨率己不受采样点数的限制,f是一个连续的频率。对指定的一个频率区间【,】包含在区间(0,/2)内。其特点为细化密度可以任意设定。这种细化方法与传统的复调制细化方法(ZOOM)不同,由于没有加大窗的长度,所以仅能对信号局部频率的幅值和相位细化运算,而不能将己经非常密集、幅值和相位相互叠加的频率成分分离开。十细化算法与比例法校正精度基本相同,但其相位精度要高一些。第三章 基于惯性传感器的运动识
35、别3.1 运动识别主要算法分类就是通过分类算法将某一未知类别样本匹配到某一已知类别中,从而确定该未知样本的类别。常见的分类算法有:最近邻法、贝叶斯(Bayes)分类法、BP 神经网络分类法、决策树算法、支持向量机(SVM)算法、隐马尔科夫(HMM)算法等。 在统计模式识别领域有一种最具有代表性的识别方法就是隐马尔可夫模型(Hidden Markov Model, HMM)。隐马尔可夫模型是一种能很好地对基于时间序列的数字信号进行建模的技术,它最大的好处在于它完善的数学模型框架以及现有成熟的自动训练和识别的相应算法HMM 最初被用在连续语音的自动识(Automatic Speech Recogn
36、ition, ASR)上,并获得了很大的成功。后来也应用于手写识别领域,成为一种应用非常广泛的识别模型。由于人体运动模式的加速度信号与连续语音的数字信号具有类似的时间序列特性,于是研究人员将这种技术引入基于加速度传感器的人体运动模式识别领域。由于语音信号是一维随机信号,所以通常用到的 HMM模型也都是一维的。而对于运动产生的加速度信号都是三维信号,为了能应用语识别领域已经成熟的一维HMM 模型,人体运动模式识别的研究人员想了各种方法将三维信号转成一维信号,最常见的方法是用矢量量化得到一维特征矢量,然后用这个一维特征矢量来训练 HMM模型典型结构框图如图所示。 当用HMM 模型对人体运动模式进行
37、识别时,需要确定所使用的状态数以及概率密度分布函数等,通常这些参数都是人为选定的,而对这些参数进行自动优化调整可以改进 HMM模型的识别性能。 在统计模式识别领域另一种最具代表性的识别方法就是支持向量机(Support Vector Machine, SVM)。有关支持向量机(SVM)的研究,首先起源于1960 年Vapink等设计的最优分类超平面。最简单的支持向量机只能对两类线性可分的模式进行识别,为了使其能够应用在非线性可分模式的识别,产生了核技术。为了使其能够满足多类模式的识别要求,产生了多个 SVM 的组合使用。为了提高分类器的通用性,人们提出了机器最大化的基准。经过多方面的改进,使得
38、 SVM 迅速发展和完善,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。鉴于 SVM 强大的分类识别能力,它也被研究人员应用到基于加速度传感器的人体运动模式识别研究中 图3-1 基于 HMM的手势识别及训练框图3.2K-means算法介绍 K-均值聚类算法基本思想 J.B.MacQueen在1967年提出的K-均值聚类算法是到目前为止用于科学和工业应用的诸多算法中一中极有影响力的技术。算法首先随机选取k个点作为初始聚类中心,然后计算各个数据对象到各聚类中心的距离,把数据对象归到离它最近的那个聚类中心所在的类;对调整后的新类计算新的聚
39、类中心,如果相邻两次的聚类中心没有任何变化,说明数据对象调整结束,聚类准则Jc已经收敛。本算法的一个特点是在每次迭代中都要考察每个样本的分类是否正确,若不正确,就要调整。在全部数据调整完后,再修改聚类中心,进入下一次迭代。如果在一次迭代算法中,所有的数据对象被正确分类,则不会有调整,聚类中心也不会有任何变化,这标志着Jc已经收敛,至此算法结束。大致流程是:输入:簇的数目 k 和包含 n 个对象的数据库 输出:k 个簇,使平方误差准则最小 算法思想为:给定 n 个数据点x 1,x 2 ,x n ,找到 K 个聚类中心 , ,.,算法思为:给定 n 个数据点, , , , 找到 K 个聚类中心 ,
40、 ,., 使得每个数据点与它最近的聚类中心的距离平方和最小, 并将这个距离平方和称为目标函数,记为Wn,其数学表达式为: (3-1)由于 K means 算法易于描述,具有时间效率高且适于处理大规模数据等优点,自20世纪70 年代以来,该算法在国内外已经被应用到包括自然语言处理、 土壤、 考古等众多领域。在文本聚类领域,K -means算法已经成为基本的算法。随着 Kmeans 算法研究的深入,该算法的一些不足纷纷暴露出来,主要包括:需要预先确定K值会受到初始聚类中心影响、难以处理分类属性数据以及容易收敛于局部最优解等。3.2.1 K-means 文本聚类算法优化 K-means 算法通过不断
41、地迭代与重新计算聚类中心直至收敛进行聚类, 因此聚类收敛条件是算法的重要组成部分。在最初的算法中 MacQueen 以平方距离和Wn为目标函数,作为聚类质量的衡量标准, 并证明了Wn的收敛性 。1978 年 Hartigan 9 分析了一维情况下的算法, 令 K = 2,即将全部数据点分割成两个簇, 证明了可以用概率收敛点来定义最佳的分割点。Pollard 考察了多维空间的情况, 并将 Hartigan 的结论推广到多维空间, 提出了Kmeans 算法新的聚类质量评价标准, 即在保证 Wn 收敛的同时, 还需保证各聚类中心也收敛到最优解。 Creator 等的研究发现, 由于目标函数 Wn 存
42、在局部极小值点, K means 算法会陷入局部最优解。为了使聚类结果尽量接近全局最优解, 需要在算法中加入新的机制, 而这些改进都以牺牲目标函数 W n 的收敛速度为代价。其中较著名的是 1995 年 Chinrungru-eng 等 提出的改进算法, 该算法在原有算法中加入了两种新的机制, 分别是:允许算法在自适应过程中摆脱目标函数 W n 的干扰;采用反馈方式, 根据当前聚类质量动态地调整算法的收敛速度 由于Wn计算的是所有数据点到其聚类中心的距离平方和,因而事实上其反映的仅仅是类内距离的度量,而根据聚类算法的基本思想, 即聚类算法应使聚簇内相似度尽可能大, 而聚簇间相似度尽可能小的基本
43、原则, 聚类收敛函数应该综合考虑类内距离和类间距离。为此, 学界提出了很多改进的聚类收敛函数, 以期更加全面地反映聚类的质量。其中大多数的改进都是采用类内紧密性(Within cluster Scatter)与类间分散性(Betweencluster Separation)的比值来作为收敛函数, 这样当收敛函数收敛到极小值时,类内紧密性和类间分散性都可以达到较优值。著名的 Davies Bouldin指数(DBI) 和 Dunn 指数(DI) 都是采用这种思想,DaviesBouldin 指数是计算类内距离之和与类间距离之和的比值, 而 Dunn 指数是计算类内距离和类间距离的最值之比。3.2
44、.2 初始聚类中心的选择 在 K means 算法中, 初始聚类中心是随机选取的,因此可能造成在同一类别的样本被强行当作两个类的初始聚类中心, 使聚类结果最终只能收敛于局部最优解,因此 K means 算法的聚类效果在很大程度上依赖于初始聚类中心的选择。针对该问题,学界提出多种改进的算法。基本分为基于密度的解决方法和基于优化算法的解决方法等 。3.5K一均值聚类算法的算法流程 原始的k均值聚类算法网输入数据集X=。,聚类数目k;输出k个类簇 ,j=1,2,3.,k 1,令I=1,随机选取个K数据点作为K个类簇的初始簇中心(I),j=1,2,3.,k2,计算每一个数据点与这个簇中心的距离d(,(
45、I),i=1,2,3,.,n,j=1,2,3.,k,如果满足, d(,(I)=mind(,(I),j=1,2,.k,则;3,计算个新的聚类中心 (3-2) 4,判断若, j=1,2,3.,k,则I=I+1,返回2,否则算法结束。一均值聚类算法在执行过程中还可以加入聚类准则函数来终止迭代过程,一般采用聚类误差平方和准则函数,即在上面算法流程中4的叩中计算聚类误差平方和J,然后加入判断,若两次的J值没有明显变化,则说明值已经收敛,结束算法,否则转入继续执行.3.6 SOM算法介绍生物学研究表明,在人脑的感觉通道上,神经元的组织原理是有序排列的。当外界的特定时空信息输入时,大脑皮层的特定区域兴奋,而
46、且类似的外界信息在对应的区域是连续映像的。生物视网膜中有许多特定的细胞对特定的图形比较敏感,当视网膜中有若干个接收单元同时受特定模式刺激时,就使大脑皮层中的特定神经元开始兴奋,输入模式接近,与之对应的兴奋神经元也接近;在听觉通道上,神经元在结构排列上与频率的关系十分密切,对于某个频率,特定的神经元具有最大的响应,位置相邻的神经元具有相近的频率特征,而远离的神经元具有的频率特征差别也较大。大脑皮层中神经元的这种响应特点不是先天安排好的,而是通过后天的学习自组织形成的。 据此芬兰Helsinki大学的Kohonen T.教授提出了一种自组织特征映射网络(Self-organiz
47、ing feature Map,SOM),又称Kohonen网络。Kohonen认为,一个神经网络接受外界输入模式时,将会分为不同的对应区域,各区域对输入模式有不同的响应特征,而这个过程是自动完成的。SOM网络正是根据这一看法提出的,其特点与人脑的自组织特性相类似。 自组织神经网络是无导师学习网络。它通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变网络参数与结构。层次型结构,具有竞争层。典型结构:输入层竞争层。如图3-2所示。 3.2图 自组织神经网络结构SOM网络共有两层:输入层和输出层。 · 输入层:通过权向量将外界
48、信息汇集到输出层各神经元。输入层的形式与BP网相同,节点数与样本维数相同。 · 输出层:输出层也是竞争层。其神经元的排列有多种形式,分为一维线阵、二维平面阵和三维栅格阵。最典型的结构是二维形式,它更具大脑皮层的形象,如图3-3所示。3-3 二维SOM平面阵列输出层的每个神经元同它周围的其他神经元侧向连接,排列成棋盘状平面;输入层为单层神经元排列。SOM自组织映射神经网络是一个巧妙的神经元网络,它建立在一维、二维或三维的神经元网络上,用于捕获包含在输入模式中感兴趣的特征,描述在复杂系统中从完全混乱到最终出现整体有序的现象。3.7 实验内容本文的实验内容是利用惯性传感
49、器对人体手部的五种动作进行识别,这五种动作分别为左、右、上、下和中心画圆,如下图3-4所示。每种动作采集的数量为20个。在进行特征提取后,通过k-means将该100个动作进行分类,得出试验结果,算出误差。图3-4 五种运动的动作示意图 其中,ax是x轴加速度,ay是y轴加速度,从下图可以看出刚开始相对而言,加速度线都是直线,就算不运动,惯性传感器内部自带数据,来消除误差,因为在测量时候会存在很多外在误差,例如重力,空气阻力等。从下图可以看出在测量运动的时候虽说没有百分之百的测到,但是大致运动数据还是测到了,而这些误差知识在很短的时间内,在一些应用中完全可以忽略。3-5 向左3-6 向右3-7
50、 向 上3-8 向下3-9 画圆3.8 实验结果 下面图表表示的是从下面5个结果图中得到的数据,其中横坐标表示每个动作在本图中识别该动作的个数,由于每个动作实际总数为20个,为了减少误差,本文中一共选取了5幅图,表示每个动作有100个。最终得到的结果求平均值。 识别率=识出动作的个数 / 动作总个数分类结果circleCrossleftdownright结果图图 3-102428181217图 3-111026182817图 3-12289112724图 3-131718242812图 3图 3-10:(24+28+18+12+17)/100=99% 图 3-11:(
51、10+26+18+28+17)/100=99% 图 3-12:(28+9+11+27+24)/100=99% 图 3-13:(17+18+24+28+12)/100=99% 图 3-14:(27+11+24+9+28)/100=99%由上表及计算结果可以得出用k-means算法的识别率为99%3-10 结果图3-11 结果图3-12 结果图3-13结果图3-14结果图第四章 结论 本文主要研究了基于惯性传感器的模式识别系统。对惯性传感器及当前的模式识别进行了深入分析,研究了五种基本动作,包括上,下,左,右,画圈。因为人体的各种复杂动作都是由很多的基本动作组成。本文中以库中的动作数据作为训练数据
52、和测试数据,采用支持向量机对多类动作进行了识别。 现将研究成果和创新点总结如下。 (1)在观看了大量视频的基础上,总结出日常的5个基本动作,采用基于惯性传感器的动作捕捉系统对这些动作进行了数据采集,以供研究使用。 (2)做了基于惯性传感器的动作识别。对数据进行预处理之后,提取了基于姿态角的特征,并进行了降维处理,采用基于一对一组合分类法的支持向量机多类分类方法进行了动作识别。 聚类分析是数据挖掘领域中的一项重要的研究课题,它既作为单独的工具以发现数据源的数据分布信息,也可以作为其他数据挖掘算法的一个预处理步骤,K-均值聚类算法是解决聚类问题的一种经典算法。它的主要优点是算法简洁、快速。如果结果
53、类是密集的,而且,当类与类之间的区别明显时,它的效果最好。聚类算法的聚类结果有一定的不可预见性,在实际应用中应根据数据类型选择合适的聚类算法(和可恰当的相似性度量方式),以取得最佳的聚类效果. 基于惯性传感器的动作识别还是一个较新的领域,本文所给出的特征提取和识别方法还都是较为传统的方法,本文详细论述了基于惯性传感器的模式识别系统。分别从惯性传感器及模式识别两个方面来论述本课题,使用该系统可以解决预测防护问题.由于现如今惯性传感器的测量会存在积累性误差。或多或少对实验结果的准确性存在影响,但是在前期的数据测量较为准确,所以在一些特定场合对于测量精确性要求不高的场合可以用到,例如残疾人的轮椅保护
54、措施等。因此,基于惯性传感器的模式识别识别系统在一定程度上可以提前预测识别动作,因此在一定程度上优于传统的视频模式识别。随着科技的发展,我相信惯性传感器的发展会越来越精确。所以对于新兴领域的惯性传感器的模式识别系统的研究会越来越火。参考文献1余瑞芬.传感器原理M.北京:航空工业出版社, 1995.2EDN China. LPS001WP:意法半导体推出MEMS传感器适用于便携设备、汽业EB/OL.(2010-12-02)2011-03-22.Http:/3Yole Development SA. MEMS technology: world's smallest baro-metric pressure sensorJ. Micronews, 2009, 78: 1.4NED A A, OKOJIE R S, KURTZ A D, et al. 6H-SiC pres-sure sensor operation at 6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年中频转杯纺纱机项目申请报告
- 玻璃反光的研究报告
- 玻璃人基因疗法研究报告
- 猜数游戏EDA课程设计
- 滨水景观公园课程设计
- 滨州单层钢结构施工方案
- 轨道交通服务相关行业投资规划报告范本
- 波音公司创新案例研究报告
- 波浪格栅吊顶施工方案
- 波形变换课程设计
- BIM技术全过程工程管理及应用策划方案
- 弯扭构件制作工艺方案(共22页)
- 水利工程填塘固基、堤身加固施工方法
- 中医针灸的骨边穴怎样定位
- 人教版八年级上册英语单词表默写版(直接打印)
- 电脱水、电脱盐讲解
- 江西省科技创新平台建设(PPT课件)
- 违约损失率(LGD)研究
- XSD3016轮式洗砂机结构设计和实现机械设计和自动化专业论文设计
- 沟槽回填施工方案(完整版)
- 2021-2025乡村5年规划三篇
评论
0/150
提交评论