《可解释性睡眠分期系统探究》11000字【论文】_第1页
《可解释性睡眠分期系统探究》11000字【论文】_第2页
《可解释性睡眠分期系统探究》11000字【论文】_第3页
《可解释性睡眠分期系统探究》11000字【论文】_第4页
《可解释性睡眠分期系统探究》11000字【论文】_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论1.1研究背景及意义睡眠是人类日常生活中必不可少的一项重要生理活动,能够协调我们身体各个器官各项机能,从而帮助我们处理日常的各种事务,一个高质量的睡眠不仅使我们的神经细胞得到了充分的营养补充,而且能够让人们容光焕发,进而高效率的完成各种复杂的任务。在例行的体检中,心电图由于具有较高的检测精度,是身体各机能的重要检测指标之一,采集速度很快并且高效,在临床上被普遍应用。心电信号(electrocardiogram,ECG)可以划分为P波段、QRS波段和T波段,三个波段有不同的特征,其中,R波的特征最明显,也是最容易被检测出来的,因此R波的检测是检测其他波和计算心电相关的特征的基础。由于心电信号具有不稳定性、近磁场性、微弱性、低频性以及随机性的特征,因此,需要设计出一种算法来去除这些不利特征的影响,且运用此算法对心电信号进行分析,判别出其对睡眠周期的影响,从而可以辅助临床医生对睡眠障碍患者进行诊疗以及学者对梦境的研究。1.2国内外研究现状早在上世纪五十年代,EAserinsky与NKleitman[1]在睡眠期间进行了眼球运动的周期和伴随相关现象的研究,将睡眠周期划分为了两个阶段:快速眼动周期(rapideyemovement,REM)和非快速眼动周期(non-rapideyemovement,NREM),开启了人类睡眠研究史的大门。目前广为熟知的R&K标准[2]是20世纪60年代Rechtschaffen和Kates制订出来的,此规则将睡眠分为3个时期:清醒期(wake,W),非快速眼动周期(non-rapideyemovement,NREM)以及快速眼动周期(rapideyemovement,REM),其中,又把NREM区分为四个阶段:入睡期Stage1,浅度睡眠期Stage2,中度睡眠期Stage3,深度睡眠期Stage4,每个周期为60-90分钟,循环周转。美国睡眠医学学会[3]在R&K规范的基础上,进行了一些调整,将S3与S4合并成为一期S3,此标准在目前广为流传与使用。多导睡眠监测仪(polysomnography,PSG)作为常用的睡眠监测方式,它通过对一系列生理指标的检测,如:血氧饱和度、肌肉运动、心率变化、心电信号、脑电波等,来计算暂停低通气以及呼吸紊乱指数,从而得到监测者的睡眠质量。但是,由于在利用多导睡眠监测仪时,有诸多限制,监测者需要在晚上七点前进入睡眠实验室,直至第二日清晨七点方可离开,监测者睡前禁止服用各类药物并尽量避免起夜,且多导睡眠需要医生手动进行两个小时左右的睡眠分期,携带一定的主观因素,误差不可避免。因而,越来越多的学者投入到利用机器算法来对睡眠进行分期的研究之中。在多导睡眠监测中,发现脑电信号在不同睡眠的阶段变化较大,因此目前许多学者已经开始利用脑电信号来进行睡眠分期。曹琪琪、刘冰利用前额叶的脑电信号对睡眠进行分期[4],通过Fp1-Fp2的脑电图(electroencephalogram,EEG)的采集,提取特征后将其进行模型训练,准确率达到了80%以上。李坚年[5]在时频域上进行EEG特征的提取,跟据美国睡眠医学学会(AmericanAcademyofSleepMedicine,AASM)标准,使用随机森林(randomforrest,RF)方法进行睡眠分期,准确率达到84.3%。王亚露[6]采用了传统的睡眠分期和优化支持向量机(supportvectormachine,SVM)分类器的算法,设计出了软件系统,能够进行睡眠信号的回放和分期,准确率达到79.9%。林少倩[7]使用基于混合特征选择和改进的果蝇算法进行睡眠分期,准确率达到了92.18%。王怡[8]在传统的睡眠分期算法基础上,提出了一种联合一维卷积神经网络与长短时记忆模型的办法进行睡眠分期,准确率达到85%以上。目前较为广泛应用的是利用脑电信号来分析睡眠,但是由于提取脑电信号过程很繁琐并且无法实现日常的检测,相比之下,心电信号的采集比较方便,且许多研究表明,心率变异性(heartratevariability,HRV)的特征与睡眠的各个阶段息息相关,因此基于心电信号的睡眠检测的方法日渐流行起来。黄文汉等[9]基于R&K睡眠分期准则,将心电信号和呼吸信号结合,利用SVM与RF的方法对睡眠进行分期,最高的准确率达到了71.9%。张兴华[10]提出了一种新兴的深度神经网络模型,即堆栈式稀疏自编码器,分别选取了不同长度的样本周期进行比较,30s的样本周期准确率达到81.69%,60s的样本周期准确率达到了83.70%,在60s睡眠周期的条件下进行睡眠分期,二分期的准确率为94.77%,三分期的准确率为83.70%,五分期的准确率为68.30%。许良[11]使用呼吸信号和心率变异性信号来进行实时睡眠分期,此算法将隐马尔可夫模型与BP神经网络的模型联合起来,弥补了隐马尔科夫(hiddenMarkovmodel,HMM)算法在识别REM与NREM3期的不足,准确率达到了79.07%。Yucelbasy等[12]用几种不同的方式对心电信号进行特征提取得到四个不同的数据集,之后采用随机森林对这四个数据集进行分类,基于形态学方法的准确率最高,达到87.11%。Surantha等[13]采用加权极值机器学习(weightedextrememachinelearning,WEML)处理数据集,准确率达到73.09%。SunH等人[14]设计出了将卷积网络和长短期记忆网络组合的5个深度神经网络来训练心电信号和呼吸信号,进行睡眠分期,达到80%的准确率。Y.Wei[15]等在单导联心电信号的基础上使用长短期记忆网络(longshort-termmemorynetwork,LSTM)构建五类分类器,NREM1期、NREM2期、NREM3期与REM期的准确率分别为89.84%、84.07%、77.76%、71.16%。王爱波[16]使用利用隐马可夫模型来对睡眠进行三分期(Wake、REM、NREM),准确率达到71.63%。周超[17]在对心电信号进行完特征提取后,使用梯度提升树的方法进行睡眠分期,二分期、三分期、四分期、六分期的准确率分别为90.69%、88.98%、86.66%、80.64%。1.3论文主要内容本论文各章节的主要内容如下:第一章介绍了本设计的研究背景与其意义,对近五年来国内外对于睡眠分期的研究进行分析与总结。第二章对本设计必备的基础知识进行了阐述。包括心电信号、睡眠分期、,以及本文选用的睡眠数据库。第三章介绍了心电数据的预处理,包括心电信号的噪声类型及滤除方法。第四章介绍了心电信号的QRS波群以及提取它们的意义。第五章对心电信号中存在的各类特征进行提取。第六章介绍了深度学习中常见的分类方法,分别使用了两种不同的方法对睡眠进行分期,并且对二者进行了对比。第七章为总结和展望。2心电信号与睡眠分期理论2.1心电信号简介心电信号对人体来说,是极为重要的生理指标。由于心电图具有较高的精度以及包括了人体主要的生理信息,因此是重要的检测指标之一。通过专业仪器的采集,便可得到我们平常所看到的心电图,进而对心电图进行提取,即可得到所需的信息。完整的心电信号分为P波段、QRS波段、T波段,而各个频段所包含的特征信号都有所不同,频谱范围也有所不同。几个波段的划分如图2-1所示。图2-1QRS波群P波:是心电波群中最早出现的波,反应的是心肌细胞在心房内除极这段过程ADDINCNKISM.Ref.{6579D30187EC47589143920B18AD1FB7}[10],形状表现为较小的圆顶状,持续时间为0.08-0.11s左右,幅值为0.25mv左右。QRS波群:是心电波群中最为明显且最为重要的一个波群,是紧跟着P波相继出现的波群,具体形状表现为Q波为下降波,R波紧跟着向上继而达到最高峰,S波紧跟着下降达到峰谷。持续时间低于1s,幅值在0-0.8mv之间。T波:与P波形状相似,也表现为较小的圆顶状,但是T波比P波持续时间要长。不同波段的频率特征具有差异性,其中,R波的特征最明显,也是最容易被检测出来的,因此R波的检测是检测其他波和计算心电相关的特征的基础。对R波的检测主要是对RR间期的检测,即:前一个R波与后一个R的间隔。由于心电信号是一种极为容易受到干扰的生理信号,对噪声的处理便十分的重要,心电信号内主要是这几种噪声:基线漂移、工频噪声和肌电噪声,其中,肌电噪声是因为在ECG信号的采集过程中身体的轻微震荡而引起的,频率集中分布在1-2000Hz左右;基线漂移是由于在心电信号收集中,因为采集设备的电极接触不良而导致的一种低频噪声,频率集中分布在1Hz以下;工频噪声是由于在收集过程中,供电设备造成的不可避免的干扰,频率集中在50Hz左右。2.2睡眠分期简介20世纪50年代初,主要从事睡眠研究的Rechtschaffen与Kales进行了一系列的脑电信号研究后,制定出了R&K睡眠分期规则,将睡眠分为三个的周期:Wake、REM、NREM,其中,NREM又被划分为4个阶段,即浅睡期的S1与S2,深睡期的S3与S4[19]。随后,许多对睡眠分期感兴趣的研究者们认为R&K不足以描述睡眠过程,认为这个规则有所偏差。于是,2007年AASM在拟定新标准的时候,将R&K标准中NREM阶段中的S3与S4阶段合并在一起成为深睡期。本设计中,将睡眠进行三分类、四分类、六分类,并进行睡眠分期的测试,各分类具体情况如表2-1所示。表2-1睡眠阶段分类三分类WakeREM NREM四分类WakeREMLightSleepDeepSleep六分类WakeREMStage1Stage2Stage3Stage42.3数据库选取本设计选取的数据库是麻省理工大学的多导睡眠数据库(MIT-BIHPolysomnographicDatabase,MITBPD)[20,21],该数据库是开源数据库,里面包含了16位受试者的共约80小时的整夜睡眠记录以及心电信号,所有记录均由睡眠专家基于R&K标准进行睡眠分期注释。此数据库包括DAT文件、ECG文件、ST文件和HEA文件,dat文件是ECG的数据文件;ecg文件是ECG的节拍注释文件;st文件是对间隔30s的睡眠阶段进行注释文件;hea文件包含关于记录的一般信息,如其长度、增益和偏移各生理信号。考虑到原始数据库包含了许多与本设计无关的信息,本设计只需要数据库内的病人信息、ECG信息、RR间期信息以及睡眠注释信息,因此将原始数据库所包含的冗余信息进行剔除,对本设计所需要的关键信息进行提取并更新原始数据库,使得设计所需的数据库只包含以下文件:an文件、rr文件、hea文件。an文件是每隔半小时的心率数据以及睡眠注释数据,rr文件是rr间期数据,hea文件是受试者的受试信息文件。3心电信号预处理3.1心电信号噪声分析心电信号是一种极为微弱的生理信号,故滤除噪声非常关键,心电信号内主要包括三类噪声:肌电噪声、基线噪声和工频噪声,三种噪声的特征如下:(1)肌电干扰:在对ECG进行检测时,由于人体肌肉的抖动而导致的噪声,频率分布在5Hz-2000Hz,具体形状表现为不规则的波形,如图3-1所示。图3-1肌电干扰噪声(2)基线漂移:在对ECG进行检测时,由于采集设备电极接触不良以及人体的微动而产生的噪声,频率低于1Hz,具体形状表现为波形在基线附近上下浮动,如图3-2所示。图3-2基线漂移噪声(3)工频干扰:在对ECG进行检测时,由于城市供电设备系统自身产生的电磁波或者辐射等而造成的不可避免的干扰[22],频率为50Hz左右,具体形状表现为模糊的波形,如图3-3所示。 图3-3工频干扰噪声 3.2心电信号噪声处理针对上述噪声,本文采用了两种方法对其进行滤除,都取得了不错的效果。3.2.1滤波器方法实验所需的QRS波群频率分布在3-40Hz,而工频干扰噪声的频率在50Hz左右,巴特沃斯滤波器具有效率高,运行时间快的优点,因此使用截止频率为50Hz的四阶ButterWorth低通滤波器[23]即可将此噪声去除。原信号如图3-4所示,Python消除此干扰后的仿真结果如图3-5所示。图3-4原心电信号图3-5去除工频干扰后的信号图3-6去除基线漂移和肌电干扰后的信号常用的去除基线漂移的低频噪声常常使用高通滤波器,但是考虑到剩余波段的频率,如:QRS波群以及ST波都属于较高频率的信号,若单纯使用高通滤波器,则会导致波段变形。中值滤波作为一种常见的非线性滤波器,利用排序理论,原理是将区域内的各点的中值来代替信号各点的值[22],常被用来处理噪声,本设计采用中值滤波器的方法对基线漂移和肌电干扰噪声进行去除。Python去除肌电干扰和基线漂移后的仿真结果如图3-6所示。3.2.2小波变换方法傅里叶变换(FourierTransform,FT)于十九世纪初第一次提出,FT是一种有效进行平稳信号分析的一种经典办法[24],但是FT不具有局部性,很难去表述具有局部特征信号,并且由于缺乏局部的时间信息,对于频率随着时间的变化而变化的信号来说。FT便无法分析,本设计所需的心电信号,是一种局部的非平稳信号,具有时域、频域特征,因此,FT变换不适用于本设计。而小波变换(WaveletTransform,WT)在傅里叶变换和短时傅里叶变换的基础上[24],不但保留了二者的优势,而且同时对二者存在的不足做出了了弥补,从而能够进行时频局部化分析,大量用于非平稳信号的分析上。WT去噪的基本原理是:利用信号和噪声对应不同的小波系数的特性,将含噪的信号进行多尺度上的分解得到小波系数,再对小波系数加以适当的处理,从而使得处理后的小波系数能够有效的抑制噪声。具体的通过小波变换进行心电信号去噪的步骤如下:(1)小波基的选取。小波基的选取是WT的基础,不同的小波特征对应不同的小波基,去噪的效果也不同,小波基选取参考的标准主要是:自相似性、支集长度、对称性[25],而符合上述准则的小波有:Symmetry小波和Coiflet小波。常用于心电信号去噪的小波基有db6,sym4,sym8这三个,而相关研究表明[20]选用sym8小波基去噪后的信噪比最高,因此本设计的小波基选用sym8小波基。(2)分解层数的选择。不同层数对应的小波变换效果也不同,通过查阅相关的资料可知,进行九层分解后的小波系数最适合心电信号去噪,不同分解层数对应的频率范围如表3-1所示。表3-1不同小波层数对应的频率范围小波层数频率范围(Hz)CD1180-360CD290-180CD345-90CD425.5-45CD511.25-25.5CD65.625-11.25CD72.8125-5.625CD81.40625-2.8125CD90.703125-1.40625(3)阈值的选择。通常有二类阈值选择函数:软阈值与硬阈值选择函数,软阈值主要思想是:低于阈值的小波变换系数为零,而超过阈值的小波变换系数则是之前的系数和阈值之差;而硬阈值的主要思想是:低于阈值的小波变换系数为零,而超过阈值的小波系数不变。(4)ECG的重构。经过小波逆变换后的ECG如图3-7所示。图3-7经过小波变换后的信号4QRS波群的检测QRS波群的检测在HRV分析中是必不可少的,只有进行了正确的R波检测,才能够进行特征提取以及实现睡眠分期。目前对于QRS波群的检测算法主要有三类:阈值法、模板匹配法、神经网络法,各自的特点如下:(1)阈值法。使用较多的阈值法是差分阈值法,它的主要原理是:用阈值区分差分计算后的ECG,本设计所使用的GQRS算法属于差分阈值法这一类。(2)模板匹配法。它的主要思想是:应用ECG的周期性,将一个周期内的QRS波群作为一个固定的模板,关于发生在这个模板上的信号,依照幅值归一化的幅频重量值便可表现信号能量在这个模板上的集中状况。(3)神经网络法。近年来,深度学习已深入到各种领域,部分学者将机器学习的方法运用到QRS波群的检测上来。黄毅使用深度神经网络的U-net的方法,对定位结果进行调整,确定QRS波群时段[26]。虽然使用U-net方法对于检测有很好的效果,然而训练的时间较长,现实中很少应用。本设计先利用GQRS算法对QRS波群进行正确的定位,然后使用XQRS检测算法将定位后的波形与注释文件的结果进行比对,最后利用经典的Pan-Tompkin算法进行R波提取。Tompkins方法是JIAPUPAN[27]等人提出的一种QRS波群监测的方法,它的检测效果和实时性比较好,是一种检测QRS波群的经典方法,该算法的主要步骤如下:QRS波群检测的结果如图4-1所示。(1)先将去噪后的心电信号通过给定的滤波器;(2)对滤波后的信号求一阶导数;(3)对求导之后的ECG再进行平方运算;(4)把上一步处理完后的ECG信号进行积分运算;(5)设定阈值对R波进行处理。图4-1经过QRS波群检测后的信号由图4-1可知,此波群检测算法已正确检测到了QRS波群,“X”符号代表检测到的R波,在这10s内的R波均已检测到,紫色的波段代表心率(Heartrate,HR),表示每分钟的心跳次数,心率变异性(HeartRateVariability,HRV)则代表了心跳快慢的变化状况,通过对HR的检测,可以方便后续对于HRV信号的分析。5特征提取5.1特征提取目的在一般的睡眠分析时,往往需要一整夜,即7个小时的睡眠记录,为了得到精确的分析结果,防止重要信息的遗漏,则选取的采样量很大,常常使用7个小时原始信号进行分析,因此得到的数据量也是十分庞大的,这样不仅仅会浪费极大的空间资源与时间运行成本,而且会得到一些冗余的数据,这些冗余的数据也会对下一步的分析造成困扰。因此直接分析原始数据并不可取,有必要对原始的心电信号进行特征提取来降低运算量。5.2心电信号各类特征提取5.2.1心率变异性分析HRV是指连续两次心跳间隔的情况变化[16],反映了RR间期的变化规律。目前对于HRV的特征提取,主要是时域特征提取、频域特征提取、非线性特征提取。5.2.2RR间期预处理由于进行特征提取的HRV信号是从真实的心电数据库中得到的,如果用它直接进行特征提取,这可能会出现缺失值和差异大的情况,因而,有必要对其进行预处理,即通过相应的函数去清洗RR间期的数据,降低离群值和异常值的出现,并且用线性插值的方法添加新值,从而有利于后续分析。5.2.3时域特征提取在医学界对睡眠进行分析时,主要是对HRV进行短程分析,即30秒。因此,本设计的所有对于QRS波群的特征提取都是以30秒为单位的。本设计对HRV进行了常见的时域特征提取,如:平均值,标准差,最大值与最小值,以66号受试者为例,提取到的各个时域特征的相关信息以及时域特征值如表5-1所示。表5-1心电信号时域特征时域特征特征介绍特征值mean_nniRR间期平均值0.207.302631578947sdnnRR间期标准差0.949908817652483sdsd相邻RR之间差异的标准差0.952328424724048nni_50连续RR间期间隔差大于50ms的数量0.538461538461538pnni_50用nni_50/RR间期数量0.615384615384615nni_20连续RR间期间隔差大于20ms的数量2pnni_20用nni_20/RR间期数量0.8810572687224669range_nniRR间期最大值和最小值的差异0.109cvcd连续差异的变化系数0.04087546780596627cvnni变异系数0.07445072794784847mean_hr平均心率0.2911843136412328max_hr最大心率0.43795620437956205min_hr最小心率0.243.90243902439025std_hr心率标准差0.2386430887373418rmssd相邻RR间期的差方和的均值的平方根0.952095869837693median_nniRR间隔差的中位数的绝对值0.3039533105238675.2.4频域特征提取对HRV信号的频域分析指的是对其各个频段上的能量分布进行分析,主要包括总功率密度谱、低频时HRV的方差、高频时HRV的方差、低频功率和高频功率,以66号受试者为例,提取到的各个频域特征的相关信息如表5-2所示。常用welch图来描述频域特征即估计功率谱,横坐标为频率,纵坐标为功率谱密度,选取30s的HRV信号来进行功率谱估计,其welch周期图如图5-1所示,由图可知,随着频率的增大,PSD随之减小。表5-2心电信号频域特征频域特征特征介绍特征值total_power总功率密度谱0.997358682189595vlf极低频时(0.003-0.04Hz)HRV的方差,反映心脏产生的内在节律0.0630486710058344lf低频时(0.04-0.15Hz)HRV的方差,反映交感神经和副交感神经活动0.382688599514213hf高频时(0.15-40Hz)HRV的方差,反映迷走神经活动的变化。0.382688599514213lf_hf_ratio等于lf/hf0.834960967554602lfnu归一化低频功率0.226543781784714hfnu归一化高频功率0.161606953574597图5-1受试者Welch图5.2.5非线性特征提取Poincare散点图是对具有非线性关系的数据研究的主要方法之一[28],可以很好的描述信号在时域上的相关性。HRV信号便具有此特点,即上一阶段的频率等相关信息与下一阶段有关,因此,使用Poincare散点图可以表示RR间期的连续相关性,便于信号分析。对于HRV信号分析的散点图如图5-2所示。以66号受试者为例,提取到的非线性特征如表5-3所示。表5-3心电信号非线性特征非线性特征特征介绍特征值csi交感神经指数0.4741031299269731cvi迷走神经指数0.37271679544421583图5-2Poincare散点图6自动睡眠分期6.1机器学习方法介绍近年来,机器学习已经广泛的应用于各行各业,基于机器学习的睡眠分期算法也已经有所发展。机器学习就是让计算机像人一样也具备获取知识以及将知识运用到实际中的能力,通过训练数据构建所需模型,并将此模型用于实验数据的分析。根据学习方式的不同,机器学习主要分为三大类:(1)强化学习、监督学习、半监督学习以及非监督学习、(2)批量学习、在线学习(3)基于模型的学习,基于实例的学习其中,监督学习是最基本的机器学习方法。在睡眠分期中被广泛应用,其主要任务是将输入的生理信号特征通过模型训练能够得到准确的睡眠分期信息[6],本设计采用监督学习的方法进行睡眠分期。监督学习又可以分为:分类、回归、标注这三类,分类是指从输入的数据中学习一个分类模型,再利用这个分类模型对输入的样本数据进行输出的预测;标注是指为输入的观测序列提供一个标记序列或者状态序列;回归是用于分析两个变量之间存在的非线性关系。本设计属于监督学习中的分类问题,在进行睡眠分期时,将睡眠分别进行三分类、四分类、六分类的预测,属于多分类的问题,可以选用的分类模型及各自的特点如表6-1所示。表6-1常见的多分类模型优缺点模型名称优点缺点支持向量机利用内积核函数代替向高维空间的非线性映射对大规模训练样本难实施极限学习机学习速度快泛化能力强结果不稳定,表示非线性能力差随机森林能处理很高维度的数据(即很多特征的数据)在某些噪音较大的分类或回归问题上会过拟合决策树便于理解和解释,树的结构可视化对样本量的需求比较大梯度提升树用较少的时间便可得到一个准确率还不错的模型由于弱学习器之间存在依赖,无法支持并行6.1.1支持向量机支持向量机(SupportVectorMachine,SVM)属于监督学习中的处理分类问题常用的线性分类器[29-31]。其基本原理是:如图6-1所示,假设黑白两类数据点代表两类不同的数据D1与D2,对于L1来说,无法分开D1与D2;对于L2来说,虽然能够将D1与D2分开,但是L2距离D1的距离偏短,而距离D2距离偏长,这样会造成过拟合问题,即不一定能够很好的分开隐藏的点与验证数据集,在训练集上很够很好的分开,但是在验证集与测试集上分类不准确;对于L3来说,它不但能够很好的分开D1与D2,而且距离D1与D2最极端点的长度适中,这就是最佳决策边界。SVM的本质是尝试拟合两个类别之间最宽的间距,使得类别间的距离较大,则间距的中心上的点便是支持向量。它的目的便是寻找最大边距超平面(maximum-marginhyperplane,MMH)使得数据分类更加准确。图6-1支持向量机原理示意图在现实生活中,很少有数据是线性可分的,因此,对于绝大多数的分类问题,属于非线性问题,支持向量机便存在这样一个方法将线性不可分的数据进行分类,支持向量机通过核函数计算不同类别数据间的关系,随之将较低维度的数据映照到较高维度的数据,因而便可以找到一个超平面将数据有效的分割开来,常见的核函数如表6-2所示。其中,有研究成果指出,高斯核函数(radialbasisfunction,RBF)在非线性分类问题中相较于其他核函数的训练数据的准确率更高,因此,本设计在进行SVM睡眠分期的训练时,使用RBF。表6-2SVM常见的核函数名称解析式径向基函数核(RBFkernel)κ多项式核(polynomialkernel)κ拉普拉斯核(Laplaciankernel)κ6.1.2极限学习机极限学习机(ExtremeLearningMachine,ELM)是一种求解单隐层神经网络的算法,最早于2006年由黄广斌[32]提出,适用于求解本文所提出的分类问题。其基本原理:如图6.1.2所示,它的模型由输入层、隐藏层、输出层三层构成,每层之间是通过一些特征映射函数来实现连接的,输入层通过一些隐藏层的映射,可以得到不同的输出,这些输出可以用来完成特征学习、聚类、回归、分类等的功能,它最大的特点是从输入层到隐藏层的映射是个随即映射。ELM的主要优点是在保证精度结果的同时有更快的速度。图6-2极限学习机原理示意图6.2睡眠分期方法测试本设计中,分别对睡眠阶段进行了三分类、四分类、六分类的测试,各分类标准和对应的标签如表6-3所示。表6-3不同分期对应的标签三分类NREMREMWake标签123四分类LightSleepDeepSleepREMWake标签1234六分类Stage1Stage2Stage3Stage4REMWake标签123456具体实验步骤:在第五章将各个受试者心电信号特征提取完后,基于不同的HRV信号在不同的阶段各有差异这一原理,每位受试者在不同的时间段提取到的特征都可映射为睡眠的不同阶段,把其特征集合和对应的标签作为样本数据进行数据集划分[18],训练集(trainset)用来进行分类模型的训练;测试集(testset)则用来进行此模型的检验,将输入的特征集经过此模型分类到不同的睡眠阶段,本设计以7:3的比例进行数据集的划分,使用训练集分别在SVM和ELM的分类模型上进行训练,从而得到2种不同的分类模型,最后利用测试集在分类模型上进行分类。准确率则是通过命中的睡眠分期数目与原始分类数据之比得到的。对于每个睡眠分期,都分别对其使用了SVM的方法和ELM的方法进行睡眠分期的测试,使用SVM与ELM模型分类后的结果如表6-4与表6-5所示。表6-4SVM分类结果DataClasses346TrainingAcc(%)TestingAcc(%)TrainingAcc(%)TestingAcc(%)TrainingAcc(%)TestingAcc(%)slp01a92.89991.42967.05975.36247.64746.377slp01b92.09551.40292.09551.40284.98047.664slp02a86.23574.28684.61571.42981.52668.932slp02b91.57968.35491.57968.35487.89567.089slp0379.10868.90069.37158.85260.72943.269slp0479.44771.02874.75366.19771.99253.052slp1471.65748.58571.25748.58561.35544.076slp1673.97535.43772.13142.71865.03139.512slp3289.08772.77582.85168.58679.55667.368slp3788.77688.46288.77688.46285.71486.058slp4172.02952.36170.62050.43156.38728.448slp4579.84972.00068.79760.26861.09053.125slp4881.42673.45181.08673.33365.91844.444slp5974.84562.50071.11841.91263.04334.559slp6076.22066.98676.22066.98671.80561.058slp6179.01073.02365.81058.87955.22746.479slp6688.96169.46688.02669.23176.77447.287slp67x75.22964.44474.31264.44460.55051.111Average81.80166.93877.24962.52468.73451.662表6-5ELM分类结果DataClasses346TrainingAcc(%)TestingAcc(%)TrainingAcc(%)TestingAcc(%)TrainingAcc(%)TestingAcc(%)slp01a96.45091.42994.70671.01478.23559.420slp01b96.04759.81394.86259.81390.11957.944slp02a84.21171.42990.28371.42984.73967.961slp02b91.05373.41891.05375.94991.05374.684slp0381.13671.29269.77761.24460.52647.596slp0477.27371.02873.37367.13669.03455.399slp1497.00661.32196.00859.43463.74551.659slp1697.33653.88393.64851.94277.09648.293slp3290.20079.58181.29273.29880.00074.211slp3796.93989.90497.14389.90494.28688.462slp4171.11555.36571.89851.72493.97835.345slp4585.12274.22271.80561.60767.66956.250slp4884.80380.97386.51780.88970.22554.667slp5989.44172.05995.96350.00092.23638.971slp6083.13071.77082.92772.24976.47166.827slp6180.19876.27964.82260.74862.32749.296slp6691.23474.04689.64474.61599.35555.039slp67x76.14780.00096.33080.00060.55062.222Average87.15872.65685.66967.38978.42558.014表6-6SVM与ELM对比ModelclassesAverage(%)346ELM72.65667.38958.01466.019SVM66.93862.52451.66260.375由表6-6可知,在对睡眠进行不同类型的分期时,对于测试集,支持向量机的平均准确率为60.375%,极限学习机的准确率为66.019%,相对而言,极限学习机的方法比极限学习机的方法具有更高的准确率。图6-3SVM分类准确率折线图图6-4ELM分类准确率折线图图6-5SVM与ELM分类准确率对比7总结与展望7.1总结睡眠状态下,心电信号中的心率变异性与自主神经系统存在密切关系,且睡眠受自主神经系统的管制,而睡眠分期是剖析睡眠状况和评估睡眠质量的重要措施之一。本文利用心率变异性的特征来对睡眠阶段进行预测。本设计的主要工作如下:1.对数据库的处理。将原始数据库所包含的冗余信息进行剔除,对本设计所需要的关键信息进行提取并更新原始数据库。2.心电信号的预处理。针对在心电信号测量过程中所产生的噪声,设计了高通滤波器及中值滤波器的方法对其加以消除。2.心电信号QRS波群的检测。利用GQRS算法进行R波定位,并且提取出RR间期以及计算出心率变异性。3.心电信号特征提取。对所获取到的心率变异性信号分别进行各种类型的特征提取。4.睡眠自动分期。利用支持向量机与极限学习机的方法对睡眠进行了分期的比较。结果表明,在对睡眠进行不同类型的分期时,支持向量机与极限学习机都有不错的效果,在测试集上,支持向量机的平均准确率为60.375%,极限学习机的准确率为66.019%,极限学习机的方法比支持向量机的方法在本设计中有更高的准确率。7.2展望从实验结果来看,本设计的准确率并不高,两种设计方法都存在一定的缺陷,并且随着睡眠阶段的精细化,准确率呈下降趋势。经过与指导老师进一步的探讨之后,认为本设计可以从以下几点来进行优化:(1)原多导睡眠数据库可能存在某些信号值的缺失,本设计没有对这些缺失的信号值进行处理。后续可以对这些缺失的信息进行填补或删除。(2)在对HRV特征提取完后没有对异常的特征进行剔除。因此,在之后的研究中需要设定特征值的判别标准以剔除不合适的特征值。(3)机器学习模型的参数是根据以往学者得出来的经验进行调优的,也许对本设计不是最优参数,后续可以在大量实验的基础上进行参数的调节来获得更高的准确率。

参考文献[1]AserinskyE,KleitmanN.RegularlyOccurringPeriodsofEyeMotility,andConcomitantPhenomena,DuringSleep1[J].TheJournalofNeuropsychiatryandClinicalNeurosciences,2003,15(4):454-455.[2]WolpertEA.Amanualofstandardizedterminology,techniquesandscoringsystemforsleepstagesofhumansubjects[J].Electroencephalography&ClinicalNeurophysiology,1969,26(2):644-644.[3]BerryRB,BudhirajaR,GottliebDJ,etal.Rulesforscoringrespiratoryeventsinsleep[J].JournalofClinicalSleepMedicineJcsmOfficialPublicationoftheAmericanAcademyofSleepMedicine,2012,8(5):597-619.[4]浙江柔灵科技有限公司.应用前额叶单通道脑电信号对睡眠分期的机器学习算法:CN202110901251.7[P].2021-11-02.[5]李坚年.基于脑电信号的睡眠分期研究[J].工业控制计算机,2021,34(03):103-104.[6]王亚露.基于支持向量机分类器的睡眠分期算法研究[D].浙江:浙江大学,2019.[7]林少倩.基于脑电信号的睡眠自动分期研究[D].浙江:浙江工业大学,2020.[8]王怡.睡眠信号自动分期的深度学习算法研究[D].重庆:重庆邮电大学,2020.[9]黄文汉,张伟,胡立刚,等.基于心电与呼吸信号的睡眠分期算法研究[J].智能计算机与应用,2018,8(1):6.[10]张兴华.基于心电信号和深度神经网络的睡眠分期研究[D].天津:天津工业大学,2018.[11]许良.基于心率呼吸率的实时睡眠分期算法研究[D].四川:电子科技大学,2018.[12]YucelbasS,YucelbasC,TezelG,etal.AutomaticsleepstagingbasedonSVD,VMD,HHTandmorphologicalfeaturesofsingle-leadECGsignal[J].ExpertSystemswithApplications,2018,102(7):193-206.[13]UtomoOK,SuranthaN,IsaSM,etal.AutomaticSleepStageClassificationusingWeightedELMandPSOonImbalancedDatafromSingleLeadECG[J].ProcediaComputerScience,2019,157:321-328.[14]SunH,WolfgangG,EzhilP,etal.Slee

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论