




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学信息处理课群综合训练与设计说明书目录摘要1abstract21 ica 的基本原理及特点31.1 盲分离数学模型31.2 ica 算法描述41.3 fica算法42 fica设计思想53 实验仿真结果记录63.1 仿真时域波形及频谱63.1.1 原始信号63.1.2 混合信号93.1.3 分离信号123.2 仿真所用的源程序154 实验结果分析245 小结与体会256 参考文献26摘要 语音信号的盲源就是在源信号和源信号如何混合都未知的情况下,从观测到的混合信号中恢复出未知源信号。语音信号盲分离技术被成功地用在了通信、医学、图像和语音信号处理等领域。我们所要研究的混合语音信号盲分离问题就是用麦克风阵列或多个麦克风阵列来模仿人的耳朵,采集得到相互干扰的混叠语音信号,然后通过分离算法将混叠的语音信号相互分离开来,提取我们所感兴趣的信号。举个例子就是在多人同时说话的嘈杂环境下,我们能够辨识感兴趣人的说话声的能力。然后把它分辨出来。 abstract the speech signal blind source is in the source signal and the source signal how to mix all unknown, from observations of mixed signal in recovering the unknown source signal. blind separation technology of speech signal was successfully used in the communication, medical, image and voice signal processing, etc. we have to study mix of speech signal is blind source separation with a microphone array or more microphone array to imitate human ears, acquisition get each other interference aliasing speech signal, and then through the separation algorithm will aliasing voice signal mutual separated, extraction we are interested in signal. for example is more than in noisy environment of speak at the same time, we can identify interested in the ability of the human voice. and then take it apart.1 ica 的基本原理及特点1.1 盲分离数学模型盲信号分离是指在没有任何先验知识的条件下,仅根据源信号之间的统计独立特性和由传感器输出的观测信号,把源信号分离出来。独立分量分析正是盲信号分离的有效方法之一。我们将该问题表述成图一所示的线性模型图一 盲信号分离的数学模该线性模型可以用下式表示: x = as.(公式一) u = wx.(公式二) 源信号s=(s1,s2.sn)和混合矩阵a都是未知的,w为待求分离矩阵,经过分离矩阵w 的作用,最终得到分离后的输出矢量u=(u1,u2.un);观测信号x=(x1,x2.xn)已知。盲信号分离的最终目的是为了寻找分离矩阵w,使输出信号u尽可能地逼近源信号s。以两个信号源为例用恒等式表示: x1(t)= h11s(t) + h12j(t).(公式三) x2(t)= h21s(t) + h22j(t).(公式四) y(t)= w1x1(t) + w2x2(t).(公式五)其中x1(t) ,x2 (t) 表示两个未知混合信号,s(t) ,j(t)表示收集到的两个信号源,h11 , h12 ,h21 ,h22表示混合矩阵,不同个数的信号源输入对应不同阶数的矩阵。而y(t) 则表示最后解混后的声音,w1 ,w2 表示分离矩阵,我们得主要任务选取合适的分离矩阵,使得最后的输出y(t)最大限度的接近s(t) 或者j(t),亦既是我们所需要挺清楚的没有其它干扰的信号声源。1.2 ica 算法描述 如果我们依据上面提出的模型,对分离过程和分离结果没有任何限定和约束,那么显然解并不是唯一的;而我们却希望输出尽量接近于所期望的结果。独立分量分析(ica)为这类问题提供了新的解决思路。ica的基本思想是假设源信号彼此相互独立,寻找分离矩阵的目的是使输出结果的各分量尽可能地相互独立,我们可以把它看作是一个最优化问题,目标函数用来度量分离结果的独立性。 从处理技术上看,依据独立性作分解势必涉及概率密度函数和高阶统计量;而且处理过程中常常要引入非线性环节。从这一意义上看,ica算法思想优于常用的只建立在二阶统计量上的线性处理技术。进行ica分解的基本原则可以简单地概括为两条:(1)非线性去相关:求分离矩阵使其任意两输出不但本身不相关,而且经非线性变换后的分量也不相关。这里的目标函数的选择对分离效果至关重要。(2)使输出尽可能非高斯化:在输出某分量的方差一定的条件下,将输入各分量作线 性组合。优化选择各权重,使输出分量尽可能非高斯化。输出的非高斯性的每一个局部最大值即给出一个独立分量。1.3 fica算法与普通 ica 相比较而言,fica 具有更快的收敛速度,而且还省去了选择步长常数的麻烦,迭代次数也相应减少。尤其是在处理分离复杂多变的语音信号时,优势非常明显。fica对观测信号x进行预处理,包括两部分:去均值化和预白化,即通过对观测信号进 行线性变换,得到一个一个新的白噪声化矢量z,使其各个分量不关联。这样可以大大简化ica算法。所以此次课程设计我采用fica算对三路语音信号进行盲处理。2 fica设计思想 我们知道语音信号是非平稳的信号,但是它在团时间内是具有稳定性的,我根据根据盲信号分离原理,用matlab采集三路语音信号,分别为music.wav,dragen.wav以及man.wav。选择合适的混合矩阵生成三路混合信号。利用盲信号分离算法中的独立成分分析ica进行语音盲信号的分离,将源信号分别从混合信号中分离出来。 按照盲分离模型fica具体步骤如下:(1)将三段声音文件保存为“.wav”格式,分别以列向量形式读入,记录时域波形以及频谱图。(2)对源信号进行预处理,方差为1,均值为0,归一化处理后得到归一化频谱。(3)根据x = as,混合矩阵a选取二阶随机矩阵,a=rand(2),经a作用后,生成混合语音序列x。(4)对x进行方差1,均值为0的操作,得到归一化频谱;然后进行预白化处理,得到白化后的信号。3 实验仿真结果记录3.1 仿真时域波形及频谱3.1.1 原始信号 图二 man.wav原始时域波形图图三 man.wav原始频谱图图四 dragen.wav原始时域波形图图五 dragen.mav原始频谱图图六 music.wav原始时域波形图图七 music.wav原始频谱图3.1.2 混合信号图八 混合语音信号man时域波形图图九 混合语音信号man频谱图图十 混合语音信号dragen时域波形图图十一 混合语音信号dragen频谱图图十二 混合语音信号music时域波形图 图十三 混合语音信号music频谱图3.1.3 分离信号图十四 分离语音信号man时域波形图图十五 分离语音信号man频谱图图十六 分离语音信号dragen时域波形图图十七 分离语音信号dragen频谱图图十八 分离语音信号music时域波形图图十九 分离语音信号music频谱图3.2 仿真所用的源程序% data lengthn = 400000; % read data from wave files1= wavread(c:usersadministratordesktop临时37724126fasticafast icamusic.wav); s1=s1(1:n);s2=wavread(c:usersadministratordesktop临时37724126fasticafast icaman.wav); s2=s2(1:n); s3=wavread(c:usersadministratordesktop临时37724126fasticafast icadragen.wav); s3=s3(1:n); s=s1; s2; s3; % mix the dataa=1 4 53.4 2.4 26 2 3.5;x = a * s; %recover s1, s2 & s3 from x len = size(x, 2); % number of data samplesic_num = size(x, 1); % number of ics % center the data with 0 mean for cnt = 1: ic_numx(cnt, :) = x(cnt, :) - mean(x(cnt, :);end % whiten the data rx = x*x/len;ux sx = eig(rx); % assert that ux*sx*ux-rx = 0 vx = inv(sx).0.5*ux; % vx is the whiten matrix z = vx * x; % z is whiten data% assert that z*z/len = i% recover ics w = eye(ic_num);w_old = w; eps = 1.0e-5;flag = 1;while (flag = 1)for (cnt = 1: ic_num)y = w(:, cnt)*z;gy = -exp(-y.2/2);gy = y.*(-gy);gy1 = (1-y.2).*(-gy); e1 = z*gy/len;e2 = mean(gy1);w(:, cnt) = e1-e2*w(:, cnt);endwt = w;uw sw = svd(wt*wt);wt = inv(uw * sqrt(sw) * wt;w = wt;change=(sum(sum(abs(w*w_old) - eye(ic_num).2)/ic_num);if ( change eps)flag = 0;endw_old = w; enddisplay(w) % recover s s_n = w*z; % play all the music %play original sound 1x1,fs,bits=wavread(c:usersadministratordesktop临时37724126fasticafast icaman.wav); %读取语音信号的数据,赋给变量x1disp(press a key to hear original sound 1); pause;sound(x1,fs); %播放语音信号 %show time domain waveform figure and spectrum image 1y1=fft(x1,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x1) %做原始语音信号的时域图形title(原始语音信号man波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图 plot(f,abs(y1(1:512);title(原始语音信号man频谱)xlabel(hz);ylabel(幅值); %play original sound 2x2,fs,bits=wavread(c:usersadministratordesktop临时37724126fasticafast icadragen.wav); %读取语音信号的数据,赋给变量x1disp(press a key to hear original sound 2); pause;sound(x2,fs); %播放语音信号%show time domain waveform figure and spectrum image 2y2=fft(x2,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x2) %做原始语音信号的时域图形title(原始语音信号dragen波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y2(1:512);title(原始语音信号dragen频谱)xlabel(hz);ylabel(幅值); %play original sound 3x3,fs,bits=wavread(c:usersadministratordesktop临时37724126fasticafast icamusic.wav); %读取语音信号的数据,赋给变量x1disp(press a key to hear original sound 3); pause;sound(x3,fs); %播放语音信号%show time domain waveform figure and spectrum image 3y3=fft(x3,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x3) %做原始语音信号的时域图形title(原始语音信号music波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y3(1:512);title(原始语音信号music频谱)xlabel(hz);ylabel(幅值); % play mix sound 1 x(1,:)=x(1,:)/(max(s_n(1,:)-min(x(1,:)*2; disp(press a key to hear mix sound 1); pause;wavplay(x(1, :), 44100);%show time domain waveform figure and spectrum image 4 y4=fft(x(1,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x(1,:) %做原始语音信号的时域图形title(混合语音信号man波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y4(1:512);title(混合语音信号man频谱)xlabel(hz);ylabel(幅值); % play mix sound 2x(2,:)=x(2,:)/(max(x(2,:)-min(x(2,:)*2;disp(press a key to hear mix sound 2); pause;wavplay(x(2, :),44100); %show time domain waveform figure and spectrum image 5y5=fft(x(2,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x(2,:) %做原始语音信号的时域图形title(混合语音信号dragen波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y5(1:512);title(混合语音信号dragen频谱)xlabel(hz);ylabel(幅值); % play mix sound 3x(3,:)=x(3,:)/(max(x(3,:)-min(x(3,:)*2;disp(press a key to hear mix sound 3);pause;wavplay(x(3, :),44100); %show time domain waveform figure and spectrum image 6y6=fft(x1,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x(3,:) %做原始语音信号的时域图形title(混合语音信号music波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y6(1:512);title(混合语音信号music频谱)xlabel(hz);ylabel(幅值);% play sound 1s_n(1,:)=s_n(1,:)-mean(s_n(1,:);s_n(1,:)=s_n(1,:)/(max(s_n(1,:)-min(s_n(1,:)*2; disp(press a key to hear sound 1);pause;wavplay(s_n(1, :), 44100); %show time domain waveform figure and spectrum image 7y7=fft(s_n(1,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(s_n(1,:) %做原始语音信号的时域图形title(分离语音信号man波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y7(1:512);title(分离语音信号man频谱)xlabel(hz);ylabel(幅值); % play sound 2s_n(2,:)=s_n(2,:)-mean(s_n(2,:);s_n(2,:)=s_n(2,:)/(max(s_n(2,:)-min(s_n(2,:)*2; disp(press a key to hear sound 2);pause;wavplay(s_n(2, :), 44100); %show time domain waveform figure and spectrum image 8y8=fft(s_n(2,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(s_n(2,:) %做原始语音信号的时域图形title(分离语音信号gragen波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y8(1:512);title(分离语音信号dragen频谱)xlabel(hz);ylabel(幅值); % play sound 3s_n(3,:)=s_n(3,:)-mean(s_n(3,:); s_n(3,:)=s_n(3,:)/(max(s_n(3,:)-min(s_n(3,:)*2; disp(press a key to hear sound 3);pause;wavplay(s_n(3, :), 44100); %show time domain waveform figure and spectrum image 9y9=fft(s_n(3,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(s_n(3,:) %做原始语音信号的时域图形title(分离语音信号music波形);xlabel(时间 n);ylabel(幅值 n);figure(2) %做原始语音信号的fft频谱图plot(f,abs(y9(1:512);title(分离语音信号music频谱)xlabel(hz);ylabel(幅值); 4 实验结果分析由实验最终结果听到的声音以及波形图、频谱图的结果可以看出,最终分离出来的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 玉柴职业技术学院《微积分上》2023-2024学年第一学期期末试卷
- 天津医科大学《三维动画制作》2023-2024学年第二学期期末试卷
- 焦作新材料职业学院《历史教学理论与教学设计》2023-2024学年第二学期期末试卷
- 宿州学院《马克思主义经典著作》2023-2024学年第一学期期末试卷
- 武汉电力职业技术学院《数据通信技术实验》2023-2024学年第二学期期末试卷
- 临汾职业技术学院《英语视听说实验教学》2023-2024学年第二学期期末试卷
- 吕梁职业技术学院《临床精神病学见习》2023-2024学年第二学期期末试卷
- 闽江学院《数据挖掘》2023-2024学年第二学期期末试卷
- 新疆阿克苏沙雅县2025届初三下学期检测试题卷(一)物理试题含解析
- 山东省济南市市中区2025届初三下学期第十二次重点考试生物试题含解析
- 特种设备作业人员考试机构规范管理办法(含附件附表 )
- 环境有害物质管理办法
- 基于PLC的温室大棚控制系统设计
- 动物免疫学第五章细胞因子
- 新版防雷检测职业技能竞赛综合知识试题库(精简500题)
- 2023年新华人寿保险股份有限公司招聘笔试题库及答案解析
- GB/T 3452.1-2005液压气动用O形橡胶密封圈第1部分:尺寸系列及公差
- GB/T 23641-2018电气用纤维增强不饱和聚酯模塑料(SMC/BMC)
- 新版《FMEA(第五版)》学习笔记(完整版)
- 装配式建筑施工组织设计(修改)
- 《高等教育心理学》《高等教育学》样题
评论
0/150
提交评论