matlab语音信号盲分离.doc

上传人：扣*** IP属地：宁夏上传时间：2019-12-23 格式：DOC 页数：28 大小：177.50KB 积分：15 举报 版权申诉

已阅读5页，还剩23页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

武汉理工大学信息处理课群综合训练与设计说明书目录摘要1abstract21 ica 的基本原理及特点31.1 盲分离数学模型31.2 ica 算法描述41.3 fica算法42 fica设计思想53 实验仿真结果记录63.1 仿真时域波形及频谱63.1.1 原始信号63.1.2 混合信号93.1.3 分离信号123.2 仿真所用的源程序154 实验结果分析245 小结与体会256 参考文献26摘要语音信号的盲源就是在源信号和源信号如何混合都未知的情况下,从观测到的混合信号中恢复出未知源信号。语音信号盲分离技术被成功地用在了通信、医学、图像和语音信号处理等领域。我们所要研究的混合语音信号盲分离问题就是用麦克风阵列或多个麦克风阵列来模仿人的耳朵,采集得到相互干扰的混叠语音信号,然后通过分离算法将混叠的语音信号相互分离开来,提取我们所感兴趣的信号。举个例子就是在多人同时说话的嘈杂环境下,我们能够辨识感兴趣人的说话声的能力。然后把它分辨出来。 abstract the speech signal blind source is in the source signal and the source signal how to mix all unknown, from observations of mixed signal in recovering the unknown source signal. blind separation technology of speech signal was successfully used in the communication, medical, image and voice signal processing, etc. we have to study mix of speech signal is blind source separation with a microphone array or more microphone array to imitate human ears, acquisition get each other interference aliasing speech signal, and then through the separation algorithm will aliasing voice signal mutual separated, extraction we are interested in signal. for example is more than in noisy environment of speak at the same time, we can identify interested in the ability of the human voice. and then take it apart.1 ica 的基本原理及特点1.1 盲分离数学模型盲信号分离是指在没有任何先验知识的条件下，仅根据源信号之间的统计独立特性和由传感器输出的观测信号，把源信号分离出来。独立分量分析正是盲信号分离的有效方法之一。我们将该问题表述成图一所示的线性模型图一盲信号分离的数学模该线性模型可以用下式表示： x = as.(公式一) u = wx.(公式二) 源信号s=(s1,s2.sn)和混合矩阵a都是未知的，w为待求分离矩阵，经过分离矩阵w 的作用，最终得到分离后的输出矢量u=(u1,u2.un);观测信号x=(x1,x2.xn)已知。盲信号分离的最终目的是为了寻找分离矩阵w，使输出信号u尽可能地逼近源信号s。以两个信号源为例用恒等式表示： x1(t)= h11s(t) + h12j(t).(公式三) x2(t)= h21s(t) + h22j(t).（公式四） y(t)= w1x1(t) + w2x2(t).（公式五）其中x1(t) ，x2 (t) 表示两个未知混合信号，s(t) ，j(t)表示收集到的两个信号源，h11 ， h12 ，h21 ，h22表示混合矩阵，不同个数的信号源输入对应不同阶数的矩阵。而y(t) 则表示最后解混后的声音，w1 ，w2 表示分离矩阵，我们得主要任务选取合适的分离矩阵，使得最后的输出y(t)最大限度的接近s(t) 或者j(t)，亦既是我们所需要挺清楚的没有其它干扰的信号声源。1.2 ica 算法描述如果我们依据上面提出的模型，对分离过程和分离结果没有任何限定和约束，那么显然解并不是唯一的；而我们却希望输出尽量接近于所期望的结果。独立分量分析(ica)为这类问题提供了新的解决思路。ica的基本思想是假设源信号彼此相互独立，寻找分离矩阵的目的是使输出结果的各分量尽可能地相互独立，我们可以把它看作是一个最优化问题，目标函数用来度量分离结果的独立性。从处理技术上看，依据独立性作分解势必涉及概率密度函数和高阶统计量；而且处理过程中常常要引入非线性环节。从这一意义上看，ica算法思想优于常用的只建立在二阶统计量上的线性处理技术。进行ica分解的基本原则可以简单地概括为两条：（1）非线性去相关：求分离矩阵使其任意两输出不但本身不相关，而且经非线性变换后的分量也不相关。这里的目标函数的选择对分离效果至关重要。（2）使输出尽可能非高斯化：在输出某分量的方差一定的条件下，将输入各分量作线性组合。优化选择各权重，使输出分量尽可能非高斯化。输出的非高斯性的每一个局部最大值即给出一个独立分量。1.3 fica算法与普通 ica 相比较而言，fica 具有更快的收敛速度，而且还省去了选择步长常数的麻烦，迭代次数也相应减少。尤其是在处理分离复杂多变的语音信号时，优势非常明显。fica对观测信号x进行预处理，包括两部分:去均值化和预白化，即通过对观测信号进行线性变换，得到一个一个新的白噪声化矢量z，使其各个分量不关联。这样可以大大简化ica算法。所以此次课程设计我采用fica算对三路语音信号进行盲处理。2 fica设计思想我们知道语音信号是非平稳的信号，但是它在团时间内是具有稳定性的，我根据根据盲信号分离原理，用matlab采集三路语音信号，分别为music.wav,dragen.wav以及man.wav。选择合适的混合矩阵生成三路混合信号。利用盲信号分离算法中的独立成分分析ica进行语音盲信号的分离，将源信号分别从混合信号中分离出来。按照盲分离模型fica具体步骤如下：（1）将三段声音文件保存为“.wav”格式，分别以列向量形式读入，记录时域波形以及频谱图。（2）对源信号进行预处理，方差为1，均值为0，归一化处理后得到归一化频谱。（3）根据x = as，混合矩阵a选取二阶随机矩阵，a=rand(2),经a作用后，生成混合语音序列x。（4）对x进行方差1，均值为0的操作，得到归一化频谱；然后进行预白化处理，得到白化后的信号。3 实验仿真结果记录3.1 仿真时域波形及频谱3.1.1 原始信号图二 man.wav原始时域波形图图三 man.wav原始频谱图图四 dragen.wav原始时域波形图图五 dragen.mav原始频谱图图六 music.wav原始时域波形图图七 music.wav原始频谱图3.1.2 混合信号图八混合语音信号man时域波形图图九混合语音信号man频谱图图十混合语音信号dragen时域波形图图十一混合语音信号dragen频谱图图十二混合语音信号music时域波形图图十三混合语音信号music频谱图3.1.3 分离信号图十四分离语音信号man时域波形图图十五分离语音信号man频谱图图十六分离语音信号dragen时域波形图图十七分离语音信号dragen频谱图图十八分离语音信号music时域波形图图十九分离语音信号music频谱图3.2 仿真所用的源程序% data lengthn = 400000; % read data from wave files1= wavread(c:usersadministratordesktop临时37724126fasticafast icamusic.wav); s1=s1(1:n);s2=wavread(c:usersadministratordesktop临时37724126fasticafast icaman.wav); s2=s2(1:n); s3=wavread(c:usersadministratordesktop临时37724126fasticafast icadragen.wav); s3=s3(1:n); s=s1; s2; s3; % mix the dataa=1 4 53.4 2.4 26 2 3.5;x = a * s; %recover s1, s2 & s3 from x len = size(x, 2); % number of data samplesic_num = size(x, 1); % number of ics % center the data with 0 mean for cnt = 1: ic_numx(cnt, :) = x(cnt, :) - mean(x(cnt, :);end % whiten the data rx = x*x/len;ux sx = eig(rx); % assert that ux*sx*ux-rx = 0 vx = inv(sx).0.5*ux; % vx is the whiten matrix z = vx * x; % z is whiten data% assert that z*z/len = i% recover ics w = eye(ic_num);w_old = w; eps = 1.0e-5;flag = 1;while (flag = 1)for (cnt = 1: ic_num)y = w(:, cnt)*z;gy = -exp(-y.2/2);gy = y.*(-gy);gy1 = (1-y.2).*(-gy); e1 = z*gy/len;e2 = mean(gy1);w(:, cnt) = e1-e2*w(:, cnt);endwt = w;uw sw = svd(wt*wt);wt = inv(uw * sqrt(sw) * wt;w = wt;change=(sum(sum(abs(w*w_old) - eye(ic_num).2)/ic_num);if ( change eps)flag = 0;endw_old = w; enddisplay(w) % recover s s_n = w*z; % play all the music %play original sound 1x1,fs,bits=wavread(c:usersadministratordesktop临时37724126fasticafast icaman.wav); %读取语音信号的数据，赋给变量x1disp(press a key to hear original sound 1); pause;sound(x1,fs); %播放语音信号 %show time domain waveform figure and spectrum image 1y1=fft(x1,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x1) %做原始语音信号的时域图形title(原始语音信号man波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图 plot(f,abs(y1(1:512);title(原始语音信号man频谱)xlabel(hz);ylabel(幅值); %play original sound 2x2,fs,bits=wavread(c:usersadministratordesktop临时37724126fasticafast icadragen.wav); %读取语音信号的数据，赋给变量x1disp(press a key to hear original sound 2); pause;sound(x2,fs); %播放语音信号%show time domain waveform figure and spectrum image 2y2=fft(x2,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x2) %做原始语音信号的时域图形title(原始语音信号dragen波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y2(1:512);title(原始语音信号dragen频谱)xlabel(hz);ylabel(幅值); %play original sound 3x3,fs,bits=wavread(c:usersadministratordesktop临时37724126fasticafast icamusic.wav); %读取语音信号的数据，赋给变量x1disp(press a key to hear original sound 3); pause;sound(x3,fs); %播放语音信号%show time domain waveform figure and spectrum image 3y3=fft(x3,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x3) %做原始语音信号的时域图形title(原始语音信号music波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y3(1:512);title(原始语音信号music频谱)xlabel(hz);ylabel(幅值); % play mix sound 1 x(1,:)=x(1,:)/(max(s_n(1,:)-min(x(1,:)*2; disp(press a key to hear mix sound 1); pause;wavplay(x(1, :), 44100);%show time domain waveform figure and spectrum image 4 y4=fft(x(1,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x(1,:) %做原始语音信号的时域图形title(混合语音信号man波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y4(1:512);title(混合语音信号man频谱)xlabel(hz);ylabel(幅值); % play mix sound 2x(2,:)=x(2,:)/(max(x(2,:)-min(x(2,:)*2;disp(press a key to hear mix sound 2); pause;wavplay(x(2, :),44100); %show time domain waveform figure and spectrum image 5y5=fft(x(2,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x(2,:) %做原始语音信号的时域图形title(混合语音信号dragen波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y5(1:512);title(混合语音信号dragen频谱)xlabel(hz);ylabel(幅值); % play mix sound 3x(3,:)=x(3,:)/(max(x(3,:)-min(x(3,:)*2;disp(press a key to hear mix sound 3);pause;wavplay(x(3, :),44100); %show time domain waveform figure and spectrum image 6y6=fft(x1,1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(x(3,:) %做原始语音信号的时域图形title(混合语音信号music波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y6(1:512);title(混合语音信号music频谱)xlabel(hz);ylabel(幅值);% play sound 1s_n(1,:)=s_n(1,:)-mean(s_n(1,:);s_n(1,:)=s_n(1,:)/(max(s_n(1,:)-min(s_n(1,:)*2; disp(press a key to hear sound 1);pause;wavplay(s_n(1, :), 44100); %show time domain waveform figure and spectrum image 7y7=fft(s_n(1,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(s_n(1,:) %做原始语音信号的时域图形title(分离语音信号man波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y7(1:512);title(分离语音信号man频谱)xlabel(hz);ylabel(幅值); % play sound 2s_n(2,:)=s_n(2,:)-mean(s_n(2,:);s_n(2,:)=s_n(2,:)/(max(s_n(2,:)-min(s_n(2,:)*2; disp(press a key to hear sound 2);pause;wavplay(s_n(2, :), 44100); %show time domain waveform figure and spectrum image 8y8=fft(s_n(2,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(s_n(2,:) %做原始语音信号的时域图形title(分离语音信号gragen波形);xlabel(时间 n);ylabel(幅值 n);figure(2)%做原始语音信号的fft频谱图plot(f,abs(y8(1:512);title(分离语音信号dragen频谱)xlabel(hz);ylabel(幅值); % play sound 3s_n(3,:)=s_n(3,:)-mean(s_n(3,:); s_n(3,:)=s_n(3,:)/(max(s_n(3,:)-min(s_n(3,:)*2; disp(press a key to hear sound 3);pause;wavplay(s_n(3, :), 44100); %show time domain waveform figure and spectrum image 9y9=fft(s_n(3,:),1024); %对信号做1024点fft变换f=fs*(0:511)/1024;figure(1)plot(s_n(3,:) %做原始语音信号的时域图形title(分离语音信号music波形);xlabel(时间 n);ylabel(幅值 n);figure(2) %做原始语音信号的fft频谱图plot(f,abs(y9(1:512);title(分离语音信号music频谱)xlabel(hz);ylabel(幅值); 4 实验结果分析由实验最终结果听到的声音以及波形图、频谱图的结果可以看出，最终分离出来的

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

matlab语音信号盲分离.doc

文档简介

温馨提示

最新文档

评论

matlab语音信号盲分离.doc

文档简介

温馨提示

最新文档

评论

相关文档