中南大学-电信专业-专业专题-研究方向介绍课件_第1页
中南大学-电信专业-专业专题-研究方向介绍课件_第2页
中南大学-电信专业-专业专题-研究方向介绍课件_第3页
中南大学-电信专业-专业专题-研究方向介绍课件_第4页
中南大学-电信专业-专业专题-研究方向介绍课件_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2013年9月电子信息处理技术的研究陈明义中南大学信息科学与工程学院电子信息工程系2013年9月电子信息处理技术的研究陈明义中南大学信息科学与1研究方向一:语音信号处理的研究研究方向二:视音频信号处理的研究研究方向三:电路综合设计技术的研究研究方向研究方向一:语音信号处理的研究研究方向2研究方向一:语音信号处理的研究语音信号处理语音评估语音识别语音编码语音合成语音通信平台语音增强研究方向一:语音信号处理的研究语音信号处理语音评估语音识别语31、变阶线性预测编解码模型的研究一、语音编码理论的研究冲激串发生器白噪声发生器变阶自适应线性预测滤波器H(z)声道参数数字样本语音S(n)G清音浊音1、变阶线性预测编解码模型的研究一、语音编码理论的研究冲激串42、CA-CELP语音编码器的研究

它将信道最优矢量量化技术(COVQ)与LBG算法相结合,针对不同的信道噪声训练出与该信道状态相匹配的码书,使编码器对于信道噪声有较强的顽健性。

2、CA-CELP语音编码器的研究它将信道最优矢53、SC-VR-CELP语音编解器研究研究涉及语音激活检测技术、语音帧分类、速率判决、线性预测、矢量量化、自适应码本搜索和固定码本搜索等关键技术。

3、SC-VR-CELP语音编解器研究研究涉及语音激活检测技61、特定说话人识别二、语音识别技术及其方法研究识别结果测试训练输入语音预处理特征提取距离匹配判决阈值用户特征空间{Code,}提出了基于VQ的说话人确认阈值的设计方法

1、特定说话人识别二、语音识别技术及其方法研究识别结果测试训72、孤立词语音识别技术的研究包括前端预处理技术:带噪声的端点检测算法和MEL频率倒谱系数特征参数提取算法,提出了整体路径约束(DTW)算法(ADTW),其能有效的提高识别率并有极好的鲁棒性。识别结果训练识别输入语音预处理特征提取模板库专家知识测度识别测度识别

参考模板2、孤立词语音识别技术的研究包括前端预处理技术:带噪声的端点8波形合成法参数合成法规则合成法三、语音合成技术研究波形合成法三、语音合成技术研究9语音情感分析语音情感合成语音情感识别语音情感分离四、情感语音技术的研究语音情感分析四、情感语音技术的研究10主观评估:MOS分,时域,频域,语谱图客观评估:MNB2,E-MODL,PESQ五、语音质量评估方法研究主观评估:MOS分,时域,频域,语谱图五、语音质量评估方法研11研究方向二:视音频信号处理技术的研究视音频信号处理数字音频嵌入与解嵌视频信号数字化音频信号数字化数字音频自动增益控制视音频信号的压缩与传输数字台标、字幕研究方向二:视音频信号处理技术的研究视音频信号处理数字音频嵌12对视音频A/D、D/A转换技术的研究,成功地开发了模拟视频数字化系统,设计了一套用于实现演播室中数字视频信号转换为模拟视频信号的系统。设计了一种利用FPGA接口SDRAM视频存储方案。完成带帧同步的数字视频系统的开发。一、视音频A/D、D/A转换技术的研究对视音频A/D、D/A转换技术的研究,成功地开发了模拟视频数13在上变换中提出运用双线性插值算法进行固定位置固定系数加权运算,实现图像放大;利用2个RAM循环交替存储8行,分别再用两个2048深度的FIFO缓存,进行乒乓操作读出相应数据。设计完成的系统可对模拟视频进行高清数字化,HDMI信号的转换,完成SDTV转HDTV的上变换功能。在高清数字视频下变换系统的研究中,针对HD-SDI接收中数据字校准实现,采用软件模块实现高清并行分量视频信号恢复。视频分辨率的下变换的实现采用像素均匀分布的循环丢弃法。二、数字电视格式转换技术的研究在上变换中提出运用双线性插值算法进行固定位置固定系数加权运算14提出了一种采用多参数融合带有反馈判决机制的音频AGC算法,可进行实时数字音频信号处理并具有一定噪音抑制能力。并且充分发挥了FPGA的优点,嵌入NiosII处理器,灵活利用Avalon总线和各功能模块实现了SOPC系统,大大提高了系统的集成度。三、数字音频AGC的研究提出了一种采用多参数融合带有反馈判决机制的音频AGC算法,可15设计了基于FPGA的数字音频嵌入和解嵌方法,即用FPGA的编程模块成功取代专业音频加解嵌芯片与专用音频接口芯片。设计了音频包缓存的方案,解决了音频数据包之间存在空隙导致加嵌出错的问题。针对数字音频接口功能,将I2S数字音频接口与AES3/EBU数字音频接口集成到了FPGA内部,采用过采样技术,能有效避免数字接口抖动对恢复出的AES3/EBU数字音频同步时钟的影响。四、数字音频加嵌与解嵌技术的研究设计了基于FPGA的数字音频嵌入和解嵌方法,即用FPGA的编16设计了台标数据分片分扇区的存储方式,为台标数字合成和台标改写带来了方便。针对数字台标系统的播出控制和系统管理问题,系统中嵌入了MC8051软核,构建了基于FPGA的片上系统(SOC),为LCD多级菜单人机交互系统的设计和整个数字台标系统的管理提供了可靠保证。五、数字台标的研究设计了台标数据分片分扇区的存储方式,为台标数字合成和台标改写17针对键控特技,提出了一种蓝背景的抠像算法,可以较好的将视频对象提取出来,作为键信号供给背景和前景的合成。针对色键和抠像特技,提出了边缘颜色分量消除的技术,解决了传统色键合成器幕布色镶边、边缘突变的现象,使抠像效果变得生动和真实。六、数字电视特技技术的研究针对键控特技,提出了一种蓝背景的抠像算法,可以较好的将视频对18研究方向三:电路综合设计技术的研究SOPC电路综合设计DSP技术EDA单片机技术嵌入式系统ASIC研究方向三:电路综合设计技术的研究SOPC电路综合设计DSP19

多参数融合数字音频AGC算法处理框图

xi(n)*Gixi(n)短时能量Mi帧内峰值Pi过零率Zi首次过零检测更新Gi多参数融合生成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论