![音频人耳可以感觉到的声音频率_第1页](http://file4.renrendoc.com/view/d8328b710c722a018daf99f269396e96/d8328b710c722a018daf99f269396e961.gif)
![音频人耳可以感觉到的声音频率_第2页](http://file4.renrendoc.com/view/d8328b710c722a018daf99f269396e96/d8328b710c722a018daf99f269396e962.gif)
![音频人耳可以感觉到的声音频率_第3页](http://file4.renrendoc.com/view/d8328b710c722a018daf99f269396e96/d8328b710c722a018daf99f269396e963.gif)
![音频人耳可以感觉到的声音频率_第4页](http://file4.renrendoc.com/view/d8328b710c722a018daf99f269396e96/d8328b710c722a018daf99f269396e964.gif)
![音频人耳可以感觉到的声音频率_第5页](http://file4.renrendoc.com/view/d8328b710c722a018daf99f269396e96/d8328b710c722a018daf99f269396e965.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1音频概述音频:人耳可以感觉到的声音频率
20Hz~20000Hz语音和音乐是两类特殊的音频信号语音是语言的载体,是对声音的抽象音乐是符号化的声音语音是由人类发音器官产生的、具有一定意义且能起到社会交际作用的声音。具有抽象表意性频率通常在200Hz~4000Hz之间人类语音分布2语音处理语音处理是建立在语言学和数字信号处理基础之上的综合学科:语音分析,语音存储与回放,语音识别,语音合成。音频采样和量化:将模拟的(连续的)声音波形数字化(离散化);语音信号的时域分析:直接利用语音信号的时域波形进行分析;语音信号的频域分析:对语音信号的频谱、功率谱等进行分析;语音信号的线性预测分析:把语音信号用一个模型来表示,利用模型的参数来描述语音信号的波形和频谱特性。(1)音频采样和量化采样频率采样频率是指采样设备每秒钟对声音信号的采集次数。采样频率越高,声音的还原就越真实越自然。量化位数量化位数是把模拟声音转换为数字信号的二进制位数。量化位数客观地反映了数字声音信号对输入声音信号描述的准确程度。(2)语音压缩编码压缩编码的意义高效存储高速传输压缩编码分类波形编码参数编码混合编码波形编码:直接将波形信号转变为数字代码,尽量真实地还原波形,声音质量好,压缩比低,码率通常在20Kb/s以上,适用于高保真音乐及语音场合。参数编码:提取语音信号的特征参数进行编码,尽量保持语音信号的可懂性,而还原后的波形可能与原波形差别很大。压缩比很高,码率可达2.4kb/s以下。语音质量较差,自然度低,对环境噪声敏感。混合编码:将参数编码和波形编码技术结合起来,克服了两种编码的缺点。压缩比高,码率为4~16Kb/s,音质介于参数编码和波形编码之间。3凌阳语音压缩算法对于波形编码、参数编码和混合编码,凌阳都开发了相应的压缩算法。属于波形编码的有A2000、A1600等属于参数编码的有S240、S200等属于混合编码的有S480、S530等凌阳音频函数库Sacmv26e.lib函数库包括语音录制、播放,以及Midi播放函数集。A2000:播放A2000格式语音资源S480:播放S480格式语音资源S240:播放S240格式语音资源DVR:语音录制与播放MS01:Midi播放A2000格式:16Kbit/s~24Kbit/s,适用于音乐或高质语音播放。SPCE061A内置Flash空间最多约可存储25秒A2000语音。S480格式:4.8Kbit/s~7.2Kbit/s,适用于一般语音播放。SPCE061A内置Flash最多约可存储90秒S480语音。S240格式:2.4Kbit/s,适用于低品质语音播放,SPCE061A内置Flash约可存储180秒S240语音。DVR-语音录放:采用A2000压缩算法进行语音录制,码率为16Kbit/s,最多约可录制20秒语音。MS01-Midi播放:最大同时发音数为6路,其中有2路为鼓点音。语音录制存储流程语音采样在定时中断的控制下,以一定的速率(8KHz)进行AD转换压缩编码将采集到的数据以某种算法压缩编码存储将编码后的数据保存到存储介质中语音播放流程数据提取语音数据送入解压缩队列数据解码解压缩数据并送入输出队列转换为模拟信号在定时中断的控制下进行数模转换转换为声音模拟信号经滤波、放大,通过扬声器输出用SPCE061A播放语音4语音识别概述根据对说话人的依赖程度,分为:
(1)特定人语音识别(SD):只能辨认特定使用者的语音,训练->使用。
(2)非特定人语音识别(SI):可辨认任何人的语音,无须训练。根据对说话方式的要求,分为:(1)孤立词识别:每次只能识别单个词汇;(2)连续语音识别:用者以正常语速说话,即可识别其中的语句。语音识别原理SPCE061A实现语音识别硬件条件专用MIC接口,用于实现语音录制16位定时器/计数器用于控制采样频率最高49MHz时钟频率,内置硬件乘法器和内积运算,保证识别算法的运行。软件条件提供语音识别函数库,只需几条语句即可实现语音识别功能。特定人语音识别程序流程开始初始化RAM执行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 博物馆展览馆施工建设合同(2025版)6篇
- 2025-2030年户外露营折叠置物架行业跨境出海战略研究报告
- 充电宝维修注意事项考核试卷
- 2025-2030年塑木户外健身路径行业深度调研及发展战略咨询报告
- 2025-2030年手术室设备社区筛查行业深度调研及发展战略咨询报告
- 2025-2030年地道腊肉香肠体验馆企业制定与实施新质生产力战略研究报告
- 2025-2030年商用巧克力喷泉机行业深度调研及发展战略咨询报告
- 2025-2030年坚果心脏健康包行业跨境出海战略研究报告
- 二零二五年度网约车平台聘用司机劳动合同标准模板
- 小额贷款公司社会责任与可持续发展考核试卷
- 融资报告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024风能发电系统风力发电场监控系统通信第71部分:配置描述语言
- 污泥处置合作合同模板
- 脑梗死的护理查房
- 2025高考数学专项复习:概率与统计的综合应用(十八大题型)含答案
- 2024-2030年中国紫苏市场深度局势分析及未来5发展趋势报告
- 销售人员课件教学课件
- LED大屏技术方案(适用于简单的项目)
- Lesson 6 What colour is it(教学设计)-2023-2024学年接力版英语三年级下册
- GB/T 4706.10-2024家用和类似用途电器的安全第10部分:按摩器具的特殊要求
评论
0/150
提交评论