【Android论文栏目提醒】:本文主要为网学会员提供“【精品】基于DSP的ADPCM编译码系统研究 - 其它资料”,希望对需要【精品】基于DSP的ADPCM编译码系统研究 - 其它资料网友有所帮助,学习一下!
Y 9310‘8分类号 密级:U D C: 编号: 基于DSP的ADPcM编译码系统研究 STUDY oN TⅡE ADPCM ENCODE AND DECoDE SYSTEM BASED oN DSP 学位授予单位及代码: 盘查堡墨盘芏!!Q!堑) 学科专业名称及代码: 堑堡垫i茎!三2 f Q8Q!Q!! 研究方向:堂童坐量垫盎 申请学位级别:墅± 指导教师:奎挂基到整握 答辩委员会主席: 研 究生:主鑫堡
论文评阅人:
论文起止时间: 2QQ!:Q4二2Q笾:丝 摘 要 语音编码技术的根本作用是使语音通信数字化,而语音通信的数字化将使通信技术的水平有显著的提高。
因此,语音编码技术在整个数字通信系统中有着至关重要的作用。
本文从编码的概念和基本理论出发,论述了自适应差值脉码调制 (ADPcM)编码的算法,重点介绍了自适应量化和自适应预测算法。
然后以Matlab下的simulillk为系统建模工具,验证了ADPCM算法的正确性和可实现性,为系统的实现和调试提供了指导。
最后根据ADPcM语音编码的算法和系统的要求,选择了数字信号处理器DsP (TMS320C5402)、模数转换器A,D等芯片并完成了硬件电路的设计,还介绍了汇编语言编写的部分程序。
文中的插入了大量图片,给出了PCM、A.LAw PCM和U—LAWPCM编码的仿真模型和结果,并从DPcM出发给出了ADPCM系统的各个子系统框图和SIMULINK仿真模型,使得基于DSP系统设计的思路非常清晰。
关键词:语音编码ADPCM DSP ABSTRACT The essential role of voice encoding technology is to digitize voicecommunication which will greatly improve me communicationtechnology.So the voice encoding technology is cmcial in the whole digitalcommunication svstem. This article mainly describes t11e concept aIld principle of encoding inthe fifst a王ld second chapters.The t11ird chapter mainly describes AdaptiveDi圩erential Pulse Code Modulation (ADPCM) algorithm, ad叩tiveq咖tizing a11d ad印tive predicting algoritll】m.In the fbunh chapter we testa11d verify ADPCM algorithm in its co丌℃ction and feasibility based on thesystem modeling、ⅣiⅡl me SIMULINK.which directs the feasibility and testof syStem.In the finh chapter we accomplish the design of hardware circuitbased on ADPCM audio encoding a1里prit№and requirement of system inⅥrhich we select chips such as DSP(Di西tal sigllal Pmcessor)and Anaiog toDigital Conven(~D),we also wTite some pmgrams by compilationlanguage. This anicle gives t|le Simulation model and result of PCM.A—Law PCMand U—Law PCM、Ⅳith a lot of Faphs.From DPCM system,we giVe ADPCMsystematic every subsystem block diagram and SIMULrNK emulation model,which makes it very clear to design nle whole system based on DSP. Key words:Voice Encoding ADPCM DSP II 第一章 绪 论§1.1引言 劳动创造了人类,创造了人类文明。
而语言是人类创造和记栽几千年的人类文明史的根本手段,没有语言就没有今天的人类文明。
语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也是人类进行思维的一种依托。
人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储和获取语言信息,这对于促进社会的发展具有十分重要的意义。
例如,我们可以应用自动语音识别技术,使手写文稿和手工打印文本变成自动听写机操作:把人工查阅各种书面文字资料的操作,变为口呼自动查阅各种各样的数据库;可以通过语音压缩编码技术把一些有价值的对话、演讲和广播等语音信息,进行高效率的压缩后再存储和传输;可以采用语音合成技术_寻存储的语音或文字资料转化为语音高质量地回放,甚至自动翻译成另一种语言的语音回放或进行文字显示。
这就是说,如果人们的听、说、读、写、查阅信息和语音通信等,都能采用先进的手段高效率地进行,这将使人们的才能得到更加充分的发挥和有效的扩展。
特别是移动通信和个人通信的发展,将使地球上任意地区的人都可以随时随地通电话,人们的相互联系将更加紧密,好像大家同属地球村的村民。
这一理想的实现已为期不远,其中语音压缩编码技术的应用当然是必不可少的。
随着通信、计算机网络等技术的飞速发展,语音压缩编码技术得到了快速发展和广泛应用,尤其是最近20年,语音压缩编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到普遍应用,起着举足轻重的作用。
§1.2语音压缩编码技术的类别 语音编码就是将模拟语音信号数字化,数字化之后可以作为数字信号传输、存储或处理,可以充分利用数字信号处理的各种技术。
为了减小存储空间或降低传输比特率节省带宽,还需要对数字化之后的语音信号进行压缩编码,这就是语音压缩编码技术。
语音的压缩编码方法归纳起来可以分为三大类:波形编码、参数编码和混合编码。
波形编码比较简单,失真最小,方法简单,但数码率比较高。
参数编码的编码速率可以很低,但音质较差,只能达到合成语音质量,其次是复杂度高。
混合编码吸收了波形编码和参数编码的优点,从而在较低的比特上获得较高的语音质量,当前受到人们较大的关注。
§1.3语音压缩编码技术的发展 自从1937年A.HReeves提出脉冲编码调制(PCM)以来,语音编码技术已有60余年的发展历史。
尤其近20年随着计算机和微电子技术的发展语音编码技术得到飞速发展。
CcITT于1972年确定64kb,S PCM语音编码G711建议,它已广泛的应用于数字通信、数字交换机等领域,至今,64kbit/s的标准PcM系统仍占统治地位。
这种编码方法可以获得较好的语音质量但占用带宽较多,在带宽资源有限的情况下不宜采用。
ccITT于80年代初着手研究低于64kbit/s的非PCM编码算法,并于1984年通过了32kbi“sADPcM语音编码G72l建议,它不仅可以达到PcM相同的语音质量而且具有更优良的抗误码性能,广泛应用于卫星,海缆及数字语音插空设备以及可变速率编码器中。
随后,于1992年公布16kbⅣs低延迟码激励线性预测(LD.cELP)的G728建议,它以其较小的延迟、较低的速率、较高的性能在实际中得到广泛的应用。
最后共轭代数码激励线性预测 (CS—ACELP)的8kbi“s语音编码G729建议已在1995年11月ITu—TsGl5全会上通过,成为国际标准。
这种编码方法延迟小,节省87.5%的带宽,可以提供与32kbi“s的ADPcM相同的语音质量,其音质是同档次码速率中最优的,而且在噪声较大的环境中也会有较好语音质量。
广泛应用于个人移动通信、低c/N数字卫星通信、高质量移动无线通信、存储埘奎索、分组语音和数字祖用信道等领域。
其它一些国际组织或国家也积极制定自己的标准。
§1.4语音压缩技术的现状及发展方向 语音压缩编码技术的发展是十分迅速的,cELP的编码速率较低,但复杂度较高,可以在4.8kbi“s左右的码速率上获得较高质量的语音是当今中低速率语音编码技术的主流技术之一,许多国际标准化组织及机构纷纷将这一编码方案作为语音编码标准。
在对其改善质量、降低复杂度、减少编码延迟等方面都提出了不少新的方法,使cELP在实践中得到广泛应用。
随着DsP技术的发展,cELP技术还具有一定的潜力,例如将G729扩展到6.4kbi“s,用于TDMA/CDMA移动无线系统和DcME。
目前,语音压缩编码技术主要有两个努力方向:一个是中低速率的语音编码的实用化,及如何在使用过程中进一步减低编码速率和提高其抗干扰、抗噪声能力;另一个是如何进一步的降低其编码速率,目前已能在5kbit/s一6kbi“s的速率上获得高质量的重建语音,下一个目标则是要在4kb/s的速率上获得短延时、高质量的重建语音。
特别是对中长延时编码,人们正在研究其更低速率(如400bi“s一1200bi“s)的编码算法,在这个过程中当编码速率降至2.4kbi以速率以下时,CELP算法即使应用更高效的量化技术也无法达到预期的指标,需要其它一些更符合低速率编码要求的算法,目前比较好的算法还有正弦变换编码 (STC)、混合激励线性预测编码(MELPC)、时频域插值编码(TFl)、基音同步激励线性预测编码(PsELP)等,同时还要求引入新的分析技术,如非线性预测、多精度时频分析技术(包括子波变换技术)、高阶统计分析技术等,这些技术更能挖掘人耳听觉掩蔽等感知机理,更能以类似人耳的特性作语音的分析与合成,使语音编码系统更接近于人类听觉器官的处理方式工作,从而在低速率语音编码的研究上取得突破。
§1.5系统设计指标 1.采用国际电信联盟(ITu)ADPcM的G721建议,语音信号可在 32kbi“s数码率上达到64kbi“s的语音质量。
2.对300Hz到3400Hz的语音信号,采用8kHz采样率,每个样点 为12位编码经过ADPCM编码后得到4位的编码输出。
3.信噪比SNR大于80dB 4.误码率优于10“ 5.编译码时延不超过5到10ms 第二章模拟信号脉冲编码基本理论 目前通信业务主要有电话、图像(传真、电视)等,这些信源在时间和幅度上均为连续的模拟信号,要实现数字化传输和交换,首先要把模拟信号变成数字信号。
电话信号的数字化称为语音编码,图像信号的数字化称为图像编码。
二者虽然各有特点,但编码原理基本一致。
由于目前通信网中大量的业务为电话业务,故本章主要讨论语音编码。
这些理论不失一般意义,它对任何模拟信号数字化的实现过程都是适用的。
根据语音的特点,把语音编码方法分为两类: 波形编码:对信号的波形进行编码,具有较高的重建信号的质量。
参量编码:提取语音信号的一些特征参量,对其进行编码,其特点是码速率低,但语音质量较波形编码要差一些。
由于波形编码质量较高,在300~3400Hz话路通道中,传输的各种模拟信号(如电话信号,模拟的数据信号、传真信号以及各种随路信令信号等)在数字化以后,仍能保持原来的质量容限。
这一点在通信网从模拟向数字的转换过渡过程中是非常重要的。
语音信号的波形编码方法有很多,如脉冲编码调制(PCM)、自适应差值脉冲编码调制(ADPcM)、自适应增量调制(ADM)、子带编码(sBc)、矢量编码(VQc)等。
下面主要介绍编码的基本理论,为对语音进行ADPcM编码译码系统提供理论依据。
4§2.1 Nyquist采样定理 将时间上连续的模拟信号变为时间上离散样值的过程称为采样。
能否由离散样值序列重建原始的模拟信号,是采样定理要回答的问题。
抽样定理是任何模拟信号数字化的理论基础。
主要下面有几种:1/Nyquist采样定理2/带通采样定理3/自然采样4/平顶采样。
本设计在采样前通过预滤波把语音信号的频带限制在300Hz到3400}k范围内,所以简单介绍Nyquist采样定理和带通采样定理,详见文献‘2。
2”。
Nyquist采样定理【:s一1:设有一个频率带限信号x(f),其频带限制在(0,厶)内,如果以不小于兀=2厶的采样速率对x(f)进行等间隔采样,得到时间离散的采样信号x(H)2 x(”瓦)(其中五21/兀称为采样间隔),则原信号工四将被所得到的采样值x∽)完全的确定。
Nyquist采样定理说明,如果以不低于信号最高频率两倍的采样速率对带限信号进行采样,那么由所得到的离散采样值就能唯一的恢复原信号。
由数字信号处理中的采样理论,使采样信号通过一个带宽不小于国一的低通滤波器,将高频率分量滤除,就能从上一(∞J中无失真的恢复出原信号』t驯。
采样定理的意义在于,时间上连续的模拟信号可以用时间上离散的采样值来取代,这样就为模拟信号的数字化处理奠定了理论基础。
本设计要求的最高频率为3400Hz,如果用Nyquist定律采样需要至少6800Hz的采样率。
§2.2.带通信号采样 Nyquist采样定理只讨论了频谱分布在(o,厶)上的基带信号的采样问题,而我们在实际中遇到的信号,特别是语音信号,往往是带通信号‘251即信号的频率分布在某一有限的频带(^,厶)上时,根据Nyquist采样定理,仍然可以按fs≥2fH的采样速率来进行采样。
当厶>>口。
厶一以时,也就是当信号的最高频率/0远远大于其信号带宽B时,如果仍然按Nyquist采样率来采样的话,则其采样频率会很高,以致很难实现,或者后续处理的速度也满足不了要求。
带通采样定理描述如下:设一个带限信号x(f),其频带限制在(^,/“)内,如果其采样速率/一满足: 盈≤,:≤盟 玎+1一。
5一硝 (2.1)其中n为整数,取值的区间为:【o,Ⅳ】,N为以肛的整数部分。
则置(国)的频谱不会发生混叠,即从置(甜)中可以无失真的恢复出x∞)。
详细证明见文献陋2”。
从上述采样定理中很容易导出最低采样率 。
羔=等跏铧 七:, (当n=最大值N时,J一最小),又由式可知:带通采样频率的最小值在2B和4B之间,即 2曰≤Z。
。
s4曰通常,当带通信号的带宽大于信号的最低频率五时,便将此信号当作低通信号处理。
只有在不满足上述条件时才使用带通抽样定理。
模拟电话信号经限带后的频率范围是300Hz到3400Hz,所以按低通信号处理,抽样频率理论值至少应为6800Hz。
由于解调时不可能使用理想的低通滤波器,而实际的滤波器均有一定宽度的过渡带,又由于抽样前的限带滤波器也可能对3400Hz以上的频率分量作不到完全抑制,所以对语音信号的抽样频率取为8000Hz。
在抽样信号的频谱之间便可形成一定间隔的“防护带”△B,既防止了频谱的混叠,又放宽了对低通滤波器的要求。
§2.3量化定理§2.3.1基本概念 将幅度连续变化的信号变成离散信号的处理过程称为量化。
由于PcM数字化过程是用有限长度的二进制数字码组表示模拟信号的样值,有限长度的二进制数字码组只能代表有限数量的样值,因此要用有限数量的样值来表示原模拟信号无限个幅度抽样值就需要量化。
量化的方法就是将样值的最大变化范围划分成若干个相邻的段落,当样值落在某一间隔内,其输出数值就用此间隔内的某单一固定值来表示。
量化的间隔可以相等,也可以不相等,两种量化方法:均匀量化和非均匀量化。
从量化结果不难发现,无论量化间隔多么小,量化必然带来误差,从而产生量化噪声。
当然量化间隔小、量化级数多能减小量化误差,但同时也增加了数码率,提高了编码设备的复杂程度,且需要较宽的传输信道。
例如,对语音信号,其抽样速率为疋=8KHz,如果每个样值编码8位,量化共有256个量化间隔,每路语音PcM编码后的数码率为8×8=64kib/s:如果每位样值编11位码,数码率提高到88kbit/s 用MATLAB下SIMULINK仿真量化模型和结果如下: S 图2.1 slMuLINK对量化和量化误差仿真模型 图2.2 slMu LINK对正弦波量化和误差仿真结果§2.3.2均匀量化 均匀量化也称为线性量化,量化过程中各量化间隔相等。
任何一个量化器都有一定的量化范围,通常取一矿~y,在均匀量化情况下,量化级数N与量化间隔(△)的关系为: 2矿 △=—— (2.3) Ⅳ 通常每个量化间隔内的量化值可以取此间隔内的任意值,但从理论上为了减小平均量化误差功率,取量化间隔的中间值为量化值,这样量化最大误差为△/2。
一般来说信源码都是二元码,因此码位n与量化级数N的关系为Ⅳ≤2”,即珂≥z6Ⅳ。
对均匀量化的量化间隔或量化电平用”住码表示,就的得到了数字编码信号,通常称为线性PcM编码信号。
§2.3.3非均匀量化 现就数字电话PcM编码,按照国际电信联盟(ITu)规定的标准,介绍非均匀量化及其编码结构。
1.压缩一扩展特性 8 实现非均匀量化利用“压缩—扩展”技术,在发送端采用具有“压缩”的量化特性,兼有对大信号“压缩”(大的△)和对小信号的“扩展”(用小的△)。
在接收端解码后的受压缩影响的样本序列,再经过与瞬时压缩完全相反的特性,即“扩展,’特性。
发收两种特性合成为线性,才不致引起各样本的压~扩失真。
构成如下图:_一习……瓜磊L一薄H—i弭一 l…■ L:羔j Lj L…j L一 图2.3非均匀量化 2.两种制式压一扩特性 ITu.T G711建议的PcM两个模式如下。
A律: V=一 1+ln爿x 。
土<x≤1 l+ln』4 4 V=~.. ’ 一z 1+hl彳 o≤x≤上 彳 (2.4)式中,x为归一化输入信号电平;y为归一化量化电平;A为确定常数,A=87.6。
上述A律压一扩特性主要用于欧洲和我国的PcM电话系统。
“律: 四gn(x)篱 (2.5)式中,sgn(.)为正符号函数;‖为压缩量度。
‖值的作用是,当‖值小时或归一化值‖Ix悻1时,接近于均匀量化特性;当‖值大时,‖lxf三l有更强的压缩效果。
在现用系统中,常取‖=100或255。
A律与律Ⅳ公式也可以由十进制对数表示,即 1+lg(4Izl) !<x≤l 一 1+19彳 (2.6) 4lxl .o≤x≤土 1+19爿 爿 蚱等等 (2.7)其实两种表示没有本质差别。
A律与“律均含有对数运算,是由于人耳对声音的响应与幅度值的对数成正比。
为了方便,一般由分段折线方式来逼近A律或‖律特性曲线。
现行标准中,A律利用了“13折线”近似关系,如下图: 、. ‘u, ■、 ..。
,● ;● ,il;0钾l+一!;: ● .● 图2.4 A律13折线压缩特性 由G.7ll建议采用的13折线,对于PcM系统8比特码字的量化信噪比改善量为26dB。
相当于节省了4b“码元,即非线性量化的A律技术,使用均匀量化的12的bi“码字可由8bi“码字完成,或11bi偶字可由7bit/码字(除极性码最高位外)完成。
用MATELAB下的sIMuLINK对以上的两种压缩律进行仿真,可倦信曝毙菠善量为26dB。
翱鑫于节瘩了秘it码元,弩毒线嫒量纯鲢A律拽术,使用均匀蚤化的12的bi俑字可由8bit,码字完成,或11bW码字可由7bi蜘马字<除极性码凝高位外)完成。
鹰MATLAB下的slMuL黼K对以上镌两种压缩律进行仿真,可以形象的看到它们的区别和特征。
仿真模型和结果如下: A.L0w 冉L●w Com§}镕of 基蛐0nde} Mu-La¨ Mu.Ljw C口m口fe岱or ExDande r 毽2。
5 A律静‖簿秘s|MuL玳K稳建穗仿粪搓型 图2.6 A律和“律的slMuLINK仿真结滟 第三章ADPCM的压缩编码原理 前面内容所讲述的PcM编码方式使用的是波形编码技术,即首先对模拟信号波形进行时间离散化,而后再根据样值幅度A进行量化和编码。
从语音信号的相关特性分析可知,当以一定的时间间隔抽样时,其所得的样值之间是有一定相关关系的。
当将这些有一定相关关系的样值按PcM方式进行编码时会使所得的编码信号中,舍有一定的冗余信息。
这样就使得编码信号的速率有一些不必要的增高,降低了信息传输效率。
虽然64kbit/s的A律或u律对数压扩PCM已经在大容量的光纤通信系统和数字微波系统中得到广泛的应用。
但是,PcM占用频带要比模拟载波系统宽得多。
因此,对于大容量的长途传输系统,尤其是卫星通信方式,采用PcM的经济性很难与模拟载波相比。
对于超短波段的移动通信网,其频带有限,每路电话必须小于25 kHz,64 kbit/s的PcM更难以获得应用。
因此,就需要在相同质量的条件下降低数字化语音的数码率,以提高数字通信系统的频带利用率。
通常把低于64 kbit/s的语音编码方法称为语音压缩编码技术,其方法很多,如差值脉码调制(DPCM)、自适应差值脉码调制(ADPcM)、子带编码(SBc)、参量编码及矢量量化编码。
自适应差值脉码调制(ADPcM)是语音压缩中复杂度较低的一种编码方法,它可32kb“/s数码率上达到64kbit/s的语音质量。
为此国际电报电话咨询委员会fccITT)在1984年提了32kbit/s ADPcM的G72l建议。
1986年对G721又做了适当的修正,使其更加实用化和完善。
本设计从差值脉冲编码调制(DPCM)出发,分析量化与预测的自适应原理、电路结构及自适应算法。
§3.1差值脉冲编码调制§3.1.1差值信号的量化和编码的概念 语音和图像信号存在着大量的冗余。
所以,利用语音信号的相关特性降低速率是语音高效编码的有效方法之一。
一般的PCM方式中对样值信号编码都是按样值幅度独立进行的,即使是相关性较强的相邻两个样值也是如此。
由于是对样值幅度独立编码,故每一编码码组允许的信号动态范围就是原语音信号的动态范围。
由于这一幅度范围大,为保持一定的编码精度就需要较多的编码位数。
如前所讨论,语音信号的PcM系统中每一样值编码所需要的编码位数为8位非线性码,而线性编码时就需要11位码。
所谓差值脉冲编码调制(DPcM),就是考虑利用信号的相关性找出可以.