基于ARM946E处理器的MP3解码优化设计0保护元件

2022-07-19 10:32

基于ARM946E处理器的MP3解码优化设计

基于ARM946E处理器的MP3解码优化设计 2011年12月10日 来源: 0 引 言

MP3(MPEG I Audio Layer 3)格式是基于电影专家组系统(Motion Picture Expert Group,MPEG)压缩标准的一种声音文件格式,其压缩比根据采样频率、压缩位率和声音模式的不同而有所变化。MP3具有很高的压缩率,可以达到1:12。一分钟左右的CD音乐经过MP3格式压缩编码后,可以压缩到1兆左右的容量,其音色和音质还可以保持基本完整而不失真。随着数字音乐的不断普及,现在MP3音乐已经不仅局限于MPEG视频应用中,而是以一种独立的数字音乐压缩技术出现在计算机、网络和各种电子设备上。目前市场流行的MP3播放器是基于DSP和专用芯片的解决方案,通过硬件或专用算法实现解码,具有良好的实时性。而消费类电子产品正朝着多功能、低成本的方向发展。随着ARM9功能的不断增强,利用系统本身处理器实现MP3软解码成为可能。另外,软件实现更便于产品功能的升级和维护,可以预见,嵌入式MP3软解码器的应用将越来越广泛。这里在分析MPEG I Audio Lay-er3解码算法的基础上,提出基于ARM946E处理器实现解码算法的软件优化方法。

1 MPEG Audio Layer3的解码流程 MP3解码算法流程如图1所示。

主要过程包括:数据流解码、Huffman解压缩、反量化与重排序、立体声解码、IMDCT和子带合成运算等。其中Huffman解码与反量化、IMDCT和子带合成等3个过程在MP3解码过程中占用了最多的CPU和内存资源,是嵌入式系统实现软件解码的关键。

2 ARM946E处理器 ARM946E处理器属于ARM9内核带有E扩展的一个可综合版本,执行v5TE架构指令。采用5级流水线,存储器系统根据哈佛体系结构重新设计,独立的数据和指令总线。带有一套存储器子系统,以提高系统性能和支持大型操作系统。 如图2所示,存储器子系统包含1个存储器保护单元(MPU)、高速缓存(Cache)和写缓冲(Write Buffer);CPU通过该子系统与系统存储器相连。

相对于ARM7,ARM9E性能上的提高主要表现在工作频率、改进的硬件特性及优化的指令执行效率。另外,ARM9E集成了轻量级的DSP处理能力,以很小的成本(CPU增加功能需要增加硬件)换来非常实用的DSP性能。充分利用好芯片资源是实现MP3解码优化的关键。

3 算法优化 针对MP3中涉及较大运算的Huffman解码与反量化、IMDCT和子带合成,分别提出算法优化处理。3.1 定长查找冗余表Huffman解码算法Huffman解码器可以通过从头至尾逐一检测各符号,以查表比较的方式进行解码。即从一维的bit流中分辨出各个长度不同的Huffman码字,然后进行复杂的匹配。 由于LayeIⅢ中的Huffman码表组长度不一,会增加码字的搜索时间。定长查找冗余表法扩充Huff_man查找表,每次选取定长N bit码流作为查找索引。查找表中包括跳转指针和编码值。若节点索引值为跳转指针时,将通过扩充Huff-man查找表得知此Huffman编码的后续bit数,并跳转到另外一个节点;然后再根据后续bit数从码流中取值;接着从上次跳转节点开始查找,如此重复直到找出对应huffman编码的内容。查找表利用Union数据结构实现,可减小Huffman表占用的空间。假设一Huff-man编码长度为l,采用传统算法需要1次移位操作和1次比较,使用定长查找法只需[z/N]次查找和[l/N]次比较操作。 表1,表2是Huffman解码的举例说明:

计算量可降低一半。 子带合成滤波在解码过程中包括了32点到64点的IMDCT处理,如式(3)所示:

由于N(i)(k)具有对称特性,可以得出:

只要计算0≤i<n/4和n/2+1≤i<3n/4范围的V(i)值即可。其减少了将近一半的计算量。

4 代码优化根据ARM946E处理器硬件特点,对实时性要求较高的关键程序进行C语言和ARM汇编级代码优化。4.1 减计数循环体 IMDCT和子带合成滤波器组2个运算量最大部分中有多个循环体运算,为了提高执行效率,推荐使用减计数循环体。 如表3所示,对于固定次数的循环,减计数循环比增计数循环速度快。这是因为每次增计数循环体外加3条指令,而减计数循环体外只有2条指令,减循环终止条件为减计数到零,而不是计数增加到某个特定的限制值。由于减计数结果已存储在指令条件标志里,省去与零比较指令。

4.2 内联函数和内嵌汇编 MP3解码算法中定点化乘法都是通过函数调用来实现,每次调用需要开销23~28个时钟周期,其中超过15个周期用于函数调用时PC指针以及寄存器压栈保护上。采用内联函数方式(使用关键字_inline声明)或宏指令,在编译阶段代码段将被直接展开。另外armcc编译器允许在C源程序中使用内嵌汇编(但代码可移植性差),使用包括汇编的内嵌函数,可以使编译器支持通常不能有效使用的ARM指令和优化方法,例如C编译器不支持的ARM v5E扩展指令。使用内联函数结合内嵌汇编实现移位乘法,可使平均时钟周期缩短为6~8个。4.3 ARM DSP扩展指令的运用 ARM946E处理器支持ARMDSP扩展指令,主要包括3个类型: (1)单周期的16×16和32×16 MAC操作; (2)对原有的算术运算指令增加了饱和处理扩展; (3)前导零(CLZ)运算指令,提高归一化、浮点运算以及除法操作的性能。 ARM处理器不支持浮点运算,经过测试及分析,定点运算中数值的截断误差选择为28 b,其可以达到较好的解码音质,不会因为爆音过多而影响播放效果。 完成类似的乘法功能,ARM的SMULL(32×32)指令需要3个周期,而ARMDSP扩展指令SMULWT(32×16)只需要1个周期。从数据的准确性上分析,由于乘数的精度为16 b,最终结果有些差异,但由于MP3解码运算都是基于28 b的定点数值的,所以通常的运算都是一个运算结果跟某一个固定定点表中的数据相乘的。若选择固定定点表中数据的高16 b数据进行运算,运算的结果误差在1 b以内。 为了验证使用ARMDSP扩展指令的优化效果,在系统120 MHz主频下,以128 Kb/s的压缩速率进行编码测试,采用的测试文件如表4所示。

上述3个MP3测试文件的比特率均为128 Kb/s,使用这三首MP3歌曲进行解码分析结果如图3所示。

实验表明,使用ARMDSP扩展指令比使用ARM一般指令解码性能平均提高17.5%,主观听觉上音质效果无差异。

5 结 语 这里充分利用ARM946E处理器的DSP扩展指令特点提高程序代码的执行效率,对3个关键模块:Huff-man解码,IMDCT运算,合成子带滤波进行算法优化及简化处理,减少了各模块的运算量,同时从C语言和ARM汇编层次来优化代码,取得了较好的实时MP3解码效果。

卵巢保养品

雀巢是进口奶粉吗

脚垫怎么治疗

怎么治焦虑症

姜潮整容

相关阅读
最好篮球场护栏网的网孔及安装形式D型卸扣多层电路板江阴栖霞涡轮叶片Trp

篮球场护栏的孔及安装形式篮球场护栏的孔及安装形式篮球场护栏的孔及安装形式篮球场护栏是安装在篮球场地外围的体育场护栏产品,篮球场护栏主要起到阻止篮球飞出竞赛场地外,也可以起到对多个篮球场施行隔离的效用。

2024-04-24 03:43
最好新振升集团高筑黄金台千里寻名驹电线接头机械设备农业机械铜杆轴承球Trp

新振升集团:高筑黄金台 千里寻名驹【铝道】转眼又到了 金九银十 的求职关键时期,新振升这标志着中复碳纤维实现了千吨级T800原丝的产业化集团从9月份开始已经启动了2013年的校机床设备园招聘计划。企业的竞争,归根结底

2024-04-23 13:36
最好驾驶式电动清扫车泵阀风力发电精密铸件球轴承橡胶设备Trp

驾驶式电动清扫车您当前位置:首页 行业动态驾驶式电动清扫车驾驶式电动清扫车来源:济南百易环保科技有限公司日期:作者:济南百易环保 驾驶式电动清扫车BY-S50,又称为新能源电动扫地车,是我公司自主研发、设计、生产的第

2024-04-23 05:36
最好济南市最新镍价格行情2012年7月13日电源线扣激光测距排风扇铜配件珠片机Trp

济南市最新镍价格行情(2012年7月13日)能够确保做实验的时分无穷度的拉近精确值您当前位置因此:首页 价格行情济南市最新镍价格行情(2012年7月13日)济南市最根据再森木公司技术人员介绍:废旧笔心能够制作成1种再生木――木塑

2024-04-23 00:45
最好运城市较早的屋顶分布式光伏电站在芮城并网导热油炉海城铝导线四通阀增压缸Trp

运城市较早的屋顶 分布式光伏浙江国泰电器科技有限公司电站在芮城并【铝道】201料位传感器7年8制动器月7日,由湖北永恒集团在运城市投资建设的50KW光伏电站并仪式在芮城县学张乡举行,成为运城市较早的接入运城电的屋顶分

2024-04-20 19:19
最好8月韩国LME注册仓库铜库存可能增加12齿轮加工功放板雷州石首液压油缸Trp

8月韩国LME注册仓库铜库存可能增加12,000吨贸易商周四称,估计8月份,韩国LME注册仓库铜库存可能增加12,000吨,甚至更多。贸易商称,韩国国内铜消费商,如线缆制造商等正在面临铜价振荡和季节性需求迟缓的压力,所以他们纷纷

2024-04-18 10:53