基于MPEG-4的音频可伸缩无损编码的研究

 2022-11-15 09:36:52

论文总字数:25099字

摘 要

近年来,随着大数据以及云传输的飞速发展,数字音频压缩领域的无损音频压缩成为一个社会热门课题,无损音频压缩算法被多机构或者公司隶属国内外从事音频开发也都提出了。像MPEG-4 ALS之所以受到了广泛的关注,是因为它在压缩效率、编解码的复杂度、支持多种设备的灵活性等方面都相较其他独立研发或不知名的无损音频压缩算法有着不错的领先,且在市场上处于垄断地位。

本课题主要针对音频数据无损编码的研究,而要完成无损压缩则需要特定的编码-解码方式和算法。首先,哈弗曼编码和串表压缩算法是作为基础算法被介绍。其次,提出了基于上下关系的算法编码、低能量模式编码以及位平面编码。紧接着,基于DSP平台编码器对编码进行进一步的优化是本文实验要点,从程序优化方面提出利用FastRTS Library提高编码器的浮点运算速度、利用DSP/BIOS来提高编码器的实时性以及存储空间优化。从C语言方面提出32位运算的移植、C语言数据结构的优化以及其他优化的技巧;最后则是在MPEG-4 ALS中实现仿真。

通过对无损音频数据压缩的研究,解决了日趋流行的无损数据压缩问题,为人们继续在语音压缩和无损编码的深入研究奠定了基础。

关键词:语音压缩;MPEG-4;可分级无损音频压缩;哈弗曼编码;位平面编码

Research on Scalable and Lossless Audio Coding Based on MPEG-4

Abstract

In recent years, with the rapid development of big data and cloud transmission, lossless audio compression in the field of digital audio compression has become a hot topic in the society, and lossless audio compression algorithms have been proposed by multiple institutions or companies affiliated with domestic and foreign audio development. The reason why MPEG-4 ALS has received extensive attention is because it has more compression efficiency, code complexity, and flexibility to support multiple devices than other independently developed or unknown lossless audio compression algorithms. A good lead, and a monopoly in the market.

This subject mainly focuses on the research of lossless encoding of audio data, and to complete lossless compression requires specific encoding-decoding methods and algorithms. First, Huffman coding and string table compression algorithms are introduced as basic algorithms. Secondly, algorithm coding, low-energy mode coding and bit-plane coding based on upper and lower relationships are proposed. Next, further optimization of the encoding based on the DSP platform encoder is the main point of this article. From the aspect of program optimization, it is proposed to use FastRTS Library to increase the floating-point operation speed of the encoder, and use DSP/BIOS to improve the real-time performance and storage space of the encoder.Optimization from the perspective of C language, the transplantation of 32-bit computing, optimization of C language data structure and other optimization techniques are proposed; finally, simulation is implemented in MPEG-4 ALS.

Through the study of lossless audio data compression, the increasingly popular lossless data compression problem is solved, which lays the foundation for people to continue in-depth research on speech compression and lossless encoding.

Keywords: speech compression; MPEG-4; scalable lossless audio compression; Huffman coding; bit plane coding

目录

摘 要 I

Abstract II

第一章 引 言 1

1.1课题背景及意义 1

1.2国内外发展现状 1

1.3论文研究安排 4

1.4小结 4

第二章 数据无损压缩原理及算法介绍 5

2.1 数据无损压缩原理 5

2.2 算法 5

2.3 小结 8

第三章 无损音频压缩算法 8

3.1基于上下关系的算数编码 8

3.2低能量模式编码 9

3.3位平面编码 10

3.4 小结 11

第四章 DSP平台编码器代码及优化 12

4.1MATLAB仿真算法 12

4.1.1提升浮点运算速率——FastRTS Library 12

4.1.2提升实时性——DSP/BIOS 12

4.1.3磁盘空间优化 13

4.2用C语言进行优化 13

4.2.1 对32位运算进行转移 13

4.2.2 优化C代码数据框架结构 14

4.3小结 14

第五章 实验结果及分析 15

5.1 MPEG-4 ALS 编码器的仿真实现 15

5.1.1莱纹森-杜宾 算法的实现 15

5.1.2 获得一阶信息熵 16

5.1.3预测 16

5.2熵编解码 17

5.2.1 Golomb-Rice Code中的参数s 17

5.2.2 Golomb-Rice 解码 18

5.3 实验结果及分析 18

5.4 本章小结 18

第六章 总结与展望 19

致 谢 20

参考文献 20

第一章 引 言

1.1课题背景及意义

在科学技术的发展速度不断提高,无损数据压缩技术和计算机科技得到了飞速的发展,无损音频压缩技术则在语音方面的适用范围方面越来越普遍。如今,我们的生活中遍布着无损音频压缩技术,聊天软件中需要无损语音压缩技术帮助用户消除噪声,音乐软件中需要无损音频压缩技术让用户体验更原生态的音乐体验,诸如此类的声音,语音,音乐等范畴,都需要无损数据压缩技术使用户得到更出色,更优秀的体验。甚至说,无损数据压缩技术与所有人类的现代生活息息相关。

传播学中麦克卢汉曾提出:媒介即讯息。其含义是,作为社会进步的标志,媒介的改变才是知晓世界变动的特征。而随着当前信息科学技术的不断进步,在声音对于压缩再到解压缩,则成为了越来越多研究机构和公司的研究热点,而正是由于在近代几十年间领域开发,无损数据压缩技术在社会中如雨后春笋般迅速发展。当下,无损音乐成为了各音乐软件公司和部分手机公司的产品卖点,HiFi也使部分执着于音质的爱好者得到了更好的体验;通话质量则成为各通讯公司和交友软件公司争相研发改善的重点,旨在能够通过更好地用户体验,划分市场份额中的大部分,变成其中的佼佼者;还有类似于声控密码或声控解锁,也都需要对用户的语音进行清晰地识别;甚至在部分用于监听设备,也都需要要求对声音来源进行高压缩比的剖析,从而协助警方得到证据或找到线索。

剩余内容已隐藏,请支付后下载全文,论文总字数:25099字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;