基于SIMD指令的高吞吐率Turbo译码器实现架构设计

 2022-02-14 20:02:45

论文总字数:30278字

摘 要

Turbo码是一种重要的信道编码方式,其性能接近于香农极限且容易实现并行计算而受到广泛应用,可以说Turbo码的发明给无线通信带来了革命性的进展。与此同时,随着通用处理器计算性能的不断提升,基于通用处理器的无线通信软基站平台成为可能。由于其相对于传统通信平台,具有灵活性等优点,受到越来越广泛的关注。

本文围绕LTE-A蜂窝移动通信系统的信道编码技术,着重研究基于通用处理器平台的高吞吐率Turbo译码器。首先,讨论了几种常用的Turbo译码算法,在此基础上,设计了面向通用处理器的实现架构,并利用Intel SSE、AVX、AVX2等SIMD指令进行算法优化。通过LTE-A的打孔机制,可以灵活支持不同码率。

我们在Intel Skylake处理器平台上进行了仿真研究和代码优化。仿真结果表明,在迭代次数为4次时,每个CPU可以实现百兆以上的译码速率。

关键词:Turbo码,SIMD,AVX ,译码器

Abstract

Turbo code is an important channel coding scheme, which is close to the Shannon limit performance and easy to implement parallel computing have been widely applied, the invention can be said Turbo code to the wireless communication has brought a revolutionary progress. Meanwhile, with the continuous improvement of the computing performance general-purpose processor, SDR platform-based wireless communication becomes possible general-purpose processor. Because of its relative conventional communication platform, flexibility, etc., are more and more attractive.

This paper focuses on LTE-A cellular mobile communication system, channel coding technology, it focuses on a general purpose processor-based platform for high-throughput Turbo decoder. First of all, we discuss several commonly used Turbo decoding algorithm, based on the design of application architecture for general-purpose processors and use Intel SSE, AVX, AVX2 and other SIMD instructions Algorithm. By puncturing mechanism LTE-A, and the flexibility to support different bit rates.

We conducted a simulation study and code optimization on Intel Skylake

processor platform. The simulation results show that the number of iterations to 4 times, each CPU can achieve more Fast decoding rate.

KEY WORDS: Turbo Code,SIMD,AVX,Decoder

目录

摘要 3

第一章 绪 论 6

1.1通信系统简介 6

1.2 Turbo码简介 6

1.3 Turbo码译码器研究现状 7

1.4研究内容和预期指标 7

1.5论文组织结构 8

第二章 LTE-A信道编码和信道调制 9

2.1 LTE-A信道编码简介 9

2.2 Turbo码 9

2.3 QPP交织器 10

2.4 码率匹配 12

2.4.1 子块交织 12

2.4.2 比特收集和打孔 14

2.5 信道调制 14

第三章 Turbo码译码算法简介 16

3.1 MAP算法 16

3.2 Max-Log-MAP算法 17

3.3 对近似的修正:Log-MAP算法 19

3.4 对三种算法的比较 19

第四章 Turbo码译码器架构设计 21

4.1 Intel SIMD指令简介 21

4.2 RSC译码器综述 21

4.3 RSC译码器实现 23

4.4 整体优化 30

第五章 计算机仿真和性能分析 31

5.1 软硬件环境 31

5.2 仿真系统简介 31

5.3 误比特率 32

5.4 译码速度 36

5.5 展望 37

致谢 37

参考文献(References) 38

表格位置

表2.1:传输信道的信道编码方案和码率9

表2.2:Turbo码交织器参数表11

表2.3:子块交织的列间映射表14

表2.4:LTE-A信道调制表15

表4.1:Turbo码译码器状态转移表21

表5.1:单线程下的译码器吞吐率36

表5.2:单CPU八线程下的译码器吞吐36

表5.3:文献[5]中的结论36

插图位置

图1.1: 现代数字通信系统框架6

图2.1: 码率为1/3的Turbo码编码器结构图9

图2.2: Turbo码速率匹配过程12

图3.1: Turbo码译码器结构16

图3.2:(Log)MAP算法Max-Log-MAP算法和SOVA的比较20

图4.1:Turbo码译码器网格图结构22

图4.2:译码器宏观示意图24

图4.3:第一步树形化简28

图4.4:第二步树形化简28

图4.5:第三步树形化简28

图4.6:寄存器处理后的最终结果29

图4.7:计算Hmax时的内存存储图29

图4.8:前行度量和后向度量的归一化操作图30

图4.9:优化后的译码器架构30

图5.1:仿真系统总框图31

图5.2:Turbo码译码器与硬判决译码器的性能比较33

图5.3:不同码率下的Turbo码误码率34

剩余内容已隐藏,请支付后下载全文,论文总字数:30278字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;