RTP协议音视频质差分析系统设计与实现

 2022-04-06 20:54:12

论文总字数:25419字

摘 要

随着网络通信技术的发展,音视频服务逐渐取代了图文类服务,在网络流量中所占的比重越来越大。在网络中评估音视频质量是许多网络设备提供商与音视频服务提供者所需要的业务场景,其处理的问题是评估从一个网络设备到另一个网络设备之间某个音视频业务的质量。

本论文基于经典MOS评分算法与经典机器学习算法,针对网络环境中音视频服务的质差问题,实现了对基于RTP协议的音视频质差评估,针对优化不同的应用有较高的准确率。具体来说,主要进行了如下工作:

1. 自主构建网络抓包环境,通过抓包获取网络中所需要的信息为源数据,自主构建网络损伤情况,用于获取各种弱网环境下的数据。

2. 进行特征提取,对源数据进行计算获得延时、抖动、丢包率等特征构建特征向量。

3. 进行模型选择,利用经过改进后的MOS评分算法和经典机器学习算法构建模型,选择准确率更高的模型。

本文提出了检测从一个网络设备到另一个网络设备之间某个音视频业务质量的解决方案,在准确率上有着较好的表现。

关键词: 质差分析 基于RTP的音视频应用 MOS评估方案 机器学习

ABSTRACT

With the development of communication technology, audio and video services have gradually replaced graphic and text services, and the proportion of network traffic has become larger and larger. Evaluating audio and video quality in the network is a business scenario required by many network equipment providers and audio and video service providers. The problem solved by this project is to evaluate the quality of an audio and video service from one network device to another.

Based on the classical MOS scoring algorithm and classical machine learning algorithm, this paper implements the audio and video quality difference evaluation based on RTP protocol for the quality difference of audio and video services in the network environment, and has higher accuracy for optimizing different applications. Specifically, the main work is as follows:

  1. Independently construct a network capture environment, and obtain the information needed in the network by capturing packets as source data. Autonomously construct network damage conditions to obtain data in various weak network environments.
  2. Feature extraction is performed, and the source data is calculated to obtain feature vectors such as delay, jitter, and packet loss rate.
  3. Model selection, using the improved MOS scoring algorithm and classical machine learning algorithms to build models, select models with higher accuracy.

This paper proposes a solution to detect the quality of an audio and video service from one network device to another, and has a good performance in accuracy.

Key word: quality analysis, RTP-based audio and video applications, MOS evaluation program, Machine learning

目 录

第一章 序论 1

第二章 相关技术及背景介绍 3

2.1 RTP、RTCP协议簇介绍 3

2.2 音视频质差评估领域 4

第三章 系统设计 6

3.1 数据抓取 6

3.1.1 音频数据抓取 6

3.1.2 视频数据抓取 6

3.2 特征工程 6

3.2.1 延时的计算 7

3.2.2 抖动的计算 8

3.2.3 丢包率的计算 9

3.2.4 连续突发丢包事件的计算 10

3.2.5 序列损伤因子的计算 10

3.2.6 帧损伤因子的计算 11

3.3 数据分析 11

3.3.1 改进的传统MOS方法 12

3.2.2 机器学习分类技术 14

3.3.3 机器学习回归技术 15

第四章 实现过程及结果分析 16

4.1 网络损伤及样本构建 16

4.2 改进MOS方法的实验结果及分析 17

4.3 机器学习分类技术的实验结果及分析 20

4.3.1 随机森林分类 20

4.3.2 SVM分类 21

4.3.3 KNN分类 23

4.3.4 决策树分类 25

4.3.5 机器学习分类技术总结 26

4.4 机器学习回归技术的实验结果及分析 26

4.4.1 线性回归 26

4.4.2 决策树回归 27

4.4.3 SVM回归 28

4.4.4 KNN回归 30

4.4.5 随机森林回归 31

4.4.6 机器学习回归技术总结 32

第五章 总结与展望 33

致谢 35

参考文献 34

  1. 绪论

2G时代以文本为信息的主要载体,3G时代以图片为信息的主要载体,4G时代则以视频为信息的主要载体。如今音视频流媒体的应用在日常生活中广泛存在,如新闻发布、网络直播、小视频APP、电子商务、实时视频会议等。尤其是网络直播和小视频的兴起对于网络而言无疑是一个更为严峻的挑战。未来通信网的发展趋势是“宽带化”、“无线化”和“移动化”的,网络环境日益复杂,网络所承载的业务也日渐丰富。而音视频业务则因为信息量大,对于网络环境有着更高的要求。网络直播、实时视频会议、音视频通话等应用方向更是对于音视频的网络传输有着实时性高的要求。音视频数据在网络传输过程中,质量极为容易受到损伤,导致图像模糊,播放停顿,声音失真,声音卡顿等现象,极大程度的影响了服务使用者的使用体验。

网络运营商面对要求日益变高的服务质量需求,需要针对不同的业务做出不同的优化调整,如带宽选路,音视频流的加速通道等技术。因此,对于网络设备提供商和服务提供商而言,则催生了应用识别技术和服务质量监测技术。尤其是网络直播的兴起,对于流媒体的质量有了更高的要求。而在复杂的网络环境下,音视频的传播很容易受到影响。对于服务质量的监测也需要更为精准,更加贴近用户感受。在这一背景下,催生了许多关于音视频评估的解决方案,本论文则提供了一个从网络环境侧进行音视频评估的解决方案。

剩余内容已隐藏,请支付后下载全文,论文总字数:25419字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;