基于编解码器对H.265/HEVC(高效视频编码)的性能分析外文翻译资料

 2022-12-18 16:08:56

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


2015 13th International Conference on Frontiers of Information Technology

基于编解码器对H.265/HEVC(高效视频编码)的性能分析

N. Minallah, S. Gul M.M. Bokhari

Department of Computer Systems Engineering, University of

Engineering amp; Technology Peshawar, Pakistan

Minallah.nasru@gmail.com, gulsaira@ymail.com

摘要视频编解码器的压缩性能对于以低比特率编码高质量视频非常重要。视频编码领域取得了重大进展。最新的视频编码标准,高效的视频编码- HEVC/H。在相同的比特率下,265将视频质量提高一倍。本文介绍了H.265、H.264和使用不同视频编码库的运动JPEG的质量和性能比较。除了需要高压缩效率,保持视频编解码器的计算复杂度也很重要。在这方面,尽管HEVC提供了最佳的压缩效率,但它的计算成本要比H.264高得多。

实验结果表明,HEVC生成的视频质量最好,其次是H.264。然而,运动JPEG编码产生最快的编码时间后,HEVC使用OpenJPEG库编码的运动JPEG视频的质量最差。H.264是所有视频编解码器中速度最慢的,其视频质量通常可与用Kakadu (Motion JPEG)编码的视频媲美。这项工作旨在为视频编码套件的选择和编解码器的未来发展提供见解。

索引词—HEVC/H.265; H.264; Kakadu; Open JPEG 2000; PSNR; SSIM

  1. 介绍

根据摩尔定律,计算能力每年都在翻倍,设备变得更便宜、更高效,然而从硬件中榨取每一分性能的欲望却在不断增长。过去的超级计算机今天的智能手机今天的智能手机将是明天的可穿戴设备,但限制是在电力消耗方面。随着设备变得越来越小,电池的容量就会降低。通过有效地利用系统资源,可以保持功能与功耗之间的平衡[1]. 大多数的消费设备被用作多媒体设备;因此,以最低的比特率和功耗提供视觉上吸引人的多媒体内容是当务之急。在这一追求中,视频编解码器一直在发展,试图在质量和性能之间建立完美的平衡。已经发布了许多编解码器,但是很少有能够引起内容制作者的注意。从1994年到2013年,视频压缩技术发生了很大的变化。 目前的HEVC在存储内存、解码时间、比特率等方面都有较大的改进[2], [3]。

Department of Electronic Engineering University of Engineering amp; Technology Abbottabad, Pakistan, mohsin.bokhari@nwfpuet.edu.pk

与H.264相比,HEVC能够实现两倍的压缩性能,同时保持相同的视频质量。HEVC通过增强的内预测、去相关变换、去阻塞滤波器、运动估计和变长熵编码来实现这一点,从而在高压缩比下产生良好的质量[2], [4]。

早在2004年,人们就开始致力于开发一种能够产生高压缩率、高质量视频的编解码器。ITU-T VCEG(视频编码专家组)开始研究H.264/AVC的继任者将吸收的各种潜在技术。KTA是一个由VCEG和MPEG联合视频团队为H.264/AVC开发的联合模型(JM)支持的软件代码库,用于评估这种联合征求建议书(CfP)。2010年与MPEG标准化为HEVC联合项目。HEVC的第一个版本于2013年完成并发布。 [5].

为了达到高压缩比的要求,考虑到这些编解码器和目标设备的最常见用途,即通常具有非常低的电池电量储备,以维持和维持设备更长的使用时间,编解码器的计算性能也非常重要。从压缩比高、性能好、功耗低等方面对编解码器进行挖掘是本文研究的主要目的。

  1. 视频编解码器和库

本节将简要介绍所选的编解码器及其各自用于视频编码的软件库。

A. HEVC(高效视频编解码器)

HEVC是H.264/MPEG-4 AVC(高级视频编码)的继承者。HEVC的目标包括易于传输系统集成、编码效率、使用并行处理体系结构实现和数据丢失恢复能力。HEVC 包括帧间预测, 帧内预测,

978-1-4673-9666-0/15 $31.00 copy; 2015 IEEE

216

DOI 10.1109/FIT.2015.46

去块滤波器,CABAC熵编码,这是增强的H.264编码工具。除了上面提到的工具, HEVC还集成了最先进的编码机制,如样本自适应偏移量、自适应偏移量、编码树单元(CTU)、波前编码模式(modesamp;tile)。HEVC版本1演示了Main、Main 10和Main静态图片概要文件。版本2引入了一个多视图概要文件、两个可伸缩扩展概要文件和21个范围扩展概要文件[6], [7]。

为了获得更好的压缩性能,HEVC的复杂度代价是无法精确测量的。然而,与H.264相比,HEVC设计的某些方面需要更多的处理,而其他方面则被削减了[8]。

HM version 14用于HEVC/H的评估。265内部和内部编码,内部周期为1,最大编码单元(max CU)为64x64,切片模式为0,切片参数为1500。HM的源代码是从他们的网站下载的,并使用微软的Visual Studio 2005在默认设置下编译。

B. H.264/AVC(高级视频编解码器)

H.264或AVC(高级视频编码)是广泛采用的标准,ISO、ITU和IEC首次在同一国际标准上合作开发H.264。H.264在健壮性、延迟、编码能力和复杂度方面都有很大的改进。它提供了一个潜在的创造更好的视频编码器,提供更高质量的视频流在相同的比特率,或在另一方面,降低比特率在相同质量的视频。除了H.264中的编码选项外,还包括多个参考帧、可变块大小、高级熵编码、循环/去块滤波器等等。H.264支持的一些编码概要文件包括基线、Main、High、High10和扩展概要文件。在相同的视频质量下,与MPEG-4 part2标准相比,H.264可以减少50%的数字视频文件大小 [9], [10]。

版本18.6用于评估H.264/AVC不同概要文件(main、high和基线)的互编码。我们使用Microsoft的Visual Studio 2005在默认设置下编译了从JM网站下载的源代码。

C. Motion JPEG 2000

运动JPEG 2000是用于视频序列编码的编解码器之一,是jpeg2000的扩展。在1996年,对于当前和未来的应用,JPEG委员会开始研究一种新的静态图像压缩标准JPEG2000的可能性。JPEG2000编码一组独立编码的视频JPEG图像序列。由于没有运动补偿,没有解决视频中的时间冗余问题,从而获得了较低的压缩比。没有解压和重新压缩,运动JPEG 2000视频流可以编辑,因为每个帧的视频是单独编码的。

它加快了编辑过程,并使函数更快,如逐帧反向播放 [11], [12]。

  1. Kakadu: Kakadu是一个用于JPEG 2000图像和运动JPEG视频编码的闭源库。它是由大卫陶布曼写的。它被用于苹果的Quick time播放器。它执行ISO/IEC 15444-1标准。我们用它来以不同的速率编码视频。
  2. OpenJPEG: OpenJPEG是一个开源库,用于编码jpeg2000图像和动态jpeg2000视频,并积极维护。它由libj2k派生而来,libj2k是另一个由David Janssens编写的开源jpeg2000库。OJ2为Linux和Windows提供了MJ2和JP2的开源c语言实现[13]。
  3. 客观视频质量评估方法

编解码器比较的主要特点是视频质量。视频质量评估可以是客观的,也可以是主观的。主观评估显示了视频在观看者看来是多么的明显,但是这种测试在时间和人力资源方面是相当昂贵的。由于这一事实,目前使用最多的方法是客观质量评价方法,它产生的值对视频质量进行评分。该方法包括使用称为度量的计算方法。常用的客观指标有峰值信噪比(PSNR)和结构相似度指数(SSIM) [14]。

A. PSNR (峰值信噪比)

PSNR是应用最广泛的视频质量指标。定义为 (1):

(1)

其中m为最大像素值,例如,对于8位图像,其值为255,MSE为(2)中定义的均值的平方误差,为两幅图像或序列I和中像素灰度值之间的平方差异的平均值。

(2)

其中X和Y是图片的大小,T是帧。从技术上讲,PSNR测量图像的保真度,而MSE测量图像的差异。PSNR指标计算简单、快速,是其主要优点 [14]。

B. SSIM (结构相似度指数)

该方法不同于基于误差的PSNR方法。由于人眼视觉系统更专注于结构信息的提取,对结构的误差提取不具有针对性,SSIM代替了传统的结构畸变测量方法。因此,SSIM指标与主观印象具有良好的相关性 [14]。

SSIM度量的一般公式由(3)给出,(3)是两个窗口x和y之间的度量,共同大小为Ntimes;N。

(3)

mu;x x的平均值,mu;y y的平均值,4的5 x的方差,4 6 y的方差,而456年是x和y的协方差。与弱稳定部门分母两个变量C1 = (k1L) 2和C2 = (k2L) 2 K1 = 0.03,使用K2 = 0.05和L是像素的动态范围。SSIM的合成值在区间[0,1],其中1代表最佳质量,0代表最差质量。SSIM是基于图像信号之间有很强的关联性的思想而设计的,图像信号之间有很强的关联性,可以获得场景中物体结构的信息。与PSNR或MSE的区别在于,SSIM将图像退化看作是结构信息的明显变化,而PSNR或MSE则试图估计明显的误差[15]。

IV. 模拟环境

在展示性能结果之前,有必要定义测试条件,这些条件必须从实际的角度出发是相关的和有意义的,以便结论可能是可靠和有用的。在实验中,我们使用了Microsoft Windows 7(32位)ultimate PC。

处理器:Intel (R) core(TM) i3-3110M CPU @ 2.40GHz

系统类型:32位操作系统

已安装内存(RAM): 2.00 GB(可用1.86 GB)

所有的实验都是在相同的环境下进行的。

  1. 压缩性能

我们比较了HEVC intra的压缩性能,使用随机访问主概要文件的HEVC互编码,不同概要文件的H.264互编码,如main、high和baseline概要文件和Motion jpeg2000。对于MJ2K,我们使用了两个不同的流行库;Kakadu

表 I. 视频序列详情

序列的名字

分辨率

帧率

Station

1920x1080

30

Pedestrian

1920x1080

30

Kimono

1920x1080

30

是一个封闭的源代码库,在一些流行的软件中使用,如苹果的QuickTime和OpenJPEG,这是一个用于jpeg2000编码和解码的开放源代码库。我们编码了3个全高清(1080p)原始YUV 4:2:0彩色格式和8位/彩色视频不同的压缩率。实验所用的视频序列如表i所示。为了便于理解,每个序列编码50帧。我们主要专注于高分辨率(HD)视频内容。每个序列都用运动JPEG、H.264和H.265标准以不同的数据速率压缩。此外,为每个视频序列选择四个量化参数(QP)值(16、24、32和40)。Kakadu和OpenJPEG的默认设置

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[20076],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版