一、文献综述
(一)国内外研究现状
点云是一种基本的三维表示,在计算机图形学中的应用已久,是最常用的三维模型。随着3D采集技术的飞速发展,点云模型在虚拟现实、增强现实、智慧城市和无人驾驶等领域起到了重要作用[1]。因为对海量的点云数据做处理需要大量的资源,为了降低数据存储的空间和数据传输带宽的需求,需要点云压缩技术做支持。近年来,点云压缩技术越来越成为支撑点云广泛应用的关键技术之一[2]。
目前ISO/IEC的MPEG(Moving Picture Experts Group)正在开展点云压缩标准化工作。定义了3种点云类型:静态点云、动态点云和动态获取点云。除此之外,他们还将点云压缩分为两种模式:基于视频编码的V-PCC(Video-based Point Cloud Compression)和基于几何体的G-PCC(Geometry-based Point Cloud Compression)[17]。V-PCC是将点云数据从3D转换为2D,再利用成熟的图像或视频压缩技术进行压缩。但这类基于映射的压缩方法并不适用于稀疏点云。G-PCC将点云的几何信息与属性信息独立出来,优先对几何数据进行编码。
在常见的点云压缩的算法中,八叉树(Octree)通常被用于点云的几何数据编码,是处理三维点云数据的重要数据结构。由于传统压缩方法的局限性以及深度学习在二维图像上广泛应用。近年来,深度学习不断被运用在三维模型的压缩中,借助神经网络学习点云的属性以及坐标的关联性[4]。3DCNN是压缩三维数据的先驱,最初应用在体素网格和深度图中,由于3D卷积计算量过大,能处理的数据较少。因此PointNet诞生了,作为研究点云深度学习的先驱,提供了对象分割、场景语义等应用,该网络不仅结构简单而且非常高效[6]。它直接将点云作为输入,通过计算法线和全局特征添加信息。但因为PointNet简单的将点云化为了一个全局特征值,网络没有学习到局部点之间的联系,导致了PointNet识别复杂场景的能力受到极大限制.基于分层抽取特征的思想,PointNet 诞生了[7]。该网络已在点云压缩中得到了广泛应用。
点云几何信息的编码方法主要可以分成3类:基于树结构的方法、基于表面近似的方法和基于映射的方法;点云属性信息压缩的编码方法主要可以分成3类:基于变换的方法、基于预测的方法和基于映射的方法[2]。针对点云特性,采用合适的编码方法,是提升点云压缩性能的关键。正是因为点云数据的多样性,很少有一种压缩手段在所有特性的点云数据中都有较高的性能。不论是传统的压缩方法还是基于深度学习的压缩技术,实现高效的点云压缩算法,为点云的广泛应用做技术支撑,是现阶段国内外的研究热点。
(二)研究主要成果
根据点云中的密度,可以将点云大致分为稠密点云和稀疏点云[2],V-PCC能够较好压缩稠密点云,G-PCC则能够较好的压缩稀疏点云。MEPG的标准点云压缩方法(G-PCC)与Google的基于kd树的方法(“Draco”)是现阶段最具有代表性的手工点云压缩方法,新的点云压缩算法通常将它们作为基线算法。
VoxelDNN[15]提出了一种基于八叉树/体素混合的点云几何无损压缩方法。它首次在体素空间中使用深度生成模型来顺序估计占用概率。结合速率优化的分区策略,该方法优于MPEG的G-PCC,在所有测试数据集上平均节省28%的速率。
MSVoxelDNN[10]提出的多尺度VoxelDNN方法来无损编码密集点云的几何形状,可以说是VoxelDNN的升级版本与G-PCC相比,MSVoxelDNN的比特率平均降低了17%。除此之外MSVoxelDNN的性能可以通过优化体素的分组来进一步提高,这样可以只删除那些对条件占用概率估计没有显着贡献的依赖项。MSVoxelDNN首次在体素域中引入多尺度深度上下文模型来估计占用率能力,其中更高分辨率的尺度以较低分辨率的尺度为条件进行建模。但是该方案在稀疏点云上的性能较差。
