为什么DCT变换比视频/图像压缩中的其他变换更受欢迎

我经历了如何在图像和视频压缩标准中使用DCT(离散余弦变换)。

但是为什么只有DCT比其他转换如dft或dst更受欢迎?


因为cos(0)是1,所以DCT-II的第一个(第0)系数是被转换值的平均值。 这使得每个8×8块的第一个系数代表了其组成像素的平均色调,这显然是一个好的开始。 随后的系数增加了细节层次,从清扫梯度开始,并逐渐变成越来越多的模式,并且恰好发生了前几个系数捕获摄影图像中的大部分信号。

Sin(0)为0,所以DST以0.5或1的偏移量开始,第一个系数是一个平缓的丘,而不是平坦的平原。 这不太适合普通图像,结果是DST需要比DCT更多的系数来编码大多数块。

DCT恰好适合。 这确实是全部。


在执行图像压缩时,我们最好的选择是执行KLT或Karhunen-Loève变换,因为它会导致原始图像和压缩图像之间的最小均方误差。 然而,KLT依赖于输入图像,这使得压缩过程不切实际。

DCT是最接近KL变换的近似值。 大多数情况下,我们对低频信号感兴趣,所以只有偶数分量是必需的,因此它在计算上只能计算DCT。

此外,使用余弦函数而不是正弦函数对于压缩非常重要,因为需要较少的余弦函数来近似典型的信号(请参阅Douglas Bagnall的答案以作进一步解释)。

使用余弦的另一个优点是缺少不连续性。 在DFT中,由于信号是周期性表示的,所以当截断表示系数时,信号将倾向于“失去其形式”。 然而,在DCT中,由于连续的周期性结构,信号可以承受相对较多的系数截断,但仍然保持期望的形状。


顶部和底部和/或左右边缘不匹配的图像宏块的DCT在较高频率系数中将具有比DFT更少的能量。 因此允许更多的机会去除这些高系数,更粗略地量化或压缩,而不会产生更多可见的宏块边界伪影。

链接地址: http://www.djcxy.com/p/62887.html

上一篇: why DCT transform is preferred over other transforms in video/image compression

下一篇: Quantization in JPEG Image Compression