MPEG如何工作
MPEG-1的特点是它是一种有损的,非平衡编码。有损意味着为达到低比特率,一些图像和伴音信息将丢失。通常这些信息是人眼和人耳最不敏感的信息,因此即使以1x
CD-ROM的速率压缩也能达到VHS的图像质量和高保真立体声的效果。MPEG采用非平衡编码意味着压缩一幅图像比解压缩慢的多。
MPEG-1的数据流包含3种成分:图像流,伴音流和系统流。图像流仅仅包含画面信息,伴音流包含声音信息,系统流实现图像和伴音的同步。所有播放MPEG图像和伴音数据所需的时钟信息都包含在系统流中。
MPEG用复杂的数学和心理学技术达到它的压缩结果。MPEG伴音压缩编码利用了人耳灵敏度的研究结果,图像编码利用人眼对亮度,颜色,运动的灵敏度的一些有利结果。
MPEG伴音
CD伴音两个通道共包含1.4Mbit/秒的数据流。听觉心理学研究表明,采用适当的压缩技术,此数据流可以压缩到256Kbit/秒而不会感觉到任何失真。MPEG伴音利用这个结果,尽管一些MPEG压缩器不支持高质量图像。
MPEG伴音编码可以实现3种压缩等级。等级I是简单压缩,它是一种听觉心理学模型下的亚抽样编码。等级II加入了更高的精度,等级III加入了非线性量化,Huffman编码和其他实现低速率高保真图像的先进技术。依次下去的等级提供了高质量和越来越高的压缩率,但要求计算机有越来越强的压缩能力。MPEG等级II可以把一个1.4Mbit/秒的立体声数据流压缩到32Kbit/秒-384Kbit/秒而保持高保真的声音。典型数据为,等级I的目标是每个通道192Kbit/秒,等级II的目标是每个通道128Kbit/秒,等级III的目标是每个通道64Kbit/秒。目标II要达到64Kbit/通道时不如等级III效果好,而在128Kbit/通道,等级II和等级III的效果一样,而且都比等级I效果好。正如上面所说的,每通道128Kbit/秒或者说两通道256Kbit/秒可以达到很好的保真度。因此,等级II对于高保真立体声音响是必要的,但也已足够了。
MPEG-1支持设置为单声道,双声道,立体声或联合立体声的两个声音通道,等级II的联合立体声把声音信号的高频部分(高于2KHz)结合起来,立体图像整个保存下来,但仅传输瞬时包络。等级I不支持两和立体声。有些MPEG压缩器不能产生等时II的伴音流,从而声音保真度较低而且没有联合立体声功能。
MPEG图像编码
MPEG图像编码包含3个成分:I帧,P帧和B帧。MPEG编码过程中,一些图像压缩成I帧,一些压缩成P帧,另一些压缩成B帧。I帧压缩可以得到6;1的压缩比而不产生任何可觉察的模糊现象。I帧压缩的同时使用P帧压缩,可以达到更高的压缩比而无可觉察的模糊现象。B帧压缩可以达到200:1的压缩比,其文件尺寸一般为I帧压缩尺寸的15%,不到P帧压缩尺寸的一半。I帧压缩去掉图像的空间冗余度,P帧和B帧去掉时间冗余度,下文将进一步解释。
I帧压缩采用基准帧模式,只提供帧内压缩,即把帧图像压缩到I帧时,仅仅考虑了帧内的图像。I帧压缩不能除去帧间冗余度。帧内压缩基于离散余弦变换(DCT),类似于JPEG和H.261图像中使用DCT的压缩标准。
P帧采用预测编码,利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。P帧预测当前帧与前面最近的I帧或P帧的差别。
B帧为双向帧间编码。它从前面和后面的I帧或P帧中提取数据。B帧基于当前帧与前一帧和后一帧图像之间的差别进行压缩。
MEPG数据流开始时对CCIR-601规定的SIF分辨率的未压缩数字图像进行抽样。SIF分辨率,对于NTSC制,就是亮度信号为352*240各像素,每个色度信号都为176*120个象素。各信号都是每秒30帧。MPEG压缩器决定了当前帧以I帧,P帧还是B帧。帧确定之后就采用DCT变换,对结果进行量化,舍入,行程编码即变长编码。编码后的典型图像帧序为:IBBPBBPBBPBBIBBPBBPBBPBBI…
B帧和P帧要求计算机有更强的功能。有些压缩器不能产生B帧或者连P帧也不能产生,则图像的压缩结果将有很明显的间断。