引用:
原帖由 w丫333 于 2005-8-16 19:23 发表
WMV-HD MPEG2 是什么英文的缩写??DXVA是什么东西??是一种软件么?
要有耐心我是新手所以很多都不是很懂。基本上我没太看明白。
1:微软的WMV HD全称Windows Media High Definition Video
2:MPEG2 压缩格式的一种
3: DXVA (DirectX Video Acceleration)加速补丁,是视频解码调用显卡驱动来进行加速的软件补丁。前提是装好DirectX,然后显卡也要支持。
MPEG2技术简介
MPEG2技术推出以来,基于MPEG2技术的新设备不断推出,吸引了广播电视行业的众多目光。在中国,MPEG2也越来越成为焦点,视频厂商也在热炒MPEG2技术,许多电视台正在思考自己需要使用哪些MPEG2产品。为了便于电视台选择设备,我们完全从技术的角度出发,客观地向大家介绍MPEG2技术的特点和目前的发展状况,期望对大家有所帮助。
一、MPEG2的起源:
MPEG译为运动图像专家组,它是在ISO的召集下,为数字视频和音频制定压缩标准的专家组。1994年推出了MPEG2压缩标准。
二、MPEG2的色度取样
目前在广播界的视频应用中,一般色度取样分为4:2:0和4:2:2两种。
三、MPEG中的图象类型
MPEG2在压缩中使用了帧间压缩和帧内压缩两种方式。为了在编玛中实现最大的压缩比,MPEG使用三种类型的图像,即I帧,P帧种B帧。
I帧是帧内压缩,不使用运动补偿,提供中等的压缩比。由于I帧不依赖于其它帧,所以是随机存取的入点,是基准帧。
P帧根据前面的I帧或P帧进行预测,因而压缩比要比I帧高,数据量平均达到I帧的1/3左右。P帧是对前后的B帧和后继的P帧进行解码的基准帧。P帧本身是有误差的,如果P帧的前一个基准帧也是P帧,就会造成误差传播。
B帧是基于内插重建的帧,它基于前后的两个I、P帧或P、P帧,它使用双向预测,数据量平均可以达到I帧的1/9左右。B帧本身不作为基准,因此可以在提供更高的压缩比的情况下不传播误差。
需要指出的是,尽管我们使用帧这个词,但是MPEG2 本身没有规定必须使用帧作为单位,可以使用场作为单位,起始为I帧。一般是一秒内有两个I帧,用来作为随机存取的入口。帧重复方式可以是IP,IB,IBP,IBBP,甚至全部是I帧。基准帧的重复频率用M表示。不同的帧重复频率提供不同的输出码率,同时影响存取延迟。
四、MPEG2中的音频
MPEG2在压缩编码时,视频和音频相互独立。MPEG2标准的第三部分描述了多通道音频编码方法,声道达到5.1个。 再此我们不多描述音频的处理。
五、MPEG2与其它压缩方式的比较
目前的数字图像压缩格式除了MPEG2还有很多种,低速视频传输用的H261、H263等,以及DV格式和目前在中国数字视频领域应用广泛的MJPEG。
1、M-JPEG、DV和MPEG2都由硬件支持,可以保证在支持正常的视频帧频率情况下,提供相当好的图像质量。
2、在同样的视频质量下,压缩算法的输出码率直接决定其性能的优劣,或者说,输出码率相同的条件下,图象质量的优劣反映了压缩算法的性能。由于M-JPEG和DV都是采用帧内压缩方式,它们的压缩效率当然要比MPEG2低。当然,这是一个平均情况,在低码率的时候,MPEG2可以比M-JPEG的压缩比高很多而保持较好的图像质量;而在要求图像质量很好的时候(比如演播室节目编辑和后期制作),它们的差别不是很大。也就是说,只是在不强调图象质量的情况下,MPEG2的压缩效率比较高。
3、由于电视台业务的多样性,要求一个压缩标准能提供多种码率。压缩算法的可编码率特性对电视台有效利用资源有非常重要的作用。MPEG2可以调整输出的码率。DV格式基于它的应用特点,不可以调整输出码率。M-JPEG虽没有帧间编码,但是也可以通过改变编码参数调节压缩比。
4、M-JPEG发展较早,在非线性编辑系统上使用了多年,软、硬件比较成熟,成本低廉,稳定性好。
5、DV的优势是与磁带的结合紧密。
6、M-JPEG和DV都是帧内压缩的方式,可以提供精确到帧的随机存取访问,不附带任何的访问延迟,这与MPEG2有很大的不同。
7、I帧的MPEG2只采用帧内压缩算法,基本和MJPEG相同。区别是I帧的MPEG2有码率上限,因而总是有图象损伤的,而MJPEG没有码率上限,可以应付对图象质量要求很苛刻的情况。
8.MPEG2分为几种不同的压缩方式,I帧高码率的图象质量好,但是存储空间与MJPEG基本相同;IBP帧码率小,空间要求小,但是图象质量很差,多半合成后图象劣画很明显。所以单一MPEG2不能满足统一格式的要求。(解释:大洋公司将推出的新产品支持多格式混编,可以支持DV25、DV50、MPEG2 I 、MPEG2 IBP等。)
六、MPEG2典型应用
MPEG2有两个大的特点,一个是运动补偿带来的高压缩比,另一个就是根据不同的需求,通过参数的调节做到码率可变。以下是几种典型应用。
1、 数字化片库:压缩比的提高对节目的存储所需要的资源大大降低。采用基于MPEG2的数字化节目库可以以较小的成本取得很好的效益。
2、 节目传输:高压缩比和可变的输出码率使得MPEG2技术在节目传播应用上发展迅速。在低至1.5MBIT/S的码率下,MPEG2数据流仍然能提供相当的图象质量,因此目前的模拟电影频道甚至可以传送四路电视节目。这在地面广播、有线电视和卫星广播上都很有吸引力,可以节约大量的成本。
3、 高清晰度电视:由于高清晰度电视的分辨率很高,带来的问题是所需的节目传输带宽很高,必须使用高压缩比才有可能传送高清晰度电视。在这一点上,目前只有MPEG2技术能够胜任。
4、 在数字化视频磁带、激光视盘、电视会议以及数字照相机等方面,MPEG2也具有很广的应用前景。
七、MPEG2的缺点
1、 MJPEG、DV都能提供精确到帧的随机访问,但是,MPEG2的压缩数据码流是基于I、P帧的或I、P、B帧的,就不能做到这一点。这在非线性编辑时会引起素材搜索的迟缓等。
2、 由于存在技术进步的空间,目前,购买某些MPEG2设备可能会存在一定的投资风险。(备注:将来可能会采用MPEG4或其它方式。)
3、 在目前的情况下,以MPEG2作为电视台的主要视频格式,不可避免地存在需要转码的要求。而MPEG2压缩方式的特点导致了转码过程中可能出现严重的图象劣化。
MPEG2技术详解及其应用
从MPEG2技术标准出台以来,基于MPEG2技术的电视台业务解决方案和新设备不断推出,吸引了广播电视行业的众多目光。在中国,MPEG2 也越来越成为焦点,视频厂商也在热炒MPEG2技术,许多电视台正在思考自己需要使用哪些MPEG2产品。为了便于电视台选择设备,我们完全从技术的角度出发,客观地向大家介绍MPEG2技术的特点和目前的发展状况,期望对大家有所帮助。
MPEG2的起源
MPEG(Motion Pictures Experts Group),译为运动图像专家组,它是在International Standards Organization(ISO,国际标准化组织)的召集下,为数字视频和音频制定压缩标准的专家组。该组织最初在1992年制定了MPEG1的标准,应用于激光视盘的节目传播。广播电视行业从MPEG1标准的应用上看到了MPEG技术对于电视行业的意义,于是该组织又在1994年推出了MPEG2压缩标准,建立了全世界范围内视音频服务与应用进行相互操作的可能性。
有三个关键的压缩技术被MPEG压缩标准使用,这就是离散余弦变换(DCT)、运动补偿(Motion Compensation)和Huffman编码。DCT降低了图像的空间(Spatial)冗余度,运动补偿降低了图像的时间(Temporal)冗余度,而Huffman编码则降低了图像在信息(Entropy)方面的冗余度。这几种技术的综合应用,使得MPEG的压缩率较高。
MPEG2标准类似于MPEG1,但是它的适应性更强,可以适用于广播电视的所有过程和环节。从定义上来看,MPEG1实际上是MPEG2的一个子集。这在后面的MPEG2的类和级的分类表中可以看出。
MPEG2标准分为四个文件,分别是:
系统层(System,ISO13818-1),描述视、音频的数据复用方式和视、音频同步方式。
视频压缩层(Video,ISO13818-2),描述数字视频编码方式和解码过程。
音频压缩层(Audio,ISO13818-3),描述数字音频编码方式和解码过程。
一致性(Conformance,ISO13818-4),说明测试编码码流的过程,检验是否符合前三个文件的规定。
MPEG2的类(Profile)和级(Level)
MPEG2压缩算法在设计时被定义为一个通用的视音频压缩标准,要求能兼顾不同的应用要求,可以对压缩的输出码率和图像质量进行控制。为此,MPEG2压缩算法分成不同的级别和类别。类定义色度空间分辨率和输出比特流控制,级则定义图像分辨率、亮度取样频率、可分级的类所能支持的视音频的层数、对应于该级的每一类的最大比特流。表1是一个MPEG标准的类和级的简单描述(有些类上的增强层没有列出)。
目前在广播界的视频应用中,一般是MP@ML(色度取样为4:2:0),和HP@ML(或称为422P@ML,表中的Studio类,色度取样为4:2:2)两种。这两种压缩方式的码率分别在5~15MB/S和15~50MB/S。
MPEG为更好地表示编码数据,用句法规定了一个层次性的结构。其结构分为六层,自上到下分别是:
图像序列层(Video Sequence)
图像组(GOP,Group of Pictures)
图像(Picture)
宏块条(Slice)
宏块(Macroblock)
块(Block)
图像序列是由图像组构成的,有表示开始的图像序列头和表示结束的图像终止码。是随机存取段落。
图像组(GOP)是为方便随机存取而加的,其结构和长度均为可变的,MPEG2对此没有硬性规定。GOP有两个参数,即长度(N)和帧重复频率(M),下面将会作解释。图像组是随机存取视频单位。
图像是独立的显示单位,也是基本编码单位。在MPEG2中,图像可以是逐行的,也可以是隔行的,这一点与MPEG1不同,MPEG1总是逐行的。
宏块条包含若干个连续的宏块,是重新同步单位。宏块条的设置目的是防止误码的扩散,当一个宏块条出现误码时,不影响后续的宏块条解码。
图像以亮度阵列被分成16X16的宏块,宏块是进行运动补偿的基本单位。一个宏块包含4个8X8的亮度块,依据类的不同,一个宏块还包含两个8X8色度块(R-Y和B-Y各一个,4:2:0取样时)或四个8X8色度块(R-Y和B-Y各两个,4:2:2取样时)。块是进行DCT运算的单位,仅包含亮度或仅包含色度。
MPEG中的三种图像类型及码流组成
我们已经提到,MPEG是基于DCT、运动补偿和Huffman编码算法的,由此,MPEG在压缩中使用了帧内压缩和帧间压缩两种方式。为了在编码中实现最大的压缩比,MPEG使用三种类型的图像,即I帧,P帧和B帧。
I帧(Intra-Frame)是帧内压缩,不使用运动补偿,提供中等的压缩比。由于I帧不依赖于其他帧,所以是随机存取的入点,同时是解码中的基准帧。
P帧(Predicated-Frame)根据前面的I帧或P帧进行预测,使用运动补偿算法进行压缩,因而压缩比要比I帧高,数据量平均达到I帧的1/3左右。P帧是对前后的B帧和后继的P帧进行解码的基准帧。P帧本身是有误差的,如果P帧的前一个基准帧也是P帧,就会造成误差传播。
B帧(Bidirectinal-Frame)是基于内插重建的帧,它基于前后的两个I、P帧或P、P帧,它使用双向预测,数据量平均可以达到I帧的1/9左右。B帧本身不作为基准,因此可以在提供更高的压缩比的情况下不传播误差。
需要指出的是,尽管我们使用帧(Frame)这个词,但是MPEG2本身没有规定进行数字图像压缩时必须使用帧作为单位,对于隔行的视频图像,可以使用场(Field)作为单位。
一个GOP由一串IBP帧组成,起始为I帧。GOP的长度是一个I帧到下一个I 帧的间隔,一般用N表示,图1中的N=9。这个长度是可变的,长GOP可以提供高的压缩比,但是会造成随机存取的延迟(必须等到下一个I帧)和误差的积累(P帧的误差传播)。一般是一秒内有两个I帧,用来作为随机存取的入口。
图1 GOP中的图像序列
在MPEG2中也没有规定GOP的结构,帧重复方式可以是IP,IB,IBP,IBBP,甚至全部是I帧。基准帧的重复频率用M表示,图1中的M=3。不同的帧重复频率提供不同的输出码率,同时影响存取延迟。
MPEG2的音频
前面提到过,MPEG2的标准的第一个文件(系统部分)中,规定了如何组合视频和音频数据的复接结构,以及用来代表时间信息的方法。但是在压缩编码时,视频和音频相互独立。MPEG2标准的第三部分描述了多通道音频压缩编码方法,声道达到5.1个。本文只着重讨论MPEG2的视频应用,因此我们不过多描述音频的处理。
MPEG2带来了什么?
新的技术总是带来更大的好处,同时由于有这样那样的某些局限,每种技术总是存在一些折衷,MPEG2也不例外。我们来看看MPEG2为广播电视带来了什么。
压缩标准的比较
目前的数字图像压缩格式还是很多的,并不只有大家关注的MPEG2这一种。其他的格式还有几种,象Apple的QuickTime,Intel的Indeo,Radius的Cinepak,低速视频传输用的H261、H263等,以及DV格式和目前在中国数字视频领域应用广泛的M-JPEG。在这么多的压缩格式中,广播电视行业根据什么来选择使用不同的压缩标准?
首先,广播电视行业需要的是高质量、兼容性好的压缩算法。QuickTime、Indeo和Cinepak 都没有提供对声音的压缩,基本都是以软件压缩/解压缩为主,包括H261、H263在内,都存在帧频低、图像质量差或需专门的平台支持等问题,因此不适于在广电领域使用。相反,M-JPEG、DV和MPEG2在硬件的支持下,可以保证在支持正常的视频帧频率情况下,提供相当好的图像质量。这就决定了只能是M-JPEG、DV和MPEG2可以在电视台占一席之地。
其次,在同样的视频质量下,压缩算法的输出码率直接决定其性能的优劣,或者说,输出码率相同的条件下,图像质量的优劣反映了压缩算法的性能。由于M-JPEG和DV都是采用帧内压缩方式,它们的压缩效率当然要比MPEG2低。当然,这是一个平均情况,在低码率的时候,MPEG可以比M-JPEG的压缩比高很多而保持较好的图像质量;而在要求图像质量很好的时候(比如演播室节目编辑和后期制作),MPEG2与M-JPEG的输出码率差别不是很大。
第三,由于电视台业务的多样性,要求一个压缩标准能提供多种码率。比如说节目传播环节,在传播不同类型的节目时,所需的带宽是不同的,体育节目要比新闻节目的码率高,而新闻节目又要比电影节目高。再比如,考虑到进行过程中复制次数的不同,节目制作环节和节目传播环节所需的码率也不同,传播环节可以使用低码率。压缩算法的可变码率(VBR,Variable Bit Rate)特性对电视台有效利用资源有非常重要的作用。MPEG2可以通过改变GOP结构和DCT及Huffman编码的参数等手段来调整输出的码率,DV格式基于它的应用特点,没有提供VBR技术。M-JPEG虽没有帧间编码,但是也可以通过改变DCT及Huffman编码参数调节压缩比。
通过以上讨论,我们可以看出,MPEG2标准在压缩性能上,确实具有比其他标准优越的地方。因此,虽然在目前的电视业务中,基于M-JPEG、DV和MPEG2三种压缩标准的设备都在被使用,但大家普遍地更关心MPEG2的发展动态。
目前的实际情况是:虽然MPEG2成为电视行业的热点,但M-JPEG、DV仍然在电视业务中大量使用。这是有原因的。M-JPEG发展较早,经过多年的在非线性视频编辑上的应用,软、硬件技术成熟,成本低廉,以目前的硬件平台的价格来看,平均比MPEG2平台便宜5000$左右。DV的优势是与磁带的结合紧密。另外M-JPEG和DV都是帧内压缩方式,可以提供精确到帧的随机存取访问,不附带任何的访问延迟,这与MPEG2有相当大的不同。
现在大家在讨论MPEG2标准的好处的时候,最强调的一点是其压缩效率高。这是不可否认的事实。从表3中我们就能很清楚地看到这一点。但是有个误区必须加以澄清,就是这个事实只发生在不强调图像质量的情况下。这对电视台业务的大部分应用场合是适用的,但是存在相反的情况。一个典型的不适用的例子就是演播室节目编辑和后期制作。电视台在演播室进行节目编辑时,对图像质量要求都很高,如果采用MPEG2技术的话,必须采用低压缩比、色度采样为4:2:2的码流才能满足要求,欧洲广播联盟推荐电视台在演播室使用基于I帧的4:2:2的MPEG2压缩标准就是证明。这时的输出码率甚至会达到50Mbit/S码率上限,在这么高的码率上,MPEG2相对于另外两种标准的压缩比优势就不明显了。如果我们仔细算算账的话,在大容量存储介质频频降价的今天,在演播室节目编辑和后期制作环节上,MPEG2带来的好处不再显得那么重要。我们应该着眼的MPEG2的优势,应该是其他的一些方面,在下面我们会介绍。
前面提到基于I帧的MPEG2格式,我们顺便介绍一下。I帧的MPEG2只采用帧内压缩算法,基本和M-JPEG相同,区别是I帧的MPEG2有码率上限,因而总是有图像损伤的,而M-JPEG没有码率上限,可以达到1.6∶1的低压缩比,因此可以应付对图像质量要求非常苛刻的情况。
通过以上的讨论,我们看到M-JPEG、DV和MPEG2各有优缺点。正是由于这些特点,使得目前在电视台的设备中,三种压缩标准并存。
电视台在是否选择MPEG2设备的问题上,存在的一个担心是,投资MPEG2设备到底能带来多大的收益?MPEG2标准能不能成为一种贯穿电视台全部业务的纽带,从而使电视台的工作进行得更有效率呢?在本文的后续部分中,我们会继续讨论。
MPEG2带来的好处
我们认为,MPEG2标准带来的好处体现在它的适应性。MPEG2在开始制定的时候,有大量的广播电视设备供应商参与,被设计成能满足多种应用需要的标准。体现在其特性上,有两个大的特点。一个是运动补偿带来的高压缩比,另一个就是根据不同的需求,通过参数的调节做到码率可变。从MPEG2标准的文件内容中我们可以看出,MPEG2针对性最强的应用是存储和传输,因为MPEG2详细定义了压缩数据在存储和传输中的句法结构,并且只定义了对MPEG2压缩数据的解码过程。基于这些特点,目前,MPEG2技术在电视业务的某些应用上具有不可比拟的优势。以下是几种典型的应用。
数字化片库。压缩比的提高对节目的存储所需要的资源大大降低。一般电视台目前保存的节目带数量惊人,传统的用视频磁带保存节目带来的问题是图像质量下降甚至损坏,而且不便于管理,在节目带的共享使用上也难以实现。采用基于MPEG2的数字化节目库可以使这些问题得以较好的解决,以较小的成本取得很好的效益。目前有许多公司在开发数字化视频存档系统,其中关键的问题是编制出完善的管理软件。
节目传播。高压缩比和可变的输出码率使得MPEG2技术在节目传播应用上发展迅速。由于在低至1.5MBIT/S的码率下,MPEG2数据流仍然能提供相当的图像质量,因此目前的模拟电视频道甚至可以传送四路电视节目。这在地面广播(Terrestrial Broadcast)、有线电视(Cable TV)和卫星广播(Satellite Broadcast)上都极具吸引力,这意味着在传送相同节目量的情况下,可以节省大量的成本。而且由于MPEG2输出码率可变,可以根据节目类型选择不同的压缩比,以达到更好的资源利用率。正是基于此原因,MPEG2已经被作为数字电视广播的压缩标准,包括欧洲的DVB、美国的ATSC都是基于MPEG2压缩格式的。我国也已经制定了部分基于MPEG2的数字电视广播的标准。
高清晰度电视。由于高清晰度电视的分辨率很高,带来的问题是所需的节目传输带宽很高,必须使用高压缩比才有可能传送高清晰度电视节目。在这一点上,目前只有MPEG2技术能够胜任。
在数字化视频磁带、激光视盘、电视会议以及数字照相机等方面,MPEG2显然也具有相当广的应用前景。而在这些领域,M-JPEG和DV等其他压缩方式无法与其匹敌。
MPEG2带来的问题
在我们对M-JPEG、DV和MPEG2三种压缩方法进行比较的时候,提到了这个棘手的问题:M-JPEG、DV都能提供精确到帧的随机访问,然而,如果MPEG2的压缩数据码流是基于I、P帧的或I、P、B帧的,就不能做到这一点。这是由运动补偿压缩算法带来的,新技术的利与弊就表现在这里。在一个GOP中,要想对P帧和B帧进行解码,必须依赖于I帧,所以在访问一个视频流的时候必须从I帧入口。这个问题在不同应用上带来的后果大相径庭。比如说,电视观众在切换节目频道时,数字视频解码盒等到新频道的I帧到来所产生的延迟不足为患,因为每秒至少有两个I帧,观众不会在意这小小的延迟。但是在电视台业务上却有很大的问题。比如说广告插播很难控制插入的起始点和长度,非线性编辑时素材搜索的迟缓等。当然目前的技术已经足够解决这个问题,能实时对压缩视频码流进行编解码的CODEC可以进行转码处理(Transcoding),从而实现帧精度控制,但这会带来另一个问题,在下一节中我们会解释。
MPEG2还要解决什么?
无可否认,MPEG2作为一种新技术,由于发展时间短,还是存在一些问题,我们在这一节将要进行的谈论,是探讨MPEG2在应用上存在的问题、如何解决以及发展现状。
我们认为第一个需要探讨的是如何改进MPEG2编码硬件平台。在前面已经提到过,MPEG2标准有一个特点,就是它着眼于传输和存储,只定义了压缩数据码流的结构(或者说句法Syntax)和解码端的结构。因此设备供应商可以按自己的技术开发不同的编码器,只要输出的码流符合MPEG2的标准定义即可。这为编码器的压缩算法提供了很大的性能改善空间,同时也导致不同公司开发的编码器的性能也有差异。
进行运动向量估计时的算法精度会明显改变输出码率和图像质量就是一个很好的例子。要进行运动估计,先要确定运动向量,这需要一个搜索窗口(Search Window)。搜索窗口的大小会显著改变输出的码率。搜索窗口越大,输出码率越低,但是图像质量也越差。搜索算法的不同也造成差异。比如说处理P帧时,搜索算法可以使用四种方式,即Exhaustive,SubSample,TwoLevel和Logarithmic。Logarithmic是在速度、压缩比和图象质量间比较好的折衷。Exhaustive算法可以达到很好的压缩比和图像质量,但是处理速度相当地慢。TwoLevel的压缩比要比Exhaustive好一些,但是速度也相当慢。如果硬件处理速度快的话,可以选用压缩比高和图像质量好的算法。而对于处理速度慢的硬件平台,只能牺牲压缩比和图像质量,而对于编码器来说,输出码率必须是相对恒定的,结果最后被割舍的是图像质量。
另一个例子是码率控制的过程。图像压缩比和图像质量是一对矛盾。在一定的码率下,我们希望充分利用规定的码率从而得到最好的图像质量。这个控制过程是包含预测与反馈,实现的方法也有很多种,而其性能也不一样。码率控制不完善的后果要么是浪费了码流(本来可以获得更高的图像质量),要么导致接收端解码器的溢出(解码器的缓冲器大小是有限度的,根据应用方向的差别大小也不同)。简单的码率控制方法可以通过编码器中的缓冲器充盈程度作为参考,控制量化步长,从而产生相对恒定的码率。复杂的结构就很多了。相信有很多正在开发的新方法。由于存在技术进步的空间,悲观地讲,购买某些MPEG2设备可能存在一定的投资风险,这些设备有可能被淘汰。
第二个需要探讨的是,如果我们想让MPEG2成为贯穿电视台业务的纽带,以MPEG2作为数字视频的主要格式,我们还有什么问题需要解决。MPEG组织从来没有期望、也不可能制定出一种对各种电视台业务的需要都非常吻合的标准。但是大家都寄希望于MPEG2能够成为电视台数字化的主要格式。这种想法如果实现,则对电视台的工作将是极有帮助的,然而MPEG组织没有告诉我们这条路如何走。目前MPEG2在电视台的应用里碰到的最大的问题是数据流的随机访问这个问题。这在编辑和切换中显得尤为重要。我们知道,在MPEG2的码流中,只有I帧才可以作为入点。因此如果想直接对码流进行切换的话,必须等到I帧的到来,这就有延迟,延迟的时间完全取决于GOP的长度。如果通过解码-处理-编码(Transcoding)的方式进行的话,则不可避免地带来图像的劣化。
电视台的节目链大概可以分为几个步骤,即:(1)节目原始素材,(2)节目后期制作,(3)传送到节目中心,(4)播出,(5)存档。 如果我们现在建立一个类似这样的电视台运作模式,至少现在看上去是很完美的,全部基于MPEG2视频格式,思路非常清晰。但是我们必须联系目前的实际条件来探讨它是不是一个好方案。在目前的传统演播室里,尽管输入的视频可以都是MPEG2的格式,但是为了进行分配、切换、编辑和混合,在很大程度还是要进行解码后再处理,以适应目前存在的多种视频格式(比如复合、模拟分量、数字分量等),这是由目前的设备多样性决定的。节目选择和切换环节对一个播出频道来讲是必需的。鉴于节目的来源广泛,在这个环节上,使用解码后的视频流作为操作对象是最合适的。在完成选择和切换后,再转换成MPEG2的压缩码流。播出内容在传送给电视观众时,由于传输方式的不同(卫星、有线和地面广播),其能接受的码率也不一样。为迎合这个需要,还需要进行转码过程以进行码率的变换。
由此可见,在目前的情况下,以MPEG2作为电视台的主要视频格式,不可避免地存在需要转码的要求。
有些人可能认为,存在转码的过程是无所谓的。实际上,MPEG2压缩方式的特点导致了转码过程中可能出现严重的图像劣化。
在转码的过程中,即使使用相同的GOP结构,也会存在这样的问题,就是GOP的相位被改变,也就是说,在重新编码的码流中,每帧的帧类型(I或B或P)与原码流中的类型不同。如果GOP结构改变,帧类型更是会变化。这会造成编码中使用新的运动矢量、编码方式和量化因子,从而引起图像的明显劣化。
一直在致力于研究如何解决这个问题的ATLANTIC项目组(从事研发一个欧洲的合作项目),做了类似的实验,证明了这种没有任何约束的转码过程带来的破坏。他们用三种类型的节目做实验,一种是赛车(Mobile),一种是篮球比赛(Basketball),还有一种是马术(Horse-riding)。实验的内容是多版复制,一个是在GOP相位没有改变的情况,另一个是GOP相位移动一帧的情况。
实验结果表明:
(a) 在GOP相位有所改变时,图像在多版复制中会持续劣化,尤其是运动信息多的节目内容。
(b) 在保持GOP相位不变的时候,图像的劣化会有一个极限。这和M-JPEG或基于I帧的MPEG2类似。
在进行基于IPB格式的MPEG2非线性编辑时,同样存在这样的问题。因为素材的来源多样化,要想做到GOP的结构和相位没有任何变化,是很难实现的。ATLANTIC项目组的研究者正在寻求这个问题的解决途径。他们的研究成果或许会帮助MPEG2设备生产商消除这个问题。
限于篇幅,我们的讨论比较简单,而且只注重大的方向。总的来说,我们应该承认,在MPEG2技术被电视台成熟应用之前,我们需要做的工作还有很多。
我们应该为MPEG2做什么?
MPEG2技术走到今天,我们应该做些什么呢?这应该从两个方面来看。
第一个方面针对电视台而言。目前有许多的国内外厂商在开发MPEG2视频设备,大洋公司作为中国视频行业的旗手,也一直致力于跟踪MPEG2压缩技术的发展,并积极探索该技术在视频上的应用方式。应该说,国内外厂商提供的某些应用方向上的MPEG2的产品,性能是优秀的,也具备了在电视台业务中实用的条件,因此电视台可以根据自己的情况选用。这在提高电视台工作效率的同时,也表达了对新技术的支持。正如我们前面提到的,MPEG2新技术的出现,在很大程度上,得益于大量的设备供应商的积极参与。电视台选用MPEG2设备,是对这些设备供应商的鼓励。有了电视台的支持,MPEG2设备供应商才有信心继续完善MPEG2应用方案。所以说,电视台的需求将对新技术的发展提供最原始、最有效的动力。
第二个方面针对视频设备供应商而言。负责任的视频设备供应商应该在努力改进应用方案、积极推广新技术的同时,把新技术的优点和缺点都展示给用户,使用户对新技术有一个全面的认识,而不应该只宣扬优点,对存在的缺点却闭口不谈。