浅析常用的视频封装格式与媒体编码格式

MPEG-4是一套用于音频,视频信息的压缩编码标准,由国际标准化组织和国际电工委员会下属的动态影像专家组(Moving Picture Experts Group,即MPEG)制定,第一版在1998年10月通过,第二版在1999年12月通过。MPEG-4格式的主要用途在于网络上流、光盘、语音发送(视频电话),以及电视广播。MPEG-4包含了MPEG-1及MPEG-2的绝大部分功能及其他格式的长处,并加入及扩展对虚拟现实模型语言的支持,面向对象的合成文件,以及数字版权管理(DRM)及其他交互功能。

视频封装格式

通俗的来讲,视频封装格式可以理解为是一个包裹,包裹就意味着这个后缀不能保证里面的具体内容的形式,也不能保证具体的相关细节。包裹里面的每一件物品,称之为轨道(track)。

  • 视频(video): 相关动画文件。
  • 音频(audio): 相关声音文件。
  • 章节(chapter): 蓝光原盘中自带的分段信息。
  • 字幕(subtitles):例如.srt字幕文件。

关于视频格式,常见的有H.264(能够细分为8bit/10bit),H.265(也有8bit/10bit之分),RealVideo(常见于早期rm/rmvb),VC-1(微软主导的标准,常见于wmv)。基本上,H.264=AVC=AVC1, H.265=HEVC。音频的格式,常见的有 FLAC/ALAC/TrueHD/DTS-HD MA这四种无损格式,和AAC/MP3/AC3/DTS(Core)这四种有损格式。

关于MKV和MP4的主要区别在于:

  • MKV支持封装无损的FLAC做为音频,MP4则不支持。MP4也能够封装无损音轨(比如ALAC,虽然广泛认为ALAC的效率不如FLAC优秀)。
  • MKV支持封装ASS/SSA格式的字幕,MP4则不支持。通常字幕组制做的字幕是ASS格式,因此内封字幕多见于MKV格式。
  • MP4作为工业标准,在视频编辑软件和播放设备上的兼容性通常好于MKV。这也是vcb-s那些为移动设备优化的视频基本上选择MP4封装的缘由。

除此以外,这两个格式(MP4/MKV)很大程度上能够互相代替。例如,它们都支持封装AVC和HEVC,包括8bit/10bit的精度。理论上讲两者都能封装同样的视频,所以不存在画质孰优孰劣之说。MKV是民间研发,为了代替古老的AVI,从而更好地支持H.264,它开发和修改的灵活度使得它能够兼容FLAC/ASS这类非工业标准的格式;而MP4则是出生于豪门,做为工业标准,替代更古老的MPG,做为新一代视频/音频封装服务的。

说到编码格式,H.264被MPEG组织称作AVC(Advanced Video Codec/先进视频编码),是MPEG4标准的第10部分,用来取代之前MPEG4第2部分(简称MPEG4P2)所制定的视频编码,因为AVC有着比MPEG4P2强很多的压缩效率。最常见的MPEG4P2编码器有divx和xvid(开源),最常见的AVC编码器是x264(开源);而H.265则是次世代的视频编码技术,被MPEG组织称为HEVC(High Efficiency Video Coding),是次世代标准MPEG-H的第2部分,不属于MPEG-4标准,有着比H.264更强的压缩效率。

AVI格式

AVI格式(后缀为.AVI),它的英文全称为Audio Video Interleaved,即音频视频交错格式。它于1992年被Microsoft公司推出。这种视频格式的优点是图像质量好。由于无损AV可以保存alpha通道,经常被我们使用。缺点太多,体积过于庞大,且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题。

DV-AVI格式

DV-AVI格式(后缀为.AVI),DV的英文全称是Digital Video Format,由索尼松下、JVC等多家厂商联合提出的一种家用数字视频格式。数字摄像机就是使用这种格式记录视频数据的。它可以通过电脑的IEEE 1394端口传输视频数据到电脑,也可以将电脑中编辑好的的视频数据回录到数码摄像机中。这种视频格式的文件扩展名也是avi。电视台采用录像带记录模拟信号,通过EDIUS由IEEE 1394端口采集卡从录像带中采集出来的视频就是这种格式。

MOV格式

QuickTime File Format格式(后缀为.MOV),美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTime。该格式具有较高的压缩比率和较完美的视频清晰度等特点,可以保存alpha通道。每次安装EDIUS,我们都要安装苹果公司推出的QuickTime。安装其目的就是为了支持JPG格式图像和MOV视频格式导入。

MPEG格式

MPEG格式(文件后缀可以是.MPG .MPEG .MPE .DAT .VOB .ASF .3GP .MP4等) :它的英文全称为Moving Picture Experts Group,即运动图像专家组格式,该专家组建于1988年,专门负责为CD建立视频和音频标准,而成员都是为视频、音频及系统领域的技术专家。MPEG文件格式是运动图像压缩算法的国际标准。MPEG格式目前有三个压缩标准,分别是MPEG-1、MPEG-2、和MPEG-4。MPEG-1、MPEG-2目前已经使用较少,这里着重介绍MPEG-4。MPEG-4其制定于1998年,MPEG-4是为了播放流式媒体的高质量视频而专门设计的,以求使用最少的数据获得最佳的图像质量。目前MPEG-4最有吸弓力的地方在于它能够保存接近于DVD画质的小体积视频文件。

视频编码格式

所谓视频编码方式就是指能够对数字视频进行压缩或者解压缩(视频解码)的程序或者设备。通常这种压缩属于有损数据压缩。也可以指通过过特定的压缩技术,将某个视频格式转换成另-种视频格式。常见的编码方式有:

H.26X系列(由ITU[国际电传视讯联盟]主导) 包括H.261、H.262、 H.263、 H.264、 H.265。

  • H.261:主要在老的视频会议和视频电话产品中使用。
  • H.263:主要用在视频会议、视频电话和网络视频上。
  • H.264: H.264/MPEG- 4第十部分,或称AVC (Advanced Video Coding,高级视频编码) ,是一种视频压缩标准,一种被广泛使用的高精度视频的录制、压缩和发布格式。
  • H.265:敲率视频编码(High Efficiency Video Coding,简称HEVC)是一种视频压缩标准,H.264/MPEG-4 AVC的继任者。HEVC被认为不仅提升图像质量,同时也能达到H.264/MPEG-4 AVC两倍之压缩率(等同于同样画面质量下比特率减少了50%), 可支持4K分辨率甚至到超高画质电视,最高分辨率可达到8192x4320(8K分辨率),这是目前发展的趋势。

MPEG系列(由ISO[国际标准组织机构]下属的MPEG[运动图象专家组]开发)视频编码方面主要有:

  • MPEG-1第二部分(MPEG-1第 二部分主要使用在VCD上,有些在线视频也使用这种格式。该编解码器的质量大致上和原有的VHS录像带相当。)
  • MPEG-2第二部分(MPEG-2第二部分等同于H.262, 使用在DVD、SVCD和大多数数字视频广播系统和有线分布系统(cable distribution systems)中。)
  • MPEG-4第二部分(MPEG 4第二部分标准可以使用在网络传输、广播和媒体存储上。比起MPEG-2和第一版的H.263, 它的压缩性能有所提高。)
  • MPEG -4第十部分(MPEG 4第十部分技术上和ITU-T H.264是相同的标准,有时候也被叫做AVC)最后这两个编码组织合作,诞生了H.264/AVC标准。ITU-T给这个标准命名为H.264,而ISO/IEC称它为MPEG-4高级视频编码(Advanced Video Coding, AVC)。

视频的基础参数

分辨率

视频是由连续的图像构成的。每一张图像称为一帧(frame)。图像则是由像素(pixel)构成的。一张图像有多少像素,称为这个图像的分辨率。例如1920×1080的图像,说明它是由横纵1920×1080个像素点构成。视频的分辨率就是每一帧图像的分辨率。

帧率

一个视频,每一秒由多少图像构成,称为这个视频的帧率(frame-rate)。常见的帧率有24000/1001=23.976, 30000/1001=29.970, 60000/1001=59.940, 25.000, 50.000等等。这个数字是一秒钟内闪过的图像的数量。好比23.976,就是1001秒内,有24000张图像。视频的帧率是能够是恒定的(cfr, Const Frame-Rate),也能够是变化的(vfr, Variable Frame-Rate)。

码率

码流(Data Rate)是指视频文件在单位时间内使用的数据流量,也叫码率或码流率,通俗一点的理解就是取样率,是视频编码中画面质量控制中最重要的部分,通常单位是kb/s或者Mb/s。通常来讲一样分辨率下,视频文件的码流越大,压缩比就越小,画面质量就越高。码流越大,说明单位时间内取样率越大,数据流,精度就越高,处理出来的文件就越接近原始文件,图像质量越好,画质越清晰,要求播放设备的解码能力也越高。

单位通常是Kbps(Kbit/s)或者Mbps(Mbit/s)。注意1B(Byte)=8b(bit)。因此一个24分钟,900MB的视频:
体积:900MB = 900MByte = 7200Mbit
时间:24min = 1440s
码率:7200/1440 = 5000 Kbps = 5Mbps

当视频文件的时间基本相同的时候(好比如今一集大概是24分钟),码率和体积基本上是等价的,都是用来描述视频大小的参数。长度分辨率都相同的文件,体积不一样,实际上就是码率不一样。码率也能够解读为单位时间内,用来记录视频的数据总量。码率越高的视频,意味着用来记录视频的数据量越多,潜在的解读就是视频能够拥有更好的质量。

比特率

比特率是指每秒传送的比特(bit)数。单位为bps(Bit Per Second),比特率越高,传送的数据越大。在视频领域,比特率常翻译为码率。比特率表示通过编码(压缩)后的音、视频数据每秒钟须要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是0,要么是1。比特率与音、视频压缩的关系,简单的说就是比特率越高,音、视频的质量就越好,但编码后的文件就越大;若是比特率越少则状况恰好相反。

采样率

采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样率是指将模拟信号转换成数字信号时的采样频率,也就是单位时间内采样多少点。一个采样点数据有多少个比特。比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大,音质越好。比特率=采样率x采用位数x声道数