图像通信课件第五章.ppt

资源描述

序列图像编码及运动估计第五章李春雷电子信息学院目录 5 1序列图像编码系统5 2二维运动估计5 3采用时间预测和变换编码的视频编码5 4MPEG 1视频编码和解码5 5视频图像编码标准中原工学院电子信息学院 2 概述数字电视 VCD DVD VOD 会议电视流媒体多媒体数据库和计算机网络等技术的日益融合和广泛应用已经遍及国民经济和社会生活的各个方面语音图形图像和数据等信息的传输处理存储及检索技术成为这些技术中重要的组成部分为了能够有效地传输和存储这些信息人们广泛采用了数字压缩编码技术新概念新算法新标准新协议正在不断涌现这门技术已经成为当今信息与通信工程学科的主要研究热点之一中原工学院电子信息学院 3 5 1序列图像编码系统视频看作一个沿时间轴分布的图像序列统称为序列图像其编码称为序列图像编码如图5 1所示对视频图像的压缩编码称为视频编码即对构成视频的图像序列中的图像进行压缩编码中原工学院电子信息学院 4 5 1序列图像编码系统视频编码的主要目的就是在保证一定重建质量的前提下以尽量少的数据量来表征视频信息以减少视频序列的码率便于能够在给定的通信信道上实时传输视频信号传统压缩编码以香农信息论为出发点用统计概率模型来描述信源这种基于数据统计的以消除视频数据相关冗余为目的的第一代视频编码技术获得了巨大成功 JPEG MPEG 1 MPEG 2 H 261 H 263等压缩编码国际标准以及它们对多媒体产业的巨大影响就是有力的证明中原工学院电子信息学院 5 5 1序列图像编码系统第二代编码第一代视频编码技术并未考虑信息接收者的主观特性视频信息的具体含义和重要程度等只是力图去消除数据冗余基于内容的第二代视频编码技术它所关心的是如何去消除视频内容的冗余它认为人眼是视频信号的最终接收者视频编码时应充分考虑人眼视觉特性这个因素这是目前视频编码中最为活跃的一个领域中原工学院电子信息学院 6 5 1序列图像编码系统 5 1 1视频图像压缩的必要性对一帧NTSC制式的彩色视频图像进行数字化传输图像数字化成720 480 颜色分量中的每个像素用8bit表示每秒传输30帧信道的传输能力要达到约248Mb s 一帧HDTV的彩色电视图像其分辨率为1920 1080 每种颜色分量中的每个像素用8bit表示每秒传输30帧那么信道的传输速率为1 4Gb s 因此不进行视频图像的压缩将对存储器的存储容量传输信道的传输率带宽及计算机的处理速度等方面造成极大的压力为了解决这些问题对视频图像进行压缩编码就显得十分必要和迫切了中原工学院电子信息学院 7 5 1序列图像编码系统 5 1 2视频图像编码系统的一般结构图5 2给出了一个视频编码系统的基本组成在编码器中首先用信源模型的参数描述数字化的视频序列信源模型参数被量化成有限的符号集量化参数取决于比特率与失真之间所期望的折衷最后用无损编码技术把量化参数映射成二进制码字最终产生的比特流在通信信道上传输解码器反向进行编码器的二进制编码和量化过程重新得到信源模型的量化参数然后解码器用信源模型的量化参数利用图像合成算法恢复解码后的视频帧中原工学院电子信息学院 8 5 1序列图像编码系统中原工学院电子信息学院 9 5 1序列图像编码系统 5 1 3视频编码方案分类几种视频编码算法它们相应的信源模型中见表5 1 信源模型可做出图像序列的像素之间在时间和空间上相关性的假设也可考虑物体的形状和运动或照度的影响一个编码算法的信源模型要根据其编码参数集和图像合成算法确定中原工学院电子信息学院 10 5 1序列图像编码系统 1 基于波形的编码把像素假设为统计上独立的得到的模型是最简单的信源模型见表5 1 相关的编码技术就称为脉冲编码调制 PCM 图像信号的PCM表示通常不用于视频编码因为它与其它信源模型相比效率较低大多数图像邻近像素的颜色色度存在较高的相关性为了减少编码比特率使用K L变换 DCT变换或小波变换等去除原图像像索点间的相关性并把原始信号的能量集中到少数的几个系数上需要量化和编码的参数是变换系数利用相邻样点间相关性的另一种方法是预测编码先由前面编码的样点预测要编码的样点值然后对预测误差进行量化和编码中原工学院电子信息学院 11 5 1序列图像编码系统现在使用的视频编码标准如H 261 H 263 MPEG l MPEG 2和MPEG 4等都采用了基于块的混合编码的编码方法它综合了预测编码和变换编码 2 基于内容的编码基于块编码的缺点采用固定大小的方块来近似场景中物体的形状如果这些边界块中包含了具有不同运动的两种物体那么用一个运动矢量就不能说明两个不同的运动存在误差基于内容的编码器企图把视频帧分成对应于不同物体的区域并分别编码这些物体对于每个物体除了运动和纹理信息外还必须传送形状信息中原工学院电子信息学院 12 5 1序列图像编码系统二维轮廓描述物体的形状采用分割算法运动矢量场描述物体的运动采用运动估计颜色波形描述物体的纹理采用纹理提取算法在视频序列中的物体已知的情况下可采用基于知识的编码该编码使用特别设计的线框来描述已识别出的物体类型因为它自适应于物体的形状有时也把这种技术称为基于模型的编码已知可能的物体类型和它们的行为时可以用语义基编码中原工学院电子信息学院 13 5 2二维运动估计为什么需要二维运动估计在视频压缩的应用中根据估计出的运动矢量和前一个已编码的参考帧可以得到当前帧的运动补偿预测运动估计最终要达到的目的是使编码运动矢量和预测误差所用的总的比特数最少我们可以在运动估计的准确性与表示运动参数所用的比特数之间做出折衷的选择在某些情况下虽然估计的运动并不是精确的实际物体运动但仍可以产生好的运动预测中原工学院电子信息学院 14 5 2二维运动估计 5 2 1二维运动估计的基本概念二维运动估计既是迈向三维运动分析的第一步也是运动补偿滤波和压缩的主要部分运动估计算法都是基于图像亮度的时间变化把观测到的或表现出来的二维运动矢量的速度称为光流 1 二维运动相关概念二维运动也称为投影运动指的是三维运动在图像平面上的透视或正交投影三维运动的特征可依据物体像素的三维瞬时速度或三维位移来表征二维位移和速度场分别是三维场在图像平面上的投影中原工学院电子信息学院 15 5 2二维运动估计视在二维位移场和视在二维速度场不同于投影产生的二维位移速度场因为 1 实际视频信号缺乏足够的空间图像梯度在实际运动能被观察到的运动范围内要有足够的灰皮等级颜色变化才能产生光流否则光流就不可观测 2 外部光照的变化一个可观测到的光流可能由于光照引起即使没有运动光流亦可观察到二维位移和速度场分别是三维场在图像平面上的投影而对应场和光流场是由时变亮度图像特性得到的位移和速度函数实际应用中由于只能观察到光流场和对应场所以在本章中假设它们等同于二维运动场中原工学院电子信息学院 16 5 2二维运动估计中原工学院电子信息学院 17 5 2二维运动估计中原工学院电子信息学院 18 5 2二维运动估计中原工学院电子信息学院 19 5 2二维运动估计人类视觉对图像中的静止部分有较高的分辨率必须给予充分的空间分辨率在传输静止图像或序列图像的静止部分时要保证较高的水平和垂直分辨率但此时可以减少传输帧数在接收端依靠帧存储器把未传输的帧补充出来人类视觉对序列图像中运动物体的分辨率将随着运动物体速率的增大而显著降低物体的运动速度越高就可用更低的清晰度进行传输例如可以对序列图像中的静止部分每两帧传输一次而对运动部分采用2 1的亚抽样这样就降低了空间分辨率而且对视觉来说不易觉察出收端的复原图像的质量有较明显的降低中原工学院电子信息学院 20 5 2二维运动估计中原工学院电子信息学院 21 5 2二维运动估计中原工学院电子信息学院 22 5 2二维运动估计 5 2 3运动估计与补偿的基本概念采用帧间预测编码可以减少时间域上的冗余度提高压缩比静止图像效果较好运动图像效果较差对当前帧某像素或像素块进行预测时知道这个像素或像素块是从前一帧的哪个位置移动过来的则在做预测时以真实对应位置上的像素值作为预测值这样预测的准确性将大大提高采用运动补偿帧间预测技术可以更好地利用序列图像的时间冗余度使预测差值的方差大大减小从而降低误码率提高压缩比获得好的运动补偿的关键是运动估计中原工学院电子信息学院 23 5 2二维运动估计 1 运动估计将图像分成若干个块并检测出当前帧中的每个块在前一帧参考帧图像中的对应位置这个过程叫做运动估计运动估计常以宏块为单位进行计算被压缩图像与参考图像在对应位置上的宏块间的位置偏移这种由运动估计得到的位置偏移是以运动矢量来描述的水平和垂直位移中原工学院电子信息学院 24 5 2二维运动估计 2 运动补偿运动估计及补偿的基本原理利用帧间运动估计得到待编码图像块的一个或多个参考块然后用这个参考块进行运动补偿将补偿后的残差进行DCT变换和可变长编码从原理上讲运动补偿帧间预测编码包括以下4个部分 1 物体划分静止区域和运动区域运动补偿预测编码主要是针对运动区域进行编码 2 运动估计对运动物体进行位移估计找出运动矢量 3 运动补偿建立同一物体在不同帧的空间对应关系 4 预测编码对补偿后的物体的位移帧差信号进行DCT变换量化编码中原工学院电子信息学院 25 5 2二维运动估计图5 9表示了帧间运动估计与补偿预测的基本过程中原工学院电子信息学院 26 5 2二维运动估计 5 2 4基于块的运动估计匹配算法1 基本思想及研究现状将图像序列的每一帧分成固定大小的宏块然后对于当前帧中的每一块根据一定的匹配准则在参考帧某一给定搜索范围内找出与当前块最相似的块即匹配块由匹配块与当前块的相对位置计算出运动位移所得运动位移即为当前块的运动矢量运动估计越准确补偿的残差就越小编码的效率也就越高解码出的图像质量越好但这种运动估计在整个系统中的计算复杂度很大往往占整个系统的50 以上中原工学院电子信息学院 27 5 2二维运动估计全搜索法搜索精度最高然而计算复杂度太高改进快速运动估计算法三步法二维对数法交叉法等通过限制搜索位置的数目来减少计算量动态搜索窗调整法是根据当前结果动态调整下一步搜索步长的大小算法性能在一定程度上有了改进预测搜索法自适应运动跟踪法等利用相邻块的运动相关性选择一个反映当前运动块趋势的预测点作为初始搜索点以提高搜索速度和预测的准确性 1999年10月菱形法被MPEG 4国际标准采纳并收入验证模型并相继出现了正方形菱形法线性菱形并行搜索法中原工学院电子信息学院 28 5 2二维运动估计 2 提高搜索效率的主要技术块匹配的基本思想是依据一定的匹配法则通过在两帧之间的像素域利用搜索程序找到最佳的运动矢量估计中原工学院电子信息学院 29 5 2二维运动估计运动估计算法的整体效率主要体现在图像质量压缩码率和搜索速度复杂度三个方面运动估计越准确预测补偿的图像质量越高补偿的残差就越小编码所需位数也就越少运动估计速度越快越有利于实时应用提高图像质量加快估计速度减小比特率等都是运动估计算法的研究目标通常是通过研究初始搜索点的选择匹配准则和运动搜索策略等来提高算法效率 1 初始搜索点的选择 1 直接选择参考帧对应块的中心位置 2 选择预测的起点中原工学院电子信息学院 30 5 2二维运动估计 2 块匹配准则运动估计算法中常用的匹配准则有三种最小绝对值差 MAD 最小均方误差 MSE 和归一化互相关函数 NCCF 3 搜索策略搜索策略选择恰当与否对运动估计的准确性运动估计的速度都有很大的影响有关搜索策略的研究主要是解决运动估计中存在的计算复杂度和搜索精度这一矛盾中原工学院电子信息学院 31 5 2二维运动估计 3典型的块匹配算法1 全搜索法 FS FullSearchmethod 1 算法思想全搜索法也称为穷尽搜索法是对搜索范围内所有可能的候选位置计算其SAD i j 值从中找出最小SAD 其对应偏移量即为所求运动矢量此算法计算量虽大但最简单可靠找到的一定是全局的最优点 2 算法描述 Step1从原点出发按顺时针方向由近及远在每个像素处计算SAD值直到遍历搜索范围内的所有点 Step2在所有的SAD中找到最小块误差 MBD 点该点所在位置即对应最佳运动矢量中原工学院电子信息学院 32 5 2二维运动估计 2 二维对数法 TDL Two DimensionalLogarithmic 二维对数搜索法由J R Jain和A K Jain提出它开创了快速算法的先例分多个阶段搜索逐次减小搜索范围直到不能再小时才结束 1 基本思想二维对数法是从原点开始以十字形分布的五个点构成每次搜索的点群通过快速搜索跟踪MBD点 2 算法描述 Step1从原点开始选取一定的步长在以十字形分布的五个点处进行块匹配计算并比较中原工学院电子信息学院 33 5 2二维运动估计中原工学院电子信息学院 34 5 3采用时间预测和变换编码的视频编码 5 3 1三种常用的视频帧典型的视频压缩技术是将第一帧图像按照静态图像编码接着确定出前一帧与当前帧的差值通过对这些差值进行编码来得到后续帧图像的编码如果当前帧图像与前一帧图像区别很大应该独立于其它帧图像对其迸行单独编码在视频压缩中常使用三种视频帧其关系见图5 23所示中原工学院电子信息学院 35 5 3采用时间预测和变换编码的视频编码 l 帧内图像帧内图像 IntraFrame或Intra 也称I帧图像是不考虑与其它图像帧的关系而单独进行编码的图像它不需要任何其它的帧图像来进行预测编码帧内视频图像的编码是通过减少视频空间冗余度来完成压缩的它们也提供了数据流的起始解码数据指针 2 前向预测图像前向预测图像 PredictedPictures 也称P帧图像是根据前面已编码的I图像或P图像进行编码的图像它利用运动补偿技术完成编码并且还可以为下一非I帧图像提供运动预测通过降低空间和时间上的冗余度中原工学院电子信息学院 36 5 3采用时间预测和变换编码的视频编码 3 双向预测图像双向预测图像 BidirectionalPredictionPictures 也称B帧图像是同时根据前面的I图像和后面的P图像或前后两个P图像进行编码的图像它也是利用运动补偿技术完成编码其压缩效率最佳为了能实现利用下一帧图像进行后向预测编码器要对视频帧重新排序视频帧的顺序编排将由原来的播放画面顺序改变成视频传送顺序利用前一帧对当前帧进行编码将引入失真导致直到下一帧内图像出现前的所有图像解码都不准确要求除对第一帧进行帧内编码还须在图像序列中间不时采用帧内编码中原工学院电子信息学院 37 5 3采用时间预测和变换编码的视频编码图5 24 a 是这三种图像构成的一个图像序列以编码器输入的顺序排列图5 24 b 是以解码器的输出和显示的顺序排序的同一图像序列每一帧图像都要有两个时间标记一个表示编码顺序一个表示显示顺序中原工学院电子信息学院 38 5 3采用时间预测和变换编码的视频编码 5 3 2基于块的混合视频编码每个视频帧被分成固定大小的块对每个块独立地进行处理称为基于块的混合意味着每个块是联合运用运动补偿时间预测和变换编码进行编码的图5 25给出了这种编码范例中的关键步骤首先利用基于块的运动估计由前面已编码的参考帧对块进行预测运动矢量确定当前块和最佳匹配块之间的位移得到预测误差然后用DCT对预测误差块进行变换量化DCT系数并用可变长编码把它们转换成二进制码字中原工学院电子信息学院 39 5 3采用时间预测和变换编码的视频编码实际用于运动估计的块大小可能与用于变换编码块的大小不一样运动估计是在一个较大的块称为宏块 MB MacroBlock 上进行的宏块被进一步分成几个块对这些块求DCT的值例如在大多数视频编码标准中宏块的大小是16 16个像素而每个块的大小是8 8个像素在MPEG 1和MPEG 2标准中把帧划分成图像组 GOP groupofpictures 而每个图像组以I帧开始后跟交织的P帧和B帧这使随机访问成为可能可以访问任何图像组而不需要对前面的图像组进行解码图像组结构也允许快进和快倒仅解码I帧或解码I帧和P帧就可以实现快进以后的顺序仅解码I帧就可以实现快倒中原工学院电子信息学院 40 5 4MPEG l视频编码和解码 5 4 1MPEG 1介绍MPEG是活动图像专家组 MovingPictureExpertGroup 的缩写 MPEG是一种视频压缩方法包括对数字图像声音以及两者同步信号的压缩 MPEG 1是针对数据率大约为1 5Mb s的中等数据率情况的标准 MPEG 2主要针对的是10Mb s的高数据率的标准 MPEG 3起初为HDTV压缩而设计但后来发现是多余的于是将其归并到MPEG 2中去 MPEG 4主要针对的是码率低于64kb s的甚低数据率的情况本节主要针对MPEG 1的图像压缩方法进行讨论中原工学院电子信息学院 41 5 4MPEG l视频编码和解码中等数据率的视频视频分辨率360 288像素每像素24位刷新率24帧秒需360 288 24 24 59719680b s的数据率音频为双声道每声道44kHz 16位量化数据率为2 44000 16 1408000b s 总的数据率为61 1Mb s 假设此数据率通过MPEG 1压缩到大约1 5Mb s中等数据率则压缩率将超过40 MPEG的视频序列由许多幅图像组成每幅图像有3个分量一个亮度分量 Y 和两个色度分量 Cb和Cr 每个分量为一矩形的采样数组数组的每行称为光栅行每个像素为3个采样的集合 MPEG 1的采样率为4 2 2 中原工学院电子信息学院 42 5 4MPEG l视频编码和解码 MPEG编码器的输入称为源数据解码器的输出称为重建数据源数据被组织成若干数据包如图5 26 b 所示每个数据包的开头为一个32位的开始码接着为一个头 header 结尾为一结束码在数据包的头和尾之间包含有许多数据组数据组中包含着压缩数据中原工学院电子信息学院 43 5 4MPEG l视频编码和解码 MPEG解码器有3个部分对视频音频和系统数据进行解码系统层读取并解释源数据中的各个码字和头将数据组发往音频层或者视频层如图5 26 a 所示进行缓冲存储并解码中原工学院电子信息学院 44 5 4MPEG l视频编码和解码 5 4 2输入图像格式与图像类型MPEG图像基本组成单元为宏块 1块16 16的亮度采样和2块8 8的色度采样 MPEG采用离散余弦变换将6个宏块变换成不相关的值对结果进行量化编码 MPEG采用不同的量化表和不同的码表来进行帧内和帧间编码 MPEG中图像以条带 slice 的形式组织起来每一条带由一组相邻的宏块组成使得很多相邻宏块可能有相同的灰度值图5 27 b 显示了一幅假定的MPEG图像是如何分成条带的图像中的每一个正方形小块为宏块中原工学院电子信息学院 45 5 4MPEG l视频编码和解码 1 输入图像的格式MPEG 1采用源输入格式 SIF SourceInputFormat 有352 288 25或352 240 30两种选择总数据量相同通过表5 2进行图像分辨率参数设置编码更大的图像中原工学院电子信息学院 46 5 4MPEG l视频编码和解码 2 图像类型MPEG l视频算法为了追求更高的压缩效率更注重去除图像序列的时间冗余度同时又必须满足多媒体播放等随机存取要求但对编解码的时间延迟则可以放宽些为折衷这些相互矛盾的要求 MPEG l将图像组中的图像划分为I图像帧内编码图像 P图像预测编码图像 B图像双向预测编码图像和D图像直流编码图像这些图像被分为很多组可以是开放或封闭的图像在编码前以编码顺序排列经解码的输出图像以显示顺序显示在封闭组中 P图像和B图像仅能通过本组的其它图像来解码得到而对开放组可以通过本组外的图像来解码得到中原工学院电子信息学院 47 5 4MPEG l视频编码和解码为了满足不同的使用要求 MPEG l采用了更为灵活的开放性视频流 1 为可随机存取和编辑并兼顾压缩比允许编码端自行选择独立的I图像的使用频率和在视频流中的位置建议随机存取点间隔为0 2s 通过搜索并解码显示各GOP中的I图像可实现快进快退功能以GOP为单位还可实现倒放 2 由于I P之间插入的B图像越多压缩比往往就越高所需帧存储器也越大成本也随之上升对于大多数景物参考图像之间插入两帧B图像较为适宜 3 编码端的视频流记录格式并不要求与图像的显示顺序相一致在编码前要将输入图像帧的序列按编码顺序重排中原工学院电子信息学院 48 5 4MPEG l视频编码和解码 MPEG中对于P帧和B帧的使用没有做任何要求下而是一个典型的测试序列对SIF分辨率采用IPBBPBBPBBPBBPBB的GOP结构在码率为1 15Mb s的MPEG视频序列中 I帧 P帧和B帧的平均图像码率分别为156kb s 62kb s 15kb s 可以看出 B帧远远小于I帧和P帧但是如果单纯增加I P帧之间B帧的数量并不能获得更好的压缩比因为这样会增加B帧与相应的I帧和P帧间的时间距离降低了它们之间的时间相关性从而降低了运动补偿预测的性能中原工学院电子信息学院 49 5 4MPEG l视频编码和解码 5 4 3视频编码与解码的具体过程MPEG l视频压缩编码与图像重建的原理框图如图5 28所示视频压缩编码技术是以基于16 16子块的运动补偿和DCT为基础的基于16X16子块的运动补偿技术可以减少序列的时间冗余度 DCT技术用于减少空域冗余度中原工学院电子信息学院 50 5 4MPEG l视频编码和解码 1 预处理过程包括RGB到YCbCr的色彩空间变换格式转换预滤波和亚采样等这些操作在MPEG 1中没有给出例如对CCIR601的预处理在信源输入格式为SIF时预处理的过程如图5 29所示对于PAL制式 SIF格式为352 288 25帧而对于NTSC制式 SIF格式为352 240 30帧中原工学院电子信息学院 51 5 4MPEG l视频编码和解码 2 编码过程MPEG标准并没有定义特定的编码过程只是定义了编码比特流的语法和解码过程通过图5 30给出一个MPEG 1编码器的功能中原工学院电子信息学院 52 5 4MPEG l视频编码和解码 1 帧序重排将显示顺序重排为编码顺序 2 运动估计和补偿I帧为帧内编码对宏块DCT 量化DCT系数再对量化结果进行VLC 对于P帧和B帧图像对其预测误差进行编码即帧间预测编码 3 比特流缓冲器比特流缓冲器中数据量的多少反映出当前宏块的复杂程度编码器可据此通过调节器调整量化器的加权因子q 4 其它部分DCT系数运动矢量宏块类型等复用为MPEG 1比特流后传输中原工学院电子信息学院 53 5 4MPEG l视频编码和解码 3 宏块的编码MPEG 1定义三种图像类型 I帧 P帧和B帧 1 帧的编码对块进行DCT变换后每个DCT系数都要与帧内编码量化矩阵的相应元素相除来进行量化对于DC系数量化步长通常固定为8 直流DC系数除以8并舍入到最近的整数即得到DC系数的量化数量化后 DC系数与前一块的量化DC系数相减将差值编码为 size amp amp为差值的大小若此数为正值则是其二进制表示若为负值则采用反码表示size表示amp所需的二进制位数中原工学院电子信息学院 54 5 4MPEG l视频编码和解码对于AC系数的量化数首先按照Zig zag顺序进行排序输出中元素代表的频率分量由低频到高频排序之后每个非零的AC系数被表示为行程幅度偶 MPEG中定义了行程幅度偶的霍夫曼码表对其进行霍夫曼编码而表中未定义的行程幅度偶则编码为ESC码后跟它们的单独码字 2 P帧的编码决定是否使用运动补偿运动矢量位数更多决定宏块使用帧间编码还是帧内编码运动剧烈决定宏块是否要被编码全零决定是否需要改变MQUANT 不使缓冲区上溢或下溢中原工学院电子信息学院 55 5 4MPEG l视频编码和解码 3 B帧的编码决定使用前向运动后向运动内插运动补偿决定采用帧内编码的方式还是帧间编码方式决定宏块是否可以被跳过决定量化尺度因子是否可以被改变 4 DCT系数的编码细节帧内编码中MPEG采样为8位无符号数而帧间采用9位有符号数二维DCT的两次求和至多将采样值扩大26倍可能产生8 6 14位的整数在两次求和过程中采样值要乘以余弦函数会产生负数求和结果是一个15位有符号数这个数再乘以1 8 1 4的因子可用12位的有符号整数表示中原工学院电子信息学院 56 5 4MPEG l视频编码和解码 12位整数通过除以从量化表得到的一个量化系数而被量化并取整正是在量化和取整过程中信息出现了不可恢复的丢失帧内编码中取整通常是取最近的整数而帧间编码是截断非整数到接近的小于其值的整数图5 31给出了图示注意在帧间编码中零值附近有较宽的间隔即所谓的死区中原工学院电子信息学院 57 5 4MPEG l视频编码和解码中原工学院电子信息学院 58 5 4MPEG l视频编码和解码中原工学院电子信息学院 59 5 4MPEG l视频编码和解码在MPEG中没有明确定义计算IDCT的方法若一幅图像的编码采用一种实现方式而在解码时采用另一种实现方式将会导致失真而在帧间编码的图像链中每幅图像采用相邻的其它图像解码这将导致累积误差称为IDCT失配现象这是MPEG需要对图像的每一部分进行周期性的帧内编码的原因量化后的QDCT要进行霍夫曼编码要用到非自适应霍夫曼方法和霍夫曼码表此码表是通过汇集来自许多训练图像序列的统计数据而算出的具体用何种码表取决于待编码的图像类型为避免出现零概率问题在汇集任何统计数据之前所有的码表项都被初始化为1 中原工学院电子信息学院 60 5 4MPEG l视频编码和解码在I图像中宏块的DC系数和AC系数是分别编码的这与JPEG编码类似图5 32表示出了I图像的Y分量 Cb分量和Cr分量所提供的3种类型的DC系数是如何在一个数据流中分别编码的中原工学院电子信息学院 61 5 4MPEG l视频编码和解码某一DC系数DCi首先被用来计算差值 DC DCi P P为前一块同一类型的DC系数然后对这个差值进行编码码字前一部分表示量值等级接着的若干位表示差值的幅值和符号量值等级就是对差值 DC的符号和幅值编码所需要的位数每个量值等级都赋予一个码字对DC系数的差值 DC的编码需要下述3个步骤 1 首先确定量值等级将它的码字发出 2 若 DC为负值将它的补码减去1 3 发出表示差值最低有效位的二进制数其位数等于量值等级表5 5概括性地列出了量值等级量值等级的码字和每一个量值等级所对应的差值 DC的范围中原工学院电子信息学院 62 5 4MPEG l视频编码和解码例5 1 设亮度差值 DC为5 因为数字5可以用3位二进制表示所以量值等级为3 首先发码字101 接着发出表示5的3位二进制数的最低有效位101 若设色度差 DC值为3 因为数字3可以用2位二进制数表示所以量值等级为2 首先发出码字10 而差值 3可以表示为2的补码11111101 假设为8位将其减去1后得到的2位最低有效位二进制数为00 将其发出中原工学院电子信息学院 63 5 4MPEG l视频编码和解码 I图像帧内编码的AC系数通过Zig zag顺序扫描进行编码对每个非零系数C输出一个游程等级码此处游程指的是在C之前的0的个数等级指的是C的绝对大小每一个非零系数C的游程等级码的后面跟一位C的符号位 1表示负数 0表示正数最后的非零系数的游程等级码字后面跟一个特定的两位块尾 EOB 码表5 6与表5 7列出了EOB码常见的游程值和等级值的游程等级码其中s表示符号位对于表中没有列出的游程值和等级值的组合编码方法是采用ESC码后面跟一个6位的表示游程长度的码和一个8位或16位的表示等级值的码中原工学院电子信息学院 64 5 4MPEG l视频编码和解码例5 2 图5 33给出了一个8 8的量化系数块的例子这些系数的Zig zag形扫描序列是127 0 0 1 0 2 0 0 0 1 127为DC系数因此AC系数的编码为3个游程等级码 2 1 1 2 3 1 后面跟着EOB码字根据表5 6 编码结果为010110001100001110100 注意符号位跟在游程等级码字后中原工学院电子信息学院 65 5 4MPEG l视频编码和解码上面的讨论为帧内编码对于I图像的DCT量化系数的编码对于帧间编码 P图像和B图像则情况有所不同通过其它帧图像预测某帧图像的过程已经将采样值去相关了 DCT在帧间编码中的优势主要体现在量化上对DCT系数的深度量化提高了压缩率在这种情况下甚至一个所有值都无差别的默认量化表都可能相当有效 DCT在帧间编码中的另一个特点是DC系数和AC系数没有实质上的区别因为它们都是差值的DCT 因此没有必要对DC系数和AC系数分开编码中原工学院电子信息学院 66 5 4MPEG l视频编码和解码 5 运动矢量的编码细节宏块的运动矢量与前一宏块的矢量有密切联系例如在景物平行移动的情况下所有矢量差不多都一样因此运动矢量编码使用DCPM技术 6 解码过程解码器输入的视频比特流码速率是固定的但画面的数量差别很大必须要设缓冲器以保证数据量的平滑防止画面波动和固定帧频显示中原工学院电子信息学院 67 5 4MPEG l视频编码和解码分路器负责语法和语义检查对宏块进行解码解码出运动矢量和宏块类型等 IDCT输出的是I画面以及P画面和B画面的预测画面并保存I及P画面生成预测画面 P B 这样重建画面等于预测画面与差分画面之和画面重新排序后再输出帧速度固定的视频图像解码过程如图5 34所示中原工学院电子信息学院 68 5 4MPEG l视频编码和解码以编码序列T1 T4 T2 T3 T7 T5 T6 T8 见图5 35 为例假设P帧中所有宏块都采用预测编码 B帧中所有宏块都采用双向预测编码解码过程如下 1 输入图像T1 I帧由于没有进行运动补偿可直接进行IDCT变换然后把解码出的图像进行显示并存入过去帧缓存器中 2 输入图像T4 P帧对每个宏块进行IDCT变换并进行运动补偿即把在过去帧 T1 中由运动矢量指出的相应宏块与IDCT变换的结果相加重建图像存入将来帧缓存器中中原工学院电子信息学院 69 5 4MPEG l视频编码和解码 3 输入图像T2 B帧 IDCT变换后进行双向运动补偿利用T2的两个运动矢量指出的过去帧 T1 和将来帧 T4 中的相应宏块形成对T2的预测值将这个预测值与IDCT变换的结果相加得到重建图像并显示 B帧不参与其它帧的运动估计不用被保存在任何帧缓存器中 4 输入图像T3 B帧重复T2的解码过程解码后立即显示T3 5 输入图像T7 P帧重复T4的解码过程将将来帧缓存器中的图像放入过去帧缓存器中同时重建的图像T7要放入将来帧缓存器中覆盖Tl 并显示图像T4 6 输入图像T5 T6 B帧重复T2的解码过程使用T4和T7进行运动补偿解码后的显示顺序为T5 T6 T7 下一组图像从T8开始重复上述的解码过程每个时刻最多有三幅图像需要存储过去帧当前帧和将来帧对于SIF格式的图像序列来说 MPEG l解码器最少需要500KB的缓存区中原工学院电子信息学院 70 5 4MPEG l视频编码和解码 5 4 4视频语法MPEG l的视频语法主要是用于确定和控制视频序列压缩的一些参数图5 36表示出了MPEG压缩流的格式和压缩流是如何在6层中组织的用点划线围绕的是可选部分中原工学院电子信息学院 71 5 4MPEG l视频编码和解码 5 4 5系统层简介1 系统层功能系统层主要实现下述功能 1 将多个基本流视频流音频流数据流复合成单一的串行比特流 2 保证基本流之间的时间同步 3 保证信源与信宿之间的时间同步 4 可随机存取便于编辑加工 5 速率可控中原工学院电子信息学院 72 5 4MPEG l视频编码和解码 2 系统层解决的问题 1 A V audio video 同步编码时以STC为基准对每一帧画面每一帧声音均附加一个PTS值解码时即按比指定时间播放从而达到A V同步的目的 2 编码器解码器同步解码器的本地STC值受控于音频FTS值不断进行更新与校正 3 复合流速率控制解码器通过把SCR值与本地STC值比较发出反馈信号可能的话控制输入流的速度 MPEG复合比特流如图5 37示中原工学院电子信息学院 73 5 4MPEG l视频编码和解码 3 系统层编码器MPEG 1系统层编码器框图如图5 38所示系统层编码器中系统时钟STC是频率为90kHz的计时器 TS PresentationTimeStamp SCR SystemClockReference 是系统的绝对时间中原工学院电子信息学院 74 5 5视频图像编码标准中原工学院电子信息学院 75 5 5视频图像编码标准中原工学院电子信息学院 76 5 5视频图像编码标准中原工学院电子信息学院 77 5 5视频图像编码标准中原工学院电子信息学院 78 5 5视频图像编码标准中原工学院电子信息学院 79 5 5视频图像编码标准中原工学院电子信息学院 80 5 5视频图像编码标准中原工学院电子信息学院 81 5 5视频图像编码标准中原工学院电子信息学院 82 5 5视频图像编码标准中原工学院电子信息学院 83 5 5视频图像编码标准中原工学院电子信息学院 84 5 5视频图像编码标准中原工学院电子信息学院 85 5 5视频图像编码标准中原工学院电子信息学院 86 5 5视频图像编码标准中原工学院电子信息学院 87 5 5视频图像编码标准作业 P200 3 7 8 9 中原工学院电子信息学院 88

展开阅读全文