Comparativa de Estándares de Codificación de Video: MPEG-2, H.261 y H.264

Clasificado en Informática

Escrito el en español con un tamaño de 4,5 KB

H.264 (MPEG-4 Parte 10)

El estándar H.264 (MPEG-4 Parte 10) está orientado a la televisión digital, aplicaciones gráficas interactivas y distribución de video en internet. Permite mezclar audio e imágenes naturales y sintéticas (concepto de **interactividad**). Ofrece accesibilidad a la información de manera universal y robusta, permitiendo la **interactividad** con la información multimedia (el usuario puede modificar/configurar el escenario actual). Este estándar facilita la codificación conjunta de datos sintéticos y reales, mejoras en la compresión y multiplexación de la información, y la codificación de objetos con forma irregular.

Aplicaciones:

  • DTV (compatible con MPEG-2)
  • Aplicaciones multimedia (videojuegos)
  • Distribución de información multimedia (internet)

Características:

  • Señal de entrada progresiva como entrelazada.
  • 4:2:2, 4:2:0

MPEG-2

MPEG-2 fue creado para transmitir TDT y trabaja con video entrelazado (campo y cuadro).

Perfiles: funcionalidades incluidas en el codificador; limita el tipo de algoritmo que se usa, donde se tiene en cuenta el compromiso entre compresión y coste del codificador.

  • Perfil Simple: El más bajo, no soporta codificación bidireccional.
  • Perfil Principal: Mejor compromiso entre compresión y calidad (IPB).
  • Perfil Jerárquico (Escalable): Dos capas:
    • Capa Base: Contiene información fundamental para codificar la señal, soporta ruido y puede ser decodificada fácilmente por cualquier decodificador.
    • Capa de Mejora: Se añade capas de realce, aumentando la definición de la imagen. Equipos más complejos y muy sensible al ruido.
  • Perfil Alto: Orientado a HDTV, utiliza IPB, 4:2:2 o 4:2:0.

Niveles: Se definen valores en la señal original tales como muestreo, Rb, resolución, frame/seg. Para cada nivel se definen perfiles.

H.261

H.261 utiliza cuadros (I, P) y tiene una resolución CIF (12 secciones 11*3Mb) o QCIF (3 secciones 11*3Mb). Su estructura de MB y GOB es del mismo tipo de codificación por bloque "YCbCr", con un único vector de movimiento por MB. Se introduce información de sincronización al inicio de cada GOB; en caso de error/pérdida, solo una parte de la imagen es irrecuperable, evitando el exceso de información.

Características:

  • Posibilidad opcional de compensación de movimientos.
  • Rb entre 4k y 2 Mbps.
  • No consiste en video entrelazado.
  • Método de búsqueda exhaustivo en 3 pasos.
  • Filtrado PAB para suavizar el efecto bloque.
  • Precisión de estimación de movimiento 1 pixel.

Estimación de Movimiento (EM) y Compensación de Movimiento (CM)

La **Estimación de Movimiento (EM)** es una técnica aplicada a frames de tipo P y B con el objetivo de eliminar la redundancia temporal en las secuencias de video, donde se obtienen Vectores de Movimiento (VM).

La **Compensación de Movimiento (CM)** se obtienen mejor predicción codificando la diferencia del MB actual y el MB de referencia de la imagen codificada. Cuando estas técnicas se aplican a cuadros P, se producen 2 tipos de información: VM y término de error (diferencia entre valores predichos y los resultados reales).

En los frames P se busca en un área de un macrobloque de referencia (el más parecido, donde la diferencia sea casi nula); si no se obtiene ese macrobloque de referencia se utiliza codificación intra. En cuadros B, se puede hacer usando imágenes previas como futuras, dando lugar a cuatro posibles codificaciones (delante, atrás, intra, bi).

Pasos:

  1. Cada imagen se divide en MB 16x16.
  2. Por cada MB de la imagen se genera una predicción (CM) buscando dónde se encuentran los bloques de la imagen anterior (EM) mediante la búsqueda en un área determinada (método 3 pasos).
  3. Si se encuentra, se genera un VM con información de distancia y dirección del MB identificado.
  4. Se resta la predicción de bloque de la imagen actual.
  5. Si la semejanza es exacta, solo se envía el VM.
  6. Si la semejanza es alta, entonces se aplica la DCT y cuantifica.
  7. Si no hay semejanza o fotograma previo se utiliza codificación intra.

Entradas relacionadas: