Técnicas de Compresión de Imagen y Espacio de Color

Escrito el 25 de Junio de 2024 en español con un tamaño de 4,44 KB

T2.2 Vídeo: Escaneado

Conjunto de muestras en el tiempo. Cada frame se descompone en muestras, líneas. 2 tipos:

Progresivo

Obtiene 1 frame completo, línea por línea de arriba a abajo. Frecuencia de escaneado es At/frame. Cuando llega al final para al principio y un pulso de sincronismo se envía. Adecuados para el procesamiento de objetos en movimiento. Precio elevado.

Entrelazado

La frecuencia de refresco es la mitad. Se generan los campos par e impar. Mejora la sensación de movimiento. Precio competitivo. No adecuado para el procesamiento de objetos en movimiento.

T3. Espacios de Color

RGB

Basado en síntesis aditiva con colores rojo, verde y azul. Se usa en cámaras, monitores, etc. Rango [0 255].

CMY

Basado en síntesis sustractiva del color: mezcla de colores restando. El espacio CMY se obtiene por transformación lineal del RGB. Se usa en impresoras y suele añadir K.

XYZ

Los primarios usados son imaginarios. Representa una estimación de la percepción de colores por el ojo humano. Creado para evitar problemas de RGB: algunos colores sólo son posibles con cantidades negativas, para buscar la separación de brillo y cromaticidad y para medir la luminosidad del color. Este modelo es independiente del dispositivo. No se usa en procesamiento de imágenes. Se usa en la especificación normalizada del color y para conversiones entre RGB y otros modelos.

CIELAB

Coordenadas L, a, b. que representan la luminosidad del color. Usado para sistemas industriales de medición de color.

YIQ, YUV

Para la difusión de la señal de TV.

HSI

Los componentes representan atributos como luminancia, matiz y saturación. Representación cilíndrica.

RESUMEN DE TODOs AL FINAL DEL T3.

T5. Compresión de Imágenes

1. Criterios de Fidelidad

Objetivos: Obtener la cantidad de error en la imagen reconstruida. Raíz cuadrada del error cuadrático medio o raíz cuadrada de la razón entre la media de los cuadrados señal a ruido.

Subjetivos: Pasos:

Se crea una base de datos de imágenes a verificar.
Los observadores evalúan las imágenes en función de unos criterios.
Los resultados se analizan estadísticamente.
Se pueden clasificar en 3 tipos:
1. Pruebas de daño: en función de lo malas que son.
2. Pruebas de calidad: en función de lo buenas que son.
3. Pruebas de comparación: en función de una referencia establecida.

2. Huffman

Sin pérdidas. Depende del histograma. Pasos:

Obtener el histograma de la imagen y calcular las probabilidades de niveles de gris.
Ordenar las probabilidades de menor a mayor.
Combinar mediante adición las dos menores.
Ir al paso 2 hasta que sólo queden 2 probabilidades.
Retrocediendo en el árbol, generar códigos alternando entre 0 y 1.

3. Código de Longitud de Cadenas (RLE)

Sin pérdidas. Cuenta el número de píxeles adyacentes con el mismo nivel de gris. Ejemplo: matriz de 0 y 1. Fila 1: 5 (indica que hay 5 ceros). Fila 2...

4. Codificación por Truncado de Bloques

Con pérdida. La imagen se divide en subimágenes en las que se reduce el nivel de gris. Algoritmo:

Dividir la imagen en bloques de 4x4.
Codificar cada bloque con un cuantificador binivel. Cada valor del bloque se compara con un umbral (por ejemplo, la media). Si está por encima se asigna 1 y si no 0.
El bloque 4x4 queda codificado con 4 bits, 2 para los dos niveles y otros 2 para guardar la cadena de 0s y 1s.
Relación de compresión de 16:4, es decir, 4:1.

5. Codificación Predictiva Diferencial

Sin pérdida: el objetivo es eliminar las redundancias de píxeles próximos. Con pérdida: se introduce un nuevo módulo, el cuantificador, que limita el rango de valores dado el error.

6. Transformada Discreta del Coseno (DCT)

Ventajas: tiene buena compresión con bajo coste computacional. Desventaja: complejidad alta, por eso se divide en bloques. Ratio de compresión entre el 90 y 95%. Bastante usada en vídeo. 2 pasos:

DCT: convierte una imagen en coeficientes de frecuencia equivalentes. Útiles para determinar la varianza en una secuencia de imágenes.
IDCT: reconstruye la imagen a partir de los coeficientes. Se emplea en compresión JPEG.

Entradas relacionadas:

Etiquetas: