Percepción Auditiva y Compresión de Audio: Fundamentos y Formatos

Clasificado en Biología

Escrito el 30 de Mayo de 2025 en español con un tamaño de 4,03 KB

Introducción a la Codificación y Percepción Auditiva

La codificación de audio aprovecha las debilidades de nuestro sistema auditivo para eliminar cierta información que no vamos a poder oír. El oído humano es un sistema complejo que genera un resultado final, el cual se traduce en un estímulo nervioso que llega al cerebro. Este sistema no es perfecto y, por ello, aparecen consecuencias, entre otras: el enmascaramiento y las bandas críticas.

La Onda Propagada y la Membrana Basilar

La membrana basilar está situada en el interior de la cóclea y es la responsable de la respuesta en frecuencia del oído humano.

El Enmascaramiento Auditivo

El enmascaramiento del audio ocurre cuando dos estímulos sonoros llegan cercanos en el tiempo (uno detrás de otro e independientes). El estímulo enmascarante hará que el enmascarado resulte inaudible porque nuestro cerebro no se da cuenta de que está ahí; no podemos distinguirlo del primero, ni somos capaces de procesarlo o interpretarlo.

Tipos de Enmascaramiento

Existen dos tipos principales de enmascaramiento:

Enmascaramiento Temporal
El tratamiento que hace el cerebro no tiene una precisión temporal muy buena; analiza los impulsos nerviosos por ráfagas temporales. El cerebro no separa un sonido débil de uno fuerte si vienen seguidos, ya sea antes o después.
- Pre-enmascaramiento: El estímulo enmascarado se presenta entre 5 y 0 ms antes de enmascararse.
- Post-enmascaramiento: El estímulo enmascarado se presenta entre 30 y 60 ms después de enmascararse.
Enmascaramiento Frecuencial
Sucede cuando dos o más tonos de distintas frecuencias llegan a nuestro oído de forma simultánea. Existe la posibilidad de que el sonido más intenso enmascare a uno o más de los sonidos débiles, y estos pasen desapercibidos por nuestro cerebro. Este fenómeno no es simétrico: los tonos graves suelen enmascarar a los agudos, dado que los ciclos de alta frecuencia se encuentran más cerca de la entrada (ventana oval). Si elimináramos las frecuencias que quedan enmascaradas, tendríamos el mismo sonido a nivel auditivo, lo cual no afecta al resultado final.

Formatos de Audio Digital

Los formatos de audio son contenedores de archivos de audio.

Bitrate

El bitrate es la cantidad de datos almacenados por cada segundo de audio que se reproduce.

Formatos Lossless (sin pérdida)

Son tipos de formatos comprimidos que permiten recomponer y obtener exactamente el audio original sin pérdida de información. El tamaño de estos ficheros es menor que el original, pero superior al de los formatos lossy.

WAV: Tipo de archivo de sonido digital utilizado en los CD de audio comerciales.
FLAC: Alternativa al MP3 sin pérdida de calidad.
MIDI: Impulso de información que se envía. Es un contenedor de audio con mucha información (no es audio en sí, sino instrucciones para instrumentos musicales).

Formatos Lossy (con pérdida)

Son formatos que, a partir del audio original, eliminan toda la información irrelevante (sonidos imperceptibles para el oído humano) y lo convierten en una aproximación fiel a la original. Su tamaño es mucho más pequeño.

MP3: Puede llegar a ocupar hasta 15 veces menos que el archivo original y aun así conserva gran calidad.
AC-3: Soporta hasta canales 5.1.
WMA: Formato de compresión de Microsoft y fue el competidor directo de MP3.
AAC: Es un formato de compresión de audio desarrollado por AT&T, Nokia, Sony y Dolby.
OGG: Formato contenedor desarrollado en código abierto, de libre distribución y sin patente.

Entradas relacionadas:

Etiquetas: