32 – ¿Cuáles son los formatos de audio digital?

PCM, Wav, Aiff. Compresión. Mp3, Ogg, Wma.

El trabajo con audio digital es casi una tarea para especialistas en enigmas. Como el audio se guarda en la computadora y todos los archivos informáticos tienen extensiones, tenemos que interpretar cada sigla y abreviatura.

La extensión es la parte final del archivo que hay después del nombre y el punto. Sirve para conocer qué tipo de archivo es, si es un texto, un video o un audio. Hay muchas extensiones y todas seguro que te suenan: WAV, RM, MP3, WMA, OGG… Juguemos, entonces, a descifrar enigmas y veamos qué significa cada una de estas siglas.

 ARCHIVOS DE AUDIO DIGITAL SIN COMPRIMIR

.PCM

No es un tipo de archivo o formato, sino una técnica de transformación de audio analógico a digital sin ningún tipo de compresión.(1) Por eso, no vemos audios con la extensión pcm. Trabajamos con PCM a la hora de digitalizar, pero siempre guardamos en archivos con alguna de estas extensiones:

Icono Wav

.WAV: (Wave, onda en inglés)

Es el formato de audio digital sin comprimir más usado. Pertenece a Microsoft / IBM.

.AIFF: (Audio Interchange File Format)

Es similar a WAV pero para las computadoras Macintosh o MAC de Apple.

.CDA: Son las pistas de audio grabadas en Disco Compacto que también usan el sistema PCM.

Todos los archivos sin comprimir son de gran tamaño. Aproximadamente, unos 10 Megas por cada minuto de audio. Estos son los formatos usados para guardar audio a nivel profesional ya que la calidad es muy buena. Pero cuando no necesitamos tanta calidad y estamos escasos de espacio, es el momento de usar la compresión de archivos.

 COMPRESIÓN DE AUDIO

Comprimir es reducir y siempre que reducimos perdemos algo. Lo mismo sucede con el audio digital. Los últimos avances han permitido que la compresión se haga con las menores pérdidas posibles de calidad, pero siempre las hay. Frente a eso, se ha ganado mucho en la reducción del tamaño de los archivos.

Mientras que un audio de 4 minutos en formato WAV ocupa aproximadamente 40 Megas, ese mismo audio, comprimido a MP3, puede reducir su peso a 4 megas, 10 veces menos. Y aparentemente, suenan igual.(2)

GUARDAR SIN COMPRIMIR

Cuando se trabaja en producción se graba siempre en WAV, sin comprimir. De esa misma forma se edita y mezcla. Si el resultado final de la edición es un audio para ser colgado en una Web o guardado en el disco duro de una computadora, podemos comprimir en mp3 pero con una calidad no inferior a 160 kbps.

Si por el contrario, la producción tiene como destino final ser grabada en un CD, nunca comprimas, deja siempre el audio en WAV y quémalo de esa forma en el CD.

1. ¿Cómo funciona la compresión?

No se trata de arrugar o aplastar el audio. La mayor parte de sistemas de compresión de audio se aprovechan de un “defecto” de nuestro oído para reducir el tamaño del archivo. Se llama enmascaramiento.

El enmascaramiento es una propiedad del oído humano que le impide distinguir dos frecuencias muy juntas dentro del mismo rango, una enmascara a la otra. Por ejemplo, si en una canción suena al mismo instante un sonido con una frecuencia de 12 Khz y otro de 12.2 Khz, podríamos quitar una de las dos sin que lo notemos al escucharlo.

De esta manera, el compresor va “restando” las frecuencias enmascaradas, lo que reduce el número de bytes. Y menos bytes en informática se traduce en archivos de menor tamaño, pero no de menor tiempo. La canción, al ser comprimida, dura lo mismo que sin comprimir.

2. Calidad de los archivos comprimidos

Vimos en la pregunta anterior que un audio digital tiene dos parámetros: la frecuencia de muestreo (la óptima es de 44.1 Khz.) y la resolución o tamaño de cada muestra (8 ó 16 bits). Al comprimir, agregamos un tercer parámetro a estos dos, el bitrate. Es la cantidad de kilobytes por segundo (kbps) y se refiere a la calidad de la compresión.

• A menor número de Kbps, más compresión, menor tamaño del archivo, pero menor calidad.

• A mayor número de Kbps, menor compresión, mayor tamaño del archivo y más calidad.

Un audio comprimido a 128 Kbps tiene mayor nivel de compresión que uno de 256 Kbps. Eso significa que el 128 es un archivo de menor tamaño y menor calidad que el de 256. ¡Aunque hay que tener oído de gato para distinguir ambos!

BIT VARIABLE O CONSTANTE

Algunos archivos tienen una tasa de bits por segundo constante (CBR Constant Bit Rate) y otros la tienen variable (VBR Variable Bit Rate). La constante es siempre la misma para todo el audio, por ejemplo, 128 kilobytes por segundo. En el método variable, lo que hace el compresor es usar más bits cuando hay partes del audio donde existen mayor número de frecuencias y no puede enmascarar todas.

 FORMATOS DE ARCHIVOS COMPRIMIDOS

Icono Mp3.MP3 (MPEG-1 Audio Layer 3) (4)

Logra compresiones altas sin muchas pérdidas, aunque todo depende de la calidad de la compresión que usemos. De 128 Kbps para abajo no es recomendable.

Aunque mp3 es el estándar de compresión más usado, sobre todo para audio en páginas Web, el gran inconveniente es su patente. Por eso, cualquier reproductor o software de edición que quiera usarlo tiene que pagar por ello.

.OGG (Vorbis)

Fruto de esa patente, la Fundación Xiph.org desarrolló en el 2002 un codec(5) totalmente libre para la compresión de audio. Similar en características al mp3, se está comenzando a usar mucho en la Web y en algunos reproductores ya que los fabricantes no tienen que pagar los costos de la patente. A estas alturas, es difícil que reemplace completamente al mp3 pero le está comiendo mucho terreno.

.AAC (Advanced Audio Coding – Codificación de Audio Avanzada)

El nivel de compresión es mayor que el mp3 (MPEG-1) sin mayores pérdidas de calidad. AAC es uno de los codec usados en el nuevo estándar de compresión MPEG-4. Este formato de audio se usa en reproductores como el iPod y en alguno de los nuevos sistemas de radio digital. AAC se perfila como el sucesor del mp3.

.RAM (también RM o RA)

Son los archivos de la compañía Real Networkpara audio. El problema es que su reproducción y edición está muy limitada a software de la misma empresa y pocos más.

.WMA (Windows Media Audio)

Es la apuesta de Windows a los formatos comprimidos. Es como un WAV, pero de tamaño más reducido y menor calidad. Mientras que los archivos mp3 y ogg los suenan casi todos los reproductores y editores, no sucede lo mismo con los wma, por eso se usa muy poco.

. AA3 (ATRAC – Adaptive Transform Acoustic Coding)

Formato inventado por Sony. Es el que usan los grabadores-reproductores de minidisc.

.OTROS

Se usan principalmente en reproductores de audio o para los ringtones(6) de teléfonos celulares, como por ejemplo mmf, amr…

PROYECTOS DE AUDIO

Los editores multipistas de audio generan archivos con extensiones propias. Por ejemplo, el multipistas Audacity guarda los archivos con la extensión .aup Pero, aunque el proyecto o sesión de Audacity contenga audios que estamos editando, esto no significa que sea una extensión de un formato de archivos de audio. Es sólo la forma en que el programa guarda el proyecto. Cada editor multipistas, al igual que cada software, tiene su propia extensión.

 ID3 TAGS

Estas tags o etiquetas no son formatos de audio, sino una aplicación de los archivos digitales. Al sonar una canción en un reproductor de audio de la computadora, vemos el título de la canción, el artista, álbum, año… Esta información son las tags y se pueden editar fácilmente con el mismo reproductor y sin afectar en nada el audio de la canción.

Winamp Tags

Pantalla del reproductor de audio Winamp para editar las tags de un audio.

▪ Ingeniería de Ondas: Formatos de Audio Digital. Alberto López Martín. Universidad de Valladolid. http://www.lpi.tel.uva.es/ (Leer el documento)

 Notas

La compresión es un procedimiento del que hablaremos más adelante que permite bajar el tamaño de los audios sin que pierdan calidad.

Al hablar de peso nos referimos al tamaño en bytes de un audio o archivo informático digital. Los archivos grandes necesitan muchos bytes, eso significa que ocupan más espacio en un disco duro y que “pesan” más para ser descargados de una web.

El audio digital sin comprimir, como el de un CD, tiene 1.411 Kbps. Como ves, la diferencia de bytes es considerable. Hablamos en este ejemplo de un audio digital sin comprimir a calidad estándar con frecuencia de muestreo 44.1 Khz, 2 canales por ser estéreo y 16 bits. Saca la cuenta: 44.1 × 2 × 16 = 1.411 Kbps

Este formato de audio digital comprimido fue desarrollado por científicos del Instituto Fraunhofer IIS, perteneciente al Grupo de Expertos en Imágenes en Movimiento (MPEG-Moving Picture Experts Group) que se dedica a desarrollar estándares de codificación de audio y video.

Siglas de Codificador – Descodificador. Los codecs de audio son los sistemas o tecnologías de compresión y descompresión.

Timbres o tonos de llamada del celular.

32 – ¿Cuáles son los formatos de audio digital?

También te puede interesar

10 comentarios sobre «32 – ¿Cuáles son los formatos de audio digital?»

  1. Gracias a vos por las felicitaciones Jorge, lo mejor es saber que el manual está siendo de utilidad sobre todo para los neófitos como comentas. Sé que para técnicos profesionales se queda un poco corto, pero la idea es que los que no son técnicos se puedan acercar a este mundo y no depender de nadie a la hora de usar los equipos.

    Saludos!

    Santiago García. Analfatecnicos.net

  2. Hola: Sólo para felicitarte y darte las gracias por esta excelente explicación de los formatos de audio digital. Sencillamente, muy completa pero a la vez muy específica y muy fácil de entender para los neófitos. Lo mejor que personalmente he podido ver en Internet, sobre este tema en especial, por lo didáctico del estilo empleado.

    Jorge Luis Carrera, PANAMÁ, REP. DE PANAMÁ.

  3. Me parece que respondiste no solo a una interrogante sino a muchas muy informado y muy bien explicado consiso y simple pero lleno de informacion util realmente un muy buen trabajo te felicito.

    Jean Paul Latour, PERU.

  4. Hola Santiago. Me encanta tu página. Esta muy didáctica, amena y fácil de entender todo su contenido. La recomendare ampliamente; y, por cierto, tu capacidad de síntesis es extraordinaria. Empece haciendo una tarea de un curso de sonido que estoy tomando a distancia y no he podido soltar tu página !!! (Leí que alguna vez estuviste en el amazonas), así que te envío un saludo desde Caracas-Venezuela! Y ante cualquier duda, te escribo. ÉXITO! ; ) 

    Denise Arismendi, CARACAS-VENEZUELA.

    1. Saludos Denise!

      Gracias por tus palabras, de verdad. Es bueno saber que el manual te es útil. Espero que la próxima edición, con todos los aportes, sugerencias y correcciones que están haciendo, quede más completo. Y sí, estuve 5 años en el Amazonas venezolano, fue mi primer destino en Latinoamérica, así que guardo gran cariño a tu país. Abrazos y cualquier duda, me cuentas!

      Santiago García. Analfatecnicos.net

  5. En primer lugar: enhorabuena por el manual y muchas gracias. He descubierto esta página a través de los vídeos de Youtube en los que se trata el manejo básico de Ardour, que, por cierto, también están geniales. Estoy leyendo (por encima) el PDF con el libro completo y me está gustando bastante todo su contenido. Es claro, conciso, fácil de entender y cercano.

    Sin embargo, al llegar a la punto 32 (acerca de los formatos digitales de audio), he echado algo en falta: los formatos de compresión sin pérdida. He visto que cuando hablas de formatos comprimidos haces la siguiente afirmación: «Comprimir es reducir y siempre que reducimos perdemos algo» que no es del todo correcto. Por poner un ejemplo fuera del mundo del audio, si comprimimos un archivo en formato ZIP (o mejor, GZIP) se habrá reducido su tamaño pero la información al descomprimirla seguirá intacta. No se habrá perdido nada.

    Del mismo modo ocurre con los formatos (supongo que de sobra conocidos por ti como FLAC o WavPack) que son capaces de reducir el tamaño de los ficheros de audio (por ejemplo WAV) y mantener todas su información una vez descomprimidos (o mejor dicho, decodificados). Quizás de cara a nuevas ediciones del manual sería interesante mencionar la compresión sin pérdida y alguno de dichos formatos ya que creo que son realmente útiles, tanto a nivel doméstico como profesional.

    Francisco Sariego Rodríguez, LOGROÑO, ESPAÑA.

    1. Hola Francisco.

      Agradecerte tus palabras sobre el Manual, me alegra mucho que te parezca útil. También te agradezco la sugerencia.

      Sabes que en varios temas, al querer hacer el Manual lo más sencillo posible y no complicar mucho, creo que he pecado de dejar algunas cosas por fuera. Estos formatos son una de ellas. Como en algunos reproductores, sobre todo los que trabajan con Windows, no trabajan bien, quise sólo citar los más comunes, que por cierto no son siempre los mejores como sabes.

      Pero la idea es, precisamente, que el Manual, al menos en la versión web, se vaya enriqueciendo con opiniones como la tuya. Y si en el futuro hay nueva edición física o en pdf del Manual, incluiré muchas de las sugerencias que están haciendo.

      Un abrazo desde la mitad del mundo!

      Santiago García. Analfatecnicos.net

Responder a santiago Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *