Últimamente me estoy volviendo a meter en la codificación de audio. Será la época, ni idea. La cuestión es que estoy retomando lo que alguna vez me interesó. Con Joe Satriani de fondo en MP3 VBR V3 voy a tratar de explicar algo de todo lo que vine viendo y concluyendo. Y capaz puedan entender qué fue eso después de MP3, y por qué lo puse.
Documentos que expliquen qué es esto del audio digital hay muchos, y muy buenos. Mejores que cualquier cosa que pueda llegar a escribir yo, desde ya. Hace ya un año o dos por mi parte traducí uno al español, que da una introducción bastante básica al tema, pero que igualmente puede llegar a ser confusa en más de un aspecto. De todas maneras, lo que voy a hacer ahora no es volver a explicar la teoría, sino tratar de exponer un poco todos los puntos más relevantes de la actualidad. Aclarar algunas cosas, desmentir otras… sarasa.
Anduve leyendo bastante. Anduve probando algo también, pero leí más de lo que probé. Formatos, codificadores, técnicas de compresión, niveles de calidad. Todo para llegar a una conclusión universal, que a la vez es compartida por más de uno. Y vos, entiendas o no del tema, vas a terminar pensando “y… supongo que tenés razón”.
A ver. Dije formatos. Formatos tenemos al viejo e inmortal MP3, al inadvertido pero decente OGG, al nuevo y reluciente AAC, al mayormente desconocido FLAC, y a ALAC que seguro no te suena ni adentro de una maraca. Del MP3 no tengo que decir mucho, cualquiera que alguna vez haya buscado un tema en internet, lo consiguió en MP3 y lo abrió con doble click. It’s a fact. De OGG cabe aclarar que se trata de la extensión de archivo, no del formato. Ese se llama Vorbis, u Ogg Vorbis si le querés poner apellido. Se parece mucho al MP3, es un poco mejor técnicamente pero es terriblemente mejor porque cualquiera lo puede usar sin deberle un peso a nadie. Vorbis es libre de patentes. Pero por otro lado, si alguna vez bajás un OGG de internet, tu reproductor (computadora, bicho portátil, radiograbador, auto, celular) lo va a mirar tal perro con cara cruzada… Poco más y te dice que pruebes tirarlo a ver si rebota. De AAC, supongo que tengo que aclarar que es lo mismo que MP4. O que M4A. Acá la hice al revés: AAC es el formato, mientras que MP4 o M4A son los contenedores, y extensiones de archivo. M4A es la abreviatura de MP4-Audio, porque al igual que OGG, un MP4 puede contener tanto audio como video. Por eso puede que encuentres un OGG como OGA (por OGG-Audio). Y como en AAC la cosa se complica un poco voy a empezar otro párrafo.
AAC es lo último de lo último. Por lo menos de lo comercial. Hoy por hoy casi todo el mercado de música digital que mueve Apple por medio de iTunes está en AAC/MP4 (a mí me gusta decirle AAC, por más que en tu vida vayas a ver un archivo con extensión .aac -que existe-). El formato es libre para usar, lo que está patentado es la publicación de cualquier codificador AAC en forma binaria… Entiendo que entienden. AAC es mejor que MP3 técnicamente hablando, presenta menos restricciones y un par de mejoras en cuanto a las capacidades que tiene (lógicamente, por algo el “4”). Pero en lo que todavía no se distingue demasiado es en la calidad del archivo final. O sea, un M4A no le pasa el trapo a un MP3. No hoy.
Después, FLAC y ALAC. Estos dos son mejores que MP3, Vorbis y AAC juntos. Emm… ahh! Me acabo de acordar que podría haber hablado en algún momento de WMA, a la par de esos 3. WMA es el formato con el que Microsoft intentó superar a MP3, pero que fracasó por el hecho que cualquier supuesta mejor calidad de sonido lograda no era competencia para un mercado inundado por un estándar de facto. Si ves WMA a la par de MP3 en reproductores digitales, es porque Microsoft puso plata. Say no more.
Volviendo con FLAC y ALAC, en donde -LAC quiere decir Lossless Audio Codec (codificador de audio sin pérdidas), la diferencia radica en la concepción de los formatos. Y en esa concepción va todo el nudo del asunto. Básicamente, sin pérdidas significa que esos archivos de audio son iguales a los del CD, DVD o lo que fuere. Como ZIP y RAR para el resto de los archivos. Es decir que entre sí son iguales (y que, por descarte, los archivos MP3, Vorbis y AAC no son iguales a la fuente). La F va por Free y la A va por Apple. Tranquilos, hoy en día los dos tienen licencia libre. Supongo que Apple se dio cuenta que nadie iba a pagar para usar un codificador que ni siquiera podía igualar al libre. Te podrás preguntar en este momento, ¿y cómo es que no se usan estos formatos para escuchar música digitalmente? Porque un tema de 4 minutos te ocupa 30 megas. Y si a eso le sumamos el cómo te cambió la cara, voilà.
Dije codificadores, o códecs… Esos dependen de cada formato. Para MP3 tenemos al universal y durísimo LAME, cuyo desarrollo sigue hoy en pie. No tiene sentido nombrar otros. Para Vorbis tenemos el codificador oficial de Xiph, bastante decente, y a su derivado aoTuV, obra de un japonés piola que la tiene bastante clara y que supo mejorar el oficial, partiendo del mismo (cabe recordar que Vorbis tiene licencia libre), en cada versión publicada. Tanto es así que el oficial tomó en dos de sus versiones las modificaciones hechas por el ponja hasta ese momento. Para AAC, la cosa se pone más emocionante. Como dije antes, es el formato más dinámico/competitivo de los actuales. Tenemos el codificador de Nero, que se distribuye como ejecutable de Windows o Linux para cualquier uso no comercial. El de Apple, dentro de QuickTime o iTunes. El de Fraunhofer, por medio de Winamp. Y el de Coding Technologies, también a través de Winamp. También podría mencionar a FAAC, el único de código abierto, pero lamentablemente presenta un desarrollo casi nulo y no está a la par del resto. De los anteriores, podríamos decir en general que Apple y Fraunhofer van un poco por encina de CT y Nero. Pero a la vez todos se encuentran en pleno desarrollo, tratando de sacarle el máximo provecho a las técnicas de compresión propias del formato, por lo que la conclusión anterior es algo volátil.
Sobre técnicas de compresión… Por suerte el mundo se dio cuenta que VBR es la única opción viable en la compresión de audio con pérdidas, dejando casi sepultadas las oscuras épocas en que cuando bajabas un MP3 era cantado a 128 kbps constantes, o capaz tenías suerte y era a 128 kbps. Hacer una pruena ABX entre el CD y esos archivos era como reconocer tu voz a las 3 de la tarde comparándola con la de las 8 de la mañana escabiado hasta la manija… o más o menos. Haciéndola corta, VBR es la que va, todos los compresores contemporáneos usan VBR por defecto, todo el mundo está feliz, muy feliz, y Xuxa también.
Llegando al último punto y quizás el más interesante, tenemos los niveles de calidad. Dichos niveles son los que habitualmente se presentan al público como tantos kbps o aproximadamente tantos kbps o en promedio tantos kbps, es decir 96 kbps, ~128 kbps o 192 kbps en promedio, etc. He aquí donde se define la razón de estos formatos: la calidad y el tamaño del archivo, definidos por esos kbps (en lo que es calidad, estimativamente). A ~256 kbps, MP3, Vorbis y AAC suenan igual que el archivo del cual salen (1.411 kbps). Igual, con esos parlantes de 50 mangos que tenés nunca vas a poder afirmar, sin tener que adivinar, si estás escuchando el CD o el MP3 aún a 192 kbps. La cuestión acá es, a medida que vamos bajando el promedio de kbps, ¿en qué punto podemos notar que el mp3/ogg/m4a suena distinto (en el 99,756% de los casos, peor) que el CD? Eso va a depender primero de tu salida de audio, y recién después del formato, su codificador y las opciones de compresión usadas.
Capaz a esta altura vos ya decís que los M4A que bajás o ripeás desde tu iTunes son los mejores del mundo y es como tener a U2 al lado tuyo y el MP3 o el otro formato que le pusieron un nombre malísimo no existen. A vos fanboy, cabe aclararte un par de últimos conceptos. Ponele que AAC se desempeñe un poco, poquito mejor que MP3/Vorbis a ~128 kbps*. ¿Cúanto mejor? No mucho, la verdad. Eso si es que suena mejor y no peor. Aún así, si le subís un toque el promedio a los MP3 a, por ejemplo ~150 kbps, lograrías el mismo resultado. ¿Ocupan mucho más? Medio mega por tema, me animo a decir. Aclaro, dije 128 porque a medida que suben los bitrates, las diferencias van quedando cada vez menos visibles, hasta llegar a la “transparencia” (en cualquier formato). La diferencia, la gran diferencia, es la portabilidad, que es para lo que en realidad están pensados estos tipos de formato de compresión con pérdidas. Mientras tus insuperables M4A suenan como debe ser en iPods o smartphones, yo llevo mis MP3 pulgosos y si no suenan, es porque los traté de poner en un minicomponente Aiwa de los ’90. Es así. Cualquier bicho que reproduzca música digital te va a leer esos MP3, y te los va a leer hasta que una onda pulsomagnética termine con la era digital. No así con los MP4, lo que nos deja con las siguientes reglas de oro… Todo aparato que reproduce MP4, reproduce MP3. No todo aparato que reproduce MP3, reproduce MP4.

Vendehumo
En lo personal, por bastante tiempo preferí Vorbis a MP3 pero, si quiero calidad de audio y no tener problemas de patentes, tengo FLAC. Y si no necesito FLAC, al fin y al cabo, ¿cuál es la mejor opción?
Happy coding.
* Por sus características propias, AAC se distingue de los demás formatos a bajos kbps, digamos menos de 100. A medida que suben las tasas la diferencia es cada vez menor.
P.D: Mucho ojo con CELT, ahora renombrado Opus. Libre de patentes al igual que Vorbis y FLAC, y todavía en desarrollo, ya pisa fuerte a bajos kbps.