Amazon, además de vender productos online, tiene una enorme (enorme) división de servicios web e inteligencia artificial llamada AWS (Amazon Web Services). En ella Amazon aglutina todo lo relacionado con tareas en la nube, como la transcripción de voz a texto, realidad aumentada, cadena de bloques y, por supuesto, machine learning. Es precisamente esta última la que aprovecha DeepComposer, el último lanzamiento de la marca que no es otra cosa que un teclado musical para crear canciones nuevas a partir de una melodía usando machine learning.
De acuerdo a Amazon, es el primero de su tipo. Se trata de un teclado similar al de un piano con 32 teclas diseñado para que los desarrolladores "tengan acceso a la IA generativa, ya sea con modelos pre-entrenados o los suyos". Por el momento el dispositivo se encuentra en fase de pruebas, pero se puede usar en la nube a través de la consola de AWS en ciertas regiones de Estados Unidos. Su funcionamiento es realmente sencillo en la práctica, aunque lo que ocurre entre bambalinas es lo realmente interesante.
De una canción de Beethoven a un tema de rock
¿Cómo funciona DeepComposer? De cara al usuario, este solo tiene que iniciar sesión en la consola de AWS, grabar una melodía corta o importar una ya grabada, seleccionar un modelo generativo correspondiente a su género favorito (digamos, rock) o importar un modelo propio y tocar la composición en la consola. Automáticamente, la IA devuelve una composición similar, pero modificada y adaptada al modelo que elegimos previamente que podemos importar directamente a SoundCloud.
Por detrás, lo que tenemos realmente es una red generativa antagónica (GAN, por su siglas en inglés), que consta de una red neuronal generadora y otra que discrimina. La generadora usa datos aleatorios para crear muestras que se envían a la discriminadora, y esta debe identificar si la muestra forma parte del corpus de entrenamiento o si es una muestra falsa creada por la red neuronal generadora. Poco a poco, la red generadora aprende a crear composiciones tan reales que la red discriminadora no es capaz de identificar como falsa.
¿Cuál es el resultado? A continuación podrás ver dos audios. El primer es un fragmento de 20 segundos de 'Oda a la alegría' de Beethoven. El segundo es el resultado de pedirle a la red neuronal antagónica que cree una composición de 20 segundos del mismo tema usando el modelo pre-entrenado "Rock". La IA no solo ha adaptado la canción a los tempos de una canción de rock, sino que ha sido capaz de añadir batería, guitarra, guitarra eléctrica y bajo.
Audio original
Audio modificado
Como decíamos al principio, DeepComposer se podrá comprar en formato físico, aunque se puede usar en la web desde algunas regiones de Estados Unidos. Su precio será de 99 dólares y, en un primer momento, se queda en su país de origen. De acuerdo a Amazon, "la disponibilidad para otros países seleccionados se anunciará más adelante".
En el caso de optar por la versión web, Amazon ofrece 12 meses de Free Tier (es decir, de uso básico). Con este plan podremos crear una pieza usando uno de los modelos pre-entrenados e importar una melodía para crear hasta 500 canciones. Además, se ofrece una prueba gratuita de AWS DeepComposter de 30 días a todos los usuarios con la que se pueden crear hasta 40 temas. Posteriormente, el precio pasará a ser de 1,26 dólares por hora de entrenamiento y 2,14 dólares por hora de inferencia.
Más información | Amazon
Ver 8 comentarios