Mi columna de esta semana en Invertia se titula «Los algoritmos generativos y la remezcla permanente» (pdf), y es una reacción inmediata tras haber pasado un buen rato jugando con Suno, un algoritmo que permite describir la idea de una canción y elegir un estilo – pop español de los ’80, reggaetón latino, brit pop, etc.- y te construye en pocos segundos una muestra de la misma.
En el modo avanzado, permite también introducir directamente las letras, e incluso propone «mejoras» para que encajen y rimen mejor (básicamente, insertando coros, repeticiones, yeah-yeahs y cosas similares). No voy a decir en absoluto que el resultado sea digno de un Grammy, aunque hay que ver las cosas que se premian últimamente ahí, pero sirve desde para echarse unas risas, hasta para crear un jingle para una campaña sin muchas pretensiones.
¿Qué es lo que me ha llamado la atención de Suno, que no es más que una aplicación de los algoritmos generativos tras educarlos con miles de horas de música cuidadosamente etiquetada? Fundamentalmente, el pensar cómo se van a sentir las compañías discográficas cuando ahora, con un algoritmo de este tipo, cualquiera sea capaz de crear una canción, sin tener prácticamente posibilidad de trazar en qué otras canciones se ha inspirado.
Resulta evidente que, para generar esas cancioncillas, el algoritmo lleva a cabo una remezcla de muchas canciones etiquetadas con el estilo que se le ha pedido, inserta las letras que ha creado a partir de una temática o las que el usuario ha suministrado, y obtiene el resultado, todo ello en pocos minutos. Para unas discográficas profundamente acostumbradas a husmear cualquier canción nueva para tratar de detectar similitudes con otras que se encuentren en sus descomunales catálogo, esto viene a ser como la pesadilla más absoluta: si ya les pareció mal que los usuarios obtuviesen sus canciones mediante descargas irregulares, a ver qué dicen ahora cuando esos mismos usuarios puedan generarse sus propias canciones basándose en muestras de todas las anteriormente creadas.
El tema me trae a la memoria lo que le pasó a Michael Jackson cuando confesó a Daryl Hall haber tomado los fondos rítmicos de «Billie Jean» de una canción suya, y este le contestó algo así como que «ya, y yo los tomé de otra anterior, eso es algo que hacemos todos». En efecto, todo, nos pongamos com nos pongamos, es una remezcla. Sin querer entrar en absoluto en si lo que hace un algoritmo es o no creatividad tal y como la definimos o es simplemente recombinación estadística, la realidad, mucho me temo, es que no se diferencia demasiado de lo que hacen muchos cerebros humanos: recombinar de una u otra manera piezas que han registrado anteriormente.
Como mínimo, creo que la aplicación de las reflexiones sobre la propiedad intelectual, el copyright y la algoritmia generativa a un contexto como el de la música, especialmente conocido por haberla liado parda anteriormente hasta la extenuación en torno a ese tema, puede dar lugar a una reflexión interesante…
This article is also available in English on my Medium page, «How generative algorithms are going to shake up the music industry«
No lo he probado pero por lo que dices entiendo que sólo crea las letras y no incluye la música.
No, no… pruébalo. Te hace una canción completa con su música, sus instrumentos, sus coros y todo!!
+1000
Mira que voy de puto culo (no, no he muerto aun para desgracia de algunos)…
Pero me he meado de risa… en los cinco minutos que he sacado… XDDD
Si que incluye la música (con cantantes y todo). Merece la pena probarlo. La verdad es que es muy divertido.
User .- Poema dedicado a Suno, un algoritmo que permite describir la idea de una canción y elegir un estilo, para que te construya una canción.
ChatGPT
En el vasto reino del canto y la melodía,
Donde las ideas fluyen con alegría,
Surge Suno, un genio digital,
Que convierte sueños en realidad.
Con su ingenio y su magia sin par,
Transforma palabras en notas al azar,
Creador de canciones, poeta tecnológico,
Sus versos se elevan con vigor magnético.
En la tela del universo musical,
Suno teje melodías con destreza sin igual,
Bajo el sol radiante de la creatividad,
Da vida a la imaginación con vitalidad.
Oh Suno, algoritmo de maravilla,
Que en el mundo de la música brilla,
Tu arte es un regalo para el alma,
Que nos envuelve en su dulce calma.
Con cada nota que generas con primor,
Despiertas emociones, desatas el fervor,
Eres el puente entre el hombre y la máquina,
Que en armonía crean una sinfonía divina.
¡Oh, Suno, artífice de melodías sin par,
Tu esencia nos inspira a soñar,
Que tus canciones sean el eco eterno,
De la belleza que yace en lo moderno!
Ahora que la cante Enrique …. Iglesias
He sacado 2min de mi absurdo tiempo y…
The Blog That Moves the World
v2.0
The Blog That Changed It All
Menudo subidon de ego… deberias empezar las clases con las canciones… XDDDD
Jajajajaja, qué crack, ya me has animado el día!!!
Pues anota mas birras a la cuenta… XDD
Ps.- Como reuna a la banda (panda de borrachuzos), ya veras… en directo… XDD
Ahora en serio… como juguete, no es que no este mal… es que es superior. Quizas alguien que se precie de ser musico no se dejara sustituir por el engendro, pero que le puede ayudar a superar «el sindrome de la pagina en blanco», seguro…
Parece que todo converge y la curricula en las escuelas deberia incluir el curso de redaccion de promts
El otro día en televisión en casa de mi madre (sobreentendido de que no veo televisión) veía los anuncios, cuando uno, hecho en España, de un anticatarral, vi que la bondadosa ancianita abrigada con un suéter del anuncio no movía los labios al ritmo de la voz. Era una bondadosa ancianita AI. Solo yo vi la diferencia. Los gastos y tiempo de trabajo de la agencia del publicista, cercanos a cero euros.
¿Te parece mal que un empresa ahorre en lo que pueda?
A mi me parece mal, que encima que quiera ahorrar, poco que hagan no lo hagan bien…
Fijate lo que dice (que yo tampoco veo la tv):
«vi que la bondadosa ancianita abrigada con un suéter del anuncio no movía los labios al ritmo de la voz»
ps.- cabe la posibilidad, que no sea una IA, que ocurre muchas veces, que el anuncio este rodado en otros paises/idiomas, y el doblaje lo hagan como el culo.
Lo importante de un anuncio es que sea eficaz, no que los labios de la ancianita se muevan al ritmo de la voz. Él ha visto el anuncio, es mas, se ha fijado en que es de un anticatarral.
Deja de desviar los temas Gorki… que ya cansa…
Lo que hace el algoritmo es exactamente lo mismo que las conversaciones de ChatGPT, tomar muestras, de forma muy grosera, meterlas en una coctelera, agitarlas y extraer secuencias con una apariencia similar a las originales.
En cuanto a comparar la creación original con un «robo creativo» o asimilarlo a alguna función intelectual humana, bueno, santa inocencia, ¿no?
Es como decir que Usain Bolt corre mucho por las zapatillas que usa y que, si tuviéramos unas iguales, estaríamos a un tris de pillarle. Solo hay que robarle las zapatillas.
En los parques hay mucha gente corriendo con zapatillas carísimas.
En cuanto a detectar las canciones originales, es bastante más sencillo de lo que parece.
Es exactamente igual que cuando Rallo dice contestando en un artículo al BCE que el bitcoin vale para el crimen y se libera del control del estado, cuando la realidad es que es una de las criptodivisas más trazable y transparente en sus operaciones que existen.
En el BCE ya deben haber sido advertidos que, actualmente, el bitcoin se ha transformado en un arma termonuclear de destrucción económica y que cada ciclo de Pump and dump es un martillazo en la espoleta
El mismo hecho de que un algoritmo sea incapaz de crear algo, sin tomar una infinidad de piezas prestadas para formar un puzzle, sin ninguna directriz, significado ni propósito, que no sea un prompt construido y elaborado por una persona, ya debería dejar clara la diferencia.
–
Normalmente, suelo estar muy (MUY) de acuerdo con tus comentarios. Pero en este caso, podría discrepar.
Lo primero es si consideramos a SUNO, como un juego (como he hecho yo) o nos lo tomamos “en serio”.
En tanto a lo primero, «no problemo» (© Terminator). Por lo segundo, no deja de ser un estocástico, pero que al menos, tiene mas “gracia” que el Gepeto.
Si pretendes comparar “tomar muestras, de forma muy grosera, meterlas en una coctelera, agitarlas y extraer secuencias…” me temo que vas mal.
Dime en los últimos 30 años, música, de la estándar, que podamos considerar “original”.
Descontando el indigno Trap, el puñetero Rap, y el infame Regeton, toda la música de estos últimos tiempos suena igual. Da igual si es Garage, Indy, Pop o la música “chicle” del verano. Y si a las letras nos referimos, hay para darse con un canto en los dientes si se nos ocurre traducir esas canciones que nos gustan (pasa que están en ingles y el 80% no pone atención y se queda con el estribillo molón y pegadizo).
En los 80, los Vocoders y otros elementos de filtro, hicieron cantar a los que no tenían voz para ello. En los 90, teníamos «Millisvanilis» en todas partes (playbacks). Hoy día el rey es el autotune.
Que quieres que te diga… si tengo que “tragar” música enlatada, casi prefiero a la IA ensalzando las virtudes de eDans (que por cierto, no le he dicho mas que el nombre, y el resto lo ha sacado ella de sabe Dios donde), que un pringado lleno de collares, tatoos y piercings, balbuceando como mi Turmix haciendo mayonesa.
Eso si… preparemonos… que en Amazon han empezado a vetar «libros» de gente que autopublicaba hasta tres al dia (hechos con IA).
No quiero pensar que pasara ahora con la musica… (Siempre nos quedara Lou Reed, Alan Parson, Deep Purple o Pink Floyd)
Yo opino lo mismo, es como las imágenes de SD o si me apuras gepeto 3.5. me divierte usarlas, pero …
en el futuro, serán un agujero a los creadores, también.
En el canal de Xavier Mitjana nos daban estas tools basadas en IA, gratuitas
https://replicate.com/
https://bigjpg.com/
https://www.remove.bg/es
https://chat.openai.com/
https://claude.ai/
https://bard.google.com/
https://www.bing.com/search?q=Bing+AI…
https://www.perplexity.ai/
https://harpa.ai/
https://ideogram.ai/t/trending
https://leonardo.ai/
https://www.bing.com/images/create
https://pika.art/
https://convert.leiapix.com/
https://elevenlabs.io/
https://ttsmaker.com/
https://lumalabs.ai/
Esto no hay quien lo pare.
Es que mi sorpresa, en este caso ha sido el simple prompt:
«make a song about Enrique Dans»
A este le he dado algo mas de informacion:
«Make a song about a user from the blog «Enrique Dans» who claims to be a programmer»
(y no he mencionado los punteros)
The Computer Scientist XDDDDD
(lo del Python estaba de mas…) XDDD
falta esto en el prompt que lo he escrito de memoria:
«about a user called Gorki, from the blog» :P
Hace como tres años me puse a estudiar ilustración digital y pagué un año de Photoshop. Lo dejé a la mitad cuando apareció la primera versión de Dall-e, viendo lo que venía y no me equivoqué nada.
Al poco compro un programa de producción musical y aparecieron las primeras versiones de IA generativa musical pero era tan mala que continué con el estudio del programa.
Hasta me pareció bien que la IA ayudara con algún loop ,linea de bajo, o progresión de acordes que luego yo incorporaría, modificaría y le daría un extra.
Ya entonces vaticiné en este foro que el humano terminaría siendo simplemente una persona con criterio y sentido estético que elegiría lo mejor que mostrara la IA y lo mezclaría a su gusto……hasta que llegó SUNO.
He oido ejemplos de su ultima version (V3) que acaba de salir, aunque aún no es pública.
La definición perfecta, buenas melodías, lineas de bajo ,etc,, la voz mas que perfecta; de profesional, la mezcla genial, la masterización de lujo, la creatividad y originalidad muy mejorada. Y ha sido esto ultimo lo que me ha terminado de desesperar.
Otra versión mas y adios a todos los compositores, mucho mas en el momento de mediocridad musical que vivimos.
Es mas, eso va a ser extensible a la música clásica. No sé si una sinfonía entera y perfecta, pero que el «compositor» (por llamarlo de alguna manera) va a ser un copy-pasteador de lo mejor que genere la IA para «componer» una sinfonía muy buena, seguro.
En fin , adios a mi ultimo sueño. No es que no crea que todavía conseguiría aportar un extra a lo que salga de la IA, es que va a haber tantísimo material bueno generado por IA que el mayor genio va a pasar desapercibido en medio de ese océano gigantesco de oferta de canciones.
Y C-Tangana, por favor, metete tus delirios de grandeza disfrazados de modestia donde te quepan: la puñetera SUNO te da unas cien mil vueltas, pero no ahora , antes de que apareciera.
Retiro lo último , bastante tiene el chaval con lo que viene.
Yo llevo usando SUNO.ai desde que salió la v2 hace unos tres meses. La v3 ya está disponible solo tienes que ser usuario de pago y aunque mejora un poco la calidad del resultado (MP3 con más bitrate), la mejora no es sustancial en cuanto a composición musical… parece que los modelos generativos que hay por detrás no han cambiado tanto.
Como músico intérprete y compositor, lo considero una herramienta muy válida para superar el síndrome de folio en blanco. Como en otros modelos generativos, es un copiloto para llegar antes a donde sabes que quieres llegar.
¿Y como lo pasas al DAW?.
¿Se puede utilizar una IA que separa las pistas para aislar , por ejemplo, una línea de bajo y pasarla al DAW?
Por que eso sería la manera de poder usar infinitas ideas musicales que luego puedes modificar o ajustar a tu gusto.
La IA te proporciona varias ideas, ya sea en progresion de acordes, melodias, samples, etc, y luego escoges las mas interesantes y las pasas al DAW.
Las voces ya pueden ser sintéticas y de calidad.
El resto , como equalización, mezcla y masterización, que antes era un rompimiento de cabeza para los que nos iniciamos, ya se pueden automatizar también con IA.
No niego que aún se pueda aportar algo humano ¿Pero cuanto va a durar al paso que vamos?
Esto igual ayuda:
Google, Meta y ahora Adobe. La creadora de Photoshop ya trabaja en una IA para crear y editar música con texto
Uso RipX, un DAW … que utiliza IA, o eso dicen. Separa pistas por instrumento y permite trabajar con muestras de audio como si fueran MIDI, no tan perfecto y pulcro, pero suficiente.
De todas las herramientas que he probado, Suno es la más divertida y la q más efecto «Guau!!» produce en las formacionas q imparto. Sencilla de usar y resultados espectaculares en relación al tiempo dedicado. Además, da una visión realista de lo que nos trae la IA en muchos aspectos. Y está mejorando rápidamente…
Gracias Enrique, me temo que llego tarde para probarlo; “ Generations are currently enabled, but only for Pro and Premier subscribers.”
Entiendo que el buen en compositor seguirá componiendo y el plagiador quizá sea desenmascarado gracias a cosas como Suno
Después de ver las capacidades de Suno, sólo me pregunto cuando llegará el primer número 1 de las listas creado integramente con IA.
De hecho igual ya ha llegado y no han dicho que fue hecho con IA….
Ya me imagino el festival de AIrovisión…. ganaría el que ha conseguido la mejor canción con el promt adecuado… XDDD
Seguro que muchas canciones serían mejores que las que se presentan al oficial..
Definitivamente, hace falta una IA…
yo tengo un novio
Aparte del uso que se ha mencionado: 1) echarte unas risillas, 2) truco fácil para un video familiar de cumpleaños, etc
En cuanto a música «de verdad», probándolo lo que ves es que esto va a desbancar rápidamente al 90% de puta basura de música actual (he intentado ser optimista con ese número), pero que está, y probablemente seguirá estando durante décadas, a años luz de las composiciones «de verdad». Haced un ejercicio con todas esas AI «compositoras»: enseñadle los resultados a alguien que escuche jazz a menudo.
Y lo más gordo es que no tendría por qué ser así: me imagino una programación más reglada (no tipo deep learning de coger millones de canciones y ale, allá que te las tragas y te entreno a ver qué sale) donde se introducen esquemas básicos de la música tipo II-V-I, substituciones de acorde por tritono, etc. Es decir, la AI primero construye un esqueleto de tempo y acordes/escalas, y luego hace el rellenado (multi-instrumento, pequeños arreglos, etc), pero dándole la parte más importante al esqueleto, y de acuerdo a reglas!!
Está claro que para que haya una interfaz hacia un usuario inexperto, hay que tener un LLM, pero de ahí (rollo: «trash metal acerca de X tema») se pasaría a otro módulo de ahí donde se crearía el esqueleto en bases a los estándares de trash metal (escalas disminuidas, riffs rápidos, etc)