Las interesantes implicaciones de lo sintético

IMAGE: DALL·E 2

Esa imagen que ves de un astronauta relajándose en un spa tropical no es una fotografía. Pero tampoco es un dibujo, o al menos, no ha sido dibujada por ninguna persona en concreto. En realidad, la imagen proviene de DALL·E 2, un algoritmo recién presentado por OpenAI que es capaz de crear imágenes de todo tipo, en distintos estilos, a partir de una descripción en lenguaje natural.

Sencillamente, le describes lo que quieres, «un pato con bufanda nadando en un bol de sopa», le defines el estilo – fotorrealista, pixel art, de los ’70, steampunk, dibujo a lápiz, etc. – y el algoritmo te lo genera con sorprendente precisión, y hasta te propone diferentes alternativas.

Es otra dimensión, pero con el mismo procedimiento, que los textos que simulan redacción humana de todo tipo generados por GPT-3 o las imágenes de personas sintéticas que cada vez se utilizan más para todo tipo de usos sin necesidad de contar con un modelo profesional: ¿quieres un artículo sobre un tema determinado, o una imagen de una persona sonriente para ilustrar un anuncio? No lo escribas ni busques un modelo: pon a un algoritmo a generarlo. ¿Quieres un cuadro? Descríbelo y pídeselo a Ai-Da. ¿Un vídeo musical?

Con DALL·E 2, cuyo nombre es una mezcla del famoso robot de Pixar con el apellido de Salvador Dalí, la cuestión se extiende a las ilustraciones, y me puedo imaginar tranquilamente todas las mañanas, cuando me toca escoger una imagen para ilustrar mi artículo diario, describiendo esa ilustración ideal a un algoritmo en lugar de buscándola entre interminables librerías libres de derechos.

La cuestión, no obstante, es interesante: ¿a quién pertenece la obra creada por un algoritmo? Cuando utilizo una imagen de una librería, trato de atribuirla a su autor, y acepto sus condiciones para su difusión. Cuando soy yo quien describe la imagen que quiero, y el algoritmo simplemente la construye considerando mi descripción y utilizando para ello infinidad de otras imágenes convenientemente etiquetadas, ¿a quién corresponde la autoría? Cuando utilizo la cara sintética de un modelo para un anuncio, ¿qué tipo de derechos genera, si realmente no es una persona que exista como tal? ¿Y si se parece mucho a mí, pero no soy yo?

Obviamente, la cuestión de los derechos de autor y el copyright es la que menos importante me resulta: no veo la necesidad de crear un sistema para que toda creación genere necesariamente unos royalties para alguien en función de algún tipo de mecanismo, y es más, creo firmemente que los conceptos de derechos de autor y copyright son algunos de los más brutalmente retorcidos y abusados de la historia. Pero conceptualmente, la cuestión tiene, indudablemente, su miga.

Mi caso es claro: carezco de las habilidades necesarias para dibujar ni siquiera un mono aunque esté detrás de un árbol, pero ahora puedo describir el dibujo que quiero con bastante exactitud, y mediante una herramienta algorítmica, obtenerlo en un instante. Estoy pasando de utilizar un lápiz o un pincel a utilizar un algoritmo, pero… ¿estoy siendo creativo? ¿El hecho de «conceptualizar» o «imaginar» la ilustración me confiere algún tipo de «autoría» sobre ella, o algún papel en su creación?

Las creaciones sintéticas ponen a la humanidad en una auténtica encrucijada. No tanto por la posibilidad de generar vídeos creíbles de políticos diciendo cosas completamente falsas que en la práctica, terminan siendo utilizadas para degradar a mujeres creando fantasías pornográficas, sino por la posibilidad de que dejemos de necesitar desde modelos, hasta actores, pasando por ilustradores, pintores, fotógrafos, escritores o todo tipo de profesiones creativas entendidas de manera amplia. Dale al algoritmo correspondiente la descripción de lo que necesitas, y el algoritmo te lo hará, sea un texto, una foto de la cara de una persona, una ilustración, o lo que sea.

Llevada al extremo, por supuesto, la disquisición resulta completamente absurda: lo que permite a un algoritmo crear lo que crea no es ni más ni menos que el conjunto de datos etiquetados que utiliza como ejemplo en su proceso de aprendizaje, lo que haría que si todos pasásemos a utilizar algoritmos para la creación de lo que sea, esas creaciones terminasen basándose todas en el mismo conjunto de datos y, por tanto, resultando en un empobrecimiento a nivel global.

Los algoritmos no crean desde cero, y en cierto sentido, son la mejor personalización de esa idea de «apoyarse en los hombros de gigantes», porque toman un montón de creaciones anteriores y las utilizan para sintetizar una nueva. Pero pensar que la creación del algoritmo debe pertenecer a alguien, aunque sea al creador del algoritmo, es ilusorio o artificial, porque lo más probable es que el creador del algoritmo no posea todos los datos que éste ha utilizado para sintetizar su creación. Y plantearse hacer ingeniería inversa del algoritmo para saber qué creaciones originales ha utilizado y en qué porcentajes, aunque técnicamente posible, tendría mucho de absurdo.

Utilizar algoritmos para todo, por tanto, sería básicamente insostenible en términos de creación artística. Pero más allá de eso, no cabe duda que arrastra implicaciones muy potentes, y que podrían llevar a una remodelación bastante radical de muchas de las cosas que hacemos habitualmente. O… de las que muchos dejan de hacer.


This article is also available in English on my Medium page, «Just how creative can an algorithm get?«

20 comentarios

  • #001
    r. - 7 abril 2022 - 15:16

    Me recuerda a la portada de: Crisis? What Crisis?

  • #002
    Benji - 7 abril 2022 - 15:36

    Me parece superinteresante. Me he puesto en la cola de espera como developer porque me gustaría incluso hacer el camino inverso: Desde imágenes generadas, crear una biblioteca de aprendizaje para mi AI.

    Y tengo varias ideas para libros que serían superinteresantes (en mi opinión) y yo sería el #1 lector y comprador de tales novelas si una AI me lo construye a partir de los trazos que le dé.

    ¿Existe el Book-IA?

  • #003
    FER - 7 abril 2022 - 15:44

    Hombre, atribuir a los creadores de la herramienta la propiedad intelectual de lo que salga del mismo me parecería tan absurdo como de Microsoft reclamara la propiedad intelectual de Canción de Fuego y Hielo, solo porque G.R.R. Martin escribiera en Word (que, por Dios, a ver si algún día lo acaba).

    Pienso que el asunto es bastante mas profundo que combinar un montón de creaciones anteriores, del mismo modo que crear un libro es mucho mas que combinar palabras que ya existen; y que el espacio a la creatividad podría ser prácticamente ilimitado. Tal vez estemos presenciando el nacimiento de una nueva forma de arte.

  • #004
    menestro - 7 abril 2022 - 16:14

    Pequeño apunte al natural, la creación plástica no funciona de la misma manera que el lenguaje.

    El cerebro humano no funciona así.

    Implica un nuevo nivel de talento utilizar el lenguaje para crear una obra plástica original, hasta ahora, la escritura y la literatura eran esa vía de expresión.

    (Al contrario de lo que postulaba la hipótesis de Sapir-Whorf.)

    Supone asumir lo que se conoce como una variedad diafásica, es decir, un lenguaje nuevo para ese contexto expresivo. Sucede lo mismo con los asistentes digitales.

    No veas lo que cuesta explicar siendo niño a un profesor que no sabes lo que es «calcar».

    • menestro - 8 abril 2022 - 10:22

      Como pequeña aclaración técnica, DALL-E es un subconjunto reducido de GPT-3, vamos lo que sería un «Paint» de Apple comparado con los «Photoshop» como Jurassic-1 o Wu Dao 2.0 , que dejan en mantillas a la serie GPTn.

      (Wu Dao 2.0 ya escribe poesia en Chino)

      Si alguien está interesado en el lenguaje humano, Ev Fedorenko y su equipo han presentado el LanA (Language Atlas) hace poco.

  • #006
    Salvador - 7 abril 2022 - 16:46

    El valor de una obra de arte es directamente proporcional a que solamente una persona que llamamos artista es capaz de realizarla, y que poca gente tenga ese talento en crearla. Lo de la ley de la oferta y la demanda aplicada al talento creativo.

    Aunque el usuario tenga los derechos de la imagen creada con una orden del estilo

    «Pínta una mona detrás de una escoba»

    Está claro que el valor que se pagaría es directamente proporcional a cuanta gente es capaz en realizar algo similar.

    Si D. Enrique se podría sentir orgulloso de usar ese algoritmo y de decir esa frase a un algoritmo, y podría estar henchido de orgullo y satisfacción.
    pero el resto de mortales con capacidad
    intelectual similar a decir una frase a ese algoritmo, realizarían la misma hazaña, y el resultado «de la obra» sería completamente similar Por lo que esa obra valdría como dicen los mexicanos «un pendejo»

    En definitiva es similar a sentirse artista por buscar una foto en un hipotético google images creativo y creerse el discípulo aventjado de Dalí por ello. Y denotaría el grado de «implicación sintética e intelectual del citado individuo»

    En definitiva ese «arte» tiene el mismo futuro económico que tirar dinero en un nft, o en comprarse el Kremlin en el meta…

    https://es.beincrypto.com/caida-ventas-nft-apunta-quiebra-ico-2018/

    PS: El arte no es morirte de frío

    • Lua - 7 abril 2022 - 19:07

      Me quitaste lo del NFT de los dedos… XDDD

      • Salvador - 7 abril 2022 - 19:58

        Como era la frase…

        «Reza hermano porque no tengas en el NFT…» XDDD
        – Petit Onan el Bárbaro –

        Obra degenerada por GPT-5

        ¡¡ Supera este video !!

        • Lua - 7 abril 2022 - 21:09

          Respuesta a Gorki, superado… :P

  • #010
    Gorki - 7 abril 2022 - 20:35

    yo describir ia algo posible por ejemplo un bodegon en el que al menos haya un pato y una calabaza y un vaso de vino tinto.

    Cuando obtuviera una imagen sensatamente buena pero «artística», la pasaría por uno de esos múltiples filtros que hacen que una fotografía parezca que la has pintado con pincel, o con acuarelas, o en mi caso, elegiría uno que pareciese que he hecho un grabado a plumilla. y luego el resultado, lo saca por una impresora laser , Lo enmarco y lo vendo. ¿Quién decía que yo no sabia dibujar bodegones?

    • Lua - 7 abril 2022 - 21:08

      A mi dejame con mi Photoshop y mis latas de cerveza… y me rio de la IA… XDDD

      SpeedArt: Creepy

  • #012
    Gorki - 7 abril 2022 - 22:26

    Espero que esta IA destrone de una vez para siempre. a las imagenes como NOTARIOS de lo ocurrido, Mucha gente, si ve una fotografía, o un video, sobre algún tema, piensa que ahí no hay trampa ni cartón, pero en le mejor de los casos, una fotografía, o un video, es la selección de uno entre los cientos de imágenes que ha obtenido el fotógrafo, que muestran con mas fuerza, el (pre)juicio que el fotógrafo tiene sobre un asunto. por tanto no es mas, (ni menos), que lael particular punto de vista de una persona, que puede ser imparcial o parcialísima sobre un tema en concreto. .

  • #013
    Xaquín - 7 abril 2022 - 22:32

    «esas creaciones terminasen basándose todas en el mismo conjunto de datos y, por tanto, resultando en un empobrecimiento a nivel global» (EDans).

    De nuevo con «lo de siempre». Y resulta curioso que, al hablar de la necesidad de estudiar la Historia de Roma, el normal de los mortales se emperra en que solo nos referimos a ilustrarse con el comportamiento de sus legiones y sus políticos, incluso de su cultura artística, etc.

    Pero es que Roma sigue dando fruto a lo largo de la historia, para bien o para mal (lo más normal). Y ahí hay que verla también. Cuando en arte, por ejemplo, se cae en el maneirismo, simplemente se está haciendo lo mismo, reproducir el cansancio creativo de una promoción de artistas.

    Por mucho que se estudiara la Historia de Roma (al modo español, por ejemplo), se está considerando como vanguardia el repetir esquemas ya usados, aunque puede que desconocidos por una mayoría de terrestres.

    La diferencia, espero, con un algoritmo inteligente es que el tratará de evitar ciertos posos, que disminuyen la calidad (a saber que eso es?) del objeto creado.

    Porque serán los humanos, que hay detrás de los algoritmos, quienes harán de su uso una simple lavadora de ropa ultramoderna, más rápida y puede que más útil. Pero hay que ser un SJ, para hacer de un puro «magnetofón» de bolsillo un inalámbrico telefónico… y eso, por poner un ejemplo reciente y «sencillo».

    El resto es hacer submarinos de bolsillo, creyendo que se están haciendo aeronaves intergalácticas. Fuera de contexto (meando).

    En fin , bien venida sea la IA, pero que algún dios omnipotente nos libere del programados medio actual. Ese que confunde la teta de silicona con una teta de verdad, a lo Marilyn, por poner un ejemplo muy famoso y tan «mal» usado en los calendarios del gran transporte USA.

    Esperemos conseguir un algoritmo que, por fin, se autofiltre de tal modo, que consiga liberarse de la carga negativa que la mente humana le haya proporcionado.

    Porque somos máquinas casi perfectas, pero no veo a las «skynet» del futuro, montando un pollo tan miserable y desastroso como el Putin en Ucrania.

  • #014
    Juan T. - 8 abril 2022 - 09:14

    Hace tiempo que preveía algo así desde que surgieron algoritmos de este tipo.

    El arte, al menos lo digital, como música o ilustración digital. ya no va a ser cuestión de que pases por el conservatorio o bellas artes, si no de tener el criterio estético para sugerir al algoritmo ideas , elegir entre las que proporcione y, en todo caso darles un toque final.

    Por ejemplo, si le digo que me componga varias melodías en re menor , puedo elegir una que me sea sugerente y desarrollarla, aplicando varios cambios de tonalidad, también ayudado por el algoritmo.

    Es decir, como el trabajo técnico lo va a hacer el el algoritmo y los programas y aplicaciones ad hoc , mi función va a ser el criterio estético, así que los artistas serán finalmente gente con buen gusto aunque no sepan solfeo o dibujo.

    El problema en este caso, es que sea la sociedad la que no tiene buen gusto, visto el éxito del intragable regaetton chabacano y otras tendencias.

  • #015
    Pedro Trillo - 9 abril 2022 - 13:14

    Os hablo desde la experiencia de ser la primera startup española que consiguió acceso y licencia a GPT-3, en nuestro caso generamos modelos de startup usando IA generativa, junto con un modelo combinatorio, al final se genera un entregable final que se descarga.

    La autoría debe de ser del autor del documento, como cualquier otro software, aún tratándose de texto generativo, requiere de una mínima entrada de datos del autor que está generando ese documento, y esos datos pertenecen a una cuenta dentro de un software.

    El usuario es el dueño de ese documento, yo alojo esos datos en mis servidores, y me conecto al Big data de GPT-3, no accedo a esa información en ningún momento, la guardo y alojo pero pertenece al usuario.

    La diferencia entre un editor de texto básico, y uno de IA, es que éste tiene detrás datos y algoritmia, pero bajo todos los efectos, es un software al que accedes, creas una cuenta, y con el que generas X ficheros.

    @Enrique, un experimento muy bueno para hacer con GPT-3, sería hacer una carga de la base de datos de tu blog y entrenarla, con todo el contenido que tienes de años, sin duda funcionaría, tendrías que pensar en un título, y 3 tags, y se generarían artículos Dans-e de manera automática en cuestión de segundos, entonces en este es este caso de uso, quién tendría el copyright?

    ; )

    • Enrique Dans - 9 abril 2022 - 15:03

      ¿Lo hacemos?

      • Lua - 9 abril 2022 - 18:39

        Expectante espero…. experimento interesante XDD

      • Pedro Trillo - 10 abril 2022 - 11:36

        Y por qué no, claro, te escribo en privado, y pensamos la mejor manera, GPT-3 funciona mejor en inglés, pero lo tienes todo traducido también, te escribo esta semana.

      • Pedro Trillo - 12 abril 2022 - 17:26

        Enviado, al correo del blog!

    • Lua - 9 abril 2022 - 18:34

      Yo no acabo de estar de acuerdo… veamos:

      He colgado un video de Speed art hecho con Photoshop. Puedo yo otorgarme la autoria? Solo de haber hecho el video?

      Por lo pronto, era un ejercicio de Photoshop basado en un tutorial ya pre-existente de una segunda persona, que a su vez, emplea mas de seis fotos «de stock» que tienen sus propios autores, ademas de la foto de la modelo, que es de un gran (para mi) fotografo, MJRanum.

      De quien es la autoria? de Ranum? de la modelo? de los diversos que hicieron las fotos de las montañas, farolillo, brushes de los pajaros, etc? Del creador del primer tutorial?

      Mia por haber sido el ultimo en «retocarlo»…???

      Desde mi punto de vista, la autoria es de todos y cada uno de los que de alguna manera han participado (modelo, montañas, farol, arbustos, aves). Que alguien, acople/combine todos esos elementos para crear un «todo», tiene merito, pero no autoria…

      Si el creador del tutorial o yo mismo, hubieramos hecho las fotos de la modelo, las montañas, etc y luego hicieramos la composicion, entonces si, seria autor unico.

      Creo que una IA, que se basa en (creo) pasar por un parser un texto, y en base a ello, buscar fotografias que estan previamente etiquetadas, buscando esas etiquetas dentro del texto.

      No, el usuario no puede reclamar autoria… tampoco la IA ni el creador de la misma.

      Quizas me puede la etica… solo es una opinion.

Dejar un Comentario

Los comentarios están cerrados