La huella de LAION y la trascendencia de una victoria judicial

IMAGE: LAION logo

LAION, la compañía alemana sin ánimo de lucro dedicada a la recopilación de imágenes para el desarrollo de sus propios algoritmos de inteligencia artificial y de otros que quieran utilizar su banco de datos libremente, ha obtenido una victoria judicial contra un fotógrafo aleman que pretendía que borrasen una serie de fotos de su autoría de la base de datos.

Esta victoria es la primera que un repositorio dedicado al entrenamiento de algoritmos obtiene contra una reclamación de copyright, y es potencialmente por ello muy importante de cara al futuro. Tras la publicación de herramientas que permiten saber si alguna imagen tuya o algún texto han sido utilizados para el entrenamiento de algoritmos, los juzgados se han llenado de pedigüeños que pretenden obtener compensaciones económicas por ello, algo que refleja únicamente su codicia y, desde mi punto de vista, una extensión injustificada, injustificable e ilógica de los derechos de autor.

Pretender que una imagen o una información, por el hecho de tener copyright, no puede ser utilizada para el entrenamiento de un algoritmo es como pretender que no podamos verla, recordarla o utilizarla para construir otras obras sobre ella, y debería ser considerado un absurdo conceptual. Como en su momento comentó Mustafa Suleyman, CEO de Microsoft AI, lo que está en la web en abierto, debe poder ser utilizado para el entrenamiento de algoritmos, y si no quieres que lo sea, no lo pongas en internet o especifica claramente, de manera que pueda ser leída e interpretada por una máquina, que no deseas que ese material sea utilizado para ese uso en concreto. Lo siento, pero eso de «no mires mi obra, que está libremente accesible en la red, porque podrías almacenarla en tu cerebro y utilizarla posteriormente sin pagarme» es completamente disfuncional.

Pocas cosas me parecen más pacatas, cutres e injustificables que protestar y pretender compensaciones porque un contenido creado por alguien ha sido utilizado para el entrenamiento de un modelo. Si quieres cobrar cuando alguien vea, lea, consuma o distribuya una obra tuya, vale, hazlo. ¿Pero cobrar cuando un algoritmo la utiliza para entrenarse? ¿Qué será lo siguiente? ¿Cobrar porque alguien piense en ella? He creado en mi vida miles de imágenes y textos, y las he publicado siempre con una licencia que permite su uso por parte de terceros. Me consta que muchas de esas imágenes y textos han sido, de hecho, recopiladas y utilizadas para muchos usos, y es más, me enorgullece. ¿Tiene algún sentido que me ofenda porque esos contenidos sean utilizados para entrenar a unos algoritmos que, eventualmente, serán la base de la inteligencia del futuro y de una eventual generación de riqueza? En modo alguno puede resultarme ofensivo que un algoritmo piense como yo lo he expresado en mis artículos o componga fotografías como yo lo he hecho. Cuanto más las utilicen, mejor para mí.

De hecho, en la primera contestación de LAION a la petición del fotógrafo, la compañía afirmó simplemente que no había nada que pudiera borrar, porque no posee imágenes, sino únicamente enlaces a las mismas. Ante eso, el fotógrafo argumentó que la compañía había hecho copias de las fotografías para extraer información de ellas, y que eso, según él, constituía una violación del copyright. Sin embargo, el argumento presentado por los demandados fue que cumplían escrupulosamente con la excepción de recopilación de datos para la minería de textos y datos existente en la legislación alemana, y que como tal, y por el hecho de ser una organización de investigación, se les permite llevar a cabo una reproducción de una obra con el fin de extraer información.

El tribunal apreció que si bien la gigantesca base de datos de LAION ha sido utilizada por organizaciones comerciales, el conjunto de datos en sí se había puesto a disposición del público de forma gratuita, y no se había presentado ninguna prueba de que ninguna entidad comercial tuviera control sobre sus operaciones, y por lo tanto, el conjunto de datos no es comercial y está destinado a la investigación científica. Por tanto, las acciones de LAION están cubiertas por la sección 60d de la Ley de Derechos de Autor alemana y, en consecuencia, no existe infracción de derechos de autor, lo que permite desestimar el caso.

Se trata de un caso que podría terminar siendo histórico y muy significativo, la primera prueba jurídica de las excepciones que permiten el entrenamiento de algoritmos con contenidos disponibles en la red. Sin embargo, el impacto jurídico en sí mismo podría ser limitado porque solamente habla del uso de minería de texto y datos para la creación de un conjunto de datos, sin entrar específicamente en el entrenamiento real de un modelo, de modo que otros tribunales de otros países o incluso alemanes podrían llegar a distintas conclusiones. Pero por el momento, todo parece indicar que LAION y otras compañías en casuísticas similares pueden estar razonablemente tranquilas: todo indica que están operando en el lado correcto de las excepciones a un concepto como el copyright, que además, debería ser objeto de una revisión y una restricción muy necesarias.

Veremos si más tribunales siguen poniéndose del lado correcto, del que afirma que por muchos derechos de autor que se esgriman, lo razonable es que una creación a la que puede accederse libremente pueda ser utilizada para el entrenamiento de modelos, ya que ese uso no tiene absolutamente nada que ver ni con el consumo de esos materiales sujetos a derechos de autor, ni con su distribución. Ya está bien de abusos irracionales de un copyright que jamás debió llegar a los extremos y a los niveles a los que ha llegado.

7 comentarios

  • #001
    menestro - 29 septiembre 2024 - 15:39

    Sin entrar en las valoraciones personales, como llamar «pedigüeño» al autor de una obra original, como Billie Eilish, por ejemplo, cosas muy personales, ya digo, vamos a aclarar la sentencia.

    LAION ha funcionado como un agregador de enlaces, es decir, no almacena el contenido original ni lo procesa digitalmente. Y por eso no ha sido sancionado.

    El infractor contra el que Robert Kneschke, el fotógrafo, debía dirigir su reclamación de copyright, es el propietario del algoritmo entrenado, Stability AI.

    Por otro lado, la ley alemana es peculiar, porque permite la recopilación de datos de forma temporal, si no existe un beneficio económico o no se demuestra. Sería el caso de los crawlers de los buscadores que indexan datos pero no los tratan o modifican.

    Por ese agujero legal, al estar mal orientada la demanda, es por donde ha perdido la reclamación, ya que LAION, no es un algoritmo generativo.

    Ni sienta un precedente, ni nada de nada, como ya se está viendo en el resto de los tribunales de EE.UU.

    .
    Getty Images v. Stability AI

    Big win for artists’ AI copyright lawsuit in the US

    Artists Land a Win in Class Action Lawsuit Against A.I. Companies

    Abstenerse trolles.

    Responder
  • #002
    Asier - 29 septiembre 2024 - 16:08

    La cuestión es tan sencilla como: si yo puedo ver una obra y crear mis propias obras (influenciado, inevitablemente, por la misma), ¿por qué un algoritmo no?

    Responder
    • BUZZWORD - 29 septiembre 2024 - 18:18

      Por la legislación como humano: Tu compras un ejemplar de una novela, una entrada o una licencia de un video, que te permite hacer ciertas como leer, visionar, reproducir en modo «humano» ese medio. Pero nadie te ha transferido derechos de grabación, copia, reproducción pública, etc

      Cuando entiendas lo anterior, suma que nadie te ha dado permisos de almacenar, procesar, trocear y reprocesar esa obra.

      El algoritmo en si no se le ha prohibido nada, porque un algoritmo, no es un sujeto sometido al derecho. Es una herramienta que usa un humano para procesar esa información. A quien se le ha prohibido es a los humanos para procesar obras que si tienen derechos.

      Si tu haces una foto, o escribes un blog, o pintas una casa con un árbol, puedes decir que esa obra esta libre de derechos y que cualquiera puede copiártela, triturarla en la picadora digital, etc etc.

      Asi que Asier, formula bien las preguntas, que en su formulación, se denotan las carencias argumentativas. Igual es la edad, que te hace que se te atragante esto de la IA.

      Responder
  • #004
    Ángel "el bueno" - 29 septiembre 2024 - 16:19

    Me ha encantao !!! Creo que voy a cambiar mi bio en Twitter y voy a poner «entrenador de algoritmos de primera división».

    Alguien hizo exactamente lo que dices en ese artículo hace ya unos meses utilizando un vídeo real para convertirlo en un dibujo animado. Puedes ver aquí:

    https://x.com/axarquiasedella/status/1803231808852463754?t=AV1XLGNwAnsli2Na7_ZD3g&s=19

    Y a reclamar al maestro armero.

    Responder
  • #005
    Gorki - 29 septiembre 2024 - 16:23

    A un panal de rica miel
    dos mil Moscas acudieron,
    que por golosas murieron
    presas de patas en él.

    (Samaniego)

    Versión SXXI

    A un empresario con arte
    dos mil autores acudieron
    que ávidos sucumbieron
    clamando por su parte

    (Maocho)

    Responder
  • #006
    Xaquín - 29 septiembre 2024 - 16:44

    Por fin un tipo de minería que no mancha las manos… como mucho las mentes (inquietas).

    Lo de que usen tus fotos y textos solo es medio argumento, ya que se supone que el artista vive de ello (tú no).

    Pero es igual. No hay forma de asumir que lo que se ha convertido en un conjunto de bits no puede ser enjaulado de nuevo. Cualquier nuevo bit que se le agregue ya hace diferente. No le pertenece a nadie… es como el cartel colgado en la pared… una foto de él ya no es el mismo cartel… cuándo asumiremos lo que significa el contenido virtual, a diferencia del analógico???

    Es como si en una charla el conferenciante quisiera cobrara por ele uso de las palabras que ha liberado y que se han diluido en el aire de la sala… podrá cobrar entrada, pero luego la apalabra liberada ya no es suya… por algo se le llama «liberada». Y lo mismo pasa con la novela que un tipo escribe… tendrá que cobrar por su trabajo, como todo el mundo (y justamente!!!), pero no pedir regalías cada vez que alguien usa una parte de esa novela (no copio y pego, claro), para hacer otra novela. Estaría bueno Homero si eso le hiciera tilín tamaño «derecho». O Velázquez cabreado con Picasso por hacer variaciones de sus Meninas…

    Y lo de que cobren los herederos, eso ya ni lo comento. Sobre todo teniendo en cuenta que estoy en contra de las herencias EXCESIVAS… porque los señores condes no heredaban lo sudado, sino lo robado!!!

    Responder
  • #007
    BUZZWORD - 29 septiembre 2024 - 19:10

    Una idea de futuro (me he inspirado en el comentario de Angel)

    Imaginad que tuvieramos un sistema que tomara como entrada la información en tiempo real del Atleti-Madrid, cogiera las posiciones de los jugadores, arbitro, su postura corporal, la del balón, etc y que mediante IA generara una simulación con dibujos animados(*), donde el espectador pudiera cambiar la vista de cámara, poner un modo primer plano desde un punto de vista subjetivo de cualquier jugador, etc… con un retraso mínimo, p.ej 30 seg. respecto al juego real

    ¿Tendría que pagar derechos ese procesamiento digital a la liga?

    Estariamos en un caso similar a la transformación digital de una obra ¿Sería pirateo?

    (*): Si eres moderno, lee avatar

    Responder

Dejar un Comentario

Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

 

XHTML: Puedes utilizar estas etiquetas: A ABBR ACRONYM B BLOCKQUOTE CITE CODE DEL EM I Q STRIKE STRONG IMG