La huella de LAION y la trascendencia de una victoria judicial

LAION, la compañía alemana sin ánimo de lucro dedicada a la recopilación de imágenes para el desarrollo de sus propios algoritmos de inteligencia artificial y de otros que quieran utilizar su banco de datos libremente, ha obtenido una victoria judicial contra un fotógrafo aleman que pretendía que borrasen una serie de fotos de su autoría de la base de datos.

Esta victoria es la primera que un repositorio dedicado al entrenamiento de algoritmos obtiene contra una reclamación de copyright, y es potencialmente por ello muy importante de cara al futuro. Tras la publicación de herramientas que permiten saber si alguna imagen tuya o algún texto han sido utilizados para el entrenamiento de algoritmos, los juzgados se han llenado de pedigüeños que pretenden obtener compensaciones económicas por ello, algo que refleja únicamente su codicia y, desde mi punto de vista, una extensión injustificada, injustificable e ilógica de los derechos de autor.

Pretender que una imagen o una información, por el hecho de tener copyright, no puede ser utilizada para el entrenamiento de un algoritmo es como pretender que no podamos verla, recordarla o utilizarla para construir otras obras sobre ella, y debería ser considerado un absurdo conceptual. Como en su momento comentó Mustafa Suleyman, CEO de Microsoft AI, lo que está en la web en abierto, debe poder ser utilizado para el entrenamiento de algoritmos, y si no quieres que lo sea, no lo pongas en internet o especifica claramente, de manera que pueda ser leída e interpretada por una máquina, que no deseas que ese material sea utilizado para ese uso en concreto. Lo siento, pero eso de «no mires mi obra, que está libremente accesible en la red, porque podrías almacenarla en tu cerebro y utilizarla posteriormente sin pagarme» es completamente disfuncional.

Pocas cosas me parecen más pacatas, cutres e injustificables que protestar y pretender compensaciones porque un contenido creado por alguien ha sido utilizado para el entrenamiento de un modelo. Si quieres cobrar cuando alguien vea, lea, consuma o distribuya una obra tuya, vale, hazlo. ¿Pero cobrar cuando un algoritmo la utiliza para entrenarse? ¿Qué será lo siguiente? ¿Cobrar porque alguien piense en ella? He creado en mi vida miles de imágenes y textos, y las he publicado siempre con una licencia que permite su uso por parte de terceros. Me consta que muchas de esas imágenes y textos han sido, de hecho, recopiladas y utilizadas para muchos usos, y es más, me enorgullece. ¿Tiene algún sentido que me ofenda porque esos contenidos sean utilizados para entrenar a unos algoritmos que, eventualmente, serán la base de la inteligencia del futuro y de una eventual generación de riqueza? En modo alguno puede resultarme ofensivo que un algoritmo piense como yo lo he expresado en mis artículos o componga fotografías como yo lo he hecho. Cuanto más las utilicen, mejor para mí.

De hecho, en la primera contestación de LAION a la petición del fotógrafo, la compañía afirmó simplemente que no había nada que pudiera borrar, porque no posee imágenes, sino únicamente enlaces a las mismas. Ante eso, el fotógrafo argumentó que la compañía había hecho copias de las fotografías para extraer información de ellas, y que eso, según él, constituía una violación del copyright. Sin embargo, el argumento presentado por los demandados fue que cumplían escrupulosamente con la excepción de recopilación de datos para la minería de textos y datos existente en la legislación alemana, y que como tal, y por el hecho de ser una organización de investigación, se les permite llevar a cabo una reproducción de una obra con el fin de extraer información.

El tribunal apreció que si bien la gigantesca base de datos de LAION ha sido utilizada por organizaciones comerciales, el conjunto de datos en sí se había puesto a disposición del público de forma gratuita, y no se había presentado ninguna prueba de que ninguna entidad comercial tuviera control sobre sus operaciones, y por lo tanto, el conjunto de datos no es comercial y está destinado a la investigación científica. Por tanto, las acciones de LAION están cubiertas por la sección 60d de la Ley de Derechos de Autor alemana y, en consecuencia, no existe infracción de derechos de autor, lo que permite desestimar el caso.

Se trata de un caso que podría terminar siendo histórico y muy significativo, la primera prueba jurídica de las excepciones que permiten el entrenamiento de algoritmos con contenidos disponibles en la red. Sin embargo, el impacto jurídico en sí mismo podría ser limitado porque solamente habla del uso de minería de texto y datos para la creación de un conjunto de datos, sin entrar específicamente en el entrenamiento real de un modelo, de modo que otros tribunales de otros países o incluso alemanes podrían llegar a distintas conclusiones. Pero por el momento, todo parece indicar que LAION y otras compañías en casuísticas similares pueden estar razonablemente tranquilas: todo indica que están operando en el lado correcto de las excepciones a un concepto como el copyright, que además, debería ser objeto de una revisión y una restricción muy necesarias.

Veremos si más tribunales siguen poniéndose del lado correcto, del que afirma que por muchos derechos de autor que se esgriman, lo razonable es que una creación a la que puede accederse libremente pueda ser utilizada para el entrenamiento de modelos, ya que ese uso no tiene absolutamente nada que ver ni con el consumo de esos materiales sujetos a derechos de autor, ni con su distribución. Ya está bien de abusos irracionales de un copyright que jamás debió llegar a los extremos y a los niveles a los que ha llegado.

This article is also available in English on my Medium page, «LAION case could leave a lasting imprint«

#001
menestro - 29 septiembre 2024 - 15:39
Sin entrar en las valoraciones personales, como llamar «pedigüeño» al autor de una obra original, como Billie Eilish, por ejemplo, cosas muy personales, ya digo, vamos a aclarar la sentencia.
LAION ha funcionado como un agregador de enlaces, es decir, no almacena el contenido original ni lo procesa digitalmente. Y por eso no ha sido sancionado.
El infractor contra el que Robert Kneschke, el fotógrafo, debía dirigir su reclamación de copyright, es el propietario del algoritmo entrenado, Stability AI.
Por otro lado, la ley alemana es peculiar, porque permite la recopilación de datos de forma temporal, si no existe un beneficio económico o no se demuestra. Sería el caso de los crawlers de los buscadores que indexan datos pero no los tratan o modifican.
Por ese agujero legal, al estar mal orientada la demanda, es por donde ha perdido la reclamación, ya que LAION, no es un algoritmo generativo.
Ni sienta un precedente, ni nada de nada, como ya se está viendo en el resto de los tribunales de EE.UU.
.
Getty Images v. Stability AI
Big win for artists’ AI copyright lawsuit in the US
Artists Land a Win in Class Action Lawsuit Against A.I. Companies
–
Abstenerse trolles.
- Chipiron - 29 septiembre 2024 - 20:04
  Por que dices «abastenerse trolles»?
  Mucho troll por el foro ultimamente?
  - menestro - 29 septiembre 2024 - 22:25
    «El sealioner o troleador finge ignorancia y cortesía, de modo que si provoca que el objetivo responda con enfado, el troleador o «león marino» puede actuar como la parte agraviada.7 .8″
    Se disfraza como un intento sincero de aprender y comunicar. El sealioning funciona así tanto para agotar la paciencia, la atención y el esfuerzo comunicativo del objetivo, como para presentarlo como poco razonable. Aunque las preguntas del «león marino» puedan parecer inocentes, su intención es maliciosa y tiene consecuencias perjudiciales»
    Sealioning
    Son personas de una edad cerca de los 60-70, jubilados anticipadamente, a quienes no les aguantan en ningún sitio, ni hijos, ni su propia familia. Con antecedentes de acoso laboral, ordenes de alejamiento de sus parejas, etc.
    ¿No habrás visto tú alguno en «el Foro»?
    –
    - Chipiron - 30 septiembre 2024 - 13:11
      Supongo que te quieres referir a mi. Pero lo siento, no me considero un troll. Ni estoy entre los 60-70, ni estoy prejubilado, ni considero que sea una persona a la que no aguanta nadie, ni estoy divorciado, etc, etc..
      Era una pregunta por curiosidad porque hacia tiempo que no me pasaba por el foro, pero visto lo visto, tardaré en volverme a pasar.
      Un saludo!
#005
Asier - 29 septiembre 2024 - 16:08
La cuestión es tan sencilla como: si yo puedo ver una obra y crear mis propias obras (influenciado, inevitablemente, por la misma), ¿por qué un algoritmo no?
- BUZZWORD - 29 septiembre 2024 - 18:18
  Por la legislación como humano: Tu compras un ejemplar de una novela, una entrada o una licencia de un video, que te permite hacer ciertas como leer, visionar, reproducir en modo «humano» ese medio. Pero nadie te ha transferido derechos de grabación, copia, reproducción pública, etc
  Cuando entiendas lo anterior, suma que nadie te ha dado permisos de almacenar, procesar, trocear y reprocesar esa obra.
  El algoritmo en si no se le ha prohibido nada, porque un algoritmo, no es un sujeto sometido al derecho. Es una herramienta que usa un humano para procesar esa información. A quien se le ha prohibido es a los humanos para procesar obras que si tienen derechos.
  Si tu haces una foto, o escribes un blog, o pintas una casa con un árbol, puedes decir que esa obra esta libre de derechos y que cualquiera puede copiártela, triturarla en la picadora digital, etc etc.
  Asi que Asier, formula bien las preguntas, que en su formulación, se denotan las carencias argumentativas. Igual es la edad, que te hace que se te atragante esto de la IA.
  - Dedo-en-la-llaga - 29 septiembre 2024 - 19:56
    No, no va a a ser así la cosa: la pregunta es que la IA, ojo, se inspira, ¿vale? , se inspira. Y luego escupe lo inspirado que se basa en muchas obras que pueden tener (o no, no importa), derechos de autor. Y entonces la pregunta es: ¿si la «inspiración» humana no paga derechos, la debería pagar una I.A.? Esa es la cosa peliaguda.
  - Chipiron - 29 septiembre 2024 - 20:07
    Eh! Sin faltar a Asier. Yo opino igual que él y la mayoría del foro.
    Relajate, es domingo.
    - BUZZWORD - 29 septiembre 2024 - 21:51
      Con la pasta que se gastó el ingeniero de caminos, y sigues igual que siempre trolleando.
      ¿Cuento la última que te ha pasado en Tarragona?
      - Chipiron - 30 septiembre 2024 - 12:23
        Yo no trolleo. El faltón eres tu, que además ni sabes que significa trollear.
        Explica lo que quieras, no tengo nada que esconder.
        
        Chipiron - 30 septiembre 2024 - 14:15
        Insisto: Explica, explica. Que así yo tambien me entero ;-)
  - Asier - 29 septiembre 2024 - 20:32
    Pero nadie te ha transferido derechos de grabación, copia, reproducción pública, etc
    Te equivocas, si no no existiría el canon por copia privada (otro abuso de las leyes del copyright).
    De todas formas el fondo del asunto no es tanto si es legal entrenar un algoritmo (aquí y ahora, porque en un futuro las leyes pueden cambiar y en cada país ser diferentes) con contenido que tiene derechos de autor, sino si siquiera tiene sentido restringirlo si no es para perpetuar usos ya demasiado abusivos del copyright vigente.
    - BUZZWORD - 29 septiembre 2024 - 21:43
      Asier
      Copia privada? Ley Sinde?
      Cierto es que todo puede variar…
      pero hay cosas que nunca cambian,…
      Pasa buen domingo, el comentario de la edad tu sabes por donde iba ;-)
      - Asier - 29 septiembre 2024 - 22:12
        Sinceramente, ni idea de a qué te refieres con lo de la edad (apostaría a que estoy por debajo de la media del blog), si es por aceptación de la IA, siempre me ha interesado, la utilizo casi a diario y ya hice algún comentario acerca de que si programas y no lo estás utilizando estás perdiendo el tiempo.
        
        BUZZWORD - 29 septiembre 2024 - 23:55
        Pues eres muy joven para tener esas lagunas… seguro que en alguna encuentras la respuesta, bro
        
        Chipiron - 30 septiembre 2024 - 12:23
        Te estás luciendo..
  - Javier - 29 septiembre 2024 - 20:34
    Y en la formulación de tus respuestas ¿qué se denota?
    - BUZZWORD - 29 septiembre 2024 - 21:53
      Queno soy como tú, bro!
      - Chipiron - 30 septiembre 2024 - 12:24
        Menos mal que no eres como Javier, un tipo normal y respetuoso, no un indeseable como tu.
#020
Ángel "el bueno" - 29 septiembre 2024 - 16:19
Me ha encantao !!! Creo que voy a cambiar mi bio en Twitter y voy a poner «entrenador de algoritmos de primera división».
Alguien hizo exactamente lo que dices en ese artículo hace ya unos meses utilizando un vídeo real para convertirlo en un dibujo animado. Puedes ver aquí:
https://x.com/axarquiasedella/status/1803231808852463754?t=AV1XLGNwAnsli2Na7_ZD3g&s=19
Y a reclamar al maestro armero.
#021
Gorki - 29 septiembre 2024 - 16:23
A un panal de rica miel
dos mil Moscas acudieron,
que por golosas murieron
presas de patas en él.
(Samaniego)
Versión SXXI
A un empresario con arte
dos mil autores acudieron
que ávidos sucumbieron
clamando por su parte
(Maocho)
#022
Xaquín - 29 septiembre 2024 - 16:44
Por fin un tipo de minería que no mancha las manos… como mucho las mentes (inquietas).
Lo de que usen tus fotos y textos solo es medio argumento, ya que se supone que el artista vive de ello (tú no).
Pero es igual. No hay forma de asumir que lo que se ha convertido en un conjunto de bits no puede ser enjaulado de nuevo. Cualquier nuevo bit que se le agregue ya hace diferente. No le pertenece a nadie… es como el cartel colgado en la pared… una foto de él ya no es el mismo cartel… cuándo asumiremos lo que significa el contenido virtual, a diferencia del analógico???
Es como si en una charla el conferenciante quisiera cobrara por ele uso de las palabras que ha liberado y que se han diluido en el aire de la sala… podrá cobrar entrada, pero luego la apalabra liberada ya no es suya… por algo se le llama «liberada». Y lo mismo pasa con la novela que un tipo escribe… tendrá que cobrar por su trabajo, como todo el mundo (y justamente!!!), pero no pedir regalías cada vez que alguien usa una parte de esa novela (no copio y pego, claro), para hacer otra novela. Estaría bueno Homero si eso le hiciera tilín tamaño «derecho». O Velázquez cabreado con Picasso por hacer variaciones de sus Meninas…
Y lo de que cobren los herederos, eso ya ni lo comento. Sobre todo teniendo en cuenta que estoy en contra de las herencias EXCESIVAS… porque los señores condes no heredaban lo sudado, sino lo robado!!!
#023
BUZZWORD - 29 septiembre 2024 - 19:10
Una idea de futuro (me he inspirado en el comentario de Angel)
Imaginad que tuvieramos un sistema que tomara como entrada la información en tiempo real del Atleti-Madrid, cogiera las posiciones de los jugadores, arbitro, su postura corporal, la del balón, etc y que mediante IA generara una simulación con dibujos animados(*), donde el espectador pudiera cambiar la vista de cámara, poner un modo primer plano desde un punto de vista subjetivo de cualquier jugador, etc… con un retraso mínimo, p.ej 30 seg. respecto al juego real
¿Tendría que pagar derechos ese procesamiento digital a la liga?
Estariamos en un caso similar a la transformación digital de una obra ¿Sería pirateo?
(*): Si eres moderno, lee avatar
- Ignacio - 30 septiembre 2024 - 08:35
  Lo que describes no tiene nada que ver, eso es piratear, siempre habrá cierto nivel de pirateo y puedes ver partidos pirata con enlaces de Telegram, ya existe no hay que imaginar nada.
  Si alguien cogiese partidos antiguos de los equipos de la liga y crease una nueva liga de fútbol con jugadores inspirados en el pasado, pero una liga con partidos nuevos creados por IA, sería sencillamente legítimo.
  El tema es más sencillo, la “propiedad” intelectual es un invento para que las creaciones artísticas y técnicas se compartan. Las ideas pueden y deber ser usadas simultáneamente por artistas, intelectuales o máquinas, para crear nuevas obras, ideas o avances técnicos.
  Los derechos de explotación que adquieres cuando compartes una obra nunca deberían poder limitar la creación de obras nuevas.
#025
Chipiron - 29 septiembre 2024 - 20:12
Estoy con lo que se ha dicho más arriba: concordamos con Enrique en su razonamiento. Pero los motivos de la sentencia incluyen cosas diferentes, como que no se use con fines lucrativos si no de investigación.
La pregunta es la misma. Si yo miro mil cuadros, y pinto el mío inspirado en los que he visto, depende de si lo venda o no para que me juzguen de una manera u otra?
Para mi todo pintor que ha cobrado por sus obras se ha influenciado en pintores anteriores y legalmente ha podido vender sus obras..
Lo mismo con la música, donde existen una métricas super bien definidas para saber si una canción es un plagio directo de otra. Pero si simplemente «son del mismo estilo», no hay ley que proteja la original frente a la nueva composición, aunque se gane dinero con ella.
Resumiendo, en Alemania se ha dado la razón a LAION, pero cogido con pinzas. Debería ser una sentencia mucho más valiente y reafirmante.
- Enrique Dans - 29 septiembre 2024 - 20:25
  Veo que el día que hablamos de «Blurred lines», de Robin Thicke, y de los herederos de Marvin Gaye que ganaron un juicio por copyright porque la canción, según ellos, «evoca» las de Marvin Gaye, faltaste a clase ;-)
  - Chipiron - 30 septiembre 2024 - 12:26
    Pues sí, lo reconozco. Ya me leeré en enlace con cariño y atención.
    Pero no crees que le han dado la razón a LAION con pinzas cuando no debería haber «peros», es decir, que si LAION se hubiese lucrado hubiese tenido que ser igual de defendible?
    Un saludo!
#028
Matt - 29 septiembre 2024 - 20:23
Pobrecicas multinacionales multimillonarias chantajeadas por fotografos o ilustradores a los que dejaran sin empleo utilizando sus fotos o ilustraciones para entrenar los algoritmos con los que se forraran.
- Gorki - 29 septiembre 2024 - 21:12
  El ser afectado por un cambio tecnológico no te da derecho a reclamar al introductor del cambio.
  Los maleteros de la estación no tienen derecho a sablear a los que inventaron las maletas con ruedas, ni los kioskeros a los periódicos que hacen diarios digitales.
  Por supuesto los ilustradores desplazados por la AI, no tiene derecho a reclamar a esta, por el hecho de que les contraten menos.
#030
Gorki - 29 septiembre 2024 - 21:00
Por qué un pintor puede pintar el “skyline” de Madrid, sin pagar derechos de autor a sus arquitectos, pero se pide que el propietario de una AI page derechos de autor al pintor, por enseñar a su AI con la imagen de su cuadro.
- BUZZWORD - 29 septiembre 2024 - 22:08
  Yo creo que fotocopiar, copiar digitalmente un libro en PDF, copiar con p2p un video, hacerse con fotos de obras protegidas con copyright para copia privada sin animo de lucro, no debería considerarse delito. Incluso el procesamiento, entrenamiento digital para IA tampoco PERO siempre y cuando que se pongan sin precio esos modelos en el dominio público.
  En el momento que intentes monetizar ese modelo…. es decir ponerlo en comercial, ya es algo que roza el «que te han mangado» tu obra…
  - Gorki - 29 septiembre 2024 - 23:45
    ¿De modo que si un pintor pinta la “skyline” de Madrid, y trata de vender el cuadro debería pagar a los arquitectos que hicieron las torres? .- Extraña creencia.
    Si hubieran cobrado derechos por cada imagen comercial que se han hecho sobre el edificio Capitol de la Gran Vía, que hasta fue protagonista en la película, «El día de la Bestia», los hijos de Luis Martínez-Feduchi, arquitecto del edificio, habrían vivido lujosamente.
    Pero, misterios de los Derechos de Autor, la obra de un arquitecto se puede utilizar sin pagar derechos al creador. Igual pasa con un diseñador de muebles, Nadie paga derechos de autor a quien utiliza los muebles para poner una terraza en la calle aunque cobre las cañas..
  - Chipiron - 30 septiembre 2024 - 12:37
    Dejando nuestras diferencias personales (que no sabia que existian hasta este foro, aunque veo que no es solo conmigo) te diré que copiar un libro digitalmente YO OPINO (supongo que podré hacerlo, no?) que SI debería ser delito.
    Igual que ir al cine a ver una peli. Otra cosa es que gente generosa como Enrique permita que sus textos se copien o reproduzcan donde uno quiera, pues da la licencia que toca.
    Pero si yo me rompo los cuernos escribiendo un libro docente y luego nadie lo compra porque se lo baja gratis, es un perjuico para mi, mi trabajo y mi voluntad.
    Pero claro, ya veo que para ti todo vale, incluso no dejar en paz a los difuntos…
  - Ignacio - 30 septiembre 2024 - 13:28
    Siento que confundes «piratear» con crear una obra nueva inspirada en una obra previa.
    Hacer publicas las obras para que sean conocidas es el sentido de los de derechos de autor.
    Impedir que una idea, una obra o una patente se use de base para otras obras no tiene sentido, es totalmente irracional, porque el sentido último de la «propiedad» intelectual es que las obras artísticas o técnicas se compartan y no se guarden bajo llave.
    Y por supuesto, debería ser legal (y creo que lo es) inspirarte en una idea o una obra previa para crear otra y venderla.
    - Chipiron - 30 septiembre 2024 - 13:58
      Totalmente de acuerdo.
#036
Ignacio - 30 septiembre 2024 - 06:51
La propiedad privada es una institución que nace del problema económico básico, la escasez y la imposibilidad del uso simultáneo de un bien.
Las propiedad privada sobre un modelo tecnológico o una obra es un invento relativamente reciente, si cuando Santo Tomás tomó las ideas del sufí Abenarabi de Murcia le hubiesen dicho que estaba cometiendo un plagio no habría entendido de que le estabas hablando, las ideas, con dificultad fluían sin más limite que el propio de su transmisión y al igual que hoy en día podían ser usadas simultáneamente por varias personas.
¿Para qué se inventaron los derechos de autor o las patentes?
Para fomentar que las ideas se compartan, “no te guardes tu creación, compártela y te reservaremos los derechos de explotación durante un tiempo limitado”.
Pensemos en los pitagóricos y sus intentos de mantener el conocimiento dentro de los límites de su grupo humano, siembre ha habido quien quería que el conocimiento quedase limitado a un grupo humano concreto por diversos motivos.
https://www.bbc.com/mundo/noticias-46730074.amp
O la posibilidad de explotar una ventaja técnica sin que la competencia la conozca.
No existen los “derechos de propiedad intelectual” las ideas no se poseen, existe un derecho limitado que tiene como finalidad el desarrollo del conocimiento y su difusión.
NO TIENE SENTIDO LIMITAR LA CREACIÓN DE NUEVAS OBRAS ARTÍSTICAS O TÉCNICAS ALEGANDO DERECHOS DE AUTOR, cuando los derechos de autor se crearon para fomentar que las ideas se compartan y se creen nuevas obras artísticas o técnicas.