La interesante evolución del panorama en inteligencia artificial

IMAGE: OpenAI's DALL·E, via ChatGPT

Mi columna de esta semana en Invertia se titula «De modelos a agentes» (pdf), y trata de explicar de una manera razonablemente accesible la transición que está teniendo lugar en el panorama de la inteligencia artificial, un campo que aún resulta muy novedoso para mucha gente pero que refleja transformaciones cada vez más importantes y decisivas para su futuro.

El primer estadío de evolución tras la aparición del mítico paper que dio origen a los transformers y a la IA generativa fue el del desarrollo de modelos masivos de lenguaje. Una era que, a efectos populares, que no de investigación, se inicia con el lanzamiento por OpenAI de Dall·E, primero, y de ChatGPT después, hace ahora casi exactamente dos años, que se convirtió en un acontecimiento a todos los niveles y en el fenómeno de adopción tecnológica más rápido de la historia.

El lanzamiento de esos modelos generó, además de muchísima expectación, mucha competencia. Otras compañías, algunas de toda la vida, otras no tanto, se lanzaron al mercado; Microsoft, gracias a su privilegiada relación con OpenAI derivada de su uso de Azure, con Copilot, o Google, primero con Bard y después con Gemini. Pero también nuevos entrantes, como Anthropic con Claude, o Perplexity, Meta con Llama, y toda una suerte de ecosistema que bordea el código abierto con compañías como Mistral y un buen número de competidores chinos, entre otros. Expresar una interfaz de un modelo como un chatbot es vistoso, razonablemente sencillo y ofrece muchas ventajas de cara a su fácil adopción, lo que hace que prácticamente todos la adopten.

Todas esas compañías contaban con las llamadas scaling laws, o leyes de escalado, que describen cómo cambia el rendimiento de una red neuronal a medida que se amplían o reducen factores clave que incluyen la cantidad de parámetros, el tamaño del conjunto de datos de entrenamiento, el coste del entrenamiento o la tasa de errores post-entrenamiento. El desarrollo de modelos menos conocidos por el gran público como Chinchilla y su posterior evolución responden al razonamiento de que esas scaling laws van a hacer que la inteligencia de los modelos progrese constantemente a medida que incrementamos sus parámetros, con todo lo que ello conlleva: una lucha de fuera bruta entre compañías en función de cuántos recursos de computación pueden permitirse, bien por su acceso a la nube, bien por las cantidades ingentes de datos necesarias, a los que algunos acceden mediante acuerdos y otros directamente se llevan puestos sin preguntar.

¿Donde está el problema? Cuando esas compañías empiezan a ser conscientes de que las scaling laws no aplican eternamente. De repente, trasciende que GPT5 es solo marginalmente mejor que GPT4, y que, de alguna manera, se está alcanzando un techo o plateau. Y frente a algunos apocalípticos de esos que hay en todas partes empiezan con la cantinela de «hasta aquí hemos llegado», «era todo una burbuja» y «no se puede pasar de aquí», empezamos a encontrarnos con otras compañías que empiezan a explorar otra frontera diferente: la de los agentes.

¿Qué es un agente? Simplemente, una entidad capaz de percibir su entorno y de tomar acciones de manera autónoma para alcanzar unos objetivos definidos, que además puede mejorar su desempeño con el aprendizaje o la adquisición progresiva de conocimientos. Esta idea de los agentes, que precisa de entornos capaces de generar feedback para esa adquisición progresiva de conocimientos, empieza a surgir como reacción, y lleva a Marc Benioff, de Salesforce, a decir que «el futuro de la IA está en los agentes, no en los chatbots«.

¿Qué ocurre ahora? Que cada vez más, el futuro no apunta a modelos monolíticos y enormes, sino a poblaciones de agentes capaces de coevolucionar en función de las circunstancias que los rodean. Anthropic, de hecho, tras proponer un agente autónomo capaz de utilizar los programas de tu ordenador por ti, lanza propone una nueva manera de conectar datos con los agentes, que permite que los modelos (cualquier modelo, no solo los de Anthropic) extraigan datos de fuentes como herramientas comerciales y software para completar tareas, así como de repositorios de contenido y entornos de desarrollo de aplicaciones. Una nueva arquitectura y fisonomía que va a dar lugar a nuevos planteamientos, que aún estamos empezando a explorar.

De modelos. a agentes. Así, cuando muchos todavía no han empezado siquiera a entender lo que conlleva cada uno. Si crees que esto va muy rápido, es porque, efectivamente, va muy rápido. Pero eso no quiere decir que te puedas permitir el lujo de esperar a que se consolide nada, porque muchos veces ni lo hará. El mundo es de los que analizan y toman decisiones rápidamente.

Por el momento, quedémonos con la tendencia y su aplicación, porque la vamos a ver en cada vez más sitios. Las implicaciones evidentes son claras: sistemas capaces de ganar inteligencia de manera más rápida y adaptativa. ¿Las consecuencias? Ya las veremos.

5 comentarios

  • #001
    Xaquín - 27 noviembre 2024 - 15:21

    No quiero ser agorero, pero toquemos el problema (ya pasado) de la introducción tecnológica en las aulas, para hablar de sus agentes.

    De como fracasó todo el mecanismo de soporte informativo hacia la mente del alumnado, por fallo clamoroso de los AGENTES encargados de esa proyección.

    Y realmente ya empezó mucho antes de que cualquier pensador logre centrarse en su origen : con las putas láminas explicativas. Realmente fue una consecuencia del copieteo vil, literal o oral, del llamado libro de texto.

    Un simple cártel inanimado, al princicpio hasta poco colorido y de un grafismo muy cutre. Pero el profesorado no fue capaz de introducir, de integrar, ese modo de proyección informativo en las aulas. Fue algo anecdótico, aunque muy enriquecedor para los que se empeñaron en interactuar con ese mecanismo laminar… aparte de ser mirados como bichos raros («no nos pagaban para eso»).

    Y podíamos seguir, con las diapositivas, los retroproyectores, los ordenadores… y el consecuente método de las presentaciones informáticas. Ya dejamos de lado el aula virtual, como una especie de maléfica gattaca, para cuatro pirados más o menos frikis…que lo hacían por gusto (no por necesidad profesional).

    Y así llegamos a la actualidad educativa : discusiones eternas en redes sociales sobre las ventajas del memorismo atroz y lo mal comprendido que fue por los «modernos» de la educación. Esos jamados con sus locos cacharros.

    Muy triste, sí, muy triste.

    Así que decidme a mí sobre los agentes digitales (IAs y demás semidioses informáticos), que nos van sacar de este atolladero tan lleno de mediocridad sapiens, que apesta. Se mire por dónde se mire. Suponiendo que seamos capaces de ver lo que miramos.

    Responder
  • #002
    Gorki - 27 noviembre 2024 - 15:36

    He de reconocer que los acontecimientos en la AI se suceden a tal velocidad que me siento arrollado e incapaz de seguir las novedades que aparecen,. Poco a poco, voy siguiendo con lentitud la vertiginosa producion de videos de DotCSV, (https://www.youtube.com/@DotCSVLab/videos), cada uno, con un nueva propuesta basada en AI mas asombrosa que las anteriores, y dia a dia, veo que mi conocimiento de la AI es mas rupestre, no porque yo no avance, sino porque el horizonte se aleja a mayor velocidad de la que yo avanzo.

    Creo haber controlado los «prompts» para generar texto pero aun estoy muy lejos de dominar la generación de imágenes, no hablo ya de hacer videos clonar voces y cosas por el estilo de las que solo se que existen y que algunos privilegiados dominan y son capaces dc hacer con ello «brujerías»

    Estoy mas que impresionado con un aparato llamado «Alter ego» que me parece que aun está en fase de laboratorio, que conecta directamente la tu mente cdon la «nube» y te permite tener «conversaciones» en tu cerebro, contigo mismo, pero donde tu interlocutor «alter ego», cerebro te contesta consultado un AI.

    Ese si, y no la gafas 3D, es un aparto que si mi economía alcanza, me compraré, aunque claro está, si Google se entra hasta de lo que pienso, mi privacidad se va de forma absoluta a la basura.

    Responder
  • #003
    Chipiron - 27 noviembre 2024 - 16:11

    Se me ocurre un Siri «supervitaminizado» para substituir al actual y poder controlar domóticamente toda la casa, además de dar el tiempo, noticias más importantes, etc, etc.

    Es que el Siri actual da pena…

    Responder
    • Guillermo - 27 noviembre 2024 - 16:51

      Y Alexa?
      Dan pena, ayudan a divinizar a la IA de chatgepeto , etc

      Responder
  • #005
    Lua - 27 noviembre 2024 - 18:18

    Efectivamente… los avances de la IA son realmente sorprendentes… y nos llevan a la frontera de lo imaginable…

    Que se lo pregunten si no, Dra. Cuernos…

    (para echarse unas risas) XDDD

    Responder

Dejar un Comentario

Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

 

XHTML: Puedes utilizar estas etiquetas: A ABBR ACRONYM B BLOCKQUOTE CITE CODE DEL EM I Q STRIKE STRONG IMG