Bienvenidos a la token economy

IMAGE: LLM tokenization (Source unknown)

A medida que el avance del desarrollo de los modelos masivos de lenguaje, Large Language Models o simplemente LLMs va teniendo lugar, empezamos a entender algunas de las variables que influyen en los liderazgos que veremos consolidarse en todas las industrias.

Cada vez más, vamos pasando del enfoque inicial, en el que se valoraba fundamentalmente el acceso a cantidades masivas de datos bien seleccionados para el entrenamiento (con repositorios abiertos como LAION en el mundo gráfico o Common Crawl en el del texto jugando un papel inicial muy importante, seguidos de una barahúnda de acuerdos con todo tipo de proveedores de contenidos), a una nueva visión en la que lo importante no es simplemente la cantidad de datos, sino las formas de convertirlos en material aprovechable, para lo que necesitamos un proceso adicional: la tokenización.

Un proceso que, en función de los criterios que tomemos, será más o menos eficiente, y que por el momento, se encuentra fuertemente influenciado por el hecho de que los grandes repositorios inicialmente utilizados para el entrenamiento de modelos contenían información mayoritariamente en inglés (46% en el caso de Common Crawl, por ejemplo). A partir de ahí, es fácil entender lo que ocurre: cualquiera que quiera enviar un prompt a un LLM entrenado mayoritariamente en inglés, se encontrará con que si ese prompt está redactado en un idioma distinto del inglés, será procesado, pero dado que debe ser traducido, consume más tokens que si estuvieran en inglés.

Bienvenidos a la token economy. En el futuro inmediato, mucho de lo que hagamos en todas las compañías, en todas las industrias, dependerá de cómo de eficientes somos enviando prompts a un LLM, que para usos distintos a los de un simple individuo preguntando cosas, se cobrarán en los correspondientes tokens. Un mundo de RAGs, de prompts enriquecidos (o, desde ese punto de vista, «complicados») con elementos tomados de bases de datos vectoriales que reflejan contextos específicos, puestos al servicio de la verticalización. En esa economía, con el token como moneda de cambio, el más eficiente gana.

En su último ranking de modelos masivos de lenguaje abiertos, la franco-americana Hugging Face refleja claramente como los LLM chinos han tomado por asalto la clasificación, encabezada por Qwen, la familia de algoritmos creada por Alibaba. Y si bien la clasificación puede considerarse una imagen incompleta al no evaluar modelos cerrados por una cuestión de asegurar la reproducibilidad de los resultados, lo que implica que algunos de los LLM más populares como ChatGPT, Claude, Gemini, etc. no aparecen, no deja de ser una medida de a dónde se puede llegar cuando la vía elegida para hacer las cosas es la del código abierto.

¿A dónde vamos? Lógicamente, a la búsqueda de modelos cada vez mejores, entrenados mejor y con mejores datos, pero también a la de la eficiencia en su uso. De ahí que el trabajo de China con su pléyade de modelos de código abierto sea potencialmente muy importante, pero también el de Samsung con el idioma coreano, el de Mistral con el francés y otros idiomas, o incluso la incipiente iniciativa del gobierno español para crear y entrenar modelos entrenados en español y otras lenguas cooficiales. Si puedes utilizar un LLM con una calidad adecuada y un consumo de tokens más bajos, seguramente lo vas a hacer, y podrás además obtener ventajas de ello.

Estamos entrando en la token economy. Compañías dedicadas a la provisión de soluciones verticales basadas en RAGs y en prompting masivo a LLMs ajenos se arruinan por haber calculado mal la cantidad de tokens que necesitaban para mantener su actividad, mientras los modelos rivalizan por ser cada vez más atractivos y más útiles, y se sigue desarrollando la idea de grandes modelos abiertos con mejoras cada vez más tangibles en su nivel. Quien mejor entienda la token economy, mejor partido sabrá sacar de ella. Si no has entendido ni una palabra de este artículo, es una señal de que debes preocuparte. Y lo que se juega en esto, potencialmente, es mucho. ¿O lo es todo?

7 comentarios

  • #001
    Juan T. - 6 julio 2024 - 12:44

    Off Topic:

    Ahora supon que te tomaste tres años sabáticos en una isla desierta , sin contacto con nadie , y acabas de llegar y lees este texto de Enrique, y empiezas a ver conceptos como Large Language Models (LLMs), LAION, Common Crawl, Tokenización, Token economy, Prompt, RAGs (Retrieval-Augmented Generation), Bases de datos vectoriales, verticalización, Qwen , Hugging Face,, ChatGPT, Claude, Gemini, Mistral, etc.

    ¿No te da la sensación de haber llegado a otro planeta?

    Responder
    • Enrique Dans - 6 julio 2024 - 12:49

      Te puedo asegurar que no hace falta haber estado en ninguna isla desierta. Muchos están exactamente igual y no se han movido de su oficina…

      Responder
      • Javier - 6 julio 2024 - 17:44

        …deja tú, hay gente de mi edad 50 (+/-10 arriba y abajo) en trabajos de cuello blanco (hablo de gente integrada al mercado laboral, no de náufragos) que hoy en día no tienen ni puta idea de qué existe algo llamado Chat GPT o Gemini. No hablemos ya de Qwen, Huggin Face, LLM’s, Tokens o NLP

        Responder
  • #004
    Gorki - 6 julio 2024 - 13:26

    No es mi día, no me he enterado de nada. A ver si lo aclaran los comentarios.

    Responder
  • #005
    Xaquín - 6 julio 2024 - 13:33

    «lo importante no es simplemente la cantidad de datos, sino las formas de convertirlos en material aprovechable» (EDans).

    No necesito isla alguna, por ahora, me basta mi cuarto de jubilata «conectado».

    Y tengo muy claro que mi ROM/MOR trata de funcionar bajo ese esquema que indicas. No le queda otra si quiere ayudarme a ser operativo en mi defensa cotidiana.

    Como también estoy seguro que muchos seres humanos no han asumido la importancia de una buena ROM/MOR bien organizada y se conforman con cualquier ejemplar de bazar chino, aunque sea de todo a 100 tokens (o superior).

    Y por eso no dan entendido que la inteligencia es algo más que acumular datos, sea de listín telefónico o de métodos para hacerse una paja… y también, por eso, la llamada IA aún está en pañales, en relación con una IH medianamente organizada.

    Y puede que así, cuando uso el apelativo mediocre se pueda entender mejor a que aspectos de mediocridad intelectiva me estoy refiriendo. Tuve alumnado que (decían) era superdotado, pero, a la hora de mostrarme lo que tenía en su ROM/MOR, le costaba un montón establecer una comunicación medianamente potable. De nada me valía lo que «en teoría» sabían.

    Porque el exceso de inteligencia (posible), como el de electricidad no vale para nada, si no tiene un uso aprovechable. Y nunca eres tú solo, quién decide lo que es o no aprovechable.

    Responder
    • Gorki - 6 julio 2024 - 14:14

      No solo me no me ha aclarado nada sino, sino que me ha sumido más en las tinieblas.

      Responder
  • #007
    menestro - 6 julio 2024 - 14:13

    Vale, ahora, vamos a verlo desde el punto de vista de un profesional en activo o un doctor en ingeniería (cualquiera) para traducirlo a legos. Alguien que trabaja en esto a un alto nivel.

    Este popurrí consiste en mezclar la pseudoeconomía de las criptomonedas – Tokenización, Blockchain – con el uso medido de ChatBots como chatGPT, el nuevo metaverso económico.

    La nueva economía de los Prompts.

    Es el mismo modelo que se recreó en los NFT pero aplicado al pago por uso de los chatbots mediante tokens – fichas de casino – y la supuesta Web3 que ya sabemos como va. (No va)

    Es una jerigonza que no se utiliza en la tecnología real, sino propia de los criptobros. El mismo sistema de pago con Tokens por el uso de repositorios para ChatBots que se intento crear en el Metaverso.

    Son casi 20 años ya, de Blockchain y Tokens.

    ¿La tecnología de Internet va por otra dirección? Sí, claro. pero es totalmente diferente a la vulgarización de las criptomonedas, los chatbots y los Orbes.

    Hay críos de 16-20 años, sin estudios, que se quedan enganchados a esta jerga pseudo-económica porque les hace parecer listos y futuros hombres de negocios, y es más fácil replicar un discurso de Youtube que leer un libro de economía.

    .

    Crypto assets market and volatility – Survey 2023

    (descenso del uso de criptomonedas en Canada)

    La guía cripto para despistados – The New York Times

    El 95% de los Token NFT ya no valen nada

    Responder

Dejar un Comentario

Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

 

XHTML: Puedes utilizar estas etiquetas: A ABBR ACRONYM B BLOCKQUOTE CITE CODE DEL EM I Q STRIKE STRONG IMG