SearchGPT: se veía venir

OpenAI anuncia el lanzamiento, por el momento en beta cerrada para muy pocos usuarios y con una lista de espera, de SearchGPT, un prototipo de motor de búsqueda diseñado para generar respuestas completas mediante inteligencia artificial generativa.

Un movimiento claramente anunciado desde que, tras el lanzamiento en abierto de su asistente generativo en formato conversacional, ChatGPT, se empezó a ver un progresivo desplazamiento de usuarios hacia un uso como motor de búsqueda, concretamente para uno de los tres grandes tipos de búsqueda, las llamadas «búsquedas informacionales», las que se llevan a cabo para aprender sobre algo, investigar o responder a una pregunta específica.

Los otros dos tipos de búsquedas, las navigacionales (llévame a una página concreta) y las transaccionales (quiero comprar algo, hacer una reserva, etc.) quedan, al menos por el momento, fuera del ámbito del proyecto, aunque lo razonable sería pensar que las primeras terminarán integradas en algún tipo de asistente de inteligencia artificial en el propio navegador que se encargue de seleccionar la página a la que, con una elevada probabilidad, el usuario quiere llegar; y los segundos se convertirán en asistentes que proponen al usuario una página concreta en la que llevar a cabo la transacción, seguramente a cambio de una comisión por tráfico inducido o por referral.

El movimiento de OpenAI es claramente un desafío al gigante de las búsquedas, Google, que lleva ya cierto tiempo intentando integrar respuestas generativas en sus páginas de resultados con unos resultados como mínimo inciertos. Cuando surgen add-ons para navegadores y artículos dedicados a cómo eliminar las llamadas AI Overviews de las páginas de resultados de Google, es que, claramente, algo no va demasiado bien.

Para Google, que cunda la idea de que las búsquedas informacionales son resueltas de forma más concluyente en un motor creado por un competidor como OpenAI sería, obviamente, gravísimo, porque buena parte de los ingresos de la compañía provienen de los clics que muchos usuarios hacen no en los resultados llamados «naturales» del algoritmo, sino en los anuncios relacionados que suelen situarse en la parte superior. Si muchos usuarios optasen por otros motores de búsqueda para sus preguntas más específicas o «sesudas», eso podría significar un problema para los ingresos de una compañía que, de hecho, tiene un problema similar a la hora de implementar esas mismas herramientas ella misma: los resultados generados por inteligencia artificial, esos AI Overviews, son más caros, de calidad más dudosa (con posibilidades de dar lugar a las mal llamadas «alucinaciones») y, además, más completos, con lo que no inspiran a buscar enlaces adicionales en forma de publicidad.

Para Google, en cualquier caso, la elección parece estar entre lo malo y lo muy malo: lo malo es que tus «AI Overviews» hagan descender tus ingresos, y lo muy malo es que en lugar de canibalizarte tú mismo, sea un tercero – en este caso OpenAI, pero podrían ser Perplexity u otros) el que venga a devorar una parte de tus resultados.

También está la cuestión de cómo pretende financiar OpenAI su proyecto: un motor de búsqueda es susceptible de generar mucho tráfico y, por tanto, muchos costes, que habría que o bien ofrecer en modo suscripción premium (como de hecho ya hace la compañía), o bien financiar con un modelo alternativo. Si ese modelo alternativo es la publicidad, OpenAI tendría que montar toda una infraestructura de ejecutivos, fuerza de ventas, etc. que no solo no ha tenido nunca, sino que tampoco tiene experiencia en gestionar, además de, posiblemente, comprometer la objetividad de sus resultados. Por el momento, además, SearchGPT ofrece el mismo característico interfaz de la Google de sus inicios: una pantalla blanca, con una caja de búsqueda debajo de un título. Nada más. Incluso más sobria aún: todo está en una discreta gama de grises.

Leyendo entre líneas en su anuncio, sobre todo en la parte en la que se refieren a acuerdos con publicaciones y creadores de contenidos, se me ocurre que sería posible llegar a un modelo de financiación en forma de tráfico generado, es decir, que potenciales socios como The Atlantic o News Corp., los dos que cita en su nota, paguen a OpenAI por el tráfico que SearchGPT genera hacia sus publicaciones, en las que ya se encargan ellos de monetizarlo convenientemente. Acuerdos de ese tipo serían relativamente novedosos porque permitirían, por un lado, que OpenAI utilizase los contenidos de esas publicaciones para entrenar sus algoritmos, mientras ofrecen a esas publicaciones un flujo de tráfico que pueden monetizar, pero por el momento, estamos simplemente disparando hipótesis sin demasiado fundamento.

¿Pretende OpenAI convertirse en un jugador relevante en el escenario de la búsqueda, o simplemente tener algo que ofrecer a los socios que la abastecen de material para el entrenamiento de sus algoritmos? Por el momento, parece difícil saberlo. Pero lo que no cabe duda, es que los usuarios pronto van a tener al menos una opción más, y Google va a tener algo más de lo que preocuparse…

This article is also available in English on my Medium page, «SearchGPT: we saw this one coming…«

#001
Gorki - 26 julio 2024 - 17:02
¡¡¡¡ Al fin un competidor de Google !!!!
- Ángel "el bueno" - 27 julio 2024 - 12:48
  Recuerdas la escena aquella de Predator….???
  Me refiero a la escena en la que el Predator levanta cogido de la mandíbula a Arnold Schwarzenegger y le mira fijamente y le deja vivir.
  ¿, Por qué crees que lo hace…?
  Básicamente porque analiza al individuo que tiene delante le considera a un oponente digno para pelear, por ello no acaba con él.
#003
Marcos - 26 julio 2024 - 17:19
Se veía venir… como el tema de hoy :). En cuanto lo he visto en otro sitio he pensado en Enrique y su artículo del día.
Se pone interesante la cosa.
#004
Buzzword - 26 julio 2024 - 17:37
Chatgpt ya tiene un remedo de búsqueda
«OpenAI ha anunciado este miércoles una nueva colaboración con Le Monde y Prisa Media, que incluye publicaciones como EL PAÍS, Cinco Días, AS o El Huffpost. La alianza permitirá a los usuarios de ChatGPT interactuar en torno a la actualidad con los contenidos de alta calidad de Prisa Media en español» ( marzo, en teoría ya accedes a esa Database, pero información bastante pobre, haced la prueba: «Cual eran las noticias de portada de ELPAIS 1 de julio de 2024 Edición España»)
Si le preguntas a Chatgpt sobre noticias que van a ocurrir, suceder ya responde en su versión gratuita:
PREGUNTA:
que conciertos de música hay en agosto en Madrid
RESPUESTA:
En agosto de 2024, Madrid ofrecerá una variada agenda de conciertos para todos los gustos. Algunos de los más destacados incluyen:
Mad Cool Festival (del 8 al 10 de agosto): Este festival internacional contará con una amplia gama de artistas de diferentes géneros musicales (Turismo Madrid).
The Omnific (2 de agosto): La banda australiana de rock progresivo tocará en la sala Wurlitzer (Conciertos Madrid).
Niña Polaca (11, 12 y 13 de agosto): La banda de pop-rock española se presentará en La Riviera (Conciertos Madrid).
Travis Scott (30 y 31 de julio): Aunque un poco antes de agosto, el famoso rapero ofrecerá dos conciertos en el WiZink Center (Ticketmaster Blog).
Además de estos eventos, la ciudad de Madrid sigue vibrante con su oferta musical durante todo el verano, asegurando entretenimiento y cultura para residentes y visitantes (Conciertos.Club).
CONCLUSION
Si se compara con la información que resulta en una búsqueda en duckduckgo o google, el resultado de OpenAI es bastante pobre, se conforma con las lineas que he reproducido arriba
No solo hay que cacarear, también hay que poner huevos decentes
- Rodrigo - 27 julio 2024 - 06:50
  E invertir mucho dinero. Cuanto dinero necesita OPEN AI
#006
Pedro Toledo - 26 julio 2024 - 18:04
– Quién mató al Comendador?
– Fuenteovejuna Señor.
O lo que es lo mismo, parece que en el futuro de Google pintan bastos.
Sin embargo, está claro que el juego de las sillas y la música, no ha hecho más que comenzar y todavía no sabemos si será Google quien se quedará sin asiento o serán varios a la vez, ni siquiera que música está sonando
#007
Gorki - 26 julio 2024 - 18:23
Era tan previsible este paso, que no puedo pensar que en Google no hayan pensado algún tipo de respuesta, Lo que si puede ocurrir es que no tuvieran mucha prisa por sacar la respuesta, pues con el sistema antiguo ganaban mas.
Yo me alegro que llegue competencia, porque el monopolio de búsquedas de Google daba como consecuencia, que poco a poco las respuestas estaban mas en función de lo que ellos podían ganar, que en función de lo que yo quería encontrar.
#008
Lua - 26 julio 2024 - 19:50
Seleccion de comentarios… XDDD
1 – Ojo con la confianza depositada en esos algoritmos, en la IA en general. Aunque partan de información humana nadie los controla, además que se han dado casos de errores. Podría sugerir «pegamento» como uno de los ingredientes por el que tú seguramente no caerás, ¿pero quién dice que no lo hará otro?
Ya me daban cierto recelo los resultados de esos buscadores (en desacuerdo con muchos «primer-posicionamientos»), ahora con esto ya no sé qué pensar ni de dónde habrá sacado la información.
2 – eso ya me ha pasado. Pedi una receta de gazpacho y me puso entre los ingredientes una cebolla. Sacrilegio! Eso solo hacen los madrileños
3 – Había un tuit de Kike García (confundador del Mundo Today) que decía.
Buscas una receta en Google: Te sale una página sobre la historia de la receta, lo que le gusta comerla a los hijos del cocinero, reflexiones sobre la cocina de antes, enlaces patrocinado y al final, medio escondida entre unos cuantos anuncios, la receta.
La pides a ChatGPT: Te da la receta.
———
Ahora nos ponemos mas serios…
4 – Yo tengo una idea: Una receta de cocina. La pongo a disposición de la gente. Esto me ha costado un esfuerzo y un trabajo. Intento compensarlo mediante anuncios.
Tu llegas a mi web, lees la receta, aprendes algo nuevo y yo me llevo un dinerito por los anuncios, lo que me permitirá poner más recetas.
win-win.
Ahora bien:
Yo tengo una idea. Un «bot» la lee una vez y la mete en su base de datos. Tu le preguntas, aprendes algo nuevo, pero aquel que generó dicha idea no se lleva nada.
nowin-win
5 – Además que lo del robo de datos de OpenAI es pan para hoy y hambre para mañana. Si cada vez más gente deja de compartir cosas en Internet porque no hay incentivo alguno para quien se ha tomado el esfuerzo (no ya dinero, sino simple acreditación), pues al final te cargas la gracia, y la actualización del entrenamiento con datos reales,
Internet se plagará cada vez más desproporcionadamente de datos sintéticos que los LLMs no podrán soportar demasiado tiempo antes de colapsar.

(c) a sus respectivos autores en la pagina de Meneame
ps.- No me queda mas remedio que copiarlos aqui, que no son muy dados a visitar enlaces… :P
#009
Xaquín - 26 julio 2024 - 20:11
Resulta muy curioso que, tanto y tanto hablar de IA y de Research y sigamos aún sin haber descubierto la forma de hacer que, esa palabreja anglosajona, responda realmente al significado profundo del concepto búsqueda… Si analizamos la situación actual de las Oxford, sea británica o USA… y tenemos en cuenta que el»éxit» de una universidad USA fue el invento de Facebook (se aburrían sin cotilleo), pienso que seguimos mareando mucho la perdiz y no salimos de ser aquella buena gente que descubrió como hacer fuego e incluso inventó una rueda, para mejorar el transporte por tierra… y más cosas después claro… como ser incapaces de superar la etapa de la Ilustración, que unos «míseros» pensadores «creyeron» que podía valer para algo.. sin percatarse de que no había variado mucho el paradigma de un gran Sócrates, que nunca tuvo a bien preguntarse la razón de que existiera la esclavitud.
En fin, cosas de la jubilación…
- Lua - 26 julio 2024 - 21:34
  Cuando yo era joven… XDDD
  “Cuando yo era joven, íbamos a las webs y las leíamos”, explica un anciano de 42 años a un adolescente incrédulo
  - Alqvimista - 27 julio 2024 - 11:00
    Jajajaja, ¡qué razón tienen! Echo de menos los foros…
#012
Javier Lux - 27 julio 2024 - 08:02
Cada vez uso más ChatGPT para la búsqueda de un dato concreto.
Por ejemplo ayer mismo quería saber cuando Piaggio patentó su sistema de horquilla delantera en sus scooter de 3 ruedas: MP3. Me interesa porque quizás compre una copia china que saldrán inmediatamente después de que venza la patente.
Preguntárselo a ChatGPT y la respuesta sale en un click, 2006. Por lo tanto mi scooter de 3 ruedas chino llegará probablemente en 2026 o 27
#013
Lua - 27 julio 2024 - 08:25
«El colapso del modelo es un proceso degenerativo que afecta a generaciones de modelos generativos aprendidos, en el que los datos que generan terminan contaminando el conjunto de entrenamiento de la próxima generación. Al recibir formación sobre datos contaminados, perciben erróneamente la realidad.»
Los modelos de IA colapsan cuando se entrenan con datos generados recursivamente:
AI models collapse when trained on recursively generated data
#014
f3r - 27 julio 2024 - 11:21
«cómo pretende financiar OpenAI su proyecto»
Pues como todo en tecnología: quemando pasta de inversores. Si quemas suficiente pasta, te aseguras de destruir(comprar) cualquier competidor que te salga, en un terreno donde todavía nadie sabe si va a haber retorno económico (bien podría ocurrir que el gasto energético de los LLM nunca llegue a ser menor que el beneficio, por cuestiones técnicas poco obvias en esta etapa).
Si al final (5 o 10 años después) hay retorno, estarás sentado en la silla del rey, el resto de enemigos habiendo sido aplastados (y escuchando el lamento de sus mujeres, como decía Conan).
Si no hay retorno, también, ya que te habrás forrado gracias a esos inversores, y habrás abandonado el barco a mitad, dejando un reguero de pérdidas.
Business as usual. Todo consiste en conseguir convencer a un número suficiente de personas de que inviertan en «tu» idea.
#015
Arcadi - 27 julio 2024 - 14:42
Yo pienso que ChatGPT se va a convertir en una suite de servicios. Entre ellos estará el buscador, SearchGPT, pero también habrá generación de imágenes, vídeos, audio, un asistente personal, conexión con la casa inteligente, generación de código, hojas de cálculo, y todo a lo que se pueda conectar. Todo esto reforzado por una interfaz de audio/video, que, si es como prometen con la 4o, será como interactuar con una persona. Va a ser de pago, no será barato y estaremos encantados de pagar por ello.
Por otro lado, en cuanto al entrenamiento, estoy convencido de que va a firmar muchos más acuerdos con generadores de contenido de calidad. Necesitan fuentes confiables e información verídica. Si se descubre una nueva especie en el Amazonas, tienen que contar con fuentes confiables para añadir esa información. Así que creo que firmarán todos los acuerdos posibles.
Las páginas pequeñas que se dedican a ofrecer información y venden el tráfico que les generan los buscadores lo tienen complicado…