Poniendo a prueba a ChatGPT: consultores centauros o cyborgs

Un working paper de Harvard, «Navigating the jagged technological frontier: field experimental evidence of the effects of AI on knowledge worker productivity and quality« (pdf) pone a prueba la productividad y calidad obtenida por consultores en el desempeño de sus tareas usando ChatGPT frente a los que no lo utilizaron, y obtiene un resultado claro y contundente: en dieciocho tareas diferentes seleccionadas para ser muestras realistas de los tipos de trabajo realizados en una empresa de consultoría de élite, los consultores que utilizaron ChatGPT superaron a aquellos que no lo hicieron, por un amplio y significativo margen, en todas las dimensiones y midiendo el rendimiento en todos los sentidos.

La conclusión es tan inequívoca, que está provocando que el estudio, a pesar de no estar todavía revisado para su publicación, esté siendo enormemente comentado: la metodología empleada es sumamente sólida, la muestra es muy amplia y bien planteada, y el experimento, en general, tiene el rigor adecuado. Lógicamente, hablamos de una base muestral, en cierto sentido, privilegiada: 758 consultores de Boston Consulting Group, que obviamente cuentan con la formación y la capacidad para hacer un muy buen uso de una herramienta como ChatGPT, y que además, son capaces de plantear la optimización del uso de la herramienta.

Los resultados son claros: los consultores con acceso a ChatGPT-4 completaron un 12,2% más de tareas en promedio, y lo hicieron un 25,1% más rápido, con resultados de calidad significativamente más alta (más de un 40% más de calidad en comparación con el grupo de control). Estos resultados se aplicaron a todos los consultores: los que estaban por debajo del umbral de desempeño promedio aumentaron un 43%, mientras que los que estaban por encima aumentaron un 17 % en comparación con sus propios puntajes. En la gráfica, puede verse la distribución de la calidad del output entre todas las tareas: el grupo azul no usó ChatGPT, mientras que los grupos verde y rojo sí lo usaron, y el grupo rojo recibió además capacitación adicional sobre cómo utilizarlo.

Una apreciación muy interesante del estudio está en la filosofía de uso de la herramienta, y contrapone a los llamados «centauros», en los que la frontera entre tareas es clara y toman la decisión de seguir haciendo muchas de ellas a la manera tradicional mientras introducen al algoritmo generativo en otras, con los que denomina «cyborgs», en los que esa frontera desaparece y, por tanto, integran el uso del algoritmo en la totalidad de sus tareas, con un nivel de integración mucho más íntimo e inseparable. Dado que la frontera entre las tareas que son adecuadas para su procesamiento mediante el algoritmo generativo y las que no es sumamente difusa, de ahí lo de «jagged technological frontier», el criterio que utiliza el consultor para entender en qué momentos puede tomar las ideas o el resultado del algoritmo de manera directa frente a cuándo debe modificarlo, volverlo a procesar, dudar del mismo o tomárselo «con un grano de sal» es fundamental, y es susceptible de diferenciar a los consultores que obtienen los mejores rendimientos. Como siempre, no es la herramienta, sino la habilidad que se tiene al utilizarla.

A la espera de su publicación en alguna revista científica, me ha parecido un estudio muy bien diseñado y desarrollado, y sobre todo, con una gran contundencia en sus conclusiones: independientemente de sus obvias limitaciones, la algoritmia generativa puede ser utilizada para obtener mejor productividad en una gama muy amplia de tareas – desde las más creativas, como la generación de ideas, hasta otras más mecánicas o más aplicadas, como la redacción de informes – y obtiene sus mejores resultados cuando es, además, utilizada por personas con las capacidades adecuadas.

Coincide, además, con mi idea de lo que debe ser la integración de este tipo de herramientas en la formación superior: completa, siempre disponible y sin límites, de manera que los alumnos aprendan a integrarla en sus flujos de trabajo de manera natural, y no simplemente como un punto al que acudo para determinadas tareas. Sin duda, muy interesante y merecedor de una buena dosis de reflexión para los que nos dedicamos a esto.

This article is also available in English on my Medium page, «When it comes to using ChatGPT, are you a centaur or a cyborg?»

#001
c3po - 23 octubre 2023 - 14:43
Te cuento una experiencia de esta semana:
Problema: Tener una tool para obtener de manera automática, el texto de un audio
1) Publicas la entrevista de Altman en un enlace
2) Tenía un vídeo con buen sonido
3) Lo paso a mp3
4) Lo subo a una web con demo de paso de audio a texto
5) Quitando el tiempo de darme de alta. En menos de 10min. Tengo un texto en español
6) Se lo paso a GPT para mejorar traducción : unos pocos minutos más
Pasar un audio a texto, y traducirlo, me hubiera llevado su hora a la antigua… o directamente no se haría, pero como test, creo que fue un buen tiempo invertido. Y que está en línea con el estudio.
Este tipo de cosas son lo que hace que la IA sean útiles. No en dejarles tomar decisiones o dejarles «pensar», o que hagan cosas que debemos hacer las personas… que simplificando es: «mandarles hacer trabajos rutinarios»,. Para una traducción buena de un documento ya tendrá que haber una empresa o un traductor en la empresa que me asegure y sea su responsabilidad validar que es correcto. Pero para un uso informal o privado, son la bomba !
#002
menestro - 23 octubre 2023 - 14:51
Si no eres capaz de superar a chatGPT con las cifras de desempeño y fiabilidad de MT-Bench, MMLU o Arthur en la mano, eres un consultor muy malo y deberías dedicarte a otra cosa.
Usar chatGPT para paliar la mediocridad o la falta de competencia, es como pretender que un procesador de textos te hace mejor escritor.
–
Yo no me dejaría operar por un neurocirujano que usase Alexa en el quirófano.
- Joseph - 24 octubre 2023 - 03:12
  El artículo no habla de eso, habla de profesionales con igual experiencia y habilidades, pero unos usando IA y los otros no. Los que usaron IA trabajaron más rápido y mejor que los que no la usaron.
  No se habla de paliar mediocridad, sino de ser aún más productivo con la IA.
  - menestro - 24 octubre 2023 - 11:29
    Leéte el estudio. O pide a chatGPT que te lo resuma si no lo entiendes.
    –
#005
Benji - 23 octubre 2023 - 15:28
Coincido. En mi empresa se me ha sugerido amablemente que tengamos cuidado con ChatGPT, pero no lo han prohibido directamente.
Lo que debo tener en cuenta a nivel personal:
a. Hay que tener cuidado con los datos confidenciales
b. Hay que revisar los resultados, no te puedes fiar del resultado nunca
c. 20€/mes es barato si lo usas. Es como Amazon Prime
A veces le planteo el problema de código que tengo y que lo desarrolle en metalenguaje o en otro sistema que conozca (C, PHP, VB, JS…). Luego solo me toca traducirlo al lenguaje que estoy usando.
¿Podría hacerlo «cualquiera»? Pues no, porque debo revisar el código y asegurarme que lo que he planteado está bien y que el resultado es el esperado.
Lo curioso es que me está convirtiendo en mejor programador, ya que debo ser capaz de expresarle correcta y concretamente lo que necesito para obtener el resultado deseado. Y luego el ver como realiza ciertas tareas o como plantea una solución enriquece mi punto de vista. Si acierta, aprenda. Si falla, lo detecto. En ambos casos mejoro yo.
—
El ejercicio del primer comentario me parece genial. Otro uso/abuso de la herramienta bien hecho ;-)
- Luis - 23 octubre 2023 - 17:05
  Gracias Benji por tus comentarios del día a día y, en especial, sobre este tema. Se nota que eres ingeniero y generalmente expresas tus opiniones de forma clara y concisa. Me gusta ¡gracias!
  - Benji - 23 octubre 2023 - 21:25
    Con mucho gusto :-)
    Estamos aquí todos en la «casa» de Enrique disfrutando la tertulia propuesta
#008
Gorki - 23 octubre 2023 - 16:10
Negarte a utilizar la IA porque «no la necesitas», es parecido a negarte, siendo mecánico, a utilizar el martillo, porque «yo con una piedra tengo suficiente»
- Michel Henric-Coll - 24 octubre 2023 - 17:10
  Un mecánico con un martillo me parece igual de peligroso que con una piedra.
  Vaaaale, te entiendo ;-)
#010
Juan T. - 23 octubre 2023 - 18:39
Open AI ya tiene oficialmente la AGI como meta mas importante y dice que toda su actividad estará enfocada en esa meta, parece ser que perfeccionando agentes autónomos multimodales.
Por otra parte parece que no se confirma que la IA sea una burbuja dada la enorme inversión que sigue llegando y que no decrece; 17.900 millones de dolares el ultimo trimestre, y una estimada de 200.000 millones de dolares en el 2025.
Así que el que no se haya enterado ya se enterará.
#011
Xaquín - 24 octubre 2023 - 11:49
Lo de siempre dicho. Tu relación con un interlocutor dependerá, siempre, más de ti que de él, salvo que sea un tirano ya establecido.
Pero, para ser un tirano, alguien tuvo que dejarle tomar el poder.
#012
Nicole Dyver - 24 octubre 2023 - 21:15
Francesc Pujol, profesor de la UNAV, se ha pronunciado abiertamente a favor de su uso en la Universidad. Es el camino. No se puede ir contra el futuro. Siempre llega.