Go y machine learning: un hito muy importante

GoPara un occidental, entender la importancia que el hito que ha tenido lugar hoy en el mundo del machine learning puede no ser demasiado obvio o sencillo. El juego del Go, aunque tiene más de cuarenta millones de practicantes en el mundo, goza de su mayor popularidad en Oriente, particularmente en países como China, en el que se considera una de las cuatro artes de la erudición, o Japón, donde antiguamente las partidas profesionales duraban varios días (hoy en día el máximo son 16 horas repartidas durante dos días). 

El Go es un juego de estrategia e intuición que se juega en una cuadrícula de líneas negras, típicamente de 19 × 19, en cuyas intersecciones se colocan las fichas, llamadas «piedras». Aprender las reglas del juego es relativamente sencillo, pero jugar a un buen nivel de competición requiere miles de horas de estudio, fundamentalmente porque la cantidad de combinaciones que pueden generarse es mayor que el número calculado de átomos en el universo. 

Para los estudiosos de la inteligencia artificial y el machine learning, la complejidad del Go ha constituido un reto durante varias décadas. Con el avance de las diferentes técnicas, las máquinas han ido siendo capaces de vencer a los humanos primero al tres en raya, después a las damas, y finalmente, en la histórica partida de Deep Blue contra Gary Kasparov, al ajedrez. Después llegó Watson y logró ganar a los mejores jugadores de Jeopardy, o Google consiguiendo algoritmos capaces de aprender a jugar docenas de juegos de consolas Atari, pero el Go se mantenía inalcanzable: la mejor inteligencia artificial llegaba tan solo a un nivel de jugador humano principiante.

El problema estaba, fundamentalmente, en la metodología. Los métodos basados en árboles de posibilidades chocan con la enorme cantidad de combinaciones existentes en Go, y entrenar la inteligencia de una máquina mediante el análisis de treinta millones de jugadas de Go de los mejores jugadores del mundo, el principio del llamado deep learning, lograba, como mucho, una máquina capaz de imitar a esos jugadores, capaz de predecir sus jugadas en un 57% de las ocasiones, pero no capaz de mejorar su rendimiento en una partida. Para ser capaz de vencerlos, se planteó otra metodología: el uso del reinforcement learning, consistente en entrenar a la máquina jugando contra sí misma, lo que le permite generar toda una nueva colección de movimientos que después son realimentados en el entrenamiento. Si no lo has leído bien, vuélvelo a leer: el sistema aprende no a partir de datos generados por humanos, sino a partir de datos y de hipótesis generadas por sí mismo, creando jugadas que no han existido previamente y tratando de resolverlas jugando contra versiones levemente diferentes de sí mismo. Algo que, lógicamente, requiere de una enorme potencia de computación, y que ha implicado un uso intensivo de la Google Cloud Platform: Google ha utilizado para ganar la misma técnica para GO que inventó Facebook hace poco, pero ellos han conseguido escalarla, y han ganado. Las técnicas utilizadas son relativamente simples, facilmente replicables, y el cálculo utilizado no es tan grande, se basa en GPUs, que son baratas, lo que contrasta con el éxito del DeepBlue de IBM en Jeopardy, con algoritmos muchísimo más complejos. 

El momento histórico ha llegado cuando ese algoritmo, creado por Google y llamado AlphaGo, ha sido capaz de vencer a uno de considerados mejores jugadores del mundo de Go, el chino Fan Hui, no en una simple partida sino cuatro veces seguidas, hecho que fue publicado precisamente ayer. Un hito histórico para la inteligencia artificial documentado directamente por un editor de Nature, y que abre además posibilidades interesantísimas para el uso de la inteligencia artificial en campos como el análisis científico. En el siguiente desafío, se enfrentará al surcoreano Lee Sedol, la persona con mayor número de victorias en torneos de todo el mundo. Para la inteligencia artificial, un verdadero hito histórico, todo un momento de la verdad, que la mayor parte de los analistas situaban como posible dentro de una década. Ha sido la metodología, la idea de aplicar deep learning con reinforcement learning, unida a la potencia computacional disponible, la que ha obtenido estos resultados. No lo veáis como una frivolidad científica, como una curiosidad o como un detalle: hablamos de un auténtico desafío, de algo que abre posibilidades capaces de cambiar muchas cosas. Un verdadero hito.

Como dirían en Memorias de África,

«a Marvin Minsky le gustará saberlo. Tengo que acordarme de decírselo».

Fue precisamente Minsky quien se cargó, en la década de los ’70, la investigación incipiente en redes neuronales demostrando que solo podían resolver problemas lineales. Tardamos diez años en darnos cuenta de que había que seguir investigándolas… y ahora son ellas las que han resuelto Go

Lo que nos queda de década va a ser precisamente esto: demostraciones sucesivas de cómo una máquina con la potencia computacional adecuada y sometida a un proceso de entrenamiento bien diseñado es capaz de mejorar la eficiencia de un hombre a la hora de desarrollar tareas cada vez más complejas, más difusas más desafiantes, más… humanas. Si en un tema he tenido la impresión, cuando me lo han explicado adecuadamente, de estar viendo algo que iba a cambiar el futuro de la humanidad en su conjunto, ha sido con machine learning. Si piensas que como directivo no te va a afectar, vete repensándolo.

 

This article is also available in English in my Medium page, “Go and machine leaning: a day to remember«

 

8 comentarios

  • #001
    menestro - 28 enero 2016 - 09:01

    Como aficionado al Go (otra afición infantil) he de corroborar que hasta ahora era bastante asequible batir a un ordenador en este juego (y otros)

    Lo cierto es que el AlphaGo lo que hace es aprender un juego situacional, es decir, las soluciones óptimas a los escenarios más comunes. No desarrolla estrategias propias.

    Es parecido a la mejora que vimos con el algoritmo Giraffe que, sin ser revolucionario, suponía superar el handicap posicional mediante redes neuronales – habrá que aclarar para legos, que el nombre es metafórico, no literal – para formar una perspectiva general del juego.

    https://www.youtube.com/watch?v=SUbqykXVx0A

    http://www.technologyreview.com/news/546066/googles-ai-masters-the-game-of-go-a-decade-earlier-than-expected/

    http://observer.com/2016/01/your-life-is-tetris-stop-playing-it-like-chess/

    Los directivos de nuestro país están más familiarizados con la ‘versión nacional’ de ese ancestral juego africano conocido como Wari Mancala.

    http://i.imgur.com/RwYFIi5.jpg

    http://mancala.wikia.com/wiki/Awari_Oracle

    (Por cierto, jugad al Go con coreanos, pero nunca al billar)

  • #002
    Gorki - 28 enero 2016 - 09:18

    Puede que consideres que es un gran avance, pero a mi me asombra cuanto han tardado en conseguirlo y el inmensa capacidad del ordenador que se precisa para ello.. En mi opinión, la IA va atrasada quinquenios en comparación con la capacidad de computo, Lo que han conseguido hoy, es como si nos asombráramos de que un ordenador sea capaz de calcular el arco seno de un ángulo, o ser capaz de resolver sistemas de ecuaciones.

    Desde hace ya bastante tiempo que los ordenadores han resuelto problemas de cálculo que la mente humana no ha sido capaz de resolver. como la conjetura de los cuatro colores y no lo han hecho en todos los casos aplicando la fuerza bruta. de cálculo. Un ordenador normal, un PC como los que tenemos en casa, son capaces de operar con matrices de decenas de filas y columnas sin excesivo problema.

    Lo equivalente en IA, seria tomar decisiones de cierta entidad, como mayor probabilidad de éxito que las que puede tomar una persona. y eso de momento está lejos de ocurrir fuera de los juegos. (lo cual no es poco).

    Me parece muy prometedor que el camino emprendido en este caso, es el del autoapredizaje mediante «jugar» con sigo mismo, pues ese sistema permite en principio ser utilizado en multitud de casos. Esperemos que el camino emprendido sea correcto. El campo de las aplicaciones para «ordenadores inteligente» es inmenso.

    Por poner un ejemplo del camino a recorrer, uno de los seres vivos menos inteligentes es una mosca, y creo que pasará aun mucho tiempo hasta que podamos equipara a un dron, con un «cerebro inteligente» capaz de volar entre los árboles del bosque y por ejemplo hacerlo posar boca abajo en una rama, .
    . .

    .

  • #003
    paco - 28 enero 2016 - 12:58

    Me ha venido a la cabeza la pelicula juegos de guerra.

  • #004
    Pablo - 28 enero 2016 - 13:22

    Como jugador de Go desde hace muchos años, admito que la noticia me sorprendió bastante. Sin embargo hay cosas importante a tener en cuenta:

    – Fan Hui es un jugador profesional de Go, pero no es un top (no es un Messi o un Ronaldo, para que nos entendamos). Es 2 dan profesional, cuando la élite es 9 dan. Realmente tengo interés en ver la partida contra Lee Sedol, que es si es un jugador top.
    – Las partidas (según he leído) eran de 1 hora por jugador. Muy poco tiempo para lo que suelen durar las partidas de torneos profesionales. Es una clara desventaja para el jugador humano.
    – Por último, aunque el «reinforcement learning» haya supuesto una gran mejora en la fuerza de la computadora, realmente -como dice otro lector- no desarrollar tácticas propias. En el Go (cualquiera que juegue lo sabe) no es todo capacidad de cómputo. Hay otros facturas muy importantes que difícilmente un máquina pueda (de momento) imitar.

  • #005
    Garepubaro - 28 enero 2016 - 15:20

    no me creo nada, siplemente que en ajedrez hay muchos intereses creados, algun multimillonario campeon siempre habia antes de llegar a cargarselo el ordenador, e incluso ciudades cuyo modo de vida es el ajedrez, en teoria porque estan en quiebra desde su inauguracion http://es.chessbase.com/post/la-ciudad-del-ajedrez-en-la-estepa-kalmuka

    y porque Go es tan dificil para el ordenador, simplemente porque el ordenador y sus seis cutres puertas logicas no es inteligencia, todo se basa en los billones que se inviertan en gente produciendo algorritmos y coleccionando posiciones para derrotar al jugador, es verdad que se han inventado memoria, como Google, a la que llamar mediante una palabra o jugada en cada momento, pero inteligencia ninguna, esto queda todavia para el siglo XXIV lo menos

    y otra prueba de que los ordenadores la informatica, no son solucion, son problema y grave

  • #006
    Gorki - 28 enero 2016 - 23:46

    y otra prueba de que los ordenadores la informatica, no son solucion, son problema y grave
    jajaja … TE SUPERAS Antonio

    Empiezo a echar en falta a Observador y sus groserías, al menos aportaba entre insultos opiniones luditas, pero razonadas.

  • #007
    mabel - 29 enero 2016 - 11:00

    Me parece super interesante este hito y apasionante todo lo que implican para el futuro próximo las disciplinas Machine Learning e Inteligencia Artificial.
    Comparto un enlace donde se puede descargar de forma gratuita una guía para enseñar a nuestros hijos a programar (jugando). www.invertirenfamilia.com
    Saludos cordiales

  • #008
    Dedo en la llaga - 2 febrero 2016 - 17:55

    Yo jamás he visto a ninguna máquina ganar a nadie, llámese Deep Blue o Alpha Go. Lo que sí he visto ha sido a un grupo de señores muy inteligentes en materia de computación y algunas cosas más, crear un artilugio con el que hacerlo… ¿Cómo se llama toda esa gente? Es lo que los tontos prefieren no saber; es lo que les pasa a los tontos cuando alguien descubre un nuevo planeta, lo señala con el dedo, y el tonto se queda embobado mirando al planeta en vez de embobarse mirando el dedo y preguntarle cómo lo ha hecho…

    Es lo que tiene esto de la tecnología, un gran poder de hipnosis que hace que nos embobemos con la máquina en vez de con la gente que está detrás de ella. Una máquina, por cierto, que la desenchufas y ya no sirve para nada. Como los amigos del Facebook y cía, los famosos «amigos de la luz», porque se va la luz y te quedas sin amigos…

    Cuánta tontería dios mío…

Dejar un Comentario

Los comentarios están cerrados