¿Puede un algoritmo predecir el éxito de una startup?

En ocasiones, la tecnología nos trae deliciosas paradojas que rozan lo autorreferente: mientras todos los capitalistas de riesgo se vuelven locos intentando escoger la mejor startup en temas de machine learning, resulta que no hay ninguno al que se le ocurra utilizar un algoritmo de machine learning para tratar de decidir en cuál de ellas invertir.

Una entrada en el blog de BigML, empresa con la que colaboro como Strategic Advisor, anuncia una colaboración con Telefonica Open Future encaminada precisamente a esto: a tratar de desarrollar un algoritmo capaz de predecir el éxito de una startup.

Un tema en el que, indudablemente, existen abundantes datos con los que alimentar a la máquina: años de startups solicitando financiación mediante detallados informes de los que poder extraer abundante información, y métricas posteriores tanto sobre la evolución del mercado, como sobre el nivel de éxito alcanzado por cada compañía.

En el fondo, tratar de construir un proceso mejor que el actual, el que algunos han denominado el «Silicon Valley’s dirty secret«: que en realidad, factores tan fundamentales como la calidad de la idea o del equipo no tienen prácticamente nada que ver en las posibilidades de conseguir financiación, porque en realidad todo el proceso se basa en mediocres humanos tratando de tomar decisiones malamente condicionadas por decenas de factores absurdos, por cuestiones que nada tienen que ver y en nada afectan la calidad de la idea, su encaje en el mercado o la idoneidad del equipo. En la práctica, lo que define quién obtiene o no obtiene financiación tiene mucho más que ver con el «a quién conoces», «quién te presenta», «en qué situación está el pipeline del inversor», «cómo han resultado otras de sus inversiones recientes», o cuestiones similares.

Si piensas que existe algún tipo de «mística» en ese proceso que de alguna manera lleva a que las mejores ideas terminen por aflorar, piénsalo de nuevo: en realidad, todo el proceso es una basura carente de calidad, que sin duda deja fuera a muchas ideas que podían haber cambiado el mundo, mientras encumbra a otras que no valen en absoluto la pena y que terminan por fracasar miserablemente. Que los números finales cuadren para algunos VCs no significa nada más que una cuestión de probabilística. Y suerte, mucha suerte. Puro azar. El proverbial «olfato» de algunos no es más que el fruto de un proceso imperfecto.

¿Podría construirse un algoritmo que diese lugar al inversor perfecto, que al menos generase un proceso de estudio de cada idea libre de condicionantes y sesgos típicamente humanos que deberían ser completamente irrelevantes en la decisión? ¿Puede una máquina estudiar las características específicas de una oleada tecnológica determinada y, en función de las características de las startups relacionadas con ella que pugnan por obtener financiación, determinar cuál o cuáles deberían poder acceder a ella para poder construir compañías con mayor nivel de éxito, que maximizasen el valor de lo invertido? La complejidad de las variables implicadas y de las relaciones existentes entre ellas parece invitar a ello, aunque de nuevo, podríamos seguramente hablar de factores autorreferentes: el simple hecho de ser la escogida por el algoritmo puede hacer surgir factores que distorsionen el resultado final de modo positivo o negativo. En cualquier caso, algunos ya lo están intentando…

La cuestión no deja de tener su miga, considerando que estamos ya en un momento en que más y más compañías de todo tipo tratan de desarrollar algoritmos de machine learning para absolutamente todo: es más que posible que en no mucho tiempo, el hecho de que consigas o no una hipoteca, el precio de tu póliza de seguros, el que recibas una inspección de Hacienda o muchas cosas más estén definidos no por un comité de supuestos expertos aplicando su supuesto «olfato» y el supuesto valor de su experiencia, sino por un algoritmo.

En el próximo PAPIs, el congreso internacional más relevante en APIs de predicción y apps relacionadas, habrá una sección en la que un algoritmo tratará de escoger al ganador del concurso de startups, que consecuentemente recibirá una inversión por parte de Telefonica Open Future. Un algoritmo predictivo tratando de elegir a la mejor startup basada en algoritmos predictivos: una auténtica delicia autorreferente :-)

This article is also available in English in my Medium page, “Could an algorithm do a better job of picking a startup than a human?»

#001
Rui Delgado - 8 agosto 2015 - 12:20
No voy a ser quien diga que la inteligencia artificial tiene sus límites, cuando soy fiel predicador de ella y de la inteligencia cognitiva.
Sin embargo, a día de hoy es muy complicado que el algoritmo te dé el visto bueno de una startup. Creo que está en el ADN y el espíritu nacional estadounidense tomar mayores riesgos y perseguir una visión. Los inversores más conocidos de startups se llevan más por su percepción (o sexto sentido) del equipo, los co-fundadores y la startup.
- Enrique Dans - 8 agosto 2015 - 12:22
  Le llamas «sexto sentido». Pero podrías llamarlo «suerte». O simplemente, como precisamente hoy dice Seth Godin, «superstición«…
#003
Gorki - 8 agosto 2015 - 15:37
No dudo que la «machine learning» llegue a inventarse, es muy posible que existe por ahí, lo que dudo, es que alguien se fíe de sus pronósticos-
De estar yo confundido y que alguien ponga su capital en función de lo que diga el algoritmo, ya se cual es la profesión del futuro, «Eexperto en Optmización de Ssiarups, experto en SPO» . Si la gente paga para que el publico encuentre en Google su pagina web, qué no estarán dispuestos a hacer, para que se fije en ellos un «Business Angel»
#004
Krigan - 8 agosto 2015 - 22:33
Una buena introducción al machine learning:
http://www.toptal.com/machine-learning/machine-learning-theory-an-introductory-primer
Desde luego, esto del machine learning implica que una serie de trabajos que antes hacían las personas van a pasar a hacerlos las máquinas. Por ejemplo, puedo usar mi móvil para hacer cualquier gestión bancaria y un cajero automático para sacar dinero en metálico (mientras sigamos usando metálico, claro). Eso significa que las sucursales ya no son necesarias.
Alguien podría objetar que sí que vas a necesitar una sucursal si quieres pedir una hipoteca, o cualquier otra clase de préstamo. Pero si quien decide darte o no el préstamo es un algoritmo de machine learning, entonces ya no necesitas la sucursal ni siquiera para esto.
Lo cual elimina 2 elementos que hasta ahora han sido psicológicamente importantes: la presencia física, y el trato humano. Como mínimo, va a resultar chocante para mucha gente. Tu banco es una app que tienes en el móvil.
Habrá quien no quiera, gente que prefiere seguir visitando «su» sucursal. Pero mantener una sucursal cuesta dinero. ¿Quién lo va a pagar? ¿Todos los clientes del banco o solo los que deseen seguir visitando la sucursal?
Por supuesto, ING Direct y otros bancos online existen desde hace tiempo. Y dan mejores condiciones por tu dinero.
- Sergi - 9 agosto 2015 - 04:17
  Yo soy cliente de ellos csi desde que empezaron en España, y puedo decirte que no es que te den mejores «condiciones» por tu dinero, sino que de verdad me dan el mejor SERVICIO que nunca me ha dado un banco. Eh, que llevó más de 7 años residiendo en el extranjero y las nuevas tarjetas de débito me siguen llegando a casa semanas antes de se venzan y haya que renovarlas!
  Yo lo tengo muy claro: lo que pueda automatizarse suele ser mejor cuando es bien automatizado. Esto no impide que detrás de tus servicios sigas teniendo a los mejores ejecutivos y a un bien formado equipo asistido claro con la mejor tecnología.
#006
xaquin - 9 agosto 2015 - 00:48
«el simple hecho de ser escogida por el algoritmo puede hacer surgir factores que distorsionen el resultado final de modo positivo o negativo»… me está sonando a mecánica cuántica…
#007
Nur Costa - 9 agosto 2015 - 09:38
He disfrutado mucho del artículo Enrique,
Frases muy poéticas con mucho significado » El proverbial “olfato” de algunos no es más que el fruto de un proceso imperfecto.»
Bravo y gracias por compartir!
#008
Mauricio - 9 agosto 2015 - 16:36
¿No es un poco ingenuo pensar que el algoritmo va a estar libre de subjetividades? El algoritmo simplemente tendrá el «olfato» de quienes lo hayan programado. Por ejemplo, si el programa diera una nota numérica a ciertos datos de la hoja de vida del CEO o a determinados aspectos del proyecto podríamos imaginarnos la siguiente asignación de puntos:
El CEO tiene entre 18 y 35 años: 2 puntos.
El CEO tiene entre 36 y 45 años: 1 punto.
El CEO tiene más de 45 años: 0 puntos.
La universidad donde estudió el CEO está entre las 100 mejores del mundo: 2 puntos.
La universidad donde estudió el CEO entre los puestos 101 y 500: 1 punto.
La universidad donde estudió el CEO está más allá del puesto 500: 0 puntos.
El CEO domina el inglés: 2 puntos.
El CEO domina el español, el francés, el alemán, el ruso, el árabe, el chino, el japonés o el coreano: 1 punto.
El CEO domina cualquier otra lengua: 0 puntos.
El proyecto produce beneficios altos para los accionistas: 2 puntos.
El proyecto produce beneficio medianos para los accionistas: 1 punto.
El proyecto produce beneficios bajos para los accionistas: 0 puntos.
En base a lo anterior, pensemos qué puntaje obtendrían los siguientes candidatos:
El candidato 1 tiene 51 años, estudió en Ahmedabad y domina el guyaratí, el maratí y el malayalam. Su proyecto beneficiará a las personas con síndrome de Down de Trivandrum.
El candidato 2 tiene 46 años estudió en Ankara y domina el turco, el persa y el kurdo. Su proyecto beneficiará a las familias pobres de Erbil.
El candidato 3 tiene 29 años, estudió en Nueva York y domina el inglés. Su proyecto beneficiará a los accionistas.
Resultado final: El candidato 3 obtiene financiamiento para su startup.
Obviamente este ejemplo es una simplificación, pero es claro que la automatización del proceso podría llevarnos incluso a peores resultados que los obtenidos por un comité de selección, aunque intentemos que el algoritmo sea flexible y que aprenda de los resultados pasados.
- Krigan - 9 agosto 2015 - 19:50
  En lo que se refiere a una empresa, su objetivo es obtener los mayores beneficios posibles en relación al riesgo de la inversión, y por tanto el algoritmo estará haciendo bien su trabajo si acierta más que el comité de expertos a la hora de elegir inversiones exitosas.
  Por supuesto, también podría haber subjetividades en el algoritmo, pero si este acierta más, entonces es que el efecto de esas subjetividades está siendo menor.
  Más aún, un algoritmo de machine learning aprende del pasado, y una de las cosas que puede aprender es que determinada variable, que el diseñador del algoritmo introdujo por prejuicio propio, es irrelevante. El algoritmo aprenderá a no tener en cuenta esa variable (más exactamente, le asignará una importancia próxima a cero).
  Las personas que componen un comité de expertos también pueden aprender de la experiencia, pero hay en el ser humano una marcada tendencia a aferrarse a sus prejuicios, cosa que no existe en una máquina.
  - Mauricio - 10 agosto 2015 - 00:00
    Pues a mí me parece que al final el algoritmo en cuestión estaría formado por un enorme número de pre-juicios que el tiempo solo tendería a volver aún más fuertes. Por ejemplo, si el propósito final es obtener mucho dinero es más probable que el algoritmo elija a un estadounidense y no a alguien de un país hispanohablante por varias razones, entre ellas el hecho de que hay más emprendedores norteamericanos ricos que sus equivalentes en España o América Latina. Y aunque se introduzcan algunas variables que otorguen puntos por ser miembro de una minoría, por ingresos familiares, género, etc., al final el susodicho algoritmo terminará siempre eligiendo preferentemente a jóvenes universitarios de clase media de países desarrollados o emergentes. Es decir, la misma cuestionable elección que habría hecho cualquier comité de selección humano.
    El objetivo final del algoritmo, sin embargo, es saber si los elegidos van a ser unos triunfadores, y esta es la parte que ningún algoritmo a corto y mediano plazo va a saber menos aún decir. Entre otros problemas, hay que contar con el hecho de que aunque la predicción sea correcta es necesario que haya gente que la dé por cierta. Si hace 10 años el algoritmo en cuestión hubiera dicho que en 2015 tanto Hotmail como MSN Messenger habrían ya desaparecido, ¿le habríamos creído? Es más, si se crea el algoritmo infalible que predice el futuro de las empresas, ¿no sería lógico pensar que también sería posible crear un algoritmo que prediga el futuro de la humanidad?
    En realidad, dudo que los dueños del capital quieran escuchar a un algoritmo infalible que sea capaz de decirnos cómo será el futuro: seguro que predice pérdidas masivas a escala planetaria debido a daños ecológicos irreparables y la muerte de millones de personas como fruto de la búsqueda de riqueza fácil por parte de un grupo relativamente reducido de voraces inversionistas.
    - Krigan - 10 agosto 2015 - 06:22
      Estás yendo mucho más lejos de lo que se pretende con el algoritmo. Es tan solo para saber si una startup tendrá éxito inicialmente. Por ejemplo, si el algoritmo funciona bien, habría predicho el éxito de Hotmail.
      Después de su éxito inicial Hotmail fue vendida a MS por un pastón (que es el destino de muchas startup). Lo que ocurra después con Hotmail le da lo mismo a los inversores de capital riesgo que iniciaron su andadura.
      Lo cual no quiere decir que la venta de Hotmail fuera un timo, siguió teniendo éxito durante años después de que MS la comprase, antes de ser desbancado por Gmail. Si en esos años MS ganó mucho dinero con Hotmail, la inversión también pudo salirle rentable.
      Dado que el algoritmo de machine learning se alimenta de datos del pasado (por ejemplo, a 5 años vista desde la fundación de la startup), cualquier prejuicio inicial que hubiera perderá importancia con el paso del tiempo.
      Otro tema diferente es si para fundar una punto-com de éxito necesitas vivir en USA. Si fuera cierto, que el algoritmo le dé importancia a vivir allí NO sería un prejuicio, sino el reflejo de una realidad.
      La situación actual, por lo que he podido ver, es que una punto-com de fuera de USA puede tener éxito en el país donde surgió (Baidu en China), o en algunos países de la misma zona cultural (VKontakte en Rusia, Bielorrusia, y Ucrania), pero el éxito mundial está reservado a las punto-com USA, salvo que la punto-com se dedique a la piratería (la sueca The Pirate Bay).
      Da lo mismo si eres un ucraniano que se fue a vivir a USA a los 16 años, como es el caso de uno de los 2 fundadores de Whatsapp, o un hindú que se fue allí a los 20 años (uno de los 2 fundadores de Hotmail), para fundar una punto-com de éxito mundial no necesitas ser gringo, pero sí vivir en USA.
      Ahora bien, también se puede ganar mucho dinero con las punto-com locales, por lo que el algoritmo también debería tenerlas en cuenta.
#012
Antonio Castro - 9 agosto 2015 - 19:25
No conozco bien el problema pero creo que hay demasiados parámetros dificilmente cuantificables en este tipo de análisis. Creo que los parámetros cualitativos pueden ser evaluados mejor por los humanos que por las máquinas.
#013
E-MOOC - 10 agosto 2015 - 18:44
No dudo que BigML lo vayan a hacer muuucho mejor que lo que nosotros podríamos hacer. Sin duda. Utilizarán sistemas más tecnológicos, más sofisticados y más cool. Pero eso (esa propuesta de valor) se la ofrecimos a Open Future el año pasado, y nos rechazaron sin ni siquiera citarnos.
Ojo, no «les vendíamos» una idea, si no una solución que se estaba probando con 25.000 emprendedores, y que estaba siendo utilizada por la red gallega de Business Angel, RedInvest; un propuesta que querían implementar en un Wayra…. y ni siquiera nos citaron.
Unos «gallegos» cualesquiera no les debió parecer suficientemente interesante.
Ay, Enrique… mexan por nos.
#014
Jorge Garcia Suárez - 10 agosto 2015 - 19:35
No creo que un soft pueda evaluar realmente algo que posee tantas características a tener en cuenta. Sobre todo cosas que no pueden ser valoradas a través de números. Aunque no dudo que sea el futuro. un lugar donde cada vez importe menos tus cualidades humanas y más tu posición en las estadísticas que interesen, para obtener determinada cosa.
#015
yosmel - 4 septiembre 2015 - 03:47
el éxito de un estatus no depende de definiciones pasadas, cuando hablamos de saber cosas las cuales son futuras, pues se romperán la cabeza, por que ningún algoritmo y persona llegara a predecir eso, pero algo que si se que uno define su futuro a partir de hoy fundar en sacrificio o no hace nada estar conforme.
la solución de algo se aplica si se sabe la respuesta, pero sin soluciones nada se puede aplicar.