Es, sin duda, uno de los ejemplos más clásicos de la llamada business intelligence (BI), utilizado en las escuelas de negocio de todo el mundo para ilustrar cómo el análisis de los datos de los clientes puede llevar a conclusiones interesantes y aprovechables en el contexto del denominado market-basket analysis: la correlación entre los pañales y la cerveza. Estos dos productos, aparentemente tan poco relacionados, protagonizan una historia que los profesores y estudiantes de marketing suelen atribuir a lo que ocurrió en una gran superficie (unas veces es Wal Mart, otras veces Osco) cuando se empezó a utilizar software analítico para combinar el análisis de los datos de compras con los demográficos obtenidos de la tarjeta de lealtad de los clientes. Según la historia, se descubrieron una serie de asociaciones, algunas perfectamente lógicas (cereales y leche, o ginebra con tónica y limones), y una completamente inesperada: pañales y cerveza. Aparentemente, los clientes masculinos, cuando compraban pañales los viernes por la noche, tenían además una gran tendencia a adquirir también cerveza. De ahí surgió toda una amplia gama de teorías psicológicas sobre cómo los hombres, cuando eran enviados a por pañales al supermercado, asociaban la idea con la de obtener alguna recompensa para ellos, o unían viernes noche con cerveza y, a pesar de ser ya padres, proseguían con el comportamiento aprendido de solteros. A resultas de esa recién descubierta correlación, la gran superficie decide mover la cerveza al lado de los pañales, y obtiene gracias a ello un incremento de ventas.
Hasta aquí, todo muy bien. Es, como dice Seth Godin en su fantástico libro, una buena historia, una de esas que aparentemente tiene patas, que se sostiene, que gusta contar. ¿El problema? Muy sencillo: que es mentira. Lisa y llanamente falsa. Es una recolección de datos inconexos que comienza con el descubrimiento de una inofensiva correlación entre consumo de pañales y cerveza no adscrita a sexo ni a día de la semana alguno, que continúa con unos cambios en el store layout que las grandes superficies nunca tomaron, y que prosigue con los supuestos buenos resultados que las grandes superficies presuntamente obtuvieron. En realidad, nada. Simplemente, una correlación inofensiva no sustentada que podría servir para ilustrar la diferencia entre la búsqueda orientada de hipótesis y la mera exploración de los datos, y que los vendedores de software de BI suelen usar con profusión para poner los dientes largos a los clientes con eso de «anda que si encuentras algo así, inesperado y rentable…» Pues a lo mejor lo encuentras, pero esperemos que si lo haces sea, al menos, más cierto que la historia de los pañales y la cerveza.
Para más explicaciones, este artículo en The Register y esta anotación de Daniel J. Power, uno de los implicados en el comienzo de esta leyenda urbana.
O sea, que al final era mentira.
Pues vaya, yo ya me había emocionado.
En mi trabajo de por las mañanas me peleo con un Datawarehouse y unas cuantas herramientas de BI. Una de nuestras tareas más divertidas es cuando nos viene algún jefe con una de esas hipótesis de que los clientes que hacen xxx también comparan fff. Y lanzas las consultas y no encuentras ningún resultado empírico que sustente la teoria…
Por cierto ha sido asociación mientras leía tu entrada tenía encima de la mesa (en su enésima relectura) el mejor libro de gestión empresarial del universo: «El Principio de Dilbert» en el capítulo dedicado a los consultores, donde se cuenta el caso de una empresa a la que los consultores le estaban planteando un plan de rediseño y ponían como ejemplo una empresa que se había reconvertido a vender bicicletas hechas a medida. Uno de los mandos intermedios de la empresa decide comprarse una de las bicicletas de la empresa puesta como ejemplo por los consultores y resulta que la empresa hacía 6 meses que había quebrado… consultores…
Lo que más me ha gustado de esta ilustrativa historia es que podamos devolver ciertas creencias al estadio de las ideas cuestionadas, ¡tan sólo con una «marca personal» en la web 2.0 ;)!
Otro punto que me ha parecido interesante es que puedan apreciarse algunos distingos entre una labor típica de mercadotécnico, consultor y académico… Todos podemos opinar, evidentemente, pero la epistemología tiene sus cositas.
Los pañales nunca están al lado de las cervezas; y lo sé perfectamente, ya que, en el camino de un producto a otro por el Mercadona, aprovecho para coger el aceite.
(Ya hago la compra solito, y sin GPS…y no se me cuelan las viejas en la carne).
Anda, con las veces que he explicado esto yo en clase para ilustrar la utilidad de la Mineria de Datos, además siempre lo he sazonado con «… y su os fijais nunca encontrares en ningún supermercado los pañales al lado de las cervezas, eso es para que os lo recorrais todos y sigais comprando». Este año tendré que poner delante lo de «cuenta la leyenda» a la hora de explicarlo.
Pero no confundamos Business Intelligence con Mineria de Datos. Siendo muy relajados podríamos decir que la segunda es parte de la primera pero son dos disciplinas totalmente diferentes.De hecho en el link que nos ha puesto Enrique se hace referencia a… «What is the «true story» about data mining, beer and diapers?»
Como dice tendero_digital, una cosa es probar a ver si hay suerte con los datos y buscar una relación entre conductas de clientes (que seguranmente fallará como el ejemplo que nos ha dicho) y otra muy distinta es que sean los datos los que te digan que correlaciones tienen entre ellos, muchas serán tonterias pero puedes encontrar alguna que sea util y se te haya pasado por alto.
Si no fijaos en las compañias farmaceuticas, los bancos y las compañias de seguro, no podrían sobrevivir sin el uso de la mineria de datos.
Bueno, al final por mucha Data Mining, Consultoria, CRM o Business Intelligence, como no pises el terreno y le vayas a preguntar a los que están en las trincheras lidiando con los clientes, puedes cometer graves errores si tomas las decisiones sentadito desde la Torre de Cristal. Todo se complementa, pero la toma de decisiones basada en la fría lectura de cifras suele ser fatal.
Hola
Pues yo tambien he utilizado el ejemplo en mis clases del IE. La verdad es que aunque sea mentira, era un buen ejemplo ya que ilustraba bien el tema, y se podrá seguir utilizando concretando que es una leyenda urbana.
La segunda lectura que saco es que existen como estas muchisimas cosas en la vida que se tratan de leyendas urbanas y que la mayoría las damos por buenas y correctas. Pero ojo no solo leyendas sino fenomenos o explicaciones a cosas que llevamos años utilizando y que son falsas
Si os interesan esta cosas compraros «lo que Einstein le conto a su barbero» que es un libro que explica fenomenos fisicos cotidianos que muchos pensamos que son de otra forma. Es mas yo como ingeniero estaba equivocado en muchas cosas
En fin como siempre llego a la misma conclusion, TODO LO QUE SABEMOS TIENE UNA CIERTA PROBABILIDAD DE SER MENTIRA POR LO QUE TENEMOS QUE ESCUCHAR MUCHO, Y NO CREERNOS SIEMPRE EN LA VERDAD ABSOLUTA DE TODO. POR TANTO LA MAYORIA DE LAS DISCUSIONES QUE TENEMOS A DIARIO NO SIRVEN PARA NADA YA QUE NOS EMPEÑAMOS EN DEMOSTRAR QUE TENEMOS LA VERDAD EN LUGAR DE PENSAR SI LO QUE NOS ESTAN DICIENDO PUDIERA SER MAS VERDAD QUE LO NUESTRO
Otro ejemplo de marketing que ha resultado ser una leyenda urbana.
En realidad estáis dejando atrás una conclusión (o más bien un principio) muy importante: La correlación no implica la causa. El ejemplo de los pañales y la cerveza me recuerda muchísimo al genial gráfico de «calentamiento del planeta frente a número de piratas» de los pastafaris (ver «pastafarismo» en la wikipedia castellana para pasar un buen rato) ;-)
Un saludo y, una vez más, enhorabuena por tu blog.
pues resulta que el jueves pasado mi profesor de gestion de la informacion, para hacernos creer que su asginatura a pesar de ser optativa es de gran importancia, nos conto dicha historia. nos conto que en una gran superficie de cordoba vieron como las ventas de cerveza y productos parecidos bajaban en un 30% y como la gerente de dicho almacen, observo como los pañales se comportaban de la misma forma que la cerveza y demas productos parecidos. el problema segun él, fue que movieron los pañales de sitio en la tienda y esto provoco las caidas de las ventas. para su comparación la gerente utilizo el coeficiente estadistico r2 y segund nuestro profesor ahora es una de las gerentes que mas cobra. mi curiosidad me llevo a buscarlo en internet y cual ha sido mi sorpresa cuando he visto esto jajajaja.
Estoy de acuerdo con Jorge y en tener cuidado entre la confusión de lo que es un Business Intelligence y para qué sirve…y para qué se utilizan los sistemas de inteligencia artificial, donde una de sus aplicaciones es el data mining. El Business Intelligence está situado en una capa superior a los ERPs, CRM y demás sistemas de gestion empresarial para extraer de forma rápida la informacion además de reflejar los resultados de las estrategias empresariales, entre muchas otras cosas. Y capturar inferencias a través de modelos matemáticos es otra cosa.
Hola amigos, soy de Perú y me encuentro realizando un estudio de Market Basket Analysis,la verdad es realmente emocionante estos temas BI.
Por favor me podrían proporcionar cual es el Support, Confidence y Lift de este estudio (Pañales y cerveza), necesito compararlo con los valores que obtuve.
Cualquier consulta sobre modelos estadísticos me escriben.
javier_javicho@yahoo.es
Saludos