Hacía tiempo que quería dedicarle algo de tiempo a Google Correlate, y estoy aprovechando el desarrollo de material para uno de mis cursos para jugar un poco con ello.
Google Correlate es parte de Google Trends, y es un buscador simple de correlaciones entre series de datos proporcionadas por el propio buscador o por el usuario. La gráfica que tenéis a la izquierda, por ejemplo, es simplemente el resultado de subir una serie temporal semanal de las visitas de mi blog exportada directamente desde Analytics, y pedirle a Correlate que busque correlaciones sobre búsquedas hechas en España.
El procedimiento es tan simple como entrar en Correlate, pedir la opción «Enter your own data», y o bien subir un archivo en el formato adecuado, o bien incluso copiar y pegar datos desde una hoja de cálculo a la cuadrícula que te muestra en la aplicación, más fácil imposible. La gráfica, tomada a modo de ejemplo, muestra una correlación muy notable (r=0.8) entre las páginas vistas en este blog y las búsquedas de la palabra «blog» en España, relativamente obvia pero que no esperaba tan elevada.
Entendiendo las limitaciones del tema y evitando conclusiones precipitadas basadas en correlaciones espurias o directamente absurdas, la verdad es que me está pareciendo interesantísimo: basta subir una serie de datos en el formato adecuado (los consejos típicos: ojo con las comas o los puntos de separación de millares, mejor eliminarlos; pon la fecha en formato anglosajón; etc. si no quieres perder tiempo), y es la propia Google la que te propone términos de búsqueda que muestren una correlación elevada con tu serie temporal.
En nuestro país, con un 97% de cuota de mercado de Google como buscador, las pautas de búsqueda tienen mucho que decirnos acerca de las posibles influencias, correlaciones o simplemente observaciones anecdóticas que puedan surgir entre el uso del buscador para determinados términos y una serie, por ejemplo, con nuestra evolución de ventas semanal. Con semejante cuota de mercado, qué duda cabe que el uso del buscador se convierte en un auténtico monitor sociológico que refleja los intereses de una parte muy significativa de la población. Para muchos productos hay cosas razonablemente obvias e interesantes (recordar el estudio que suele presentar la propia Google entre incidencia de gripe y búsquedas relacionadas con la enfermedad), pero otras pueden no serlo tanto. Para experimentar con ello de una manera sencillísima, pero que creo que puede llegar a tener bastante más miga y más posibilidades de las que inicialmente parecía.
He tratado. pero no he sabido hacerlo, averiguar si se cumple em España el «Ïndice de la patata», que definióo en los años 90 el presidente de la Unión de Horticultores de Moscú, Andréi Tumánov, y que dice «Cuantas más patatas se siembran en huertos improvisados, en solares abandonados o en terrenos públicos junto a las vías del tren o de los ríos, peor es la situación en el país».
Detecto en mi blog un interés inusitado por los Huertos Failiares y se están creando presión para la aparición de huertos familiares, ( http://www.heraldo.es/noticias/aragon/zaragoza_provincia/zaragoza/el_parque_del_agua_cuenta_con_200_huertos_urbanos_177653_301.html ), o sucesos como los de Benimaclet, ( http://www.lavanguardia.com/vida/20120125/54245290905/vecinos-de-un-barrio-de-valencia-se-enfrentan-al-bbva-por-un-huerto-urbano.html ) pero no he sabido hacer la correpondencia con el IBEX o algo que muestre el aumento de la crisis, Ahí lo dejo para quien sea más listo.
Qué raro que hoy no hables del 15-M.
Te lo dijimos y no hiciste caso, que vuestro movimiento buenista se convertiría en una cueva de comunistas y frikis gandules.
‘Espúreo’ es una palabra espuria:
http://www.lavadoradetextos.com/2012/03/‘espureo’-es-una-palabra-espuria/
Y según Fundeu:
http://www.fundeu.es/vademecum-E-espurio-5839.html
Cuando hacemos correlaciones y sacamos conclusiones tenemos siempre que tener mucho cuidado como las interpretamos. Dejarme poneros un ejemplo que pongo siempre en mis clases
«el otro día leí en la prensa que el 35% de las personas que tuvieron un accidente con consecuencia de muerte el año pasado habían bebido alcohol».
Yo cuando monto en un coche, lo primero que pregunto al conductor es si ha bebido y si me dice que NO, me bajo inmediatamente del coche, porque pienso; Joder, este pertenece al grupo de mayor porcentaje es decir al 65% de los que se matan!!!!!.
PD: Evidentemente no lo digo por tu ejemplo Enrique lo digo por las conclusiones que la gente puede sacar erróneos de los datos estadísticos.
Cierto José Luis….
Como es cierto que hay una relación entre la estatura y el peso corporal: las personas altas pesan más… me he puesto a comer de todo y a toda hora a ver si crezco unos centímetros…
En fin: como siempre se ha dicho, la estadística es el arte de mentir con números. Asi que a analizar muy bien antes de sacar conclusiones apresuradas.
Parece una herramienta bastante interesante, sobre todo para hacer estudios y llevar a cabo actividades similares.
La probaré.
Gracias por tu explicación.
Un saludo.
Curiosos los datos que uno puede observar con esta herramienta y con google trends.
Google y las fluctuaciones bursátiles
Un análisis demuestra la correlación entre las fluctuaciones del mercado de valores y el volumen de búsquedas en Google de ciertos términos.
http://www.investigacionyciencia.es/noticias/google-y-las-fluctuaciones-burstiles-9559
Tambien he observado sin que me sorprenda demasiado las busquedas de las siguientes marcas de automoviles en diferentes paises y su relación con la forma en que se ha vivido la crisis en cada uno de ellos:
España:
http://www.google.es/trends/explore#geo=ES&q=renault,+peugeot,+citroen,+volkswagen,+porsche&cmpt=q
Francia:
http://www.google.es/trends/explore#geo=FR&q=renault,+peugeot,+citroen,+volkswagen,+porsche&cmpt=q
Alemania:
http://www.google.es/trends/explore#geo=DE&q=renault,+peugeot,+citroen,+volkswagen,+porsche&cmpt=q
China:
http://www.google.es/trends/explore#geo=CN&q=renault,+peugeot,+citroen,+volkswagen,+porsche&cmpt=q