Ayer, un rayo que cayó en las afueras de Dublín provocó un incidente en los transformadores que abastecen de electricidad a los data centers que Amazon y Microsoft tienen en la capital irlandesa y con los que dan servicio, en el caso de Amazon, a su plataforma de cloud computing EC2 y, en el de Microsoft, a sus BPOS (Business Productivity Online Services). El resultado fue la caída o degradación del servicio de numerosos sitios web en toda Europa que utilizan esos servicios, un caso que no es la primera vez que sucede ni obviamente será la última.
Mientras, un proyecto de Microsoft Research se plantea algo tan curioso e interesante como deslocalizar y distribuir los data centers en casas particulares en forma de aparatos de calefacción: servidores-calefactores eléctricos que tendrías en tu casa, mientras la compañía te subvenciona la electricidad necesaria para mantenerlos operativos y, colateralmente, para que calientes tu casa. Y relacionado, un estudio revela que Google maneja alrededor de novecientos mil servidores, y que su impacto energético es considerablemente menor de lo esperado debido tanto a la crisis económica como a la utilización intensiva de tecnologías como el green-IT y la virtualización.
Curioso conjunto de noticias. Sin duda, vivimos tiempos interesantes…
Dile a una empresa que cae un rayo y todos sus datos estarán inaccesibles durante horas en toda Europa. Y todavía queda gente que nos vende que lo de la nube es la solución definitiva…
Ah! O sea que lo del Cloud Computing es eso… Que las nubes provocan tormentas eléctricas (que de las financieras ya se encargan otros), y toda la civilización 2.0 se va al garete. ;)
A lo mejor la continuidad del suministro eléctrico puede llegar a ser una ventaja competitiva…
¡Ah! por eso no va Meneame.
Aunque llevo mucho tiempo en Dublín y estoy acostumbrado a ver las 4 estaciones en un dia, lo de ayer no lo había visto nunca. De estar nublado como normalmente es en Dublín a hacer un día super-soleado con temperaturas de 19-20 y de repente ponerse oscuro a tope y caer lluvia por un tubo, a veces con granizo, bajando en 20 minutos la temperatura bruscamente unos 7 grados hasta 12-13. Al ratito, un sol del copón otra vez, y otra vez a 20 grados. Este ciclo se repetió hasta 5-6 veces ayer. No me sorprende lo del ciclo lluvia-sol pues es habitual en verano aqui, lo que si me sorprendió fueron los cambios tan bruscos de temperatura de hasta 7 grados en tan solo 15-20 minutos. No sabía lo del rayo, pero no me sorprende, fue un dia de tormentas bastante extraño.
#001 Josue y #002 Jesus
¿De veras pensaís que la razón de que las empresas de Internet no cubran sus objetivos es por una momentanea, paralizacion/ralentizacion de Internet a causa de un rayo que cae en Irlanda?, y por qué no por el corte de suministro eléctrico en donde tiene la oficina central, ¿O es que en tu casa lo largo de un año no se te va la luz nunca?
No saquemos el catastrofismo a relucir, el calendario está lleno de fiestas nacionales, autonómicas y locales y las empresas funcionan maravillosamente. Por poner un ejemplo Las Fallas en Valencia paralizan la ciudad por más de una semana, igual pasa en otrros sitios con la Semana Santa, la Feria de Abril, los Safermines etc. aparte todos hacemos «puentes» en los que muchas actividades se paralizan y eso no solo pasa aquí los «bank holiday», los «holloways», el «Columbus Day» paralizan la actividad en USA y a pesar de ello las empresas salen a delante.
…..
Me parece muy curioso, pero hoy técnicamente nada especialmente complejo, tener un servidor como elemento calefactor de una vivienda, el cloud computing ya es el presente en muchas grandes empresas de forma interna usando sus propios ordenadores en red y puede ser el futuro en estos gigantes de Internet.
Con gusto cambiaría la caldera de gas natural de mi comunidad de vecinos por unos servidores, si ellos pagan la mitad de la energía que se consuma, pero solo funcionan a todo tren, tres meses al año, en verano no hay calefacción y el consumo en calentar el agua baja mucho, Habría que compensar el funcionamiento a tope de servidores en Europa, con otros funcionando a medio gas en Australia y viceversa, así unos trabajarían de día en Invierno mientras los otros estarían de noche en verano. ´
Me parece esta solución mejor que montar grades centros en sitios como Noruega, solo porque hace un frío que pela y si ahorra en refrigeración, aquí no es solo que que se ahorre en refrigeración, es que el calor producido se puede vender como subproducto a consumidores locales.
Indudablemente hay mucha gente ingeniosa en el mundo.
Yo siempre había pensado que una de las ventajas del cloud computing era la absoluta distribución de los servicios. Y que la caída catastrófica de un CPD era algo de lo que la propia infraestructura del cloud computing te protegía y abstraía (osea, que era transparente).
Veo que no es para nada así :)
Off topic:
Un interesante articulo sobre lo que yo creo que es la gran tomadura de pelo y que debería estar en las bases del 15M.
http://www.elpais.com/articulo/economia/Muchos/venden/pocos/compran/elpepieco/20110808elpepieco_4/Tes
Lo de refundar el capitalismo lo dejamos para otro siglo, no?
Parece que los rayos no están acatando del todo el principio de neutralidad de la red, habrase visto… ya se torna impostergable un nuevo Manifiesto español contra el clima o cualquier otro fenómeno natural que atente contra internet.
Mientras tanto no hay que decir nada de como Google degradó la semana pasada, el Youtube de contenido generado por usuario (y sin necesidad de ningún rayo) a 380 kbps, al tiempo que su nuevo servicio pagado de renta online de películas sí iba como un cohete. Si un videito de 480p necesita de al menos 600-700 kbps para correr bien, bueno pues… saquen sus propias conclusiones. Al menos para Google, no todos los bites deben ser tratados igual.
¡Catástrofe en las redacciones de los servicios informativos de T5, A3, La Sexta, Cuatro, etc.!
«Meneame sigue caído y no sabemos de qué hablar. Es una situación a la que nunca nos hemos enfrentado. Puede que incluso tengamos que contactar con fuentes de ahí fuera, valorar el conjunto de informaciones y redactar nosotros mismos la noticia. Si por lo menos la temporada hubiese empezado, rellenaríamos con lo que ha dicho Mouriño que dijo Guardiola que le dijo Rosell. Pero ahora, ¿qué demonios hacemos?»
Los becarios que en verano pueblan las redacciones de periódicos y emisoras también han mostrado su inquietud:
«En la facultad no nos han preparado para esto. Nuestro jefes se estén empezando a enfadar, la tensión y mal rollo se palpa en el ambiente, y la verdad es que no sabemos cómo vamos a salir de ésta»
Otro Off topic. El sábado en una librería de Lima, un rostro familiar me observaba a través de un cable de USB a modo de monóculo desde las estanterías.
Enhorabuena Enrique que «Todo va a cambiar» ya llegó al Perú, e imagino que a toda latinoamérica.
De hecho Google invirtió mucha pasta en energía maremotriz y demostró su interés en la energía geotérmica de Islandia.
Para Mario: Por mal que nos parezca, es Google quien da el servicio de video en streaming. Se le puede reprochar con toda razón de que no informe de las condiciones distintas ambas modalidades (falta de transaprencia), pero eso no tiene nada que ver con la neutralidad de la red, puesto que hablamos de un extremo, no de un intermediador. Una cosa es que un operador de telecomunicaciones discrimine paquetes en función de origen, destino o contenido y otra que un proveedor de servicios ofrezca mejores condiciones a una versión de pago que a otra gratuita. Tan sólo quería aclarar ese punto, gracias.
#006 Gorki, por lo que veo desconoces el concepto de CPD de respaldo, que permite que si se va la luz en CPD principal se active este y todo siga funcionando. Pueden caer dos rayos, uno en cada CPD, pero eso ya sería el colmo de la mala suerte. Así funcionan ahora muchísimas empresas, a las que se les está ofreciendo que eso no hace falta con el cloud computing, que implementa su propia redundancia (como dice #007 David). Y este es el resultado: UNA TOMADURA DE PELO.
Y de momento vamos para un día sin que se haya recuperado el servicio (p.e. menéame), no es un ratito.
Supongo que no sirve para nada explicarte que las empresas ya cuentan con esas fiestas y por tanto no ganar esos días dinero no es un problema, mientras que una caída del servicio de un día en el que sí que preveían ventas SÍ es un problema. Es lo que tiene no conocer cómo funciona una empresa.
#007. David. En realidad funciona así, como servicio distribuído para casos de desastre como éste. Pero no «by default» sino que que es un servicio aparte que hay que pagar aparte, y aquí es donde yo veo el fallo. El servicio distribuído debería ser operativo desde la modalidad más básica y así se evitaría la mala prensa que Amazon está cosechando en estos momentos, porque no habría apenas impacto y podría silenciarse. Webs como Filmin y Menéame parece ser que no contaban con este servicio y se encuentran caídas, lo que no le da mala prensa a estas webs, sino al proveedor, Amazon.
…al proveedor, Amazon, y mala prensa también al propio concepto de nube.
Por otro lado, la historieta del rayo me suena rara, yo ayer no vi ni un relámpago ni oi un sólo trueno. Si un rayo cae tan cerca de donde estoy el estruendo debió ser más que perceptible. Eso sí, cayó agua por un tubo, y quizá fuese esa la verdadera causa, que todos conocemos a estas compañias electricas de Irlanda y también España. Y ese es otro factor a tener en cuenta cuando te estableces en un determinado lugar, si tus proveedores van a ser tecnológicamente tan sólidos como tu, capaces de ofrecer 24/365 de servicio consistente.
#11
Webs como Filmin y Menéame parece ser que no contaban con este servicio y se encuentran caídas, lo que no le da mala prensa a estas webs, sino al proveedor, Amazon
A quien no le daría mala prensa es a mi blog personal pero en cualquier web medianamente profesional deberían haber tenido en cuenta algo así.
De todos modos, una de las que citas está muuuuuy lejos de ser algo serio y no necesita caídas de servicio para cosechar mala prensa.
#16. Jose. Sin duda Meneame y Filmin (esta ni pierde ni gana) pierden algo pero si el trafico se restablece mañana, después del ruido Menéame habrá perdido poco, aparte de la tranquilidad de sus administradores.
Amazon ha perdido mucho, y la nube en general, puesto que ya ni los clientes, como Meneame, confiarán en ella, o al menos se plantearán otros planes de seguridad.
#012 Josue
Ninguna empresa desaparece por que caigan las lineas. Te ha pasado ir a un cajero automático y que por la razón que sea esté fuera de servicio, pues a ves eso impide trabajar a toda una serie de sucursales, pasa con relativa frecuencia y ese suceso no ha hecho bajar jamás un entero a las acciones en bolsa de ningún banco.
Las empresas no son tan endebles y con seguridad Amazon pierda ventas si se cae un día Internet, pero también con toda seguridad, recupera una parte sustancial de ellas al día siguiente, porque si necesitas un determinado libro de medicina, ingeniería o de lo que sea, no vas a renunciar a comprarlo porque no hayas conectado a Amazón un día. Al final las ventas perdidas no suponen nada en el resultado de la compañía.
Como te digo, se caen los servidores de Internet, así como se cae los terminales en las compañías y se bloquean las bases de datos, de tarde en tarde e inevitablemente. No hay servidor que garantice la operabilidad al 100%, siempre hay un pequeño margen de error, por más que tengan respaldos y todo lo que quieras poner, y repito no pasa nada, eso ha pasado montones de veces y nunca la sangre llega al río. Hacer catastrofismo de ello es no tener ni idea como es una empresa
Otra cosa es que a nadie le guste perder ni un euro de ventas.
#018 Gorki, el sistema lleva casi un día caído. Ese downtime no lo encontrarás en ninguna empresa de hoy en día que tenga un CPD de respaldo con un sistema mínimamente serio. Esto de la nube vende mucho pero es claramente inferior al sistema tradicional de disponibilidad. No es un problema de que todos los sistemas se caigan, el problema es que unos se caen más que otros y cualquier empresa prefiere el que menos se caiga.
Además está completamente fuera del control de la empresa. ¿Cuánto va a tardar en volver a funcionar? Ni idea, y lo único que puede hacer Menéame es sentarse a esperar.
Pero bueno, el que quiera comprarlo que lo compre, es su problema.
La verdad es que a Ricardo Galli, y el otro, Benjami no-se-que, se las estan dando en toda la boca, ahora. Quizá habría que darselas también a Enrique Dans. De momento me abstengo.
Por cierto, la plataforma de Microsoft volvió a funcionar a pleno rendimiento en 2-3 horas. La de Amazon sigue medio caída 24 horas después. Los fanatismos informáticos nunca son buenos.
Yo he manejado un data center en España, ninguna compañía de seguros quería asegurar las caídas de linea o de electricidad, solución duplicar los datos en otro lugar del mundo, con todo lo que vale en dinero, lo de las centrales eléctricas es una vergüenza y yo pensaba que solo era en España, en un año tuvimos tres caídas importantes dos por electricidad y otra por una tarjeta de red por suministrador de fibra óptica, ya veo que en un país que se jacta de ser una potencia mundial en empresas de informática -por librarles de impuestos con el resto de la comunidad europea entre otras cosas- no tenga duplicado el sistema eléctrico o un generador de electricidad para los data center importantes, o que amazon no tenga duplicados los data center, en otra parte del mundo, ver para creer en una empresa tan importante a nivel mundial, voy a tener que enviarles mi curriculum, enrique tu que tienes buenos contactos ya sabes mi email, lo deje por frustración pero por lo que veo no debo de ser el único, es el momento de volver a pedir trabajo.
El Service Health Dashboard de Amazon WS es hoy una fuente sin igual de diversión. Meneame sigue caído y no me extraña visto el despiporre de los sistemas de Amazon EC2. Un par de perlas (entre otras muchas) de la última actualización:
«Separately, and independent from the power issue in the affected availability zone, we’ve discovered an error in the EBS software that cleans up unused snapshots … During a recent run of this EBS software in the EU-West Region, one or more blocks in a number of EBS snapshots were incorrectly deleted … We have now also disabled all of the snapshots that contain these missing blocks.»
«For the remaining EBS volumes, we were unable to verify whether or not there were any in-flight writes that did not get consistently saved. As a result, we’ve now started the process of creating recovery snapshots for all of these EBS volumes that are still unavailable. … the process might take up to 24 hours to fully complete. We expect that a large portion of these volumes created from these recovery snapshots will be consistent, but customers will need to verify volume consistency by running a recovery tool on their new volume (e.g. a file system recovery tool like fsck).»
No soy un experto, pero esto traducido al español ¿quiere decir «Búscate la vida amigo, si te devolvemos un EBS inconsistente. Te acompañamos en el sentimiento.»?
Por los comentarios anteriores, deduzco que por aquí hay administradores de sistemas experimentados, que trabajan, o han trabajado, en grandes empresas: con la perspectiva de estas +48h ¿contrataríais a Amazon EC2 para alojar algún servicio crítico de vuestras organizaciones?
No me imagino yo a una empresa que gestione dinero (bancos, aseguradoras, gestoras de fondos,…) o información ciudadana crítica (policía, tributos, hospitales,…) funcionando de esta manera. No se cuál ha sido el impacto sobre PayPal, que parece se ha recuperado más rápido que filmin o meneame (y, además, desconozco que parte de la operación estaba alojada en la EC2), y si ellos también se han encontrado con el problema de los EBSs inconsistentes.
A lo peor es que, como lo pobres de meneame sólo «trafican» con ideas y noticias, son del grupo QLD (¡que les den!).
Este comentario, recuperado vía Slashdot (http://cort.as/16cP), me parece que refleja el sentir de bastantes responsables de CPDs:
Whilst the technology exists for the cloud to deliver fault tolerant distributed storage, when you choose to put data in the cloud, you are choosing to relinquish control of the data. You are placing it in the hands of someone else. Quite probably an organisation that you do not know intimately. Quite probably an organisation that is based in a different legislative region – probably another country.
You have little to no capacity to audit their system. You have little to no capacity to test their fault tolerance. And here’s the sucker punch – you have little to no legal comeback for the consequences if something bad happens.
… the only data you can safely put in the cloud is data that would be basically irrelevant to your core business anyway.
El problema es cuando tu core business es precisamente «vender» datos.
Ultima observación:
El efecto de la caída de meneame ya se detecta, como es lógico, en Google Trends (http://cort.as/16cY): importante subidón de las búsquedas (todos desesperados, intentado saber lo que pasaba).
Ahora, lo sorprendente es la estadística por ciudades: 1. Vigo y 3. La Coruña. En un caso debe ser el efecto del numeroso grupo de ciberactivistas «Dans, family & friends». Pero ¿el de Vigo? ¿Dónde está pasando estos 5 (ya malditos para él) días de vacaciones Gallir?
Interesante; aunque no sé si conoces La Maldición China «que vivas tiempos interesantes».
Porque en este mundo hiperconectado las culturas también lo están, y hay que tener cuidado con lo que se dice y desea, que desde luego los tiempos se están poniendo interesantísimos y no precisamente por lo tecnológico.
Comentario 10 de Henry: crack, de sombrerazo.
#017 y #05 (Supongo que eres la misma persona) Al igual que tu, vale que llovio demasiado pero no vi ningun relampago ni escuche ningun trueno. Ni mis conocidos que viven por otras partes de Dublin, tampoco… Mala suerte que el unico (o de los pocos rayos) les cayeran encima.
No se que película pretenden vender.
Al final, puesto que es una solución antigua, precisamente la «solución» al problema también lo es… utilizar mirrors de la nube… y mantenerlos sincronizados… si uno falla, el otro toma su lugar…
A alguien le suena….
os recomiendo la lectura del artículo Y…¿A que huelen las nubes? en http://www.diegoguerrero.info/y-%C2%BFa-que-huelen-las-nubes/
Quiero uno de esos aparatos de calefacción en mi casa….además de mantenerme calentito me sentiría orgulloso de prestar un servicio tan importante a una compañía como Microsoft jeje. ¿Dónde me apunto para tenerlo?
Por fin, casi una semana después del desastre reconocen que no fue un rayo. Los que vivimos en Dublín ya sabíamos que no pudo ser, pues ni se vió ni se oyó nada ese día aparte de la lluvia.
«The initial fault diagnosis from our utility provider indicated that a lightning strike caused the transformer to fail. The utility provider now believes it was not a lightning strike, and is continuing to investigate root cause. »
En la propia web de Amazon Web Services: http://aws.amazon.com/es/message/2329B7/