domingo, 4 de febrero de 2018

UN REINICIO DE 30 MILLONES DE DÓLARES

Dicen que los informáticos lo solucionamos todo reiniciando el equipo. Es lo primero que preguntamos, por algo será. No será algo tan baladí cuando a los usuarios no se les ocurre en momentos de crisis... digo yo.

En el año 2016 Australia llevó a cabo su censo nacional. Ese año aprovechó la tecnología para crear una página web en la que los ciudadanos presentaban diversos formularios. Al frente de este proyecto estaba IBM y una de las empresas más importantes de estadística de Australia, ABS.

Se estuvieron haciendo pruebas durante todo un año para ver que  cantidad de tráfico era soportado y parece ser que la cosa fue relativamente bien hasta que llego el día del censo. El sistema estuvo caído durante 40 horas. Trabajos extras, monitorizaciones, funcionamiento de servidores, personal... todo extra.


Se abrió una comisión de investigación para ver que había pasado y por qué fue debido tanto gasto extra. Se llegó a una conclusión sorprendente. La propia IBM dijo que el problema se hubiera solucionado reiniciando uno de los dos routers que controlaban el tráfico.

Michael Shallcroos, el ingeniero responsable de IBM explico que sufrieron un ataca DDoS en un router, lo que les obligó a apagarlo y manejar todo el tráfico con uno. En las pruebas hicieron algo parecido y salió bien. Bienvenido a la realidad Michael. La realidad fue que un solo router no pudo soportar todo el tráfico y se cayó. 

Los sobre costes que se sufrieron tuvieron que ser compensados por la empresa de estadísticas ABS y estos rondaron los 30 millones de dólares. 

David Kalish de ABS dijo que aprendieron una valiosa lección y que para el censo del 2021 estarán mucho mejor preparados y tendrán un sistema más robusto... Por la cuenta que les trae.
 

No hay comentarios:

Publicar un comentario