Durante cerca de una hora esta mañana acceder a Amazon, Twitch, Vimeo o Reddit (entre otras muchas) ha sido impsoible. Al intentarlo aparecía un mensaje de error (normalmente un "503 Service Unavailable"), y el problema se ha debido a una caída de un CDN llamado Fastly.
Esta empresa proporciona una Content Delivery Network, una infraestructura que permite acelerar el acceso a todo tipo de contenidos web. Sus responsables han identificado el problema apenas una hora después de producirse y ya lo han corregido, lo que ha hecho que los servicios afectados estén de nuevo disponibles.
Caída brutal de múltiples servicios en internet
Los indicios apuntaban desde el principio a la caída de Fastly, un Content Delivery Network (CDN) que permite acelerar el comportamiento de esos servicios web cacheando ciertos datos para que cuando accedemos a ellos ese acceso sea casi instantáneo.
La página de información de estado de los servicios de este CDN mostraba en esos momentos cómo se había producido un incidente a las 11:58 CEST. Los responsables indicaban aproximadamente una horaa después que habían identificado el problema y que se estaba implementando la solución.
Ese incidente ha afectado a múltiples centros de datos en todo el mundo, y esa parece la causa de la caída de muchísimos servicios que hacen uso de esta plataforma de distribución de contenidos.
No importa que esos servicios estén alojados en infraestructuras como AWS o Azure: si los datos pasan por Fastly, el error se produce y hace que dichos servicios estén inaccesibles.
Entre los afectados parcial o totalmente han estado la propia Amazon, Spotify, Twitch, Vimeo, Reddit, Shopify, Giphy, Quora, o Metacritic, pero también medios de comunicación como The New York Times, la CNN, El Mundo, The Verge, Financial Times, The Guardian o Vice. Otros sitios como GitHub han estado accesibles, pero sin mostrar apenas contenido.
Al intentar acceder a todos ellos aparecía normalmente un mensaje de error "503 Service Unavailable" o bien un simple "connection failure".
El servicio Downdetector que registra caídas de todo tipo de plataformas web mostraba durante esos momentos un aumento de incidencias en múltiples servicios como los citados, y todas ellas parecen estar extendidas por todo el mundo y no localizadas en un punto concreto.
Aunque los indicios apuntaban inicialmente a Amazon Web Services (AWS), la plataforma en la nube de Amazon, la página de información de sus servidores mostraba que todos estaban funcionando normalmente.
Desde Xataka nos pusimos en contacto con Amazon, cuyos portavoces nos indicaron que "ahora mismo no tenemos ningún comentario que hacer sobre este tema", y añaden que "si hubiese alguna actualización" nos informarán sin falta.
Como indicábamos inicialmente, el problema se corrigió apenas una hora después de descubrirse, y todos los servicios que habían estado inaccesibles ya vuelven a estar operativos.
En Fastly indican que en estos primeros accesos a esos servicios "se podría experimentar un tiempo de carga mayor" en estos primeros momentos a medida que los servicios están volviendo a funcionar, pero más allá de eso, todo ha vuelto a la normalidad.
Según los responsables de Fastly se ha identificado "una configuración del servicio que ha provocado disrupciones en nuestros POPs (Points of Presence) de forma global, y hemos procedido a deshabilitar dicha configuración". Los datos revelan que la incidencia se produjo a las 09:47 UTC y se comenzó la corrección del problema a las 10:36 UTC, con el 50% restaurado a las 11:00 UTC.
Ver 16 comentarios