Durante octubre de 2025, dos de los principales proveedores de servicios cloud experimentaron interrupciones significativas que afectaron a servicios globales. El 20 de octubre, Amazon Web Services (AWS) sufrió una caída en su región US-EAST-1, y solo nueve días después, el 29 de octubre, se produjo un fallo en Azure Front Door de Microsoft. Estos incidentes revelaron la fragilidad de la arquitectura digital global y la dependencia crítica de unos pocos hubs tecnológicos.
El Efecto Dominó del Fallo en AWS
El incidente de AWS comenzó el 19 de octubre con un fallo en el sistema que traduce nombres de dominio a direcciones IP (DNS). Este problema impidió que las aplicaciones de los usuarios localizaran los servidores donde se alojaban sus datos. Aunque AWS corrigió la falla de DNS inicial en pocas horas, el problema había desencadenado complejas reacciones en cadena en otros sistemas que tardaron 16 horas en estabilizarse completamente.
La interrupción afectó a más de 75 servicios, dejando a las aplicaciones sin capacidad para acceder a sus bases de datos, ejecutar código o almacenar información. El origen del problema fue la región US-EAST-1 de Virginia, una zona crítica que aloja componentes esenciales utilizados globalmente para dirigir el tráfico de internet y distribuir contenido web. Por esta razón, la caída afectó incluso a servicios que tenían sus datos en otras regiones, ya que dependían de esta infraestructura central para funcionar. Aplicaciones clave como Snapchat, Reddit, Hulu, PlayStation, Venmo, Robinhood y Coinbase experimentaron interrupciones, y en España, usuarios de plataformas bancarias y servicios de telecomunicaciones también reportaron problemas de acceso.
La Interrupción por Configuración en Azure
Nueve días después, Microsoft confirmó que un cambio de configuración erróneo en su servicio Azure Front Door había generado una interrupción que afectó a usuarios y empresas en múltiples regiones durante más de ocho horas. Azure Front Door actúa como la puerta de entrada para las aplicaciones alojadas en la nube de Microsoft: gestiona las conexiones seguras, dirige el tráfico web global y verifica las peticiones.
Cuando este sistema falló, los usuarios no pudieron iniciar sesión ni acceder a las aplicaciones que dependían de él. Se reportaron problemas para acceder a portales clave. Al igual que con AWS, los servicios que dependen de Azure para autenticación y balanceo de tráfico quedaron afectados en Europa, incluyendo España.
Vulnerabilidad Estructural y Concentración de Mercado
Ambos incidentes subrayan la fragilidad inherente a la arquitectura cloud actual. Los servicios, distribuidos globalmente, a menudo dependen de un número limitado de infraestructuras centralizadas. Un fallo en uno de estos nodos críticos desata una reacción en cadena que impacta sistemas aparentemente independientes. Esta vulnerabilidad estructural se ve amplificada por la concentración del mercado. Con AWS manteniendo un 37% de la cuota global, Azure un 23% y Google Cloud un 10%, un problema en cualquiera de ellos tiene consecuencias desproporcionadas a nivel mundial.
Para mitigar riesgos, los proveedores de servicios cloud deben implementar procesos de validación más rigurosos antes de desplegar cambios en producción, junto con mecanismos de rollback automatizados y ventanas de validación más amplias para configuraciones críticas. Por su parte, los operadores de servicios esenciales necesitan diversificar proveedores, mantener planes de contingencia actualizados y utilizar sistemas de monitorización independientes que no dependan de la infraestructura del proveedor cloud.