Pondělní ráno se neslo ve znamení rozsáhlého výpadku cloudových služeb Amazon Web Services (AWS). Problém s DNS u databáze DynamoDB v klíčovém regionu US-EAST-1 způsobil nedostupnost mnoha populárních webů a aplikací po celém světě.
Anatomie cloudového kolapsu
Velká část internetu zažila v pondělí 20. října perné chvíle. Masivní výpadek postihl infrastrukturu Amazon Web Services (AWS), konkrétně její nejvytíženější region US-EAST-1 v Severní Virginii. Problémy začaly již brzy ráno východoamerického času (dopoledne v Evropě) a projevovaly se zvýšenou chybovostí a latencí u mnoha služeb.
Jako hlavní příčina byl identifikován problém s překladem DNS adres u regionálních koncových bodů služby DynamoDB. Jde o klíčovou databázi, kterou využívá nespočet klientů AWS. Ačkoliv se Amazonu podařilo samotný DNS problém relativně rychle zmírnit, spustil tím kaskádu následných potíží.
Nejvýrazněji se problémy projevily u služby EC2, která zajišťuje virtuální servery. Výpadek DynamoDB způsobil potíže se spouštěním nových EC2 instancí, což dále ochromilo služby, které na EC2 spoléhají. Amazon musel dokonce přistoupit k omezování počtu nových spouštěných instancí, aby umožnil obnovu systému.
Dopad na uživatele byl okamžitý a plošný. Nefungovaly nebo byly extrémně pomalé populární aplikace jako Venmo, Snapchat, Canva, Lyft nebo hry jako Fortnite a Roblox. Problémy hlásily i banky, aerolinky, streamovací služby jako Disney+ a Apple Music, nebo zpravodajské weby. Výpadek zasáhl dokonce i vlastní služby Amazonu, včetně asistentky Alexa a zákaznické podpory.
Obrázek: unsplash.com
Zdroj: engadget.com


