Збій AWS порушив роботу Amazon, Coinbase та низки великих сайтів

Технічний збій Amazon Web Services (AWS) порушив роботу Amazon, Coinbase, Robinhood і низки торгових, ігрових і стрімінгових сервісів, що використовують AWS як ключову інфраструктуру.
Основна хвиля повідомлень про збої припала на регіон US-East-1 (77%), менша частка — на US-West-1 (13%) і US-West-2 (10%). Користувачі офіційного сайту Amazon найчастіше скаржилися на збої мобільного додатку (53% звернень), помилки головної сторінки (26%) і проблеми з кошиком (22%).
Про проблеми, пов'язані зі збоєм AWS, повідомили кілька інших великих сервісів. Криптовалютна біржа Coinbase, Robinhood і ШІ-шукач Perplexity відзначили погіршення продуктивності. Піки скарг фіксувалися в онлайн-іграх Roblox і Fortnite, а також в месенджері Slack. Збільшення кількості помилок спостерігалося в пристроях і сервісах Amazon, включаючи Alexa і Ring.
Про проблеми, пов'язані зі збоєм AWS, повідомили кілька інших великих сервісів. Криптовалютна біржа Coinbase, Robinhood і ШІ-шукач Perplexity відзначили погіршення продуктивності. Піки скарг фіксувалися в онлайн-іграх Roblox і Fortnite, а також в месенджері Slack. Збільшення кількості помилок спостерігалося в пристроях і сервісах Amazon, включаючи Alexa і Ring.
У соціальних мережах і коментарях на платформах користувачі описували конкретні наслідки: частина студентів не змогла зайти в систему Canvas, водії стикалися з проблемами входу в Amazon Relay, відзначалися можливі затримки оновлення статусу доставки посилок. Обговорювалася також доступність змін в Amazon Flex.
Інженери Amazon повідомили про підвищені показники помилок і затримок в регіоні US-EAST-1 (Північна Вірджинія), вказавши, що команди «працюють за декількома паралельними напрямками, щоб прискорити відновлення». Компанія заявила, що з'ясовує причини і веде роботи по повному відновленню сервісів.
Інженери Amazon повідомили про підвищені показники помилок і затримок в регіоні US-EAST-1 (Північна Вірджинія), вказавши, що команди «працюють за декількома паралельними напрямками, щоб прискорити відновлення». Компанія заявила, що з'ясовує причини і веде роботи по повному відновленню сервісів.
AWS надає послуги зберігання і обчислень, включаючи Amazon S3 і EC2, і контролює близько третини світового хмарного ринку. Компанії, що залежать від AWS, попередили клієнтів, що функції на зразок відстеження посилок і управління «розумним будинком» можуть залишатися обмеженими до повної нормалізації систем.
Деякі постраждалі компанії, включаючи Amazon, все частіше використовують кодування і генерацію коду за допомогою штучного інтелекту для розробки власних продуктів. Хоча це прискорює розробку, при слабкому контролі воно також може привести до появи непомітних помилок, таких як сьогоднішня, а також до зупинки роботи при масовому відключенні хмарних сервісів.
Для зниження серйозності наслідків подібних інцидентів у майбутньому експерти рекомендують проектувати системи з урахуванням регіональної ізоляції: використовувати сервери мінімум у двох регіонах AWS, тримати бази даних з крос-регіональними репліками і виносити критичні залежності (аутентифікація, DNS, черги) у зовнішні/резервні контури.
Для зниження серйозності наслідків подібних інцидентів у майбутньому експерти рекомендують проектувати системи з урахуванням регіональної ізоляції: використовувати сервери мінімум у двох регіонах AWS, тримати бази даних з крос-регіональними репліками і виносити критичні залежності (аутентифікація, DNS, черги) у зовнішні/резервні контури.