AWS-сбой нарушил работу Amazon, Coinbase и ряда крупных сайтов

Фото - AWS-сбой нарушил работу Amazon, Coinbase и ряда крупных сайтов
Технический сбой Amazon Web Services (AWS) нарушил работу Amazon, Coinbase, Robinhood и ряда торговых, игровых и стриминговых сервисов, использующих AWS как ключевую инфраструктуру.
Основная волна сообщений о сбоях пришлась на регион US-East-1 (77%), меньшая доля — на US-West-1 (13%) и US-West-2 (10%). Пользователи официального сайта Amazon чаще всего жаловались на сбои мобильного приложения (53% обращений), ошибки главной страницы (26%) и проблемы с корзиной (22%).

О проблемах, связанных со сбоем AWS, сообщили несколько других крупных сервисов. Криптовалютная биржа Coinbase, Robinhood и ИИ-поисковик Perplexity отметили ухудшение производительности. Пики жалоб фиксировались в онлайн-играх Roblox и Fortnite, а также в мессенджере Slack. Повышение числа ошибок наблюдалось в устройствах и сервисах Amazon, включая Alexa и Ring.
В соцсетях и комментариях на платформах пользователи описывали конкретные последствия: часть студентов не смогла зайти в систему Canvas, водители сталкивались с проблемами входа в Amazon Relay, отмечались возможные задержки обновления статуса доставки посылок. Обсуждалась также доступность смен в Amazon Flex.

Инженеры Amazon сообщили о повышенных показателях ошибок и задержках в регионе US-EAST-1 (Северная Вирджиния), указав, что команды «работают по нескольким параллельным направлениям, чтобы ускорить восстановление». Компания заявила, что выясняет причины и ведёт работы по полному восстановлению сервисов.

AWS предоставляет услуги хранения и вычислений, включая Amazon S3 и EC2, и контролирует около трети мирового облачного рынка. Компании, зависящие от AWS, предупредили клиентов, что функции вроде отслеживания посылок и управления «умным домом» могут оставаться ограниченными до полного нормализации систем.
Некоторые затронутые компании, включая Amazon, все чаще используют кодирование и генерацию кода с помощью искусственного интеллекта для разработки собственных продуктов. Хотя это ускоряет разработку, при слабом контроле оно также может привести к появлению незаметных ошибок, таких как сегодняшняя, а также остановке работы при массовом отключении облачных сервисов.

Для снижения серьезности последствий подобных инцидентов в будущем эксперты рекомендуют проектировать системы с учетом региональной изоляции: использовать сервера минимум в двух регионах AWS, держать базы данных с кросс-региональными репликами и выносить критические зависимости (аутентификация, DNS, очереди) во внешние/резервные контуры.