Amazon сообщила о сбое в работе своего облачного региона Amazon Web Services в Бахрейне — проблемы возникли из-за вооружённого конфликта на Ближнем Востоке, у компании это уже второй инцидент за месяц.
Источник изображения: Woliul Hasan / unsplash.com
Сбои в работе облачной инфраструктуры вызваны активностью БПЛА в этом районе, сообщил представитель Amazon агентству Reuters; по состоянию на вечер 23 марта AWS не обновляла соответствующую страницу состояния. В компании также не прокомментировали, что стало причиной неполадок: прямая атака на инфраструктуру компании или удары вблизи неё. Сейчас Amazon помогает клиентам перевести их ресурсы в другие региона на время восстановления основных мощностей здесь; масштабы ущерба и предполагаемая продолжительность неполадок не уточняются. «По мере развития ситуации и, как мы предупреждали ранее, просим владельцев рабочих нагрузок в пострадавших регионах продолжать миграцию в другие регионы», — говорится в заявлении компании.
AWS — облачное подразделение Amazon и основной источник прибыли компании; на этой платформе работает множество известных сайтов и ресурсов государственных учреждений. Ранее AWS сообщала о сбое в облачных регионах Бахрейне и ОАЭ в результате отключения электроснабжения, возникшем из-за ближневосточного конфликта, — тогда компания сообщила, что восстанавливает работу инфраструктуры, в том числе оказывая помощь в переносе клиентских ресурсов в другие регионы. По итогам первого инцидента в Amazon предупредили, что восстановление может затянуться из-за структурных повреждений; «а в некоторых случаях потребовалось проведение мероприятий по тушению пожара, что привело к дополнительному ущербу от воды», отметили в компании.
Опасения некоторых инвесторов относительно назревания классического «пузыря» в сфере искусственного интеллекта то и дело разбиваются заявлениями о новых крупных сделках, демонстрирующих заинтересованность участников рынка в развитии профильной вычислительной инфраструктуры. Amazon до конца следующего года планирует закупить у Nvidia более 1 млн различных чипов для своей облачной инфраструктуры.
Источник изображения: Nvidia
Об этом сообщило агентство Reuters со ссылкой на официальное заявление обеих компаний. Финансовая сторона сделки не раскрывается, но Amazon достаточно охотно говорит о том, какие именно чипы Nvidia понадобятся облачному подразделению компании AWS. Помимо 1 млн графических процессоров для ускорения работы систем ИИ, американский облачный гигант закупит у Nvidia полный спектр сопутствующих решений, представленных на этой неделе. По крайней мере, сетевые коммутаторы Spectrum и новые чипы Groq (LPU) для работы с инференсом этому клиенту Nvidia тоже понадобятся в больших количествах. Поставки начнутся в этом году и продолжатся до конца следующего, как минимум.
Йен Бак (Ian Buck), вице-президент Nvidia по продуктам для гиперскейлеров и высокопроизводительным вычислениям, заявил следующее: «Инференс — это сложно, невероятно сложно. Чтобы быть лучшим в инференсе, требуется не один чип. Мы в действительности используем все семь чипов». В рамках указанной сделки Nvidia также поставит сетевое оборудование серий Connect X и Spectrum X в центры обработки данных AWS. Это особенно важно, поскольку исторически AWS использовала разработанные на заказ сетевые решения, а потому интеграция компонентов Nvidia потребует аналогичного индивидуального подхода.
Microsoft рассматривает возможность судебного иска против OpenAI и Amazon по поводу их сделки на $50 млрд, которая может нарушить её эксклюзивное облачное партнёрство с OpenAI. В прошлом месяце Amazon и OpenAI подписали несколько соглашений, одно из них делает Amazon Web Services (AWS) эксклюзивным сторонним поставщиком облачных услуг для Frontier, корпоративной платформы OpenAI для создания и запуска ИИ-агентов.
Источник изображения: unsplash.com
Предмет потенциального иска — может ли OpenAI предлагать Frontier через AWS, не нарушая партнёрское соглашение с Microsoft, которое требует, чтобы модели стартапа были доступны через облачную платформу Microsoft Azure. По сообщениям Financial Times, руководство Microsoft считает такой подход нецелесообразным и нарушающим дух, если не букву, их соглашения. В данный момент, в преддверии запуска Frontier, компании пытаются урегулировать спор без обращения в суд.
«Мы знаем наш контракт, — заявил представитель Microsoft. — Мы подадим на них в суд, если они его нарушат. Если Amazon и OpenAI хотят рискнуть, полагаясь на креативность своих юристов по контрактам, я бы поддержал нас, а не их». Хотя в заявлении Microsoft ставилась задача обозначить ограничения на совместную работу Amazon и OpenAI, в нем также сказано, что Microsoft «с нетерпением ждёт», что они создадут вместе, и что Frontier продолжит размещаться на Azure.
Microsoft стала одним из первых инвесторов OpenAI, вложив в компанию $1 млрд в 2019 году и $10 млрд в начале 2023 года. В сентябре прошлого года обе компании подписали необязывающее соглашение о новых условиях сотрудничества, что открыло OpenAI путь к заключению сделок с SoftBank, Nvidia и Amazon.
В совместном заявлении, опубликованном в прошлом месяце, Microsoft и OpenAI заявляли, что Microsoft сохраняет свою «исключительную лицензию и доступ к интеллектуальной собственности в отношении моделей и продуктов OpenAI», и что Azure остаётся эксклюзивным облачным провайдером для моделей OpenAI.
Очевидно, рассуждения основателя Nvidia о способности компании выручить в сегменте ИИ до $1 трлн за два или три года не оставляют равнодушными других участников рынка, поэтому глава Amazon Энди Джесси (Andy Jassy) на собрании сотрудников компании также обнародовал свой прогноз. Через 10 лет, по его мнению, подразделение AWS сможет получать до $600 млрд выручки ежегодно.
Источник изображения: AWS
Что характерно, как поясняет Reuters, данная сумма в два раза превышает прежнюю версию прогноза главы Amazon. Ещё недавно он считал, что AWS будет к 2036 году ежегодно получать выручку в размере $300 млрд, но теперь полагает уместным ориентироваться на удвоенное значение — $600 млрд. Как признался подчинённым генеральный директор Amazon, удвоить сумму в прогнозе ему позволяет «то, что сейчас происходит в сфере искусственного интеллекта».
Для сравнения: в прошлом году облачный бизнес AWS принёс $128,7 млрд выручки — она выросла на 19 % по сравнению с 2024 годом. Чтобы оправдать прогнозы Джесси, выручка AWS в ближайшие десять лет должна в среднем увеличиваться на 17 % в год. Структура выручки в прогнозе главы Amazon не детализировалась. В этом году компания готова направить $200 млрд на строительство новых вычислительных центров; после соответствующих заявлений курс акций Amazon снизился, поскольку инвесторы испугались роста расходов. Энди Джесси убеждён, что ИИ даёт компаниям возможность строить очень крупный бизнес, и Amazon сейчас получает очень чёткие и заметные сигналы в части спроса на соответствующую инфраструктуру, поэтому резкое увеличение капитальных затрат на её создание глава компании считает оправданным и целесообразным. Как пояснил глава Amazon, компания должна вкладывать деньги в элементы инфраструктуры за два года до того, как она начнёт приносить доход, поэтому сейчас необходимо действовать решительно.
Ещё одним важным рубежом Amazon считает осуществление миллионной доставки товаров дронами, которая должна состояться в этом году. Эксперименты в этой сфере торговая площадка ведёт с 2013 года; сейчас клиентам в отдельных регионах предлагается услуга доставки небольших заказов в течение 30 минут с использованием беспилотных летательных аппаратов. В январе Amazon пришлось объявить о закрытии сети бакалейных магазинов Fresh and Go, поскольку они обеспечивали менее 1 % выручки в общей системе розницы.
Предназначенный для написания программного кода агент с искусственным интеллектом Amazon Kiro устроил масштабный сбой в облачной инфраструктуре AWS, решив прибегнуть к радикальному методу исправления работы сервиса — удалить весь код полностью и переписать его, передаёт Financial Times. В Amazon такую интерпретацию инцидента отвергли.
Источник изображения: Woliul Hasan / unsplash.com
Подразделение облачных веб-сервисов Amazon (AWS) сталкивалось с перебоями в работе из-за ошибок, допущенных службой ИИ Kiro, сообщили источники издания. Один из крупных сбоев произошёл в середине декабря, когда сотрудники компании открыли Kiro доступ к изменениям в коде систем — способный действовать в автономном режиме ИИ-агент принял решение «удалить и создать окружение заново». Разбираться с последствиями этого решения пришлось 13 часов.
«За последние месяцы мы уже наблюдали минимум два сбоя в работе производственных систем», — признался один из осведомленных источников в компании. Вину на происходящее он возложил на ИИ-агента, который должен был решить проблему без участия человека. «Сбои были незначительными, но вполне предсказуемыми», — сообщил источник. Согласно официальной позиции Amazon, сбои были вызваны действиями человека, а не ИИ. По умолчанию Kiro перед выполнением каких-либо действий запрашивает авторизацию, подчеркнули в компании, но у связанного с декабрьским инцидентом разработчика оказались более широкие права доступа, чем ожидалось.
Amazon намерена и далее расширять возможности ИИ-агента, чтобы преодолеть рамки вайб-кодинга — схемы работы, при которой ИИ генерирует код по описанию пользователя. В предыдущем сбое был замешан Amazon Q Developer — помощник в генерации кода, добавили источники Financial Times.
Компания Amazon в лице своего подразделения AWS и раньше была одним из крупнейших игроков рынка облачных услуг, а в эпоху бума ИИ начала активно обслуживать интересы многих разработчиков профильных систем. Поскольку спрос на услуги такого характера и не думает снижаться, капитальные затраты Amazon в этом году вырастут на 54 % до $200 млрд.
Источник изображения: Amazon
Деньги будут направлены, по словам генерального директора Энди Джесси (Andy Jassy), главным образом именно на развитие инфраструктуры AWS, и в основном на её связанную с ИИ часть. Глава компании назвал это решение «экстраординарно необычайной возможностью навсегда изменить размер AWS и Amazon в целом». Компания готова агрессивно вкладывать средства, чтобы стать лидером рынка, по его словам.
Столь серьёзное увеличение затрат неизбежно скажется на прибыли компании. Если аналитики рассчитывали на получение Amazon операционной прибыли в размере $22,2 млрд по итогам текущего квартала, то руководство компании призвало рассчитывать на диапазон от $16,5 до $21,5 млрд. После закрытия торгов в США акции Amazon на этом фоне успели снизиться в цене на 10 %. Всего с начала года они снизились на 3,5 %. Конкурирующие Microsoft и Alphabet (Google) также сообщили, что будут вынуждены увеличить капитальные затраты в этом году. Инвесторы опасаются, что расходы облачных гигантов растут быстрее прибыли.
С другой стороны, выручка AWS в прошлом квартале выросла на 24 % до $35,6 млрд, что стало максимальным приростом более чем за три года. Операционная прибыль на облачном направлении составила $12,5 млрд. Часть капитальных расходов Amazon будет направлена на развитие космической группировки спутников связи Kuiper, расширение розничной сети продуктовых магазинов и внедрение роботов в логистической сфере. В любом случае, основная часть капитальных затрат будет связана именно с развитием инфраструктуры ИИ.
В прошлом квартале AWS располагала заказами на сумму $244 млрд, что на 40 % выше прошлогоднего результата и на 22 % выше в последовательном сравнении. Общая выручка Amazon в прошлом квартале выросла на 14 % до $213,4 млрд, операционная прибыль составила $25 млрд. Если учесть, что в сфере интернет-торговли выручка Amazon выросла на 10 % до $83 млрд, то основную часть доходов она получает именно от интернет-магазина. Реклама в высокий для подобного бизнеса сезон обеспечила рост профильной выручки на 23 % до $21,3 млрд. Компании пришлось сократить 16 000 сотрудников в прошлом месяце. В совокупности с предыдущими мероприятиями такого рода работы лишились около 30 000 человек. Без учёта этих сокращений численность штата Amazon составляла около 1,58 млн человек по состоянию на 31 декабря прошлого года.
Поскольку сама Arm недавно заявила о поддержке интерфейса NVLink Fusion в своих процессорных архитектурах, её клиентам сделать это рано или поздно тоже бы пришлось. Облачный гигант Amazon (AWS) начал декабрь заявления о намерениях реализовать поддержку интерфейса Nvidia в своих будущих ускорителях семейства Trainium4.
Источник изображения: AWS
Сроки выхода этих ускорителей при этом названы не были, как отмечает Reuters. Анонс был сделан на недельной конференции по облачным вычислениям в Лас-Вегасе, которая собрала около 60 000 посетителей. Непосредственно среди разработчиков чипов поддержку NVLink Fusion ранее анонсировали компании Intel, Samsung и Qualcomm, теперь к ним присоединилась и AWS.
По замыслу последней, технология Nvidia поможет компании создавать более эффективные вычислительные кластеры, в которых серверы быстрее обмениваются информацией друг с другом. Прежде чем появятся ускорители Trainium4, компания AWS наполнит рынок серверами на основе ускорителей Trainium3, распространение которых уже начала. Данные системы содержат 144 чипов и в четыре раза превосходят по быстродействию своих предшественников, при этом потребляя на 40 % меньше электроэнергии. Представители AWS рассчитывают конкурировать с другими участниками рынка, включая Nvidia, благодаря более выгодному сочетанию цены и быстродействия своих решений.
В программной сфере AWS представила ИИ-модель Nova 2, которая получила возможность комбинировать в ответах на запросы текстовую и визуальную информацию, а также генерировать речевые сообщения. Модель Sonic специализируется на речевом обмене информации, причём делает это вполне естественно, по словам разработчиков. AWS помогает клиентам создавать собственные ИИ-модели, для этого был представлен сервис Nova Forge, который предоставляет инструменты для обучения более специализированных моделей.
Высочайшая активность OpenAI и её ближайших партнёров в сфере привлечения средств к развитию инфраструктуры ИИ в США хоть и вызывает у некоторых аналитиков не совсем лестные ассоциации с пьяными матросами, неуклонно охватывает всё новые направления. Недавно глава компании Сэм Альтман (Sam Altman) заявил, что готов продавать доступ к облачным мощностям напрямую.
Источник изображения: OpenAI
Объясняя попытки OpenAI лоббировать свои интересы в США на высшем политическом уровне, Сэм Альтман подчеркнул, что компания не рассчитывает на финансовую помощь со стороны правительства страны в случае своего банкротства, но при этом хотела бы получить некоторые налоговые преференции при строительстве центров обработки данных, а также гарантии по кредитам под строительство предприятий по производству чипов.
Со страниц социальной сети X генеральный директор OpenAI также сообщил следующее: «Мы также ищем пути продавать вычислительные мощности напрямую другим компаниям (и людям); мы уверены, что миру потребуется много ИИ-облаков, и мы очень взволнованы возможностью предложить это». По сути, OpenAI не скрывает намерений стать своего рода провайдером облачных услуг. Это сделает её конкурентом AWS (Amazon), Microsoft Azure и Google Cloud.
Финансовый директор компании Сара Фрайар (Sarah Friar) ещё в сентябре намекнула, что облачные провайдеры буквально «учатся за счёт» OpenAI, и она не намерена уступать специфические компетенции в этой сфере конкурентам. Если учесть, что за восемь лет OpenAI собирается привлечь около $1,4 трлн на строительство центров обработки данных в США, то превращение в облачного провайдера как раз снабдило бы её стабильным источником дохода, позволяя рассчитываться с инвесторами и кредиторами.
Если Google, Amazon и Microsoft предоставляют облачные услуги сторонним компаниям, то Meta✴✴ Platforms вкладывается в развитие инфраструктуры для собственных нужд, и динамика акций компании показывает, что инвесторов начало беспокоить отсутствие у неё бизнес-плана по заработку на этой инфраструктуре в дополнение к уже существующим направлениям деятельности. Возможно, опыт Meta✴✴ в этом смысле будет использован OpenAI для построения собственной стратегии развития бизнеса.
Владельцы умных матрасов Eight Sleep буквально потеряли сон из-за масштабного сбоя серверов AWS. Оказалось, что локальное управление во многих моделях было просто не предусмотрено, из-за чего умные матрасы зависали в режиме охлаждения, нагрева и неудобного наклона. Также выяснилось, что матрасы отсылают производителю просто неприличное количество телеметрии и данных о своих пользователях. Eight Sleep поклялась добавить матрасам возможность работы офлайн.
Источник изображения: Eight Sleep
Умные матрасы были впервые представлены компанией Eight Sleep в 2019 году, а их последнее поколение — в мае этого года. Рекламный проспект обещает всё: от отдыха в невесомости и настройки положения тела в постели до полного климат-контроля и встроенных динамиков, и даже возможности пробуждения «мягкой вибрацией». Комплект для сна Mac Daddy за $3000 был одобрен Марком Цукербергом (Mark Zuckerberg), Илоном Маском (Elon Musk) и другими известными руководителями, спортсменами и знаменитостями.
Как выяснилось, умные матрасы Eight Sleep, цена которых начинается от $2000 в зависимости от модели и размера, плюс ежемесячная подписка стоимостью $200, целиком и полностью зависят от подключения к облаку. Для управления настройками температуры и высоты через приложение Eight Sleep требуется активное подключение к интернету, и ранее оно не предоставляло возможности настраивать функции в автономном режиме.
«Сбой в работе AWS — напоминание о том, что планирование непрерывности бизнеса — это не просто вопрос выбора, — считает вице-президент компании Spin.AI Сергей Балынский. — Организациям следует поддерживать независимые резервные копии и диверсифицировать свою деятельность, используя несколько облачных провайдеров, чтобы сбой в работе одной платформы не привёл к остановке работы».
Генеральный директор Eight Sleep извинился перед пользователями после того, как сбой в работе AWS вывел умные матрасы из строя. Вчера компания начала выпускать новый «режим отключения», чтобы решить эту проблему. Он позволяет управлять матрасом через Bluetooth, когда облачная инфраструктура недоступна. Примечательно, что до недавнего сбоя клиенты Eight Sleep уже несколько лет безрезультатно жаловались на отсутствие возможности управления офлайн.
Но все эти события послужили лишь прологом истории. Один из владельцев умного матраса после сбоя попытался разобраться в проблеме и обнаружил, что само приложение отправляет производителю невообразимое количество данных — 17,7 Гбайт в месяц. Другой пользователь проверил свою статистику и обнаружил, что его модель потребляет ещё больше — 28 Гбайт в месяц, или примерно 1 Гбайт в день. Можно с уверенностью утверждать, что подобные поведение демонстрируют умные матрас-шпионы и у других пользователей.
Источник изображения: X
Трудно даже представить, какие данные отправляют эти комплекты для сна своему производителю и как в дальнейшем они используются. По сути дела, Eight Sleep знает о владельцах своих умных матрасов всё — их склонности и интимные привычки, любимые позы для сна, характер храпа, содержание разговоров перед сном, распорядок дня и множество другой информации. Огромный вопрос, как компания распоряжается этими данными и какова может быть цена их утечки. А компании, возможно, стоит сменить название — вместо Eight Sleep («Восьмой сон») назваться Matress 007 («Матрас 007»).
На облачную инфраструктуру Amazon (AWS) завязана работа многих сервисов сторонних провайдеров, поэтому недавний масштабный сбой затронул функционирование тысяч сайтов, включая приложения типа Snapchat и Reddit. К вечеру понедельника работу инфраструктуры AWS, пострадавшую от сбоя, удалось восстановить, по словам представителей компании.
Источник изображения: AWS
При этом Amazon отмечает, что в работе некоторых сервисов сохраняются задержки, возникшие из-за накопившейся очереди на передачу информации в период, пока они не функционировали. Чтобы отложенные данные достигли своих получателей, потребуется ещё несколько часов. Сбой затронул работу инфраструктуры в разных странах мира. Пользователи на время утратили возможность оплачивать услуги и товары, бронировать билеты и общаться друг с другом через приложения для видеоконференцсвязи. В Великобритании перестали работать некоторые сервисы местных операторов связи и правительственные сайты. В США перестали работать облачные игровые сервисы и инфраструктура агрегаторов услуг такси. По некоторым оценкам, в результате сбоя пострадали не менее 4 млн человек и не менее тысячи компаний. Социальная сеть X, по заявлениям главы Signal Мередит Уиттэкер (Meredith Whittaker), тоже пострадала, но её владелец Илон Маск (Elon Musk) данную информацию опроверг.
По своим масштабам, как отмечает Reuters, данный сбой стал крупнейшим с прошлого года, когда история с CrowdStrike парализовала работу банков и аэропортов по всему миру и нарушила функционирование многих информационных сервисов. Это уже третий за последние пять лет случай участия вычислительного кластера AWS в штате Вирджиния в серьёзных инфраструктурных сбоях. Приложения из-за сбоя в системе DNS не могли найти необходимый сетевой адрес для обращения к облачным базам данным Amazon.
Причиной сбоя, как призналась AWS, стала некорректная работа подсистемы, отвечающей за мониторинг распределения сетевой нагрузки в серверной инфраструктуре компании. Уже к десяти часам вечера понедельника по GMT компания заявила, что все сервисы AWS вернулись к нормальному режиму работы. На отправку накопившихся в очереди данных потребовалось ещё несколько часов. Площадка в Вирджинии, на которой случился сбой, является старейшей и крупнейшей в облачной инфраструктуре AWS.
Amazon Web Services (AWS), крупнейший в мире провайдер облачных сервисов, в понедельник столкнулся с масштабным и продолжительным сбоем, который привёл к недоступности тысяч сайтов и приложений по всему миру — от Snapchat, Reddit и Duolingo до банков, торговых платформ и некоторых сервисов Amazon. Можно считать, что за сутки произошло два сбоя AWS — один утром, а другой ближе к вечеру.

Проблемы начались рано утром и фактически продолжаются уже более девяти часов. На пике количество жалоб на перебои превышало 9000 только в США, по данным Downdetector. К полудню часть сервисов удалось восстановить, однако AWS предупредила, что на отдельных сервисах сохраняются «повышенное число ошибок». В частности, сбои затронули облачные вычислительные системы EC2 и сервис Lambda — один из ключевых инструментов AWS для автоматизации бизнес-процессов. К вечеру число жалоб снова подскочило, а Amazon подтвердила наличие проблем, но позже отрапортовала об успехах в их устранении.
«Мы продолжаем работать над устранением сбоев при запуске новых экземпляров EC2. В регионе US-EAST-1 наблюдается увеличение числа запусков новых экземпляров EC2 и уменьшение числа проблем с сетевым подключением. Мы также отмечаем значительное улучшение ситуации с ошибками вызова Lambda, особенно при создании новых сред выполнения (в том числе для вызовов Lambda@Edge)», — говорится в последнем сообщении Amazon на странице статуса AWS.
Причиной сбоя AWS назвала внутренние проблемы с системой мониторинга сетевых балансировщиков нагрузки в регионе US-EAST-1 (Северная Вирджиния) — это крупнейшая и старейшая зона AWS, которая уже сталкивалась с похожими инцидентами в 2020 и 2021 годах.
В AWS подчёркивают, что признаков кибератаки не выявлено. Масштаб инцидента вновь поставил под вопрос устойчивость современной цифровой инфраструктуры. Эксперты отмечают, что всё больше компаний оказываются зависимы от услуг небольшого числа глобальных облачных провайдеров, и любой их сбой способен вызвать цепную реакцию по всему миру: от сбоев в банковских приложениях до недоступности доставки, игр и социальных сетей.
По оценкам Ookla, совокупно более 4 миллионов пользователей сообщили о проблемах. Среди пострадавших оказались сервисы Snap, Venmo, Perplexity, Coinbase, Robinhood, Uber, Lyft, а также популярные игры Fortnite и Clash Royale. В Британии сбой затронул банки Lloyds и Bank of Scotland, Vodafone, BT и даже сайт налоговой службы.
Облачный провайдер Amazon Web Services (AWS) в настоящее время испытывает серьезный сбой, который привел к отключению многих популярных онлайн-сервисов, включая Amazon, Alexa, Snapchat, Fortnite и другие. Страница проверки состояния AWS сообщает, что несколько служб «пострадали» и компания «исследует повышенную частоту ошибок и задержки для нескольких сервисов AWS в регионе US-EAST-1», хотя сбои также сказываются на работе интернет-сервисов не только в США, но и в других регионах по всему миру.
Источник изображения: AWS
Пользователи Reddit сообщают, что умный помощник Alexa перестал работать и не может отвечать на запросы или выполнять команды — даже такие функции, как заранее установленные будильники, не работают. Проблема AWS, по-видимому, также влияет на платформы, работающие в её облачной сети, включая Perplexity, Zoom, Airtable, Canva и приложение McDonalds. Также сообщается о проблемах в работе игровых серверов Roblox, Fortnite и Dead by Daylight, а некоторые пользователи также сообщают о проблемах со Steam и Epic Games. Причина сбоя не подтверждена, и неясно, когда будет восстановлено нормальное обслуживание.
«Perplexity сейчас не работает, — сказал генеральный директор Perplexity Аравинд Сринивас (Aravind Srinivas) на своей странице X. — Основная причина – проблема с AWS. Мы работаем над ее устранением».
Панель управления AWS впервые сообщила о проблемах, затронувших регион US-EAST-1, в 10:11 по московскому времени. «Мы активно занимаемся этим вопросом и работаем над устранением проблемы и выяснением ее первопричины. Мы предоставим обновленную информацию через 45 минут или раньше, если у нас появится дополнительная информация», — сообщила Amazon в обновлении, опубликованном в 10:51 утра.
Обновлено:
Amazon сообщила, что сбой был «полностью устранен» и что большинство сервисов возвращаются к нормальному режиму работы после нескольких часов, в течение которых немалая часть интернета не могла загружаться. Облачный гигант возложил вину за сбой на проблемы с DNS — систему, которая преобразует веб-адреса в IP-адреса. В то время как некоторые сбои могут быть устранены быстро, проблемы с DNS иногда требуют больше времени для решения.
Из-за высокого спроса платформа Amazon Web Services всего через несколько дней после запуска ввела ежедневные ограничения на работу с новой средой разработки (IDE) Kiro с поддержкой агентов искусственного интеллекта и завела список ожидания для её новых пользователей.
Источник изображения: kiro.dev
Развернув эти меры, AWS рассчитывает выиграть время, чтобы специалисты компании смогли масштабировать вспомогательную инфраструктуру и повысить производительность продукта — от первых пользователей Kiro стали поступать жалобы на недостаточно высокую его скорость. Пользователям, уже начавши работать с Kiro, рекомендовали не устанавливать программу на несколько машин — выводятся соответствующие предупреждения.
Amazon выпустила среду программирования Kiro всего неделю назад, и из-за чрезмерной популярности продукта мошенники уже начали запускать поддельные ресурсы с предложениями о скачивании приложения, пытаясь нажиться на доверчивых пользователях, которые ищут неограниченный доступ к сервису. Первоначально продукт предлагался в бесплатном варианте, а также версиях Pro и Pro+, но сейчас AWS удалила информацию о ценах, пообещав вернуть её в ближайшее время.
Ранее планировалось, что Kiro будет бесплатным для пользователей в течение ознакомительного периода, но стратегию пришлось скорректировать, когда популярность продукта превзошла ожидания. AWS также, возможно, добавит поддержку ИИ-моделей Anthropic Claude Sonnet 3.7 и 4.0, некоторые пользователи просили и об интеграции с Gemini 1.5 Pro.
Сфера искусственного интеллекта становится полем сражений для целых государств, и соперничающим в этом контексте США и Китаю становится всё сложнее обеспечивать комфортный режим работы для транснациональных корпораций. Вслед за IBM и Microsoft, о закрытии своей китайской лаборатории по разработке ИИ объявила и Amazon.
Источник изображения: AWS
О соответствующих шагах крупнейшего игрока рынка облачных вычислений сообщило на этой неделе издание Financial Times. Открытая в 2018 году лаборатория в Шанхае занималась исследованиями в сфере искусственного интеллекта, но теперь её деятельность приходится свернуть из-за обострившихся противоречий между США и КНР. Об этом сообщил на страницах социальной сети WeChat теперь уже бывший руководитель китайской лаборатории AWS Ван Миньцзе (Wang Minjie).
Возглавляемый им коллектив разработчиков за это время успел опубликовать более 100 научных работ и был в авангарде разработки нейронных сетей с открытым исходным кодом для систем, использующих графы для представления данных. Материнской компании Amazon это помогло сгенерировать выручку в размере почти $1 млрд.
Политические причины являются не единственным фактором, способствовавшим закрытию лаборатории AWS в Китае. Компания вынуждена сокращать персонал по всему миру. По иронии судьбы, более активное использование ИИ в операционной деятельности Amazon позволяет меньше полагаться на человеческий труд. Какое количество сотрудников AWS потеряло работу в Китае, оценить сложно. В пике их численность достигала 1000 человек, как отмечают осведомлённые источники. Местный персонал обеспечивал как работу инфраструктуры, используемой транснациональными корпорациями в Китае, так и систем AWS, работающих на нужды представительств китайских компаний за пределами страны. Меры экспортного контроля США затрудняют взаимодействие специалистов, находящихся в Китае, со своими зарубежными коллегами, а обмен опытом традиционно является залогом технического прогресса.
IBM в прошлом году сократила около 1000 китайских специалистов области исследований и разработок. Тогда же Microsoft пришлось переместить профильный персонал из Китая из-за ужесточения мер экспортного контроля со стороны США. В 2023 году материнская компания Amazon была вынуждена закрыть свой бизнес по продаже электронных книг в Китае, поскольку он не выдерживал конкуренции с местными игроками. Уйти с китайского рынка интернет-торговли Amazon пришлось ещё в 2019 году, поскольку местные гиганты просто её вытеснили.
Масштабы бизнеса так называемых «облачных гигантов» позволяют оправдывать созданные на заказ решения. Это касается не только вычислительных средств, но и сопутствующих систем. Так, столкнувшись с растущим тепловыделением ускорителей вычислений Nvidia, компания Amazon (AWS) решила оснастить их жидкостной системой охлаждения собственной разработки.
Источник изображения: AWS
По словам исполнительного вице-президента AWS Дейва Брауна (Dave Brown), на которого ссылается CNBC, готовые системы жидкостного охлаждения занимали бы слишком много драгоценного пространства в центрах обработки данных Amazon, а ещё их монтаж обещал растянуться на длительное время. Кроме того, серийные системы сторонних производителей не устраивали AWS по своим характеристикам и предполагали увеличенный расход воды, а потому компания решила создать свою.
Те системы охлаждения, которые будут исправно функционировать в небольших центрах обработки данных, для Amazon не всегда подходят, как пояснил представитель компании, поскольку они имеют ограниченную производительность. Amazon разработала модульные системы жидкостного охлаждения рядной компоновки, которые могут устанавливаться как в строящиеся центры обработки данных, так и в уже существующие. В частности, новая система охлаждения нашла применение в инстансах семейства P6e, которые содержат стойки GB200 NVL72 с соответствующим количеством ускорителей Nvidia новейшего поколения Blackwell. Компания Amazon остаётся крупнейшим провайдером облачных услуг, поэтому разработка собственных инженерных решений оправдывает себя в подобных случаях.