Самое интересное в обзорах

Стойка Groq 3 LPX включает 256 чипов Groq 3 LPU. Такая система располагает 128 Гбайт SRAM. Её суммарная пропускная способность достигает 40 Пбайт/с. Для объединения чипов внутри стойки предусмотрен выделенный интерфейс внутрисистемного масштабирования. Его пропускная способность составляет 640 Тбайт/с на стойку.

Вице-президент Nvidia по гипермасштабируемым решениям Иэн Бак (Ian Buck) назвал Groq LPX сопроцессором для Rubin. По его словам, он повысит производительность декодирования «на каждом слое ИИ-модели на каждом токене». Nvidia связывает это решение со следующим рубежом ИИ — мультиагентными системами. Речь идёт о сценариях, где нужно обеспечивать интерактивную работу при инференсе моделей с триллионами параметров и окнами контекста в миллионы токенов.

Когда ИИ-агенты всё чаще обмениваются данными друг с другом, а не с человеком в окне чат-бота, меняется и порог приемлемого отклика. Скорость, достаточная для человека, оказывается слишком низкой для ИИ-агента. Бак описывает переход от мира, где разумным считался уровень 100 токенов в секунду, к уровню 1 500 токенов в секунду и выше для межагентного обмена.

Добавление Groq 3 LPU должно усилить позиции Rubin в сегменте низколатентного инференса. В тексте в качестве конкурента названа Cerebras. Компания использует процессоры Wafer-Scale Engine (WSE), выполненные на целой кремниевой пластине, где большие объёмы SRAM объединены с вычислениями для низколатентного инференса на продвинутых моделях. OpenAI также привлекала мощности Cerebras для обслуживания части передовых моделей из-за выгодных характеристик задержки этой платформы.

Иэн Бак также допустил, что появление Groq 3 LPU может сократить роль ускорителя инференса Rubin CPX. Он сказал, что сейчас Nvidia сосредоточена на интеграции стойки Groq 3 LPX с Rubin. Дополнительных подробностей он не привёл. При этом оба чипа рассчитаны на сходное усиление инференса, но Groq LPU не требует большого объёма памяти GDDR7, который нужен каждому модулю Rubin CPX.

Источники:

Теги: nvidia, ии, искусственный интеллект, groq, rubin
nvidia, ии, искусственный интеллект, groq, rubin

Soft
Hard
Тренды 🔥
Microsoft запустила ИИ-рестайлинг фотографий — и это не Copilot 2 ч.
YouTube завалил некоторых пользователей проверками CAPTCHA перед просмотром видео 4 ч.
Q-Day ближе, чем все думали: Google резко приблизила сроки взлома почти всей современной криптографии 4 ч.
В России арестовали администратора одной из крупнейших хакерских площадок LeakBase 4 ч.
Разработчик «Мира танков» решил проблему с долгом государству на 11 миллиардов рублей — исполнительное производство прекращено 4 ч.
Nvidia выпустила драйвер-заплатку для исправления подтормаживаний в Arknights: Endfield 5 ч.
Древний ужас пробуждается в геймплейном трейлере Cthulhu: The Cosmic Abyss — детективного хоррора по мотивам творчества Лавкрафта 5 ч.
Google выпустила ИИ-модель Lyria 3 Pro для генерации трёхминутных музыкальных треков — но не бесплатно 6 ч.
Надёжный инсайдер раскрыл главную игру апрельской линейки PS Plus за неделю до официального анонса 7 ч.
«Яндекс» и UserGate представили совместное решение для киберзащиты по принципу сетевого доверия 7 ч.
Новая статья: Система жидкостного охлаждения ID-Cooling FX360 LCD: кому котиков? Недорого 3 ч.
MaxSun представила свои варианты Arc Pro B70 — с активным и пассивным охлаждением 6 ч.
Google поведёт квантовые компьютеры по гибридному пути: к сверхпроводящим кубитам добавят нейтральные атомы 6 ч.
ASRock представила юбилейную матплату Z890 Taichi 10th Anniversary с обновлённым дизайном 7 ч.
Dell представила обновлённые ноутбуки серии Pro — они стали тоньше и получили свежие чипы Intel и AMD 8 ч.
Intel выпустила Xeon 600 с 12–86 ядрами для рабочих станций и Core Ultra 300 vPro для бизнес-ноутбуков 9 ч.
Samsung представила смартфоны Galaxy A37 и A57 с чипами Exynos и улучшенной защитой от влаги по цене $450–550 9 ч.
Intel выпустила «Больших боевых магов» — видеокарты Arc Pro B70 и B65 с 32 Гбайт GDDR6 для профессионалов 9 ч.
MSI представила блоки питания со встроенным зуммером — он громко предупредит об угрозе расплавления видеокарты 10 ч.
Австралия решила надавить на ИИ ЦОД, частично отказавшись от рыночного подхода 10 ч.