Самое интересное в обзорах

Структура ЦОД теперь строится на готовых модулях, как считают в Nvidia, которые содержат всё необходимое для эффективного масштабирования вычислительных мощностей с учётом постоянного роста сложности решаемых задач. Клиенты могут сочетать готовые модули ЦОД с учётом специфики своей деятельности. Например, в одной стойке Vera Rubin NVL72 находятся 72 графических процессора Rubin и 36 центральных процессоров Vera, соединённых скоростной шиной NVLink 6 и сетевыми контроллерами ConnectX-9 SuperNIC, а также специализированные процессоры BlueField-4, которые разгружают центральные процессоры от задач работы с сетевым трафиком. По сравнению с решениями поколения Blackwell новые системы Vera Rubin справляются с обучением сложных моделей силами в четыре раза меньшего количества GPU. Пропускная способность в пересчёте на ватт потребляемой энергии в задачах инференса у Vera Rubin до десяти раз выше, а затраты на один токен в десять раз ниже. В кластерах стойки NVL72 масштабируются при помощи Quantum-X800 InfiniBand и Spectrum-X Ethernet.

Центральные процессоры Vera, по словам представителей Nvidia, хорошо себя проявляют в задачах обучения с подкреплением и агентских ИИ-нагрузках. Компания может объединять в одной стойке до 256 таких процессоров, оснащённых системой жидкостного охлаждения. С прочими компонентами кластера они могут сообщаться при помощи сетевых решений Spectrum-X. По сравнению с некими традиционными CPU, на которые ссылается Nvidia, её процессоры Vera могут справляться с ИИ-задачами на 50 % быстрее.

Специализированные чипы Groq 3 LPX обеспечивают эффективную работу с агентскими ИИ-нагрузками при минимальных задержках. В сочетании с другими чипами, входящими в состав платформы Vera Rubin, они обеспечивают увеличение пропускной способности в задачах инференса до 35 раз на один мегаватт потребляемой мощности, а потенциал выручки при использовании моделей с триллионом параметров увеличивается в десять раз. В состав одной стойки входит 256 чипов LPU, 128 Гбайт интегрированной на них памяти SRAM, а пропускная способность достигает 640 Тбайт/с. В сочетании с прочими компонентами платформы Vera Rubin, чипы LPU достигают максимальной эффективности как по быстродействию, так и по энергопотреблению, а также использованию ресурсов памяти. Стойки LPX будут доступны клиентам Nvidia со второй половины текущего года.

Стойка BlueField-4 STX специализируется на унификации адресного пространства GPU между элементами кластера. Обработка хранимой в кеше информации в операциях инференса ускоряется до пяти раз, при этом обеспечивается высокая энергоэффективность по сравнению с системами на классической архитектуре. Достигается общий для кластера контекст, обеспечивающий быстрое взаимодействие с ИИ-агентами и более эффективно масштабируемыми ИИ-сервисами.

Отдельная стойка Spectrum-6 SPX отвечает за скоростной обмен данными по интерфейсу Ethernet. Она может содержать не только коммутаторы Spectrum-X Ethernet, но и коммутаторы Nvidia Quantum-X800 InfiniBand в зависимости от потребностей конкретной конфигурации. В исполнении с кремниевой фотоникой и интеграцией на уровне упаковки чипов эффективность передачи информации возрастает в пять раз, а надёжность по сравнению с традиционными подключаемыми решениями увеличивается в десять раз.

Источник:

Теги: nvidia, vera rubin, groq, ии
nvidia, vera rubin, groq, ии

Soft
Hard
Тренды 🔥
Mozilla запустила разработку платформы cq — своего рода Stack Overflow для ИИ-агентов 27 мин.
Американский судья усмотрела в действиях Пентагона желание наказать Anthropic за её позицию 2 ч.
ChatGPT научился давать прогноз погоды на срок до 10 дней с помощью AccuWeather 3 ч.
Апскейлер PSSR 2 для PlayStation 5 имеет общие корни с технологией масштабирования AMD FSR, но использует иную реализацию 3 ч.
Вышла macOS Tahoe 26.4 с компактной панелью вкладок Safari, лимитами заряда батареи и другими нововведениями 4 ч.
Apple объединит управление устройствами и бизнес-инструменты в одной платформе — Apple Business 5 ч.
ФАС не будет штрафовать за рекламу в Telegram и YouTube до конца 2026 года 5 ч.
Разработчик «Мира танков» и «Мира кораблей» задолжал государству более 11 миллиардов рублей 6 ч.
Конец эпохи: Xiaomi отправила на пенсию MIUI — оболочку, которая прославила компанию 7 ч.
Минцифры хочет фильтровать весь трафик Рунета — средства блокировки разгонят в 2,5 раза к 2030 году 7 ч.
Arm представила процессоры Arm AGI для ИИ, став конкурентом собственным клиентам 16 мин.
Пациент с Neuralink заиграл в World of Warcraft силой мысли 28 мин.
В iFixit разобрали Samsung Galaxy S26 Ultra: аккумулятор заменить легко, а камеры и экран — нет 34 мин.
BYD второй месяц подряд обошла Tesla по продажам в Европе — отрыв увеличился 2 ч.
NextEra построит газовые электростанции на 10 ГВт для ИИ ЦОД в США 3 ч.
В России начались продажи планшета Honor Pad X8b с ёмкой батареей и большим экраном по цене от 16 тыс. рублей 3 ч.
Через два года США первыми в истории запустят корабль с ядерным двигателем за пределы земной орбиты — к Марсу 3 ч.
Microsoft получит 700 МВт в ИИ ЦОД Crusoe, от которых отказались Oracle и OpenAI 3 ч.
Amazon поглотила стартап Fauna — он выпустил домашнего робота размером с ребёнка 3 ч.
Гагарин получил 512 ИИ-ускорителей B300 — Eleveight AI развернула чипы NVIDIA в 2-МВт ЦОД в Армении 3 ч.