2025-02-10
—— от центров обработки данных до периферийных вычислений: анализ эволюции технологий оптической связи в контексте ИИ
Когда ChatGPT запускает глобальную гонку за моделями ИИ, а алгоритмы автономного вождения становятся все более совершенными, индустрия искусственного интеллекта сталкивается с небывалой жаждой вычислительной мощности. В этой гонке за вычислительной мощью один, казалось бы, малозаметный аппарат — высокоскоростной оптический модуль — становится ключевой технологией, определяющей скорость развития ИИ. За кулисами таких ведущих вычислительных решений, как кластеры Google TPU и NVIDIA DGX SuperPod, световые сигналы со скоростью сотен Гбит/с проходят по оптоволокну, тоньше волоса, создавая нейронные сети мира ИИ.
В 2023 году мировые поставки серверов ИИ превысили 1,2 миллиона единиц, но мало кто знает, что каждый сервер, оснащенный 8 графическими процессорами H100, требует как минимум 4 оптических модуля на 800 Гбит для обеспечения обмена данными. Оптические модули, являясь ключевыми устройствами для преобразования оптических и электрических сигналов, прямо влияют на эффективность взаимодействия кластеров GPU в центрах обработки данных.
В сценариях обучения крупных языковых моделей объем параметров уже превышает триллионы, и для однократного обучения требуется задействовать более 10 000 графических процессоров. Ограничения традиционной медной передачи по пропускной способности и расстоянию делают оптические модули ключом к преодолению “стенки памяти”: оптический модуль OSFP на 800 Гбит позволяет передавать данные со скоростью 106 Гбит/с по одному каналу с задержкой менее 2 наносекунд, что повышает эффективность синхронизации параметров более чем на 40%. Плотность развертывания оптических модулей в центрах обработки данных ведущих облачных провайдеров возросла с 6 модулей на стойку в 2020 году до 24 модулей к 2024 году.
Суперкомпьютерный центр Microsoft Azure в Огайо строится с использованием трехуровневой топологии CLOS, с оптическими коммутаторами на 25,6 Тбит/с и платформой NVIDIA Quantum-2 InfiniBand на 12,8 Тбит/с, создавая матрицу вычислительной мощности из 150 000 графических процессоров. Это требует более 100 000 оптических модулей на 800 Гбит, которые обеспечивают уровень ошибок 0,003% на расстоянии 300 метров.
Автономные устройства, такие как roadside units (RSU), начинают использовать оптические модули QSFP-DD на 400 Гбит, с потребляемой мощностью, снижающейся с 7 Вт до 4,5 Вт. В условиях экстремальных температур от -40°C до 85°C они все равно обеспечивают стабильность лазера. Последние решения по оптической связи в суперкомпьютере Tesla Dojo сокращают задержку передачи видео данных до одной пятой по сравнению с традиционными решениями.
Прорывы в фотонных вычислительных чипах меняют аппаратную архитектуру. Чип Lightmatter Envise интегрирует оптические модули с единицами хранения и вычислений, достигая энергоэффективности 300 TOPS на ватт в матричных вычислениях, что приносит революционные изменения в сценах вывода ИИ.
Лидеры отрасли сосредоточились на трех основных направлениях:
LightCounting прогнозирует, что к 2025 году рынок высокоскоростных оптических модулей достигнет 17,6 миллиарда долларов, где доля спроса, связанного с ИИ, составит более 60%. Китайские производители уже занимают 35% рынка модулей на 800 Гбит и выше, а кремниевые решения таких компаний, как Xuchuang Technology и Huawei HiSilicon, находятся на стадии массового производства.
С развитием многофункциональных моделей ИИ потребность в вычислительной мощности удваивается каждые 18 месяцев. Эволюция технологии оптических модулей больше не ограничивается увеличением скорости, а направляется к таким направлениям, как совместная оптическая упаковка, программируемые оптические сети и квантовая оптическая связь. Возможно, в недалеком будущем мы увидим не только переходы на скорости 1,6 Т и 3,2 Т, но и новую эпоху вычислений, переопределяемую светом — в мире, где данные больше не требуют “перемещения”, а границы между вычислительной мощностью и соединением исчезнут.
(Общий объем текста: около 850 слов)
Источники данных: отчеты рынка LightCounting, рейтинг TOP500 суперкомпьютеров, технические документы ведущих компаний.
Технические примечания: 800G DR8 — это 8-канальный оптический модуль с длиной волны 850 нм, CPO (Co-Packaged Optics) обозначает совместную упаковку оптики.