Стартап в области фотонных вычислений Lightmatter собрал 400 миллионов долларов, чтобы устранить проблемы в одном из современных центров обработки данных. Разработанный компанией уровень оптических межсоединений позволяет сотням графических процессоров работать синхронно, упрощая дорогостоящую и сложную работу по обучению и запуску моделей искусственного интеллекта.
Развитие искусственного интеллекта и, соответственно, огромные требования к вычислительным ресурсам привели к росту индустрии центров обработки данных, но это не так просто, как подключить еще тысячу графических процессоров. Как уже давно известно экспертам по высокопроизводительным вычислениям, не имеет значения, насколько быстродействует каждый узел вашего суперкомпьютера, если половину времени эти узлы простаивают в ожидании поступления данных.
Уровень или несколько уровней межсоединений — это то, что фактически превращает стойки с процессорами и графическими процессорами в одну гигантскую машину, из чего следует, что чем быстрее межсоединение, тем быстрее работает центр обработки данных. И похоже, что Lightmatter создает самый быстрый уровень межсоединений, используя фотонные чипы, которые она разрабатывает с 2018 года.
“Гиперскейлеры знают, что если им нужен компьютер с миллионом узлов, они не смогут этого сделать с помощью коммутаторов Cisco. Как только вы покидаете стойку, вы переходите от подключения с высокой плотностью к крепкому напитку”, – сказал TechCrunch Ник Харрис, генеральный директор и основатель компании. (Вы можете посмотреть его краткое выступление по этому вопросу здесь).
По его словам, самым современным решением является NVLink и, в частности, платформа NVL72, которая объединяет 72 устройства Nvidia Blackwell, подключенных друг к другу в стойке, и обеспечивает максимальную производительность 1,4 Эксафлопс при точности FP4. Но ни одна стойка не является изолированной, и все эти вычислительные ресурсы приходится выжимать с помощью 7 терабит “масштабируемой” сети. Звучит многообещающе, и это действительно так, но невозможность быстрее подключить эти устройства друг к другу и к другим стойкам является одним из главных препятствий на пути повышения производительности.
“Для миллиона графических процессоров требуется несколько уровней коммутаторов. и это приводит к значительному увеличению времени ожидания”, – сказал Харрис. “Вы должны перейти от электрического к оптическому, а затем от электрического к оптическому.… количество потребляемой энергии и время ожидания огромны. И в больших кластерах это значительно ухудшается”.
Итак, что же представляет собой световая материя? Волокно. Много-много волокон, проложенных через чисто оптический интерфейс. Производительность до 1,6 терабит на волокно (при использовании нескольких цветов) и до 256 волокон на чип.… что ж, давайте просто скажем, что 72 графических процессора со скоростью 7 терабит/с начинают казаться довольно необычными.
“Фотоника развивается намного быстрее, чем многие думали — люди годами пытались заставить ее работать, но мы на верном пути”, – сказал Харрис. “После семи лет абсолютно убийственной работы”, – добавил он.
Фотонный интерконнект, доступный в настоящее время от Lightmatter, выдает 30 терабит/с, а встроенная в стойку оптическая схема позволяет 1024 графическим процессорам работать синхронно в своих собственных, специально разработанных стойках. На случай, если вам интересно, эти два показателя не увеличиваются в одинаковой степени, потому что многое из того, что нужно было бы подключить к другой стойке, может быть выполнено на стойке в кластере с тысячью графических процессоров. (И в любом случае, 100 терабит уже в пути).
Харрис отметил, что рынок для этого огромен, и все крупные компании, занимающиеся центрами обработки данных, от Microsoft до Amazon и новичков, таких как xAI и OpenAI, демонстрируют неиссякаемый спрос на вычислительную технику. “Они объединяют здания! Интересно, как долго они смогут продолжать в том же духе”, – сказал он.
Многие из этих гиперскейлеров уже являются клиентами, хотя Харрис не назвал ни одного из них. “Представьте, что Lightmatter – это литейное производство, например, TSMC”, – сказал он. “Мы не выбираем фаворитов и не привязываем свое имя к брендам других людей. Мы предоставляем им дорожную карту и платформу — просто помогаем расширить ассортимент”.
Автор изображения: Lightmatter
Но, застенчиво добавил он, “вы не сможете увеличить свою оценку в четыре раза, не используя эту технологию”, – возможно, это намек на недавний раунд финансирования OpenAI, в ходе которого компания была оценена в 157 миллиардов долларов, но это замечание с таким же успехом могло относиться и к его собственной компании.
Этот раунд в 400 миллионов долларов в день оценивается в 4,4 миллиарда долларов, что примерно в два раза превышает оценку на середину 2023 года, что “делает нас, безусловно, крупнейшей компанией в области фотоники. Это круто!” – сказал Харрис. Раунд проводился компанией T. Rowe Price Associates при участии существующих инвесторов, компании Fidelity Management and Research и GV.
Что дальше? В дополнение к interconnect компания разрабатывает новые подложки для чипов, чтобы они могли выполнять еще более сложные, если хотите, сетевые задачи, используя свет.
Харрис предположил, что, помимо interconnect, мощность на чип в будущем станет существенным отличием. “Через десять лет у вас будут чипы в масштабе пластины от любого производителя – другого способа повысить производительность каждого чипа просто нет”, — сказал он. Компания Cerebras, конечно, уже работает над этим, хотя вопрос о том, смогут ли они оценить истинную ценность этого достижения на данном этапе развития технологии, остается открытым.
Но Харрис, видя, что индустрия микросхем сталкивается с трудностями, планирует быть готовым и ждать следующего шага. “Через десять лет взаимосвязь станет законом Мура”, – сказал он.