Световая революция: как новая архитектура оптических компьютеров ускорит путь к искусственному интеллекту

Световая революция: как новая архитектура оптических компьютеров ускорит путь к искусственному интеллекту

 

Ученые совершили прорыв, разработав фундаментальную архитектуру для компьютеров следующего поколения, которые используют свет вместо электричества. Это открытие может коренным образом изменить методы обучения и работы моделей искусственного интеллекта (ИИ).

В основе больших языковых моделей и систем глубокого обучения лежит взвешенная структура данных под названием «тензор». Её можно сравнить с картотечным шкафом, где на каждом ящике есть стикеры, показывающие, какие из них используются чаще всего. Когда модель ИИ обучается распознавать изображение или предсказывать текст, она организует данные именно в такие тензоры. Скорость их обработки — это главное «узкое место», которое ограничивает производительность и предельный размер любой современной модели ИИ.

В традиционных оптических компьютерах для обработки тензоров требуется многократно активировать массивы лазеров. Это похоже на сканирование штрихкода на каждой коробке, где внутри скрыта математическая задача. Объем вычислительной мощности, необходимой для их решения, растет вместе с возможностями самих моделей.

Хотя на небольших масштабах световые вычисления быстрее и энергоэффективнее, у них есть ключевой недостаток: большинство оптических систем не могут работать параллельно. В отличие от графических процессоров (GPU), которые можно объединять в кластеры для экспоненциального роста мощности, световые системы обычно работают линейно. Именно поэтому разработчики чаще всего отдают предпочтение традиционным электронным чипам с их преимуществами параллельных вычислений.

Это ограничение — причина, по которой самые мощные модели от таких компаний, как OpenAI, Anthropic, Google и xAI, требуют для обучения и работы тысяч GPU, работающих одновременно.

Однако новая архитектура под названием Parallel Optical Matrix-Matrix Multiplication (POMMM), способна решить эту проблему. В отличие от предыдущих методов, она выполняет множество тензорных операций одновременно с помощью одного лазерного импульса.

Результатом стала революционная аппаратная архитектура для ИИ, которая потенциально может превзойти возможности самых современных электронных чипов по скорости обработки тензоров, при этом значительно снизив энергопотребление.

Будущее аппаратного обеспечения ИИ

Исследование, опубликованное 14 ноября в журнале Nature Photonics, подробно описывает экспериментальный прототип и серию сравнительных тестов со стандартными оптическими и GPU-системами.

Ученые использовали специальную компоновку обычных оптических компонентов вместе с новым методом кодирования и обработки данных, что позволило захватывать и анализировать тензорные «пакеты» за один лазерный выстрел.

Им удалось закодировать цифровые данные в амплитуду и фазу световых волн, превратив информацию в физические свойства оптического поля. Комбинируясь, эти световые волны passively выполняют математические операции, такие как перемножение матриц и тензоров. В этой парадигме для вычислений не требуется дополнительной энергии — они происходят по мере распространения света, что устраняет необходимость в управлении и переключении во время обработки.

«Этот подход можно реализовать практически на любой оптической платформе, — заявил в своем заявлении ведущий автор исследования Чжипей Сан, руководитель Фотонной группы Университета Аалто. — В будущем мы планируем интегрировать эту вычислительную структуру непосредственно в фотонные чипы, что позволит световым процессорам выполнять сложные задачи ИИ с чрезвычайно низким энергопотреблением».

По оценкам ученых, этот подход может быть интегрирован в основные платформы ИИ в течение трех-пяти лет.

Ускоритель для искусственного общего интеллекта (ИОИ)

Разработчики называют этот шаг на пути к следующему поколению Искусственного Общего Интеллекта (ИОИ) — гипотетической системе, которая будет умнее человека и способна обучаться в самых разных областях, независимо от своих исходных данных.

«Это создаст новое поколение оптических вычислительных систем, значительно ускоряющее выполнение сложных задач ИИ в бесчисленных областях», — добавил соавтор работы.

Хотя в самой статье прямо не упоминается ИОИ, она несколько раз ссылается на вычисления общего назначения. В сообществе компьютерных наук широко распространено мнение, что простое масштабирование нынешних методов — это жизнеспособный путь к достижению ИОИ. В то же время такие ученые, как Ян Лекун, главный специалист по ИИ в Meta, с этим не согласны, утверждая, что большие языковые модели никогда не достигнут статуса ИОИ, независимо от степени их масштабирования.

С появлением POMMM у ученых, возможно, появился критически важный элемент аппаратной головоломки, необходимый для устранения одного из самых больших препятствий в этой области. Это открывает путь к масштабированию, далеко выходящему за пределы, установленные современной электроникой.

Этот прорыв знаменует собой смену парадигмы. Мы движемся от эпохи, где прогресс в ИИ достигался за счет строительства все более гигантских и энергозатратных дата-центров, к эре, где фундаментальные физические свойства света — его скорость и способность выполнять вычисления «на лету» — станут основой для интеллектуальных систем.

В перспективе это сулит не только сверхбыстрые чат-боты или генераторы изображений. Речь идет о решении задач, которые сегодня считаются неподъемными: от мгновенного моделирования сложных климатических процессов и открытия новых лекарств до создания персональных медицинских помощников, способных в реальном времени анализировать данные тысяч пациентов. POMMM — это не просто ускоритель для существующих моделей ИИ; это, возможно, ключ к двери, за которой начинается новая, истинно интеллектуальная эра вычислений.

Добавить комментарий