Творчество из хаоса: как несовершенства алгоритмов порождают искусство ИИ
Нам когда-то обещали самоуправляемые автомобили и роботов-горничных. Вместо этого мы получили искусственный интеллект, способный обыграть человека в шахматы, анализировать терабайты текста и сочинять сонеты. Это стало одним из главных парадоксов современности: физические задачи, простые для людей, оказались сложными для роботов, а алгоритмы всё лучше копируют наш интеллект.
Ещё одна загадка, десятилетиями ставившая учёных в тупик, — странная «креативность» ИИ. Диффузионные модели, лежащие в основе нейросетей вроде DALL·E и Stable Diffusion, созданы для воспроизведения изображений, на которых они обучались. Однако на практике они импровизируют, смешивая элементы и генерируя не просто абстракции, а осмысленные картины. «Парадокс в том, что идеальная модель просто запоминала бы данные, — объясняет Джулио Бироли, исследователь ИИ из Парижской высшей нормальной школы. — Но вместо этого она создаёт нечто новое».
Как шум превращается в искусство
Чтобы генерировать изображения, диффузионные модели используют дениазинг — процесс устранения шумов. Представьте, что вы многократно пропускаете картину через шредер, пока не останется лишь горсть пыли, а затем пытаетесь собрать её заново. Но как из этого рождается новизна? Оказалось, всё дело в технических несовершенствах самой системы.
Физики Мейсон Камб и Сурья Гангули из Стэнфорда обнаружили, что креативность ИИ — не магия, а следствие двух особенностей архитектуры:
- Локальность: модель обрабатывает только небольшие «патчи» пикселей, игнорируя общую композицию.
- Эквивариантность: сдвиг входных данных автоматически отражается в результате, сохраняя структуру.
Эти ограничения, ранее считавшиеся недостатками, на деле стали ключом к творчеству. Как клетки в эмбрионе самоорганизуются в органы без общего плана (парадокс Тьюринга), так и ИИ собирает изображение по частям, порой добавляя «лишние пальцы» или причудливые детали.
Эксперимент, который всё изменил
Камб и Гангули создали ELS-машину — математическую модель, симулирующую дениазинг только на основе локальности и эквивариантности. При тестах её выходы на 90% совпали с результатами обученных нейросетей. «Это шокирует, — говорит Гангули. — Креативность оказалась неизбежным следствием архитектуры, а не машинного обучения».
Человек vs ИИ: в чём сходство?
Исследование заставляет переосмыслить природу творчества. Как заметил Бенджамин Хувер из MIT, и люди, и алгоритмы творят, комбинируя фрагменты опыта. Возможно, новизна рождается именно из ограничений — будь то нехватка данных у ИИ или субъективность восприятия у человека.
Дальнейшие горизонты
Открытие меняет правила игры:
- Борьба с артефактами: понимание причин «лишних пальцев» поможет улучшить генерацию.
- Этика ИИ: если креативность алгоритмов предсказуема, можно контролировать их выводы.
- Нейронаука: аналогичные механизмы самоорганизации могут работать в мозге, где нейроны координируются без центрального управления.
Как и в случае с теорией Тьюринга, объяснившей patterns в живой природе, эта работа открывает дверь к диалогу между физикой, ИИ и философией. Возможно, истинное творчество — не полёт гения, а умение находить гармонию в хаосе ограничений.
По материалам Quanta Magazine. Адаптировано и дополнено для русскоязычной аудитории.