Тайная дуэль умов: как математики проиграли ИИ в битве за сложнейшие задачи
В середине мая, в тишине калифорнийского Беркли, собрались 30 ведущих математиков мира. Некоторые прилетели из Великобритании, чтобы принять участие в необычном эксперименте: сражении с ИИ-ботом o4-mini, обученным решать задачи высочайшего уровня сложности. В течение двух дней учёные бросали ему вызов, предлагая проблемы, которые и человеку казались нерешаемыми. К их изумлению, бот не только справился с некоторыми из них, но и продемонстрировал стиль мышления, характерный для гениального исследователя.
«У меня есть коллеги, которые всерьёз говорят, что эти модели близки к математическому гению», — признаётся Кен Оно, профессор Университета Вирджинии и один из судей эксперимента.
o4-mini, созданный OpenAI, относится к новому поколению языковых моделей, оптимизированных для сложных логических выводов. В отличие от предшественников, таких как ChatGPT, его обучали на узкоспециализированных данных с усиленной обратной связью от людей. Это позволило боту погружаться в задачи, которые обычным ИИ казались неподъёмными.
Для оценки возможностей o4-mini OpenAI привлекла некоммерческую организацию Epoch AI, разработавшую 300 уникальных математических вопросов, ответы на которые ещё не были опубликованы. Традиционные языковые модели справились лишь с 2% из них, подтвердив отсутствие навыков глубокого анализа. Однако o4-mini показал иные результаты: к апрелю 2025 года он решал уже 20% задач.
Но главным испытанием стал четвёртый уровень сложности — вопросы, под силу лишь единицам среди математиков. Участники проекта, связанные жёстким NDA, общались только через Signal, чтобы избежать утечек данных. Каждая неудача ИИ приносила автору задачи $7500. К маю учёные едва набрали нужное количество «непобедимых» вопросов, что вынудило Epoch AI организовать очную встречу 17–18 мая.
Шок и трепет:
В субботу вечером Кен Оно предложил боту проблему из области теории чисел, над которой годами бились учёные. Спустя 10 минут ИИ, освоив научную литературу и проверив гипотезы на упрощённой версии, выдал безупречное решение — с долей сарказма: «Цитировать источники не нужно — это число вычислено мной!»
«Я не ожидал, что столкнусь с таким уровнем рассуждений. Это то, как работает учёный. Это пугает», — поделился Оно в переписке с коллегами.
К воскресенью группе удалось найти 10 вопросов, с которыми o4-mini не справился. Однако скорость ИИ впечатлила: то, что математик решал бы месяцами, бот завершал за минуты.
Будущее под вопросом:
Участники встречи задумались о «пятом уровне» — задачах, неподвластных даже лучшим умам человечества. Если ИИ достигнет этого рубежа, роль математиков может радикально измениться. «Мы станем задавать вопросы и взаимодействовать с ботами, как профессора со студентами», — предполагает Оно.
Ян Хуэй Хэ из Лондонского института математических наук сравнил o4-mini с «очень талантливым аспирантом», но предупредил об опасности слепого доверия ИИ: «Он выдаёт ответы с такой уверенностью, что это напоминает “доказательство запугиванием”».
Эксперимент в Беркли стал тревожным звонком для академического сообщества. Некоторые учёные уже предлагают пересмотреть программы обучения, сделав акцент на креативности и междисциплинарности — навыках, пока недоступных ИИ. Другие видят в технологиях шанс ускорить открытия, переложив рутинные вычисления на машины.
Однако критики напоминают: ИИ, в отличие от человека, не понимает смысла решаемых задач. «Он оперирует паттернами, а не интуицией, — отмечает российский математик Алексей Стахов. — Но если однажды он научится задавать собственные вопросы, это будет новая эра — или конец привычной науки».
Пока же o4-mini остаётся инструментом, а не соперником. Но, как гласит надпись на доске в аудитории Беркли, где проходила встреча: «Машина не заменит математика. Но математик, использующий машину, заменит того, кто её боится».