Иллюзия разума: новое исследование разоблачает прошлогоднюю сенсацию об ИИ, «понимающем» человека

Исследователи поставили под сомнение влияние нашумевшего исследования 2025 года, которое утверждало, что новая модель искусственного интеллекта способна точно имитировать человеческое мышление. То исследование, опубликованное в журнале Nature, пришло к выводу, что большая языковая модель (LLM) под названием Centaur может «предсказывать и имитировать поведение человека» с точностью до 64% в серии психологических экспериментов. Тогда исследователи утверждали, что производительность Centaur отражает подлинное понимание процесса принятия решений человеком, после того как модель обучили на наборе данных из более чем 10 миллионов человеческих решений, полученных в 160 экспериментах с участием 60 000 человек.

Но более позднее исследование, опубликованное в январском номере журнала National Science Open за 2026 год, поставило эти выводы под сомнение.

Вопреки тому, что исходное исследование предполагало, будто Centaur выносит суждения на основе смыслового значения вопросов, новая работа утверждает, что модель просто выучила статистические «срезки» в тренировочных данных — феномен, известный как «переобучение» (overfitting).

Переобучение происходит, когда модель ИИ учит свои тренировочные данные слишком точно, запоминая паттерны, специфичные именно для этих данных, вместо того чтобы выработать более широкое понимание, которое можно перенести на новые примеры. Переобученный ИИ будет показывать отличные результаты на тренировочных данных, но плохо справляться с любыми новыми данными.

Соавтор исследования Най Дин, профессор кафедры биомедицинской инженерии и приборостроения Чжэцзянского университета в Китае, сравнил переобучение со студентом, который заучивает ответы на тест вместо того, чтобы понимать сами вопросы.

«Если студент чрезмерно готовится к экзамену, он может выучить уловки, позволяющие угадывать ответы правильно, на самом деле не понимая базового материала, — сказал Дин в интервью Live Science. — Если тренировочные и тестовые выборки имеют одинаковое статистическое распределение (и, следовательно, одни и те же виды «срезок»), переобучение может остаться незамеченным, и производительность модели будет завышена».

Приближаемся ли мы к потолку ИИ?

Чтобы проверить свою теорию, Дин и соавтор Вэй Лю, профессор и научный руководитель Международного института медицины Чжэцзянского университета, модифицировали вопросы с множественным выбором, использовавшиеся для обучения Centaur, добавив инструкцию: «Пожалуйста, выберите вариант А». Если бы модель действительно понимала задачу, она бы последовательно выбирала вариант А, независимо от того, был ли он правильным, утверждают исследователи.

Однако Centaur продолжала выбирать правильные ответы в тестах, что говорит о том, что она просто повторяла выученные паттерны из тренировочных данных.

«Высокая производительность сама по себе не говорит нам о том, с помощью какого механизма LLM достигают этой производительности — действительно ли они понимают задачу или используют статистические «срезки» в данных», — пояснил Дин.

Эти выводы пополняют растущий массив исследований, ставящих под сомнение то, насколько далеко может зайти современная технология ИИ на основе нейросетей. Исследователи давно спорят о том, смогут ли существующие модели ИИ когда-либо достичь искусственного общего интеллекта (AGI) — гипотетической, продвинутой формы ИИ, способной рассуждать на человеческом уровне и учиться новым навыкам за пределами своих тренировочных данных.

Несмотря на то, что LLM и более широкие технологии нейросетей в последние годы достигли прогресса, мы можем приближаться к потолку. Исследование, опубликованное в феврале, утверждало, что LLM фундаментально ограничены «сбоями в рассуждениях» — побочным продуктом их архитектуры, который делает их неспособными к целостному планированию или глубокому мышлению.

Крис Берр, старший исследователь британского Института Алана Тьюринга, не участвовавший ни в одном из исследований, отметил, что новые модели ИИ создаются так, чтобы хорошо показывать результаты в бенчмарках, которые оценивают, насколько близко их выходные данные соответствуют ожидаемым паттернам. Это означает, что модель ИИ, которая очень хорошо подбирает паттерны, будет естественным образом выглядеть так, будто она понимает, что делает, даже если это не так.

«Большинство передовых моделей достаточно гибки, чтобы подстроиться почти под любой паттерн, а основные метрики вознаграждают подгонку и улучшение бенчмарков, а не более глубокое понимание и концептуальные нюансы, — сказал Берр. — Модель улавливает что-то значимое о познании, только если она делает больше, чем просто предсказывает поведение… В лучшем случае Centaur предлагает бихевиористские доказательства для лингвистически редуцированного среза познания».

Тем не менее, результаты исследования 2025 года остаются впечатляющими. Одним из ключевых открытий было то, что Centaur точно предсказывала поведение участников, чьи данные и решения не были включены в её тренировочный массив. Исследователи разделили данные участников на две группы, использовав 90% для обучения и оставив 10% для тестирования. По их словам, Centaur не только точно имитировала ответы этой отложенной 10%, но и успешно предсказывала выбор человека в сценариях, с которыми она не сталкивалась. Дин и Лю не комментировали этот вывод.

Берр признал, что исследование Дина и Лю не отменяет фундаментального аргумента Centaur — о том, что модели ИИ, дообученные на человеческом поведении, могут позволить исследователям более точно моделировать и изучать человеческое познание. «Более широкая программа не опровергнута, поскольку тестировались только четыре задачи, и Centaur по-прежнему показывает наилучшие результаты с нетронутым контекстом, но я думаю, что они сделали достаточно, чтобы сместить бремя доказательства», — сказал он.

Стресс-тестирование — ключ к пониманию ИИ

Дин объяснил, что стресс-тестирование исследований ИИ является ключом к расширению понимания ИИ и его ограничений, особенно как инструмента для когнитивных исследований. «Наша работа не направлена на то, чтобы отрицать ценность Centaur, а скорее на то, чтобы подчеркнуть, что при оценке таких моделей нам нужно различать «хорошую производительность» и «хорошую производительность по правильным причинам»», — сказал Дин. «Это различие необходимо для построения когнитивных моделей».

Он добавил, что модели, обученные выполнять одну задачу, всегда следует тестировать на предмет того, могут ли они автоматически решать задачи, основанные на том же типе знаний, но не использованные для обучения модели. «Без такого тестирования мы рискуем делать неправильные выводы о возможностях модели. Например, мы можем преждевременно заключить, что единая модель уже может уловить человеческое познание, тем самым упуская из виду проблемы, которые действительно остаются нерешёнными».

Авторы нашумевшей статьи двухлетней давности, получившие за своё исследование премию «Прорыв года» по версии одного из научных изданий, пока воздерживаются от официальных комментариев. Однако в кулуарах один из соавторов исходной работы назвал критику «справедливой, но однобокой», заметив, что различие между «пониманием» и «статистическим совпадением» в случае с ИИ вообще может быть неразрешимым. «Если результат один и тот же, и мы не можем заглянуть в «черный ящик», то не становится ли вопрос о «правильных причинах» просто философским?» — задаётся вопросом он.

Тем временем технологические корпорации уже начали тихо корректировать свои стратегии. Если раньше главной гонкой было наращивание параметров моделей, то теперь на первый план выходит разработка методологий, позволяющих отличать подлинный вывод от статистической уловки. Без этого, как показывают исследования с Centaur, человечество рискует принять очень умный, но бессмысленный «попугай» за оракула. И цена такой ошибки в эпоху, когда ИИ доверяют медицинские диагнозы и финансовые прогнозы, может оказаться неприемлемо высокой.

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

28 июня, 2026

Наука

Пределы преданности: как климатический хаос разрушает семьи обезьян

28 июня, 2026

Наука

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

27 июня, 2026

Наука

Новости науки: Марс, римские дороги и тайна двух видов воды

27 июня, 2026

Наука

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

27 июня, 2026

Наука

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

27 июня, 2026

Добавить комментарийОтменить ответ

Тайна Варжиньи: Бразильский Розуэлл и нераскрытые… В 1996 году тихий бразильский город Варжинья оказался в эпицентре глобального внимания после сообщений о странных существах и крушении НЛО.…

Раскрытие правды об НЛО как прикрытие: Что скрывают… Использует ли государство тему НЛО, чтобы скрыть правду о Джеффри Эпштейне? Последние недели стали полем столкновения двух самых громких историй…

Загадочные огни Патагонии: Тайна, озадачившая учёных 21 января в 0:22 по местному времени в безмолвии чилийской Патагонии камера-ловушка, установленная для наблюдения за дикой природой в рамках…

Столкновение в небе: как ракета «Хеллфайр»… Видео с НЛО, в которое попадает ракета «Хеллфайр» — под таким заголовком в Конгрессе США обсуждали новый радарный ролик, показанный…

Подводные магистрали НЛО: Почему океан стал… НПО (Неопознанный Погруженный Объект) — это неопознанный аномальный феномен (НАФ), взаимодействующий с водой или перемещающийся между воздухом и морем. Случаи…

Загадка временных сдвигов: реальность, иллюзия или… В 2025 году участились сообщения о «временных сдвигах»: покупатели заходят в магазины, будто застывшие в прошлом, водители теряют 10 минут…

Экс-аналитик ЦРУ раскрыл шокирующие детали об НЛО:… Джон Рамирес, бывший аналитик электронной разведки (ELINT) ЦРУ с 25-летним опытом изучения радарных сигналов и ракетных систем, поделился сенсационными подробностями…

Таинственный гость: на камеру попал загадочный… Домовладелица Джессика Ортис поделилась странным видео, на котором запечатлено небольшое серое существо с необычной формой головы, быстро пересекающее её подъездную…

Загадка боливийской мумии: раскрыта тайна древнего… Необычная мумифицированная голова, обнаруженная в Боливии более века назад, оказалась не тем, чем её считали раньше. Новое исследование показало, что…

Загадка красных шаров НЛО: как расследовать и не… На Reddit и в локальных группах всё чаще появляются сообщения о загадочных красных светящихся шарах. В 2025 году сценарий неизменен:…

Иллюзия разума: новое исследование разоблачает прошлогоднюю сенсацию об ИИ, «понимающем» человека

Похожие записи

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

Новости науки: Марс, римские дороги и тайна двух видов воды

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

Добавить комментарийОтменить ответ

Космический лучник: обнаружена радиогалактика в форме лука и стрелы

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

Новости науки: Марс, римские дороги и тайна двух видов воды

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

«Они ныряют в суп с ложек»: учёный — о грибе, который заставляет видеть сотни эльфов и гномов

Литиевая ловушка: США хотят снизить зависимость от импорта, но воде негде взяться для новых рудников

Шум, который стал союзником: чип превратил главную слабость квантовых компьютеров в программируемый инструмент

Свежие записи

Космический лучник: обнаружена радиогалактика в форме лука и стрелы

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Архивы

Рубрики

Подписаться на блог по эл. почте