Крах моделей ИИ: почему нейросети могут «сойти с ума» без людей

В то время как эволюция систем искусственного интеллекта (ИИ) не демонстрирует признаков замедления, растет обеспокоенность тем, что большие языковые модели (LLM) вскоре исчерпают созданные человеком данные для обучения.

Когда это произойдет, говорят ученые, модели ИИ будут все больше полагаться на синтетическую информацию, сгенерированную самим же ИИ, что приведет к эффекту, называемому «коллапсом модели». В этом состоянии LLM начинают выдавать бессвязный набор слов, а системы ИИ, которые на них основаны, гораздо чаще, чем сегодня, дают неточные ответы и «галлюцинируют» информацию в ответ на запросы.

«Это особенно тревожно, учитывая, что некоторые эксперты полагают, что мы исчерпаем высококачественные данные, созданные человеком, уже к концу года. Так что если вы полагаетесь на синтетические данные, но при этом существует почти экзистенциальная угроза, что это утопит ваш ИИ, — вы в беде, — объяснил Яссер Руди, профессор теории неупорядоченных систем на математическом факультете Королевского колледжа Лондона (KCL), в интервью Live Science. — Например, если бы LLM использовались в больницах для анализа снимков мозга и поиска рака, то при обучении другой модели на синтетических данных мог бы произойти коллапс, и эти машины стали бы ставить людям неверные диагнозы».

Однако исследование Руди показало, что коллапс модели можно обойти, добавив в обучающие данные ИИ всего один созданный человеком информационный элемент — даже если все остальные данные будут синтетическими. Работа, выполненная совместно с исследователями из Норвежского университета естественных и технических наук и Международного центра теоретической физики имени Абдуса Салама в Италии, была опубликована 14 мая в журнале Physical Review Letters.

Хотя коллапс моделей еще не происходил в реальных условиях с активно развернутой системой ИИ, любой, кто пользуется такими инструментами, как ChatGPT или Gemini, скорее всего, сталкивался с ошибками или «галлюцинациями». Руди надеется, что новые выводы помогут наметить метод, позволяющий обойти эту потенциальную угрозу.

Как бороться с коллапсом

Помимо широко известных «галлюцинаций» у первых поколений генеративных ИИ-продуктов, мы, возможно, еще не видели драматических примеров коллапса моделей в форме сложных нейросетей, которые «сходят с ума» и выдают полную бессмыслицу. Но признаки небольшого коллапса можно заметить, когда ИИ выдает все более неточные или шаблонные ответы на запросы или полностью выдумывает информацию, пытаясь сгенерировать некий результат, который, как он предполагает, хочет получить пользователь.

При многократном обучении LLM на данных, сгенерированных другими LLM, базовая истина и источник информации, а также всплески вариативности между поколениями моделей «сглаживаются», что приводит к однородным ответам и результатам. Например, текст, который на первый взгляд выглядит читабельным, может не содержать реальных деталей или нюансов. По сути, коллапс модели можно разделить на «раннюю» и «позднюю» стадии: на первой ИИ теряет способность выдавать редкую информацию и дает шаблонные, синтетические ответы, а на второй начинает нести ахинею.

Огромный масштаб LLM и данных, которые они обрабатывают, затрудняет понимание того, как и почему они «галлюцинируют» и какие именно решения приводят к коллапсу. Чтобы решить эту проблему, исследователи использовали модели меньшего размера, принадлежащие к экспоненциальным семействам — обобщающему термину для ряда распределений вероятностей, например, для оценки вероятных исходов случайных событий. Кривая нормального распределения (колоколообразная кривая) — один из таких примеров, равно как и расчет вероятности выпадения орла при подбрасывании монеты.

«Изучая аналитически управляемые модели, такие как экспоненциальные семейства, можно ответить на вопросы „почему“ и „как“, — сказал Руди. — По той же логике можно придумать способы смягчения опасных эффектов, понять, как эти способы работают, и в конечном итоге применить их к реальным примерам».

Всего одна точка опоры

Исследователи обнаружили, что если добавить всего одну внешнюю человеческую точку данных в пул синтетических данных, используемых моделью в ходе замкнутого цикла обучения (когда новая модель обучается на данных, сгенерированных предыдущими), коллапса модели удается избежать.

Руди привел пример: ИИ-классификатор изображений или видео, где LLM обучается на данных, включающих реальное изображение, правильно классифицированное человеком, а не медиа, сгенерированные или классифицированные ИИ.

«Иными словами, эта точка данных была бы связана с „основополагающей истиной“ — тем, что мы заведомо знаем как правду и что можно независимо проверить», — пояснил Руди.

Следующим шагом для Руди и его коллег станет применение этого подхода к более крупным и сложным моделям, чтобы проверить, сохраняется ли принцип. Команда заявила, что этот метод может смягчить потенциально «катастрофические» сценарии коллапса моделей, особенно в тех ИИ-системах, которые мы используем в повседневной жизни.

«Это исследование — первый шаг к установлению основных правил предотвращения такого развития событий в будущем, — заключил Руди. — Хотя предстоит еще много работы, инженеры ИИ, создающие что-то вроде следующего ChatGPT, могут использовать наши выводы для разработки моделей, которые не разрушаются».

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

28 июня, 2026

Наука

Пределы преданности: как климатический хаос разрушает семьи обезьян

28 июня, 2026

Наука

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

27 июня, 2026

Наука

Новости науки: Марс, римские дороги и тайна двух видов воды

27 июня, 2026

Наука

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

27 июня, 2026

Наука

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

27 июня, 2026

Добавить комментарийОтменить ответ

Тайна Варжиньи: Бразильский Розуэлл и нераскрытые… В 1996 году тихий бразильский город Варжинья оказался в эпицентре глобального внимания после сообщений о странных существах и крушении НЛО.…

Раскрытие правды об НЛО как прикрытие: Что скрывают… Использует ли государство тему НЛО, чтобы скрыть правду о Джеффри Эпштейне? Последние недели стали полем столкновения двух самых громких историй…

Загадочные огни Патагонии: Тайна, озадачившая учёных 21 января в 0:22 по местному времени в безмолвии чилийской Патагонии камера-ловушка, установленная для наблюдения за дикой природой в рамках…

Столкновение в небе: как ракета «Хеллфайр»… Видео с НЛО, в которое попадает ракета «Хеллфайр» — под таким заголовком в Конгрессе США обсуждали новый радарный ролик, показанный…

Подводные магистрали НЛО: Почему океан стал… НПО (Неопознанный Погруженный Объект) — это неопознанный аномальный феномен (НАФ), взаимодействующий с водой или перемещающийся между воздухом и морем. Случаи…

Загадка временных сдвигов: реальность, иллюзия или… В 2025 году участились сообщения о «временных сдвигах»: покупатели заходят в магазины, будто застывшие в прошлом, водители теряют 10 минут…

Экс-аналитик ЦРУ раскрыл шокирующие детали об НЛО:… Джон Рамирес, бывший аналитик электронной разведки (ELINT) ЦРУ с 25-летним опытом изучения радарных сигналов и ракетных систем, поделился сенсационными подробностями…

Таинственный гость: на камеру попал загадочный… Домовладелица Джессика Ортис поделилась странным видео, на котором запечатлено небольшое серое существо с необычной формой головы, быстро пересекающее её подъездную…

Загадка боливийской мумии: раскрыта тайна древнего… Необычная мумифицированная голова, обнаруженная в Боливии более века назад, оказалась не тем, чем её считали раньше. Новое исследование показало, что…

Загадка красных шаров НЛО: как расследовать и не… На Reddit и в локальных группах всё чаще появляются сообщения о загадочных красных светящихся шарах. В 2025 году сценарий неизменен:…

Крах моделей ИИ: почему нейросети могут «сойти с ума» без людей

Похожие записи

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

Новости науки: Марс, римские дороги и тайна двух видов воды

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

Добавить комментарийОтменить ответ

Космический лучник: обнаружена радиогалактика в форме лука и стрелы

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

Новости науки: Марс, римские дороги и тайна двух видов воды

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

«Они ныряют в суп с ложек»: учёный — о грибе, который заставляет видеть сотни эльфов и гномов

Литиевая ловушка: США хотят снизить зависимость от импорта, но воде негде взяться для новых рудников

Шум, который стал союзником: чип превратил главную слабость квантовых компьютеров в программируемый инструмент

Свежие записи

Космический лучник: обнаружена радиогалактика в форме лука и стрелы

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Архивы

Рубрики

Подписаться на блог по эл. почте