Время как мера интеллекта: как длительность задач раскрывает возможности ИИ

Ученые предложили новый способ оценки возможностей искусственного интеллекта (ИИ) — по тому, насколько быстро системы могут справляться с задачами, которые обычно выполняют люди. Хотя современные модели ИИ превосходят человека в предсказании текста или решении тестовых заданий, их эффективность резко падает, когда речь заходит о сложных, многоэтапных проектах, таких как управленческая аналитика или долгосрочное планирование.

Чтобы измерить этот разрыв, исследователи из организации Model Evaluation & Threat Research (METR) предложили сравнивать, сколько времени тратит ИИ на выполнение задач разной сложности в сравнении с человеком. Результаты, опубликованные 30 марта в базе препринтов arXiv, показывают: чем дольше задача, тем хуже с ней справляется ИИ.

От минут к часам: где ИИ теряет эффективность

Ученые обнаружили, что модели ИИ успешно выполняют задания, на которые у человека уходит менее 4 минут, почти в 100% случаев. Однако для задач, требующих более 4 часов, показатель успеха падает до 10%. При этом новейшие модели, такие как GPT-4 и Claude 3 Opus, справляются с длительными задачами лучше, чем их предшественники.

Почему это важно?

Скорость прогресса: За последние 6 лет способность ИИ выполнять задачи с 50%-ной надежностью удваивается каждые 7 месяцев.
Прогноз на 2032 год: Если тенденция сохранится, ИИ сможет автоматизировать месячный объем работы программиста уже через 8 лет.

Как тестировали ИИ?

Для исследования использовали разные модели — от Sonnet 3.7 до GPT-4 — и давали им задачи разной сложности:

Простые (поиск фактов в Википедии, ответы на короткие вопросы).
Сложные (написание кода на CUDA, исправление ошибок в PyTorch).

Для оценки применяли инструменты HCAST (189 задач по машинному обучению и кибербезопасности) и RE-Bench (сравнение с инженерами-людьми). Также ученые ввели понятие «беспорядочности» задач — чем больше в них параллельных процессов и неопределенности, тем сложнее ИИ.

Что это значит для будущего?

Универсальные ИИ-агенты уже близко
По прогнозам экспертов, к 2026 году ИИ сможет решать разнообразные задачи в течение дней или недель, а не только короткие запросы.
- Для бизнеса: ИИ возьмет на себя рутинные процессы, снижая затраты и высвобождая время для творческих задач.
- Для пользователей: Виртуальные ассистенты смогут планировать путешествия, следить за здоровьем или управлять финансами почти автономно.
Новый эталон для оценки ИИ
Традиционные тесты (например, точность ответов) не учитывают длительность и сложность реальных задач. Метрика на основе времени дает более практичное понимание возможностей ИИ.

«Измерение ИИ по времени выполнения задач — это не идеальный, но крайне полезный индикатор», — отмечает Сохроб Казеруниан, эксперт по ИИ из Vectra AI.

Вывод: ИИ учится думать дольше

Исследование подтверждает: главный вызов для ИИ — не знания, а способность удерживать внимание и координировать действия в долгосрочной перспективе. И если текущие темпы роста сохранятся, через несколько лет мы увидим истинно универсальные системы, способные заменить человека в куда более широком спектре задач, чем сегодня.

Остается вопрос: готово ли общество к такому будущему?

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

28 июня, 2026

Наука

Пределы преданности: как климатический хаос разрушает семьи обезьян

28 июня, 2026

Наука

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

27 июня, 2026

Наука

Новости науки: Марс, римские дороги и тайна двух видов воды

27 июня, 2026

Наука

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

27 июня, 2026

Наука

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

27 июня, 2026

Добавить комментарийОтменить ответ

Тайна Варжиньи: Бразильский Розуэлл и нераскрытые… В 1996 году тихий бразильский город Варжинья оказался в эпицентре глобального внимания после сообщений о странных существах и крушении НЛО.…

Раскрытие правды об НЛО как прикрытие: Что скрывают… Использует ли государство тему НЛО, чтобы скрыть правду о Джеффри Эпштейне? Последние недели стали полем столкновения двух самых громких историй…

Загадочные огни Патагонии: Тайна, озадачившая учёных 21 января в 0:22 по местному времени в безмолвии чилийской Патагонии камера-ловушка, установленная для наблюдения за дикой природой в рамках…

Столкновение в небе: как ракета «Хеллфайр»… Видео с НЛО, в которое попадает ракета «Хеллфайр» — под таким заголовком в Конгрессе США обсуждали новый радарный ролик, показанный…

Подводные магистрали НЛО: Почему океан стал… НПО (Неопознанный Погруженный Объект) — это неопознанный аномальный феномен (НАФ), взаимодействующий с водой или перемещающийся между воздухом и морем. Случаи…

Загадка временных сдвигов: реальность, иллюзия или… В 2025 году участились сообщения о «временных сдвигах»: покупатели заходят в магазины, будто застывшие в прошлом, водители теряют 10 минут…

Экс-аналитик ЦРУ раскрыл шокирующие детали об НЛО:… Джон Рамирес, бывший аналитик электронной разведки (ELINT) ЦРУ с 25-летним опытом изучения радарных сигналов и ракетных систем, поделился сенсационными подробностями…

Таинственный гость: на камеру попал загадочный… Домовладелица Джессика Ортис поделилась странным видео, на котором запечатлено небольшое серое существо с необычной формой головы, быстро пересекающее её подъездную…

Загадка боливийской мумии: раскрыта тайна древнего… Необычная мумифицированная голова, обнаруженная в Боливии более века назад, оказалась не тем, чем её считали раньше. Новое исследование показало, что…

Загадка красных шаров НЛО: как расследовать и не… На Reddit и в локальных группах всё чаще появляются сообщения о загадочных красных светящихся шарах. В 2025 году сценарий неизменен:…

Время как мера интеллекта: как длительность задач раскрывает возможности ИИ

От минут к часам: где ИИ теряет эффективность

Как тестировали ИИ?

Что это значит для будущего?

Вывод: ИИ учится думать дольше

Похожие записи

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

Новости науки: Марс, римские дороги и тайна двух видов воды

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

Добавить комментарийОтменить ответ

Космический лучник: обнаружена радиогалактика в форме лука и стрелы

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Точка невозврата: как изменился бы мир, если бы Карфаген победил Рим

Новости науки: Марс, римские дороги и тайна двух видов воды

Когда снимку Земли больше не верят: как ИИ разрушает доверие к научным изображениям

Как римляне строили свои знаменитые прямые дороги: три прибора, один из которых не найден до сих пор

«Они ныряют в суп с ложек»: учёный — о грибе, который заставляет видеть сотни эльфов и гномов

Литиевая ловушка: США хотят снизить зависимость от импорта, но воде негде взяться для новых рудников

Шум, который стал союзником: чип превратил главную слабость квантовых компьютеров в программируемый инструмент

Свежие записи

Космический лучник: обнаружена радиогалактика в форме лука и стрелы

Холодная сварка в космосе: почему металлы слипаются без клея и кислорода

Пределы преданности: как климатический хаос разрушает семьи обезьян

Архивы

Рубрики

Подписаться на блог по эл. почте