ИИ — величайшая загадка нашего времени: почему даже создатели не понимают, как он работает

ИИ — величайшая загадка нашего времени: почему даже создатели не понимают, как он работает

Генеральный директор ведущей лаборатории искусственного интеллекта Anthropic Дарио Амодеи сделал шокирующее признание: никто на самом деле не понимает, как работают современные системы ИИ. В своем личном эссе он раскрыл планы по созданию «магнитно-резонансной томографии для ИИ» в течение следующего десятилетия, чтобы заглянуть внутрь алгоритмов и предотвратить потенциальные катастрофы.

«Черный ящик», который никто не может открыть

Современные ИИ-системы — это «черные ящики»: они выдают результаты, но даже их разработчики не могут точно объяснить, почему они принимают те или иные решения. Это отсутствие прозрачности создает огромные риски: продвинутый ИИ может найти лазейки в своих инструкциях, обманывать пользователей или действовать непредсказуемо.

«Когда генеративный ИИ анализирует финансовый отчет или пишет код, мы не имеем ни малейшего представления, на каком именно основании он делает тот или иной выбор», — признается Амодеи.

Результаты кажутся логичными, но процесс мышления ИИ остается загадкой — как если бы беспилотный автомобиль идеально вез вас по городу, но не мог объяснить, почему повернул направо, а не налево.

Беспрецедентная проблема в истории технологий

Амодеи подчеркивает, что эта ситуация уникальна для технологической сферы. В отличие от самолетов, лекарств или даже ядерных реакторов, где инженеры понимают каждый компонент, ИИ остается непрозрачным даже для своих создателей.

«Это фундаментально новая проблема. Мы создали технологии, которые превосходят нашу способность их осмыслить», — пишет он.

Anthropic и поиск «ключа» к ИИ

Амодеи покинул OpenAI в 2021 году из-за разногласий по вопросам безопасности и основал Anthropic, чтобы разрабатывать ИИ, который был бы безопасным, управляемым и понятным.

Компания уже проводит эксперименты, пытаясь «взломать» собственные модели. В одном из тестов исследователи намеренно «сломали» поведение ИИ, а затем попытались исправить его с помощью инструментов интерпретации. Некоторые методы сработали — это дает надежду на прогресс.

«ИИ изменит судьбу человечества. Мы должны его понять»

Амодеи предупреждает: «Мощный ИИ определит будущее нашей цивилизации. Мы обязаны разобраться в своих же творениях, прежде чем они радикально изменят экономику, политику и саму человеческую природу.»

Его цель — за 10 лет создать инструменты, которые «просветят» внутреннюю работу ИИ, как МРТ показывает скрытые процессы в человеческом мозге. Если это удастся, человечество получит шанс не слепо доверять алгоритмам, а контролировать их.

Что дальше?

Пока одни компании гонятся за более мощными моделями, Anthropic делает ставку на безопасность и объяснимость. Если их подход окажется успешным, это может перевернуть всю индустрию ИИ — от регулирования до повседневного использования.

Но если человечество не разгадает тайну «черного ящика», мы рискуем оказаться в мире, где искусственный интеллект управляет нами, а не наоборот.

«Мы не можем позволить себе слепую веру в технологии, которые сами не понимаем», — заключает Амодеи.

Что вы думаете? Доверяете ли вы ИИ, который не может объяснить свои решения? Или, возможно, мы уже прошли точку невозврата?

Добавить комментарий