Сможем ли мы когда-нибудь расшифровать язык инопланетян?

Олаф Липински: В научно-фантастическом фильме 2016 года «Прибытие» перед лингвистом стоит сложная задача расшифровать инопланетный язык, состоящий из палиндромных фраз, которые читаются так же, как и задом наперед, и написаны круглыми символами. По мере того как она обнаруживает различные подсказки, разные страны мира по-разному интерпретируют эти послания — некоторые считают, что они несут угрозу.

Если бы человечество оказалось в подобной ситуации сегодня, то лучшим выходом было бы обратиться к исследованиям, раскрывающим, как искусственный интеллект (ИИ) разрабатывает языки.

Но что именно определяет язык? Большинство из нас использует хотя бы один из них для общения с окружающими, но как он появился? Лингвисты размышляют над этим вопросом уже несколько десятилетий, однако простого способа выяснить, как развивался язык, не существует.

Язык эфемерен, он не оставляет заметных следов в окаменелостях. В отличие от костей, мы не можем раскопать древние языки, чтобы изучить, как они развивались с течением времени.

Хотя мы не можем изучить истинную эволюцию человеческого языка, возможно, симуляция могла бы дать некоторые сведения. Именно здесь на помощь приходит ИИ — увлекательная область исследований под названием «эмерджентная коммуникация», на изучение которой я потратил последние три года.

Чтобы смоделировать, как может развиваться язык, мы даем агентам (ИИ) простые задачи, требующие общения, например игру, в которой один робот должен провести другого к определенному месту на сетке, не показывая ему карту. Мы не устанавливаем (почти) никаких ограничений на то, что и как они могут говорить — мы просто даем им задачу и позволяем решать ее так, как они хотят.

Поскольку решение этих задач требует от агентов общения друг с другом, мы можем изучить, как развивается их общение с течением времени, чтобы получить представление о том, как может развиваться язык.

Подобные эксперименты проводились и с людьми. Представьте, что вы, носитель английского языка, работаете в паре с человеком, не говорящим по-английски. Ваша задача — дать партнеру указание взять зеленый кубик из набора предметов на столе.

Вы можете попытаться изобразить руками форму куба и указать на траву за окном, чтобы обозначить зеленый цвет. Со временем вы вместе выработаете своего рода протоязык.

Возможно, вы создадите специальные жесты или символы для обозначения «куба» и «зеленого». При многократном взаимодействии эти импровизированные сигналы станут более утонченными и последовательными, образуя базовую систему коммуникации.

Аналогичным образом это происходит и с ИИ. Путем проб и ошибок они учатся говорить об объектах, которые видят, а их собеседники учатся их понимать.

Но как мы узнаем, о чем они говорят? Если они развивают этот язык только со своим искусственным собеседником, а не с нами, как мы узнаем, что означает каждое слово? Ведь конкретное слово может означать «зеленый», «куб» или, что еще хуже, и то, и другое. Эта проблема интерпретации — ключевая часть моего исследования.

Взламывая код

Задача понимания языка ИИ поначалу может показаться практически невыполнимой. Если бы я попробовал поговорить по-польски (мой родной язык) с сотрудником, который говорит только по-английски, мы бы не смогли понять друг друга или даже узнать, где начинается и заканчивается каждое слово.

С языками искусственного интеллекта проблема еще сложнее, поскольку они могут организовывать информацию способами, совершенно чуждыми человеческим лингвистическим шаблонам.

К счастью, лингвисты разработали сложные инструменты, использующие теорию информации для интерпретации неизвестных языков.

Подобно тому как археологи собирают древние языки из фрагментов, мы используем шаблоны в разговорах ИИ, чтобы понять их лингвистическую структуру. Иногда мы находим удивительные сходства с человеческими языками, а иногда открываем совершенно новые способы общения.

Эти инструменты помогают нам заглянуть в «черный ящик» общения ИИ, показывая, как искусственные агенты разрабатывают свои собственные уникальные способы обмена информацией.

Моя недавняя работа посвящена использованию того, что видят и говорят агенты, для интерпретации их языка. Представьте, что у вас есть стенограмма разговора на неизвестном вам языке, а также то, на что смотрел каждый из говорящих. Мы можем сопоставить паттерны в стенограмме с объектами в поле зрения участника, выстраивая статистические связи между словами и объектами.

Например, возможно, фраза «yayo» совпадает с пролетающей мимо птицей — мы можем предположить, что «yayo» — это слово говорящего, означающее «птица». Внимательно анализируя эти закономерности, мы можем начать расшифровывать смысл общения.

В последней работе, написанной мной и моими коллегами и опубликованной в материалах конференции Neural Information Processing Systems (NeurIPS), мы показываем, что такие методы могут быть использованы для реверс-инжиниринга, по крайней мере, части языка и синтаксиса ИИ, что дает нам понимание того, как они могут строить коммуникацию.

Инопланетяне и автономные системы

Как это связано с инопланетянами? Методы, которые мы разрабатываем для понимания языков ИИ, могут помочь нам расшифровать любые будущие инопланетные сообщения.

Если нам удастся получить письменный инопланетный текст вместе с некоторым контекстом (например, визуальной информацией, относящейся к тексту), мы сможем применить те же статистические инструменты для его анализа. Подходы, которые мы разрабатываем сегодня, могут стать полезными инструментами для будущего изучения инопланетных языков, известного как ксенолингвистика.

Но нам не нужно искать инопланетян, чтобы извлечь пользу из этих исследований. Существует множество применений, от улучшения языковых моделей, таких как ChatGPT или Claude, до улучшения коммуникации между автономными транспортными средствами или беспилотниками.

Расшифровывая возникающие языки, мы можем сделать будущие технологии более понятными. Будь то знание того, как самодвижущиеся автомобили координируют свои движения или как системы искусственного интеллекта принимают решения, мы не просто создаем интеллектуальные системы — мы учимся их понимать».

Олаф Липински, аспирант кафедры искусственного интеллекта Саутгемптонского университета.

Поделитесь в вашей соцсети👇