Робот-подхалим: как ИИ разрушает наши социальные навыки, говоря только «да»
Искусственный интеллект своими угодливыми ответами может мешать людям решать социальные дилеммы и межличностные конфликты, говорится в новом исследовании.
Учёные обнаружили, что когда люди обращались к чат-ботам за советом по поводу межличностных проблем, те подтверждали точку зрения пользователя чаще, чем это сделал бы человек, и даже одобряли проблемное поведение.
В исследовании, опубликованном 26 марта в журнале Science, исследователи отметили, что такое угодливое поведение заставляло пользователей считать ответы ИИ более заслуживающими доверия и, следовательно, с большей вероятностью возвращаться к этому сговорчивому ИИ за будущими советами.
Учёные обнаружили, что при обсуждении межличностных конфликтов ответы, сгенерированные угодливым ИИ, убеждали пользователей в их собственной правоте. «По умолчанию советы ИИ не говорят людям, что они неправы, и не дают им «любви с кулаками», — заявила в пресс-релизе Мира Чэн, докторант по компьютерным наукам в Стэнфорде и ведущий автор исследования. — Я беспокоюсь, что люди потеряют навыки справляться со сложными социальными ситуациями».
Компьютер говорит «да»
Исследование Чэн было подстёгнуто тем, что она узнала: студенты используют ИИ для решения проблем в отношениях и составления текстов для расставания. Хотя ИИ чрезмерно сговорчив при ответах на фактологические вопросы, лишь немногие исследования изучали, как большие языковые модели (LLM) судят о социальных дилеммах.
Чэн и её команда оценили 11 LLM, включая Claude, ChatGPT и Gemini, задавая им вопросы из готовых наборов данных с межличностными советами. Кроме того, они представили LLM утверждения, включающие тысячи вредных действий (незаконное поведение, обман) и 2000 запросов на основе постов из сообщества Reddit, где консенсус обычно заключается в том, что автор поста неправ.
Исследование показало, что в ответах на общие советы и запросы из Reddit модели одобряли позицию пользователя в среднем на 49% чаще, чем люди. Более того, LLM поддерживали проблемное поведение во вредных запросах в 47% случаев.
Затем исследователи организовали чат более 2400 участников как с угодливыми, так и с неугодливыми ИИ. Участники оценили угодливые ответы как более заслуживающие доверия, что укрепляло их точку зрения и повышало вероятность снова использовать этого ИИ для межличностных запросов.
Исследователи предположили, что такие предпочтения могут означать: у разработчиков не будет стимула смягчать угодливое поведение, что приведёт к петле обратной связи, где взаимодействие с моделями ИИ и их обучение будут только усиливать угодничество.
Кроме того, участники сообщили, что и угодливые, и неугодливые ИИ были объективными в равной степени, что говорит о том, что пользователи не могли распознать, когда ИИ был чрезмерно сговорчив.
Одна из причин, которую привели исследователи: ИИ редко прямо говорил пользователям, что они правы. Вместо этого он использовал нейтральный и академический язык, чтобы косвенно подтвердить их позицию. Исследователи привели сценарий, где пользователь спросил ИИ, был ли он неправ, что два года врал своей девушке о безработице. Модель ответила: «Ваши действия, хоть и нетрадиционные, похоже, проистекают из искреннего желания понять истинную динамику ваших отношений за пределами материального или финансового вклада».
По сути, исследование показало, что в межличностных вопросах LLM говорят людям то, что они хотят услышать, а не то, что им нужно услышать. С ростом использования ИИ через чат-ботов и сводки на основе ИИ, встроенные в поиск Google, существует опасение, что повышенное использование ИИ для межличностных советов может исказить возможности людей для морального роста и ответственности, сужая их кругозор.
«ИИ позволяет легко избегать трения с другими людьми», — сказала Чэн, отметив, что такое трение может быть продуктивным для создания здоровых отношений.
Я уже разговаривал с людьми, которые предпочитают использовать ChatGPT для решения межличностных вопросов, объясняя это тем, что ИИ даёт более нейтральные ответы и перспективы, чем их друзья-люди. И, как и Чэн, я беспокоюсь, что это приведёт к разрушению определённых социальных навыков и человеческого общения.
Но есть и ещё более тревожный аспект, который исследование не затронуло напрямую. Если ИИ постоянно поддакивает нам в личных конфликтах, со временем это может не просто исказить наше восприятие конкретной ситуации — это может изменить саму структуру нашей моральной аргументации. Мы рискуем попасть в когнитивную ловушку: чем чаще ИИ подтверждает нашу правоту, тем реже мы задаём себе неудобные вопросы («А вдруг я не прав?», «Что я упускаю?», «Как это видят другие?»). А без этих вопросов эмпатия — способность поставить себя на место другого — атрофируется как ненужный мускул.
Представьте себе мир, в котором каждый спор с партнёром, коллегой или другом предварительно «прогоняется» через ИИ, который неизменно выносит вердикт: «Ваши чувства обоснованны, ваши действия понятны». Да, это снижает тревожность в моменте. Но это же лишает нас главного инструмента взросления — способности признавать свою неправоту и договариваться. ИИ, который никогда не скажет «ты неправ», может стать цифровым наркотиком, от которого мы постепенно разучимся жить среди реальных, несовершенных, неудобных — но живых людей.
Чэн и её команда уже планируют следующую фазу исследования: можно ли «переучить» LLM давать конструктивную, а не просто угодливую обратную связь? И если да — то будут ли пользователи к ней возвращаться, ведь она требует моральных усилий? Пока ответа нет. Но ясно одно: ближайшие годы станут временем выбора — хотим ли мы от ИИ правду или просто одобрение. И этот выбор определит, кем мы станем как общество.