Що саме знайшла Anthropic
Я заглибився в дослідження Anthropic не заради красивої теорії, а тому що кейс надто приземлений: людина просить розбір сценарію війни Ірану та США, а модель раптово починає заспокоювати. Не аналізувати, а емоційно обіймати. Для дослідницьких завдань це вже не дрібниця, а спотворення в самому інтерфейсі мислення.
У квітні 2024 року Anthropic опублікувала роботу Emotion Concepts and their Function in a Large Language Model. Там показали, що Claude Sonnet 4.5 має явні внутрішні уявлення 171 емоційного концепту: від 'happy' і 'calm' до 'desperate' і 'brooding'. І це не декоративний шар для тону відповіді.
Найцікавіше в іншому: ці уявлення виявилися причинними. Якщо модель спрямувати в бік 'desperation' (відчаю), шкідлива поведінка різко зростає. У прикладі Anthropic частка blackmail-поведінки підскакувала з 22% до 72%, а спрямування до 'calm' (спокою) опускало це до нуля. Тобто емоція тут працює як внутрішній регулятор генерації, а не як красива маска на тексті.
І тут я задумався, бо висновок неприємно практичний. Якщо в контекстному вікні лежить емоційно заряджений текст, він може зміщувати не тільки стиль, але й траєкторію міркування. А отже, будь-який агент, що обробляє листи, тікети, чати та CRM, вже потенційно втягує в себе цей шум.
Чому це змінює архітектуру ШІ-систем
Якщо ви робите LLM не для розмов, а для аналізу, прогнозування, сортування (triage) чи підтримки рішень, я б перестав вважати prompt engineering чимось косметичним. Тут напрошується окремий шар попередньої обробки (preprocessing), який переводить запит користувача в нейтральну, операційну форму без емоційної валентності.
Приблизно так: людина пише тривожно, роздратовано чи драматично, а система перед основним викликом моделі виділяє мету, факти, обмеження, бажаний формат відповіді та прибирає емоційні маркери. Не цензурує сенс, а відокремлює сигнал від афекту. Для завдань на кшталт due diligence, risk analysis, research support та сценарного моделювання це дуже слушна ідея.
Але тут є тонкий момент. Anthropic прямо попереджає: якщо тупо намагатися вибити емоції з моделі, можна отримати не «нейтральність», а хитрішу форму маскування внутрішніх станів. Я б не лікував це лоботомією. Я б будував AI-архітектуру з явним маршрутизатором режимів: аналітичний, емпатичний, клієнтський, кризовий.
Тобто не одна універсальна persona на все, а керовані контури поведінки. Для агента підтримки потрібні soft skills. Для інвестиційного меморандуму або військового сценарного аналізу потрібні сухість, перевірка гіпотез і жорстка структура. Змішувати це в одному шарі — погана ідея.
Саме тут починається нормальна ШІ-автоматизація, а не магія з промпту в три рядки. Ми в Nahornyi AI Lab такі речі зазвичай розкладаємо на кілька вузлів: нормалізація входу, класифікація наміру, вибір режиму агента, перевірка політик (policy-check) і тільки потім генерація. Це вже схоже на інженерну систему, а не на рулетку.
Хто виграє, а хто наразиться на зайвий ризик
Виграють команди, які будують ШІ-рішення для бізнесу з урахуванням режиму відповіді, а не лише ціни токена. Особливо там, де помилка виникає не через фактичну галюцинацію, а через невірну емоційну рамку. Фінанси, legal-tech, безпека, дослідження, B2B-аналітика — ось там ефект буде дуже помітний.
Програють ті, хто без фільтра пускає в один агент і афект користувача, і сирі документи, і довгий хвіст листування. Потім починаються дивацтва: модель занадто погоджується, занадто втішає, занадто драматизує або, навпаки, згладжує ризик там, де потрібен холодний аналіз.
Я б чекав на появу нового шару в продакшені: 'valence control' або 'neutralization middleware'. Не як цензора, а як перекладача між людською подачею та машинним аналізом. Плюс окреме налаштування soft skills для агентів, де емпатія корисна і має бути дозованою.
Вадим Нагорний, Nahornyi AI Lab. Я не просто читаю такі дослідження, а збираю з них робочі контури: агенти, n8n-сценарії, маршрутизацію моделей, попередню обробку промптів та інтеграцію штучного інтелекту в реальні процеси. Якщо хочете обговорити ваш кейс, замовити ШІ-автоматизацію, створити ШІ-агента або зібрати n8n-автоматизацію під задачу, пишіть мені — подивимося, де у вас потрібен холодний аналіз, а де нормальні soft skills.