Технічний контекст
Я б не списував Hermes як черговий твіттерний перегрів. Коли модель починають масово використовувати в локальних збірках, OpenRouter та агентних пайплайнах, я зазвичай йду не в меми, а в документацію та реальні тести. Тут якраз цікавий не хайп сам по собі, а потенціал для AI-автоматизації без жорсткої прив'язки до одного вендора.
Якщо коротко, Hermes — це open-source серія від Nous Research, створена на базі Llama і донавчена для діалогів, інструкцій, виклику функцій (function calling) та міркувань (reasoning). У свіжих ітераціях найчастіше обговорюють Hermes 3, а поруч вже з'являється Hermes 4 з гібридним режимом міркування. І ось тут якраз я зупинився: вони намагаються поєднати швидку відповідь і глибше «подумати перед відповіддю» в одній моделі, а не розводити це по різних стеках.
За розмірами є версії 8B, 70B і 405B. Практичний сенс простий: 8B можна досить жваво запускати локально або в дешевому контурі для інференсу, 70B вже виглядає як серйозний кандидат для продакшн-завдань, а 405B — це скоріше історія для тих, хто реально вміє рахувати залізо та затримку (latency). Для AI-інтеграції це зручно: можна тримати одну логіку продукту і підміняти клас моделі під бюджет та SLA.
Що мені подобається в Hermes на папері, так це акцент на агентних сценаріях. Вони явно готували модель під багатовиткові діалоги, виклик функцій і більш передбачувану роботу в ланцюжках використання інструментів (tool-use). До того ж, у Nous є Hermes Agent, self-hosted open-source агент з пам'яттю та конекторами до месенджерів, пошти та CLI. Не ідеальна срібна куля, але як полігон для перевірки AI-архітектури ідея здорова.
Чого поки не вистачає? Жорстких свіжих порівнянь, яким я б довіряв беззастережно. У пошуковій видачі багато загальних формулювань про «advanced reasoning» та «surpassing many finetunes», але мало цифр, після яких можна впевнено сказати: так, ось це вже прямий удар по закритих моделях у конкретному класі завдань.
Що це змінює для бізнесу та автоматизації
Для команд, які не хочуть сидіти на одному API, Hermes виглядає як нормальний кандидат на прототипи та частину продакшн-сценаріїв. Особливо там, де важливі виклик функцій, контроль над стеком і можливість розгорнути все ближче до своїх даних.
Виграють ті, кому потрібна гнучкість: внутрішні асистенти, агенти підтримки, сортування вхідних завдань, напівавтономні робочі процеси. Програють ті, хто чекає магії «з коробки»: open-source модель майже завжди вимагає налаштування, тестів та нормальної інфраструктури, інакше якість буде нестабільною.
Ми в Nahornyi AI Lab вирішуємо якраз цей неприємний прошарок між «модель прикольна» і «вона реально економить години команді». Якщо у вас вже сверблять руки спробувати Hermes для розробки AI-рішень, можна швидко розкласти ваш процес, перевірити ризики та зібрати AI-автоматизацію так, щоб це працювало не в треді на X, а у вашому бізнесі.