Технический контекст
Я поковырялся в том, как сейчас раздают nex-agi/nex-n2-pro, и тут самое полезное не в красивых лозунгах, а в пороге входа. Модель уже висит на OpenRouter как nex-agi/nex-n2-pro:free, то есть для быстрой проверки AI automation сценариев не нужно сразу открывать бюджет.
Это демка, и да, «платить потом» тут звучит буквально: бесплатный доступ заявлен как временный. Но для меня это как раз удобный момент взять свои реальные промпты, tool calling, structured outputs и посмотреть, где модель тянет, а где начинает плыть.
По железу это не игрушка: 397B MoE, около 17B активных параметров, база на Qwen3.5-397B-A17B. Контекст заявлен до 262k токенов, есть text + image input, function calling и режимы reasoning, так что это уже не просто «еще одна LLM», а заготовка под нормальную AI integration в рабочие пайплайны.
По бенчмаркам цифры у них дерзкие: 80.8 на SWE-Bench Verified, 58.8 на SWE-Bench Pro, 75.3 на Terminal-Bench 2.1, 83.7 на BrowseComp. Я на такие числа всегда смотрю с прищуром, потому что это вендорская подача, а не независимый аудит, но набор метрик хотя бы показывает, куда модель целится: код, агенты, браузинг, инструменты.
Из живых отзывов картина тоже знакомая. Людям нравится качество на side-задачах, но рядом почти сразу всплывают два старых друга: нестабильность и скорость. То есть восторг понятен, назад правда пути нет, но в прод я бы такую штуку пускал только после своих нагрузочных тестов.
Что это меняет для бизнеса и автоматизации
Первое: стало дешевле проверять гипотезы. Если вы хотите build AI automation для саппорта, внутреннего поиска, кодовых агентов или обработки документов, бесплатная демка убирает лишнюю паузу перед тестом.
Второе: open-weight модели все ближе к задачам, где раньше без frontier API было грустно. Это уже влияет на AI architecture: где-то можно уйти от дорогого провайдера, а где-то собрать гибридную схему с fallback по качеству и цене.
Проиграют здесь те, кто до сих пор выбирает модель по скриншоту из бенчмарка. Выиграют команды, которые умеют мерить latency, tool reliability, стоимость маршрутизации и держать резервный контур. Мы в Nahornyi AI Lab как раз такие штуки и собираем для клиентов: не «магия AI», а рабочая система с понятными ограничениями.
Если у вас назрела AI implementation история и вы хотите понять, потянет ли такая модель ваш реальный процесс, давайте разберем его на куски. В Nahornyi AI Lab я обычно быстро собираю тестовый контур, чтобы стало видно, где достаточно одной модели, а где лучше сразу создавать кастомный AI-агент под конкретную нагрузку.