Skip to main content
AI agentsrate limitsChronicle

Chronicle тихо жжет лимиты API

Похоже, Chronicle запускает фоновых sandboxed-агентов, которые строят memory по скриншотам и быстро расходуют rate limits. Для бизнеса это неприятно: AI automation начинает внезапно упираться в квоты, хотя в интерфейсе расход токенов может выглядеть неполным. Это грозит сбоями в продакшене и скрытым перерасходом бюджета.

Технический контекст

Я зацепился за эту историю не из-за красивого бага, а из-за очень знакомого паттерна: включаешь AI automation, а лимиты улетают куда-то в фон. По описанию, Chronicle гоняет sandboxed-агентов в фоне, чтобы собирать memory из снимков экрана, и именно они быстро съедают rate limits.

Тут важен не сам факт фоновой работы, а то, как она учитывается. Если пользователь смотрит на счетчик токенов в интерфейсе и не видит явного расхода, а квота при этом падает, значит метering идет не на том уровне. Я такое видел в агентных системах не раз: видимый чат дешевый, а настоящие затраты сидят в скрытых шагах, ретраях, tool calls и длинном контексте.

Официального разбора именно по Chronicle я не нашел, так что говорю честно: это пока выглядит как подтвержденная особенность по пользовательскому сообщению, а не как документированное поведение вендора. Но сама механика абсолютно правдоподобная. Если агент в фоне анализирует пачки изображений, собирает память, делает промежуточные вызовы и еще повторяет их при сбоях, лимиты улетают очень быстро.

И вот здесь я бы смотрел не на “токены в UI”, а на три вещи: логи вызовов по агенту, расход по workflow и сверку с дашбордом провайдера API. Если цифры не бьются, почти всегда виноваты скрытые вызовы, фоновые задачи или неочевидные retry-цепочки.

Что это меняет для бизнеса и автоматизации

Для команды это плохой сюрприз: вы думаете, что запас квоты есть, а прод-процесс уже начинает тормозить. Особенно больно там, где artificial intelligence integration завязана на поддержку, ресерч или внутренние операционные пайплайны.

Выигрывают те, кто считает бюджет не “на пользователя”, а “на агента и сценарий”. Проигрывают все, кто верит только фронтовому счетчику и не ставит жесткие лимиты на фоновые процессы.

Я бы сразу делал три шага: резал контекст, ставил token budget до старта workflow и выносил фоновых агентов под отдельную квоту. Мы в Nahornyi AI Lab именно такие узкие места и разбираем у клиентов: где агент жрет лимит, где ломается AI architecture, и как собрать нормальную AI solution development без тихих потерь. Если у вас автоматизация уже начала странно упираться в квоты, можно быстро пройтись по цепочке и собрать систему так, чтобы AI implementation не сжигала бюджет за спиной у команды.

Ранее мы разбирали, как Anthropic скрытно понижала производительность Claude, а затем вернула прозрачность после скандала. Эта история перекликается с тем, как Codex теперь тайно сжигает лимиты — пользователи снова сталкиваются с непрозрачностью ИИ-сервисов.

Поделиться статьёй