Uber охладил хайп вокруг расходов на LLM

Операционный директор Uber публично сказал простую вещь: рост расходов на токены для больших языковых моделей все сложнее оправдать, если бизнес не видит прямой отдачи. Для AI implementation это важный сигнал. Эра безлимитных экспериментов заканчивается, и теперь компании считают не вау-эффект, а реальный и измеримый полезный бизнес-результат.

Технический контекст

Я зацепился здесь не за сам заголовок, а за формулировку. COO Uber Эндрю Макдоналд фактически сказал: токенов тратим больше, а понятной прибавки в продуктовой пользе не видно. Для меня это очень знакомая картина из реальных проектов по AI automation, когда команда легко наращивает вызовы моделей, а вот связь с метриками бизнеса быстро размывается.

Первичный источник тут один: интервью, которое пересказал Business Insider. Там же всплыл показательный эпизод: внутри Uber обсуждали, что бюджет на Claude Code на 2026 год уже исчерпан, и это стало тем самым моментом, когда люди перестали смотреть на LLM как на почти бесплатную магию. И правильно, потому что для отдельного сотрудника промпт стоит копейки, а для компании в сумме это уже архитектурное решение с вполне земным счетом.

Меня здесь особенно цепляет не сумма сама по себе, а отсутствие прямой линии между расходом и выходом. Если я не могу показать, что больше токенов дали хотя бы заметно быстрее релизы, лучшее качество поддержки или больше автоматизированных операций, значит у меня не AI integration, а дорогая привычка.

И да, новость свежая, май 2026, так что это не ретроспектива. Это уже новый тон рынка: сначала счетчик токенов, потом красивые демо.

Влияние на бизнес и автоматизацию

Я вижу тут три практических вывода. Первый: компании будут резать не сам ИИ, а бессистемное потребление моделей без маршрутизации, кэша, лимитов и оценки, где действительно нужен дорогой LLM, а где хватит более простой связки.

Второй: выиграют команды, которые считают unit economics на уровне сценария. Не «мы внедрили ИИ», а «этот агент сократил время разбора тикета на 42% и окупает себя за квартал». Именно так и выглядит нормальная AI solution development, а не просто покупка доступа к очередной модели.

Проиграют те, кто строил внутренние процессы на бесконтрольном копилоте и не думал про AI architecture. Я это регулярно вижу: стоит поставить реальные лимиты, и внезапно половина цепочек оказывается лишней.

Если у вас похожая история и расходы на модели уже спорят с наймом, давайте разберем это по-взрослому. В Nahornyi AI Lab мы обычно начинаем не с новой модели, а с карты процессов, после чего можно собрать AI automation так, чтобы бизнес платил за результат, а не за красивое сгорание токенов.

Ранее мы разбирали технические способы радикально снизить потребление токенов, например, за счет передачи ИИ-агентам облегченной Markdown-разметки вместо тяжелого HTML. Подобные архитектурные оптимизации становятся жизненно необходимыми именно сейчас, когда крупный бизнес начинает всерьез сомневаться в рентабельности генеративных моделей.

Поделиться статьёй

Twitter/X LinkedIn Telegram

Uber охладил хайп вокруг расходов на LLM

Технический контекст

Влияние на бизнес и автоматизацию

Ещё новости

Gemma 4 стала заметно практичнее на edge

364M параметров и новый шанс для on-device AI