Технічний контекст
Я зачепився тут не за сам заголовок, а за формулювання. COO Uber Ендрю Макдоналд фактично сказав: токенів витрачаємо більше, а зрозумілої надбавки в продуктовій користі не видно. Для мене це дуже знайома картина з реальних проєктів з AI automation, коли команда легко нарощує виклики моделей, а ось зв'язок із метриками бізнесу швидко розмивається.
Первинне джерело тут одне: інтерв'ю, яке переказав Business Insider. Там же сплив показовий епізод: усередині Uber обговорювали, що бюджет на Claude Code на 2026 рік уже вичерпано, і це стало тим самим моментом, коли люди перестали дивитися на LLM як на майже безкоштовну магію. І правильно, бо для окремого співробітника промпт коштує копійки, а для компанії в сумі це вже архітектурне рішення з цілком земним рахунком.
Мене тут особливо чіпляє не сума сама по собі, а відсутність прямої лінії між витратою та результатом. Якщо я не можу показати, що більше токенів дали хоча б помітно швидші релізи, кращу якість підтримки або більше автоматизованих операцій, значить у мене не AI integration, а дорога звичка.
І так, новина свіжа, травень 2026 року, тож це не ретроспектива. Це вже новий тон ринку: спочатку лічильник токенів, потім красиві демо.
Вплив на бізнес і автоматизацію
Я бачу тут три практичні висновки. Перший: компанії будуть різати не сам ШІ, а безсистемне споживання моделей без маршрутизації, кешу, лімітів та оцінки, де дійсно потрібен дорогий LLM, а де вистачить простішої зв'язки.
Другий: виграють команди, які рахують unit economics на рівні сценарію. Не «ми впровадили ШІ», а «цей агент скоротив час розбору тікета на 42% і окупає себе за квартал». Саме так і виглядає нормальна AI solution development, а не просто купівля доступу до чергової моделі.
Програють ті, хто будував внутрішні процеси на безконтрольному копілоті і не думав про AI architecture. Я це регулярно бачу: варто поставити реальні ліміти, і раптом половина ланцюжків виявляється зайвою.
Якщо у вас схожа історія і витрати на моделі вже сперечаються з наймом, давайте розберемо це по-дорослому. У Nahornyi AI Lab ми зазвичай починаємо не з нової моделі, а з карти процесів, після чого можна зібрати AI automation так, щоб бізнес платив за результат, а не за красиве згоряння токенів.