Uber охолодив хайп навколо витрат на LLM

Операційний директор Uber публічно заявив просту річ: зростання витрат на токени для великих мовних моделей дедалі важче виправдати, якщо бізнес не бачить прямої віддачі. Для AI implementation це важливий сигнал. Епоха безлімітних експериментів закінчується, і відтепер компанії цінують не вау-ефект, а реальний і вимірний корисний результат.

Технічний контекст

Я зачепився тут не за сам заголовок, а за формулювання. COO Uber Ендрю Макдоналд фактично сказав: токенів витрачаємо більше, а зрозумілої надбавки в продуктовій користі не видно. Для мене це дуже знайома картина з реальних проєктів з AI automation, коли команда легко нарощує виклики моделей, а ось зв'язок із метриками бізнесу швидко розмивається.

Первинне джерело тут одне: інтерв'ю, яке переказав Business Insider. Там же сплив показовий епізод: усередині Uber обговорювали, що бюджет на Claude Code на 2026 рік уже вичерпано, і це стало тим самим моментом, коли люди перестали дивитися на LLM як на майже безкоштовну магію. І правильно, бо для окремого співробітника промпт коштує копійки, а для компанії в сумі це вже архітектурне рішення з цілком земним рахунком.

Мене тут особливо чіпляє не сума сама по собі, а відсутність прямої лінії між витратою та результатом. Якщо я не можу показати, що більше токенів дали хоча б помітно швидші релізи, кращу якість підтримки або більше автоматизованих операцій, значить у мене не AI integration, а дорога звичка.

І так, новина свіжа, травень 2026 року, тож це не ретроспектива. Це вже новий тон ринку: спочатку лічильник токенів, потім красиві демо.

Вплив на бізнес і автоматизацію

Я бачу тут три практичні висновки. Перший: компанії будуть різати не сам ШІ, а безсистемне споживання моделей без маршрутизації, кешу, лімітів та оцінки, де дійсно потрібен дорогий LLM, а де вистачить простішої зв'язки.

Другий: виграють команди, які рахують unit economics на рівні сценарію. Не «ми впровадили ШІ», а «цей агент скоротив час розбору тікета на 42% і окупає себе за квартал». Саме так і виглядає нормальна AI solution development, а не просто купівля доступу до чергової моделі.

Програють ті, хто будував внутрішні процеси на безконтрольному копілоті і не думав про AI architecture. Я це регулярно бачу: варто поставити реальні ліміти, і раптом половина ланцюжків виявляється зайвою.

Якщо у вас схожа історія і витрати на моделі вже сперечаються з наймом, давайте розберемо це по-дорослому. У Nahornyi AI Lab ми зазвичай починаємо не з нової моделі, а з карти процесів, після чого можна зібрати AI automation так, щоб бізнес платив за результат, а не за красиве згоряння токенів.

Раніше ми розбирали технічні способи радикально знизити споживання токенів, наприклад, завдяки передачі ШІ-агентам полегшеної Markdown-розмітки замість важкого HTML. Подібні архітектурні оптимізації стають життєво необхідними саме зараз, коли великий бізнес починає серйозно сумніватися в рентабельності генеративних моделей.

Поділитися статтею

Twitter/X LinkedIn Telegram

Uber охолодив хайп навколо витрат на LLM

Технічний контекст

Вплив на бізнес і автоматизацію

Ще новини

Gemma 4 стала помітно практичнішою на edge

364M параметрів і новий шанс для ШІ на пристроях