Uber enfría el entusiasmo en torno al gasto en LLM

El director de operaciones de Uber afirmó públicamente una gran verdad: el creciente gasto en tokens para modelos de lenguaje es cada vez más difícil de justificar sin beneficios directos. Esta es una señal crucial para la implementación de IA. La era de experimentos ilimitados termina, priorizando resultados tangibles sobre la simple novedad.

Contexto Técnico

No me llamó la atención el titular en sí, sino la formulación. El COO de Uber, Andrew Macdonald, dijo esencialmente: gastamos más tokens, pero no se ve un aumento claro en el valor del producto. Para mí, esta es una imagen muy familiar de proyectos reales de automatización con IA, donde el equipo aumenta fácilmente las llamadas al modelo, pero la conexión con las métricas comerciales se desdibuja rápidamente.

La fuente principal aquí es una entrevista resumida por Business Insider. Allí surgió un episodio revelador: dentro de Uber discutieron que el presupuesto para Claude Code de 2026 ya se había agotado. Ese fue el momento exacto en que la gente dejó de ver a los LLM como magia casi gratuita. Y con razón, porque para un empleado individual un prompt cuesta centavos, pero para una empresa en conjunto es una decisión arquitectónica con una factura muy terrenal.

Lo que me impacta aquí no es la suma en sí, sino la falta de una línea directa entre el gasto y el resultado. Si no puedo demostrar que más tokens lograron lanzamientos notablemente más rápidos, mejor calidad de soporte o más operaciones automatizadas, entonces no tengo una integración de IA; tengo un hábito costoso.

Y sí, la noticia es reciente, mayo de 2026, por lo que no es una retrospectiva. Es el nuevo tono del mercado: primero el contador de tokens, luego las demos bonitas.

Impacto en el Negocio y la Automatización

Veo tres conclusiones prácticas aquí. Primera: las empresas no recortarán la IA en sí, sino el consumo asistemático de modelos sin enrutamiento, caché, límites y sin evaluar dónde se necesita realmente un LLM costoso y dónde bastaría con una combinación más simple.

Segunda: ganarán los equipos que calculen la economía unitaria a nivel de escenario. No "implementamos IA", sino "este agente redujo el tiempo de resolución de tickets en un 42% y se amortiza en un trimestre". Así es exactamente como se ve el desarrollo adecuado de soluciones de IA, y no simplemente comprar acceso a otro modelo.

Los perdedores serán quienes construyeron procesos internos con un copiloto incontrolado sin pensar en la arquitectura de IA. Lo veo a menudo: tan pronto como se establecen límites reales, de repente la mitad de las cadenas resultan ser redundantes.

Si tienes una situación similar y los gastos en modelos ya compiten con la contratación, vamos a analizarlo con madurez. En Nahornyi AI Lab, no solemos empezar con un modelo nuevo, sino con un mapa de procesos, tras lo cual podemos armar la automatización de IA para que el negocio pague por resultados, no por la quema espectacular de tokens.

Anteriormente analizamos formas técnicas de reducir radicalmente el consumo de tokens, como enviar sintaxis Markdown ligera a los agentes de IA en lugar de HTML pesado. Estas optimizaciones arquitectónicas se vuelven vitales ahora que las grandes empresas empiezan a dudar de la rentabilidad de los modelos generativos.

Compartir este articulo

Twitter/X LinkedIn Telegram

Uber enfría el entusiasmo en torno al gasto en LLM

Contexto Técnico

Impacto en el Negocio y la Automatización

Mas noticias

Gemma 4 se vuelve significativamente más práctica en el borde

364M parámetros y una nueva oportunidad para la IA en dispositivos