Contexto técnico
Lo que me llamó la atención no fue solo la cifra del 80%, sino la frecuencia con la que la repiten quienes construyen productos reales. En la implementación de IA, veo la misma tendencia: para resumir, clasificar, extraer, estructurar datos y algunas tareas de código, los modelos abiertos ya no parecen un compromiso por falta de presupuesto.
Al revisar comparativas recientes, la realidad es bastante concreta. DeepSeek-V3 suele superar a Gemma 3 4B en pruebas generales y de código como GPQA, MMLU-Pro y LiveCodeBench, mientras que Gemma resiste mejor en el seguimiento de instrucciones. Pero el verdadero impacto no está en las tablas de clasificación, sino en el precio.
Según las comparativas publicadas, Gemma 3 4B puede ser mucho más barato: alrededor de 0,02 $ por millón de tokens de entrada y 0,04 $ de salida, frente a los 0,27 $ y 1,10 $ de DeepSeek-V3. Aunque DeepSeek es más potente en razonamiento y código, Gemma se vuelve sumamente atractiva para flujos de trabajo masivos y bien delimitados.
Aquí es donde suelo detener a mi equipo y decirles: no confundan "el modelo responde bien" con "el sistema funciona de forma fiable". Los modelos abiertos no son buenos por sí solos, sino combinados con esquemas de inferencia, validación, RAG, enrutamiento y supervisión humana. Sin una arquitectura de IA sólida, todo se convierte rápidamente en una demostración vistosa pero inútil.
Qué cambia esto para la automatización empresarial
La primera consecuencia es simple: las tareas de alto volumen pueden migrar de costosos modelos avanzados sin problema. Cuando se necesita un formato predecible y no un ensayo filosófico de 12 párrafos, Gemma y DeepSeek suelen ser más rentables.
Segundo: los equipos que valoran la ejecución local, el control de datos y la personalización tienen las de ganar. Los que intentan resolver el procesamiento rutinario de documentos y la creación de agentes de IA complejos con el mismo entorno tecnológico saldrán perdiendo.
Tercero: el 20% de las tareas restantes son precisamente aquellas donde los errores cuestan más. Los flujos de trabajo de agentes largos, el razonamiento complejo, el uso de herramientas y los casos extremos aún se manejan mejor con modelos cerrados. No recomendaría recortar gastos a ciegas en esos aspectos.
En Nahornyi AI Lab abordamos precisamente esta parte complicada: no solo elegimos un modelo por la moda, sino que diseñamos la automatización de IA adaptada a su proceso, calculando el coste de los errores, la latencia y el mantenimiento. Si se pregunta qué se puede trasladar de forma segura a Gemma o DeepSeek y qué debería quedarse en potentes API, analicemos su flujo de trabajo y construyamos un esquema operativo sin tokens desperdiciados ni magia innecesaria.