Skip to main content
open-weight modelsGemmaDeepSeek

¿Están Gemma y DeepSeek resolviendo ya el 80% de las tareas?

Los recientes puntos de referencia muestran un cambio claro: Gemma y DeepSeek ya son capaces de manejar la mayoría de las tareas rutinarias. Esto transforma la automatización con IA al modificar presupuestos y estrategias de implementación, aunque el comportamiento complejo de los agentes aún requiere sistemas avanzados.

Contexto técnico

Lo que me llamó la atención no fue solo la cifra del 80%, sino la frecuencia con la que la repiten quienes construyen productos reales. En la implementación de IA, veo la misma tendencia: para resumir, clasificar, extraer, estructurar datos y algunas tareas de código, los modelos abiertos ya no parecen un compromiso por falta de presupuesto.

Al revisar comparativas recientes, la realidad es bastante concreta. DeepSeek-V3 suele superar a Gemma 3 4B en pruebas generales y de código como GPQA, MMLU-Pro y LiveCodeBench, mientras que Gemma resiste mejor en el seguimiento de instrucciones. Pero el verdadero impacto no está en las tablas de clasificación, sino en el precio.

Según las comparativas publicadas, Gemma 3 4B puede ser mucho más barato: alrededor de 0,02 $ por millón de tokens de entrada y 0,04 $ de salida, frente a los 0,27 $ y 1,10 $ de DeepSeek-V3. Aunque DeepSeek es más potente en razonamiento y código, Gemma se vuelve sumamente atractiva para flujos de trabajo masivos y bien delimitados.

Aquí es donde suelo detener a mi equipo y decirles: no confundan "el modelo responde bien" con "el sistema funciona de forma fiable". Los modelos abiertos no son buenos por sí solos, sino combinados con esquemas de inferencia, validación, RAG, enrutamiento y supervisión humana. Sin una arquitectura de IA sólida, todo se convierte rápidamente en una demostración vistosa pero inútil.

Qué cambia esto para la automatización empresarial

La primera consecuencia es simple: las tareas de alto volumen pueden migrar de costosos modelos avanzados sin problema. Cuando se necesita un formato predecible y no un ensayo filosófico de 12 párrafos, Gemma y DeepSeek suelen ser más rentables.

Segundo: los equipos que valoran la ejecución local, el control de datos y la personalización tienen las de ganar. Los que intentan resolver el procesamiento rutinario de documentos y la creación de agentes de IA complejos con el mismo entorno tecnológico saldrán perdiendo.

Tercero: el 20% de las tareas restantes son precisamente aquellas donde los errores cuestan más. Los flujos de trabajo de agentes largos, el razonamiento complejo, el uso de herramientas y los casos extremos aún se manejan mejor con modelos cerrados. No recomendaría recortar gastos a ciegas en esos aspectos.

En Nahornyi AI Lab abordamos precisamente esta parte complicada: no solo elegimos un modelo por la moda, sino que diseñamos la automatización de IA adaptada a su proceso, calculando el coste de los errores, la latencia y el mantenimiento. Si se pregunta qué se puede trasladar de forma segura a Gemma o DeepSeek y qué debería quedarse en potentes API, analicemos su flujo de trabajo y construyamos un esquema operativo sin tokens desperdiciados ni magia innecesaria.

Para combinar eficazmente redes propietarias pesadas en tareas complejas con soluciones abiertas como DeepSeek para las básicas, las empresas necesitan un enrutamiento flexible. En un artículo anterior explicamos cómo un proxy LLM evita la dependencia del proveedor y facilita cambiar de modelo.

Compartir este articulo