GPT-5.4: Potente en Código, Irregular en el Diálogo

OpenAI lanzó GPT-5.4 como su modelo insignia para tareas generales y de código, pero los usuarios notan una brecha: es potente para programar, pero su rendimiento en el diálogo es cuestionable. Para las empresas, esto indica que la calidad no solo depende del modelo, sino de la arquitectura de prompts y sus modos de pensamiento.

Contexto Técnico

Decidí ignorar las presentaciones de marketing y sumergirme en cómo se describe realmente a GPT-5.4 en la práctica. Oficialmente, OpenAI lo posiciona como el nuevo buque insignia para tareas generales, de programación (coding) y de agentes, reemplazando ramas antiguas como GPT-5.2 y retirando gradualmente GPT-5.3-Codex. Sobre el papel, todo es perfecto: un modelo unificado, un gran contexto, menos errores fácticos y varios modos, incluido el de Pensamiento (Thinking).

Pero no fue eso lo que me llamó la atención, sino la disparidad en las opiniones de los usuarios. Una persona usa GPT-5.4 junto a Opus como una segunda opinión, para verificar hechos y como máquina de feedback. Otra, por el contrario, dice que para conversar es el modelo más débil de la gama alta, por debajo de Gemini y Opus.

Y aquí es donde empieza lo interesante. Un tercer caso de uso no va de "abrir un chat y obtener magia". Esta persona ejecuta GPT-5.4 Extended Thinking dentro de un ChatGPT muy personalizado: ocho módulos en markdown, disparadores, un sistema complejo de instrucciones y una lógica separada para autodiagnosticar su razonamiento. El resultado que obtiene es bueno, a veces muy bueno, pero el modelo requiere un ajuste constante.

Para mí, esto significa que GPT-5.4 no es un modelo que se pueda evaluar con un simple "fuerte" o "débil". En un modo conversacional básico, puede perder frente a interlocutores más "agradables". Sin embargo, en una configuración compleja con pensamiento extendido, instrucciones modulares y un enrutamiento de tareas claro, se revela de una manera completamente diferente.

Traducido a lenguaje de ingeniero, el modelo se ha vuelto más sensible a la arquitectura de IA que lo rodea. No se trata solo del prompt del sistema, sino del esquema completo: qué roles se definen, dónde se verifican los hechos, cómo se inicia el razonamiento, qué sucede ante la duda y cuándo debe detenerse para volver a verificar.

Impacto en Negocios y Automatización

Para las empresas, la conclusión es muy práctica. GPT-5.4 no elimina la necesidad de diseñar la solución. Al contrario, penaliza una implementación perezosa con más dureza de lo que muchos esperan. Si simplemente conectas el modelo a un chat de soporte o a un asistente interno sin una capa de reglas, memoria, disparadores y validación, podrías obtener un resultado por debajo de las expectativas.

En cambio, donde se necesita automatización con IA no para "charlar un rato", sino para "analizar un problema, probar una hipótesis y devolver una respuesta estructurada", GPT-5.4 tiene un potencial enorme. Especialmente en combinación con escenarios de agentes, revisión de documentos, generación de artefactos de trabajo y flujos de varios pasos. Yo prestaría especial atención a los casos que requieren una segunda pasada de pensamiento, no solo una primera respuesta bonita.

¿Quién gana? Los equipos que saben construir la arquitectura de soluciones de IA, no solo elegir un modelo por la moda. ¿Quién pierde? Aquellos que esperan una varita mágica universal lista para usar. Con GPT-5.4 esto es especialmente notable: la calidad depende en gran medida de cómo hayas construido el sistema alrededor del modelo.

Esto también lo veo en proyectos de clientes. Cuando en Nahornyi AI Lab hacemos una implementación de inteligencia artificial, la mayor mejora casi nunca proviene de un simple cambio de modelo. Proviene de una combinación: enrutamiento de solicitudes, prompts modulares, memoria, autoverificación, lógica de respaldo y, a veces, incluso la separación entre el modo conversacional y el de razonamiento.

En resumen, GPT-5.4 está empujando al mercado hacia un desarrollo más maduro de soluciones de IA. Ya no basta con "conectar una API". Es necesario entender cuándo el modelo debe hablar rápido, cuándo pensar más tiempo, cuándo debatir consigo mismo y cuándo escalar silenciosamente a otro módulo o a una persona.

Soy Vadim Nahornyi de Nahornyi AI Lab, y no solo comento estas cosas, sino que las construyo con mis propias manos en sistemas reales: desde agentes de IA hasta escenarios en n8n y complejos circuitos de validación de respuestas.

Si quieres discutir tu caso de uso, solicitar una automatización con IA, crear un agente de IA o construir una integración adecuada para una tarea de negocio, contáctame. Veremos dónde realmente necesitas GPT-5.4 y dónde funcionaría mejor otra combinación.

Compartir este articulo

Twitter/X LinkedIn Telegram

GPT-5.4: Potente en Código, Irregular en el Diálogo

Contexto Técnico

Impacto en Negocios y Automatización

Mas noticias

LFM2.5-8B-A1B: Cómo evitar bucles de razonamiento

Hay tuit de Altman, pero el lanzamiento aún no aparece