Skip to main content

La compañía lanza GPT-4.1 junto a las versiones Mini y Nano, tres modelos diseñados para desarrolladores con una ventana de contexto de un millón de tokens y un rendimiento superior a GPT-4o y GPT-4.5. Esta nueva generación no llegará, de momento, a ChatGPT, pero marcará el camino hacia futuras actualizaciones del asistente.

“GPT-4.1 mejora a GPT-4o en casi todas las dimensiones”. Con esta frase, Sam Altman, CEO de OpenAI, dio la bienvenida al nuevo modelo estrella de la compañía durante una retransmisión en directo este lunes. Tras meses de expectativa en torno a GPT-5, finalmente OpenAI ha presentado una alternativa intermedia, pero poderosa: GPT-4.1, que llega acompañada de dos versiones optimizadas —Mini y Nano— diseñadas especialmente para desarrolladores y casos de uso reales.

La nueva familia GPT-4.1 está disponible exclusivamente a través de la API de OpenAI, y de momento no se puede usar directamente en ChatGPT. Sin embargo, la compañía ya ha dejado claro que estas capacidades se integrarán progresivamente en su producto principal, de forma similar a como sucedió con GPT-4o.

GPT-4.1 mejora un 21 % el rendimiento de GPT-4o en programación, según OpenAI, y reduce costes y latencia.

Entre las mejoras más destacadas, GPT-4.1 eleva la ventana de contexto a un millón de tokens, es decir, puede procesar el equivalente a 750.000 palabras en una sola entrada. Esto permite manejar proyectos extensos, largas conversaciones o procesar código y documentos complejos sin perder el hilo. Además, el modelo ha sido entrenado para reconocer con mayor fiabilidad los fragmentos relevantes del contexto y descartar el ruido o la información innecesaria.

Otra de las novedades clave es el enfoque en programación. GPT-4.1 logra una puntuación del 54,6 % en el benchmark SWE-Bench Verified, una mejora sustancial respecto al 33,2 % obtenido por GPT-4o y al 28 % de GPT-4.5. Esto lo convierte, según la propia OpenAI, en su mejor modelo para tareas de desarrollo y codificación. En MultiChallenge, una prueba que mide la capacidad para seguir instrucciones, también destaca con un 38,3 %, muy por encima de sus predecesores.

¿Y qué pasa con GPT-5?

La llegada de GPT-4.1 también ha servido para aclarar los planes futuros de la compañía. Altman confirmó que el lanzamiento de GPT-5, previsto inicialmente para mayo, se retrasa “unos meses”. “Nos ha resultado más difícil de lo que pensábamos integrar todos los componentes sin perder calidad ni estabilidad”, explicó el CEO en la misma retransmisión.

Mientras tanto, OpenAI comienza a cerrar etapas anteriores. GPT-4, el modelo que marcó un antes y un después en la historia de la IA generativa, será retirado de ChatGPT el 30 de abril. Le seguirá GPT-4.5 —conocido internamente como Orion—, que dejará de estar disponible en la API a partir del 14 de julio. ¿El motivo? GPT-4.1 ofrece un rendimiento similar o superior en áreas clave, con menor coste y mayor velocidad.

OpenAI confirma que el lanzamiento de GPT-5 se retrasa unos meses y comienza la retirada de GPT-4 y GPT-4.5 de su API.

De hecho, el precio es uno de los argumentos más potentes: GPT-4.1 cuesta 2 dólares por millón de tokens de entrada y 8 dólares por millón de tokens de salida. En comparación, el coste de GPT-4.5 era 75 y 150 dólares, respectivamente. Las versiones Mini y Nano reducen aún más ese coste, llegando hasta los 0,10 dólares por millón de tokens de entrada en el caso del modelo más ligero.

Nuevos usos, más realismo

OpenAI ha diseñado GPT-4.1 pensando en un uso práctico y realista. “Hemos optimizado el modelo para tareas que importan a los desarrolladores: codificación frontend, edición precisa, uso coherente de herramientas, seguimiento del formato…”, explicaba un portavoz de la compañía en declaraciones a TechCrunch.

Además, GPT-4.1 ha sido puesto a prueba en el benchmark Video-MME, que evalúa la comprensión de contenidos audiovisuales. En la categoría de vídeos largos sin subtítulos, obtuvo un 72 % de acierto, una cifra récord. Su conocimiento también ha sido actualizado hasta junio de 2024, lo que le permite responder con mayor precisión a eventos recientes.

Sin embargo, no todo es perfecto. OpenAI reconoce que el modelo puede ser menos fiable cuando debe procesar grandes cantidades de información. En uno de sus tests internos, la precisión del modelo cayó del 84 % con 8.000 tokens al 50 % con un millón de tokens. También puede requerir instrucciones más explícitas, ya que tiende a responder de forma más literal que GPT-4o.

El objetivo: un programador autónomo

Más allá de los benchmarks, el rumbo de OpenAI parece claro: avanzar hacia una inteligencia artificial capaz de asumir el papel de un ingeniero de software completo. Sarah Friar, CFO de la compañía, ya adelantó esta ambición en una cumbre tecnológica en Londres: un modelo que pueda programar aplicaciones de principio a fin, incluyendo documentación, pruebas y resolución de errores.

Con GPT-4.1, OpenAI da un paso en esa dirección, y al mismo tiempo responde a la presión creciente de rivales como Google, Anthropic o DeepSeek, que ya han presentado modelos con capacidades similares y resultados superiores en algunas pruebas.

La carrera por el dominio de la IA generativa continúa, y GPT-4.1 es, sin duda, el nuevo caballo de batalla de OpenAI.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Dejar un comentario