Skip to main content

Google ha presentado su nuevo modelo más inteligente hasta el momento, el Gemini 2.5 Pro. Este destaca por su capacidad de razonamiento que le permite descomponer tareas complejas en pasos lógicos antes de dar una respuesta

Este modelo se ha posicionado en el top 1 de LMArena, superando a sus competidores como Antrhopic u OpenAI, con cierto margen. LMArena es una plataforma de código abierto para la evaluación comparativa de diferentes modelos de IA, creada por investigadores de UC Berkeley SkyLab. En esta plataforma se evalúan las preferencias humanas en interacciones de modelos de lenguaje e indica que Gemini 2.5 Pro es el modelo que ofrece respuestas más alineadas con lo que buscan los usuarios.

Este modelo se ha sometido a diferentes evaluaciones para determinar su rendimiento en distintas áreas. En referencia a su rendimiento en tareas específicas Gemini 2.5 Pro ha demostrado tener grandes habilidades para las matemáticas y la ciencia. Según el estudio realizado por GPQA Diamond, diseñado para evaluar la capacidad de razonamiento científico del modelo, Gemini 2.5 Pro ha obtenido una puntuación del 84%, superando a otros modelos de IA en este campo.

Además, en otro estudio llamado «Humanity’s Last Exam», que evalúa el conocimiento y razonamiento humano del modelo, Gemini 2.5 Pro obtuvo una puntuación de 18,8% y se establece como un referente a seguir para los modelos sin uso de herramientas externas.

 

Gemini 2.5 Pro mejora su capacidad de codificación respecto a modelos anteriores

Otro ámbito en el que destaca el nuevo modelo de Gemini es en la codificación. El modelo sobresale en la codificación de aplicaciones web visualmente atractivas y en la transformación y edición de código. En el análisis realizado por SWE-Bench Verified, uno de los más importantes en la industria para la evaluación de código, obtuvo un 63,8%, siendo superado tan solo por el modelo de Antrhopic Claude 3.7 Sonnet, el cual obtuvo una puntuación de 70.3%. Aun así, el modelo de Gemini demuestra que puede ser competitivo en este ámbito, y ha demostrado su capacidad de codificación con el siguiente video.

Actualmente, Gemini 2.5 Pro esta disponible para desarrolladores y empresas las cuales ya pueden empezar a experimentar con este modelo a través de Google AI Studio y los usuarios de Gemini Advanced pueden usar este modelo a través de la aplicación de Gemini. También se espera que en las próximas semanas esté disponible en Vertex AI.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Gerard Quintana

Periodista. Me encanta el periodismo y la tecnología.

Dejar un comentario