La empresa se centra en mejorar el rendimiento y la seguridad, y publica sus modelos con licencia Apache 2.0
IBM ha lanzado Granite 3.0, su tercera actualización de su serie de modelos de lenguaje grande (LLM) enfocados a satisfacer las necesidades de empresas en busca de soluciones robustas de inteligencia artificial. Esta nueva versión trae avances clave en rendimiento, seguridad y apertura, siendo parte de la oferta de modelos optimizados dentro de la plataforma de IA empresarial IBM Watsonx.
Los modelos son los siguientes:
- Modelos densos y de propósito general:
- Granite-3.0-8B-Instruct
- Granite-3.0-8B-Base
- Granite-3.0-2B-Instruct
- Granite-3.0-2B-Base
- Modelos de guías de entrada y salida basados en LLM:
- Granite-Guardian-3.0-8B
- Granite-Guardian-3.0-2B
- Modelos ‘Mixture of Experts’ (MoE) para minimizar la latencia:
- Granite-3.0-3B-A800M-Instruct
- Granite-3.0-1B-A400M-Instruct
- Decodificador especulativo para aumentar la velocidad y eficiencia de la inferencia:
- Granite-3.0-8B-Instruct-Accelerator
Principales características
El Granite-3.0-8B-Instruct es el mayor de todos, diseñado para manejar grandes volúmenes de datos textuales y de código y entrenado con más de 12 billones de tokens procesados en múltiples idiomas y lenguajes de programación. Este modelo ha sido ajustado específicamente para tareas empresariales, como la generación de texto, clasificación de datos y la extracción de entidades. Las empresas que requieren procesamiento de lenguaje natural (NLP), generación de contenido y análisis avanzado de datos pueden beneficiarse de su capacidad de personalización y eficiencia en múltiples tareas.
Una de las innovaciones más notables en Granite 3.0 es el uso de modelos «Mixture of Experts» (MoE), un enfoque de aprendizaje automático que divide el modelo de IA en subredes separadas (o ‘expertos’), cada una especializada en un subconjunto de los datos de entrada, para realizar conjuntamente una tarea, lo que reduce el uso innecesario de recursos y optimiza la inferencia. Además, se ha introducido un decodificador especulativo, capaz de procesar tokens a mayor velocidad, con un incremento en el rendimiento de hasta el 220%, según ha anunciado la compañía. Estas mejoras permiten que las empresas obtengan resultados más rápidos y eficientes en comparación con versiones anteriores.
Seguridad y transparencia
En cuanto a la seguridad y el compromiso con la transparencia, IBM sigue una línea de trabajo diferenciada en la industria. Granite 3.0 se publica bajo la licencia Apache 2.0, lo que lo hace un proyecto abierto y accesible, una estrategia que refleja la intención de la compañía de fomentar la confianza en la inteligencia artificial. Esto contrasta con la tendencia de muchos otros desarrolladores de modelos LLM que han optado por mantener sus modelos cerrados o de uso restringido. Los modelos abiertos de IA no solo permite a las empresas auditar el comportamiento del modelo, sino que también facilitan la implementación de mejoras y personalizaciones de manera colaborativa.
Además, IBM ha reforzado las medidas de control y supervisión en Granite 3.0 mediante el desarrollo de Granite Guardian 3.0, un componente especializado que actúa como filtro de seguridad para monitorear la generación de contenido inapropiado o sesgado, incluyendo lenguaje violento, ofensivo o éticamente cuestionable. Este modelo guardián se encarga de minimizar los riesgos asociados al uso de modelos de IA en contextos empresariales, donde la seguridad y la precisión son clave.
Otra ventaja destacable de Granite 3.0 es su interoperabilidad. Los modelos no solo están disponibles en IBM watsonx, sino que también pueden integrarse en otras plataformas como Google Vertex AI y Hugging Face, lo que facilita a los desarrolladores y empresas la incorporación de estos potentes modelos en sus aplicaciones sin tener que realizar complejas adaptaciones.
Un futuro multimodal
Con la promesa de seguir evolucionando, IBM ha anunciado que en futuras actualizaciones de Granite 3.0 se incorporarán capacidades multimodales, permitiendo la integración de datos textuales, visuales y auditivos en un solo marco de trabajo. Además, se ampliarán las ventanas de contexto, lo que permitirá a las empresas procesar información más compleja y detallada en cada consulta.
Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.