Skip to main content

Apple, en una iniciativa conjunta con la Universidad de Cornell, ha dado un paso significativo en el campo del aprendizaje automático con el lanzamiento de Ferret, un modelo de código abierto multimodal de aprendizaje automático. Este modelo, especializado en el análisis de regiones específicas de imágenes para realizar consultas, representa un avance notable en las tecnologías de inteligencia artificial.

El debut de Ferret en Github en octubre fue discreto, sin grandes anuncios ni promociones. El código se publicó junto con Ferret-Bench a finales de octubre, y sus versiones de control se lanzaron a mediados de diciembre, según informa AppleInsider. A pesar de su lanzamiento inicialmente bajo perfil, el modelo ha captado la atención de la comunidad de investigación en IA, destacando VentureBeat la importancia del lanzamiento como un reflejo del compromiso de Apple con la investigación influyente en IA.

Ferret se ofrece bajo una licencia no comercial, lo que impide su uso comercial en su forma actual. No obstante, existe la posibilidad de que Apple lo integre en futuros productos o servicios.

En una colaboración con la Universidad de Cornell, Apple ha presentado Ferret, un modelo de aprendizaje automático y de código abierto, diseñado para cambiar radicalmente la forma en que se realizan consultas basadas en imágenes.

Según Zhe Gan, científico de investigación en IA/ML de Apple, Ferret es capaz de identificar y contextualizar elementos dentro de cualquier área de una imagen con precisión. Esto significa que el modelo puede analizar una sección específica de una imagen, identificar elementos relevantes para una consulta, y utilizar esa información para proporcionar respuestas detalladas y contextualizadas.

Este lanzamiento es un hito para los investigadores, ya que muestra un cambio en la postura habitualmente reservada de Apple respecto a su trabajo en IA. Además, plantea preguntas sobre la infraestructura de Apple en IA, ya que la empresa busca ampliar sus capacidades para competir en el mercado global de IA, posiblemente en colaboración con otras empresas o mediante la expansión de sus propias tecnologías de código abierto.

Un detalle interesante revelado en el lanzamiento en Github, y destacado por la comunidad de Reddit r/Apple, es que Ferret fue entrenado en 8 GPU A100 con 80 GB de memoria, lo que indica un reconocimiento inusual de Apple hacia las GPU de Nvidia.

 

Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación. Esta es la de hoy.