Skip to main content

3Cat ha presentado una serie de herramientas que facilitarán la labor de los redactores de TV3 en sus tareas diarias. Con estos programas informáticos equipados con IA generativa, los periodistas pueden desde hacer resúmenes automáticos de noticias y entrevistas, hasta generar imágenes para ilustrar artículos web. El proyecto está en una fase inicial de prueba de concepto y, como aseguran desde el CIDAI, se irá mejorando con el tiempo.

La televisión catalana apuesta por las nuevas tecnologías equipadas con IA siempre como herramienta: «Estamos poniendo las bases de un futuro en el que nos tenemos que poner las pilas [en innovación]», explica Medir Plandolit, Responsable Digital de Informativos. En este sentido, la Corporación Catalana de Mitjans Audiovisuals ha constituido una Comisión Responsable de IA para velar por las buenas prácticas. La idea es gestionar la implantación de las nuevas tecnologías con autorregulación interna.

«No debemos tener miedo», explica Plandolit, porque «los profesionales se ahorrarán tiempo para poder dedicarlo a tareas que persiguen un contenido de mayor calidad«. Y en esta línea, todos los avances deben cumplir con los principios de «transparencia y control humano». «Son herramientas enfocadas a mejorar el trabajo de los profesionales, nunca sustituirlo», ha reafirmado Rafael Bermudez Guijo, responsable de Proyectos de Investigación Tecnológica de 3Cat: «Estas herramientas deben ayudarnos a mantener la calidad, a hacer contenido veraz y a mantener el rigor«.

Resúmenes de noticias y entrevistas

La primera herramienta presentada permite resumir contenidos de vídeo. Para ello, transcribe automáticamente el audio del vídeo (con la integración del modelo Whisper, de OpenAI). Además, es capaz de «distinguir diferentes hablantes» y reconocer donde comienza y acaba cada frases, explica José Adrián Rodríguez Fonollosa, Catedrático del Centro de Inteligencia Artificial de la UPC. En esta primera etapa, una grabación de una hora se pueden transcribir en dos minutos.

La herramienta transcribe el audio y selecciona lo más importante

A continuación las frases se ordenan por importancia en relación con la temática. «Los usuarios también pueden escoger las palabras clave», puntualiza Fonollosa. En resumen: la herramienta puede seleccionar «las diez frases más importantes hasta dejar una entrevista de una hora en un minuto«. Un contenido que puede ser útil para compartirlo en redes sociales y maximizar su difusión, entre otros usos posibles.

«Es un método muy eficiente para procesar información procedente de diferentes canales», asegura Rafael Redondo, de EURECAT. En este sentido, se ha optado por usar una técnica text-to-speech porque «las herramientas de análisis de vídeo todavía no están muy maduras».

Generación de imágenes para noticias

Otra punta de lanza del proyecto consiste en generar imágenes para ilustrar los artículos en la web de 3Cat. En este caso, se usan para generar recursos gráficos. En este momento la están usando «como asistente para el editor de contenido», ya que se encuentra en una fase en la que las imágenes todavía necesitan ediciones posteriores antes de ser publicadas. La herramienta hace primero un resumen de la noticia, para luego agrupar los objetos que debe tener la imagen y el lugar en el que irán situados. Después genera el fondo y los elementos por separado, para acabar dando lugar a la imagen definitiva, según ha explicado Bodgan Raducanu, Investigador Senior del CVC. 

El motor que se usa en este caso es Stable Diffusion. Esta herramienta se plantea también como un soporte para las tareas de difusión de contenidos en redes sociales, donde la imagen muchas veces es crucial «para atraer la atención del usuario».

Toda revolución necesita sus cronistas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.