Nombre de la entidad:
ETIQMEDIA SOLUCIONES AUDIOVISUALES, S.L.
Tipo de proyecto:
Tecnología / Inteligencia artifical
Provincia:
Zaragoza
Convocatoria:
Convocatoria para el año 2022 del procedimiento de concesión de ayudas para proyectos de I+D empresarial de aplicación a los ámbitos de audiovisual y de los videojuegos, y la transferencia y adaptación de estos desarrollos a otros sectores de aplicación, en el marco del Plan de Impulso al Sector Audiovisual España Hub Audiovisual de Europa, la Agenda “España Digital 2025”, el Plan de Recuperación, Transformación y Resiliencia y el Plan Estatal de Investigación Científica, Técnica y de Innovación 2021-2023.
Cuantía de la ayuda:
317850,75€
Descripción del proyecto:
Etiqmedia es una empresa tecnológica creada en Aragón en 2016 y centrada en el desarrollo de herramientas para optimizar la gestión y explotación de contenido audiovisual. Todas las tecnologías utilizadas en por la entidad son de desarrollo propio, trabajando en tecnologías del habla, procesamiento de imagen y procesamiento del lenguaje natural. Actualmente se genera una cantidad inmensa de contenido audiovisual en muchos ámbitos. Para poder rentabilizar y extraer la información del contenido audiovisual es necesario realizar un conjunto de tareas muy costosas si se abordan de forma manual: etiquetado, transcripción, subtitulado, resumen, etc. La propuesta de valor de la empresa ha sido automatizar al máximo estos procesos. Sus clientes ya son capaces de buscar y encontrar los contenidos que requieren mediante su plataforma de indexación automática multilingüe. Sin embargo, estos demandan no sólo ser capaces de indexar el contenido sino segmentarlo de forma lógica, comprenderlo y proponer la generación automática de nuevo contenido, principalmente resúmenes, que faciliten su explotación. La solución propuesta se basa en diseñar y desarrollar una a serie de módulos software que se integrarán en la plataforma de gestión de vídeo de la empresa para la segmentación en escenas, comprensión de cada una de dichas escenas y creación de resúmenes automáticos de vídeo trabajando con estas escenas. Con estos módulos la plataforma deberá ser capaz de tomar como entrada un video con el audio en cualquiera de los idiomas del Estado, en inglés o con una combinación de ellos. Del video se extraerán los planos, la imagen más representativa por plano, caras reconocidas, hablantes y texto en pantalla, generando con todo ello además los planos semánticos y una descripción automática por cada imagen extraída. A partir del audio se generará la transcripción, con la cual se creará un resumen automático y se extraerán etiquetas semánticas, al igual que también se extraerán del texto en pantalla. Por último, con toda esta información se generará un resumen automático del contenido, simulando como lo haría un humano, mostrando para cada caso y en cada entorno la información más relevante y representativa del contenido. Esta edición automática de contenidos se basará en resúmenes extractivos y abstractivos, en el análisis de la relevancia y en la búsqueda de contenido similar de manera multimodal en el propio repositorio de cliente.