LIBNOVA se ha centrado desde sus inicios en desarrollar la plataforma de preservación digital más avanzada: LIBSAFE.
En 2017, crea LIBNOVA RESEARCH LABS, el departamento de coordinación de las líneas de investigación a seguir en innovación tecnológica dentro de la compañía. Los resultados concluyentes obtenidos en estas investigaciones repercuten directamente en la plataforma de preservación digital LIBSAFE.
Pensando siempre en el usuario final, en este laboratorio se pretende simplificar las tareas de preservación digital a través de la aplicación de técnicas de Inteligencia Artificial como la automatización de procesos de ingesta, la creación de flujos de trabajo, el análisis del contenido de los objetos digitales, etc.
Las líneas de investigación prioritarias de LIBNOVA Research Labs son:
El objetivo general de este proyecto es desarrollar un sistema autónomo avanzado para el análisis de contenido y clasificación automatizada de los archivos digitales.
Este desarrollo se centrará en algoritmia basada en los últimos avances de la inteligencia artificial y en utilización de redes neuronales para clasificación de contenido, de tal forma que se consiga una automatización íntegra del proceso de ingesta de archivos, en el proceso de Preservación Digital.
La solución permitirá clasificar de manera automática los objetos digitales, en especial aquellos de contenido visual o textual, y con capacidad de generación de los metadatos que acompañan a cada objeto para proceder a su inclusión en el sistema de preservación.
Este sistema incorporará un proceso de análisis y clasificación automatizada de la información que llegue tanto en forma de objetos visuales o imágenes como en archivos de texto.
El objetivo general de este proyecto, cuyo consorcio está liderado por el CERN e incluye a varias de las principales organizaciones europeas relacionadas con la investigación, consiste en la construcción de una solución de última generación para el archivado y la preservación de datos de investigación científica escalable a varios petabytes.
Preservar los datos de investigación tiene sus propios desafíos, y es realmente complejo de lograr sin los procesos y las herramientas adecuadas. Gestionar la procedencia de los datos, resolver los problemas de reproducibilidad o alinear los datasets con las mejores prácticas son áreas clave que hay que abordar y que involucra a muchas comunidades.
Con nuestra plataforma LIBSAFE como base y en colaboración con la Universidad de Barcelona, el Consejo Superior de Investigaciones Científicas y David Giaretta, nuestra propuesta ha sido seleccionada para participar en el proyecto (con una financiación total de 4,8 millones de euros durante varios años).
Los productos resultantes pasarán a formar parte del Catálogo Europeo Open Science Cloud (EOSC).