La tecnología cambia. Su información permanece
La tecnología cambia
Su información permanece
La preservación digital de los datos de investigación (research datasets) – WDPD2020

5 noviembre, 2020

  • LIBNOVA se une a la celebración del Día Mundial de la Preservación Digital 2020 escribiendo un post como invitado en el blog de la DPC sobre la Preservación Digital de Datos de Investigación Científica.

    Una de las áreas más olvidadas de la preservación digital es el mundo científico. En este post queremos compartir pensamientos y reflexiones sobre la preservación digital de datos de investigación.

    WDPD2020-Spanish-Landscape-RGB

    La preservación digital de los datos de investigación (research datasets)

    El año pasado, en nuestro post como invitados en el blog de la DPC, escribimos sobre “Aumentar la comunidad para disminuir el riesgo, de forma internacional” (se puede leer en inglés aquí: Augmenting the community, lowering the risk internationally) y comentamos que muchas veces la solución a los problemas individuales relacionados con la preservación digital se encuentra mirando a la comunidad, y buscando si otra institución ya ha pasado por lo mismo. Este año, el tema central del Día Mundial de la Preservación Digital es “Digits: For Good” (Datos: Para siempre) y nosotros hemos querido centrarnos en la preservación digital de los datos de investigación.

    Pero echemos la vista atrás, la promesa de LIBNOVA siempre ha sido proporcionar a la comunidad la plataforma de preservación digital más avanzada. Y lo estamos consiguiendo paso a paso.

    Hace unos años, creamos LIBNOVA RESEARCH LABS, el departamento desde el que se coordinan las líneas de investigación a seguir en innovación tecnológica dentro de la compañía. Al mismo tiempo, hemos estado haciendo un análisis de mercado para entender las necesidades de los distintos sectores y las peculiaridades de cada uno (por ejemplo, entre patrimonio cultural y departamentos de investigación). Finalmente, la confluencia de estas dos vías de trabajo ha dado como resultado el desarrollo y lanzamiento de una herramienta de gestión y preservación de datos de investigación innovadora y vanguardista que presentamos el año pasado.

    Pero, ¿qué hemos aprendido por el camino?

    Los desafíos de los datos de investigación

    Durante nuestro estudio de mercado, hemos intercambiado comentarios e información con más de 50 organizaciones de investigación. Las razones más extendidas entre las instituciones por las que no están preservando adecuadamente sus datos de investigación son las siguientes:

    • Falta una visión unificada de los datos de investigación, ya que están dispersos en múltiples plataformas a lo largo de su ciclo de vida, atendiendo a su funcionalidad, los protocolos o procedimientos a seguir y sus principales características.
    • La preservación digital se aborda (si se aborda) al final del proyecto, cuando todos están pensando ya en el siguiente proyecto, los recursos son escasos, y los datos están dispersos en infinidad de plataformas.
    • En muchos proyectos tanto las estructuras de datos como el software empleado son de vanguardia (se están inventando) y además ningún proyecto de investigación es igual a otro, por lo tanto no hay una manera eficaz de normalizar o estandarizar los formatos y las estructuras de datos.
    • A menudo, el código y los datos no están juntos, por lo que se pierde información relevante.

    Nuestros propios desafíos como investigadores

    Como organización de investigación, también tenemos nuestras propias preocupaciones, que se podría resumir en los siguientes puntos:

    • Necesitamos tener confianza en cómo se gestionan y se protegen los datos de investigación durante todo el ciclo de vida de los datos.
    • Necesitamos proporcionar las mejores herramientas disponibles a nuestros investigadores, equilibrando cuidadosamente los recursos disponibles en el proyecto de investigación, preguntándonos: ¿cuánto va a costar esto?
    • Nos preocupa también la gestión de grandes volúmenes de datos y la escalabilidad de la plataforma.

    Pensamientos y reflexiones sobre la preservación digital de datos de investigación

    Estas son las principales conclusiones a las que hemos llegado en estos primeros años de investigación y retroalimentación sobre la preservación digital para los conjuntos de datos de investigación:

    1. Si nos preocupamos por el trabajo de archivo o de archivado al final del proyecto, la mayor parte de la información ya se habrá perdido:

    • Esta labor debería comenzar ANTES de comenzar el proyecto, proporcionando una plataforma que los investigadores utilicen durante todo el ciclo de vida del proyecto como el “único” sitio para guardar los datos.
    • Los investigadores trabajan juntos (incluso desde diferentes instituciones), así que necesitan un sitio para compartir el contenido.
    • Además de lo anterior, también tenemos que tener en cuenta y cuidar la “cadena de integridad”.

    2. En el caso de los datos de investigación, el código normalmente es información representativa de los datos:

    • Por eso es importante preservar el código junto con los datos. Ya que la reproducibilidad suele ser necesaria a largo plazo.
    • Es crucial estar alineado con el Modelo OAIS y la ISO 16363.

    3. Es necesario crear formas sencillas de proporcionar metadatos, incluyendo la posibilidad de crear la Red de Información de Representación (Representation Information Network) para el contenido:

    • Ha de ser flexible para dar cabida a diferentes disciplinas.
    • Basado en estándares para mejorar la accesibilidad.
    • Y ¿cuántos metadatos? Se han de considerar al menos los principios de FIABILIDAD (FAIR) y CONFIANZA (TRUST).

    Cuando pensamos en la preservación digital de datos de investigación tenemos que pensar que no solo estamos preservando dígitos, si no que puede ser la clave de muchas investigaciones futuras. Por eso, debemos tomar todas las precauciones que sean necesarias durante todo el proceso, incluso desde antes de que comience el proyecto.

    Antonio Guillermo Martinez, CEO y fundador de LIBNOVA.

    WDPD_Illustration

  • Mapa del sitio | Nota Legal | Política de Privacidad | Condiciones generales de venta, uso y contratación | Política de cookies | Política de Calidad | Política de Compras | Contacto
    LIBNOVA S.L. - Paseo de la Castellana, 153, 28046 Madrid - Tel: +34 91 449 08 94 - Fax: +34 91 141 21 21

    LIBNOVA PYME Innovadora