BIBLIOGUÍAS
Se considera todo aquel material que ha sido registrado durante la investigación, está reconocido por la comunidad científica y sirve para certificar los resultados de la investigación que se realiza. Pueden ser numéricos, descriptivos o visuales, en estado bruto o analizado, experimentales u observacionales.
Las instrucciones para adjuntar los datos como material suplementario se encuentran en la política editorial de cada revista, en el apartado de información para autores.
Según la tipología de los datos, los formatos serán distintos. En el caso de protocolos, secuencias, estructuras... se depositan en un repositorio (p.e. Genbank, ProteinDataBank, etc.) y en el artículo se incluye el número identificación permanente asignado.
Los artículos de datos se publican en revistas de datos y están revisados por pares. Principlamente son de acceso abierto para que los datos puedan ser reutilizados y citados. Se pueden consultar las revistas de datos en Zenodo List of Data Journals.
Al conjunto de datos se le asigna un número de identificación persistente que se debe incluir en el artículo. Los repositorios de datos están registrados en re3data y se pueden consultar desde el buscador Repository Finder.
Actualmente la Universidad de Navarra no cuenta con un repositorio institucional propio dedicado a la preservación de datos de investigación. Sin embargo, existe un importante número de repositorios externos que ofrecen este servicio. Cada uno de estos repositorios cuenta con una "Comunidad Universidad de Navarra", donde los investigadores de la institución suben sus datos de investigación.
En líneas generales, los repositorios de datos de investigación en los que actualmente depositan los datos de investigación se dividen en dos tipos:
El tratamiento de los datos hace referencia a limpiar y procesar los datos en bruto, recogidos o generados durante la investigación. Los ficheros de datos deben estar bien organizados y con una estructura coherente y ordenada. Se recomienda:
Se debe asegurar la integridad de los datos creando una versión definitiva del conjunto.
Se deben seleccionar los datos que serán accesibles públicamente, ya que no todos pueden ser abiertos. Hay que tener en cuenta aspectos relativos a la propiedad intelectual (Ley 23/2006 de Propiedad Intelectual), la propiedad industrial, la privacidad o secreto y la protección de datos personales.
Cuando se obtienen datos personales, sensibles o confidenciales vía cuestionarionario, entrevistas, etc. se debe mantener la confidencialidad según indica la ley LO 15/1999 de Protección de Datos de Carácter Personal. Para cumplir con los preceptos legales:
El proceso de anonimización permite compartir datos preservando la privacidad. Para anonimizar los datos de carácter personal se recomienda:
Es importante definir la licencia de uso y reutilización que se quiere permitir que tengan los datos. Se debe incluir en los metadatos, en el repositorio o en el archivo adjunto a los datos "readme file". Las licencias más comunes son:
This {DATA(BASE)-NAME} is made available under the Public Domain Dedication and License v1.0 whose full text can be found at: opendatacommons.org/licenses/pddl/1.0/
This {DATA(BASE)-NAME} is made available under the Open Data Commons Attribution License: opendatacommons.org/licenses/by/
This {DATABASE-NAME} is made available under the Open Database License: opendatacommons.org/licenses/odbl/1.0/. Any rights in individual contents of the database are licensed under the Database Content License: opendatacommons.org/licenses/odbl/1.0/
Al depositar el archivo de datos de investigación, algunos repositorios le asignan un identificador unívoco y permanente. Este identificador es muy importante ya que asegura el almacenamiento del archivo y su localización de forma permanente aunque el recurso cambie de localización.
El más común es DOI (Digital Object Identifier), también se utilizan handle, purl, ark. Es un elemento obligatorio a incluir en la referencia bibliográfica para citar los datos.
Se recomienda proporcionar la cita normalizada para favorecer el reconocimiento de la autoría:
Ejemplo de dataset en un repositorio:
Ball-Damerow, J.E., Brenskelle, L., Barve, N., LaFrance, R., Soltis, P.S., Sierwald, P., ... Guralnick, R. (2019). Bibliographic dataset characterizing studies that use online biodiversity databases [data set]. Version 1. Zenodo. doi.org/10.5281/zenodo.2589439
Más información en: Cómo citar los datos de investigación.
Se recomienda subir al repositorio, junto al archivo de datos, un archivo complementario en formato plano .txt titulado "Readme file", con los campos esenciales de información:
En el siguiente enlace se puede acceder a un ejemplo de documento txt. con la información básica sobre un dataset.
Es importante seleccionar un repositorio que asigne a los datos un identificador unívoco y permanente (DOI, PURL, ARK) para que sean localizables aunque la url cambie.
El registro re3data recopila los repositorios de datos existentes clasificados por disciplinas, tipo de datos, licencia de uso, área geográfica, y otros criterios.
La revista Scientific Data, de Nature, recomienda algunos repositorios por temática y tipo de datos.
Para elaborar esta guía se han utilizado las siguientes fuentes: