Elegir el formato adecuado
En la etapa de planificación de la investigación es importante considerar en qué formato se guardarán sus archivos. Esto estará determinado por una serie de factores que incluyen:
- La naturaleza de su investigación
- Qué software tiene a su disposición y con cual tiene experiencia previa
- El hardware que está utilizando para recopilar sus datos (es posible que no tenga otra opción en cuanto a los formatos de archivo producidos por un instrumento o equipo en particular)
- Los flujos de trabajo que pretende implementar para recopilar y analizar sus datos
- El espacio de almacenamiento digital que tiene disponible: la elección del formato de archivo puede tener un impacto en el tamaño del conjunto de datos final
- Es importante considerar cuestiones como: qué formatos son más fáciles de compartir y/o reutilizar, cuáles tienen menor riesgo de obsolescencia, qué formato requiere el repositorio donde voy a depositar, etc.
Tipos de formatos
El formato elegido debe garantizar la reutilización y preservación de los datos, así como cumplir los requerimientos de los organismos financiadores y los requisitos de los repositorios donde se van a depositar. Se recomienda utilizar formatos abiertos, no propietarios, para garantizar que la mayoría del software sea capaz de interpretar los datos.
Formatos de ficheros recomendados y aceptados en función de los tipos de datos:
Más información
Algunas herramientas para la conversión de formatos:
Estructura de los ficheros
El nombre, la estructura de las carpetas y el control de versiones de los ficheros deben facilitar la búsqueda, localización y comprensión de los datos. Por ello, es muy importante planificar bien esta cuestión.
Recomendaciones para nombrar los archivos:
- Nombrar los archivos con nombres cortos y relevantes
- No utilizar caracteres especiales: ~ ¡ ! @ # $ % ^ & * ( ) ` ; < > ¿ ? , [ ] { } ' " |
- Usar el guion bajo, mejor que el espacio en blanco
- Ser consistente con la nomenclatura que se escoge, mayúsculas, minúsculas, forma de las fechas, AAAA‐MM‐DD o AAAA‐MM.
Más información UK Data Service
Herramientas para renombrar ficheros:
Recomendaciones para la organización de las carpetas:
- Pensar la mejor jerarquía para los archivos: profunda o superficial
- Organización sistemática de las carpetas y ficheros
- Restringir el nivel de carpetas a tres o cuatro
- Separar los trabajos finalizados de los que los que está en curso
Más información UK Data Service
Recomendaciones para el control de versiones:
- Si hay varias versiones nombrar por número (por ejemplo v01, v02, etc.)
- Para la versión final se puede nombrar como FINAL
- Decidir cuántas versiones de un archivo y qué versiones se conservarán y durante cuánto tiempo
- Registrar los cambios realizados en un archivo cuando se crea una nueva versión
- Realizar un seguimiento de la ubicación de los archivos si están almacenados en distintas ubicaciones
- Elegir una sola ubicación para las versiones importantes o definitivas
Más información UK Data Service
Herramientas para gestionar versiones:
Infografía Organice los archivos del proyecto elaborada por el Grup de treball de Suport a la Recerca del CSUC y traducida por la Sección de Apoyo a la Investigación de la Universidad de Sevilla
Documentar los datos
- Una buena documentación ayuda a interpretar los datos, tanto ahora como en el futuro, permitiendo usarlos de forma rápida y ágil. Facilita el compartirlos con otros colegas y proporciona un contexto para minimizar el riesgo de malentendidos o mal uso
- La documentación debe incluir información sobre quién creó los datos y por qué, una descripción de los datos, la metodología, las unidades de medida y las definiciones de códigos. También puede incluir referencias a datos relacionados o al software
- La documentación es esencial para la preservación de los datos a largo plazo, funcionando como un registro de acuerdos, procedencias, licencias y acceso
- No debe dejarse para el final del proyecto, sino al inicio y durante el mismo, así aseguramos que los datos claves están presentes
- La documentación puede estar en cualquier formato que sea apropiado para su investigación y los datos que describe: hoja de cálculo, imágenes, base de datos, etc. Independientemente del formato de la documentación, debe asegurarse de que esté accesible junto con sus datos para cuando se requiera interpretarlos. Si estuviese en un formato físico, se recomienda digitalizarla para que pueda ser almacenada con los datos que describe y tenga una copia de seguridad
- ¿Qué se debe documentar? No hay reglas fijas, pero es conveniente pensar en lo que se necesita para que pasados 5 o 10 años los datos puedan ser reutilizados
- Para garantizar que los datos pueden ser replicados de manera sencilla y rentable es imprescindible añadir un fichero readme.txt con la información necesaria para que los datos sean comprensibles y reutilizables: descripción, metodología, coberturas, derechos de uso, privacidad. Existen diversas guías y plantillas de ayuda para elaborar el archivo: plantilla Acceso Descarga, Guía para elaborar ficheros readme de la Cornell University.