Il est recommandé d’élaborer un plan de gestion de données qui précisera, dès le début d’un projet de recherche, les données et les documents afférents qui seront à conserver et à protéger, à l’aide de copie de sauvegarde.
Une bonne règle est celle du 3-2-1 : 3 copies, dont 2 copies de sauvegarde avec 1 copie hors site.
Idéalement, il faudrait conserver toutes les données de recherche jugées de qualité avec les documents afférents, c’est-à-dire : les métadonnées, les documents décrivant la méthodologie de collecte de données et de conception de la base de données, ainsi que les documents décrivant les façons d’utiliser ou de transformer la base de données.
- Il n’y a pas de règle générale sur la fréquence des mises à jour des copies de sauvegarde des bases de données. Lorsque le projet de recherche progresse et que de nouvelles données sont disponibles, les fichiers conservés doivent être régulièrement mis à jour.
- Par la suite, il est recommandé d’utiliser un plan de mise à jour qui peut faire un rappel automatique pour effectuer une révision et déterminer si des modifications à la base de données ou à un des documents afférents seraient nécessaires à faire.
Aucun type de technologie n’est parfait, c’est pourquoi il est recommandé d’utiliser différentes technologies pour copier une même base de données. Voici une liste des technologies courantes :
- Répertoires réseau : Ces répertoires sont placés sur des serveurs institutionnels qui sont normalement bien protégés et dont des copies de sauvegardes automatiques sont régulièrement effectuées.
- Disque dur d’ordinateur : C’est une technologie flexible tandis que la base de données est en élaboration, mais elle devrait être utilisée en complément avec une autre technologie, car le risque de bris ou de perte n’est pas négligeable.
- Instruments externes d’enregistrement (clés USB, CD, DVD) : Ce sont des produits abordables et particulièrement utiles lors de déplacements. Toutefois, il est risqué d’utiliser uniquement ces technologies pour conserver une base de données à long terme; la durabilité est limitée et le risque de perte ou de vol est élevé.
- Répertoires en nuage : Les services comme Dropbox, Google Drive ou OneDrive offrent de l’espace d’enregistrement gratuit ou à faible coût. Même si la plupart offrent des technologies de cryptage, la protection des données n’est pas assurée. En outre, la bande passante est limitée, ce qui peut restreindre l’utilisation de grandes bases de données. Finalement, le service est sujet à changement selon les orientations et la stabilité du fournisseur de service.
Il est important d’utiliser un format de fichier qui permettra une utilisation à long terme aisée de la base de données et ne nécessitant pas de conversion importante des données enregistrées. Il est recommandé d’utiliser des formats en logiciel libre (txt, csv, tab, mp3, flac, xml), idéalement avec un encodage Unicode (ex. UTF-8). Si la base de données inclut de nombreuses métadonnées, il est alors suggéré d’utiliser des formats structurés comme SPSS, SAS ou Stata.
Si vous utilisez un logiciel propriétaire, il est important de préciser lequel.