Sauvegarde et archivage

La  Cellule Mathdoc assure une sauvegarde régulière de toutes les informations qu'elle manipule comme tout centre de traitement de l'information. Ceci est décrit dans le chapitre « Infrastructures ».

Mathdoc héberge un volume conséquent de données (articles...) d'une valeur scientifique importante et dont il n'existe souvent pas de copie dans une autre structure. En parallèle, des logiciels spécifiques internes ont été développés et des bases de données sont utilisées pour la gestion et l'accès à ces données. Le volume global est d'environ un Tera-octet et les documents ne sont que du texte ou des images, pas de multimédia.

Dans cette situation il y a deux risques majeurs qu'il faut prendre en compte :

  • Une destruction des matériels (machines, disques) entraînant aussi la perte des données sur le site Mathdoc à Grenoble. Pour ce risque une solution est d'assurer une copie régulière des données, bases de données et logiciels sur un autre site non grenoblois de manière à pouvoir remettre en place les services assurés avec les données. Cela correspond à un plan minimal de reprise d'activité.
  • L'impossibilité de relire d’anciennes données qu'il est nécessaire de conserver et qui ne sont plus utilisées au quotidien mais qui ont une certaine valeur. Il y a ainsi des données historiques sur d’anciens supports physiques qu'on ne sait déjà plus lire. Il faut donc étudier comment assurer un archivage pérenne des données importantes avec les outils pour les traiter.

Trois actions sont menées pour ces 2 objectifs :

  • La mise en œuvre d'une sauvegarde à distance sur un site Mathrice non Grenoblois, actuellement à Lille pour être précis. Le système fonctionne avec les données des services majeurs mais il manque encore les outils logiciels et d'autres données. Il reste donc à faire la liste exhaustive de ce qu'il faut sauvegarder et le mettre en œuvre. C'est en cours.
  • La participation au groupe de travail BSN6 sur l'archivage pérenne. Ce type de service est assuré principalement par le CINES (PAC) et BNF (SPAR) pour le patrimoine scientifique. Le déploiement de ces solutions a été achevé et plusieurs centres similaires au nôtre les utilisent déjà (Persée, Cleo, CCSD, SICD…). Il y a actuellement un coût élevé et surtout un modèle opératoire qui nous semble inadapté (pas pérenne, justement !) : la structure qui a des données à préserver (pour l’éternité) doit payer une somme non négligeable au CINES pour l’archivage de ses données, chaque année. Que se passe-t-il en cas de coupe budgétaire ? Mathdoc a décidé de participer aux réflexions sur la mise en œuvre en étant éventuellement volontaire pour devenir site pilote. C'est l'objectif de la participation à ce groupe de travail (où l’on apporte aussi des exemples de besoins concrets).
  • La participation à la réflexion sur la mise en place d’un système de copies des données documentaires de maths distribué sur plusieurs sites européens (au moins 3). Nous avons proposé ce projet aux partenaires de l'initiative EuDML, sous la forme de la mise en place d’un réseau privé LOCKSS. Un début d'étude documentaire sur LOCKSS est en cours.