Projet bibliothèques numériques

Le projet bibliothèques numériques peut être découpé en :

Plateforme et chaîne de numérisation

Une des premières actions est de mettre à plat notre chaîne de production et de diffusion des collections numérisées. Il y a là à la fois une opportunité et une certaine urgence car après le départ de Catherine Zoppis,  l’évolution de la chaîne actuelle est rendue nécessaire notamment pour accompagner le projet BSN 5 pour lequel nous avons des délais assez stricts de mise en ligne, mais ne peut se faire comme de petites modifications incrémentales. Tandis que Claude Goutorbe travaille avec Olivier Labbe sur la plateforme numérique de Mathdoc qui permettra de remplacer EDBM pour l’hébergement et la diffusion de nos corpus numériques, nous allons utiliser nos reliquats du projet EuDML pour recruter un ingénieur sur CDD pour une mission d’un an environ dont l’objectif sera de créer la nouvelle base de données de production de Numdam, ainsi que les applications satellites permettant de gérer cette production. Le modèle de données sera un sur-ensemble de celui de la base de diffusion, simplifiant ainsi la publication et permettant de remonter certaines tâches à l’étape logique de la chaîne de production, ce qui n’est pas le cas aujourd’hui (un exemple : le matching des références bibliographiques). La maîtrise des technologies de la nouvelle plateforme par plusieurs membres permanents de l’équipe en prévision du départ à la retraite de Claude Goutorbe est également un objectif prioritaire. Cela permettra la mise en service de cette plateforme courant 2015. Un avantage attendu de cette plateforme est de disposer d’une infrastructure de bas niveau assez universelle pour héberger toutes les collections numériques dont nous avons la charge (collections numérisées, acquises, archivées dans le cadre de licences nationales, hébergées pour le compte de partenaires académiques…), voire pour réaliser un miroir de la DML remplaçant les services mini-DML et LiNum qui sont appelés naturellement à être fermés dès que leur contenu se retrouve dans un plus grand réservoir de données (ce qui n’est pas le cas actuellement puisque EuDML est toujours limité à des partenariats européens).

Politique d’acquisition documentaire

Un second objectif est de définir une politique d’acquisition des collections numériques de Mathdoc. La numérisation de livres en aveugle est hors de portée pour une unité de notre taille. En revanche, une numérisation concertée pourrait se faire en lien avec le RNBM sur le principe que tout mathématicien pourrait recommander la numérisation d’un texte rare ou difficile d’accès, de façon à constituer un corpus utile. Il reste également quelques revues qui n’ont toujours pas été numérisées, comme le Journal de mathématiques pures et appliquées ou le Bulletin des sciences mathématiques. Ces deux dernières revues étant numérisées par Gallica avec une barrière mobile de 70 ans, le problème de la réindexation de ces collections se pose également  avec une certaine acuité, ainsi d’ailleurs que celle des CRAS. Toutes ses actions trouvent assez naturellement leur place dans les projets nationaux (BSN, PAP de la DIST), mais nous ne les entreprendrons que si on nous en donne les moyens humains et financiers. De même, l’acquisition de la production récente des publications archivées dans Numdam reste une priorité scientifique pour Mathdoc. Le projet Scientific Edition prend en compte cette activité et souhaite en faire bénéficier les revues nouvelles et innovantes. Il ne faut pas sous-estimer le caractère chronophage de cette activité.

Agrégation et bibliothèques virtuelles

Nous participons à une proposition de projet européen porté par le réseau Eu-MATHS-IN qui a souhaité intégrer un work package créant un lien entre les outils à destination des industriels et de la communauté académique en simulation et modélisation (et plus généralement en mathématiques) et la bibliothèque EuDML. De façon générale, nous ferons tout ce que nos moyens nous permettront de faire pour élargir les collections EuDML à tous les parternaires possibles,  et pour clarifier et améliorer le service en ligne. Nous envisageons de faire un miroir des collections comme test pour notre propre plateforme, et comme sécurité dans le cas où le partenaire principal ne maintiendrait pas le service si aucun financement spécifique ne devait apparaître rapidement.
Nous participerons aussi au travail à l’échelle mondiale, avec pour principale stratégie de faire avancer en parallèle ce qui peut être fait dans chaque continent en fonction des opportunités et des communautés locales, en cherchant à faire adopter des standards d’interopérabilité simples et peu contraignants mais permettant au final de combiner les résultats des différents projets et constituer de la sorte une infrastructure globale.

Archivage pérenne

Mettre en place un archivage pérenne de nos collections est un objectif affiché par Mathdoc depuis des années. Nous avons cru l’atteindre en cours de ce quinquennal à la faveur de la BSN dont une recommandation des groupes 2, 5 et 6 était de labelliser des collections (sur critères scientifiques et techniques) et d’offrir en contrepartie un dispositif d’accès et d’archivage pérenne de plein droit. Ces recommandations n’ayant pas survécu à la réalité de la rigueur budgétaire, il nous resterait la possibilité de payer une somme non négligeable (et annuelle, aussi longtemps que nous souhaitons conserver l’archive, donc pour l’éternité ?) au CINES, ce que nous nous sommes refusés à faire pour l’instant. Comme alternative, nous avons proposé aux partenaires de l’initiative EuDML de monter une archive répliquée et dupliquée CLOCKSS au moins pour les collections de Numdam. Nous allons faire pression en faveur de ce projet mais, comme il dépend de moyens dans plusieurs pays européens pour sa mise en place, nous ne nous faisons pas d’illusions sur l’imminence de sa mise en œuvre.

Contrôle qualité pour les acquisitions numériques

En fonction des moyens qui nous serons alloués, nous souhaitons mettre en place une véritable chaîne d’acquisition pour Numdam, qui prenne en compte les formats d’archivage comme PDF/A et opère un véritable contrôle qualité sur les données reçues comme nous le faisons pour la numérisation.

Statistiques pertinentes sur l’usage de nos services

Nous disposons de très peu d’outils de statistiques pour mesurer et surtout mieux comprendre l’usage qui est fait de nos services. Nous ne savons pas par exemple dans quelle mesure la recherche sur les bibliographies est utilisée ni à quelles fins. Numdam en propose une version très élaborée depuis la première mise en ligne ; elle est disponible sous une forme très différente dans Numir et n’est pas proposée dans EuDML par exemple. Nous savons que la grande majorité des utilisateurs font leurs recherches dans des moteurs de recherche généralistes ou dédiés et atteignent donc directement l’article sans utiliser le moteur de recherche local (ce qui est impossible dans Numir). Nous savons aussi que quelques utilisateurs font un usage très avancé de nos  moteurs de recherche (les historiens, notamment). Mais nous n’avons pas de données au-delà de quelques logs que nous n’avons pas le temps d’analyser. Nous avons pu faire un peu avancer ces questions lors de l’enquête de la BNF à laquelle nous avons participé en tant que bibliothèque associée à Gallica. Un partenariat avec des chercheurs et quelques développements à l’occasion de stages de master pourraient être envisagés.