Edition : activités du CEDRAM

L’activité du Cedram se décompose en trois volets principaux :

  • développement de divers composants de la chaîne d’édition, de la sélection des articles à la diffusion en passant par la fabrication ;
  • support aux revues ;
  • production et publication au fil de l’eau.

Dans la première catégorie, on trouve évidemment la plateforme de diffusion, qui est en cours de refonte et dont la mise en production devrait suivre celle de Numdam, mais aussi plus spécifiquement les outils de fabrication (classe LaTeX cedram et ses déclinaisons pour les diverses séries, Tralics et les transformations XML vers les formats utilisés pour la difusion). Le support, l’installation et la documentation de RUCHE a également mobilisé des moyens sur la période, même s’il n’y a pas eu de développements à proprement parler, l’activité s’étant consacrée principalement à des correctifs. Mathdoc consacre aussi une certaine énergie à la mise en place et à la maintenance journalière des sites web des revues, dont une grande partie est en Spip.

La seconde catégorie est assez variée et couvre un spectre d’activités assez large, allant d’une veille sur les nouveautés du monde LaTeX à la fourniture d’outils comme RUCHE, voire à la réponse à pas mal de questions au jour le jour, ceci pouvant être en rapport avec une documentation parfois trop elliptique, pour ne pas dire inexistante, de certains de nos outils.

La troisième catégorie passe un peu inaperçue : c’est le labeur quotidien qui consiste à accompagner un fascicule finalisé par une revue vers sa mise en ligne sur le site de diffusion. Ce chemin est à la fois très largement automatisé et plein d’embûches. Ceci peut donc nécessiter une technicité non bornée a priori, et des interventions manuelles à chaque étape. Depuis le départ en congé longue durée d’Isabelle Costerg, cette tâche est réalisée sur la base du bon vouloir par deux personnes, dont le directeur de l’unité, pour ne pas pénaliser les revues.

Chaîne de production

Le but recherché par le Cedram est de permettre aux revues académiques de s’approprier leur production en mettant à leur disposition des outils performants et facile d’accès. C’est une des raisons pour lesquelles la chaîne de production est entièrement basée sur (et largement écrite en) LaTeX : ce qui est validé par les auteurs, ce sont les sources LaTeX et le PDF qui en résulte. Par conséquent c’est ce qui fait foi et est donc à la source des tous les traitements subséquents.

Le fonctionnement actuel du Cedram suppose que les revues disposent de la structure éditoriale leur permettant de gérer le processus allant de la soumission ou sollicitation d’un article à l’établissement de la version définitive après évaluation par les pairs, relectures, corrections et mise en page au sein du fascicule. À partir de là, Mathdoc (cf. figure 3) A FAIRE ! mette le lien

  • réceptionne tous les éléments nécessaires à la fabrication du fascicule ;
  • lance des scripts et programmes qui produisent simultanément le fichier XML de métadonnées et tous les PDF nécessaires à l’impression comme à l’édition électronique ;
  • met en ligne le résultat de ces traitements sur un site de test ayant fonction d’épreuve électronique, à partir duquel la revue décide de faire des corrections, demande des modifications, ou valide pour mise en ligne sur le site public ;
  • bascule les fascicules validés sur le site de la revue ;
  • retourne à la revue les éléments de production définitifs, de telle sorte qu’elle puisse les archiver, faire imprimer le cas échéant, etc.

L’hypothèse ci-dessus n’étant finalement que rarement vérifiée, Mathdoc a pris en charge au fil du temps de nombreux aspects qui ne sont pas de son ressort (à l’exclusion de décisions scientifiques). Une solution est d’étendre la palette des services proposés par Mathdoc (voir le projet Scientific Edition ci-dessous) pour répondre à tous les cas mais il faudra mettre des moyens humains pour que cela puisse fonctionner !

La classe Cedram a vu son nombre d’options augmenter assez rapidement pour faire face à tous les cas de figure. Il existe aujourd’hui deux modes opératoires radicalement différents :

  • un mode natif dans lequel les articles sont composés avec la classe Cedram (c’est-à-dire que les textes des auteurs sont mis aux normes en utilisant la déclinaison de la classe Cedram qui implémente la maquette de la revue, de ce fait la qualité est optimale) ;
  • un mode de compatibilité qui permet d’utiliser un PDF déjà composé avec une autre classe (voire avec autre chose que LaTeX) et d’insérer cependant l’article dans le système de production standard du Cedram en préparant un fichier LaTeX paramétrant les métadonnées.

Les Annales de l’institut Fourier utilisent des sous-traitants pour la mise aux normes des articles, si bien qu’il y a une qualité de la préparation des fascicules relativement homogène. L’intervention de Mathdoc consiste à régler finement les métadonnées et corriger des erreurs qui peuvent avoir échappé aux étapes précédentes car le XML n’y est pas produit. Quoiqu’organisées un peu différemment, la situation est similaire pour AMBP, JTNB, JEP, CML, TSG, qui sont toutes produites en mode natif.

MSIA et plusieurs séries d’actes sont également produites en mode natif, la plupart du temps par l’équipe de Mathdoc car il n’y a pas de personnel pour prendre en charge la mise aux normes du Cedram dans ces publications. C’est un point préoccupant, surtout dans les circonstances actuelles d’absence de personnel à Mathdoc dédié à ces tâches.
Deux séries sont produites en mode de compatibilité : le séminaire SLS-EDP par décision de son responsable qui ne souhaite pas passer du temps à reprendre les textes des orateurs, et les Annales de la faculté des sciences de Toulouse qui font imprimer leurs fascicules avant de nous les envoyer, et pour lesquelles la mise en ligne sur le site du Cedram s’apparente à une acquisition dans Numdam.
De fait, la chaîne d’intégration au Cedram en mode de compatibilité est assez largement utilisée pour les acquisitions de Numdam quand nous pouvons disposer de sources LaTeX de façon à générer des métadonnées XML de qualité.

Une part importante de la production actuelle du Cedram est représentée par les AIF (80 articles et 2500 à 3000 pages par an sur les 200 articles et 6000 pages annuelles). Cependant le volume de travail dépend beaucoup de l’organisation de chaque publication, de l’existence ou non d’une personne référente pour les différentes tâches à réaliser en amont ou en aval de notre chaîne de fabrication et diffusion.

A FAIRE ! : insérer schéma p 34

Crossref

CrossRef est le service d’une association d'éditeurs (Publishers International Linking Association, Inc.) qui développe une infrastructure permettant d'établir des références croisées entre publications. La Cellule Mathdoc est devenue membre de l'association Crossref en 2011, et est donc habilitée à attribuer des DOI (Digital Object Identifier) aux articles scientifiques qu'elle publie, et à les déclarer dans le système CrossRef. CrossRef fournit également un service permettant d'obtenir un DOI à partir d'une référence bibliographique (par matching).
Un système simple d'attribution et d'enregistrement des DOI a été développé en 2011, ainsi qu'un système d'interrogation de la base CrossRef.
Mis en place en une quinzaine de jours, ces systèmes sont peu ou mal intégrés au flux de production Cedram existant. Une des tâches à prévoir dans les années qui viennent pourrait être une amélioration du flux de production intégrant dans sa conception la gestion des DOI.
Notons également que tous les services CrossRef fonctionnent de manière asynchrone, les notifications étant envoyées par courrier électronique. Ceci rend délicate une automatisation plus poussée de leur utilisation.

Versement dans Numdam

À l'issue d'un délai d'environ un an après leur publication sur un des sites hébergés par le Cedram, les volumes sont versés dans la bibliothèque numérique Numdam. Pour l’essentiel, les XML Cedram sont convertis (simplifiés) à la DTD Volphys de Numdam.  Le seul domaine dans lequel il arrive que les données Cedram soient moins précises que celles de Numdam est le balisage des bibliographies, car les bibliographies répondent à des logiques différentes dans les deux services : dans Numdam, ce sont des chaînes de caractères surbalisées a posteriori, tandis que dans Cedram, ce sont soit des données provenant de Bibtex demandant un traitement pour être lues, soit des chaînes de caractères stylées mais non balisées.
Comme pour les autres acquisitions Numdam, les PDF sont versés tel quel.

Lancement de séries

Depuis le démarrage du Cedram les séries diffusées étaient restées relativement stables (une seule création : Math in Action, qui n’a jamais atteint un flux d’articles considérable).
En 2011, le « séminaire X-EDP » s’est éteint après quarante ans de service, il a laissé la place au « séminaire Laurent Schwartz — EDP et applications » réalisé en partenariat par Polytechnique et l’IHES, et publié par l’X. Le lancement de cette série s’est fait sans difficulté particulière.  C’est la première série utilisant explicitement une licence Creative Commons. Une page de garde a été dessinée, ainsi qu’une vignette de couverture pour l’identifier sur le site web.
En 2012, les travaux ont commencé pour accueillir la revue Confluentes Mathematici, précédemment publiée par World Scientific et désormais en accès libre au Cedram, l’éditeur étant l’institut Camille Jordan (Lyon). La conception du site web en Spip a été comme d’habitude un peu compliquée mais largement prise en main par le laboratoire lyonnais, lequel a aussi maîtrisé assez rapidement le système LaTeX.
En 2014, le Cedram a participé au lancement du Journal de l’école polytechnique, renaissant dans une nouvelle série consacrée aux mathématiques. Création d’une maquette entièrement nouvelle, devant tenir compte des souhaits des graphistes de l’X et très étroitement pilotée par Claude Sabbah. Quatorze articles sont parus en 2014. Une particularité de cette revue est que les sources TeX des articles sont diffusés à côté des PDF.
Enfin, fin 2014, nous avons publié un ouvrage de Michèle Audin : livre historique principalement consacré au séminaire Julia, dont elle a ressaisi et annoté l’intégralité des textes (dont la numérisation est par ailleurs programmée dans Numdam 4). Cet ouvrage d’un millier de pages à la structure complexe a été entièrement reconçu en vue d’une édition purement électronique avec possibilité d’impression à la demande séparée de la partie historique, voire des tomes annuels. Cet ouvrage était en principe programmé dans une collection historique d’un éditeur académique qui s’est retiré du projet.

En 2014, Mathdoc a aussi participé aux travaux préliminaires de lancement de la revue SMAI-Journal of Computational Mathematics (maquette LaTeX, conseil, adhésion à Crosscheck…) et donné son accord pour l’accueil d’une nouvelle série d’actes : Winterbraid Lecture Notes (WBLN).

Projet Scientific Edition

Un grand nombre de réunions ont eu lieu au cours de la période entre les revues du Cedram et avec d’autres partenaires dans le but de faire avancer la mutualisation (bouquet commun, avec la SMF, outils communs partagés par des revues sur différentes plateformes…). Pour l’instant, le seul résultat tangible est constitué par les décisions prises lors de la journée sur les publications organisée à Grenoble par Mathdoc le 24 novembre 2014 : formalisation d’un projet Scientific Edition alliant le Cedram, Epi-math, le volet mathématique d’Epi-Sciences, et mathjournal, un projet d’évolution d’OJS pour mieux servir les revues de math. Avec notamment pour objectif d’accompagner les revues académiques vers un libre accès « diamant » qui suppose un soutien fort et déterminé d’institutions assurant la gratuité de la publication et de l’accès. Mathdoc a commencé à se former sur OJS, organise d’ailleurs une formation à Grenoble le 6 janvier 2015, et a décidé d’accompagner les AIF dans leur migration à partir de RUCHE. Les autres aspects du projet restent largement spéculatifs car dépendant de financement ou de soutien non débloqués fin 2014.