Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Manifestations XML francophones et internationales.L'actualité des affaires et stratégies XML.L'actualité des technologies XML.Les nouveautés et l'actualités de notre site.Pointeurs sur l'actualité XML sur d'autres sites, en français comme en anglais.


Dix années de XML à l'ABES

Répondez à cet article.

La recommandation XML 1.0 a été publiée il y a dix ans cette année. Yann Nicolas, conservateur de bibliothèques à l'ABES (Agence Bibliographique de l'Enseignement Supérieur), répond aux questions de XMLfr et fait le point de ces dix années de XML à l'ABES.

Eric van der Vlist, Dyomedea (vdv@dyomedea.com).
lundi 31 mars 2008

Eric van der Vlist : A quel moment avez-vous commencé à vous intéresser à XML?

Yann Nicolas : A l'ABES, on a ressenti le besoin de "passer par" XML vers 2001. Je dis "on', mais je suis arrivé à l'ABES en 2003 !.

vdV : Pour quelle raison? Quelle a été votre première application de XML?

YN : L'ABES venait de lancer le Sudoc, qui est le catalogue collectif des bibliothèques universitaires de France. Le Sudoc est à la fois un réseau de catalogage et un site de recherche et de consultation public. Parmi ses missions, il y a aussi l'édition de produits dérivés à partir de notre base bibliographique, des listes de notices ou de références éditées sous différentes formes (CSV, Word...).

vdV : Quelles étaient vos attentes par rapport à ces technologies? Quel était le problème à résoudre?

YN : Dans ce processus d'édition, il y avait d'un côté les données de départ, formatées en MARC, un format propre au monde des bibliothèques, hérité des années 60 ; de l'autre côté, il y avait les données cibles, dans les formats de la bureautique de tous les jours (.doc, .xls…). D'un côté un format métier, riche, très spécifique et assez daté ; de l'autre une pluralité de formats bien connus. XML s'est imposé comme le go between idéal, le bon intermédiaire.

En fait, on a utilisé XML dans son rôle classique de format pivot permettant de multiples sorties à partir d'une seule source de données. Les informations à traiter étaient à la fois orientées Données et orientées Documents, car, en MARC, l'ordre des informations peut compter. XML était vraiment pertinent.

vdV : Comment vous y êtes vous pris, quels outils/architecture/méthodes avez-vous utilisé?

YN : Les données MARC sont converties par programme dans un format XML pivot, qui possède la même finesse que les données de départ –du MARC en XML en somme. Ensuite, un XSLT prend le relais puis des composants .NET.

vdV : Les résultats ont-ils été conformes à vos attentes?

YN : Tout à fait, même si, depuis, bien des choses ont changé et qu'on ne le referait plus forcément de la même manière.

vdV : Quels enseignements avez-vous pu en tirer?

YN : Deux enseignements principaux : premièrement, XML était une technologie très prometteuse pour les bibliothèques, l'occasion d'échapper à l'enclave technologique dans laquelle elles se trouvent bien souvent (formats spécifiques, marché des outils et services informatiques spécifique,…) ; deuxièmement, XML (voire XSLT) était une technologie prometteuse pour les bibliothécaires eux-mêmes, car il est plus lisible que le format MARC et plus facile à manipuler.

vdV : Pouvez-vous nous parler des applications de XML les plus marquantes?

YN : Fin 2007, nous avons lancé Calames, un nouveau catalogue, dédié aux archives et aux manuscrits (le Sudoc traite surtout des livres et des revues). Cette fois, les données bibliographiques traitées sont nativement en XML, en l'occurrence en EAD, un vocabulaire utilisé dans les bibliothèques et centres d'archives du monde entier.

vdV : A quelle date?

YN : La conception a eu lieu de juillet à décembre 2006 et le cœur des développements de janvier à juin 2007. Mais les différentes expériences que nous avons eues avec XML depuis 2001 nous ont beaucoup aidés.

vdV : Quel était le problème à résoudre?

YN : Comme le Sudoc, Calames est à la fois une interface publique de recherche et de consultation, un réseau de bibliothèques et un outil de catalogage en EAD. Il fallait trouver une manière d'exploiter nos données XML pour permettre des recherches en texte intégral assez fines sur de nombreux éléments, du scan d'index avec autocomplétion, de la navigation fluide dans de copieux arbres XML (20 Mo parfois) dans tous les axes (parents, enfants, frères) et enfin l'édition en ligne de ces données EAD.

vdV : Comment vous y êtes vous pris, quelles outils/architecture/méthodes avez-vous utilisé?

YN : Côté méthode, notre direction nous a fait confiance pour réaliser les développements en interne. Nous avons procédé dans un va-et-vient permanent entre des prototypages et une concertation étroite avec les experts métier de bibliothèques partenaires.

Ce qui fut décisif, c'est le choix d'une base de données hybride comme MS SQL Server 2005, gardant le meilleur du relationnel et prometteuse sur les technologies XML (données de type XML, implémentation d'une partie d'XQuery, XSLT, W3C XML Schema…). Au départ, nous espérions tout faire en XQuery, mais les performances n'étaient pas suffisantes pour la recherche. Finalement, nous avons opté pour une solution mixte. Notre interface de catalogage en EAD interagit bien avec la base de données en XQuery et DML (le XQuery Update de Microsoft). Par contre, l'interface de recherche et de consultation s'appuie sur un traitement différent : le fichier EAD est éclaté dans la base en blocs XML, qui correspondent aux unités d'information minimales que le client Web aura à manipuler en AJAX.

Nous n'aurions pas pu obtenir ce que nous voulions avec une base de données relationnelle, car l'XML de l'EAD est complexe, variable et contient du contenu mixte. Inversement, un SGBD purement XML comme eXist n'aurait pas suffi non plus à effectuer tous les traitements exigés, du moins pas aujourd'hui.

vdV : Les résultats ont-ils été conformes à vos attentes?

YN : Oui. Les performances sont très satisfaisantes. La navigation dans l'arbre XML est souple, et ce dans les deux interfaces. Par ailleurs, l'architecture générale de Calames est extensible, ce qui nous permettra d'aller plus loin. Calames est tout jeune.

vdV : Quels enseignements avez-vous pu en tirer?

YN : La solution "XML à tous les étages" n'est pas forcément la bonne. Quand les performances ou d'autres considérations l'exigeaient, nous avons utilisé d'autres solutions, comme le relationnel pour la recherche ou le JSON pour stocker certaines informations côté client. Pourtant, pouvoir gérer de l''XML/EAD du début jusqu'à la fin, du producteur jusqu'au consommateur, de l'éditeur XML jusqu'au navigateur en passant par la base, est intéressant.

vdV : D'une manière générale, vos attentes initiales par rapport aux technologies XML se sont-elles réalisées? Comment qualifieriez-vous l'importance de XML dans votre organisation?

YN : XML est le vecteur par lequel peuvent converger les différentes applications et les différents métiers de l'abes. En tant que technologie Web mature, elle est incontournable pour nos informaticiens. En tant qu'outil de structuration et de manipulation des données à la fois lisible et proche du contenu même de l'information, XML peut être une seconde langue pour certains bibliothécaires, notamment ceux qui ont pris l'habitude de travailler en MARC.

vdV : Comment qualifieriez-vous son niveau de « pénétration » dans votre organisation?

YN : Tous les informaticiens de l'ABES connaissent XML et prêt de la moitié l'utilisent régulièrement, plus ou moins intensivement. Mais, il ne fait aucun doute que cette généralisation d'XML va se poursuivre, à mesure que nos applications évolueront, convergeront et s'ouvriront encore plus vers le Web d'aujourd'hui. Mais cela est vrai aussi des bibliothécaires.

vdV : Trouvez-vous l'information dont vous avez besoin sur XML? Où la trouvez-vous?

YN : Sur le Web (forums, FAQ) et dans les manuels (chez O'Reilly, Wrox).

vdV : Les technologies XML posent-elles des problèmes de formation? Lesquels?

YN : Au-delà de l'autoformation, qui compte beaucoup, nous avons su faire appel aux bons formateurs ;-)

Par contre, dès que les besoins deviennent plus pointus, il est parfois difficile de se perfectionner pour connaître les bonnes pratiques, trouver les raccourcis, ne pas essuyer les plâtres .

vdV : Allez-vous démarrer de nouveaux projets avec des technologies XML? Lesquels?

YN : Nous allons surtout nous concentrer sur nos applications actuelles, pour les rendre plus standard, plus conformes à l'esprit du Web d'aujourd'hui, plus cohérentes entre elles. XML sera un outil précieux pour cet effort.

Par exemple, nous avons recours à des webservices pour faire dialoguer nos applications et nous utilisons Schematron pour effectuer du contrôle qualité sur nos données.

vdV : Quelles sont vos principales attentes par rapport à XML?

YN : Pour nous, les enjeux cruciaux tournent autour des performances (XSLT, XQuery) et de la recherche Full Text d'XQuery.

Parallèlement se pose la question de la création de données en XML. Pour Calames, nos collègues des bibliothèques ont fait le choix d'un véritable éditeur XML, qui ne dissimule pas la structure XML. Pour d'autres projets, XForms nous semble très séduisant, mais quid des "documents" XML ? Les formulaires ne peuvent traiter le contenu mixte. Si la solution "éditeur XML" est viable pour le catalogage dans Calames, ce n'est pas le cas pour produire de la documentation en Docbook, par exemple. Pour que Docbook se généralise à l'ABES (il est déjà utilisé), nous avons besoin de solutions d'édition efficaces. Open Office est décevant sur ce point.

vdV : Envisagez-vous de remplacer XML par une autre technologie?

YN : A l'ABES, notre métier, ce sont les métadonnées. RDF et les autres technologies du web sémantique apparaissent naturellement comme l'étape suivante. Mais ces technologies ne remplacent pas les technologies XML puisque XML est une des syntaxes de RDF.

vdV : Quel rôle voyez-vous pour XML dans 10 ans?

YN : Je botte en touche. Mais il est tentant d'imaginer la banalisation d'XML. Néanmoins, si XML était menacé par d'autres technologies, il me paraîtrait essentiel de conserver l'esprit des compromis qu'XML a su trouver : un format pour les données et les documents, un cadre libéral qui permet à chacun de créer son propre format tout en incitant à réutiliser les formats XML des autres (schémas, espaces de noms), enfin une famille d'outils à la disposition des informaticiens mais compréhensible par les experts métiers.

Voir aussi :

  1. Dix années de XML chez Adobe France
  2. Dix années de XML à l'INSEE
  3. Dix années de XML

Copyright 2008, Eric van der Vlist.


 

Mots clés.



L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.


Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot  

Conception, réalisation et hébergement
Questions ou commentaires
  redacteurs@xmlfr.org