Dix annees de XML a l' ABES
La recommandation XML 1.0 a ete publiee il y a dix ans cette annee.
Yann Nicolas , conservateur de bibliotheques a l' ABES (Agence
Bibliographique de l'Enseignement Superieur), repond aux questions de
XMLfr et fait le point de ces dix annees de XML a l' INSEE .
Eric van der Vlist , Dyomedea ( vdv@dyomedea.com ).
---------------
Retrouvez cet article en ligne
(http://xmlfr.org/actualites/decid/080331-0001).
Donnez votre avis !
mailto:xml-decid@xmlfr.org?subject=Re:%20INFO%20:%20Dix%20annees%20de%20XML%20a%20l'ABES
---------------
Eric van der Vlist : A quel moment avez-vous commence a vous
interesser a XML ?
Yann Nicolas : A l' ABES , on a ressenti le besoin de "passer par" XML
vers 2001. Je dis "on', mais je suis arrive a l' ABES en 2003 !.
vdV : Pour quelle raison? Quelle a ete votre premiere application de
XML ?
YN : L' ABES venait de lancer le Sudoc , qui est le catalogue collectif
des bibliotheques universitaires de France. Le Sudoc est a la fois un
reseau de catalogage et un site de recherche et de consultation public.
Parmi ses missions, il y a aussi l'edition de produits derives a partir
de notre base bibliographique, des listes de notices ou de references
editees sous differentes formes (CSV, Word...).
vdV : Quelles etaient vos attentes par rapport a ces technologies? Quel
etait le probleme a resoudre?
YN : Dans ce processus d'edition, il y avait d'un cote les donnees de
depart, formatees en MARC , un format propre au monde des
bibliotheques, herite des annees 60 ; de l'autre cote, il y avait les
donnees cibles, dans les formats de la bureautique de tous les jours
(.doc, .xls?). D'un cote un format metier, riche, tres specifique et
assez date ; de l'autre une pluralite de formats bien connus. XML s'est
impose comme le go between ideal, le bon intermediaire.
En fait, on a utilise XML dans son role classique de format pivot
permettant de multiples sorties a partir d'une seule source de donnees.
Les informations a traiter etaient a la fois orientees Donnees et
orientees Documents, car, en MARC , l'ordre des informations peut
compter. XML etait vraiment pertinent.
vdV : Comment vous y etes vous pris, quels outils/architecture/methodes
avez-vous utilise?
YN : Les donnees MARC sont converties par programme dans un format XML
pivot, qui possede la meme finesse que les donnees de depart ?du MARC
en XML en somme. Ensuite, un XSLT prend le relais puis des composants
.NET .
vdV : Les resultats ont-ils ete conformes a vos attentes?
YN : Tout a fait, meme si, depuis, bien des choses ont change et qu'on
ne le referait plus forcement de la meme maniere.
vdV : Quels enseignements avez-vous pu en tirer?
YN : Deux enseignements principaux : premierement, XML etait une
technologie tres prometteuse pour les bibliotheques, l'occasion
d'echapper a l'enclave technologique dans laquelle elles se trouvent
bien souvent (formats specifiques, marche des outils et services
informatiques specifique,?) ; deuxiemement, XML (voire XSLT ) etait une
technologie prometteuse pour les bibliothecaires eux-memes, car il est
plus lisible que le format MARC et plus facile a manipuler.
vdV : Pouvez-vous nous parler des applications de XML les plus
marquantes?
YN : Fin 2007, nous avons lance Calames , un nouveau catalogue, dedie
aux archives et aux manuscrits (le Sudoc traite surtout des livres et
des revues). Cette fois, les donnees bibliographiques traitees sont
nativement en XML , en l'occurrence en EAD , un vocabulaire utilise
dans les bibliotheques et centres d'archives du monde entier.
vdV : A quelle date?
YN : La conception a eu lieu de juillet a decembre 2006 et le c?ur des
developpements de janvier a juin 2007. Mais les differentes experiences
que nous avons eues avec XML depuis 2001 nous ont beaucoup aides.
vdV : Quel etait le probleme a resoudre?
YN : Comme le Sudoc , Calames est a la fois une interface publique de
recherche et de consultation, un reseau de bibliotheques et un outil de
catalogage en EAD . Il fallait trouver une maniere d'exploiter nos
donnees XML pour permettre des recherches en texte integral assez fines
sur de nombreux elements, du scan d'index avec autocompletion, de la
navigation fluide dans de copieux arbres XML (20 Mo parfois) dans tous
les axes (parents, enfants, freres) et enfin l'edition en ligne de ces
donnees EAD .
vdV : Comment vous y etes vous pris, quelles
outils/architecture/methodes avez-vous utilise?
YN : Cote methode, notre direction nous a fait confiance pour realiser
les developpements en interne. Nous avons procede dans un va-et-vient
permanent entre des prototypages et une concertation etroite avec les
experts metier de bibliotheques partenaires.
Ce qui fut decisif, c'est le choix d'une base de donnees hybride comme
MS SQL Server 2005, gardant le meilleur du relationnel et prometteuse
sur les technologies XML (donnees de type XML , implementation d'une
partie d' XQuery , XSLT , W3C XML Schema ?). Au depart, nous esperions
tout faire en XQuery , mais les performances n'etaient pas suffisantes
pour la recherche. Finalement, nous avons opte pour une solution mixte.
Notre interface de catalogage en EAD interagit bien avec la base de
donnees en XQuery et DML (le XQuery Update de Microsoft ). Par contre,
l'interface de recherche et de consultation s'appuie sur un traitement
different : le fichier EAD est eclate dans la base en blocs XML , qui
correspondent aux unites d'information minimales que le client Web aura
a manipuler en AJAX .
Nous n'aurions pas pu obtenir ce que nous voulions avec une base de
donnees relationnelle, car l' XML de l' EAD est complexe, variable et
contient du contenu mixte. Inversement, un SGBD purement XML comme
eXist n'aurait pas suffi non plus a effectuer tous les traitements
exiges, du moins pas aujourd'hui.
vdV : Les resultats ont-ils ete conformes a vos attentes?
YN : Oui. Les performances sont tres satisfaisantes. La navigation dans
l'arbre XML est souple, et ce dans les deux interfaces. Par ailleurs,
l'architecture generale de Calames est extensible, ce qui nous
permettra d'aller plus loin. Calames est tout jeune.
vdV : Quels enseignements avez-vous pu en tirer?
YN : La solution " XML a tous les etages" n'est pas forcement la bonne.
Quand les performances ou d'autres considerations l'exigeaient, nous
avons utilise d'autres solutions, comme le relationnel pour la
recherche ou le JSON pour stocker certaines informations cote client.
Pourtant, pouvoir gerer de l'' XML / EAD du debut jusqu'a la fin, du
producteur jusqu'au consommateur, de l'editeur XML jusqu'au navigateur
en passant par la base, est interessant.
vdV : D'une maniere generale, vos attentes initiales par rapport aux
technologies XML se sont-elles realisees? Comment qualifieriez-vous
l'importance de XML dans votre organisation?
YN : XML est le vecteur par lequel peuvent converger les differentes
applications et les differents metiers de l'abes. En tant que
technologie Web mature, elle est incontournable pour nos
informaticiens. En tant qu'outil de structuration et de manipulation
des donnees a la fois lisible et proche du contenu meme de
l'information, XML peut etre une seconde langue pour certains
bibliothecaires, notamment ceux qui ont pris l'habitude de travailler
en MARC .
vdV : Comment qualifieriez-vous son niveau de « penetration » dans
votre organisation?
YN : Tous les informaticiens de l' ABES connaissent XML et pret de la
moitie l'utilisent regulierement, plus ou moins intensivement. Mais, il
ne fait aucun doute que cette generalisation d' XML va se poursuivre, a
mesure que nos applications evolueront, convergeront et s'ouvriront
encore plus vers le Web d'aujourd'hui. Mais cela est vrai aussi des
bibliothecaires.
vdV : Trouvez-vous l'information dont vous avez besoin sur XML ? Ou la
trouvez-vous?
YN : Sur le Web (forums, FAQ) et dans les manuels (chez O'Reilly , Wrox
).
vdV : Les technologies XML posent-elles des problemes de formation?
Lesquels?
YN : Au-dela de l'autoformation, qui compte beaucoup, nous avons su
faire appel aux bons formateurs ;-)
Par contre, des que les besoins deviennent plus pointus, il est parfois
difficile de se perfectionner pour connaitre les bonnes pratiques,
trouver les raccourcis, ne pas essuyer les platres .
vdV : Allez-vous demarrer de nouveaux projets avec des technologies XML
? Lesquels?
YN : Nous allons surtout nous concentrer sur nos applications
actuelles, pour les rendre plus standard, plus conformes a l'esprit du
Web d'aujourd'hui, plus coherentes entre elles. XML sera un outil
precieux pour cet effort.
Par exemple, nous avons recours a des webservices pour faire dialoguer
nos applications et nous utilisons Schematron pour effectuer du
controle qualite sur nos donnees.
vdV : Quelles sont vos principales attentes par rapport a XML ?
YN : Pour nous, les enjeux cruciaux tournent autour des performances (
XSLT , XQuery ) et de la recherche Full Text d' XQuery .
Parallelement se pose la question de la creation de donnees en XML .
Pour Calames , nos collegues des bibliotheques ont fait le choix d'un
veritable editeur XML , qui ne dissimule pas la structure XML . Pour
d'autres projets, XForms nous semble tres seduisant, mais quid des
"documents" XML ? Les formulaires ne peuvent traiter le contenu mixte.
Si la solution "editeur XML " est viable pour le catalogage dans
Calames , ce n'est pas le cas pour produire de la documentation en
Docbook , par exemple. Pour que Docbook se generalise a l' ABES (il est
deja utilise), nous avons besoin de solutions d'edition efficaces. Open
Office est decevant sur ce point.
vdV : Envisagez-vous de remplacer XML par une autre technologie?
YN : A l' ABES , notre metier, ce sont les metadonnees. RDF et les
autres technologies du web semantique apparaissent naturellement comme
l'etape suivante. Mais ces technologies ne remplacent pas les
technologies XML puisque XML est une des syntaxes de RDF .
vdV : Quel role voyez-vous pour XML dans 10 ans?
YN : Je botte en touche. Mais il est tentant d'imaginer la banalisation
d' XML . Neanmoins, si XML etait menace par d'autres technologies, il
me paraitrait essentiel de conserver l'esprit des compromis qu' XML a
su trouver : un format pour les donnees et les documents, un cadre
liberal qui permet a chacun de creer son propre format tout en incitant
a reutiliser les formats XML des autres (schemas, espaces de noms),
enfin une famille d'outils a la disposition des informaticiens mais
comprehensible par les experts metiers.
Voir aussi :
- Dix annees de XML chez Adobe France [1]
- Dix annees de XML a l'INSEE [2]
- Dix annees de XML [3]
Copyright 2008, Eric van der Vlist .
---------------------------------------------------------
References:
[1] http://xmlfr.org/actualites/decid/080326-0001
[2] http://xmlfr.org/actualites/decid/080210-0002
[3] http://xmlfr.org/actualites/decid/080210-0001
---------------------------------------------------------
Mail genere par FormatedTextOutputHandler pour XT
(http://4xt.org/downloads/examples/outputhandlers/formatedtext/).
--
Devenez redacteur <XML>fr et contribuez au developpement
du xml francophone (http://xmlfr.org/infos/redacteurs) !
Liste de diffusion "xml-decid@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet lie a XML.
Pour resilier votre abonnement, envoyez un message contenant la
commande "unsubscribe" a xml-decid-request@xmlfr.org
(mailto:xml-decid-request@xmlfr.org?Subject=unsubscribe)
Received on Mon Mar 31 09:22:41 2008