Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Si vous vous posez une question, vous n'êtes peut-être pas le premier...Les traductions en français des bibles XML.Ces articles sont des références dans leur domaine.Tout ce qu'il faut savoir pour démarrer sur un sujet XML...


XML expliqué à mon directeur général

1ère partie : XML comme fondation - principe et utilité

Michel Duperrier, fondateur de l'initiative sparklingPoint (http://sparklingpoint.com).
vendredi 21 février 2003

Jour après jour, XML prend une place une place significative au coeur des architectures des systèmes d'information. Élargissant sa traditionnelle filiation aux systèmes de publication, XML s'impose aujourd'hui comme le format pivot des processus d'intégration, d'ouverture et d'échanges des systèmes d'information. Cet article propose une première approche sur le principe et l'utilité de XML comme fondation de ces nouvelles technologies.

XML : un métalangage, un espéranto, un format pivot ?

En partant simplement de sa définition, XML est un langage extensible (eXtensible) utilisant des balises (Markup Language). Chaque donnée est identifiée par une balise : "<titreArticle>XML expliqué à mon directeur général</titreArticle>" . Ainsi, un individu ou un programme peuvent identifier une donnée plus facilement et plus précisément. Ce langage est extensible car il permet de créer un vocabulaire permettant de décrire une structure de données particulière ou propre à un métier.

Exemple :

<chanson>
  <titre>The fool on the hill</titre>
  <interprete>The Beatles</interprete>
  <auteur>John Lennon</auteur>
  <auteur>Paul McCartney</auteur>
</chanson>

XML est un métalangage en ce sens qu'il permet de créer d'autres langages, plutôt appelés des vocabulaires. Deux partenaires d'affaires peuvent ainsi s'entendre pour échanger des données dans un format commun. Il leur suffit de définir une structure et de s'entendre précisément sur le sens, la "sémantique" des données ainsi échangées.

XML est un langage simple, hiérarchique, utilisant du texte et s'appuyant sur le format Unicode qui permet la représentation des caractères de tous les pays du globe. Il est indépendant des plates-formes matérielles, des systèmes d'exploitation, des langages qui l'utilisent, des protocoles qui le transportent. Cette "portabilité" universelle est une des principales raisons pour lesquelles XML s'est imposé comme socle de la structure des données notamment pour les services Web qui permettent une interopérabilité entre des systèmes par nature incompatibles et dont il sera question plus loin et le Web sémantique.

XML est un langage qui sépare le contenu de la présentation

L'exemple ci-dessus pourrait être présenté de la façon suivante :

Bonjour,
La référence du titre diffusé sur XMLfm est :
The fool on the hill (John Lennon Paul McCartney) interprété par The Beatles.

Cordialement,

XMLfm

Ou encore :

Titre du morceau demandé : The fool on the hill

Par : The Beatles

Ainsi, une source de données unique permet une variété de présentations à partir d'un même contenu grâce à la technologie de transformation associée à des feuilles de style (XSLT pour eXtensible Stylesheet Language Transformation). À partir d'un document XML, il est possible de produire un autre document dans un langage utilisant des balises (XML, XHTML, HTML, WML) ou dans un format à vocation de publication (Word, PDF texte)

En reprenant ces premiers éléments, nous constatons que XML est un langage qui permet de forger simplement des vocabulaires adaptés à la nature des données à structurer. Ces vocabulaires définissent des documents portables et indépendants des systèmes sur lesquels ils sont exploités. Ces documents peuvent être utilisés à des fins de traitement, de publication, d'archivage ou d'échange. Pour les échanges, qu'ils soient internes (entre applications du même système d'information) ou externes (avec des systèmes d'information de partenaires d'affaires), on mesure l'importance capitale de la correspondance des formats et de la définition de la sémantique des données échangées. Afin de permettre l'ajustement entre ce format d'échange et les formats internes propres aux systèmes d'information des partenaires, l'intérêt des technologies de transformation XSLT est évident. Enfin, pour la publication, l'apport de XSLT est double en permettant, d'une part, des mises en forme multiples adaptées au destinataire et, d'autre part, de diffuser la même source d'information selon des canaux différents (Web, PDF, WAP, e-mail, CD-ROM) sans duplication d'information. XML est donc bien un métalangage dont l'universalité en fait de facto un espéranto et a vocation d'être un format pivot tant dans les échanges que dans la publication multi-canal.

Ce qui précède XML : SGML, HTML, HTTP, IP, Unicode, l'EDI conventionnel

XML est présent aujourd'hui principalement au coeur des architectures de trois grands domaines que sont la gestion documentaire, la publication sur Internet (portails) et les échanges d'information (EAI, EDI, services Web). Afin de mesurer l'apport de XML et sa popularité croissante dans ces trois domaines, il est intéressant de rappeler brièvement leur origine, leur portée et leurs limitations.

GML fut créé par trois ingénieurs d'IBM dont il porte les trois initiales : Charles Goldfarb, Edward Mosher, et Raymond Lorie. C'est un métalangage très riche utilisant des balises et réputé complexe. Il a été conçu dans les années 70 pour gérer l'importante documentation informatique produite par le constructeur puis est devenu dans le milieu des années 80 un standard ISO (International Organization for Standardization) où il prit son 'S' initial pour finalement s'appeler SGML : Standard Generalized Markup Language. Il est très utilisé en particulier dans les secteurs produisant d'importantes documentations structurées et complexes comme les industries aéronautique, électronique, militaire Son exploitation exige un environnement approprié et le contenu n'est pas directement publiable sur Internet.

HTML (HyperText Markup Language) fut créé par Tim Berners-Lee en 1990 alors qu'il travaillait comme chercheur au CERN à Genève et souhaitait publier des documents sur ce qui allait devenir le Web dont il est l'inventeur. Pour pouvoir établir des liens entre les documents, Tim Berners-Lee adapta la notion de lien hypertexte donnant naissance au langage HTML supporté par le protocole HTTP (HyperText Transfer Protocol), et créa la notion d'URL (Uniform Resource Locator). Il construisit HTTP sur IP (Internet Protocol) et choisit de créer HTML comme une application de SGML. Celle-ci se limite à un balisage de présentation (fontes, graissage, couleur) mais ne prend pas en compte les données autrement que comme de simples chaînes de caractères. Ceci explique les difficultés qu'ont les moteurs de recherche à faire la différence entre le constructeur informatique "Sun" Microsystems, le détergeant "Sun", le "sun" des pages météo de la BBC, le journal tabloïd anglais The "Sun", le stratège chinois "Sun" Tzu faute de balises adaptées pour interpréter le contenu. En revanche, le fait que HTTP soit construit sur IP permet une diffusion directe du contenu des documents en HTML sur Internet et constitue l'origine du World Wide Web que nous connaissons. Enfin, le besoin de compatibilité universelle des formats de représentation de caractères s'est trouvé depuis résolu par le standard Unicode.

Le monde de l'EDI (Electronic Data Interchange - Échanges de Données Informatisés*) [* : "informatisés" car ce sont bien les échanges qui sont informatisés] s'est initialement construit à partir d'une initiative de General Motors qui a cherché un moyen efficace, fiable et sécurisé de rationaliser ses échanges avec la galaxie de ses fournisseurs, puis s'est élargi progressivement à d'autres secteurs économiques comme la distribution, le transport, la finance. Le monde de l'EDI conventionnel est structuré autour de deux standards principaux ANSI/X12 pour les États-Unis et EDIFACT pour le reste du monde dont la standardisation est établie au sein du centre CEFACT de l'ONU. Ces deux standards EDIFACT et X12 s'appuient sur des réseaux à valeur ajoutée (VAN) pour les échanges et nécessitent la mise en oeuvre d'infrastructures et d'adaptations du système d'information qui sont souvent hors de portée des PME ou suffisamment dissuasives pour en retarder l'adoption. Dans cette optique, l'émergence de XML dans le monde des échanges permet à la communauté EDI d'envisager d'élargir plus rapidement le nombre des acteurs aux PME et d'utiliser le potentiel de la souplesse de XML pour enrichir les applications EDI actuelles.

Dans ces trois domaines XML apporte une valeur ajoutée. Tout d'abord, XML est né dans le monde SGML. Jon Bosak de Sun Microsystems composa en 1996 un groupe de travail de spécialistes afin de proposer une version plus "light" de SGML qu'ils baptisèrent XML et qui fut adoptée comme recommandation par le W3C (World Wide Web Consortium) en février 1998. XML est souvent présenté comme représentant 20 % de la complexité de SGML pour lui conserver 80 % de son potentiel. Ensuite, très naturellement, XML s'est imposé comme "la mère" du langage HTML et, de façon générale, comme "la mère" de tous les langages qui ont plus une vocation de publication, XML se concentrant exclusivement sur la structure et le contenu. Afin de rendre HTML compatible avec la structure plus rigoureuse de XML, HTML va dans le sens de cette évolution et le successeur de HTML version 4 porte désormais le nom de XHTML version 1. Enfin, on ne compte plus les initiatives du monde de l'EDI qui ont placé XML au coeur de leur architecture. Citons, par exemple, RosettaNet (industries électroniques et informatiques), CGIP (Global Commerce Internet Protocol) et surtout, ebXML, qui est une initiative commune au CEFACT de l'ONU et au consortium OASIS (Organization for the Advancement of Structured Information Standards).

XML au carrefour de la publication, de l'intégration et des échanges

XML s'est aujourd'hui imposé comme langage pivot de la publication, de l'intégration et des échanges. L'ensemble des acteurs s'est aujourd'hui rallié à ce standard et on notera que même les systèmes les plus fermés proposent désormais une ouverture fondée sur XML. Les récentes adoptions du format XML dans les logiciels bureautiques (OpenOffice, Microsoft Office 11) vont contribuer à accélérer le mouvement de fond de sa généralisation et de sa banalisation.

XML rend l'information facilement réutilisable. Il simplifie la gestion documentaire et ouvre son potentiel de diffusion sur Internet. Il permet aux portails d'entreprise de fédérer une information dans un format flexible et adapté à la publication multi-canal sur Internet. Il facilite l'interopérabilité et les échanges entre des systèmes d'information hétérogènes. Enfin, contrairement à certaines idées reçues, XML n'a pas vocation à remplacer ni HTML ni l'EDI conventionnel mais il contribue à enrichir fortement leur potentiel. De la même façon, il y a peu de chances de voir XML devenir le format universel de représentation des données des applications de back office. En revanche, il contribuera fortement, comme support d'interopérabilité, à leur ouverture et à leur intégration avec les autres applications de l'entreprise et de ses partenaires.

Autres articles:

Copyright 2003, Michel Duperrier.


 

Mots clés.



L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.


Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot  

Conception, réalisation et hébergement
Questions ou commentaires
  redacteurs@xmlfr.org