Ce nouveau standard marque la convergence des formats HTML et XML.
Par Eric van der Vlist, Dyomedea
Paris, France,
vendredi 28 janvier 2000
XHTML marque la convergence de XML et HTML, deux "dialectes" de SGML qui avaient
malencontreusement dérivé et étaient devenus incompatibles...
Au départ, il y eu GML inventé en 1969 par Charles Goldfarb (IBM), Edward Mosher et Raymond Lorie et
rapidement adopté par le monde de l'édition.
Ce sigle qui est composé des initiales des trois inventeurs signifie également "Generic Markup Language").
Sous l'impulsion de l'ANSI, le GML donna naissance au SGML (le S de SGML signifiant "Simple")
en 1980 et SGML s'imposa rapidement comme la référence en matière de description et d'échange de documents.
En 1990, Tim Berners-Lee qui travaillait alors au CERN, invente HTTP (Hyper Text Transfer Protocol)
et HTML (Hyper Text Marku Language), un dialecte de SGML adapté à une utilisation client/serveur. Le
web était né !
En 1994, Tim Berners-Lee créa le W3C (World Wide Web Consortium) qui devint le garant de HTML qui
est le standard utilisé par les milliards de pages qui composent aujourd'hui le web.
HTML est hélas très marqué par sa vocation initiale "Hyper Text" et s'il permet de décrire comment
visualiser et présenter un document, il ne permet pas d'analyser le contenu d'une page. De plus,
HTML est un langage "fermé" et non "extensible" restreint à sa propre sémantique et qui ne permet
pas de définir de nouveaux types de documents.
Tant qu'il ne s'agit que de présenter des documents dans des navigateurs relativement standard,
cela ne pose pas de problèmes majeurs, par contre, cela devient une limitation bloquante si l'on
veut faire une exploitation plus automatique des informations présentes sur Internet, que l'on
développe des applications de transferts de données ou que l'on cherche à présenter les informations
sur des types de terminaux ayant des contraintes techniques très différentes (terminaux
mobiles par exemple).
Pour compenser ces défauts, le W3C publia, en 1998, la première version de ses recommandations
XLM. XML est un dialecte simplifié de SGML permettant une plus grande souplesse d'utilisation.
Contrairement à HTML enfermé dans son rôle de langage de présentation d'information, XML permet
de décrire tout et n'importe quoi. L'utilisation de XML permet donc de dissocier complètement les
informations de leur présentation.
Pour donner naissance à XML, on a imposé une cure d'amaigrissement à SGML et donc ajouté de
nouvelles règles syntaxiques... que HTML, créé 8 ans avant XML ne respecte pas !
En 1998, Internet s'est donc trouvé riche de deux standards voisins et incompatibles, ce qui
ne va pas sans poser quelques problèmes !
La solution à ces problèmes devrait s'appeler XHTML. Tout en restant très voisin de HTML,
XHTML respecte les règles XML. Il peut donc être utilisé par les outils XML et reste visualisable
par les versions récentes des navigateurs. Il est également plus extensible que HTML et permet
de définir la structure et le contenu des documents.
Pour en savoir plus :
Recommandation W3C XHTML: v.o., v.f..
Recommandation W3C XML: v.o., v.f..
Yahoo! actualités : XHTML 1.0 marie la chèvre et le chou.
Yahoo! actualités : Le Web du futur s'écrit en XHTML.
Copyright 2000,
Eric van der Vlist.
|