Tim Bray et John Cowan ont publié un Draft Internet IETF proposant de définir un nouvel encodage XML réalisant l'expansion des entités HTML et MathML.
Eric van der Vlist, Dyomedea (vdv@dyomedea.com).
lundi 20 octobre 2003
Annoncé sur XML-DEV, ce Draft Internet propose de définir un nouvel encodage XML appelé « UTF-8+names » qui réaliserait le remplacement des entités HTML et MathML.
Bien que ce ne soit pas énoncé très clairement, la motivation semble être de répondre à tout ceux qui souhaiterait pouvoir utiliser en XML, comme c'est le cas en HTML, des entités telles que « é » ou « » sans avoir besoin de les déclarer au préalable dans une DTD.
Le principe en est simple : lorsque cet encodage serait utilisé, les références à des entités HTML et MathML seraient remplacées par leur valeur avant d'atteindre les parseurs XML. Les références à des entités ne figurant pas dans la liste des entités HTML et MathML seraient quant à elles gérées par les parseurs comme elles le sont actuellement.
Comme toute tentative de modification des mécanismes de base de XML, cette proposition a suscité une vive polémique et quelques quatre-vingt messages ont été été échangé à ce sujet ce week-end sur XML-DEV.
Si certains, tels Mike Championqualifient la proposition de
"grande idée"
, d'autres tels Simon St.Laurent sont violemment contre, y voyant une proposition
"intrinsèquement perverse qui triche avec la séparation entre les encodages des caractères et la représentation de ces caractères dans ces encodages"
.
De fait, UTF-8+names introduit un niveau de traitement supplémentaire entre la couche « décodage de caractères » et le parseur XML, niveau que Bill de hÓraassimile à un langage de macro. Plusieurs intervenants plaident pour l'utilisation d'une autre syntaxe que celle des références à entités de manière à marquer visuellement la différence de traitement entre cette nouvelle fonction et les entités XML gérées par les parseurs.
Enfin, pour James Clark c'est une solution - qui d'ailleurs serait
"extrêmement déroutante pour les utilisateurs"
- à un faux problème : les utilisateurs XHTML pourraient utiliser des outils gérant correctement les encodages existants et les symboles MathML seraient mieux représentés par des éléments que par des entités.
Autres articles :
Copyright 2003, Eric van der Vlist.
|