Le W3C a
publié une note, "The [NEL] Newline
Character", se penchant sur un caractère blanc Unicode 3.0
non géré par XML
1.0.
Par Simon St.Laurent,
xmlhack - traduit par Eric van der Vlist,
Dyomedea (vdv@dyomedea.com).
vendredi 16 mars 2001
Les problèmes se manifestent sur les systèmes OS/390 ou sur les systèmes interagissant avec ces
mainframes:
"L'omission de [NEL], le caractère newline défini
par Unicode 3.0, dans la section "gestion
des fins de lignes" de la spécification XML
1.0 crée de sérieuses difficultés lorsque l'on traite des documents XML et des DTDs sur les
systèmes mainframes IBM… Les documents XML qui contiennent des caractères [NEL] sont déclarés
invalides ou mal formés par les parseurs conformes à XML
1.0."
Dans la version 2.0 d' Unicode,
sur laquelle XML a été bâtie, les caractères
entre x0080 et x009F étaient indéfinis (bien que marqué "CTRL" dans
les tables). Le caractère [NEL] en x0085 est apparu pour la première fois dans
un rapport technique Unicode en 1999 et ensuite
dans Unicode 3.0.
La note fournit le texte d'une mise à jour pour XML 1.0 deuxième édition. Il reconnaît également le
besoin de travaux complémentaires pour que
"le Consortium Unicode
et le groupe de travail Internationalisation du W3C recommandent l'addition des
caractères séparateur de lignes (#x2028) et de paragraphes (#x2029) au même
titre que [NEL]"
.
Autres articles:
Copyright 2001,
Simon St.Laurent (auteur) et Eric van der Vlist (traducteur).
|