On Tue, Jan 10, 2006 at 03:20:55PM +0100,
Erik Mazoyer <Erik.Mazoyer@hyperoffice.fr> wrote
a message of 92 lines which said:
> Juste histoire d'embrouiller un peu plus, il est possible d'écrire
> un fichier ascii contenant de l'Unicode. Par exemple,
> 你好
Ce n'est pas embrouillé, c'est la différence entre la couche basse
"Forme codée en mémoire" ('Character Encoding Form') et la couche
haute "Jeu de caractères codés" ('Coded Character Set'). Le caractère
Unicode U+4F60 peut s'écrire 你 comme il peut s'écrire de
manière très différente en UTF-8, UTF-16 ou UTF-32.
La référence à ce sujet est l'UTR 17,
http://www.unicode.org/reports/tr17/. Mais je trouve que c'est mieux
expliqué dans http://www.w3.org/TR/charmod/.
> De même il est possible d'écrire de l'ascii dans un fichier Unicode.
Oui, c'est plus facile, US-ASCII est un sous-ensemble d'Unicode. Et
US-ASCII est un sous-ensemble d'UTF-8.
> Par contre pour l'écriture c'est plus complexe, je ne connais pas de
> solution pour générer facilement un fichier ascii contant de
> l'Unicode. En effet, les "serialiseurs" écrivent toujours les
> caractères dans leur représentation au sein du codage et jamais sous
> forme entités (你 par exemple), à part les entités XML.
C'est inexact. xsltproc (de la libxml2) produit des entités par
défaut, si on ne lui colle pas un <xsl:output>.
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Tue Jan 10 22:35:18 2006