> Je comprends mieux, mais je ne pense pas que ce soit la
> bonne façon de le spécifier.
> Abstraitement, quand les caractères sont extraits
> d'un document XML ils n'ont pas d'encodage,
> ce sont juste de caractères.
Tout à fait d'accord.
> Il est possible que l'implémentation les représente en
> mémoire en UTF-8 (ou plus rarement en UTF-16) mais c'est
> un détail d'implémentation.
Absolument.
> Ce qui compte c'est l'encodage dans lequel ils vont
> sortir. Ce que tu précise ci-dessus se limite donc à:
>
> <xsl:output encoding="ISO-8859-1"/>
Non, car si j'ai un caratère chinois, j'aimerais qu'il soit écrit. Si je précise que mon encoding est en ISO Latin 1, j'ai un écchec à l'écriture.
Pourtant, il est possible d'écrire un fichier ISO Latin 1 contenant de l'Unicode
<?xml version="1.0"><root>你好</root>
Cette chaine de caractère peut même être transmise par n'importe quelle messagerie (car ascii pur) et pourtant elle contient deux caractères chinois.
C'est juste un problème d'écriture.
En utilisant Java, je sais facilement l'écrire, (voir la discussion avec François Jannin) mais je reste lié à mon environnement de production.
Cordialement,
--------------------------------------------------------------------
Erik Mazoyer, Chef de projet
HyperOffice
6, rue Jacques Daguerre - 92565 Rueil-Malmaison Cedex
Tél. 01 41 96 96 76
Fax 01 41 96 96 77
Mél erik.mazoyer@hyperoffice.fr
Nouveau cycle de séminaires "les mardis d'HyperOffice" Inscriptions et renseignements : http://www.hyperoffice.fr/formation/catalogue/index.asp
-----Message d'origine-----
De : Robin Berjon [mailto:robin.berjon@expway.fr]
Envoyé : mardi 10 janvier 2006 17:09
À : xml-tech@xmlfr.org
Objet : [xml-tech] Re: RE : Re: RE : Re: RE : j'y perd mon latin iso-8859-1
On Jan 10, 2006, at 16:56, Erik Mazoyer wrote:
>> Je ne suis pas sûr de saisir exactement ce que voudrais avoir au
>> niveau normatif,...
>
> Du style :
> <xsl:output encoding="UTF-8" byteEncoding="ISO-8859-1">
>
> Et automatiquement il comprend :
> "Tous les caractères au-delà de 255 doivent être encodés sous forme
> d'entités".
Je comprends mieux, mais je ne pense pas que ce soit la bonne façon
de le spécifier. Abstraitement, quand les caractères sont extraits
d'un document XML ils n'ont pas d'encodage, ce sont juste de
caractères. Il est possible que l'implémentation les représente en
mémoire en UTF-8 (ou plus rarement en UTF-16) mais c'est un détail
d'implémentation. Ce qui compte c'est l'encodage dans lequel ils vont
sortir. Ce que tu précise ci-dessus se limite donc à:
<xsl:output encoding="ISO-8859-1"/>
Ceci est sous-spécifié dans XSLT 1.0 (où de toute façon tout
xsl:output n'est que consultatif) mais est clairement exprimé dans
XSLT 2.0 & XQuery Serialization.
--
Robin Berjon
Senior Research Scientist
Expway, http://expway.com/
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Tue Jan 10 17:26:46 2006