From: Robin Berjon (robin.berjon@expway.fr)
Date: 19/12/2003 - 17:44
scharloi wrote:
> Le problème est le suivant : le caractère 0x216 est reconnu par le parseur comme etant "ø" = code 0xC3 (Atilde) suivi de 0x44 (virgule) .
> L'encodage ISO-8859-1 est pourtant géré dans expat du moins c'est ce que dit la specification.
> Quelqu'un a t'il déjà eu un problème similaire ?
Expat lit ton document en Latin-1 mais t'en fourni le contenu en UTF-8.
C'est une fort bonne idée puisque ça te permet de traiter divers
documents de la même façon quel que soit leur encodage d'origine. Je
pense qu'il existe un flag de Expat te permettant de récupérer tes
chaînes dans l'encodage d'origine mais ça voudra dire que tu ne pourra
traiter du XML correctement que dans cet encodage, ce qui est
inutilement contraignant.
Si tu as vraiment besoin d'utiliser de vieux encodages legacy, tu peux
convertir de l'UTF-8 en 8859-1 avec une librarie comme iconv.
--
Robin Berjon
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Archive générée par hypermail 2.1.3 le 28/06/2004 - 11:06 UTC
webmaster@xmlfr.org
|