> J'ai pas galéré avec les encodage en PHP et en XSLT.
> Ma solution a été de travailer en ISO-8859 de bout en bout
Voila des années que je travaille tout Unicode.
C'est de loin la solution royale.
Mais c'est vrai que Java est Unicode, ce qui simplifie le developpement.
Quand je travaillais en C++, c'était beaucoup plus compliqué.
Je travaille avec des textes, français, allemend, polonais, russes, chinois, japonais, greques, etc.
Je n'ai rencontré aucun soucis depuis que l'on impose que tout soit Unicode.
J'ai aussi pris l'habitude de ne pas spécifier l'encodage des fichiers pour les parseur XML car il le font beaucoup mieux que moi étant donné qu'ils détectent automatiquement l'encodage.
Cela permet de supporter des input qui sont "mal encodé", par exemple en ISO Latin 1.
Dés l'instant ou ils rentrent dans la "machinerie" ils deviennent Unicode et tout le monde est content :)
> et j' ai trouver une "bonne" fonction de transcodage UT8-ISO.
Tu dois avoir de sacrées restrictions sur tes contenus.
Comment fais-tu pour un texte en chinois.
Cordialement,
--------------------------------------------------------------------
Erik Mazoyer, Chef de projet
HyperOffice
6, rue Jacques Daguerre - 92565 Rueil-Malmaison Cedex
Tél. 01 41 96 96 76
Fax 01 41 96 96 77
Mél erik.mazoyer@hyperoffice.fr
Nouveau cycle de séminaires "les mardis d'HyperOffice" Inscriptions et renseignements : http://www.hyperoffice.fr/formation/catalogue/index.asp
-----Message d'origine-----
De : Marc Abiven (datz) [mailto:datz@free.fr]
Envoyé : mardi 10 janvier 2006 17:32
À : xml-tech@xmlfr.org
Objet : [xml-tech] Re: RE : Re: RE : j'y perd mon latin iso-8859-1
J'ai pas galéré avec les encodage en PHP et en XSLT.
Ma solution a été de travailer en ISO-8859 de bout en bout
et j' ai trouver une "bonne" fonction de transcodage UT8-ISO.
----- Original Message -----
From: "François Jannin" <issar@free.fr>
To: <xml-tech@xmlfr.org>
Sent: Tuesday, January 10, 2006 4:15 PM
Subject: [xml-tech] Re: RE : Re: RE : j'y perd mon latin iso-8859-1
> Erik Mazoyer wrote:
>
>>>Ce n'est pas forcément vrai, personnellement j'utilise Encode
>>>(http://search.cpan.org/~dankogai/Encode-2.12/Encode.pm).
>>>
>>>
>>
>>Quand je disait "facilement", je voulais dire normatif ou presque (par
>>exemple la reconnaissance par les premiers caractères n'est pas
>>"normative" mais se trouve décrite dans la norme "xml 1.0" et la norme
>>"xml 1.1").
>>
>>En java (je prêche pour ma paroisse) il est "simple" de poser un
>>filtre
>>sur un Writer pour encoder "automatiquement" les entités.
>>
>>
> Je travaille en Java, ça tombe bien. Peux-tu donner un exemple ou un
> lien sur ces filtres de Writer ? J'ai l'impression que je me suis
> compliquée la vie avec l'URLEncoder/Decoder pour rien.
>
> Pour résumer ma problèmatique sous forme de rébus :
>
> 1/ Mon premier est un serveur WEBDAV stockant des métadonnées en utf-8
> 2/ Mon deuxième est une appli java d'indexation qui récupère les
> données de mon premier en utf-8 et les indexe en iso-8859-1 (avec
> URLDecoder.decode(la chaine du serveur webdav, "utf8") : à ce moment
> précis je pensais tenir de l'iso-8859-1 (charset du système) 3/ Mon
> troisième est une appli front-end cocoon/java qui récupère du xml
> iso-8859-1 de mon premier(resultat d'une recherche) et doit l'afficher
> en html utf-8 à travers une transfo XSLT + sérialisation HTML utf8. 3/
> Et mon tout donne un casse-tête chinois ressemblant à un générateur
> d'improbabilités :)
>
> Malgré moult tests j'obtiens soit des caractères bizarres par-ci ou
> des multi-byte error par-là. Par exemple, j'envoie une requête avec
> accents latin-1(eh oui ! du français !) url-encodée en utf-8 et
> impossible de l'utliser pour la recherche, même aprés avoir essayé
> toutes combinaisons d'encodage/décodage avec URLDecoder/Encoder.
>
> Merci mille fois de votre aide.
> Cordialement,
> François.
>
>
> --
> Devenez redacteur <XML>fr et contribuez au developpement du xml
> francophone (http://xmlfr.org/infos/redacteurs/) !
>
> Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
>
> Cette liste est a votre disposition pour discuter en francais de tout
> sujet technique lie a XML.
>
> Pour resilier votre abonnement, envoyez un message contenant la
> commande "unsubscribe" a xml-tech-request@xmlfr.org
> (mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
>
>
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Tue Jan 10 17:46:06 2006