Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Commentaires et questions non techniques.Commentaires et questions techniques.

 
Cliquez ici.

From: Eric van der Vlist (vdv@dyomedea.com)
Date: 15/07/2004 - 09:11


On Thu, 2004-07-15 at 10:54, Estéban GWINNER wrote:

> Ok, je vois. Voici un peu plus d'explications...
> Je suis entrain de developper une application dont la premiere etape est de
> transformer un fichier de format MARC21 en un fichier XML. Une des
> conditions de cette application est le support d'unicode. Pour faire la
> transformation MARC21 to XML, j'utilise "marcxml", une api java (disponible
> ici : http://marc4j.tigris.org)
> Le fichier MARC21 peut contenir divers caracteres (latin, tcheque,
> cyrilique, ...)
> Je pensais qu'UTF-8 prenait en charge tous ces types de caracteres...

Oui, c'est le cas.

> par quel moyen puis-je réaliser cette condition ?

Le problème que vous avez ici est que l'entête n'est pas conforme au
contenu du document.

Lorsque marxml sauvegarde le document XML résultant de la
transformation, il faut utiliser une API qui écrive un flux de
caractères au format indiqué dans l'entête XML (utf-8 en l'occurrence).

> Quel jeu de caracteres dois-je utiliser.

N'importe lequel pourvu qu'il gère les caractères que vous utilisez
(utf-8 étant quasiment universel évite de se poser cette question) et
que les caractères soient effectivement écrits dans l'encodage spécifié
dans l'entête.

> Je suis un peu perdu avec tout ca...

On superpose deux couches : la couche XML qui est une couche abstraite
et la couche fichier physique. Les problèmes de ce type arrivent lorsque
l'on crée une incohérente entre le niveau XML qui spécifie un encodage
et le niveau physique qui ne respecte pas ces encodage.

La situation est encore pire lorsque l'on envoie ce document sur HTTP
puisque HTTP spécifie également l'encodage dans ses headers (d'où un
nouveau risque d'incohérence) et/ou lorsque ce document XML est un
document XHTML puisque XHTML spécifie également l'encodage dans un
élément <meta/> (quatrième source d'incohérence).

Cordialement,

Eric van der Vlist

-- 
See you in Portland.
                               http://conferences.oreillynet.com/os2004/
Upcoming XML schema languages tutorial:
 - Portland   -half day-   (27/07/2004)        http://masl.to/?E6ED13728
------------------------------------------------------------------------
Eric van der Vlist       http://xmlfr.org            http://dyomedea.com
(ISO) RELAX NG   ISBN:0-596-00421-4 http://oreilly.com/catalog/relax
(W3C) XML Schema ISBN:0-596-00252-1 http://oreilly.com/catalog/xmlschema
------------------------------------------------------------------------

-- Devenez redacteur <XML>fr et contribuez au developpement du xml francophone (http://xmlfr.org/infos/redacteurs/) !

Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).

Cette liste est a votre disposition pour discuter en francais de tout sujet technique lie a XML.

Pour resilier votre abonnement, envoyez un message contenant la commande "unsubscribe" a xml-tech-request@xmlfr.org (mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)



Archive générée par hypermail 2.1.3 le 30/07/2004 - 13:32 UTC

webmaster@xmlfr.org

 

xml tech

Discussions techniques au sujet de XML.

Cette liste est à votre disposition pour discuter en français de tout sujet technique lié à XML.



Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot@online.fr  

Conception, réalisation et hébergement