Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Commentaires et questions non techniques.Commentaires et questions techniques.

 
Cliquez ici.

From: Laurent CAPRANI (caprani@multimania.com)
Date: 21/09/2001 - 16:21


> -----Original Message-----
> From: xml-tech-bounce@xmlfr.org [mailto:xml-tech-bounce@xmlfr.org]On
> Behalf Of Aguero, Dimitri
> Sent: Friday, September 21, 2001 4:10 AM
> To: 'xml-tech@xmlfr.org'
> Subject: [xml-tech] RE: [xml-tech] Re: Comment XML gère les caractères
> multibyte ?
>
>
> Merci de votre réponse.
>
> Un seul commentaire sur Unicode que j'aimerais partager: D'après
> ce que j'ai
> compris (je peux me tromper), Unicode fait un encodage sur deux octets, ce
> qui est suffisant pour presque tous les alphabets sauf certains alphabets
> chinois.

Unicode est un jeu de caractères, c'est à dire une simple liste de
caractères avec un numéro chacun.
Il y a aujourd'hui plus de 40.000 caractères numérotés, on s'attend à ce
qu'il y en ait bientôt 100.000. Ils couvrent la plupart des écritures et
symboles du monde et l'ambition est de les couvrir toutes.
Exemples: A [A majuscule] -> 65, ç [c cédille minuscule] -> 231, :-)
[binette rigolote] -> 9786

Les encodages sont les méthodes pour inscrire ces numéros sur un support
informatique.
Les encodages peuvent avoir une dimension fixe (auquel cas il ne peuvent pas
inscrire n'importe quel nombre) ou une dimension variable.

Il y a deux confusions classiques:
1. De confondre octet et caractère. La tradition UNIX, C etc. a eu tendance
a appeler caractère, ce qui n'était que les 7 premiers bits d'un octet.
2. De confondre Unicode et encodage à 16 bits. À l'origine, Unicode était
effectivement assorti d'un encodage sur 16 bits.
Bien des logiciels appellent encore "Unicode" les encodages sur 16 bits.

Les encodages d'aujourd'hui sont UTF-8 et UTF-16. Ce sont des encodages de
taille variable.
UTF-8 représente le jeu ASCII sur 7 bits, mais tous les autres caractères
sur 2 octets et plus.
UTF-16 représente le Unicode traditionnel sur 16 bits, mais les autres
caractères sur plus d'octets.

-- Laurent CAPRANI
   Montréal

--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !

Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).

Cette liste est a votre disposition pour discuter en francais de tout sujet technique lie a XML.

Pour resilier votre abonnement, envoyez un message contenant la commande "unsubscribe" a xml-tech-request@xmlfr.org (mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)



Archive générée par hypermail 2.1.3 le 28/06/2004 - 11:06 UTC

webmaster@xmlfr.org

 

xml tech

Discussions techniques au sujet de XML.

Cette liste est à votre disposition pour discuter en français de tout sujet technique lié à XML.



Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot@online.fr  

Conception, réalisation et hébergement