From: Laurent CAPRANI (caprani@multimania.com)
Date: 21/09/2001 - 16:21
> -----Original Message-----
> From: xml-tech-bounce@xmlfr.org [mailto:xml-tech-bounce@xmlfr.org]On
> Behalf Of Aguero, Dimitri
> Sent: Friday, September 21, 2001 4:10 AM
> To: 'xml-tech@xmlfr.org'
> Subject: [xml-tech] RE: [xml-tech] Re: Comment XML gère les caractères
> multibyte ?
>
>
> Merci de votre réponse.
>
> Un seul commentaire sur Unicode que j'aimerais partager: D'après
> ce que j'ai
> compris (je peux me tromper), Unicode fait un encodage sur deux octets, ce
> qui est suffisant pour presque tous les alphabets sauf certains alphabets
> chinois.
Unicode est un jeu de caractères, c'est à dire une simple liste de
caractères avec un numéro chacun.
Il y a aujourd'hui plus de 40.000 caractères numérotés, on s'attend à ce
qu'il y en ait bientôt 100.000. Ils couvrent la plupart des écritures et
symboles du monde et l'ambition est de les couvrir toutes.
Exemples: A [A majuscule] -> 65, ç [c cédille minuscule] -> 231, :-)
[binette rigolote] -> 9786
Les encodages sont les méthodes pour inscrire ces numéros sur un support
informatique.
Les encodages peuvent avoir une dimension fixe (auquel cas il ne peuvent pas
inscrire n'importe quel nombre) ou une dimension variable.
Il y a deux confusions classiques:
1. De confondre octet et caractère. La tradition UNIX, C etc. a eu tendance
a appeler caractère, ce qui n'était que les 7 premiers bits d'un octet.
2. De confondre Unicode et encodage à 16 bits. À l'origine, Unicode était
effectivement assorti d'un encodage sur 16 bits.
Bien des logiciels appellent encore "Unicode" les encodages sur 16 bits.
Les encodages d'aujourd'hui sont UTF-8 et UTF-16. Ce sont des encodages de
taille variable.
UTF-8 représente le jeu ASCII sur 7 bits, mais tous les autres caractères
sur 2 octets et plus.
UTF-16 représente le Unicode traditionnel sur 16 bits, mais les autres
caractères sur plus d'octets.
-- Laurent CAPRANI
Montréal
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Archive générée par hypermail 2.1.3 le 28/06/2004 - 11:06 UTC
webmaster@xmlfr.org
|