Après avoir rappelé les notions de glyphe et de caractère, nous étudions les normes classiques d’échange de caractères, telles qu’Ascii ou ISO-latin-1. Puis, nous décrivons Unicode, une norme de codage 16-bits qui a comme but de représenter tous les caractères des langues vivantes pour permettre l’échange sans problèmes de textes rédigés dans les langues parlées des différentes parties du monde. ISO/IEC-10646 est une généralisation à quatre octets — dont les 2 premiers octets coincident avec ceux d’Unicode — qui permet aussi la représentation de caractères spéciaux et anciens en les codant sur 32 bits.
After revieiwing the difference between glyphs and characters, we discuss character exchange standards, like Ascii and ISO-Latin-1. Then we turn our attention to Unicode, a 16-bit encoding standard that will eventually represent the characters of all living languages and thus will make it possible to exchange without problems texts written in the languages spoken in various parts of the world. ISO/IEC-10646 is a 4-byte generalisation–the first two bytes coinciding with Unicode–but whose full 32-bits wide encoding space allows the representation of special or ancient characters.
@article{CG_1995___20_1_0, author = {Andr\'e, Jacques and Goossens, Michel}, title = {Codage des caract\`eres et multi-linguisme~: de {l{\textquoteright}ASCII} \`a {UNICODE} et {ISO/IEC-10646}}, journal = {Cahiers GUTenberg}, pages = {1--53}, publisher = {Association GUTenberg}, number = {20}, year = {1995}, language = {fr}, url = {http://archive.numdam.org/item/CG_1995___20_1_0/} }
TY - JOUR AU - André, Jacques AU - Goossens, Michel TI - Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646 JO - Cahiers GUTenberg PY - 1995 SP - 1 EP - 53 IS - 20 PB - Association GUTenberg UR - http://archive.numdam.org/item/CG_1995___20_1_0/ LA - fr ID - CG_1995___20_1_0 ER -
André, Jacques; Goossens, Michel. Codage des caractères et multi-linguisme : de l’ASCII à UNICODE et ISO/IEC-10646. Cahiers GUTenberg, Multilinguisme et codage des caractères ; d’Ascii à Unicode et OMEGA, no. 20 (1995), pp. 1-53. http://archive.numdam.org/item/CG_1995___20_1_0/