SELFHTML

Jeux de caractères (famille iso-8859 et autres)

Page d'information: vue d'ensemble

vers le bas Les jeux de caractères ISO-8859
vers le bas Liste des jeux de caractères ISO-8859
vers le bas Tous les jeux de caractères officiels

 vers le bas 

Les jeux de caractères ISO-8859

La famille iso-8559 a été développée par l' European Computer Manufacturer's Association (ECMA). Il s'agit d'une collection de jeux de caractères pour les écritures alphabétiques. En font partie les écritures latines sur lesquelles sont fondées la plupart des langues de l'Europe de l'ouest et d'Amérique ou aussi les écritures cyrilliques.

Tous les jeux de caractères de cette famille se basent sur une représentation d'un octet par signe. Ce qui veut dire que tous les jeux de caractères comprennent 256 caractères possibles. Pour tous les jeux de caractères, les 128 premiers signes (les signes entre 0 et 127) sont identiques à ceux du jeu de caractères ASCII. Ce qui a l'avantage que les lettres latines courantes majuscules et minuscules, les chiffres arables et les signes spéciaux courants comme la ponctuation et les signes commerciaux soient toujours disponibles dans tous ces jeux de caractères.

jeu de caractères ASCII

Ci-dessus est représenté le jeu de caractères ASCII. Les signes de ce jeu de caractères pouvant être représentés ont des valeurs comprises entre 32 et 127. La valeur 32 est l'espace. Tous les jeux de caractères iso-8559 contiennent ce jeu de caractères.

Comment lire ce tableau de jeu de caractères et les suivants:

Vous trouvez la valeur d'un signe en additionnant les valeurs du titre de colonne et du titre de ligne pour le signe concerné. Un K majuscule a par exemple dans ce tableau une valeur de ligne de 70 et une valeur de colonne 5. Ce qui donne la valeur 75 pour ce signe. Les valeurs des caractères peuvent jouer un rôle pour l'utilisation de jeux de caractères et d'unicodes en HTML. Au cas où ce n'est pas de la valeur décimale mais de la valeur hexadécimale d'un caractère dont vous avez besoin, vous pouvez utiliser le Autre page d'information Traducteur décimal/hexadécimal.

Comme pour le jeu de caractères ASCII qui voit ses 32 premiers caractères (valeurs des signes de 0 à 31) réservés pour des caractères de contrôle les jeux de caractères étendus de la famille iso font aussi l'économie d'une plage de signes. Il s'agit des 32 premiers signes au delà du domaine ASCII, donc des valeurs de caractères de 128 à 159. Les tableaux des différents jeux de caractères plus bas représentent pour cette raison les valeurs de signes restantes de 160 à 255. Le signe avec la valeur 160 représentent dans tous ces jeux de caractères un espace imposé.

Beaucoup des jeux de caractères de la famille iso-8559 se chevauchent. C'est intentionnel. Les jeux de caractères sont si optimisés que le plus grand nombre possible d'écritures sont couvertes avec un jeu de caractères chacune. Les caractères qui existent dans plusieurs jeux de caractères de la famille iso-8859, ont en règle générale toujours la même valeur, c'est à dire qu'ils se trouvent toujours au même endroit dans les différents jeux de caractères.

Six des jeux de caractères iso-8859 se réfèrent à des écritures qui pour l'essentiel sont fondées sur l'écriture latine. Ces jeux de caractères sont nommés pour cette raison Latin-1 à Latin-6.

 vers le hautvers le bas 

Liste des jeux de caractères ISO-8859

Les tableaux suivants montrent les différents jeux de caractères de la famille iso-8859. Comment vous pouvez mettre en service ces jeux de caractères en HTML est expliqué dans la partie Autre page d'information mention de jeu de caractères comme mention Meta. Les noms représentés en bleu sont les désignations respectives que vous pouvez mentionner en HTML.

ISO-8859-1 (Latin-1)

Ce jeu de caractères contient les signes spécifiques pour les langues de l'Europe de l'ouest et d'Amérique. Il convient aux langues suivantes: albanais, danois, allemand, anglais, finlandais, français, galicien, irlandais, islandais, italien, catalan, néerlandais, norvégien, portugais, suédois et espagnol. Il n'y manque que des signes distincts comme le "ij" néerlandais ou les guillemets basses allemandes.

ISO-8859-1

ISO-8859-2 (Latin-2)

Ce jeu de caractères contient les signes spécifiques pour la plupart des langues de l'Europe centrale et slaves. Il convient aux langues suivantes: croate, polonais, roumain, slovaque, slovène, tchèque et hongrois.

ISO-8859-2

ISO-8859-3 (Latin-3)

Ce jeu de caractères convient aux langues: Espéranto, galicien, maltais et turc.

ISO-8859-3

ISO-8859-4 (Latin-4)

Ce jeu de caractères contient quelques uns des signes des langues suivantes: estonien, letton et lituanien. Comparez aussi ce jeu de caractères avec iso 8559-10, qui est très semblable.

ISO-8859-4

ISO-8859-5

Ce jeu de caractères contient des signes cyrilliques. Il couvre largement les langues suivantes: bulgare, macédonien, russe, serbe et ukrainien.

ISO-8859-5

ISO-8859-6

Ce jeu de caractères contient des signes de l'écriture arabe. La représentation des signes dans le tableau ci-après est pourtant "abstraite", étant donné que les signes varient dans la pratique de l'écriture selon qu'ils sont placés au début, au milieu ou à la fin d'un mot ou seuls. L'arabe se caractérise en outre par la direction de l'écriture (de droite à gauche).

ISO-8859-6

ISO-8859-7

Ce jeu de caractères contient les signes de l'écriture grecque moderne.

ISO-8859-7

ISO-8859-8

Ce jeu de caractères contient les signes de l'écriture hébraïque. Comme pour l'écriture arabe la direction de l'écriture est ici de droite à gauche.

ISO-8859-8

ISO-8859-9 (Latin-5)

Ce jeu de caractères est conçu spécialement pour le turc. Il est basé sur le jeu de caractères iso 8859-1, mais contient à la place des signes spéciaux islandais les signes turcs.

ISO-8859-9

ISO-8859-10 (Latin-6)

Ce jeu de caractères contient des signes spéciaux pour les langues suivantes: Groenlandais (Inuit) et lapon (Sami).

ISO-8859-10

 vers le hautvers le bas 

Tous les jeux de caractères officiels

Il y a quantité d'autres jeux de caractères en partie déjà plus anciens qui définissent des conventions pour différentes écritures ou familles d'écritures, souvent spécifiques au pays. À l'adresse Internet suivante sont réunis les noms de ces jeux de caractères:

Page en langue anglaise http://www.iana.org/assignments/character-sets

Les noms de jeux de caractères qui y sont énumérés dans la liste derrière name: ou alias: peuvent être mentionnés en HTML quand vous voulez imposer un certain jeu de caractères (Il faut employer de préférence les noms qui figurent dans la liste avec la mention preferred MIME name). Cela est possible pour tout le document par exemple avec la Autre page d'information mention du jeu de caractères par défaut.

 vers le haut
page suivante Autre page d'information Le système unicode
page précédente Autre page d'information Ordinateur et langage écrit
 

© 2001 Stefan Münz / © 2003 Traduction Adresse électronique Serge François, 13405@free.fr
Adresse électronique selfhtml@fr.selfhtml.org