Table des caractères Unicode (0000-FFFF)

Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.

Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme "U+...." (où "...." représente un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).

Plan multilingue de base (PMB/BMP)

Les tables suivantes listent tous les blocs de points de code alloués dans ce plan dans les normes ISO/CEI 10646 et Unicode.

Légende des conventions de couleurs et de style

Les blocs affichés sur fond clair sont alloués et contiennent des caractères affichables et normalisés.

Les blocs affichés sur fond jaune pâle sont alloués et contiennent des caractères affichables et normalisés pour des écritures de droite à gauche (ils nécessitent la prise en charge des écritures bidirectionnelles pour un rendu correct ; certains de ces caractères, mais pas tous, peuvent nécessiter une présentation en miroir selon le contexte directionnel).

Les blocs affichés sur fond vert sont alloués définitivement et attribués à des caractères à usage privé et libre, mais non interopérables.

Les blocs affichés sur fond rouge sont alloués définitivement mais les points de codes ne sont pas attribués à des caractères affichables (ce sont des caractères spéciaux ou de contrôle).

Les blocs affichés sur fond gris ne sont pas encore attribués officiellement (dans la version actuelle Unicode 12.1). Parmi ceux-ci :

  • les blocs nommés « (en caractères droits entre parenthèses) » sont acceptés par les groupes de travail de normalisation Unicode et/ou ISO et en cours de validation finale pour une normalisation prochaine, cependant la liste exacte et l’ordre des caractères qui seront retenus n’est pas encore définitive, des unifications, distinctions ou ajouts étant encore possibles ;
  • les blocs nommés « (en italique entre parenthèses) » ont seulement fait l’objet d’une proposition formelle et sont en cours de validation par les groupes de travail de normalisation Unicode et/ou ISO, pour une normalisation ultérieure, la liste précise et l’ordre des caractères n’est qu’indicative ;
  • les blocs nommés « ¿en italique entre points d’interrogation? » sont en projet et peuvent être encore déplacés, leur taille étant seulement estimée s’ils sont finalement retenus.
  • Afin de limiter la taille des pages sur Wikipédia, chaque plan Unicode est subdivisé ici en 16 plages arbitraires de 4 096 points de code chacun, décrits dans des sous-pages plus complètes accessibles par la palette de navigation en haut des pages, ou bien via les liens dans la première colonne des tables ci-dessous.
  • Lorsqu’un bloc officiel d’Unicode s’étend sur plusieurs plages, les liens nommant les blocs dans les tables ci-dessous pointent seulement vers la première partie du bloc, et les autres parties sont liées entre elles et listées chacune dans les sous-pages des plages de 4 096 points de code.

Alphabets occidentaux modernes

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+0000 commandes C0 latin de base commandes C1 latin – 1
U+0100 latin étendu – A latin étendu – B
U+0200 latin étendu – B alphabet phonétique international lettres modificatives avec chasse
U+0300 diacritiques grec et copte
U+0400 cyrillique
U+0500 cyrillique – supplément arménien  

Abjads afroasiatiques modernes (écrits de droite à gauche)

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+0500   hébreu
U+0600 arabe
U+0700 syriaque arabe – supplément thâna n’ko
U+0800 samaritain mandéen syriaque – supplément arabe étendu – A

Abugidas et alphabets sud-asiatiques modernes

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+0900 devanâgarî bengalî
U+0A00 gourmoukhî goudjarâtî
U+0B00 oriyâ tamoul
U+0C00 télougou kannara
U+0D00 malayalam singhalais
U+0E00 thaï lao
U+0F00 tibétain
U+1000 birman géorgien

Autres alphabets et syllabaires modernes

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1100 jamos hangeul
U+1200 éthiopien
U+1300 éthiopien éthiopien – supplément cherokee
U+1400
U+1500
syllabaires autochtones canadiens
U+1600 syllabaires autochtones canadiens ogam runes

Abugidas sud-asiatiques modernes

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1700 tagal hanounóo bouhid tagbanoua khmer
U+1800 mongol  

Syllabaires modernes – extension

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1800   syllab. autochtones canadiens étendus

Abugidas sud-asiatiques modernes

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1900 limbu taï-le nouveau taï-lue symb. khmers
U+1A00 bougui taï tham (ou lanna) diacritiques étendus
U+1B00 balinais soundanais batak
U+1C00 lepcha ol tchiki cyril.
ét. – C
géorgien étendu soundanais extensions védiques

Alphabets occidentaux modernes – extension

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+1D00 phonétique - supplément phonétique étendu - supplément diacritiques - supplément
U+1E00 latin étendu additionnel
U+1F00 grec étendu

Symboles et ponctuations d’usage général ou technique

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+2000 ponctuation générale exposants et indices symboles monétaires signes combinatoires pour symboles
U+2100 symboles de type lettre formes numérales flèches
U+2200 symboles mathématiques
U+2300 signes techniques divers
U+2400 pictogrammes de commande reconnaissance optique alphanumériques cerclés
U+2500 filets pavés formes géométriques
U+2600 symboles divers
U+2700 casseau symboles mathématiques divers – A flèches – supplément – A
U+2800 combinaisons Braille
U+2900 flèches – supplément – B symboles mathématiques divers – B
U+2A00 opérateurs mathématiques supplémentaires
U+2B00 symboles et flèches divers

Alphabets modernes – extension 1

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+2C00 glagolitique latin étendu – C copte
U+2D00 supplément géorgien tifinaghe éthiopien étendu cyrillique ét. – A
U+2E00 ponctuation complémentaire  

Sinogrammes, clés et traits les plus courants d’Asie orientale

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+2E00   sinogrammes – clés CJC – supplément
U+2F00 sinogrammes – clés chinoises du Kangxi dsc. id.
U+3000 symboles et ponct. CJC hiragana katakana
U+3100 bopomofo hangûl – jamos de compatibilité kanboun bopomofo étendu sinogrammes – traits CJC katakana – supplément
U+3200 lettres et mois CJC entourés
U+3300 sinogrammes de compatibilité CJC
U+3400
...
U+4000
...
sinogrammes unifiés CJC – supplément A
U+4D00 sinogrammes unifiés CJC – supplément A hexagrammes du Yi Jing
U+4E00
...
U+5000
...
U+6000
...
U+7000
...
U+8000
...
U+9000
...
U+9FFF
sinogrammes unifiés CJC
U+A000
...
syllabaire yi des Monts frais
U+A400 syllabaire yi des Monts frais clés yi lissou

Alphabets et alphasyllabaires modernes – extension 2

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+A500 vaï
U+A600 vaï cyrillique étendu – B bamoum
U+A700 lettres modificatives de ton latin étendu – D
U+A800 sylotî nâgrî formes numérales indiennes ’phags pa saurashtra dévanâgarî étendu
U+A900 kayah li rejang jamos hangûl – A javanais birman étendu – B
U+AA00 cham birman étendu – A taï việt meitei mayek étendu
U+AB00 éthiopien étendu – A latin étendu – E tchérokî – supplément meitei mayek
U+AC00
...
U+B000
...
U+C000
...
U+D000
...
syllabes hangûl précomposées
U+D700 syllabes hangûl précomposées jamos hangûl étendus – B

Points de codes à usage spécial

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+D800
...
demi-zone haute d’indirection
U+DB00 demi-zone haute d’indirection demi-zone haute d’indirection à usage privé
U+DC00
...
U+DF00
demi-zone basse d’indirection
U+E000
...
U+F000
...
U+F800
zone à usage privé

Caractères de compatibilité, formes de présentation et autres caractères spéciaux

  +00 +10 +20 +30 +40 +50 +60 +70 +80 +90 +A0 +B0 +C0 +D0 +E0 +F0
U+F900
U+FA00
sinogrammes de compatibilité CJC
U+FB00 formes de prés. alphabétiques formes de présentation arabes – A
U+FC00 formes de présentation arabes – A
U+FD00 formes de présentation arabes – A non-caractères f.p.a. – A
U+FE00 sélecteurs de variante f. de présent. verticales demi-
diacritiques
formes de
compatibilité CJC
petites formes formes de présentation arabes – B
U+FF00 formes de demi et pleine chasse spéciaux

Voir aussi

Liens internes

Liens externes

  • Portail de l’informatique
  • Portail de l’écriture
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.