Voici une liste mise à jour des plus beaux "goodies" Unicode, ainsi que des packages et des ressources

Unicode est génial! Avant son apparition, la communication internationale était épuisante: chacune définissait son propre jeu de caractères étendu séparé dans la moitié supérieure de l'ASCII (les soi-disant pages de codes). Cela a créé un conflit. Pensez simplement que les Allemands ont dû négocier avec les Coréens, où se trouve la page de codes. Heureusement, Unicode est apparu et a introduit une norme commune. Unicode 8.0 couvre plus de 120 000 caractères de plus de 129 scripts. À la fois moderne et ancien, et toujours pas décrypté. Unicode prend en charge le texte de gauche à droite et de droite à gauche, superpose les caractères et comprend une variété de symboles et d'émojis culturels, politiques, religieux. Unicode est incroyablement humain et ses capacités sont largement sous-estimées.

Table des matières

Brève introduction

Quels caractères sont inclus dans Unicode Standard?

La norme Unicode définit les codes des caractères dans les principales langues modernes. Ce sont des scripts alphabétiques européens, des scripts du Moyen-Orient de droite à gauche et de nombreux scripts asiatiques.

La norme contient également des signes de ponctuation, des signes diacritiques, des symboles mathématiques, des symboles techniques, des flèches, des dingbats, des emojis, etc. Elle fournit des codes pour les signes diacritiques qui changent les signes de caractères, tels que les tildes (~). Ils sont utilisés en combinaison avec ceux de base pour représenter des caractères accentués (par exemple, ñ). En général, la version 9.0 d'Unicode fournit des codes pour 128 172 caractères des alphabets du monde, des jeux d'idéogrammes et des collections de caractères.

Les caractères les plus courants sont placés dans les premiers 64K points de code, une zone de l'espace de code appelée le plan multilingue principal, ou BMP pour faire court. Il y a seize autres plans supplémentaires disponibles pour encoder d'autres caractères, avec plus de 850 000 points de code inutilisés. Ils peuvent être utiles pour ajouter de nouveaux personnages aux futures versions de la norme.

La norme Unicode réserve également des points de code pour un usage privé. Les fournisseurs ou les utilisateurs finaux peuvent les désigner dans leurs propres systèmes pour leurs personnages ou les utiliser avec des polices spécialisées. Le BMP a 6400 points de code pour un usage privé et 131 068 points de code supplémentaires pour un usage privé, si 6400 n'est pas suffisant pour des applications spécifiques.

Encodages de caractères Unicode

Les normes de codage de caractères déterminent non seulement l'identité de chaque caractère et sa valeur numérique ou point de code, mais également la façon dont cette valeur est représentée en bits.

La norme Unicode définit trois formes de codage qui permettent la transmission des mêmes données: un octet, un mot et un double mot (c'est-à-dire 8, 16 ou 32 bits par unité de code). Les trois formulaires codent le même jeu de caractères commun et peuvent être efficacement convertis les uns aux autres sans perte de données. Le consortium Unicode approuve pleinement l'utilisation de l'une de ces formes de codage comme moyen convenu de mettre en œuvre la norme Unicode.

UTF-8 est populaire pour le HTML et les protocoles similaires. UTF-8 est un moyen de convertir tous les caractères Unicode en un codage à longueur d'octet variable. Son avantage est que les caractères Unicode qui correspondent à l'ensemble ASCII familier ont les mêmes valeurs d'octet que ASCII, et les caractères Unicode convertis en UTF-8 peuvent être utilisés avec de nombreux logiciels existants sans modifications majeures du logiciel.

UTF-16 est populaire dans de nombreux environnements où il est nécessaire d'équilibrer un accès efficace aux caractères avec un stockage économique. Il est assez compact et tous les caractères fréquemment utilisés sont placés dans un bloc de code 16 bits, tandis que tous les autres caractères sont disponibles via des paires de blocs de code 16 bits.

UTF-32 est utile lorsque la quantité de mémoire n'est pas un problème, mais nécessite l'accès aux caractères dans un seul code à largeur fixe. Ici, chaque caractère Unicode est codé dans un seul bloc de code 32 bits.

Les trois formes de codage ne nécessitent pas plus de 4 octets (ou 32 bits) pour chaque caractère.

Parlez de chiffres

Le jeu de caractères Unicode est divisé en 17 segments principaux (plans), qui sont ensuite divisés en blocs. Dans chaque avion, il y a une place pour 65 536 (2 ¹⁶ ) points de code, ce qui crée un total de 1 114 112 points de code. Il existe deux «avions à usage privé» (n ° 16 et n ° 17) qui sont attribués à la discrétion des entreprises / utilisateurs. Ils ont 131 072 points de code.

Non.	Le titre	Gamme
1.	Avion multilingue principal	(de U + 0000 à U + FFFF)
2.	Avion multilingue supplémentaire	(de U + 10000 à U + 1FFFF)
3.	Plan idéographique supplémentaire	(de U + 20 000 à U + 2FFFF)
4.	Plan idéographique tertiaire	(de U + 30000 à U + 3FFFF)
5.	Plan 5 (non utilisé)	(de U + 40000 à U + 4FFFF)
6.	Avion 6 (non utilisé)	(de U + 50 000 à U + 5FFFF)
7.	Avion 7 (non utilisé)	(de U + 60 000 à U + 6FFFF)
8.	Avion 8 (non utilisé)	(de U + 70 000 à U + 7FFFF)
9.	Avion 9 (non utilisé)	(de U + 80 000 à U + 8FFFF)
10.	Avion 10 (non utilisé)	(de U + 90 000 à U + 9FFFF)
11.	Avion 11 (non utilisé)	(de U + A0000 à U + AFFFF)
12.	Avion 12 (non utilisé)	(de U + B0000 à U + BFFFF)
13.	Avion 13 (non utilisé)	(de U + C0000 à U + CFFFF)
14.	Avion 14 (non utilisé)	(de U + D0000 à U + DFFFF)
15.	Avion supplémentaire spécialisé	(de U + E0000 à U + EFFFF)
16.	Espace supplémentaire pour usage privé - A	(de U + F0000 à U + FFFFF)
17.	Espace supplémentaire pour usage privé - B	(de U + 100000 à U + 10FFFF)

Le premier avion est appelé le principal avion multilingue ou BMP. Il contient des points de code de U + 0000 à U + FFFF, c'est-à-dire les caractères les plus couramment utilisés. Les seize plans restants (U + 010000 → U + 10FFFF) sont appelés supplémentaires ou astraux.

Paires de substitution UTF-16

Les symboles en dehors du plan principal, comme un tétragramme qui signifie le centre (U + 1D306), peuvent être encodés en UTF-16 avec seulement deux unités de code 16 bits: 0xD834 0xDF06. C'est ce qu'on appelle une paire de substitution. Veuillez noter qu'une paire de substitution ne représente qu'un seul caractère.

La première unité de code d'une paire de substitution se situe toujours dans la plage de 0xD800 à 0xDBFF et est appelée la partie supérieure de la paire.

La deuxième unité de code de la paire de substitution se situe toujours dans la plage de 0xDC00 à 0xDFFF et est appelée le bas de la paire.

Matthias Binens

Paire de substitution: représentation d'un symbole abstrait, consistant en une séquence de deux unités de code de 16 bits, où la première valeur de la paire est l'unité de code de substitution supérieure et la seconde est l'unité de code de substitution inférieure. Les paires de substitution ne sont utilisées qu'en UTF-16.

Unicode 8.0 Chapitre 3.8 - Surrogates

Calcul des paires de substitution

Le caractère Unicode «Pile of shit» (U + 1F4A9) dans UTF-16 devra être codé comme une paire de substitution, c'est-à-dire deux substituts. Pour convertir n'importe quel point de code en une paire de substitution, utilisez cet algorithme (en JavaScript). Gardez à l'esprit que nous utilisons la notation hexadécimale.

var High_Surrogate = function(Code_Point){ return Math.floor((Code_Point - 0x10000) / 0x400) + 0xD800 }; var Low_Surrogate = function(Code_Point){ return (Code_Point - 0x10000) % 0x400 + 0xDC00 }; // Reverses The Conversion var Code_Point = function(High_Surrogate, Low_Surrogate){ return (High_Surrogate - 0xD800) * 0x400 + Low_Surrogate - 0xDC00 + 0x10000; };

Composition et décomposition

Unicode comprend un mécanisme pour changer la forme d'un caractère, ce qui étend considérablement l'ensemble de glyphes pris en charge. Cela s'applique aux diacritiques combinables. Ils sont insérés après le personnage principal. Plusieurs marques diacritiques peuvent être appliquées à la même marque. Unicode contient également des versions précompilées de la plupart de ces combinaisons pour une utilisation normale.

Certaines séquences de caractères peuvent également être représentées comme un seul caractère appelé caractère précomposé, alias caractère composite. Par exemple, le caractère [ü] peut être codé comme le seul point de code U + 00FC ou comme le caractère de base U + 0075 (u), suivi du caractère non autonome U + 0308 (¨). La norme Unicode code les caractères composés pour la compatibilité avec les normes établies, telles que Latin 1, qui comprend de nombreux caractères composés, tels que [ü] et [ñ].

Les caractères composés peuvent être développés pour des raisons de cohérence ou d'analyse. Par exemple, lors du tri alphabétique, le symbole [ü] peut être décomposé en [u] suivi du symbole non indépendant [¨]. Après une telle décomposition, l'algorithme est plus facile à travailler avec une séquence de caractères. Cela facilite le tri dans les langues où les modificateurs de caractères n'affectent pas l'ordre alphabétique. La norme Unicode définit l' ordre de décomposition pour tous les caractères composites. Il définit également des formes de normalisation pour fournir des représentations uniques de personnages.

Mythes Unicode

Extrait des diapositives de la présentation de Mark Davis "Mythes of Unicode" .

Unicode n'est qu'un code 16 bits . - Certaines personnes croient à tort que Unicode est juste un code 16 bits, dans lequel chaque caractère occupe 16 bits, et donc il y a 65 536 caractères possibles. En fait, ce n'est pas entièrement vrai. C'est le mythe Unicode le plus courant, donc si vous le pensiez aussi avant, ne vous découragez pas.
Vous pouvez prendre n'importe quel point de code qui n'est pas utilisé pour vos besoins . - Non. Un jour, cet endroit sera remplacé par un autre symbole. Au lieu de cela, utilisez des avions pour un usage privé ou des zones sans caractères dans chaque avion où il n'y aura pas de caractères par défaut.
Chaque point de code Unicode représente un caractère . - Non. Il existe de nombreux points sans caractères (FFFE, FFFF, 1FFFE, etc.). De plus, des points de code de substitution, des points de code privés et inutilisés, ainsi que des "caractères" de contrôle / formatage (RLM, ZWNJ, etc.)
Unicode manque d'espace . - S'il se remplissait linéairement, il se serait terminé en 2140. Mais l'endroit ne se remplit pas linéairement. Plans futurs voir ici .
Tous les personnages sont appariés un à un . - Non. Les options sont les suivantes:
- Un à plusieurs: (β → SS)
- Compte tenu du contexte: (... Σ ← → ... ς et en même temps ... ΣΤ ... ← → ... στ ...)
- En fonction des paramètres régionaux: (I ← → ı et en même temps © ← → i)

Encodages d'application Unicode

Type de codage	Exemple
Objet HTML (décimal)
Objet HTML (hex)
Code de contrôle d'URL	% F0% 9F% 96% 96
UTF-8 (hex)	0xF0 0x9F 0x96 0x96 (f09f9696)
UTF-8 (binaire)	11110000: 10011111: 10010110: 10010110
UTF-16 / UTF-16BE (hex)	0xD83D 0xDD96 (d83ddd96)
UTF-16LE (hex)	0x3DD8 0x96DD (3dd896dd)
UTF-32 / UTF-32BE (hex)	0x0001F596 (0001f596)
UTF-32LE (hex)	0x96F50100 (96f50100)
Séquence d'échappement octale	\ 360 \ 237 \ 226 \ 226

Code source

Type de codage	Exemple
Javascript	\ u1F596
Json	\ u1F596
C	\ u1F596
C ++	\ u1F596
Java	\ u1F596
Python	\ u1F596
Perl	\ x {1F596}
Rubis	\ u {1F596}
CSS	\ 01F596

Liste de personnages incroyables.

Le partage d'un document peut rapidement transformer l'édition en une bataille écrite de rap, menée par un arrangement de plus en plus confus de gestionnaires de U + 202a à U + 202e

Caractères spéciaux

Le Consortium Unicode a publié un diagramme de ponctuation général où vous pouvez trouver plus d'informations.

Symbole	Le titre	La description
`''`	U + FEFF Espace insécable de largeur nulle (Byte Order Mark - BOM)	Il a une importante propriété d'unicité lors du changement de l'ordre des octets. Il a également une largeur et une invisibilité nulles. Dans un logiciel inapproprié (comme un interpréteur PHP), cela conduit à toutes sortes d'exemples de comportement amusant.
`'￯'`	Nomenclature inversée '\ uFFEF'	Pas assimilé à un caractère, sauf pour le début du texte.
`''`	'\ u200B' Espace insécable de largeur nulle	Un symbole sans apparence et sans effet, sauf pour éviter la formation de ligatures.
`' '`	U + 00A0 Espace insécable	Rassemble les personnages adjacents. Bien connu sous le nom de ` ` en HTML.
`''`	U + 00AD Trait d'union doux	En HTML, il fonctionne comme un espace de largeur nulle, mais lorsqu'il rencontre la fin d'une ligne (et seulement dans ce cas), il montre un trait d'union.
`'‍'`	U + 200D Signe de largeur nulle (avec union)	Provoque la connexion de caractères voisins (par exemple, des caractères arabes ou des emojis pris en charge). Peut être utilisé pour les emojis combinés séquentiellement.
`'⁠'`	Connecteur de mots U + 2060	Identique à U + 00A0, mais complètement invisible. Bon pour @ font-face sur Twitter.
`' '`	U + 1680 personnage spatial Ogham	Marque un espace qui ressemble à un tiret. Idéal pour rapprocher les programmeurs de la folie: 1 + 2 === 3.
`';'`	U + 037E point d'interrogation grec	Ressemble à un point-virgule. Aussi une façon amusante de troller les développeurs.
`'‭'`	U + 202D	Change la direction du texte de gauche à droite.
`'‮'`	U + 202E	Change la direction du texte de droite à gauche.
`'ꓸ'`	U + A4F8 Lisu lettre ton mya ti	Double pour le point.
`'ꓹ'`	U + A4F9 Lisu lettre ton na po	Double pour une virgule.
`'ꓼ'`	U + A4FC Lisu lettre ton mya na	Double pour le point-virgule.
`'ꓽ'`	U + A4FD Lisu lettre ton mya jeu	Double pour le colon.
`'︀'`	Sélecteurs d'options (de U + FE00 à U + FE0F et de U + E0100 à U + E01EF)	Un bloc de 256 caractères de largeur nulle possédant la propriété ID_Continue, c'est-à-dire, peut être utilisé dans les noms de variable (pas la première lettre). Ce qui les rend spéciaux, c'est que le curseur de la souris passe dessus, car ils combinent des caractères, contrairement à la plupart des autres caractères de largeur nulle.
`'ᅟ'`	U + 115F Placeholder Hangul Choson	Remplit essentiellement l'espace. Rendu en tant que caractère de largeur nulle (invisible) sauf s'il est explicitement pris en charge dans le rendu. Marqué comme ID_Start
`'ᅠ'`	U + 1160 Placeholder Chunson	Remplit peut-être l'espace? Rendu en tant que caractère de largeur nulle (invisible) sauf s'il est explicitement pris en charge dans le rendu. Marqué comme ID_Start
`'ㅤ'`	U + 3164 agrégat Hangul	En général, il remplit l'espace. Rendu en tant que caractère de largeur nulle (invisible) sauf s'il est explicitement pris en charge dans le rendu. Marqué comme ID_Start

Attendez ... qu'est-ce que je viens de lire?

Les identifiants variables peuvent inclure des espaces!

L'espace réservé U + 3164 Hangul s'affiche sous la forme d'un grand espace. Si le caractère n'est clairement pas pris en charge dans le rendu , il est alors affiché comme complètement invisible (et ne prend pas d'espace, c'est-à-dire "largeur nulle"). Cela signifie que vous ne verrez jamais un caractère de remplacement de caractère laid ( ).

Je ne sais pas encore pourquoi U + 3164 est chargé de se comporter de cette façon. Fait intéressant, U + 3164 a été ajouté à Unicode dans la version 1.1 (1993) - les spécialistes du Consortium ont donc eu beaucoup de temps pour y réfléchir. Quoi qu'il en soit, voici quelques exemples.

 > var ᅟ = 'foo'; undefined > ᅟ 'foo' > var ㅤ= alert; undefined > var foo = 'bar' undefined > if ( foo ===ㅤ`baz` ){} // alert undefined > var varㅤfooㅤ\u{A60C}ㅤπ = 'bar'; undefined > varㅤfooㅤꘌㅤπ 'bar'

** Remarque: ** J'ai testé le rendu U + 3164 sur Ubuntu et OS X avec les paramètres suivants: `node`,` php`, `ruby`,` python3.5`, `scala`,` vim`, `cat` , `chrome` +` gistub gist '. Atom est le seul système qui échoue en affichant (incorrectement) des champs vides. Je n'ai pas encore vérifié le code dans Emacs et Sublime. Si je comprends bien, le consortium Unicode ne réaffectera pas ou ne renommera pas les caractères ou les points de code, mais il peut être persuadé de modifier les propriétés de caractères tels que ID_Start et ID_Continue.

Modificateurs

Zero Width Combiner (ZWJ) est un caractère non imprimable dans un ensemble informatique de certaines polices complexes, telles que l'arabe ou toute police indienne. Lorsqu'il est placé entre deux caractères qui autrement ne seraient pas connectés, ZWJ les force à imprimer sous une forme combinée.

Le Zero Width Disconnector (ZWNJ) est un caractère non imprimable dans les ensembles d'écriture informatisés avec ligatures. Lorsqu'il est placé entre deux caractères qui autrement seraient combinés en une ligature, ZWNJ les oblige à imprimer dans leurs formes finale et originale, respectivement. Agit comme un espace, mais est utilisé lorsqu'il est souhaitable de garder des mots proches les uns des autres ou de combiner un mot avec son morphème.

 > 'a' "a" > 'a\u{0308}' "ä" > 'a\u{20DE}\u{0308}' "a⃞̈" > 'a\u{20DE}\u{0308}\u{20DD}' "a⃞̈⃝" // Modifying Invisible Characters > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}' "‎‎‎‎‎‎‎‎‎‎" > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}'.length 10

Collisions de transformées en majuscules

Symbole	Point de code	Résultat
ß	0x00DF	`SS`
ı	0x0131	`I`
ſ	0x017F	`S`
ﬀ	0xFB00	`FF`
fi	0xFB01	`FI`
fl	0xFB02	`FL`
ﬃ	0xFB03	`FFI`
ﬄ	0xFB04	`FFL`
ﬅ	0xFB05	`ST`
ﬆ	0xFB06	`ST`

Collisions de conversion en minuscules

Symbole	Point de code	Résultat
K	0x212A	`k`

Quirks et dépannage

La longueur de ligne est généralement déterminée par le nombre de points de code . Cela signifie que les paires de substitution seront considérées comme deux caractères. Plusieurs diacritiques peuvent être superposés à un symbole: a + ̈ == ̈a . Cela augmente la longueur de la chaîne, ne produisant qu'un seul caractère.
De même, l'inversion de chaîne devient souvent une tâche non triviale . Encore une fois, les paires de substitution et les diacritiques doivent être inversés ensemble. ES Reverser offre une assez bonne solution.

Les comparaisons majuscules et minuscules ne correspondent pas toujours . Ils peuvent s'exprimer dans de telles relations:

Un à plusieurs: (ß → SS)
Compte tenu du contexte: (... Σ ← → ... ς et ... ΣΤ ... ← → ... στ ...)
En fonction des paramètres régionaux: (I ← → ı et İ ← → i)

Une à plusieurs comparaisons

La plupart des caractères ci-dessous expriment leurs correspondances un-à-plusieurs en majuscules et d'autres en minuscules. En principe, la liste peut être divisée en deux parties.

Point de code	Symbole	Le titre	Caractère associé	Points de code associés
U + 00DF	`ß`	Escet latin minuscule (S aigu)	`s` , `s`	U + 0073, U + 0073
U + 0130	`İ`	Lettre majuscule latine "I" avec un point au-dessus	`i` , `̇`	U + 0069, U + 0307
U + 0149	`ŉ`	Lettre minuscule latine "n" de l'apostrophe précédente	`ʼ` , `n`	U + 02BC, U + 006E
U + 01F0	`ǰ`	Lettre minuscule latine j	`j` , `̌`	U + 006A, U + 030C
U + 0390	`ΐ`	Iota grec en minuscules avec dialyse et tonos.	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 03B0	`ΰ`	Lettre minuscule grecque ipsilon avec dialyse et tonos.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 0587	`և`	Ligature arménienne minuscule ech yiwn	`ե` , `ւ`	U + 0565, U + 0582
U + 1E96	`ẖ`	Lettre minuscule latine h avec une ligne ci-dessous	`h` ,	U + 0068, U + 0331
U + 1E97	`ẗ`	Lettre minuscule latine t avec dieresis	`t` , `̈`	U + 0074, U + 0308
U + 1E98	`ẘ`	Lettre minuscule latine w avec anneau au-dessus	`w` , `̊`	U + 0077, U + 030A
U + 1E99	`ẙ`	Lettre minuscule latine y avec anneau au-dessus	`y` , `̊`	U + 0079, U + 030A
U + 1E9A	`ẚ`	Lettre minuscule latine a avec la moitié droite de l'anneau	`a` , `ʾ`	U + 0061, U + 02BE
U + 1E9E	`ẞ`	Lettre majuscule latine aigus s	`s` , `s`	U + 0073, U + 0073
U + 1F50	`ὐ`	Lettre minuscule grecque ipsilon avec psil	`υ` , `̓`	U + 03C5, U + 0313
U + 1F52	`ὒ`	Lettre grecque minuscule ipsilon avec psili et varia	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0300
U + 1F54	`ὔ`	Lettre minuscule grecque ipsilon avec psily et oxy	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0301
U + 1F56	`ὖ`	Lettre minuscule grecque ipsilon avec psily et périsome	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0342
U + 1F80	`ᾀ`	Lettre minuscule grecque alpha avec psili et ipogemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F81	`ᾁ`	Lettre minuscule grecque alpha avec dasia et ipogemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F82	`ᾂ`	Lettre minuscule grecque alpha avec psilia et varia et ipogemen	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F83	`ᾃ`	Lettre minuscule grecque alpha avec dasia et varia et ipogemen	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F84	`ᾄ`	Lettre minuscule grecque alpha avec psily et oxy et ipogemen	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F85	`ᾅ`	Lettre minuscule grecque alpha avec dasia et oxy et ipogemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F86	`ᾆ`	Lettre minuscule grecque alpha avec psily et perispomenti et ipogemen	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F87	`ᾇ`	Lettre grecque minuscule alpha avec dasia et perispomenti et hypogrammen	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F88	`ᾈ`	Lettre majuscule grecque alpha avec psil et programmeurs	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F89	`ᾉ`	Lettre majuscule grecque alpha avec dasia et programmemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F8A	`ᾊ`	Lettre majuscule grecque alpha avec psilia et varia et programmes	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F8B	`ᾋ`	Lettre majuscule grecque alpha avec dasia et varia et prog	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F8C	`ᾌ`	Lettre majuscule grecque alpha avec psily et oxy et prog	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F8D	`ᾍ`	Lettre majuscule grecque alpha avec dasia et oxy et programmemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F8E	`ᾎ`	Lettre majuscule grecque alpha avec psily et perispomenti et programmation	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F8F	`ᾏ`	Lettre majuscule grecque alpha avec dasia et perispomenti et progs	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F90	`ᾐ`	Lettre minuscule grecque ceci avec psily et ipogemen	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F91	`ᾑ`	Lettre minuscule grecque a avec dasia et ipogemen	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F92	`ᾒ`	Lettre minuscule grecque ceci avec psilia et varia et ipogemen	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F93	`ᾓ`	Lettre minuscule grecque eta avec dasia et varia et ipogemen	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F94	`ᾔ`	Lettre minuscule grecque A avec psilia et oksia et ipogemen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F95	`ᾕ`	Lettre minuscule grecque eta avec dasia et oksia et ipogemen	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F96	`ᾖ`	Lettre minuscule grecque ceci avec psily et perispomenti et ipogemen	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F97	`ᾗ`	Lettre minuscule grecque eta avec dasia et perisopmenti et hypogrammen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1F98	`ᾘ`	Lettre majuscule grecque ceci avec psilah et programmes	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F99	`ᾙ`	Lettre majuscule grecque avec Dasia et programmeurs	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F9A	`ᾚ`	Lettre majuscule grecque ceci avec psilia et varia et prosgrammemeny	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F9B	`ᾛ`	Lettre majuscule grecque ceci avec dasia et varia et prosgrammemeny	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F9C	`ᾜ`	Lettre majuscule grecque ceci avec psilia et oxy et programmen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F9D	`ᾝ`	Lettre majuscule grecque avec Dasia et Oksia et programmeurs	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F9E	`ᾞ`	Lettre majuscule grecque ceci avec psily et perispomenty et prosgrammeny	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F9F	`ᾟ`	Lettre majuscule grecque ceci avec dasia et perispomenti et programmen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1FA0	`ᾠ`	Lettre minuscule grecque oméga avec psili et ipogemen	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA1	`ᾡ`	Oméga lettre minuscule grecque avec dasia et ipogemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FA2	`ᾢ`	Lettre minuscule grecque oméga avec psilia et varia et ipogemen	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FA3	`ᾣ`	Lettre minuscule grecque oméga avec dasia et varia et ipogemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FA4	`ᾤ`	Lettre minuscule grecque oméga avec psily et oxy et ipogemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FA5	`ᾥ`	Lettre minuscule grecque oméga avec dasia et oxy et ipogemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FA6	`ᾦ`	Omega lettre minuscule grecque avec psily et perispomenti et ipogemen	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FA7	`ᾧ`	Omega lettre minuscule grecque avec dasia et perispomenti et hypogrammemen	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FA8	`ᾨ`	Lettre majuscule grecque oméga avec psili et programme	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA9	`ᾩ`	Lettre majuscule grecque Omega avec dasia et programmemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FAA	`ᾪ`	Lettre majuscule grecque oméga avec psilia et varia et prosgrammemeny	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FAB	`ᾫ`	Lettre majuscule grecque Omega avec dasia et varia et programmeurs	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FAC	`ᾬ`	Lettre majuscule grecque oméga avec psilia et oxy et progamemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FAD	`ᾭ`	Lettre majuscule grecque oméga avec dasia et oksia et programmeurs	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FAE	`ᾮ`	Lettre majuscule grecque oméga avec psily et perispomenti et prosgrammemeny	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FAF	`ᾯ`	Lettre majuscule grecque oméga avec dasia et perispomenti et prosgrammemeny	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FB2	`ᾲ`	Lettre minuscule grecque alpha avec varia et ipogemen	`ὰ` , `ι`	U + 1F70, U + 03B9
U + 1FB3	`ᾳ`	Lettre minuscule grecque alpha avec ogogerammeni	`α` , `ι`	U + 03B1, U + 03B9
U + 1FB4	`ᾴ`	Lettre minuscule grecque alpha avec oxy et ipogemen	`ά` , `ι`	U + 03AC, U + 03B9
U + 1FB6	`ᾶ`	Lettre minuscule grecque alpha avec perispomenti	`α` ,	U + 03B1, U + 0342
U + 1FB7	`ᾷ`	Lettre minuscule grecque alpha avec perispomenti et ipogemen	`α` , `͂` `ι`	U + 03B1, U + 0342, U + 03B9
U + 1FBC	`ᾼ`	Lettre majuscule grecque alpha avec progs	`α` , `ι`	U + 03B1, U + 03B9
U + 1FC2	`ῂ`	Lettre minuscule grecque et avec varia et ipogemen	`ὴ` , `ι`	U + 1F74, U + 03B9
U + 1FC3	`ῃ`	Lettre minuscule grecque A avec ipogemen	`η` , `ι`	U + 03B7, U + 03B9
U + 1FC4	`ῄ`	Lettre minuscule grecque eta avec oxy et ipogemen	`ή` , `ι`	U + 03AE, U + 03B9
U + 1FC6	`ῆ`	Lettre minuscule grecque a avec perispomenti	`η` ,	U + 03B7, U + 0342
U + 1FC7	`ῇ`	Lettre minuscule grecque a avec perispomenti et ipogemen	`η` , `͂` `ι`	U + 03B7, U + 0342, U + 03B9
U + 1FCC	`ῌ`	Lettre majuscule grecque ceci avec prog	`η` , `ι`	U + 03B7, U + 03B9
U + 1FD2	`ῒ`	Iota minuscule grec avec dialyse et varia	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0300
U + 1FD3	`ΐ`	Iota grec en minuscules avec dialyse et oxy	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 1FD6	`ῖ`	Grec iota minuscule avec perispomenti	`ι` ,	U + 03B9, U + 0342
U + 1FD7	`ῗ`	Iota grec en minuscules avec dialyse et point	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0342
U + 1FE2	`ῢ`	Lettre grecque minuscule ipsilon avec dialyse et varia.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0300
U + 1FE3	`ΰ`	Lettre minuscule grecque ipsilon avec dialyse et oxy.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 1FE4	`ῤ`	Rho grec en minuscules avec psili	`ρ` , `̓`	U + 03C1, U + 0313
U + 1FE6	`ῦ`	Lettre minuscule grecque ipsilon avec perispomenti	`υ` ,	U + 03C5, U + 0342
U + 1FE7	`ῧ`	Lettre minuscule grecque ipsilon avec dialyse et point	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0342
U + 1FF2	`ῲ`	Oméga lettre minuscule grecque avec varia et ipogemen	`ὼ` , `ι`	U + 1F7C, U + 03B9
U + 1FF3	`ῳ`	Lettre minuscule grecque oméga avec ogogerammeni	`ω` , `ι`	U + 03C9, U + 03B9
U + 1FF4	`ῴ`	Oméga lettre minuscule grecque avec oxia et ipogemen	`ώ` , `ι`	U + 03CE, U + 03B9
U + 1FF6	`ῶ`	Lettre minuscule grecque oméga avec perispomenti	`ω` ,	U + 03C9, U + 0342
U + 1FF7	`ῷ`	Omega lettre minuscule grecque avec perispomenti et ipogemen	`ω` , `͂` `ι`	U + 03C9, U + 0342, U + 03B9
U + 1FFC	`ῼ`	Lettre majuscule grecque oméga avec programme	`ω` , `ι`	U + 03C9, U + 03B9
U + FB00	`ﬀ`	Ligature latine minuscule Ff	`f` `f`	U + 0066, U + 0066
U + FB01	`ﬁ`	Ligature minuscule latine Fi	`f` , `i`	U + 0066, U + 0069
U + FB02	`ﬂ`	Ligature latine minuscule Fl	`f` `l`	U + 0066, U + 006C
U + FB03	`ﬃ`	Ligature latine minuscule Ffi	`f` , `f` , `i`	U + 0066, U + 0066, U + 0069
U + FB04	`ﬄ`	Ligature latine minuscule Ffl	`f` , `f` , `l`	U + 0066, U + 0066, U + 006C
U + FB05	`ﬅ`	Ligature latine minuscule longue ST	`s` , `t`	U + 0073, U + 0074
U + FB06	`ﬆ`	Ligature minuscule latine St	`s` , `t`	U + 0073, U + 0074
U + FB13	`ﬓ`	Ligature arménienne minuscule Men Now	`մ` , `ն`	U + 0574, U + 0576
U + FB14	`ﬔ`	Ligature arménienne minuscule Hommes Ech	`մ` , `ե`	U + 0574, U + 0565
U + FB15	`ﬕ`	Ligature arménienne minuscule Hommes Ini	`մ` , `ի`	U + 0574, U + 056B
U + FB16	`ﬖ`	Ligature arménienne minuscule Vew Now	`վ` , `ն`	U + 057E, U + 0576
U + FB17	`ﬗ`	Ligature arménienne minuscule Homme Xeh	`մ` , `խ`	U + 0574, U + 056D

Grands packages et bibliothèques

PhantomScript -: ghost :: flashlight: Exécution de JavaScript invisible et d'ingénierie sociale
ESReverser - Gestion des chaînes JavaScript basées sur Unicode .
mimic - Utilisation abusive d'Unicode
python-ftfy - Tente de créer la représentation maximale correcte et complète du texte reçu en Unicode.
vim-troll-stopper - Protégez votre code des trolls unicode.

Emoji

Graphique Emoji du consortium Unicode
Emojipedia - Informations sur un emoji spécifique, blog de nouvelles.
emojitracker — Twitter.
World Translation Foundation — , , .
Can I Emoji? — iOS, Android Windows.

Unicode (diversity), . .

, , . — . :

	Recette
U+1F469 U+200D U+2764 U+FE0F U+200D U+1F469
U+1F468 U+200D U+1F468 U+200D U+1F467 U+200D U+1F466

, .

8.0 ( 2015 ) - . , ( , FitzpatrickSkinType.pdf). .

Unicode

Code	Le titre
U+1F3FB	-1-2
U+1F3FC	-3
U+1F3FD	-4
U+1F3FE	-5
U+1F3FF	-6

, \u{1F466}\u{1F3FE} .

+

→

JavaScript (ES6)

, ID_START , . , ID_CONTINUE , .

 // How convenient! var π = Math.PI; // Sometimes, you just have to use the Bad Parts of JavaScript: var ಠ_ಠ = eval; // Code, YU NO WORK?! var ლ_ಠ益ಠ_ლ = 42; // How about a JavaScript library for functional programming? var λ = function() {}; // Obfuscate boring variable names for great justice var \u006C\u006F\u006C\u0077\u0061\u0074 = 'heh'; // …or just make up random ones var Ꙭൽↈⴱ = 'huh'; // While perfectly valid, this doesn't work in most browsers: var foo\u200Cbar = 42; // This is *not* a bitwise left shift (`<<`): var 〱〱 = 2; // This is, though: 〱〱 << 〱〱; // 8 // Give yourself a discount: var price_9̶9̶_89 = 'cheap'; // Fun with Roman numerals var Ⅳ = 4; var Ⅴ = 5; Ⅳ + Ⅴ; // 9 // Cthulhu was here var Hͫ̆̒̐ͣ̊̄ͯ͗͏̵̗̻̰̠̬͝ͅE̴̷̬͎̱̘͇͍̾ͦ͊͒͊̓̓̐_̫̠̱̩̭̤͈̑̎̋ͮͩ̒͑̾͋͘Ç̳͕̯̭̱̲̣̠̜͋̍O̴̦̗̯̹̼ͭ̐ͨ̊̈͘͠M̶̝̠̭̭̤̻͓͑̓̊ͣͤ̎͟͠E̢̞̮̹͍̞̳̣ͣͪ͐̈T̡̯̳̭̜̠͕͌̈́̽̿ͤ̿̅̑Ḧ̱̱̺̰̳̹̘̰́̏ͪ̂̽͂̀͠ = 'Zalgo';

CSS .

 <!-- place this within the document head --> <meta charset="UTF-8" /> <!-- error message --> <div class="ಠ_ಠ">You do not have access to this page.</div> <!-- success message --> <div class="">Your changes have been saved successfully!</div>

 .ಠ_ಠ { border: 1px solid #f00; } . { background: lightgreen; }

HTML

HTML- , , .

, HTML .

 // U+1160 HANGUL JUNGSEONG FILLER transformAllTags('ᅠ'); // An actual HTML element node designed to look like a comment node, using the U+01C3 LATIN LETTER RETROFLEX CLICK // <ǃ-- name="viewport" content="width=device-width"></ǃ--> transformAllTags('ǃ--'); // or even <ᅠ⃝ transformAllTags('\u{1160}\u{20dd}'); // and for a bonus, all existing tag names will have each character ensquared. h⃞t⃞m⃞l⃞ transformAllTags(); function transformAllTags (newName){ // querySelectorAll doesn't actually return an array. Array.from(document.querySelectorAll('*')) .forEach(function(x){ transformTag(x, newName); }); } function wonky(str){ return str.split('').join('\u{20de}') + '\u{20de}'; } function transformTag(tagIdOrElem, tagType){ var elem = (tagIdOrElem instanceof HTMLElement) ? tagIdOrElem : document.getElementById(tagIdOrElem); if(!elem || !(elem instanceof HTMLElement))return; var children = elem.childNodes; var parent = elem.parentNode; var newNode = document.createElement(tagType||wonky(elem.tagName)); for(var a=0;a<elem.attributes.length;a++){ newNode.setAttribute(elem.attributes[a].nodeName, elem.attributes[a].value); } for(var i= 0,clen=children.length;i<clen;i++){ newNode.appendChild(children[0]); //0...always point to the first non-moved element } newNode.style.cssText = elem.style.cssText; parent.replaceChild(newNode,elem); }

 function testBegin(str){ try{ eval(`document.createElement( '${str}' );`) return true; } catch(e){ return false; } } function testContinue(str){ try{ eval(`document.createElement( 'a${str}' );`) return true; } catch(e){ return false; } }

 // Test if dashes can start an HTML Tag > testBegin('-') < false > testContinue('-') < true > testBegin('ᅠ-') // Prepend dash with U+1160 HANGUL JUNGSEONG FILLER < true

TrueType OpenType UTF-8, 65 535 . 1,1 UTF-8, .

256 .

, () (CJK). , , « ».

. 17- .

Le titre	À partir de		#
	U+0000	U+007F	128
— 1	U+0080	U+00FF	128
— A	U+0100	U+017F	128
— B	U+0180	U+024F	208
	U+0250	U+02AF	96
	U+02B0	U+02FF	80
	U+0300	U+036F	112
	U+0370	U+03FF	135
	U+0400	U+04FF	256
	U+0500	U+052F	48
	U+0530	U+058F	89
	U+0590	U+05FF	87
	U+0600	U+06FF	255
	U+0700	U+074F	77
	U+0750	U+077F	48
	U+0780	U+07BF	50
	U+07C0	U+07FF	59
	U+0800	U+083F	61
	U+0840	U+085F	29
— A	U+08A0	U+08FF	50
	U+0900	U+097F	128
	U+0980	U+09FF	93
	U+0A00	U+0A7F	79
	U+0A80	U+0AFF	85
	U+0B00	U+0B7F	90
	U+0B80	U+0BFF	72
	U+0C00	U+0C7F	96
	U+0C80	U+0CFF	87
	U+0D00	U+0D7F	100
	U+0D80	U+0DFF	90
	U+0E00	U+0E7F	87
	U+0E80	U+0EFF	67
	U+0F00	U+0FFF	211
	U+1000	U+109F	160
	U+10A0	U+10FF	88
	U+1100	U+11FF	256
	U+1200	U+137F	358
	U+1380	U+139F	26
	U+13A0	U+13FF	92
	U+1400	U+167F	640
	U+1680	U+169F	29
	U+16A0	U+16FF	89
	U+1700	U+171F	20
	U+1720	U+173F	23
	U+1740	U+175F	20
	U+1760	U+177F	18
	U+1780	U+17FF	114
	U+1800	U+18AF	156
	U+18B0	U+18FF	70
	U+1900	U+194F	68
	U+1950	U+197F	35
	U+1980	U+19DF	83
	U+19E0	U+19FF	32
	U+1A00	U+1A1F	30
	U+1A20	U+1AAF	127
	U+1AB0	U+1AFF	15
	U+1B00	U+1B7F	121
	U+1B80	U+1BBF	64
	U+1BC0	U+1BFF	56
	U+1C00	U+1C4F	74
-	U+1C50	U+1C7F	48
	U+1CC0	U+1CCF	8
	U+1CD0	U+1CFF	41
	U+1D00	U+1D7F	128
	U+1D80	U+1DBF	64
U+1DFF	U+1DC0	U+1DFF	58
	U+1E00	U+1EFF	256
	U+1F00	U+1FFF	233
	U+2000	U+206F	111
	U+2070	U+209F	42
	U+20A0	U+20CF	31
	U+20D0	U+20FF	33
	U+2100	U+214F	80
	U+2150	U+218F	60
	U+2190	U+21FF	112
	U+2200	U+22FF	256
	U+2300	U+23FF	251
	U+2400	U+243F	39
	U+2440	U+245F	11
	U+2460	U+24FF	160
	U+2500	U+257F	128
	U+2580	U+259F	32
	U+25A0	U+25FF	96
	U+2600	U+26FF	256
Dingbats	U+2700	U+27BF	192
— A	U+27C0	U+27EF	48
— A	U+27F0	U+27FF	16
	U+2800	U+28FF	256
— B	U+2900	U+297F	128
— B	U+2980	U+29FF	128
	U+2A00	U+2AFF	256
	U+2B00	U+2BFF	206
	U+2C00	U+2C5F	94
— C	U+2C60	U+2C7F	32
	U+2C80	U+2CFF	123
	U+2D00	U+2D2F	40
	U+2D30	U+2D7F	59
	U+2D80	U+2DDF	79
— A	U+2DE0	U+2DFF	32
	U+2E00	U+2E7F	67
	U+2E80	U+2EFF	115
	U+2F00	U+2FDF	214
	U+2FF0	U+2FFF	12
	U+3000	U+303F	64
	U+3040	U+309F	93
	U+30A0	U+30FF	96
	U+3100	U+312F	41
	U+3130	U+318F	94
	U+3190	U+319F	16
	U+31A0	U+31BF	27
	U+31C0	U+31EF	36
	U+31F0	U+31FF	16
	U+3200	U+32FF	254
	U+3300	U+33FF	256
— A	U+3400	U+4DBF	6191
« »	U+4DC0	U+4DFF	64
	U+4E00	U+9FFF	20941
	U+A000	U+A48F	1165
	U+A490	U+A4CF	55
	U+A4D0	U+A4FF	48
	U+A500	U+A63F	300
— B	U+A640	U+A69F	96
	U+A6A0	U+A6FF	88
	U+A700	U+A71F	32
— D	U+A720	U+A7FF	159
	U+A800	U+A82F	44
	U+A830	U+A83F	10
	U+A840	U+A87F	56
	U+A880	U+A8DF	81
	U+A8E0	U+A8FF	30
-	U+A900	U+A92F	48
	U+A930	U+A95F	37
— A	U+A960	U+A97F	29
	U+A980	U+A9DF	91
— B	U+A9E0	U+A9FF	31
	U+AA00	U+AA5F	83
— A	U+AA60	U+AA7F	32
-	U+AA80	U+AADF	72
	U+AAE0	U+AAFF	23
— A	U+AB00	U+AB2F	32
— E	U+AB30	U+AB6F	54
	U+AB70	U+ABBF	80
	U+ABC0	U+ABFF	56
	U+AC00	U+D7AF	2
— B	U+D7B0	U+D7FF	72
	U+D800	U+DB7F	2
	U+DB80	U+DBFF	2
	U+DC00	U+DFFF	2
	U+E000	U+F8FF	2
	U+F900	U+FAFF	472
	U+FB00	U+FB4F	58
— A	U+FB50	U+FDFF	643
	U+FE00	U+FE0F	16
	U+FE10	U+FE1F	10
	U+FE20	U+FE2F	16
	U+FE30	U+FE4F	32
	U+FE50	U+FE6F	26
— B	U+FE70	U+FEFF	141
	U+FF00	U+FFEF	225
	U+FFF0	U+FFFF	7
	U+10000	U+1007F	88
	U+10080	U+100FF	123
	U+10100	U+1013F	57
	U+10140	U+1018F	77
	U+10190	U+101CF	13
	U+101D0	U+101FF	46
	U+10280	U+1029F	29
	U+102A0	U+102DF	49
	U+102E0	U+102FF	28
	U+10300	U+1032F	36
	U+10330	U+1034F	27
	U+10350	U+1037F	43
	U+10380	U+1039F	31
	U+103A0	U+103DF	50
	U+10400	U+1044F	80
	U+10450	U+1047F	48
	U+10480	U+104AF	40
	U+10500	U+1052F	40
	U+10530	U+1056F	53
	U+10600	U+1077F	341
	U+10800	U+1083F	55
	U+10840	U+1085F	31
	U+10860	U+1087F	32
	U+10880	U+108AF	40
	U+108E0	U+108FF	26
	U+10900	U+1091F	29
	U+10920	U+1093F	27
	U+10980	U+1099F	32
	U+109A0	U+109FF	90
	U+10A00	U+10A5F	65
	U+10A60	U+10A7F	32
	U+10A80	U+10A9F	32
	U+10AC0	U+10AFF	51
	U+10B00	U+10B3F	61
	U+10B40	U+10B5F	30
	U+10B60	U+10B7F	27
	U+10B80	U+10BAF	29
	U+10C00	U+10C4F	73
	U+10C80	U+10CFF	108
	U+10E60	U+10E7F	31
	U+11000	U+1107F	109
	U+11080	U+110CF	66
-	U+110D0	U+110FF	35
	U+11100	U+1114F	67
	U+11150	U+1117F	39
	U+11180	U+111DF	94
	U+111E0	U+111FF	20
	U+11200	U+1124F	61
	U+11280	U+112AF	38
	U+112B0	U+112FF	69
	U+11300	U+1137F	85
	U+11480	U+114DF	82
	U+11580	U+115FF	92
	U+11600	U+1165F	79
	U+11680	U+116CF	66
	U+11700	U+1173F	57
-	U+118A0	U+118FF	84
	U+11AC0	U+11AFF	57
	U+12000	U+123FF	922
	U+12400	U+1247F	116
	U+12480	U+1254F	196
	U+13000	U+1342F	1071
	U+14400	U+1467F	583
	U+16800	U+16A3F	569
	U+16A40	U+16A6F	43
	U+16AD0	U+16AFF	36
	U+16B00	U+16B8F	127
	U+16F00	U+16F9F	133
	U+1B000	U+1B0FF	2
	U+1BC00	U+1BC9F	143
	U+1BCA0	U+1BCAF	4
	U+1D000	U+1D0FF	246
	U+1D100	U+1D1FF	231
	U+1D200	U+1D24F	70
« »	U+1D300	U+1D35F	87
	U+1D360	U+1D37F	18
	U+1D400	U+1D7FF	996
SignWriting	U+1D800	U+1DAAF	672
	U+1E800	U+1E8DF	213
	U+1EE00	U+1EEFF	143
	U+1F000	U+1F02F	44
	U+1F030	U+1F09F	100
	U+1F0A0	U+1F0FF	82
	U+1F100	U+1F1FF	173
	U+1F200	U+1F2FF	57
	U+1F300	U+1F5FF	766
	U+1F600	U+1F64F	80
	U+1F650	U+1F67F	48
	U+1F680	U+1F6FF	98
	U+1F700	U+1F77F	116
	U+1F780	U+1F7FF	85
— C	U+1F800	U+1F8FF	148
	U+1F900	U+1F9FF	15
— B	U+20000	U+2A6DF	42676
— C	U+2A700	U+2B73F	60
— D	U+2B740	U+2B81F	27
— E	U+2B820	U+2CEAF	2
	U+2F800	U+2FA1F	542
Balises	U+E0000	U+E007F	97
	U+E0100	U+E01EF	240
— A	U+F0000	U+FFFFF	4
— B	U+100000	U+10FFFF	4

— - .
— , .
— .
— , . .
, — , . , .
— , . , [Ä] [A] [¨].
— .
— , , . .
— , .
— .

: c codepoints.net .

11.0 ()
10.0 ( , 20.06.2017 .)
9.0
8.0
7.0
6.3
6.2
6.1
6.0
5.2
5.1
5.0 ()
4.0.1
4.0

Cet adorable Unicode