Aquí hay una lista actualizada de los "productos" Unicode más maravillosos, así como paquetes y recursos

¡Unicode es asombroso! Antes de su aparición, la comunicación internacional era agotadora: cada uno definía su propio conjunto de caracteres extendidos por separado en la mitad superior de ASCII (las llamadas páginas de códigos). Esto creó conflicto. Solo piense que los alemanes tuvieron que negociar con los coreanos, ¿dónde está la página de códigos? Afortunadamente, apareció Unicode e introdujo un estándar común. Unicode 8.0 cubre más de 120,000 caracteres de más de 129 scripts. Tanto moderno como antiguo, y aún no descifrado. Unicode admite texto de izquierda a derecha y de derecha a izquierda, superpone caracteres e incluye una variedad de símbolos culturales, políticos, religiosos y emojis. Unicode es increíblemente humano, y sus capacidades se subestiman enormemente.

Contenido

Breve introducción

¿Qué caracteres están incluidos en Unicode Standard?

El estándar Unicode define códigos para caracteres en los principales idiomas modernos. Estas son escrituras alfabéticas europeas, escrituras del Medio Oriente de derecha a izquierda y muchas escrituras asiáticas.

El estándar también contiene signos de puntuación, signos diacríticos, símbolos matemáticos, símbolos técnicos, flechas, dingbats, emojis, etc. Proporciona códigos para signos diacríticos que cambian los signos de caracteres, como tildes (~). Se usan en combinación con los básicos para representar caracteres acentuados (por ejemplo, ñ). En general, la versión 9.0 de Unicode proporciona códigos para 128,172 caracteres de alfabetos mundiales, conjuntos de ideogramas y colecciones de caracteres.

Los caracteres más comunes se colocan en los primeros puntos de código de 64K, un área del espacio de código llamado plano multilingüe principal, o BMP para abreviar. Hay otros dieciséis planos adicionales disponibles para codificar otros caracteres, con más de 850,000 puntos de código no utilizados. Pueden ser útiles para agregar nuevos personajes a futuras versiones del estándar.

El estándar Unicode también reserva puntos de código para uso privado. Los proveedores o usuarios finales pueden designarlos en sus propios sistemas para sus personajes o usarlos con fuentes especializadas. El BMP tiene 6400 puntos de código para uso privado y otros 131 068 puntos de código adicionales para uso privado, si 6400 no es suficiente para aplicaciones específicas.

Codificaciones de caracteres Unicode

Los estándares de codificación de caracteres determinan no solo la identidad de cada carácter y su valor numérico o punto de código, sino también cómo se representa este valor en bits.

El estándar Unicode define tres formas de codificación que permiten la transmisión de los mismos datos: un byte, una palabra y una palabra doble (es decir, 8, 16 o 32 bits por unidad de código). Las tres formas codifican el mismo conjunto de caracteres común y pueden convertirse efectivamente entre sí sin pérdida de datos. El Consorcio Unicode respalda completamente el uso de cualquiera de estos formularios de codificación como una forma acordada para implementar el Estándar Unicode.

UTF-8 es popular para HTML y protocolos similares. UTF-8 es una forma de convertir todos los caracteres Unicode a una codificación de longitud de bytes variable. Su ventaja es que los caracteres Unicode que corresponden al conjunto ASCII familiar tienen los mismos valores de bytes que ASCII, y los caracteres Unicode convertidos a UTF-8 se pueden usar con una gran cantidad de software existente sin grandes modificaciones de software.

UTF-16 es popular en muchos entornos donde es necesario equilibrar el acceso eficiente a los personajes con un almacenamiento económico. Es bastante compacto, y todos los caracteres de uso frecuente se colocan en un bloque de código de 16 bits, mientras que todos los demás caracteres están disponibles a través de pares de bloques de código de 16 bits.

UTF-32 es útil cuando la cantidad de memoria no es una preocupación, pero requiere acceso a caracteres en un único código de ancho fijo. Aquí, cada carácter Unicode está codificado en un solo bloque de código de 32 bits.

Las tres formas de codificación requieren no más de 4 bytes (o 32 bits) para cada carácter.

Hablar sobre números

El conjunto de caracteres Unicode se divide en 17 segmentos principales (planos), que se dividen en bloques. En cada plano hay un lugar para 65 536 (2 ¹⁶ ) puntos de código, lo que crea un total de 1,114,112 puntos de código. Hay dos "aviones de uso privado" (No. 16 y No. 17) que se asignan para su uso a discreción de las empresas / usuarios. Tienen 131.072 puntos de código.

No	Titulo	Alcance
1)	Avión multilingüe principal	(de U + 0000 a U + FFFF)
2)	Avión multilingüe adicional	(de U + 10000 a U + 1FFFF)
3)	Plano ideográfico adicional	(de U + 20,000 a U + 2FFFF)
4)	Plano ideográfico terciario	(de U + 30000 a U + 3FFFF)
5)	Plano 5 (no utilizado)	(de U + 40,000 a U + 4FFFF)
6)	Plano 6 (no utilizado)	(de U + 50,000 a U + 5FFFF)
7)	Plano 7 (no utilizado)	(de U + 60,000 a U + 6FFFF)
8)	Plano 8 (no utilizado)	(de U + 70,000 a U + 7FFFF)
9)	Avión 9 (no utilizado)	(de U + 80,000 a U + 8FFFF)
10)	Plano 10 (no utilizado)	(de U + 90,000 a U + 9FFFF)
11)	Plano 11 (no utilizado)	(de U + A0000 a U + AFFFF)
12)	Plano 12 (no utilizado)	(de U + B0000 a U + BFFFF)
13)	Plano 13 (no utilizado)	(de U + C0000 a U + CFFFF)
14)	Plano 14 (no utilizado)	(de U + D0000 a U + DFFFF)
15)	Avión adicional especializado	(de U + E0000 a U + EFFFF)
16)	Área adicional para uso privado - A	(de U + F0000 a U + FFFFF)
17)	Área adicional para uso privado - B	(de U + 100000 a U + 10FFFF)

El primer plano se llama plano multilingüe principal o BMP. Contiene puntos de código de U + 0000 a U + FFFF, es decir, los caracteres más utilizados. Los dieciséis planos restantes (U + 010000 → U + 10FFFF) se denominan adicionales o astrales.

Pares sustitutos UTF-16

Los símbolos fuera del plano principal, como un tetragrammaton que significa el centro (U + 1D306), se pueden codificar en UTF-16 con solo dos unidades de código de 16 bits: 0xD834 0xDF06. Esto se llama un par sustituto. Tenga en cuenta que un par sustituto representa solo un personaje.

La primera unidad de código de un par sustituto siempre está en el rango de 0xD800 a 0xDBFF y se llama la parte superior del par.

La segunda unidad de código del par sustituto siempre está en el rango de 0xDC00 a 0xDFFF y se llama la parte inferior del par.

Matthias Binens

Par sustituto: una representación de un símbolo abstracto, que consiste en una secuencia de dos unidades de código de 16 bits, donde el primer valor del par es la unidad de código sustituto superior y el segundo es la unidad de código sustituto inferior. Los pares sustitutos se usan solo en UTF-16.

Unicode 8.0 Capítulo 3.8 - Sustitutos

Cálculo de pares sustitutos

El carácter Unicode "Montón de mierda" (U + 1F4A9) en UTF-16 tendrá que codificarse como un par sustituto, es decir, dos sustitutos. Para convertir cualquier punto de código en un par sustituto, use este algoritmo (en JavaScript). Tenga en cuenta que usamos la notación hexadecimal.

var High_Surrogate = function(Code_Point){ return Math.floor((Code_Point - 0x10000) / 0x400) + 0xD800 }; var Low_Surrogate = function(Code_Point){ return (Code_Point - 0x10000) % 0x400 + 0xDC00 }; // Reverses The Conversion var Code_Point = function(High_Surrogate, Low_Surrogate){ return (High_Surrogate - 0xD800) * 0x400 + Low_Surrogate - 0xDC00 + 0x10000; };

Composición y descomposición.

Unicode incluye un mecanismo para cambiar la forma de un personaje, que amplía enormemente el conjunto de glifos admitidos. Esto se aplica a los diacríticos combinables. Se insertan después del personaje principal. Se pueden aplicar múltiples marcas diacríticas a la misma marca. Unicode también contiene versiones precompiladas de la mayoría de estas combinaciones para uso normal.

Algunas secuencias de caracteres también se pueden representar como un solo carácter llamado carácter precompuesto, también conocido como carácter compuesto. Por ejemplo, el carácter [ü] puede codificarse como el único punto de código U + 00FC o como el carácter base U + 0075 (u), seguido del carácter no autónomo U + 0308 (¨). El estándar Unicode codifica caracteres compuestos para compatibilidad con estándares establecidos, como Latin 1, que incluye muchos caracteres compuestos, como [ü] y [ñ].

Los caracteres compuestos se pueden expandir para lograr consistencia o análisis. Por ejemplo, cuando se ordena alfabéticamente, el símbolo [ü] se puede descomponer en [u] seguido del símbolo no independiente [¨]. Después de tal descomposición, el algoritmo es más fácil de trabajar con una secuencia de caracteres. Esto facilita la clasificación en idiomas donde los modificadores de caracteres no afectan el orden alfabético. El estándar Unicode establece el orden de descomposición para todos los caracteres compuestos. También define formas de normalización para proporcionar representaciones únicas de personajes.

Mitos Unicode

De las diapositivas de la presentación de Mark Davis "Mitos de Unicode" .

Unicode es solo un código de 16 bits . - Algunas personas creen erróneamente que Unicode es solo un código de 16 bits, en el que cada carácter ocupa 16 bits y, por lo tanto, hay 65.536 caracteres posibles. De hecho, esto no es del todo cierto. Este es el mito más común de Unicode, así que si también lo pensaste antes, no te desanimes.
Puede tomar cualquier punto de código que no se use para sus necesidades . - No Algún día este lugar será reemplazado por otro símbolo. En su lugar, use planos para uso privado o áreas sin caracteres en cada plano donde no habrá caracteres por estándar.
Cada punto de código Unicode representa un carácter . - No Hay muchos puntos sin caracteres (FFFE, FFFF, 1FFFE, etc.) Además, puntos de código sustitutos, puntos de código privados y no utilizados, así como "caracteres" de control / formato (RLM, ZWNJ, etc.)
Unicode se queda sin espacio . - Si se llenara linealmente, habría terminado en 2140. Pero el lugar no se llena linealmente. Planes futuros ver aquí .
Todos los personajes se corresponden uno a uno . - No Las opciones son:
- Uno a muchos: (β → SS)
- Dado el contexto: (... Σ ← → ... ς y al mismo tiempo ... ΣΤ ... ← → ... στ ...)
- Según la configuración regional: (I ← → ı y al mismo tiempo İ ← → i)

Codificaciones de aplicación Unicode

Tipo de codificación	Ejemplo
Objeto HTML (decimal)
Objeto HTML (hexadecimal)
Código de control de URL	% F0% 9F% 96% 96
UTF-8 (hex)	0xF0 0x9F 0x96 0x96 (f09f9696)
UTF-8 (binario)	11110000: 10011111: 10010110: 10010110
UTF-16 / UTF-16BE (hex)	0xD83D 0xDD96 (d83ddd96)
UTF-16LE (hex)	0x3DD8 0x96DD (3dd896dd)
UTF-32 / UTF-32BE (hex)	0x0001F596 (0001f596)
UTF-32LE (hex)	0x96F50100 (96f50100)
Secuencia de escape octal	\ 360 \ 237 \ 226 \ 226

Código fuente

Tipo de codificación	Ejemplo
Javascript	\ u1F596
Json	\ u1F596
C	\ u1F596
C ++	\ u1F596
Java	\ u1F596
Pitón	\ u1F596
Perl	\ x {1F596}
Rubí	\ u {1F596}
CSS	\ 01F596

Lista de personajes increíbles.

Compartir un documento puede convertir rápidamente la edición en una batalla de rap escrita, librada por un acuerdo cada vez más confuso de gerentes de U + 202a a U + 202e

Personajes especiales

El Consorcio Unicode ha publicado un diagrama de puntuación general donde puede encontrar más información.

Símbolo	Titulo	Descripción
`''`	U + FEFF Espacio sin ruptura de ancho cero (Marca de orden de bytes - BOM)	Tiene una propiedad importante de unicidad al cambiar el orden de los bytes. También tiene ancho cero e invisibilidad. En un software inapropiado (como un intérprete PHP), esto lleva a todo tipo de ejemplos de comportamiento divertido.
`'￯'`	Lista de materiales inversa '\ uFFEF'	No equivale a un personaje, excepto por el comienzo del texto.
`''`	'\ u200B' Espacio sin ruptura de ancho cero	Un símbolo sin apariencia y sin efecto, excepto para evitar la formación de ligaduras.
`' '`	U + 00A0 Espacio sin ruptura	Hace que los personajes adyacentes se mantengan unidos. Bien conocido como ` ` en HTML
`''`	U + 00AD Guión suave	En HTML, funciona como un espacio de ancho cero, pero cuando encuentra el final de una línea (y solo en este caso) muestra un guión.
`'‍'`	U + 200D Señal de ancho cero (con unión)	Hace que los caracteres vecinos se conecten (por ejemplo, caracteres árabes o emojis compatibles). Se puede usar para emojis combinados secuencialmente.
`'⁠'`	U + 2060 Word Connector	Igual que U + 00A0, pero completamente invisible. Bueno para @ font-face en Twitter.
`' '`	U + 1680 personaje espacial Ogham	Marca un espacio que parece un guión. Ideal para acercar a los programadores a la locura: 1 + 2 === 3.
`';'`	U + 037E Signo de interrogación griego	Parece un punto y coma. También es una forma divertida de engañar a los desarrolladores.
`'‭'`	U + 202D	Cambia la dirección del texto de izquierda a derecha.
`'‮'`	U + 202E	Cambia la dirección del texto de derecha a izquierda.
`'ꓸ'`	U + A4F8 Lisu tono de letra mya ti	Doble por el punto.
`'ꓹ'`	U + A4F9 Lisu tono de letra na po	Doble por una coma.
`'ꓼ'`	Tono de letra U + A4FC Lisu mya na	Doble para punto y coma.
`'ꓽ'`	U + A4FD Lisu tono de letra mya jeu	Doble para el colon.
`'︀'`	Selectores de opciones (de U + FE00 a U + FE0F y de U + E0100 a U + E01EF)	Un bloque de 256 caracteres de ancho cero que tiene la propiedad ID_Continue, es decir, se puede usar en nombres de variables (no en la primera letra). Lo que los hace especiales es que el cursor del mouse pasa sobre ellos, porque combinan caracteres, a diferencia de la mayoría de los otros caracteres de ancho cero.
`'ᅟ'`	U + 115F Marcador de posición Hangul Choson	Esencialmente llena el espacio. Representado como un carácter de ancho cero (invisible) a menos que sea explícitamente compatible en la representación. Marcado como ID_Start
`'ᅠ'`	U + 1160 Marcador de posición Chunson	Quizás llena el espacio? Representado como un carácter de ancho cero (invisible) a menos que sea explícitamente compatible en la representación. Marcado como ID_Start
`'ㅤ'`	U + 3164 agregado Hangul	En general, llena el espacio. Representado como un carácter de ancho cero (invisible) a menos que sea explícitamente compatible en la representación. Marcado como ID_Start

Espera ... ¿qué acabo de leer?

¡Los identificadores variables pueden incluir espacios!

El marcador de posición Hangul U + 3164 se muestra como un espacio amplio. Si el carácter claramente no se admite en la representación , se muestra como completamente invisible (y no ocupa espacio, es decir, "ancho cero"). Esto significa que nunca verá un personaje de reemplazo de personaje feo ( ).

Todavía no estoy seguro de por qué U + 3164 tiene instrucciones de comportarse de esta manera. Curiosamente, U + 3164 se agregó a Unicode en la versión 1.1 (1993), por lo que los especialistas del Consorcio tuvieron mucho tiempo para pensarlo. De todos modos, aquí hay algunos ejemplos.

 > var ᅟ = 'foo'; undefined > ᅟ 'foo' > var ㅤ= alert; undefined > var foo = 'bar' undefined > if ( foo ===ㅤ`baz` ){} // alert undefined > var varㅤfooㅤ\u{A60C}ㅤπ = 'bar'; undefined > varㅤfooㅤꘌㅤπ 'bar'

** Nota: ** Probé el renderizado U + 3164 en Ubuntu y OS X con los siguientes parámetros: `node`,` php`, `ruby`,` python3.5`, `scala`,` vim`, `cat` , `chrome` +` github gist '. Atom es el único sistema que falla al mostrar (incorrectamente) campos vacíos. Todavía tengo que verificar el código en Emacs y Sublime. Según tengo entendido, el Consorcio Unicode no reasignará ni cambiará el nombre de los caracteres o puntos de código, pero puede ser persuadido para cambiar las propiedades de los caracteres como ID_Start e ID_Continue.

Modificadores

Zero Width Combiner (ZWJ) es un carácter no imprimible en un conjunto de computadora de algunas fuentes complejas, como el árabe o cualquier fuente india. Cuando se coloca entre dos caracteres que de otro modo no estarían conectados, ZWJ los obliga a imprimir en forma combinada.

El seccionador de ancho cero (ZWNJ) es un carácter no imprimible en conjuntos de escritura basados en computadora con ligaduras. Cuando se coloca entre dos caracteres que de otro modo se unirían en una ligadura, ZWNJ los obliga a imprimir en sus formas final y original, respectivamente. Actúa como un espacio, pero se usa cuando es deseable mantener las palabras cercanas entre sí o combinar una palabra con su morfema.

 > 'a' "a" > 'a\u{0308}' "ä" > 'a\u{20DE}\u{0308}' "a⃞̈" > 'a\u{20DE}\u{0308}\u{20DD}' "a⃞̈⃝" // Modifying Invisible Characters > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}' "‎‎‎‎‎‎‎‎‎‎" > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}'.length 10

Colisiones de transformación en mayúsculas

Símbolo	Punto de código	Resultado
ß	0x00DF	`SS`
ı	0x0131	`I`
ſ	0x017F	`S`
ﬀ	0xFB00	`FF`
fi	0xFB01	`FI`
ﬂ	0xFB02	`FL`
ﬃ	0xFB03	`FFI`
ﬄ	0xFB04	`FFL`
ﬅ	0xFB05	`ST`
ﬆ	0xFB06	`ST`

Colisiones minúsculas de conversión

Símbolo	Punto de código	Resultado
K	0x212A	`k`

Quirks y resolución de problemas

La longitud de la línea generalmente está determinada por el número de puntos de código . Esto significa que los pares sustitutos se considerarán dos caracteres. Se pueden superponer varios signos diacríticos en un símbolo: a + ̈ == ̈a . Esto aumenta la longitud de la cadena, produciendo solo un carácter.
Del mismo modo, la inversión de cadenas a menudo se convierte en una tarea no trivial . Nuevamente, los pares sustitutos y los signos diacríticos deben invertirse juntos. ES Reverser ofrece una solución bastante buena.

Las comparaciones en mayúsculas y minúsculas no siempre coinciden . Se pueden expresar en tales relaciones:

Uno a muchos: (ß → SS)
Dado el contexto: (... Σ ← → ... ς y ... ΣΤ ... ← → ... στ ...)
Según la configuración regional: (I ← → ı e İ ← → i)

Una a muchas comparaciones

La mayoría de los caracteres a continuación expresan sus asignaciones de uno a muchos en mayúsculas y otros en minúsculas. En principio, la lista se puede dividir en dos partes.

Punto de código	Símbolo	Titulo	Carácter asociado	Puntos de código asociado
U + 00DF	`ß`	Escet en minúscula latina (S aguda)	`s` , `s`	U + 0073, U + 0073
U + 0130	`İ`	Letra mayúscula latina "I" con un punto arriba	`i` , `̇`	U + 0069, U + 0307
U + 0149	`ŉ`	Letra minúscula latina "n" por el apóstrofe anterior	`ʼ` , `n`	U + 02BC, U + 006E
U + 01F0	`ǰ`	Letra minúscula latina j	`j` , `̌`	U + 006A, U + 030C
U + 0390	`ΐ`	Iota griega minúscula con diálisis y tonos.	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 03B0	`ΰ`	Letra minúscula griega ipsilon con diálisis y tonos.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 0587	`և`	Ligadura minúscula armenia ech yiwn	`ե` , `ւ`	U + 0565, U + 0582
U + 1E96	`ẖ`	Letra h minúscula latina con una línea debajo	`h`	U + 0068, U + 0331
U + 1E97	`ẗ`	Letra latina minúscula t con diéresis	`t` , `̈`	U + 0074, U + 0308
U + 1E98	`ẘ`	Letra minúscula latina w con anillo arriba	`w` , `̊`	U + 0077, U + 030A
U + 1E99	`ẙ`	Letra latina minúscula y con anillo arriba	`y` , `̊`	U + 0079, U + 030A
U + 1E9A	`ẚ`	Letra latina minúscula a con la mitad derecha del anillo	`a` , `ʾ`	U + 0061, U + 02BE
U + 1E9E	`ẞ`	Letra mayúscula latina aguda	`s` , `s`	U + 0073, U + 0073
U + 1F50	`ὐ`	Letra minúscula griega ipsilon con psil	`υ` , `̓`	U + 03C5, U + 0313
U + 1F52	`ὒ`	Letra minúscula griega ipsilon con psili y varia	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0300
U + 1F54	`ὔ`	Letra minúscula griega ipsilon con psily y oxy	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0301
U + 1F56	`ὖ`	Letra minúscula griega ipsilon con psily y perisome	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0342
U + 1F80	`ᾀ`	Letra minúscula griega alfa con psili y ipogemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F81	`ᾁ`	Letra minúscula griega alfa con dasia y ipogemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F82	`ᾂ`	Letra minúscula griega alfa con psilia y varia y ipogemen	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F83	`ᾃ`	Letra minúscula griega alfa con dasia y varia y ipogemen	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F84	`ᾄ`	Letra minúscula griega alfa con psily y oxy y ipogemen	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F85	`ᾅ`	Letra minúscula griega alfa con dasia y oxy y ipogemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F86	`ᾆ`	Letra minúscula griega alfa con psily y perispomenti e ipogemen	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F87	`ᾇ`	Letra minúscula griega alfa con dasia y perispomenti e hypogrammen	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F88	`ᾈ`	Letra mayúscula griega alfa con psil y programmemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F89	`ᾉ`	Letra mayúscula griega alfa con dasia y programmemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F8A	`ᾊ`	Letra mayúscula griega alfa con psilia y varia y programas	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F8B	`ᾋ`	Letra mayúscula griega alfa con dasia y varia y prog	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F8C	`ᾌ`	Letra mayúscula griega alfa con psily y oxy y prog	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F8D	`ᾍ`	Letra mayúscula griega alfa con dasia y oxy y programmemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F8E	`ᾎ`	Letra mayúscula griega alfa con psily y perispomenti y programmemeny	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F8F	`ᾏ`	Letra mayúscula griega alfa con dasia y perispomenti y progs	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F90	`ᾐ`	Letra minúscula griega esto con psily y ipogemen	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F91	`ᾑ`	Letra minúscula griega a con dasia y ipogemen	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F92	`ᾒ`	Letra minúscula griega esto con psilia y varia e ipogemen	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F93	`ᾓ`	Letra minúscula griega eta con dasia y varia e ipogemen	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F94	`ᾔ`	Letra minúscula griega a con psilia y oksia e ipogemen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F95	`ᾕ`	Letra minúscula griega eta con dasia y oksia e ipogemen	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F96	`ᾖ`	Letra minúscula griega esto con psily y perispomenti e ipogemen	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F97	`ᾗ`	Letra minúscula griega eta con dasia y perisopmenti e hypogrammen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1F98	`ᾘ`	Letra mayúscula griega esto con psila y programas	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F99	`ᾙ`	Letra mayúscula griega esto con dasia y programadores	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F9A	`ᾚ`	Letra mayúscula griega esto con psilia y varia y prosgrammemeny	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F9B	`ᾛ`	Letra mayúscula griega esto con dasia y varia y prosgrammemeny	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F9C	`ᾜ`	Letra mayúscula griega con psilia y oxi y programadores	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F9D	`ᾝ`	Letra mayúscula griega esto con dasia y oksia y programadores	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F9E	`ᾞ`	Letra mayúscula griega esto con psily y perispomenty y prosgrammeny	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F9F	`ᾟ`	Letra mayúscula griega esto con dasia y perispomenti y programadores	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1FA0	`ᾠ`	Letra griega minúscula omega con psili y ipogemen	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA1	`ᾡ`	Letra griega minúscula omega con dasia y ipogemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FA2	`ᾢ`	Letra griega minúscula omega con psilia y varia e ipogemen	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FA3	`ᾣ`	Letra griega minúscula omega con dasia y varia e ipogemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FA4	`ᾤ`	Letra griega minúscula omega con psily y oxy y ipogemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FA5	`ᾥ`	Letra griega minúscula omega con dasia y oxi y ipogemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FA6	`ᾦ`	Letra griega minúscula omega con psily y perispomenti e ipogemen	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FA7	`ᾧ`	Letra griega minúscula omega con dasia y perispomenti e hipogrammemen	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FA8	`ᾨ`	Letra mayúscula griega omega con psili y programa	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA9	`ᾩ`	Letra mayúscula griega Omega con dasia y programmemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FAA	`ᾪ`	Letra mayúscula griega omega con psilia y varia y prosgrammemeny	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FAB	`ᾫ`	Letra mayúscula griega Omega con dasia y varia y programmemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FAC	`ᾬ`	Letra mayúscula griega omega con psilia y oxi y progamemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FAD	`ᾭ`	Letra mayúscula griega omega con dasia y oksia y programmemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FAE	`ᾮ`	Letra mayúscula griega omega con psily y perispomenti y prosgrammemeny	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FAF	`ᾯ`	Letra mayúscula griega omega con dasia y perispomenti y prosgrammemeny	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FB2	`ᾲ`	Letra griega minúscula alfa con varia y ipogemen	`ὰ` , `ι`	U + 1F70, U + 03B9
U + 1FB3	`ᾳ`	Letra minúscula griega alfa con ogogerammeni	`α` , `ι`	U + 03B1, U + 03B9
U + 1FB4	`ᾴ`	Letra griega minúscula alfa con oxi y ipogemen	`ά` , `ι`	U + 03AC, U + 03B9
U + 1FB6	`ᾶ`	Letra minúscula griega alfa con perispomenti	`α` ,	U + 03B1, U + 0342
U + 1FB7	`ᾷ`	Letra minúscula griega alfa con perispomenti e ipogemen	`α` , `͂` `ι`	U + 03B1, U + 0342, U + 03B9
U + 1FBC	`ᾼ`	Letra mayúscula griega alfa con progs	`α` , `ι`	U + 03B1, U + 03B9
U + 1FC2	`ῂ`	Letra griega minúscula et con varia y ipogemen	`ὴ` , `ι`	U + 1F74, U + 03B9
U + 1FC3	`ῃ`	Letra minúscula griega a con ipogemen	`η` , `ι`	U + 03B7, U + 03B9
U + 1FC4	`ῄ`	Letra griega minúscula eta con oxi y ipogemen	`ή` , `ι`	U + 03AE, U + 03B9
U + 1FC6	`ῆ`	Letra minúscula griega a con perispomenti	`η` ,	U + 03B7, U + 0342
U + 1FC7	`ῇ`	Letra minúscula griega a con perispomenti e ipogemen	`η` , `͂` `ι`	U + 03B7, U + 0342, U + 03B9
U + 1FCC	`ῌ`	Letra mayúscula griega esto con prog	`η` , `ι`	U + 03B7, U + 03B9
U + 1FD2	`ῒ`	Iota minúscula griega con diálisis y varia	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0300
U + 1FD3	`ΐ`	Iota minúscula griega con diálisis y oxi	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 1FD6	`ῖ`	Iota minúscula griega con perispomenti	`ι` ,	U + 03B9, U + 0342
U + 1FD7	`ῗ`	Iota griega minúscula con diálisis y período	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0342
U + 1FE2	`ῢ`	Letra minúscula griega ipsilon con diálisis y varia.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0300
U + 1FE3	`ΰ`	Letra minúscula griega ipsilon con diálisis y oxi.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 1FE4	`ῤ`	Griego minúscula rho con psili	`ρ` , `̓`	U + 03C1, U + 0313
U + 1FE6	`ῦ`	Letra minúscula griega ipsilon con perispomenti	`υ` ,	U + 03C5, U + 0342
U + 1FE7	`ῧ`	Letra minúscula griega ipsilon con diálisis y período	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0342
U + 1FF2	`ῲ`	Letra griega minúscula omega con varia e ipogemen	`ὼ` , `ι`	U + 1F7C, U + 03B9
U + 1FF3	`ῳ`	Letra griega minúscula omega con ogogerammeni	`ω` , `ι`	U + 03C9, U + 03B9
U + 1FF4	`ῴ`	Letra griega minúscula omega con oxia y ipogemen	`ώ` , `ι`	U + 03CE, U + 03B9
U + 1FF6	`ῶ`	Letra griega minúscula omega con perispomenti	`ω` ,	U + 03C9, U + 0342
U + 1FF7	`ῷ`	Letra griega minúscula omega con perispomenti e ipogemen	`ω` , `͂` `ι`	U + 03C9, U + 0342, U + 03B9
U + 1FFC	`ῼ`	Letra mayúscula griega Omega con programa	`ω` , `ι`	U + 03C9, U + 03B9
U + FB00	`ﬀ`	Ligadura en minúscula latina Ff	`f` `f`	U + 0066, U + 0066
U + FB01	`ﬁ`	Ligadura en minúscula latina Fi	`f` , `i`	U + 0066, U + 0069
U + FB02	`ﬂ`	Ligadura latina minúscula Fl	`f` `l`	U + 0066, U + 006C
U + FB03	`ﬃ`	Ligadura latina minúscula Ffi	`f` , `f` , `i`	U + 0066, U + 0066, U + 0069
U + FB04	`ﬄ`	Ligadura en minúscula latina Ffl	`f` , `f` , `l`	U + 0066, U + 0066, U + 006C
U + FB05	`ﬅ`	Latina ligadura minúscula larga ST	`s` , `t`	U + 0073, U + 0074
U + FB06	`ﬆ`	Ligadura latina minúscula St	`s` , `t`	U + 0073, U + 0074
U + FB13	`ﬓ`	Ligadura minúscula armenia Men Now	`մ` , `ն`	U + 0574, U + 0576
U + FB14	`ﬔ`	Ligadura minúscula armenia Hombres Ech	`մ` , `ե`	U + 0574, U + 0565
U + FB15	`ﬕ`	Ligadura minúscula armenia Hombres Ini	`մ` , `ի`	U + 0574, U + 056B
U + FB16	`ﬖ`	Ligadura minúscula armenia Vew Now	`վ` , `ն`	U + 057E, U + 0576
U + FB17	`ﬗ`	Ligadura minúscula armenia Hombres Xeh	`մ` , `խ`	U + 0574, U + 056D

Grandes paquetes y bibliotecas

PhantomScript -: ghost :: flashlight: ejecutando JavaScript invisible e ingeniería social
ESReverser : manejo de cadenas JavaScript basado en Unicode .
mimic - Mal uso de Unicode
python-ftfy : intenta crear la representación máxima correcta y completa del texto recibido en Unicode.
vim-troll-stopper : protege tu código de los trolls Unicode.

Emoji

Gráfico de Emoji del Consorcio Unicode
Emojipedia - Información sobre un emoji específico, blog de noticias.
emojitracker — Twitter.
World Translation Foundation — , , .
Can I Emoji? — iOS, Android Windows.

Unicode (diversity), . .

, , . — . :


U+1F469 U+200D U+2764 U+FE0F U+200D U+1F469
U+1F468 U+200D U+1F468 U+200D U+1F467 U+200D U+1F466

, .

8.0 ( 2015 ) - . , ( , FitzpatrickSkinType.pdf). .

Unicode

Código	Titulo
U+1F3FB	-1-2
U+1F3FC	-3
U+1F3FD	-4
U+1F3FE	-5
U+1F3FF	-6

, \u{1F466}\u{1F3FE} .

+

→

JavaScript (ES6)

, ID_START , . , ID_CONTINUE , .

 // How convenient! var π = Math.PI; // Sometimes, you just have to use the Bad Parts of JavaScript: var ಠ_ಠ = eval; // Code, YU NO WORK?! var ლ_ಠ益ಠ_ლ = 42; // How about a JavaScript library for functional programming? var λ = function() {}; // Obfuscate boring variable names for great justice var \u006C\u006F\u006C\u0077\u0061\u0074 = 'heh'; // …or just make up random ones var Ꙭൽↈⴱ = 'huh'; // While perfectly valid, this doesn't work in most browsers: var foo\u200Cbar = 42; // This is *not* a bitwise left shift (`<<`): var 〱〱 = 2; // This is, though: 〱〱 << 〱〱; // 8 // Give yourself a discount: var price_9̶9̶_89 = 'cheap'; // Fun with Roman numerals var Ⅳ = 4; var Ⅴ = 5; Ⅳ + Ⅴ; // 9 // Cthulhu was here var Hͫ̆̒̐ͣ̊̄ͯ͗͏̵̗̻̰̠̬͝ͅE̴̷̬͎̱̘͇͍̾ͦ͊͒͊̓̓̐_̫̠̱̩̭̤͈̑̎̋ͮͩ̒͑̾͋͘Ç̳͕̯̭̱̲̣̠̜͋̍O̴̦̗̯̹̼ͭ̐ͨ̊̈͘͠M̶̝̠̭̭̤̻͓͑̓̊ͣͤ̎͟͠E̢̞̮̹͍̞̳̣ͣͪ͐̈T̡̯̳̭̜̠͕͌̈́̽̿ͤ̿̅̑Ḧ̱̱̺̰̳̹̘̰́̏ͪ̂̽͂̀͠ = 'Zalgo';

CSS .

 <!-- place this within the document head --> <meta charset="UTF-8" /> <!-- error message --> <div class="ಠ_ಠ">You do not have access to this page.</div> <!-- success message --> <div class="">Your changes have been saved successfully!</div>

 .ಠ_ಠ { border: 1px solid #f00; } . { background: lightgreen; }

HTML

HTML- , , .

, HTML .

 // U+1160 HANGUL JUNGSEONG FILLER transformAllTags('ᅠ'); // An actual HTML element node designed to look like a comment node, using the U+01C3 LATIN LETTER RETROFLEX CLICK // <ǃ-- name="viewport" content="width=device-width"></ǃ--> transformAllTags('ǃ--'); // or even <ᅠ⃝ transformAllTags('\u{1160}\u{20dd}'); // and for a bonus, all existing tag names will have each character ensquared. h⃞t⃞m⃞l⃞ transformAllTags(); function transformAllTags (newName){ // querySelectorAll doesn't actually return an array. Array.from(document.querySelectorAll('*')) .forEach(function(x){ transformTag(x, newName); }); } function wonky(str){ return str.split('').join('\u{20de}') + '\u{20de}'; } function transformTag(tagIdOrElem, tagType){ var elem = (tagIdOrElem instanceof HTMLElement) ? tagIdOrElem : document.getElementById(tagIdOrElem); if(!elem || !(elem instanceof HTMLElement))return; var children = elem.childNodes; var parent = elem.parentNode; var newNode = document.createElement(tagType||wonky(elem.tagName)); for(var a=0;a<elem.attributes.length;a++){ newNode.setAttribute(elem.attributes[a].nodeName, elem.attributes[a].value); } for(var i= 0,clen=children.length;i<clen;i++){ newNode.appendChild(children[0]); //0...always point to the first non-moved element } newNode.style.cssText = elem.style.cssText; parent.replaceChild(newNode,elem); }

 function testBegin(str){ try{ eval(`document.createElement( '${str}' );`) return true; } catch(e){ return false; } } function testContinue(str){ try{ eval(`document.createElement( 'a${str}' );`) return true; } catch(e){ return false; } }

 // Test if dashes can start an HTML Tag > testBegin('-') < false > testContinue('-') < true > testBegin('ᅠ-') // Prepend dash with U+1160 HANGUL JUNGSEONG FILLER < true

TrueType OpenType UTF-8, 65 535 . 1,1 UTF-8, .

256 .

, () (CJK). , , « ».

. 17- .

Titulo			#
	U+0000	U+007F	128
— 1	U+0080	U+00FF	128
— A	U+0100	U+017F	128
— B	U+0180	U+024F	208
	U+0250	U+02AF	96
	U+02B0	U+02FF	80
	U+0300	U+036F	112
	U+0370	U+03FF	135
	U+0400	U+04FF	256
	U+0500	U+052F	48
	U+0530	U+058F	89
	U+0590	U+05FF	87
	U+0600	U+06FF	255
	U+0700	U+074F	77
	U+0750	U+077F	48
	U+0780	U+07BF	50
	U+07C0	U+07FF	59
	U+0800	U+083F	61
	U+0840	U+085F	29
— A	U+08A0	U+08FF	50
	U+0900	U+097F	128
	U+0980	U+09FF	93
	U+0A00	U+0A7F	79
	U+0A80	U+0AFF	85
	U+0B00	U+0B7F	90
	U+0B80	U+0BFF	72
	U+0C00	U+0C7F	96
	U+0C80	U+0CFF	87
	U+0D00	U+0D7F	100
	U+0D80	U+0DFF	90
	U+0E00	U+0E7F	87
	U+0E80	U+0EFF	67
	U+0F00	U+0FFF	211
	U+1000	U+109F	160
	U+10A0	U+10FF	88
	U+1100	U+11FF	256
	U+1200	U+137F	358
	U+1380	U+139F	26
	U+13A0	U+13FF	92
	U+1400	U+167F	640
	U+1680	U+169F	29
	U+16A0	U+16FF	89
	U+1700	U+171F	20
	U+1720	U+173F	23
	U+1740	U+175F	20
	U+1760	U+177F	18 años
	U+1780	U+17FF	114
	U+1800	U+18AF	156
	U+18B0	U+18FF	70
	U+1900	U+194F	68
	U+1950	U+197F	35
	U+1980	U+19DF	83
	U+19E0	U+19FF	32
	U+1A00	U+1A1F	30
	U+1A20	U+1AAF	127
	U+1AB0	U+1AFF	15
	U+1B00	U+1B7F	121
	U+1B80	U+1BBF	64
	U+1BC0	U+1BFF	56
	U+1C00	U+1C4F	74
-	U+1C50	U+1C7F	48
	U+1CC0	U+1CCF	8
	U+1CD0	U+1CFF	41
	U+1D00	U+1D7F	128
	U+1D80	U+1DBF	64
U+1DFF	U+1DC0	U+1DFF	58
	U+1E00	U+1EFF	256
	U+1F00	U+1FFF	233
	U+2000	U+206F	111
	U+2070	U+209F	42
	U+20A0	U+20CF	31
	U+20D0	U+20FF	33
	U+2100	U+214F	80
	U+2150	U+218F	60 60
	U+2190	U+21FF	112
	U+2200	U+22FF	256
	U+2300	U+23FF	251
	U+2400	U+243F	39
	U+2440	U+245F	11
	U+2460	U+24FF	160
	U+2500	U+257F	128
	U+2580	U+259F	32
	U+25A0	U+25FF	96
	U+2600	U+26FF	256
Dingbats	U+2700	U+27BF	192
— A	U+27C0	U+27EF	48
— A	U+27F0	U+27FF	16
	U+2800	U+28FF	256
— B	U+2900	U+297F	128
— B	U+2980	U+29FF	128
	U+2A00	U+2AFF	256
	U+2B00	U+2BFF	206
	U+2C00	U+2C5F	94
— C	U+2C60	U+2C7F	32
	U+2C80	U+2CFF	123
	U+2D00	U+2D2F	40
	U+2D30	U+2D7F	59
	U+2D80	U+2DDF	79
— A	U+2DE0	U+2DFF	32
	U+2E00	U+2E7F	67
	U+2E80	U+2EFF	115
	U+2F00	U+2FDF	214
	U+2FF0	U+2FFF	12
	U+3000	U+303F	64
	U+3040	U+309F	93
	U+30A0	U+30FF	96
	U+3100	U+312F	41
	U+3130	U+318F	94
	U+3190	U+319F	16
	U+31A0	U+31BF	27
	U+31C0	U+31EF	36
	U+31F0	U+31FF	16
	U+3200	U+32FF	254
	U+3300	U+33FF	256
— A	U+3400	U+4DBF	6191
« »	U+4DC0	U+4DFF	64
	U+4E00	U+9FFF	20941
	U+A000	U+A48F	1165
	U+A490	U+A4CF	55
	U+A4D0	U+A4FF	48
	U+A500	U+A63F	300
— B	U+A640	U+A69F	96
	U+A6A0	U+A6FF	88
	U+A700	U+A71F	32
— D	U+A720	U+A7FF	159
	U+A800	U+A82F	44
	U+A830	U+A83F	10
	U+A840	U+A87F	56
	U+A880	U+A8DF	81
	U+A8E0	U+A8FF	30
-	U+A900	U+A92F	48
	U+A930	U+A95F	37
— A	U+A960	U+A97F	29
	U+A980	U+A9DF	91 91
— B	U+A9E0	U+A9FF	31
	U+AA00	U+AA5F	83
— A	U+AA60	U+AA7F	32
-	U+AA80	U+AADF	72
	U+AAE0	U+AAFF	23
— A	U+AB00	U+AB2F	32
— E	U+AB30	U+AB6F	54
	U+AB70	U+ABBF	80
	U+ABC0	U+ABFF	56
	U+AC00	U+D7AF	2
— B	U+D7B0	U+D7FF	72
	U+D800	U+DB7F	2
	U+DB80	U+DBFF	2
	U+DC00	U+DFFF	2
	U+E000	U+F8FF	2
	U+F900	U+FAFF	472
	U+FB00	U+FB4F	58
— A	U+FB50	U+FDFF	643
	U+FE00	U+FE0F	16
	U+FE10	U+FE1F	10
	U+FE20	U+FE2F	16
	U+FE30	U+FE4F	32
	U+FE50	U+FE6F	26
— B	U+FE70	U+FEFF	141
	U+FF00	U+FFEF	225
	U+FFF0	U+FFFF	7 7
	U+10000	U+1007F	88
	U+10080	U+100FF	123
	U+10100	U+1013F	57
	U+10140	U+1018F	77
	U+10190	U+101CF	13
	U+101D0	U+101FF	46
	U+10280	U+1029F	29
	U+102A0	U+102DF	49
	U+102E0	U+102FF	28
	U+10300	U+1032F	36
	U+10330	U+1034F	27
	U+10350	U+1037F	43
	U+10380	U+1039F	31
	U+103A0	U+103DF	50
	U+10400	U+1044F	80
	U+10450	U+1047F	48
	U+10480	U+104AF	40
	U+10500	U+1052F	40
	U+10530	U+1056F	53
	U+10600	U+1077F	341
	U+10800	U+1083F	55
	U+10840	U+1085F	31
	U+10860	U+1087F	32
	U+10880	U+108AF	40
	U+108E0	U+108FF	26
	U+10900	U+1091F	29
	U+10920	U+1093F	27
	U+10980	U+1099F	32
	U+109A0	U+109FF	90
	U+10A00	U+10A5F	65
	U+10A60	U+10A7F	32
	U+10A80	U+10A9F	32
	U+10AC0	U+10AFF	51
	U+10B00	U+10B3F	61
	U+10B40	U+10B5F	30
	U+10B60	U+10B7F	27
	U+10B80	U+10BAF	29
	U+10C00	U+10C4F	73
	U+10C80	U+10CFF	108
	U+10E60	U+10E7F	31
	U+11000	U+1107F	109
	U+11080	U+110CF	66
-	U+110D0	U+110FF	35
	U+11100	U+1114F	67
	U+11150	U+1117F	39
	U+11180	U+111DF	94
	U+111E0	U+111FF	20
	U+11200	U+1124F	61
	U+11280	U+112AF	38
	U+112B0	U+112FF	69
	U+11300	U+1137F	85
	U+11480	U+114DF	82
	U+11580	U+115FF	92
	U+11600	U+1165F	79
	U+11680	U+116CF	66
	U+11700	U+1173F	57
-	U+118A0	U+118FF	84
	U+11AC0	U+11AFF	57
	U+12000	U+123FF	922
	U+12400	U+1247F	116
	U+12480	U+1254F	196
	U+13000	U+1342F	1071
	U+14400	U+1467F	583
	U+16800	U+16A3F	569
	U+16A40	U+16A6F	43
	U+16AD0	U+16AFF	36
	U+16B00	U+16B8F	127
	U+16F00	U+16F9F	133
	U+1B000	U+1B0FF	2
	U+1BC00	U+1BC9F	143
	U+1BCA0	U+1BCAF	4 4
	U+1D000	U+1D0FF	246
	U+1D100	U+1D1FF	231
	U+1D200	U+1D24F	70
« »	U+1D300	U+1D35F	87
	U+1D360	U+1D37F	18 años
	U+1D400	U+1D7FF	996
SignWriting	U+1D800	U+1DAAF	672
	U+1E800	U+1E8DF	213
	U+1EE00	U+1EEFF	143
	U+1F000	U+1F02F	44
	U+1F030	U+1F09F	100
	U+1F0A0	U+1F0FF	82
	U+1F100	U+1F1FF	173
	U+1F200	U+1F2FF	57
	U+1F300	U+1F5FF	766
	U+1F600	U+1F64F	80
	U+1F650	U+1F67F	48
	U+1F680	U+1F6FF	98
	U+1F700	U+1F77F	116
	U+1F780	U+1F7FF	85
— C	U+1F800	U+1F8FF	148
	U+1F900	U+1F9FF	15
— B	U+20000	U+2A6DF	42676
— C	U+2A700	U+2B73F	60 60
— D	U+2B740	U+2B81F	27
— E	U+2B820	U+2CEAF	2
	U+2F800	U+2FA1F	542
Tags	U+E0000	U+E007F	97
	U+E0100	U+E01EF	240
— A	U+F0000	U+FFFFF	4 4
— B	U+100000	U+10FFFF	4 4

— - .
— , .
— .
— , . .
, — , . , .
— , . , [Ä] [A] [¨].
— .
— , , . .
— , .
— .

: c codepoints.net .

11.0 ()
10.0 ( , 20.06.2017 .)
9.0
8.0
7.0
6.3
6.2
6.1
6.0
5.2
5.1
5.0 ()
4.0.1
4.0

Este adorable Unicode