Aqui está uma lista atualizada dos mais maravilhosos "brindes" Unicode, bem como pacotes e recursos

Unicode é incrível! Antes de sua aparição, a comunicação internacional era exaustiva: cada um definia seu próprio conjunto de caracteres estendidos separado na metade superior do ASCII (as chamadas páginas de código). Isso criou conflito. Basta pensar que os alemães tiveram que negociar com os coreanos, onde está a página de códigos de quem. Felizmente, o Unicode apareceu e introduziu um padrão comum. O Unicode 8.0 cobre mais de 120.000 caracteres de mais de 129 scripts. Moderno e antigo, e ainda não decifrado. O Unicode suporta texto da esquerda para a direita e da direita para a esquerda, sobrepõe caracteres e inclui uma variedade de símbolos culturais e políticos, religiosos e emojis. O Unicode é incrivelmente humano e suas capacidades são muito subestimadas.

Conteúdo

Breve introdução

Quais caracteres estão incluídos no Unicode Standard?

O padrão Unicode define códigos para caracteres nos principais idiomas modernos. São scripts alfabéticos europeus, scripts do Oriente Médio da direita para a esquerda e muitos scripts asiáticos.

O padrão também contém sinais de pontuação, diacríticos, símbolos matemáticos, símbolos técnicos, setas, símbolos, emojis etc. Ele fornece códigos para diacríticos que alteram sinais de caracteres, como til (~). Eles são usados em combinação com os básicos para representar caracteres acentuados (por exemplo, ñ). Em geral, o Unicode versão 9.0 fornece códigos para 128.172 caracteres de alfabetos mundiais, conjuntos de ideogramas e coleções de caracteres.

Os caracteres mais comuns são colocados nos primeiros pontos de código de 64 K, uma área do espaço de código chamada plano multilíngue principal ou BMP, abreviado. Existem dezesseis outros planos adicionais disponíveis para codificar outros caracteres, com mais de 850.000 pontos de código não utilizados. Eles podem ser úteis para adicionar novos personagens a versões futuras do padrão.

O padrão Unicode também reserva pontos de código para uso privado. Fornecedores ou usuários finais podem designá-los em seus próprios sistemas para seus personagens ou usá-los com fontes especializadas. O BMP possui 6400 pontos de código para uso privado e outros 131 068 pontos de código adicionais para uso privado, se 6400 não for suficiente para aplicativos específicos.

Codificações de caracteres Unicode

Os padrões de codificação de caracteres determinam não apenas a identidade de cada caractere e seu valor numérico ou ponto de código, mas também como esse valor é representado em bits.

O padrão Unicode define três formas de codificação que permitem a transmissão dos mesmos dados: um byte, uma palavra e uma palavra dupla (ou seja, 8, 16 ou 32 bits por unidade de código). Todos os três formulários codificam o mesmo conjunto de caracteres comum e podem ser efetivamente convertidos um no outro sem perda de dados. O Consórcio Unicode endossa totalmente o uso de qualquer um desses formulários de codificação como uma maneira acordada de implementar o Padrão Unicode.

UTF-8 é popular para protocolos HTML e similares. UTF-8 é uma maneira de converter todos os caracteres Unicode em uma codificação variável de comprimento de bytes. Sua vantagem é que os caracteres Unicode que correspondem ao conjunto ASCII familiar têm os mesmos valores de bytes que o ASCII, e os caracteres Unicode convertidos em UTF-8 podem ser usados com muitos softwares existentes, sem grandes modificações.

O UTF-16 é popular em muitos ambientes em que é necessário equilibrar o acesso eficiente a caracteres com armazenamento econômico. É bastante compacto e todos os caracteres usados com freqüência são colocados em um bloco de código de 16 bits, enquanto todos os outros caracteres estão disponíveis através de pares de blocos de código de 16 bits.

UTF-32 é útil quando a quantidade de memória não é uma preocupação, mas requer acesso a caracteres em um único código de largura fixa. Aqui, cada caractere Unicode é codificado em um único bloco de código de 32 bits.

Todas as três formas de codificação requerem não mais que 4 bytes (ou 32 bits) para cada caractere.

Fale sobre números

O conjunto de caracteres Unicode é dividido em 17 segmentos principais (planos), que são divididos em blocos. Em cada plano, há um lugar para 65 536 (2 ¹⁶ ) pontos de código, o que cria um total de 1.114.112 pontos de código. Existem dois "planos de uso privado" (nº 16 e nº 17) que são alocados para uso a critério das empresas / usuários. Eles possuem 131.072 pontos de código.

Não.	Título	Range
1	Plano multilíngue principal	(de U + 0000 a U + FFFF)
2)	Plano multilíngue adicional	(de U + 10000 a U + 1FFFF)
3)	Plano ideográfico adicional	(de U + 20.000 a U + 2FFFF)
4)	Plano ideográfico terciário	(de U + 30000 a U + 3FFFF)
5)	Avião 5 (não usado)	(de U + 40.000 a U + 4FFFF)
6	Avião 6 (não usado)	(de U + 50.000 a U + 5FFFF)
7)	Avião 7 (não usado)	(de U + 60.000 a U + 6FFFF)
8)	Avião 8 (não usado)	(de U + 70.000 a U + 7FFFF)
9	Plano 9 (não usado)	(de U + 80.000 a U + 8FFFF)
10)	Avião 10 (não usado)	(de U + 90.000 a U + 9FFFF)
11)	Plano 11 (não usado)	(de U + A0000 a U + AFFFF)
12)	Avião 12 (não usado)	(de U + B0000 a U + BFFFF)
13)	Plano 13 (não usado)	(de U + C0000 a U + CFFFF)
14)	Avião 14 (não usado)	(de U + D0000 a U + DFFFF)
15	Plano adicional especializado	(de U + E0000 a U + EFFFF)
16	Área adicional para uso privado - A	(de U + F0000 a U + FFFFF)
17	Área adicional para uso privado - B	(de U + 100000 a U + 10FFFF)

O primeiro plano é chamado de principal plano multilíngue ou BMP. Ele contém pontos de código de U + 0000 a U + FFFF, ou seja, os caracteres mais usados. Os dezesseis planos restantes (U + 010000 → U + 10FFFF) são chamados adicionais ou astrais.

Pares substitutos UTF-16

Símbolos fora do plano principal, como um tetragrammaton que significa o centro (U + 1D306), podem ser codificados em UTF-16 com apenas duas unidades de código de 16 bits: 0xD834 0xDF06. Isso é chamado de par substituto. Observe que um par substituto representa apenas um caractere.

A primeira unidade de código de um par substituto está sempre no intervalo de 0xD800 a 0xDBFF e é chamada de parte superior do par.

A segunda unidade de código do par substituto está sempre no intervalo de 0xDC00 a 0xDFFF e é chamada de parte inferior do par.

Matthias Binens

Par substituto: uma representação de um símbolo abstrato, consistindo em uma sequência de duas unidades de código de 16 bits, em que o primeiro valor do par é a unidade de código substituto superior e o segundo é a unidade de código substituto inferior. Pares substitutos são usados apenas no UTF-16.

Unicode 8.0 Capítulo 3.8 - Substitutos

Cálculo de pares substitutos

O caractere Unicode "Pilha de merda" (U + 1F4A9) no UTF-16 terá que ser codificado como um par substituto, ou seja, dois substitutos. Para converter qualquer ponto de código em um par substituto, use este algoritmo (em JavaScript). Lembre-se de que usamos notação hexadecimal.

var High_Surrogate = function(Code_Point){ return Math.floor((Code_Point - 0x10000) / 0x400) + 0xD800 }; var Low_Surrogate = function(Code_Point){ return (Code_Point - 0x10000) % 0x400 + 0xDC00 }; // Reverses The Conversion var Code_Point = function(High_Surrogate, Low_Surrogate){ return (High_Surrogate - 0xD800) * 0x400 + Low_Surrogate - 0xDC00 + 0x10000; };

Composição e decomposição

O Unicode inclui um mecanismo para alterar a forma de um caractere, que estende bastante o conjunto de glifos com suporte. Isso se aplica aos diacríticos combináveis. Eles são inseridos após o personagem principal. Várias marcas diacríticas podem ser aplicadas à mesma marca. O Unicode também contém versões pré-compiladas da maioria dessas combinações para uso normal.

Algumas seqüências de caracteres também podem ser representadas como um único caractere chamado de caráter pré-composto, também conhecido como caráter composto. Por exemplo, o caractere [ü] pode ser codificado como o único ponto de código U + 00FC ou como o caractere base U + 0075 (u), seguido pelo caractere não independente U + 0308 (¨). O padrão Unicode codifica caracteres compostos para compatibilidade com padrões estabelecidos, como o Latim 1, que inclui muitos caracteres compostos, como [ü] e [ñ].

Caracteres compostos podem ser expandidos para consistência ou análise. Por exemplo, ao classificar em ordem alfabética, o símbolo [ü] pode ser decomposto em [u] seguido pelo símbolo não independente [¨]. Após essa decomposição, o algoritmo fica mais fácil de trabalhar com uma sequência de caracteres. Isso facilita a classificação em idiomas onde os modificadores de caracteres não afetam a ordem alfabética. O padrão Unicode define a ordem de decomposição para todos os caracteres compostos. Ele também define formas de normalização para fornecer representações exclusivas de caracteres.

Mitos Unicode

Dos slides da apresentação de Mark Davis "Mitos do Unicode" .

Unicode é apenas um código de 16 bits . - Algumas pessoas acreditam erroneamente que Unicode é apenas um código de 16 bits, no qual cada caractere ocupa 16 bits e, portanto, existem 65.536 caracteres possíveis. De fato, isso não é inteiramente verdade. Esse é o mito Unicode mais comum; portanto, se você também pensava assim antes, não desanime.
Você pode usar qualquer ponto de código que não seja usado para suas necessidades . - não. Algum dia, este lugar será substituído por outro símbolo. Em vez disso, use aviões para uso particular ou áreas sem caracteres em cada plano onde não haverá caracteres por padrão.
Cada ponto de código Unicode representa um caractere . - não. Existem muitos pontos sem caracteres (FFFE, FFFF, 1FFFE etc.) Além disso, pontos de código substitutos, pontos de código privados e não utilizados, além de "caracteres" de controle / formatação (RLM, ZWNJ, etc.)
O Unicode fica sem espaço . - Se preenchesse linearmente, terminaria em 2140. Mas o local não preenche linearmente. Planos futuros ver aqui .
Todos os caracteres são correspondidos um a um . - não. As opções são:
- Um para muitos: (β → SS)
- Dado o contexto: (... Σ ← → ... ς e ao mesmo tempo ... ΣΤ ... ← → ... στ ...)
- Com base na localidade: (I ← → ı e ao mesmo tempo İ ← → i)

Codificações de aplicativos Unicode

Tipo de codificação	Exemplo
Objeto HTML (decimal)
Objeto HTML (hex)
Código de controle de URL	% F0% 9F% 96% 96
UTF-8 (hex)	0xF0 0x9F 0x96 0x96 (f09f9696)
UTF-8 (binário)	11110000: 10011111: 10010110: 10010110
UTF-16 / UTF-16BE (hex)	0xD83D 0xDD96 (d83ddd96)
UTF-16LE (hex)	0x3DD8 0x96DD (3dd896dd)
UTF-32 / UTF-32BE (hex)	0x0001F596 (0001f596)
UTF-32LE (hex)	0x96F50100 (96f50100)
Sequência de escape octal	\ 360 \ 237 \ 226 \ 226

Código fonte

Tipo de codificação	Exemplo
Javascript	\ u1F596
Json	\ u1F596
C	\ u1F596
C ++	\ u1F596
Java	\ u1F596
Python	\ u1F596
Perl	\ x {1F596}
Ruby	\ u {1F596}
CSS	\ 01F596

Lista de personagens incríveis.

Compartilhar um documento pode transformar rapidamente a edição em uma batalha de rap escrita, travada por um arranjo cada vez mais confuso de gerentes de U + 202a a U + 202e

Caracteres especiais

O Unicode Consortium publicou um diagrama de pontuação geral, onde você pode encontrar mais informações.

Símbolo	Título	Descrição do produto
`''`	U + FEFF Espaço sem quebra de largura zero (Byte Order Mark - BOM)	Possui uma propriedade importante de exclusividade ao alterar a ordem dos bytes. Ele também tem largura e invisibilidade zero. Em software inadequado (como um intérprete PHP), isso leva a todos os tipos de exemplos de comportamento divertido.
`'￯'`	BOM reversa '\ uFFEF'	Não é equiparado a um caractere, exceto no início do texto.
`''`	'\ u200B' Espaço sem quebra de largura zero	Um símbolo sem aparência e sem efeito, exceto para impedir a formação de ligaduras.
`' '`	U + 00A0 Espaço sem quebra	Faz com que os caracteres adjacentes fiquem juntos. Bem conhecido como ` ` em HTML.
`''`	U + 00AD Hífen suave	No HTML, ele funciona como um espaço de largura zero, mas quando encontra o final de uma linha (e somente neste caso) mostra um hífen.
`'‍'`	Sinal de largura zero U + 200D (com união)	Faz com que caracteres vizinhos se conectem (por exemplo, caracteres árabes ou emojis suportados). Pode ser usado para emojis combinados sequencialmente.
`'⁠'`	Conector do Word U + 2060	O mesmo que U + 00A0, mas completamente invisível. Bom para @ font-face no Twitter.
`' '`	Caráter espacial U + 1680 Ogham	Marca um espaço que parece um traço. Ótimo para aproximar os programadores da loucura: 1 + 2 === 3.
`';'`	U + 037E ponto de interrogação grego	Parece um ponto e vírgula. Também é uma maneira divertida de trollar desenvolvedores.
`'‭'`	U + 202D	Altera a direção do texto da esquerda para a direita.
`'‮'`	U + 202E	Altera a direção do texto da direita para a esquerda.
`'ꓸ'`	Tom de letra U + A4F8 Lisu mya ti	Dobro para o ponto.
`'ꓹ'`	Tom de letra U + A4F9 Lisu po	Duplo para vírgula.
`'ꓼ'`	Tom de letra U + A4FC Lisu agora	Duplo para ponto e vírgula.
`'ꓽ'`	Tom de letra U + A4FD Lisu mya jeu	Duplo para o cólon.
`'︀'`	Seletores de opção (de U + FE00 a U + FE0F e de U + E0100 a U + E01EF)	Um bloco de 256 caracteres de largura zero que possui a propriedade ID_Continue, ou seja, pode ser usado em nomes de variáveis (não na primeira letra). O que os torna especiais é que o cursor do mouse passa sobre eles, porque eles combinam caracteres, ao contrário da maioria dos outros caracteres de largura zero.
`'ᅟ'`	Espaço reservado para U + 115F Hangul Choson	Essencialmente, preenche o espaço. Renderizado como um caractere de largura zero (invisível), a menos que seja explicitamente suportado na renderização. Marcado como ID_Start
`'ᅠ'`	Espaço reservado para U + 1160 Chunson	Talvez preenche o espaço? Renderizado como um caractere de largura zero (invisível), a menos que seja explicitamente suportado na renderização. Marcado como ID_Start
`'ㅤ'`	Agregado Hangul U + 3164	Em geral, preenche o espaço. Renderizado como um caractere de largura zero (invisível), a menos que seja explicitamente suportado na renderização. Marcado como ID_Start

Espere ... o que eu acabei de ler?

Identificadores variáveis podem incluir espaços!

O espaço reservado U + 3164 Hangul é exibido como um espaço amplo. Se o caractere não for claramente suportado na renderização , ele será exibido como completamente invisível (e não ocupa espaço, ou seja, "largura zero"). Isso significa que você nunca verá um caractere de substituição de caractere feio ( ).

Ainda não sei ao certo por que o U + 3164 é instruído a se comportar dessa maneira. Curiosamente, o U + 3164 foi adicionado ao Unicode na versão 1.1 (1993) - então os especialistas do Consortium tiveram muito tempo para pensar sobre isso. De qualquer forma, aqui estão alguns exemplos.

 > var ᅟ = 'foo'; undefined > ᅟ 'foo' > var ㅤ= alert; undefined > var foo = 'bar' undefined > if ( foo ===ㅤ`baz` ){} // alert undefined > var varㅤfooㅤ\u{A60C}ㅤπ = 'bar'; undefined > varㅤfooㅤꘌㅤπ 'bar'

** Nota: ** Testei a renderização U + 3164 no Ubuntu e OS X com os seguintes parâmetros: `node`,` php`, `ruby`,` python3.5`, `scala`,` vim`, `cat` , `chrome` +` github gist '. Atom é o único sistema que falha ao exibir incorretamente campos vazios. Ainda tenho que verificar o código no Emacs e Sublime. Pelo que entendi, o Unicode Consortium não irá reatribuir ou renomear caracteres ou pontos de código, mas pode ser persuadido a alterar as propriedades de caracteres, como ID_Start e ID_Continue.

Modificadores

O Zero Width Combiner (ZWJ) é um caractere não imprimível em um conjunto de computadores de algumas fontes complexas, como árabe ou qualquer fonte indiana. Quando colocado entre dois caracteres que não estariam conectados, o ZWJ os obriga a imprimir de forma combinada.

O desconector de largura zero (ZWNJ) é um caractere não imprimível em conjuntos de gravação baseados em computador com ligaduras. Quando colocados entre dois caracteres que de outra forma seriam unidos a uma ligadura, o ZWNJ os obriga a imprimir em suas formas final e original, respectivamente. Atua como um espaço, mas é usado quando é desejável manter as palavras próximas umas das outras ou combinar uma palavra com seu morfema.

 > 'a' "a" > 'a\u{0308}' "ä" > 'a\u{20DE}\u{0308}' "a⃞̈" > 'a\u{20DE}\u{0308}\u{20DD}' "a⃞̈⃝" // Modifying Invisible Characters > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}' "‎‎‎‎‎‎‎‎‎‎" > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}'.length 10

Colisões de transformação em maiúsculas

Símbolo	Ponto de código	Resultado
ß	0x00DF	`SS`
ı	0x0131	`I`
ſ	0x017F	`S`
ﬀ	0xFB00	`FF`
fi	0xFB01	`FI`
fl	0xFB02	`FL`
ﬃ	0xFB03	`FFI`
ﬄ	0xFB04	`FFL`
ﬅ	0xFB05	`ST`
ﬆ	0xFB06	`ST`

Colisões de conversão em minúsculas

Símbolo	Ponto de código	Resultado
K	0x212A	`k`

Peculiaridades e solução de problemas

O comprimento da linha geralmente é determinado pelo número de pontos de código . Isso significa que pares substitutos serão considerados dois caracteres. Vários diacríticos podem ser sobrepostos a um símbolo: a + ̈ == ̈a . Isso aumenta o comprimento da cadeia, produzindo apenas um caractere.
Da mesma forma, a inversão de string geralmente se torna uma tarefa não trivial . Novamente, pares substitutos e diacríticos devem ser revertidos juntos. O ES Reverser oferece uma solução muito boa.

As comparações em maiúsculas e minúsculas nem sempre correspondem . Eles podem ser expressos em tais relacionamentos:

Um para muitos: (ß → SS)
Dado o contexto: (... Σ ← → ... ς e ... ΣΤ ... ← → ... στ ...)
Com base na localidade: (I ← → ı e İ ← → i)

Uma para muitas comparações

A maioria dos caracteres abaixo expressa seus mapeamentos um para muitos em letras maiúsculas e outros em letras minúsculas. Em princípio, a lista pode ser dividida em duas partes.

Ponto de código	Símbolo	Título	Caráter associado	Pontos de código associados
U + 00DF	`ß`	Esceto latino minúsculo (S agudo)	`s` , `s`	U + 0073, U + 0073
U + 0130	`İ`	Letra maiúscula latina "I" com um ponto acima	`i` `̇`	U + 0069, U + 0307
U + 0149	`ŉ`	Letra minúscula latina "n" do apóstrofo anterior	`ʼ` , `n`	U + 02BC, U + 006E
U + 01F0	`ǰ`	Letra minúscula latina j	`j` , `̌`	U + 006A, U + 030C
U + 0390	`ΐ`	Iota minúscula grega com diálise e tonos.	`ι` , `̈`	U + 03B9, U + 0308, U + 0301
U + 03B0	`ΰ`	Letra minúscula grega ipsilon com diálise e tonos.	`̈` ,	U + 03C5, U + 0308, U + 0301
U + 0587	`և`	Ligadura minúscula armênia ech yiwn	`ե` , `ւ`	U + 0565, U + 0582
U + 1E96	`ẖ`	Letra minúscula latina h com uma linha abaixo	`h`	U + 0068, U + 0331
U + 1E97	`ẗ`	Letra minúscula latina t com déresis	`t` , `̈`	U + 0074, U + 0308
U + 1E98	`ẘ`	Letra minúscula latina w com anel acima	`w` , `̊`	U + 0077, U + 030A
U + 1E99	`ẙ`	Letra minúscula latina y com anel acima	`y` `̊`	U + 0079, U + 030A
U + 1E9A	`ẚ`	Letra minúscula latina a com metade direita do anel	`a` , `ʾ`	U + 0061, U + 02BE
U + 1E9E	`ẞ`	Maiúscula latina aguda s	`s` , `s`	U + 0073, U + 0073
U + 1F50	`ὐ`	Letra minúscula grega ipsilon com psil	`υ` ,	U + 03C5, U + 0313
U + 1F52	`ὒ`	Letra minúscula grega ipsilon com psili e varia	`̓` ,	U + 03C5, U + 0313, U + 0300
U + 1F54	`ὔ`	Letra minúscula grega ipsilon com psily e oxy	`̓` ,	U + 03C5, U + 0313, U + 0301
U + 1F56	`ὖ`	Letra minúscula grega ipsilon com psily e perisome	`̓` ,	U + 03C5, U + 0313, U + 0342
U + 1F80	`ᾀ`	Letra minúscula grega alfa com psili e ipogemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F81	`ᾁ`	Letra minúscula grega alfa com dasia e ipogemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F82	`ᾂ`	Letra minúscula grega alfa com psilia e varia e ipogemen	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F83	`ᾃ`	Letra minúscula grega alfa com dasia e varia e ipogemen	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F84	`ᾄ`	Letra minúscula grega alfa com psily e oxy e ipogemen	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F85	`ᾅ`	Letra minúscula grega alfa com dasia e oxy e ipogemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F86	`ᾆ`	Letra minúscula grega alfa com psily e perispomenti e ipogemen	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F87	`ᾇ`	Letra minúscula grega alfa com dasia e perispomenti e hypogrammen	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F88	`ᾈ`	Letra maiúscula grega alfa com psil e programmemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F89	`ᾉ`	Letra maiúscula grega alfa com dasia e programmemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F8A	`ᾊ`	Letra maiúscula grega alfa com psilia e varia e programas	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F8B	`ᾋ`	Letra maiúscula grega alfa com dasia e varia e prog	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F8C	`ᾌ`	Letra maiúscula grega alfa com psily e oxy e prog	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F8D	`ᾍ`	Letra maiúscula grega alfa com dasia e oxy e programmemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F8E	`ᾎ`	Letra maiúscula grega alfa com psily e perispomenti e programmemeny	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F8F	`ᾏ`	Letra maiúscula grega alfa com dasia e perispomenti e progs	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F90	`ᾐ`	Letra minúscula grega isto com psily e ipogemen	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F91	`ᾑ`	Letra minúscula grega a com dasia e ipogemen	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F92	`ᾒ`	Letra minúscula grega isso com psilia e varia e ipogemen	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F93	`ᾓ`	Letra minúscula grega eta com dasia e varia e ipogemen	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F94	`ᾔ`	Letra minúscula grega a com psilia e oksia e ipogemen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F95	`ᾕ`	Letra minúscula grega eta com dasia e oksia e ipogemen	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F96	`ᾖ`	Letra minúscula grega isso com psily e perispomenti e ipogemen	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F97	`ᾗ`	Letra minúscula grega eta com dasia e perisopmenti e hypogrammen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1F98	`ᾘ`	Letra maiúscula grega com psilah e programas	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F99	`ᾙ`	Letra maiúscula grega com dasia e programadores	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F9A	`ᾚ`	Maiúscula grega isso com psilia e varia e prosgrammemeny	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F9B	`ᾛ`	Maiúscula grega isso com dasia e varia e prosgrammemeny	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F9C	`ᾜ`	Maiúscula grega isso com psilia e oxy e programadores	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F9D	`ᾝ`	Letra maiúscula grega com dasia e oksia e programadores	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F9E	`ᾞ`	Maiúscula grega isso com psily e perispomenty e prosgrammeny	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F9F	`ᾟ`	Letra maiúscula grega com dasia e perispomenti e programadores	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1FA0	`ᾠ`	Omega letra minúscula grega com psili e ipogemen	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA1	`ᾡ`	Omega letra minúscula grega com dasia e ipogemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FA2	`ᾢ`	Ômega minúscula da letra grega com psilia e varia e ipogemen	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FA3	`ᾣ`	Letra minúscula grega ômega com dasia e varia e ipogemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FA4	`ᾤ`	Ômega letra minúscula grega com psily e oxy e ipogemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FA5	`ᾥ`	Letra minúscula grega ômega com dasia e oxy e ipogemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FA6	`ᾦ`	Ômega letra minúscula grega com psily e perispomenti e ipogemen	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FA7	`ᾧ`	Letra minúscula grega ômega com dasia e perispomenti e hypogrammemen	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FA8	`ᾨ`	Letra maiúscula grega ômega com psili e programa	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA9	`ᾩ`	Letra maiúscula grega Omega com dasia e programmemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FAA	`ᾪ`	Letra maiúscula grega ômega com psilia e varia e prosgrammemeny	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FAB	`ᾫ`	Letra maiúscula grega Omega com dasia e varia e programmemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FAC	`ᾬ`	Letra maiúscula grega ômega com psilia e oxy e progamemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FAD	`ᾭ`	Letra maiúscula grega ômega com dasia e oksia e programmemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FAE	`ᾮ`	Letra maiúscula grega ômega com psily e perispomenti e prosgrammemeny	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FAF	`ᾯ`	Letra maiúscula grega ômega com dasia e perispomenti e prosgrammemeny	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FB2	`ᾲ`	Letra minúscula grega alfa com varia e ipogemen	`ὰ` , `ι`	U + 1F70, U + 03B9
U + 1FB3	`ᾳ`	Letra minúscula grega alfa com ogogerammeni	`α` , `ι`	U + 03B1, U + 03B9
U + 1FB4	`ᾴ`	Letra minúscula grega alfa com oxy e ipogemen	`ά` , `ι`	U + 03AC, U + 03B9
U + 1FB6	`ᾶ`	Letra minúscula grega alfa com perispomenti	`α` ,	U + 03B1, U + 0342
U + 1FB7	`ᾷ`	Letra minúscula grega alfa com perispomenti e ipogemen	`α` , `͂` `ι`	U + 03B1, U + 0342, U + 03B9
U + 1FBC	`ᾼ`	Letra maiúscula grega alfa com progs	`α` , `ι`	U + 03B1, U + 03B9
U + 1FC2	`ῂ`	Letra minúscula grega et com varia e ipogemen	`ὴ` , `ι`	U + 1F74, U + 03B9
U + 1FC3	`ῃ`	Letra minúscula grega a com ipogemen	`η` , `ι`	U + 03B7, U + 03B9
U + 1FC4	`ῄ`	Letra minúscula grega eta com oxy e ipogemen	`ή` , `ι`	U + 03AE, U + 03B9
U + 1FC6	`ῆ`	Letra minúscula grega a com perispomenti	`η`	U + 03B7, U + 0342
U + 1FC7	`ῇ`	Letra minúscula grega a com perispomenti e ipogemen	`η` , `͂` `ι`	U + 03B7, U + 0342, U + 03B9
U + 1FCC	`ῌ`	Maiúscula grega isso com prog	`η` , `ι`	U + 03B7, U + 03B9
U + 1FD2	`ῒ`	Iota minúscula grega com diálise e variabilidade	`ι` , `̈`	U + 03B9, U + 0308, U + 0300
U + 1FD3	`ΐ`	Iota minúscula grega com diálise e oxi	`ι` , `̈`	U + 03B9, U + 0308, U + 0301
U + 1FD6	`ῖ`	Iota minúsculo grego com perispomenti	`ι`	U + 03B9, U + 0342
U + 1FD7	`ῗ`	Iota minúscula grega com diálise e período	`ι` , `̈`	U + 03B9, U + 0308, U + 0342
U + 1FE2	`ῢ`	Letra minúscula grega ipsilon com diálise e varia.	`̈` ,	U + 03C5, U + 0308, U + 0300
U + 1FE3	`ΰ`	Letra minúscula grega ipsilon com diálise e oxi.	`̈` ,	U + 03C5, U + 0308, U + 0301
U + 1FE4	`ῤ`	Rho minúsculo grego com psili	`ρ` , `̓`	U + 03C1, U + 0313
U + 1FE6	`ῦ`	Letra minúscula grega ipsilon com perispomenti	`υ`	U + 03C5, U + 0342
U + 1FE7	`ῧ`	Letra minúscula grega ipsilon com diálise e período	`̈` ,	U + 03C5, U + 0308, U + 0342
U + 1FF2	`ῲ`	Letra minúscula grega ômega com varia e ipogemen	`ὼ` , `ι`	U + 1F7C, U + 03B9
U + 1FF3	`ῳ`	Letra minúscula grega omega com ogogerammeni	`ω` , `ι`	U + 03C9, U + 03B9
U + 1FF4	`ῴ`	Omega letra minúscula grega com oxia e ipogemen	`ώ` , `ι`	U + 03CE, U + 03B9
U + 1FF6	`ῶ`	Letra minúscula grega ômega com perispomenti	`ω`	U + 03C9, U + 0342
U + 1FF7	`ῷ`	Letra minúscula grega ômega com perispomenti e ipogemen	`ω` , `͂` `ι`	U + 03C9, U + 0342, U + 03B9
U + 1FFC	`ῼ`	Letra maiúscula grega Omega com programa	`ω` , `ι`	U + 03C9, U + 03B9
U + FB00	`ﬀ`	Ligadura em minúscula latina Ff	`f` `f`	U + 0066, U + 0066
U + FB01	`ﬁ`	Ligadura minúscula em latim Fi	`i`	U + 0066, U + 0069
U + FB02	`ﬂ`	Ligadura em minúscula latina Fl	`f` `l`	U + 0066, U + 006C
U + FB03	`ﬃ`	Ligadura em minúscula latina Ffi	`f` , `i`	U + 0066, U + 0066, U + 0069
U + FB04	`ﬄ`	Ligadura em minúscula latina Ffl	`f` , `f` , `l`	U + 0066, U + 0066, U + 006C
U + FB05	`ﬅ`	Ligadura minúscula em latim ST longo	`s` , `t`	U + 0073, U + 0074
U + FB06	`ﬆ`	Ligadura latina minúscula St	`s` , `t`	U + 0073, U + 0074
U + FB13	`ﬓ`	Ligadura minúscula armênia Men Now	`մ` , `ն`	U + 0574, U + 0576
U + FB14	`ﬔ`	Ligadura minúscula armênia Men Ech	`մ` , `ե`	U + 0574, U + 0565
U + FB15	`ﬕ`	Ligadura minúscula armênia Men Ini	`մ` , `ի`	U + 0574, U + 056B
U + FB16	`ﬖ`	Ligadura minúscula da Armênia Vew Now	`վ` , `ն`	U + 057E, U + 0576
U + FB17	`ﬗ`	Ligadura minúscula armênia Men Xeh	`մ` , `խ`	U + 0574, U + 056D

Ótimos pacotes e bibliotecas

PhantomScript -: ghost :: flashlight: Executando JavaScript invisível e engenharia social
ESReverser - manipulação de string JavaScript baseada em Unicode .
mimic - Uso indevido de Unicode
python-ftfy - tenta criar a máxima representação correta e completa do texto recebido no Unicode.
vim-troll-stopper - Proteja seu código contra trolls unicode.

Emoji

Unicode (diversity), . .

, , . — . :


U+1F469 U+200D U+2764 U+FE0F U+200D U+1F469
U+1F468 U+200D U+1F468 U+200D U+1F467 U+200D U+1F466

, .

8.0 ( 2015 ) - . , ( , FitzpatrickSkinType.pdf). .

Unicode


U+1F3FB	-1-2
U+1F3FC	-3
U+1F3FD	-4
U+1F3FE	-5
U+1F3FF	-6

, \u{1F466}\u{1F3FE} .

+

→

JavaScript (ES6)

, ID_START , . , ID_CONTINUE , .

 // How convenient! var π = Math.PI; // Sometimes, you just have to use the Bad Parts of JavaScript: var ಠ_ಠ = eval; // Code, YU NO WORK?! var ლ_ಠ益ಠ_ლ = 42; // How about a JavaScript library for functional programming? var λ = function() {}; // Obfuscate boring variable names for great justice var \u006C\u006F\u006C\u0077\u0061\u0074 = 'heh'; // …or just make up random ones var Ꙭൽↈⴱ = 'huh'; // While perfectly valid, this doesn't work in most browsers: var foo\u200Cbar = 42; // This is *not* a bitwise left shift (`<<`): var 〱〱 = 2; // This is, though: 〱〱 << 〱〱; // 8 // Give yourself a discount: var price_9̶9̶_89 = 'cheap'; // Fun with Roman numerals var Ⅳ = 4; var Ⅴ = 5; Ⅳ + Ⅴ; // 9 // Cthulhu was here var Hͫ̆̒̐ͣ̊̄ͯ͗͏̵̗̻̰̠̬͝ͅE̴̷̬͎̱̘͇͍̾ͦ͊͒͊̓̓̐_̫̠̱̩̭̤͈̑̎̋ͮͩ̒͑̾͋͘Ç̳͕̯̭̱̲̣̠̜͋̍O̴̦̗̯̹̼ͭ̐ͨ̊̈͘͠M̶̝̠̭̭̤̻͓͑̓̊ͣͤ̎͟͠E̢̞̮̹͍̞̳̣ͣͪ͐̈T̡̯̳̭̜̠͕͌̈́̽̿ͤ̿̅̑Ḧ̱̱̺̰̳̹̘̰́̏ͪ̂̽͂̀͠ = 'Zalgo';

CSS .

 <!-- place this within the document head --> <meta charset="UTF-8" /> <!-- error message --> <div class="ಠ_ಠ">You do not have access to this page.</div> <!-- success message --> <div class="">Your changes have been saved successfully!</div>

 .ಠ_ಠ { border: 1px solid #f00; } . { background: lightgreen; }

HTML

HTML- , , .

, HTML .

 // U+1160 HANGUL JUNGSEONG FILLER transformAllTags('ᅠ'); // An actual HTML element node designed to look like a comment node, using the U+01C3 LATIN LETTER RETROFLEX CLICK // <ǃ-- name="viewport" content="width=device-width"></ǃ--> transformAllTags('ǃ--'); // or even <ᅠ⃝ transformAllTags('\u{1160}\u{20dd}'); // and for a bonus, all existing tag names will have each character ensquared. h⃞t⃞m⃞l⃞ transformAllTags(); function transformAllTags (newName){ // querySelectorAll doesn't actually return an array. Array.from(document.querySelectorAll('*')) .forEach(function(x){ transformTag(x, newName); }); } function wonky(str){ return str.split('').join('\u{20de}') + '\u{20de}'; } function transformTag(tagIdOrElem, tagType){ var elem = (tagIdOrElem instanceof HTMLElement) ? tagIdOrElem : document.getElementById(tagIdOrElem); if(!elem || !(elem instanceof HTMLElement))return; var children = elem.childNodes; var parent = elem.parentNode; var newNode = document.createElement(tagType||wonky(elem.tagName)); for(var a=0;a<elem.attributes.length;a++){ newNode.setAttribute(elem.attributes[a].nodeName, elem.attributes[a].value); } for(var i= 0,clen=children.length;i<clen;i++){ newNode.appendChild(children[0]); //0...always point to the first non-moved element } newNode.style.cssText = elem.style.cssText; parent.replaceChild(newNode,elem); }

 function testBegin(str){ try{ eval(`document.createElement( '${str}' );`) return true; } catch(e){ return false; } } function testContinue(str){ try{ eval(`document.createElement( 'a${str}' );`) return true; } catch(e){ return false; } }

 // Test if dashes can start an HTML Tag > testBegin('-') < false > testContinue('-') < true > testBegin('ᅠ-') // Prepend dash with U+1160 HANGUL JUNGSEONG FILLER < true

TrueType OpenType UTF-8, 65 535 . 1,1 UTF-8, .

256 .

, () (CJK). , , « ».

. 17- .

			#
	U+0000	U+007F	128
— 1	U+0080	U+00FF	128
— A	U+0100	U+017F	128
— B	U+0180	U+024F	208
	U+0250	U+02AF	96
	U+02B0	U+02FF	80
	U+0300	U+036F	112
	U+0370	U+03FF	135
	U+0400	U+04FF	256
	U+0500	U+052F	48.
	U+0530	U+058F	89
	U+0590	U+05FF	87
	U+0600	U+06FF	255
	U+0700	U+074F	77
	U+0750	U+077F	48.
	U+0780	U+07BF	50.
	U+07C0	U+07FF	59.
	U+0800	U+083F	61
	U+0840	U+085F	29
— A	U+08A0	U+08FF	50.
	U+0900	U+097F	128
	U+0980	U+09FF	93
	U+0A00	U+0A7F	79
	U+0A80	U+0AFF	85
	U+0B00	U+0B7F	90
	U+0B80	U+0BFF	72
	U+0C00	U+0C7F	96
	U+0C80	U+0CFF	87
	U+0D00	U+0D7F	100
	U+0D80	U+0DFF	90
	U+0E00	U+0E7F	87
	U+0E80	U+0EFF	67
	U+0F00	U+0FFF	211
	U+1000	U+109F	160
	U+10A0	U+10FF	88
	U+1100	U+11FF	256
	U+1200	U+137F	358
	U+1380	U+139F	26
	U+13A0	U+13FF	92
	U+1400	U+167F	640
	U+1680	U+169F	29
	U+16A0	U+16FF	89
	U+1700	U+171F	20
	U+1720	U+173F	23
	U+1740	U+175F	20
	U+1760	U+177F	18
	U+1780	U+17FF	114
	U+1800	U+18AF	156
	U+18B0	U+18FF	70
	U+1900	U+194F	68
	U+1950	U+197F	35
	U+1980	U+19DF	83
	U+19E0	U+19FF	32.
	U+1A00	U+1A1F	30
	U+1A20	U+1AAF	127
	U+1AB0	U+1AFF	15
	U+1B00	U+1B7F	121
	U+1B80	U+1BBF	64
	U+1BC0	U+1BFF	56.
	U+1C00	U+1C4F	74
-	U+1C50	U+1C7F	48.
	U+1CC0	U+1CCF	8
	U+1CD0	U+1CFF	41.
	U+1D00	U+1D7F	128
	U+1D80	U+1DBF	64
U+1DFF	U+1DC0	U+1DFF	58.
	U+1E00	U+1EFF	256
	U+1F00	U+1FFF	233
	U+2000	U+206F	111
	U+2070	U+209F	42.
	U+20A0	U+20CF	31
	U+20D0	U+20FF	33
	U+2100	U+214F	80
	U+2150	U+218F	60
	U+2190	U+21FF	112
	U+2200	U+22FF	256
	U+2300	U+23FF	251
	U+2400	U+243F	39.
	U+2440	U+245F	11
	U+2460	U+24FF	160
	U+2500	U+257F	128
	U+2580	U+259F	32.
	U+25A0	U+25FF	96
	U+2600	U+26FF	256
Dingbats	U+2700	U+27BF	192
— A	U+27C0	U+27EF	48.
— A	U+27F0	U+27FF	16
	U+2800	U+28FF	256
— B	U+2900	U+297F	128
— B	U+2980	U+29FF	128
	U+2A00	U+2AFF	256
	U+2B00	U+2BFF	206
	U+2C00	U+2C5F	94
— C	U+2C60	U+2C7F	32.
	U+2C80	U+2CFF	123
	U+2D00	U+2D2F	40.
	U+2D30	U+2D7F	59.
	U+2D80	U+2DDF	79
— A	U+2DE0	U+2DFF	32.
	U+2E00	U+2E7F	67
	U+2E80	U+2EFF	115
	U+2F00	U+2FDF	214
	U+2FF0	U+2FFF	12
	U+3000	U+303F	64
	U+3040	U+309F	93
	U+30A0	U+30FF	96
	U+3100	U+312F	41.
	U+3130	U+318F	94
	U+3190	U+319F	16
	U+31A0	U+31BF	27
	U+31C0	U+31EF	36.
	U+31F0	U+31FF	16
	U+3200	U+32FF	254
	U+3300	U+33FF	256
— A	U+3400	U+4DBF	6191
« »	U+4DC0	U+4DFF	64
	U+4E00	U+9FFF	20941
	U+A000	U+A48F	1165
	U+A490	U+A4CF	55
	U+A4D0	U+A4FF	48.
	U+A500	U+A63F	300
— B	U+A640	U+A69F	96
	U+A6A0	U+A6FF	88
	U+A700	U+A71F	32.
— D	U+A720	U+A7FF	159
	U+A800	U+A82F	44
	U+A830	U+A83F	10
	U+A840	U+A87F	56.
	U+A880	U+A8DF	81
	U+A8E0	U+A8FF	30
-	U+A900	U+A92F	48.
	U+A930	U+A95F	37
— A	U+A960	U+A97F	29
	U+A980	U+A9DF	91
— B	U+A9E0	U+A9FF	31
	U+AA00	U+AA5F	83
— A	U+AA60	U+AA7F	32.
-	U+AA80	U+AADF	72
	U+AAE0	U+AAFF	23
— A	U+AB00	U+AB2F	32.
— E	U+AB30	U+AB6F	54
	U+AB70	U+ABBF	80
	U+ABC0	U+ABFF	56.
	U+AC00	U+D7AF	2
— B	U+D7B0	U+D7FF	72
	U+D800	U+DB7F	2
	U+DB80	U+DBFF	2
	U+DC00	U+DFFF	2
	U+E000	U+F8FF	2
	U+F900	U+FAFF	472
	U+FB00	U+FB4F	58.
— A	U+FB50	U+FDFF	643
	U+FE00	U+FE0F	16
	U+FE10	U+FE1F	10
	U+FE20	U+FE2F	16
	U+FE30	U+FE4F	32.
	U+FE50	U+FE6F	26
— B	U+FE70	U+FEFF	141
	U+FF00	U+FFEF	225
Caracteres especiais	U+FFF0	U+FFFF	7
	U+10000	U+1007F	88
	U+10080	U+100FF	123
	U+10100	U+1013F	57
	U+10140	U+1018F	77
	U+10190	U+101CF	13
	U+101D0	U+101FF	46.
	U+10280	U+1029F	29
	U+102A0	U+102DF	49.
	U+102E0	U+102FF	28.
	U+10300	U+1032F	36.
	U+10330	U+1034F	27
	U+10350	U+1037F	43
	U+10380	U+1039F	31
	U+103A0	U+103DF	50.
	U+10400	U+1044F	80
	U+10450	U+1047F	48.
	U+10480	U+104AF	40.
	U+10500	U+1052F	40.
	U+10530	U+1056F	53
	U+10600	U+1077F	341
	U+10800	U+1083F	55
	U+10840	U+1085F	31
	U+10860	U+1087F	32.
	U+10880	U+108AF	40.
	U+108E0	U+108FF	26
	U+10900	U+1091F	29
	U+10920	U+1093F	27
	U+10980	U+1099F	32.
	U+109A0	U+109FF	90
	U+10A00	U+10A5F	65
	U+10A60	U+10A7F	32.
	U+10A80	U+10A9F	32.
	U+10AC0	U+10AFF	51
	U+10B00	U+10B3F	61
	U+10B40	U+10B5F	30
	U+10B60	U+10B7F	27
	U+10B80	U+10BAF	29
	U+10C00	U+10C4F	73
	U+10C80	U+10CFF	108
	U+10E60	U+10E7F	31
	U+11000	U+1107F	109
	U+11080	U+110CF	66
-	U+110D0	U+110FF	35
	U+11100	U+1114F	67
	U+11150	U+1117F	39.
	U+11180	U+111DF	94
	U+111E0	U+111FF	20
	U+11200	U+1124F	61
	U+11280	U+112AF	38.
	U+112B0	U+112FF	69
	U+11300	U+1137F	85
	U+11480	U+114DF	82
	U+11580	U+115FF	92
	U+11600	U+1165F	79
	U+11680	U+116CF	66
	U+11700	U+1173F	57
-	U+118A0	U+118FF	84
	U+11AC0	U+11AFF	57
	U+12000	U+123FF	922
	U+12400	U+1247F	116
	U+12480	U+1254F	196
	U+13000	U+1342F	1071
	U+14400	U+1467F	583
	U+16800	U+16A3F	569
	U+16A40	U+16A6F	43
	U+16AD0	U+16AFF	36.
	U+16B00	U+16B8F	127
	U+16F00	U+16F9F	133
	U+1B000	U+1B0FF	2
	U+1BC00	U+1BC9F	143
	U+1BCA0	U+1BCAF	4
	U+1D000	U+1D0FF	246
	U+1D100	U+1D1FF	231
	U+1D200	U+1D24F	70
« »	U+1D300	U+1D35F	87
	U+1D360	U+1D37F	18
	U+1D400	U+1D7FF	996
SignWriting	U+1D800	U+1DAAF	672
	U+1E800	U+1E8DF	213
	U+1EE00	U+1EEFF	143
	U+1F000	U+1F02F	44
	U+1F030	U+1F09F	100
	U+1F0A0	U+1F0FF	82
	U+1F100	U+1F1FF	173
	U+1F200	U+1F2FF	57
	U+1F300	U+1F5FF	766
	U+1F600	U+1F64F	80
	U+1F650	U+1F67F	48.
	U+1F680	U+1F6FF	98
	U+1F700	U+1F77F	116
	U+1F780	U+1F7FF	85
— C	U+1F800	U+1F8FF	148
	U+1F900	U+1F9FF	15
— B	U+20000	U+2A6DF	42676
— C	U+2A700	U+2B73F	60
— D	U+2B740	U+2B81F	27
— E	U+2B820	U+2CEAF	2
	U+2F800	U+2FA1F	542
Tags	U+E0000	U+E007F	97
	U+E0100	U+E01EF	240
— A	U+F0000	U+FFFFF	4
— B	U+100000	U+10FFFF	4

— - .
— , .
— .
— , . .
, — , . , .
— , . , [Ä] [A] [¨].
— .
— , , . .
— , .
— .

: c codepoints.net .

11.0 ()
10.0 ( , 20.06.2017 .)
9.0
8.0
7.0
6.3
6.2
6.1
6.0
5.2
5.1
5.0 ()
4.0.1
4.0

Esse adorável Unicode

Conteúdo

Breve introdução

Quais caracteres estão incluídos no Unicode Standard?

Codificações de caracteres Unicode

Fale sobre números

Pares substitutos UTF-16

Cálculo de pares substitutos

Composição e decomposição

Mitos Unicode

Codificações de aplicativos Unicode

Código fonte

Lista de personagens incríveis.

Caracteres especiais

Identificadores variáveis podem incluir espaços!

Modificadores

Colisões de transformação em maiúsculas

Colisões de conversão em minúsculas

Peculiaridades e solução de problemas

Uma para muitas comparações

Ótimos pacotes e bibliotecas

Emoji

HTML

More articles:

Esse adorável Unicode

Conteúdo

Breve introdução

Quais caracteres estão incluídos no Unicode Standard?

Codificações de caracteres Unicode

Fale sobre números

Pares substitutos UTF-16

Cálculo de pares substitutos

Composição e decomposição

Mitos Unicode

Codificações de aplicativos Unicode

Código fonte

Lista de personagens incríveis.

Caracteres especiais

Identificadores variáveis ​​podem incluir espaços!

Modificadores

Colisões de transformação em maiúsculas

Colisões de conversão em minúsculas

Peculiaridades e solução de problemas

Uma para muitas comparações

Ótimos pacotes e bibliotecas

Emoji

HTML

More articles:

Identificadores variáveis podem incluir espaços!