Hier finden Sie eine aktualisierte Liste der schönsten Unicode- "Goodies" sowie der Pakete und Ressourcen

Unicode ist großartig! Vor seinem Erscheinen war die internationale Kommunikation anstrengend: Jeder definierte seinen eigenen erweiterten Zeichensatz in der oberen Hälfte von ASCII (den sogenannten Codepages). Dies führte zu Konflikten. Man denke nur, dass die Deutschen mit den Koreanern verhandeln mussten, wo ist deren Codepage. Glücklicherweise erschien Unicode und führte einen gemeinsamen Standard ein. Unicode 8.0 umfasst mehr als 120.000 Zeichen aus über 129 Skripten. Sowohl moderne als auch alte und immer noch nicht entschlüsselt. Unicode unterstützt Text von links nach rechts und von rechts nach links, überlagert Zeichen und enthält eine Vielzahl von kulturellen, politischen, religiösen Symbolen und Emojis. Unicode ist erstaunlich menschlich und seine Fähigkeiten werden stark unterschätzt.

Inhalt

Kurze Einführung

Welche Zeichen sind in Unicode Standard enthalten?

Der Unicode-Standard definiert Codes für Zeichen in den wichtigsten modernen Sprachen. Dies sind europäische alphabetische Schriften, Schriften aus dem Nahen Osten von rechts nach links und viele asiatische Schriften.

Die Norm enthält auch Satzzeichen, diakritische Zeichen, mathematische Symbole, technische Symbole, Pfeile, Dingbats, Emojis usw. Sie enthält Codes für diakritische Zeichen, die Zeichen ändern, z. B. Tilden (~). Sie werden in Kombination mit einfachen Zeichen verwendet, um Zeichen mit Akzenten darzustellen (z. B. ñ). Im Allgemeinen bietet Unicode Version 9.0 Codes für 128.172 Zeichen aus Weltalphabeten, Ideogrammsätzen und Zeichensammlungen.

Die häufigsten Zeichen befinden sich in den ersten 64K-Codepunkten, einem Bereich des Codebereichs, der als mehrsprachige Hauptebene oder kurz BMP bezeichnet wird. Es stehen 16 weitere Ebenen zur Codierung anderer Zeichen mit über 850.000 nicht verwendeten Codepunkten zur Verfügung. Sie können nützlich sein, um zukünftigen Versionen des Standards neue Zeichen hinzuzufügen.

Der Unicode-Standard reserviert auch Codepunkte für den privaten Gebrauch. Anbieter oder Endbenutzer können sie in ihren eigenen Systemen für ihre Charaktere festlegen oder sie mit speziellen Schriftarten verwenden. Das BMP verfügt über 6400 Codepunkte für den privaten Gebrauch und weitere 131 068 zusätzliche Codepunkte für den privaten Gebrauch, wenn 6400 für bestimmte Anwendungen nicht ausreicht.

Unicode-Zeichenkodierungen

Zeichencodierungsstandards bestimmen nicht nur die Identität jedes Zeichens und seinen numerischen Wert oder Codepunkt, sondern auch, wie dieser Wert in Bits dargestellt wird.

Der Unicode-Standard definiert drei Codierungsformen, die die Übertragung derselben Daten ermöglichen: ein Byte, ein Wort und ein Doppelwort (d. H. 8, 16 oder 32 Bits pro Codeeinheit). Alle drei Formen codieren denselben gemeinsamen Zeichensatz und können effektiv ohne Datenverlust ineinander konvertiert werden. Das Unicode-Konsortium befürwortet uneingeschränkt die Verwendung einer dieser Kodierungsformen als vereinbarte Methode zur Implementierung des Unicode-Standards.

UTF-8 ist beliebt für HTML und ähnliche Protokolle. Mit UTF-8 können alle Unicode-Zeichen in eine Codierung mit variabler Bytelänge konvertiert werden. Der Vorteil besteht darin, dass Unicode-Zeichen, die dem bekannten ASCII-Satz entsprechen, dieselben Bytewerte wie ASCII haben und in UTF-8 konvertierte Unicode-Zeichen mit einer Vielzahl vorhandener Software ohne größere Softwaremodifikationen verwendet werden können.

UTF-16 ist in vielen Umgebungen beliebt, in denen ein Gleichgewicht zwischen effizientem Zugriff auf Zeichen und wirtschaftlichem Speicher erforderlich ist. Es ist recht kompakt und alle häufig verwendeten Zeichen sind in einem 16-Bit-Codeblock angeordnet, während alle anderen Zeichen über Paare von 16-Bit-Codeblöcken verfügbar sind.

UTF-32 ist nützlich, wenn die Speicherkapazität keine Rolle spielt, jedoch der Zugriff auf Zeichen in einem einzigen Code mit fester Breite erforderlich ist. Hier wird jedes Unicode-Zeichen in einem einzelnen 32-Bit-Codeblock codiert.

Alle drei Codierungsarten erfordern nicht mehr als 4 Bytes (oder 32 Bits) für jedes Zeichen.

Sprechen Sie über Zahlen

Der Unicode-Zeichensatz ist in 17 Hauptsegmente (Ebenen) unterteilt, die weiter in Blöcke unterteilt sind. In jeder Ebene gibt es einen Platz für 65 536 (2 ¹⁶ ) Codepunkte, wodurch insgesamt 1.114.112 Codepunkte erstellt werden. Es gibt zwei Flugzeuge für den privaten Gebrauch (Nr. 16 und Nr. 17), die nach Ermessen der Unternehmen / Nutzer zugeteilt werden. Sie haben 131.072 Codepunkte.

Nr	Titel	Reichweite
1.	Hauptflugzeug mehrsprachig	(von U + 0000 bis U + FFFF)
2.	Zusätzliches mehrsprachiges Flugzeug	(von U + 10000 bis U + 1FFFF)
3.	Zusätzliche ideografische Ebene	(von U + 20.000 bis U + 2FFFF)
4.	Tertiäre ideografische Ebene	(von U + 30000 bis U + 3FFFF)
5.	Flugzeug 5 (nicht verwendet)	(von U + 40.000 bis U + 4FFFF)
6.	Flugzeug 6 (nicht verwendet)	(von U + 50.000 bis U + 5FFFF)
7.	Flugzeug 7 (nicht verwendet)	(von U + 60.000 bis U + 6FFFF)
8.	Flugzeug 8 (nicht verwendet)	(von U + 70.000 bis U + 7FFFF)
9.	Flugzeug 9 (nicht verwendet)	(von U + 80.000 bis U + 8FFFF)
10.	Flugzeug 10 (nicht verwendet)	(von U + 90.000 bis U + 9FFFF)
11.	Flugzeug 11 (nicht verwendet)	(von U + A0000 bis U + AFFFF)
12.	Ebene 12 (nicht verwendet)	(von U + B0000 bis U + BFFFF)
13.	Ebene 13 (nicht verwendet)	(von U + C0000 bis U + CFFFF)
14.	Ebene 14 (nicht verwendet)	(von U + D0000 bis U + DFFFF)
15.	Spezialisiertes zusätzliches Flugzeug	(von U + E0000 bis U + EFFFF)
16.	Zusätzlicher Bereich für den privaten Gebrauch - A	(von U + F0000 bis U + FFFFF)
17.	Zusätzlicher Bereich für den privaten Gebrauch - B	(von U + 100000 bis U + 10FFFF)

Die erste Ebene wird als mehrsprachige Hauptebene oder BMP bezeichnet. Es enthält Codepunkte von U + 0000 bis U + FFFF, dh die am häufigsten verwendeten Zeichen. Die restlichen 16 Ebenen (U + 010000 → U + 10FFFF) werden zusätzlich oder astral genannt.

Ersatzpaare UTF-16

Symbole außerhalb der Hauptebene, wie ein Tetragramm, das die Mitte (U + 1D306) bedeutet, können in UTF-16 mit nur zwei 16-Bit-Codeeinheiten codiert werden: 0xD834 0xDF06. Dies wird als Ersatzpaar bezeichnet. Bitte beachten Sie, dass ein Ersatzpaar nur ein Zeichen darstellt.

Die erste Codeeinheit eines Ersatzpaares liegt immer im Bereich von 0xD800 bis 0xDBFF und wird als oberer Teil des Paares bezeichnet.

Die zweite Codeeinheit des Ersatzpaares liegt immer im Bereich von 0xDC00 bis 0xDFFF und wird als unterste der Paare bezeichnet.

Matthias Binens

Ersatzcode-Paar: Eine Darstellung eines abstrakten Symbols, bestehend aus einer Folge von zwei 16-Bit-Code-Einheiten, wobei der erste Wert des Paares die oberste Ersatzcode-Einheit und der zweite die untere Ersatzcode-Einheit ist. Ersatzpaare werden nur in UTF-16 verwendet.

Unicode 8.0 Kapitel 3.8 - Ersatzzeichen

Berechnung von Ersatzpaaren

Das Unicode-Zeichen "Pile of Shit" (U + 1F4A9) in UTF-16 muss als Ersatzpaar codiert werden, dh als zwei Ersatzzeichen. Verwenden Sie diesen Algorithmus (in JavaScript), um einen Codepunkt in ein Ersatzpaar umzuwandeln. Denken Sie daran, dass wir hexadezimale Notation verwenden.

var High_Surrogate = function(Code_Point){ return Math.floor((Code_Point - 0x10000) / 0x400) + 0xD800 }; var Low_Surrogate = function(Code_Point){ return (Code_Point - 0x10000) % 0x400 + 0xDC00 }; // Reverses The Conversion var Code_Point = function(High_Surrogate, Low_Surrogate){ return (High_Surrogate - 0xD800) * 0x400 + Low_Surrogate - 0xDC00 + 0x10000; };

Zusammensetzung und Zersetzung

Unicode enthält einen Mechanismus zum Ändern der Form eines Zeichens, durch den die unterstützte Menge von Glyphen erheblich erweitert wird. Dies gilt für kombinierbare diakritische Zeichen. Sie werden nach dem Hauptcharakter eingefügt. Es können mehrere diakritische Zeichen auf dasselbe Zeichen angewendet werden. Unicode enthält auch vorkompilierte Versionen der meisten dieser Kombinationen für den normalen Gebrauch.

Einige Zeichenfolgen können auch als ein einzelnes Zeichen dargestellt werden, das als vorkomponiertes Zeichen oder als zusammengesetztes Zeichen bezeichnet wird. Beispielsweise kann das Zeichen [ü] als einziger Codepunkt U + 00FC oder als Basiszeichen U + 0075 (u) gefolgt vom nicht eigenständigen Zeichen U + 0308 (¨) codiert werden. Der Unicode-Standard codiert zusammengesetzte Zeichen, um die Kompatibilität mit gängigen Standards wie Latin 1 zu gewährleisten. Dazu gehören viele zusammengesetzte Zeichen wie [ü] und [ñ].

Zusammengesetzte Zeichen können aus Gründen der Konsistenz oder Analyse erweitert werden. Wenn Sie beispielsweise alphabetisch sortieren, kann das Symbol [ü] in [u] gefolgt vom nicht unabhängigen Symbol [¨] zerlegt werden. Nach einer solchen Zerlegung ist es einfacher, mit einer Folge von Zeichen zu arbeiten. Dies erleichtert das Sortieren in Sprachen, in denen sich Zeichenmodifikatoren nicht auf die alphabetische Reihenfolge auswirken. Der Unicode-Standard legt die Zerlegungsreihenfolge für alle zusammengesetzten Zeichen fest. Es definiert auch Formen der Normalisierung, um eindeutige Darstellungen von Zeichen bereitzustellen.

Unicode-Mythen

Aus den Folien der Präsentation von Mark Davis "Mythen von Unicode".

Unicode ist nur 16-Bit-Code . - Einige Leute glauben fälschlicherweise, dass Unicode nur ein 16-Bit-Code ist, bei dem jedes Zeichen 16 Bit belegt, und daher gibt es 65.536 mögliche Zeichen. In der Tat ist dies nicht ganz richtig. Dies ist der häufigste Unicode-Mythos. Wenn Sie dies auch schon einmal dachten, lassen Sie sich nicht entmutigen.
Sie können jeden Codepunkt verwenden, der nicht für Ihre Anforderungen verwendet wird . - Nein. Eines Tages wird dieser Ort durch ein anderes Symbol ersetzt. Verwenden Sie stattdessen Flugzeuge für den privaten Gebrauch oder Bereiche ohne Zeichen in jeder Ebene, in denen standardmäßig keine Zeichen vorhanden sind.
Jeder Unicode-Codepunkt repräsentiert ein Zeichen . - Nein. Es gibt viele Punkte ohne Zeichen (FFFE, FFFF, 1FFFE usw.), außerdem Ersatzcodepunkte, private und nicht verwendete Codepunkte sowie Steuer- / Formatierungszeichen (RLM, ZWNJ usw.).
Unicode hat keinen Speicherplatz mehr . - Wenn es linear gefüllt wäre, wäre es 2140 zu Ende gegangen. Der Platz füllt sich aber nicht linear. Zukunftspläne finden Sie hier .
Alle Zeichen sind eins zu eins zugeordnet . - Nein. Die Optionen sind:
- Eins zu viele: (β → SS)
- Vor dem Hintergrund: (... Σ ← → ... ς und gleichzeitig ... ΣΤ ... ← → ... στ ...)
- Basierend auf dem Gebietsschema: (I ← → ı und gleichzeitig İ ← → i)

Unicode-Anwendungscodierungen

Codierungsart	Beispiel
HTML-Objekt (dezimal)
HTML-Objekt (hex)
URL-Kontrollcode	% F0% 9F% 96% 96
UTF-8 (hex)	0xF0 0x9F 0x96 0x96 (f09f9696)
UTF-8 (binär)	11110000: 10011111: 10010110: 10010110
UTF-16 / UTF-16BE (hex)	0xD83D 0xDD96 (d83ddd96)
UTF-16LE (hex)	0x3DD8 0x96DD (3dd896dd)
UTF-32 / UTF-32BE (hex)	0x0001F596 (0001f596)
UTF-32LE (hex)	0x96F50100 (96f50100)
Oktale Escape-Sequenz	\ 360 \ 237 \ 226 \ 226

Quellcode

Codierungsart	Beispiel
Javascript	\ u1F596
Json	\ u1F596
C	\ u1F596
C ++	\ u1F596
Java	\ u1F596
Python	\ u1F596
Perl	\ x {1F596}
Ruby	\ u {1F596}
CSS	\ 01F596

Liste der erstaunlichen Charaktere.

Das Teilen eines Dokuments kann die Bearbeitung schnell in einen schriftlichen Rap-Kampf verwandeln, der von einer zunehmend verwirrenden Anordnung von Managern von U + 202a bis U + 202e geführt wird

Sonderzeichen

Das Unicode-Konsortium hat ein allgemeines Interpunktionsdiagramm veröffentlicht, in dem Sie weitere Informationen finden.

Symbol	Titel	Beschreibung
`''`	U + FEFF Unterbrechungsfreier Raum der Breite Null (Byte Order Mark - BOM)	Es hat eine wichtige Eigenschaft der Eindeutigkeit, wenn die Reihenfolge der Bytes geändert wird. Es hat auch keine Breite und Unsichtbarkeit. In unangemessener Software (wie einem PHP-Interpreter) führt dies zu allen möglichen Beispielen für unterhaltsames Verhalten.
`'￯'`	'\ uFFEF' Stückliste stornieren	Mit Ausnahme des Textanfangs nicht mit einem Zeichen gleichgesetzt.
`''`	'\ u200B' Nicht unterbrechender Raum mit einer Breite von Null	Ein Symbol ohne Aussehen und ohne Wirkung, außer um die Bildung von Ligaturen zu verhindern.
`' '`	U + 00A0 Raum ohne Unterbrechung	Lässt benachbarte Zeichen zusammenhalten. Bekannt als ` ` in HTML.
`''`	U + 00AD Weicher Bindestrich	In HTML funktioniert es wie ein Leerzeichen ohne Breite, aber wenn es auf das Ende einer Zeile trifft (und nur in diesem Fall), wird ein Bindestrich angezeigt.
`'‍'`	U + 200D Nullbreitenzeichen (mit Anschluss)	Bewirkt, dass benachbarte Zeichen verbunden werden (z. B. arabische Zeichen oder unterstützte Emojis). Kann für sequentiell kombinierte Emojis verwendet werden.
`'⁠'`	U + 2060 Word Connector	Wie U + 00A0, jedoch völlig unsichtbar. Gut für @ font-face auf Twitter.
`' '`	U + 1680 Ogham Leerzeichen	Markiert ein Leerzeichen, das wie ein Bindestrich aussieht. Großartig, um Programmierer dem Wahnsinn näher zu bringen: 1 + 2 === 3.
`';'`	U + 037E Griechisches Fragezeichen	Sieht aus wie ein Semikolon. Auch eine lustige Art, Entwickler zu trollen.
`'‭'`	U + 202D	Ändert die Richtung des Texts von links nach rechts.
`'‮'`	U + 202E	Ändert die Richtung des Texts von rechts nach links.
`'ꓸ'`	U + A4F8 Lisu Buchstabenton mya ti	Verdoppeln Sie für den Punkt.
`'ꓹ'`	U + A4F9 Lisu Buchstabenton na po	Double für ein Komma.
`'ꓼ'`	U + A4FC Lisu Buchstabenton mya na	Double für Semikolon.
`'ꓽ'`	U + A4FD Lisu Buchstabenton mya jeu	Double für den Doppelpunkt.
`'︀'`	Optionsschalter (von U + FE00 bis U + FE0F und von U + E0100 bis U + E01EF)	Ein Block mit 256 Zeichen der Breite Null mit der Eigenschaft ID_Continue kann in Variablennamen (nicht im ersten Buchstaben) verwendet werden. Das Besondere an ihnen ist, dass der Mauszeiger über sie fährt, da sie im Gegensatz zu den meisten anderen Zeichen mit der Breite Null Zeichen kombinieren.
`'ᅟ'`	U + 115F Platzhalter Hangul Choson	Füllt im Wesentlichen den Raum. Wird als Zeichen mit der Breite Null (unsichtbar) gerendert, sofern dies beim Rendern nicht ausdrücklich unterstützt wird. Als ID_Start markiert
`'ᅠ'`	U + 1160 Platzhalter Chunson	Vielleicht füllt der Raum? Wird als Zeichen mit der Breite Null (unsichtbar) gerendert, sofern dies beim Rendern nicht ausdrücklich unterstützt wird. Als ID_Start markiert
`'ㅤ'`	U + 3164 Hangul-Aggregat	Im Allgemeinen füllt es den Raum. Wird als Zeichen mit der Breite Null (unsichtbar) gerendert, sofern dies beim Rendern nicht ausdrücklich unterstützt wird. Als ID_Start markiert

Warten Sie ... was habe ich gerade gelesen?

Variablenbezeichner können Leerzeichen enthalten!

Der Hangul-Platzhalter U + 3164 wird als breites Leerzeichen angezeigt. Wenn das Zeichen beim Rendern eindeutig nicht unterstützt wird, wird es als vollständig unsichtbar angezeigt (und beansprucht keinen Platz, d. H. "Breite Null"). Dies bedeutet, dass Sie niemals ein hässliches Zeichen als Ersatzzeichen ( ) sehen werden.

Ich bin mir noch nicht sicher, warum U + 3164 angewiesen ist, sich so zu verhalten. Interessanterweise wurde U + 3164 in Version 1.1 (1993) zu Unicode hinzugefügt - so hatten die Konsortialspezialisten viel Zeit, um darüber nachzudenken. Wie auch immer, hier sind ein paar Beispiele.

 > var ᅟ = 'foo'; undefined > ᅟ 'foo' > var ㅤ= alert; undefined > var foo = 'bar' undefined > if ( foo ===ㅤ`baz` ){} // alert undefined > var varㅤfooㅤ\u{A60C}ㅤπ = 'bar'; undefined > varㅤfooㅤꘌㅤπ 'bar'

** Hinweis: ** Ich habe U + 3164-Rendering unter Ubuntu und OS X mit den folgenden Parametern getestet: `node`,` php`, `ruby`,` python3.5`, `scala`,` vim`, `cat` , `chrome` +` github gist '. Atom ist das einzige System, bei dem (fälschlicherweise) leere Felder angezeigt werden. Ich habe den Code in Emacs und Sublime noch nicht überprüft. Soweit ich weiß, weist das Unicode-Konsortium keine Zeichen oder Codepunkte neu zu oder benennt sie um, kann jedoch dazu überredet werden, die Eigenschaften von Zeichen wie ID_Start und ID_Continue zu ändern.

Modifikatoren

Zero Width Combiner (ZWJ) ist ein nicht druckbares Zeichen in einem Computersatz komplexer Schriftarten, z. B. arabischer oder indischer Schriftarten. Wenn sie zwischen zwei Zeichen platziert werden, die sonst nicht verbunden wären, werden sie von ZWJ gezwungen, in kombinierter Form zu drucken.

Der Zero Width Disconnector (ZWNJ) ist ein nicht druckbares Zeichen in computergestützten Schreibsätzen mit Ligaturen. Wenn sie zwischen zwei Zeichen platziert werden, die ansonsten zu einer Ligatur verbunden wären, werden sie von ZWNJ gezwungen, in ihrer endgültigen bzw. ursprünglichen Form zu drucken. Fungiert als Leerzeichen, wird jedoch verwendet, wenn es wünschenswert ist, Wörter nahe beieinander zu halten oder ein Wort mit seinem Morphem zu kombinieren.

 > 'a' "a" > 'a\u{0308}' "ä" > 'a\u{20DE}\u{0308}' "a⃞̈" > 'a\u{20DE}\u{0308}\u{20DD}' "a⃞̈⃝" // Modifying Invisible Characters > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}' "‎‎‎‎‎‎‎‎‎‎" > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}'.length 10

Großbuchstaben transformieren Kollisionen

Symbol	Codepunkt	Ergebnis
ß	0x00DF	`SS`
ı	0x0131	`I`
ſ	0x017F	`S`
ﬀ	0xFB00	`FF`
fi	0xFB01	`FI`
fl	0xFB02	`FL`
ﬃ	0xFB03	`FFI`
ﬄ	0xFB04	`FFL`
ﬅ	0xFB05	`ST`
ﬆ	0xFB06	`ST`

Konvertierungskollisionen in Kleinbuchstaben

Symbol	Codepunkt	Ergebnis
K	0x212A	`k`

Macken und Fehlerbehebung

Die Linienlänge wird normalerweise durch die Anzahl der Codepunkte bestimmt . Dies bedeutet, dass Ersatzpaare als zwei Zeichen betrachtet werden. Einem Symbol können mehrere diakritische Zeichen überlagert werden: a + ̈ == ̈a . Dies erhöht die Länge der Zeichenfolge und erzeugt nur ein Zeichen.
In ähnlicher Weise wird die String-Inversion häufig zu einer nicht trivialen Aufgabe . Auch hier sollten Ersatzpaare und diakritische Zeichen gemeinsam vertauscht werden. ES Reverser bietet eine ziemlich gute Lösung.

Vergleiche zwischen Groß- und Kleinbuchstaben stimmen nicht immer überein . Sie können in solchen Beziehungen ausgedrückt werden:

Eins zu viele: (ß → SS)
Vor dem Hintergrund: (... Σ ← → ... ς und ... ΣΤ ... ← → ... στ ...)
Basierend auf dem Gebietsschema: (I ← → ı und İ ← → i)

Ein bis viele Vergleiche

Die meisten der unten aufgeführten Zeichen drücken ihre Eins-zu-Viele-Zuordnungen in Großbuchstaben und andere in Kleinbuchstaben aus. Grundsätzlich kann die Liste in zwei Teile unterteilt werden.

Codepunkt	Symbol	Titel	Assoziierter Charakter	Zugehörige Codepunkte
U + 00DF	`ß`	Lateinisches Kleinbuchstaben-Escet (S-akut)	`s` , `s`	U + 0073, U + 0073
U + 0130	`İ`	Lateinischer Großbuchstabe "I" mit einem Punkt darüber	`i` , `̇`	U + 0069, U + 0307
U + 0149	`ŉ`	Lateinischer Kleinbuchstabe "n" nach dem vorhergehenden Apostroph	`ʼ` , `n`	U + 02BC, U + 006E
U + 01F0	`ǰ`	Lateinischer Kleinbuchstabe j	`j` , `̌`	U + 006A, U + 030C
U + 0390	`ΐ`	Griechische Kleinbuchstaben Iota mit Dialyse und Tonos.	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 03B0	`ΰ`	Griechischer Kleinbuchstabe Ipsilon mit Dialyse und Tonos.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 0587	`և`	Armenische Kleinligatur ech yiwn	`ե` , `ւ`	U + 0565, U + 0582
U + 1E96	`ẖ`	Lateinischer Kleinbuchstabe h mit einer Zeile darunter	`h` ,	U + 0068, U + 0331
U + 1E97	`ẗ`	Lateinischer Kleinbuchstabe t mit Dierese	`t` , `̈`	U + 0074, U + 0308
U + 1E98	`ẘ`	Lateinischer Kleinbuchstabe w mit Ring oben	`w` , `̊`	U + 0077, U + 030A
U + 1E99	`ẙ`	Lateinischer Kleinbuchstabe y mit Ring oben	`y` , `̊`	U + 0079, U + 030A
U + 1E9A	`ẚ`	Lateinischer Kleinbuchstabe a mit rechter Ringhälfte	`a` , `ʾ`	U + 0061, U + 02BE
U + 1E9E	`ẞ`	Lateinischer Großbuchstabe akut s	`s` , `s`	U + 0073, U + 0073
U + 1F50	`ὐ`	Griechischer Kleinbuchstabe Ipsilon mit Psil	`̓` , `̓`	U + 03C5, U + 0313
U + 1F52	`ὒ`	Griechischer Kleinbuchstabe Ipsilon mit Psili und Varia	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0300
U + 1F54	`ὔ`	Griechischer Kleinbuchstabe Ipsilon mit Psily und Oxy	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0301
U + 1F56	`ὖ`	Griechischer Kleinbuchstabe Ipsilon mit Psily und Perisom	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0342
U + 1F80	`ᾀ`	Griechischer Kleinbuchstabe Alpha mit Psili und Ipogemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F81	`ᾁ`	Griechischer Kleinbuchstabe Alpha mit Dasia und Ipogemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F82	`ᾂ`	Griechischer Kleinbuchstabe Alpha mit Psilia und Varia und Ipogemen	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F83	`ᾃ`	Griechischer Kleinbuchstabe Alpha mit Dasia und Varia und Ipogemen	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F84	`ᾄ`	Griechischer Kleinbuchstabe Alpha mit Psily und Oxy und Ipogemen	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F85	`ᾅ`	Griechischer Kleinbuchstabe Alpha mit Dasia und Oxy und Ipogemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F86	`ᾆ`	Griechischer Kleinbuchstabe Alpha mit Psily und Perispomenti und Ipogemen	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F87	`ᾇ`	Griechischer Kleinbuchstabe Alpha mit Dasia und Perispomenti und Hypogrammen	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F88	`ᾈ`	Griechischer Großbuchstabe Alpha mit Psil und Programmierern	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F89	`ᾉ`	Griechischer Großbuchstabe Alpha mit Dasia und Programmierern	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F8A	`ᾊ`	Griechischer Großbuchstabe Alpha mit Psilia und Varia und Programmen	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F8B	`ᾋ`	Griechischer Großbuchstabe Alpha mit Dasia und Varia und Prog	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F8C	`ᾌ`	Griechischer Großbuchstabe Alpha mit Psily und Oxy und Prog	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F8D	`ᾍ`	Griechischer Großbuchstabe Alpha mit Dasia und Oxy und Programmierern	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F8E	`ᾎ`	Griechischer Großbuchstabe Alpha mit Psily und Perispomenti und Programmierkenntnissen	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F8F	`ᾏ`	Griechischer Großbuchstabe Alpha mit Dasia und Perispomenti und Progs	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F90	`ᾐ`	Griechischer Kleinbuchstabe dieses mit psily und ipogemen	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F91	`ᾑ`	Griechischer Kleinbuchstabe a mit Dasia und Ipogemen	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F92	`ᾒ`	Griechischer Kleinbuchstabe dies mit Psilia und Varia und Ipogemen	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F93	`ᾓ`	Griechischer Kleinbuchstabe eta mit demia und varia und ipogemen	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F94	`ᾔ`	Griechischer Kleinbuchstabe a mit Psilia und Oksia und Ipogemen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F95	`ᾕ`	Griechischer Kleinbuchstabe eta mit demia und oksia und ipogemen	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F96	`ᾖ`	Griechischer Kleinbuchstabe dieses mit psily und perispomenti und ipogemen	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F97	`ᾗ`	Griechischer Kleinbuchstabe eta mit Dasia und Perisopmenti und Hypogrammen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1F98	`ᾘ`	Griechischer Großbuchstabe dies mit Psila und Programmen	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F99	`ᾙ`	Griechischer Großbuchstabe dies mit Dasia und Programmierern	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F9A	`ᾚ`	Griechischer Großbuchstabe dies mit Psilia und Varia und Prosgrammemenie	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F9B	`ᾛ`	Griechischer Großbuchstabe dies mit Dasia und Varia und Prosgrammemenie	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F9C	`ᾜ`	Griechischer Großbuchstabe dies mit Psilia und Oxy und Programmen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F9D	`ᾝ`	Griechischer Großbuchstabe dies mit Dasia und Oksia und Programmierern	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F9E	`ᾞ`	Griechischer Großbuchstabe dies mit psily und perispomenty und prosgrammeny	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F9F	`ᾟ`	Griechischer Großbuchstabe dies mit Dasia und Perispomenti und Programmen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1FA0	`ᾠ`	Griechischer Kleinbuchstabe Omega mit Psili und Ipogemen	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA1	`ᾡ`	Griechischer Kleinbuchstabe Omega mit Dasia und Ipogemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FA2	`ᾢ`	Griechischer Kleinbuchstabe Omega mit Psilia und Varia und Ipogemen	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FA3	`ᾣ`	Griechischer Kleinbuchstabe Omega mit Dasia und Varia und Ipogemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FA4	`ᾤ`	Griechischer Kleinbuchstabe Omega mit Psily und Oxy und Ipogemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FA5	`ᾥ`	Griechischer Kleinbuchstabe Omega mit Dasia und Oxy und Ipogemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FA6	`ᾦ`	Griechischer Kleinbuchstabe Omega mit psily und perispomenti und ipogemen	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FA7	`ᾧ`	Griechischer Kleinbuchstabe Omega mit Dasia und Perispomenti und Hypogrammemen	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FA8	`ᾨ`	Griechischer Großbuchstabe Omega mit Psili und Programm	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA9	`ᾩ`	Griechischer Großbuchstabe Omega mit Dasia und Programmierern	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FAA	`ᾪ`	Griechischer Großbuchstabe Omega mit Psilia und Varia und Prosgrammemeny	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FAB	`ᾫ`	Griechischer Großbuchstabe Omega mit Dasia und Varia und Programmierern	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FAC	`ᾬ`	Griechischer Großbuchstabe Omega mit Psilia und Oxy und Progamemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FAD	`ᾭ`	Griechischer Großbuchstabe Omega mit Dasia und Oksia und Programmierern	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FAE	`ᾮ`	Griechischer Großbuchstabe Omega mit Psily und Perispomenti und Prosgrammemeny	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FAF	`ᾯ`	Griechischer Großbuchstabe Omega mit Dasia und Perispomenti und Prosgrammemeny	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FB2	`ᾲ`	Griechischer Kleinbuchstabe Alpha mit Varia und Ipogemen	`ὰ` , `ι`	U + 1F70, U + 03B9
U + 1FB3	`ᾳ`	Griechischer Kleinbuchstabe Alpha mit Ogogerammeni	`α` , `ι`	U + 03B1, U + 03B9
U + 1FB4	`ᾴ`	Griechischer Kleinbuchstabe Alpha mit Oxy und Ipogemen	`ά` , `ι`	U + 03AC, U + 03B9
U + 1FB6	`ᾶ`	Griechischer Kleinbuchstabe Alpha mit Perispomenti	`α` ,	U + 03B1, U + 0342
U + 1FB7	`ᾷ`	Griechischer Kleinbuchstabe Alpha mit Perispomenti und Ipogemen	`α` , `͂` `ι`	U + 03B1, U + 0342, U + 03B9
U + 1FBC	`ᾼ`	Griechischer Großbuchstabe Alpha mit Progs	`α` , `ι`	U + 03B1, U + 03B9
U + 1FC2	`ῂ`	Griechischer Kleinbuchstabe et mit varia und ipogemen	`ὴ` , `ι`	U + 1F74, U + 03B9
U + 1FC3	`ῃ`	Griechischer Kleinbuchstabe a mit ipogemen	`η` , `ι`	U + 03B7, U + 03B9
U + 1FC4	`ῄ`	Griechischer Kleinbuchstabe eta mit oxy und ipogemen	`ή` , `ι`	U + 03AE, U + 03B9
U + 1FC6	`ῆ`	Griechischer Kleinbuchstabe a mit Perispomenti	`η` ,	U + 03B7, U + 0342
U + 1FC7	`ῇ`	Griechischer Kleinbuchstabe a mit Perispomenti und Ipogemen	`η` , `͂` `ι`	U + 03B7, U + 0342, U + 03B9
U + 1FCC	`ῌ`	Griechischer Großbuchstabe dies mit Prog	`η` , `ι`	U + 03B7, U + 03B9
U + 1FD2	`ῒ`	Griechische Kleinbuchstaben Iota mit Dialyse und Varia	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0300
U + 1FD3	`ΐ`	Griechischer Kleinbuchstabe Iota mit Dialyse und Oxy	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 1FD6	`ῖ`	Griechische Kleinbuchstaben Iota mit Perispomenti	`ι` ,	U + 03B9, U + 0342
U + 1FD7	`ῗ`	Griechischer Kleinbuchstabe Iota mit Dialyse und Periode	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0342
U + 1FE2	`ῢ`	Griechischer Kleinbuchstabe Ipsilon mit Dialyse und Varia.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0300
U + 1FE3	`ΰ`	Griechischer Kleinbuchstabe Ipsilon mit Dialyse und Oxy.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 1FE4	`ῤ`	Griechisches Rho in Kleinbuchstaben mit Psili	`ρ` , `̓`	U + 03C1, U + 0313
U + 1FE6	`ῦ`	Griechischer Kleinbuchstabe Ipsilon mit Perispomenti	`υ`	U + 03C5, U + 0342
U + 1FE7	`ῧ`	Griechischer Kleinbuchstabe Ipsilon mit Dialyse und Punkt	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0342
U + 1FF2	`ῲ`	Griechischer Kleinbuchstabe Omega mit Varia und Ipogemen	`ὼ` , `ι`	U + 1F7C, U + 03B9
U + 1FF3	`ῳ`	Griechischer Kleinbuchstabe Omega mit Ogogerammeni	`ω` , `ι`	U + 03C9, U + 03B9
U + 1FF4	`ῴ`	Griechischer Kleinbuchstabe Omega mit Oxia und Ipogemen	`ώ` , `ι`	U + 03CE, U + 03B9
U + 1FF6	`ῶ`	Griechischer Kleinbuchstabe Omega mit Perispomenti	`ω` ,	U + 03C9, U + 0342
U + 1FF7	`ῷ`	Griechischer Kleinbuchstabe Omega mit Perispomenti und Ipogemen	`ω` , `͂` `ι`	U + 03C9, U + 0342, U + 03B9
U + 1FFC	`ῼ`	Griechischer Großbuchstabe Omega mit Programm	`ω` , `ι`	U + 03C9, U + 03B9
U + FB00	`ﬀ`	Lateinische Kleinbuchstaben Ff	`f` `f`	U + 0066, U + 0066
U + FB01	`ﬁ`	Lateinische Kleinbuchstaben Fi	`f` , `i`	U + 0066, U + 0069
U + FB02	`ﬂ`	Lateinische Kleinbuchstaben Fl	`f` `l`	U + 0066, U + 006C
U + FB03	`ﬃ`	Lateinische Kleinbuchstaben Ffi	`f` , `f` , `i`	U + 0066, U + 0066, U + 0069
U + FB04	`ﬄ`	Lateinische Kleinbuchstaben Ffl	`f` , `f` , `l`	U + 0066, U + 0066, U + 006C
U + FB05	`ﬅ`	Lateinische Kleinbuchstaben lang ST	`s` , `t`	U + 0073, U + 0074
U + FB06	`ﬆ`	Lateinische Kleinbuchstaben St	`s` , `t`	U + 0073, U + 0074
U + FB13	`ﬓ`	Armenische Kleinbuchstaben Men Now	`մ` , `ն`	U + 0574, U + 0576
U + FB14	`ﬔ`	Armenische Kleinbuchstaben Männer Ech	`մ` , `ե`	U + 0574, U + 0565
U + FB15	`ﬕ`	Armenische Kleinbuchstaben Men Ini	`մ` , `ի`	U + 0574, U + 056B
U + FB16	`ﬖ`	Armenische Kleinbuchstaben Vew Now	`վ` , `ն`	U + 057E, U + 0576
U + FB17	`ﬗ`	Armenische Kleinbuchstaben Men Xeh	`մ` , `խ`	U + 0574, U + 056D

Tolle Pakete und Bibliotheken

PhantomScript -: ghost :: flashlight : Ausführen von unsichtbarem JavaScript und Social Engineering
ESReverser - Unicode- basiertes JavaScript-String-Handling.
mimic - Missbrauch von Unicode
python-ftfy - Versucht, die maximale korrekte und vollständige Darstellung des in Unicode empfangenen Texts zu erstellen.
vim-troll-stopper - Schützen Sie Ihren Code vor Unicode-Trollen.

Emoji

Unicode-Konsortium-Emoji-Diagramm
Emojipedia - Informationen zu einem bestimmten Emoji, News-Blog.
emojitracker — Twitter.
World Translation Foundation — , , .
Can I Emoji? — iOS, Android Windows.

Unicode (diversity), . .

, , . — . :

	Rezept
U+1F469 U+200D U+2764 U+FE0F U+200D U+1F469
U+1F468 U+200D U+1F468 U+200D U+1F467 U+200D U+1F466

, .

8.0 ( 2015 ) - . , ( , FitzpatrickSkinType.pdf). .

Unicode

Code	Titel	Beispiele
U+1F3FB	-1-2
U+1F3FC	-3
U+1F3FD	-4
U+1F3FE	-5
U+1F3FF	-6

, \u{1F466}\u{1F3FE} .

+

→

JavaScript (ES6)

, ID_START , . , ID_CONTINUE , .

 // How convenient! var π = Math.PI; // Sometimes, you just have to use the Bad Parts of JavaScript: var ಠ_ಠ = eval; // Code, YU NO WORK?! var ლ_ಠ益ಠ_ლ = 42; // How about a JavaScript library for functional programming? var λ = function() {}; // Obfuscate boring variable names for great justice var \u006C\u006F\u006C\u0077\u0061\u0074 = 'heh'; // …or just make up random ones var Ꙭൽↈⴱ = 'huh'; // While perfectly valid, this doesn't work in most browsers: var foo\u200Cbar = 42; // This is *not* a bitwise left shift (`<<`): var 〱〱 = 2; // This is, though: 〱〱 << 〱〱; // 8 // Give yourself a discount: var price_9̶9̶_89 = 'cheap'; // Fun with Roman numerals var Ⅳ = 4; var Ⅴ = 5; Ⅳ + Ⅴ; // 9 // Cthulhu was here var Hͫ̆̒̐ͣ̊̄ͯ͗͏̵̗̻̰̠̬͝ͅE̴̷̬͎̱̘͇͍̾ͦ͊͒͊̓̓̐_̫̠̱̩̭̤͈̑̎̋ͮͩ̒͑̾͋͘Ç̳͕̯̭̱̲̣̠̜͋̍O̴̦̗̯̹̼ͭ̐ͨ̊̈͘͠M̶̝̠̭̭̤̻͓͑̓̊ͣͤ̎͟͠E̢̞̮̹͍̞̳̣ͣͪ͐̈T̡̯̳̭̜̠͕͌̈́̽̿ͤ̿̅̑Ḧ̱̱̺̰̳̹̘̰́̏ͪ̂̽͂̀͠ = 'Zalgo';

CSS .

 <!-- place this within the document head --> <meta charset="UTF-8" /> <!-- error message --> <div class="ಠ_ಠ">You do not have access to this page.</div> <!-- success message --> <div class="">Your changes have been saved successfully!</div>

 .ಠ_ಠ { border: 1px solid #f00; } . { background: lightgreen; }

HTML

HTML- , , .

, HTML .

 // U+1160 HANGUL JUNGSEONG FILLER transformAllTags('ᅠ'); // An actual HTML element node designed to look like a comment node, using the U+01C3 LATIN LETTER RETROFLEX CLICK // <ǃ-- name="viewport" content="width=device-width"></ǃ--> transformAllTags('ǃ--'); // or even <ᅠ⃝ transformAllTags('\u{1160}\u{20dd}'); // and for a bonus, all existing tag names will have each character ensquared. h⃞t⃞m⃞l⃞ transformAllTags(); function transformAllTags (newName){ // querySelectorAll doesn't actually return an array. Array.from(document.querySelectorAll('*')) .forEach(function(x){ transformTag(x, newName); }); } function wonky(str){ return str.split('').join('\u{20de}') + '\u{20de}'; } function transformTag(tagIdOrElem, tagType){ var elem = (tagIdOrElem instanceof HTMLElement) ? tagIdOrElem : document.getElementById(tagIdOrElem); if(!elem || !(elem instanceof HTMLElement))return; var children = elem.childNodes; var parent = elem.parentNode; var newNode = document.createElement(tagType||wonky(elem.tagName)); for(var a=0;a<elem.attributes.length;a++){ newNode.setAttribute(elem.attributes[a].nodeName, elem.attributes[a].value); } for(var i= 0,clen=children.length;i<clen;i++){ newNode.appendChild(children[0]); //0...always point to the first non-moved element } newNode.style.cssText = elem.style.cssText; parent.replaceChild(newNode,elem); }

 function testBegin(str){ try{ eval(`document.createElement( '${str}' );`) return true; } catch(e){ return false; } } function testContinue(str){ try{ eval(`document.createElement( 'a${str}' );`) return true; } catch(e){ return false; } }

 // Test if dashes can start an HTML Tag > testBegin('-') < false > testContinue('-') < true > testBegin('ᅠ-') // Prepend dash with U+1160 HANGUL JUNGSEONG FILLER < true

TrueType OpenType UTF-8, 65 535 . 1,1 UTF-8, .

256 .

, () (CJK). , , « ».

. 17- .

Titel	Von	Zu	#
	U+0000	U+007F	128
— 1	U+0080	U+00FF	128
— A	U+0100	U+017F	128
— B	U+0180	U+024F	208
	U+0250	U+02AF	96
	U+02B0	U+02FF	80
	U+0300	U+036F	112
	U+0370	U+03FF	135
	U+0400	U+04FF	256
	U+0500	U+052F	48
	U+0530	U+058F	89
	U+0590	U+05FF	87
	U+0600	U+06FF	255
	U+0700	U+074F	77
	U+0750	U+077F	48
	U+0780	U+07BF	50
	U+07C0	U+07FF	59
	U+0800	U+083F	61
	U+0840	U+085F	29.
— A	U+08A0	U+08FF	50
	U+0900	U+097F	128
	U+0980	U+09FF	93
	U+0A00	U+0A7F	79
	U+0A80	U+0AFF	85
	U+0B00	U+0B7F	90
	U+0B80	U+0BFF	72
	U+0C00	U+0C7F	96
	U+0C80	U+0CFF	87
	U+0D00	U+0D7F	100
	U+0D80	U+0DFF	90
	U+0E00	U+0E7F	87
	U+0E80	U+0EFF	67
	U+0F00	U+0FFF	211
	U+1000	U+109F	160
	U+10A0	U+10FF	88
	U+1100	U+11FF	256
	U+1200	U+137F	358
	U+1380	U+139F	26
	U+13A0	U+13FF	92
	U+1400	U+167F	640
	U+1680	U+169F	29.
Runen	U+16A0	U+16FF	89
	U+1700	U+171F	20
	U+1720	U+173F	23
	U+1740	U+175F	20
	U+1760	U+177F	18
	U+1780	U+17FF	114
	U+1800	U+18AF	156
	U+18B0	U+18FF	70
	U+1900	U+194F	68
	U+1950	U+197F	35
	U+1980	U+19DF	83
	U+19E0	U+19FF	32
	U+1A00	U+1A1F	30
	U+1A20	U+1AAF	127
	U+1AB0	U+1AFF	15
	U+1B00	U+1B7F	121
	U+1B80	U+1BBF	64
	U+1BC0	U+1BFF	56
	U+1C00	U+1C4F	74
-	U+1C50	U+1C7F	48
	U+1CC0	U+1CCF	8
	U+1CD0	U+1CFF	41
	U+1D00	U+1D7F	128
	U+1D80	U+1DBF	64
U+1DFF	U+1DC0	U+1DFF	58
	U+1E00	U+1EFF	256
	U+1F00	U+1FFF	233
	U+2000	U+206F	111
	U+2070	U+209F	42
	U+20A0	U+20CF	31
	U+20D0	U+20FF	33
	U+2100	U+214F	80
	U+2150	U+218F	60
	U+2190	U+21FF	112
	U+2200	U+22FF	256
	U+2300	U+23FF	251
	U+2400	U+243F	39
Optische Zeichenerkennung	U+2440	U+245F	11
	U+2460	U+24FF	160
	U+2500	U+257F	128
	U+2580	U+259F	32
	U+25A0	U+25FF	96
	U+2600	U+26FF	256
Dingbats	U+2700	U+27BF	192
— A	U+27C0	U+27EF	48
— A	U+27F0	U+27FF	16
	U+2800	U+28FF	256
— B	U+2900	U+297F	128
— B	U+2980	U+29FF	128
	U+2A00	U+2AFF	256
	U+2B00	U+2BFF	206
	U+2C00	U+2C5F	94
— C	U+2C60	U+2C7F	32
	U+2C80	U+2CFF	123
	U+2D00	U+2D2F	40
	U+2D30	U+2D7F	59
	U+2D80	U+2DDF	79
— A	U+2DE0	U+2DFF	32
	U+2E00	U+2E7F	67
	U+2E80	U+2EFF	115
	U+2F00	U+2FDF	214
	U+2FF0	U+2FFF	12
	U+3000	U+303F	64
	U+3040	U+309F	93
	U+30A0	U+30FF	96
	U+3100	U+312F	41
	U+3130	U+318F	94
	U+3190	U+319F	16
	U+31A0	U+31BF	27
	U+31C0	U+31EF	36
	U+31F0	U+31FF	16
	U+3200	U+32FF	254
	U+3300	U+33FF	256
— A	U+3400	U+4DBF	6191
« »	U+4DC0	U+4DFF	64
	U+4E00	U+9FFF	20941
	U+A000	U+A48F	1165
	U+A490	U+A4CF	55
	U+A4D0	U+A4FF	48
	U+A500	U+A63F	300
— B	U+A640	U+A69F	96
	U+A6A0	U+A6FF	88
	U+A700	U+A71F	32
— D	U+A720	U+A7FF	159
	U+A800	U+A82F	44
	U+A830	U+A83F	10
	U+A840	U+A87F	56
	U+A880	U+A8DF	81
	U+A8E0	U+A8FF	30
-	U+A900	U+A92F	48
	U+A930	U+A95F	37
— A	U+A960	U+A97F	29.
	U+A980	U+A9DF	91
— B	U+A9E0	U+A9FF	31
	U+AA00	U+AA5F	83
— A	U+AA60	U+AA7F	32
-	U+AA80	U+AADF	72
	U+AAE0	U+AAFF	23
— A	U+AB00	U+AB2F	32
— E	U+AB30	U+AB6F	54
	U+AB70	U+ABBF	80
	U+ABC0	U+ABFF	56
	U+AC00	U+D7AF	2
— B	U+D7B0	U+D7FF	72
	U+D800	U+DB7F	2
	U+DB80	U+DBFF	2
	U+DC00	U+DFFF	2
	U+E000	U+F8FF	2
	U+F900	U+FAFF	472
	U+FB00	U+FB4F	58
— A	U+FB50	U+FDFF	643
	U+FE00	U+FE0F	16
	U+FE10	U+FE1F	10
	U+FE20	U+FE2F	16
	U+FE30	U+FE4F	32
	U+FE50	U+FE6F	26
— B	U+FE70	U+FEFF	141
	U+FF00	U+FFEF	225
	U+FFF0	U+FFFF	7
	U+10000	U+1007F	88
	U+10080	U+100FF	123
	U+10100	U+1013F	57
	U+10140	U+1018F	77
	U+10190	U+101CF	13
	U+101D0	U+101FF	46
	U+10280	U+1029F	29.
	U+102A0	U+102DF	49
	U+102E0	U+102FF	28
	U+10300	U+1032F	36
	U+10330	U+1034F	27
	U+10350	U+1037F	43
	U+10380	U+1039F	31
	U+103A0	U+103DF	50
	U+10400	U+1044F	80
	U+10450	U+1047F	48
	U+10480	U+104AF	40
	U+10500	U+1052F	40
	U+10530	U+1056F	53
	U+10600	U+1077F	341
	U+10800	U+1083F	55
	U+10840	U+1085F	31
	U+10860	U+1087F	32
	U+10880	U+108AF	40
	U+108E0	U+108FF	26
	U+10900	U+1091F	29.
	U+10920	U+1093F	27
	U+10980	U+1099F	32
	U+109A0	U+109FF	90
	U+10A00	U+10A5F	65
	U+10A60	U+10A7F	32
	U+10A80	U+10A9F	32
	U+10AC0	U+10AFF	51
	U+10B00	U+10B3F	61
	U+10B40	U+10B5F	30
	U+10B60	U+10B7F	27
	U+10B80	U+10BAF	29.
	U+10C00	U+10C4F	73
	U+10C80	U+10CFF	108
	U+10E60	U+10E7F	31
	U+11000	U+1107F	109
	U+11080	U+110CF	66
-	U+110D0	U+110FF	35
	U+11100	U+1114F	67
	U+11150	U+1117F	39
	U+11180	U+111DF	94
	U+111E0	U+111FF	20
	U+11200	U+1124F	61
	U+11280	U+112AF	38
	U+112B0	U+112FF	69
	U+11300	U+1137F	85
	U+11480	U+114DF	82
	U+11580	U+115FF	92
	U+11600	U+1165F	79
	U+11680	U+116CF	66
	U+11700	U+1173F	57
-	U+118A0	U+118FF	84
	U+11AC0	U+11AFF	57
Keilschrift	U+12000	U+123FF	922
	U+12400	U+1247F	116
	U+12480	U+1254F	196
	U+13000	U+1342F	1071
	U+14400	U+1467F	583
	U+16800	U+16A3F	569
	U+16A40	U+16A6F	43
	U+16AD0	U+16AFF	36
	U+16B00	U+16B8F	127
	U+16F00	U+16F9F	133
	U+1B000	U+1B0FF	2
	U+1BC00	U+1BC9F	143
	U+1BCA0	U+1BCAF	4
	U+1D000	U+1D0FF	246
	U+1D100	U+1D1FF	231
	U+1D200	U+1D24F	70
« »	U+1D300	U+1D35F	87
	U+1D360	U+1D37F	18
	U+1D400	U+1D7FF	996
SignWriting	U+1D800	U+1DAAF	672
	U+1E800	U+1E8DF	213
	U+1EE00	U+1EEFF	143
	U+1F000	U+1F02F	44
	U+1F030	U+1F09F	100
	U+1F0A0	U+1F0FF	82
	U+1F100	U+1F1FF	173
	U+1F200	U+1F2FF	57
	U+1F300	U+1F5FF	766
	U+1F600	U+1F64F	80
	U+1F650	U+1F67F	48
	U+1F680	U+1F6FF	98
	U+1F700	U+1F77F	116
	U+1F780	U+1F7FF	85
— C	U+1F800	U+1F8FF	148
	U+1F900	U+1F9FF	15
— B	U+20000	U+2A6DF	42676
— C	U+2A700	U+2B73F	60
— D	U+2B740	U+2B81F	27
— E	U+2B820	U+2CEAF	2
	U+2F800	U+2FA1F	542
Tags	U+E0000	U+E007F	97
	U+E0100	U+E01EF	240
— A	U+F0000	U+FFFFF	4
— B	U+100000	U+10FFFF	4

— - .
— , .
— .
— , . .
, — , . , .
— , . , [Ä] [A] [¨].
— .
— , , . .
— , .
— .

: c codepoints.net .

11.0 ()
10.0 ( , 20.06.2017 .)
9.0
8.0
7.0
6.3
6.2
6.1
6.0
5.2
5.1
5.0 ()
4.0.1
4.0

Dieser entzückende Unicode