Berikut adalah daftar terbaru dari "barang" Unicode yang paling indah, serta paket dan sumber daya

Unicode luar biasa! Sebelum kemunculannya, komunikasi internasional melelahkan: masing-masing mendefinisikan karakternya sendiri yang diperluas di bagian atas ASCII (yang disebut halaman kode). Ini menciptakan konflik. Bayangkan saja bahwa Jerman harus bernegosiasi dengan Korea, di mana halaman kode-nya. Untungnya, Unicode muncul dan memperkenalkan standar umum. Unicode 8.0 mencakup lebih dari 120.000 karakter dari lebih dari 129 skrip. Baik modern dan kuno, dan masih belum didekripsi. Unicode mendukung teks dari kiri ke kanan dan dari kanan ke kiri, overlay karakter dan termasuk berbagai simbol budaya, politik, agama dan emoji. Unicode luar biasa manusia, dan kemampuannya sangat diremehkan.

Isi

Pengantar singkat

Karakter apa yang termasuk dalam Unicode Standard?

Standar Unicode mendefinisikan kode untuk karakter dalam bahasa modern utama. Ini adalah skrip alfabet Eropa, skrip Timur Tengah dari kanan ke kiri dan banyak skrip Asia.

Standar ini juga berisi tanda baca, diakritik, simbol matematika, simbol teknis, panah, dingbats, emoji, dll. Ini menyediakan kode untuk diakritik yang mengubah tanda karakter, seperti tildes (~). Mereka digunakan dalam kombinasi dengan yang dasar untuk mewakili karakter beraksen (misalnya, ñ). Secara umum, Unicode versi 9.0 menyediakan kode untuk 128.172 karakter dari huruf dunia, kumpulan ideogram, dan koleksi karakter.

Karakter yang paling umum ditempatkan di titik kode 64K pertama, area ruang kode yang disebut pesawat multibahasa utama, atau singkatnya BMP. Ada enam belas pesawat tambahan lain yang tersedia untuk penyandian karakter lain, dengan lebih dari 850.000 titik kode yang tidak digunakan. Mereka mungkin berguna untuk menambahkan karakter baru ke versi standar masa depan.

Standar Unicode juga menyimpan poin kode untuk penggunaan pribadi. Vendor atau pengguna akhir dapat menunjuk mereka di sistem mereka sendiri untuk karakter mereka atau menggunakannya dengan font khusus. BMP memiliki 6400 titik kode untuk penggunaan pribadi dan 131 poin tambahan 06 06 lainnya untuk penggunaan pribadi, jika 6400 tidak cukup untuk aplikasi tertentu.

Penyandian karakter Unicode

Standar pengkodean karakter tidak hanya menentukan identitas setiap karakter dan nilai numerik atau titik kode, tetapi juga bagaimana nilai ini direpresentasikan dalam bit.

Standar Unicode mendefinisikan tiga bentuk pengkodean yang memungkinkan transmisi data yang sama: byte, kata, dan kata ganda (mis., 8, 16, atau 32 bit per unit kode). Ketiga bentuk menyandikan kumpulan karakter umum yang sama dan dapat secara efektif dikonversi satu sama lain tanpa kehilangan data. Konsorsium Unicode sepenuhnya mendukung penggunaan salah satu bentuk pengodean ini sebagai cara yang disepakati untuk menerapkan Standar Unicode.

UTF-8 populer untuk HTML dan protokol serupa. UTF-8 adalah cara mengubah semua karakter Unicode ke variabel byte-length encoding. Keuntungannya adalah bahwa karakter Unicode yang sesuai dengan set ASCII yang dikenal memiliki nilai byte yang sama dengan ASCII, dan karakter Unicode yang dikonversi ke UTF-8 dapat digunakan dengan banyak perangkat lunak yang ada tanpa modifikasi perangkat lunak utama.

UTF-16 populer di banyak lingkungan di mana diperlukan untuk menyeimbangkan akses efisien ke karakter dengan penyimpanan ekonomis. Ini cukup kompak, dan semua karakter yang sering digunakan ditempatkan dalam satu blok kode 16-bit, sementara semua karakter lain tersedia melalui pasangan blok kode 16-bit.

UTF-32 berguna di mana jumlah memori tidak menjadi masalah, tetapi membutuhkan akses ke karakter dalam kode lebar tetap tunggal. Di sini, setiap karakter Unicode dikodekan dalam blok kode 32-bit tunggal.

Ketiga bentuk pengkodean tidak memerlukan lebih dari 4 byte (atau 32 bit) untuk setiap karakter.

Bicara tentang angka

Set karakter Unicode dibagi menjadi 17 segmen utama (pesawat), yang selanjutnya dibagi menjadi beberapa blok. Di setiap pesawat ada tempat untuk 65.536 (2 ¹⁶ ) poin kode, yang menciptakan total 1.114.112 poin kode. Ada dua "pesawat penggunaan pribadi" (No. 16 dan No. 17) yang dialokasikan untuk digunakan atas kebijakan perusahaan / pengguna. Mereka memiliki 131.072 poin kode.

Tidak.	Judul	Kisaran
1.	Pesawat multibahasa utama	(dari U + 0000 ke U + FFFF)
2.	Pesawat multibahasa tambahan	(dari U + 10000 ke U + 1FFFF)
3.	Pesawat ideografis tambahan	(dari U + 20.000 hingga U + 2FFFF)
4.	Bidang ideografi tersier	(dari U + 30000 hingga U + 3FFFF)
5.	Pesawat 5 (tidak digunakan)	(dari U + 40.000 hingga U + 4FFFF)
6.	Pesawat 6 (tidak digunakan)	(dari U + 50.000 hingga U + 5FFFF)
7.	Pesawat 7 (tidak digunakan)	(dari U + 60.000 ke U + 6FFFF)
8.	Pesawat 8 (tidak digunakan)	(dari U + 70.000 ke U + 7FFFF)
9.	Pesawat 9 (tidak digunakan)	(dari U + 80.000 hingga U + 8FFFF)
10.	Pesawat 10 (tidak digunakan)	(dari U + 90.000 ke U + 9FFFF)
11.	Pesawat 11 (tidak digunakan)	(dari U + A0000 ke U + AFFFF)
12.	Pesawat 12 (tidak digunakan)	(dari U + B0000 ke U + BFFFF)
13.	Pesawat 13 (tidak digunakan)	(dari U + C0000 ke U + CFFFF)
14.	Pesawat 14 (tidak digunakan)	(dari U + D0000 ke U + DFFFF)
15.	Pesawat tambahan khusus	(dari U + E0000 ke U + EFFFF)
16.	Area tambahan untuk penggunaan pribadi - A	(dari U + F0000 ke U + FFFFF)
17.	Area tambahan untuk penggunaan pribadi - B	(dari U + 100000 ke U + 10FFFF)

Pesawat pertama disebut pesawat multibahasa utama atau BMP. Ini berisi poin kode dari U + 0000 ke U + FFFF, yaitu karakter yang paling umum digunakan. Enam belas pesawat yang tersisa (U + 010000 → U + 10FFFF) disebut tambahan atau astral.

Pasangan pengganti UTF-16

Simbol di luar bidang utama, seperti tetragrammaton yang berarti pusat (U + 1D306), dapat dikodekan dalam UTF-16 dengan hanya dua unit kode 16-bit: 0xD834 0xDF06. Ini disebut pasangan pengganti. Harap dicatat bahwa pasangan pengganti hanya mewakili satu karakter.

Unit kode pertama dari pasangan pengganti selalu dalam kisaran dari 0xD800 ke 0xDBFF dan disebut bagian atas dari pasangan tersebut.

Unit kode kedua dari pasangan pengganti selalu dalam kisaran dari 0xDC00 hingga 0xDFFF dan disebut bagian bawah pasangan.

Matthias Binens

Pasangan pengganti: Representasi satu simbol abstrak, yang terdiri dari urutan dua unit kode 16-bit, di mana nilai pertama pasangan adalah unit kode pengganti atas dan yang kedua adalah unit kode pengganti yang lebih rendah. Pasangan pengganti hanya digunakan dalam UTF-16.

Unicode 8.0 Bab 3.8 - Pengganti

Perhitungan pasangan pengganti

Karakter Unicode "Tumpukan kotoran" (U + 1F4A9) di UTF-16 harus dikodekan sebagai pasangan pengganti, yaitu, dua pengganti. Untuk mengonversi titik kode apa pun menjadi pasangan pengganti, gunakan algoritma ini (dalam JavaScript). Perlu diingat bahwa kami menggunakan notasi heksadesimal.

var High_Surrogate = function(Code_Point){ return Math.floor((Code_Point - 0x10000) / 0x400) + 0xD800 }; var Low_Surrogate = function(Code_Point){ return (Code_Point - 0x10000) % 0x400 + 0xDC00 }; // Reverses The Conversion var Code_Point = function(High_Surrogate, Low_Surrogate){ return (High_Surrogate - 0xD800) * 0x400 + Low_Surrogate - 0xDC00 + 0x10000; };

Komposisi dan dekomposisi

Unicode termasuk mekanisme untuk mengubah bentuk karakter, yang sangat memperluas set mesin terbang yang didukung. Ini berlaku untuk diakritik yang dapat dikombinasikan. Mereka dimasukkan setelah karakter utama. Beberapa tanda diakritik dapat diterapkan pada tanda yang sama. Unicode juga berisi versi pra-kompilasi dari sebagian besar kombinasi ini untuk penggunaan normal.

Beberapa urutan karakter juga dapat direpresentasikan sebagai karakter tunggal yang disebut karakter yang dikompilasi sebelumnya, alias karakter gabungan. Misalnya, karakter [ü] dapat dikodekan sebagai satu-satunya titik kode U + 00FC atau sebagai karakter dasar U + 0075 (u), diikuti oleh karakter non-mandiri U + 0308 (¨). Standar Unicode mengkodekan karakter majemuk untuk kompatibilitas dengan standar yang ditetapkan, seperti Latin 1, yang mencakup banyak karakter majemuk, seperti [ü] dan [ñ].

Karakter majemuk dapat diperluas untuk konsistensi atau analisis. Misalnya, ketika mengurutkan menurut abjad, simbol [ü] dapat didekomposisi menjadi [u] diikuti oleh simbol non-independen [¨]. Setelah dekomposisi seperti itu, algoritma lebih mudah untuk bekerja dengan urutan karakter. Ini membuatnya lebih mudah untuk mengurutkan dalam bahasa di mana pengubah karakter tidak mempengaruhi urutan abjad. Standar Unicode menetapkan urutan penguraian untuk semua karakter komposit. Ini juga mendefinisikan bentuk normalisasi untuk memberikan representasi karakter yang unik.

Unicode Myths

Dari slide presentasi Mark Davis "Myths of Unicode . "

Unicode hanya kode 16-bit . - Beberapa orang secara keliru percaya bahwa Unicode hanya kode 16-bit, di mana setiap karakter menempati 16 bit, dan karenanya ada 65.536 karakter yang mungkin. Sebenarnya, ini tidak sepenuhnya benar. Ini adalah mitos Unicode yang paling umum, jadi jika Anda juga berpikiran seperti itu sebelumnya, jangan berkecil hati.
Anda dapat mengambil titik kode apa pun yang tidak digunakan untuk kebutuhan Anda . - Tidak. Suatu hari nanti tempat ini akan diganti oleh simbol lain. Sebagai gantinya, gunakan pesawat untuk penggunaan pribadi atau area tanpa karakter di setiap bidang di mana tidak akan ada karakter menurut standar.
Setiap titik kode Unicode mewakili karakter . - Tidak. Ada banyak titik tanpa karakter (FFFE, FFFF, 1FFFE, dll.) Selain itu, ganti titik kode, titik kode pribadi dan tidak terpakai, serta kontrol / pemformatan "karakter" (RLM, ZWNJ, dll.)
Unicode kehabisan ruang . - Jika diisi secara linear, itu akan berakhir pada 2140. Tetapi tempat itu tidak mengisi secara linear. Rencana masa depan lihat di sini .
Semua karakter dicocokkan satu lawan satu . - Tidak. Opsinya adalah:
- Satu ke banyak: (β → SS)
- Mengingat konteksnya: (... Σ ← → ... ς dan pada saat yang sama ... ΣΤ ... ← → ... στ ...)
- Berdasarkan lokal: (I ← → ı dan pada saat yang sama İ ← → i)

Penyandian Aplikasi Unicode

Jenis pengkodean	Contoh
Objek HTML (desimal)
Objek HTML (hex)
Kode kontrol URL	% F0% 9F% 96% 96
UTF-8 (hex)	0xF0 0x9F 0x96 0x96 (f09f9696)
UTF-8 (biner)	11110000: 10011111: 10010110: 10010110
UTF-16 / UTF-16BE (hex)	0xD83D 0xDD96 (d83ddd96)
UTF-16LE (hex)	0x3DD8 0x96DD (3dd896dd)
UTF-32 / UTF-32BE (hex)	0x0001F596 (0001f596)
UTF-32LE (hex)	0x96F50100 (96f50100)
Urutan melarikan diri oktal	\ 360 \ 237 \ 226 \ 226

Kode sumber

Jenis pengkodean	Contoh
Javascript	\ u1F596
Json	\ u1F596
C	\ u1F596
C ++	\ u1F596
Jawa	\ u1F596
Python	\ u1F596
Perl	\ x {1F596}
Ruby	\ u {1F596}
CSS	\ 01F596

Daftar karakter luar biasa.

Berbagi dokumen dapat dengan cepat mengubah pengeditan menjadi pertarungan rap tertulis, yang dilakukan oleh pengaturan manajer yang semakin membingungkan dari U + 202a hingga U + 202e

Karakter khusus

Konsorsium Unicode telah menerbitkan diagram tanda baca umum tempat Anda dapat menemukan informasi lebih lanjut.

Simbol	Judul	Deskripsi
`''`	U + FEFF Non-breaking space dengan lebar nol (Byte Order Mark - BOM)	Ini memiliki properti keunikan yang penting ketika mengubah urutan byte. Ini juga memiliki lebar nol dan tembus pandang. Dalam perangkat lunak yang tidak sesuai (seperti penerjemah PHP), ini mengarah ke semua jenis contoh perilaku yang menyenangkan.
`'￯'`	Membalikkan BOM	Tidak disamakan dengan karakter, kecuali untuk awal teks
`''`	'\ u200B' Ruang tanpa putus dengan lebar nol	Simbol tanpa penampilan dan tanpa efek, kecuali untuk mencegah pembentukan ligatur.
`' '`	U + 00A0 Ruang tanpa putus	Membuat karakter yang berdekatan tetap bersatu. Dikenal sebagai ` ` dalam HTML.
`''`	U + 00AD Tanda hubung lunak	Dalam HTML, ini berfungsi seperti ruang nol-lebar, tetapi ketika bertemu ujung garis (dan hanya dalam kasus ini) menunjukkan tanda hubung.
`'‍'`	U + 200D Tanda nol-lebar (dengan penyatuan)	Menyebabkan karakter tetangga terhubung (misalnya, karakter Arab atau emoji yang didukung). Dapat digunakan untuk emoji gabungan berurutan.
`'⁠'`	Konektor Kata U + 2060	Sama seperti U + 00A0, tetapi sama sekali tidak terlihat. Bagus untuk @ font-face di Twitter.
`' '`	Karakter ruang U + 1680 Ogham	Menandai ruang yang terlihat seperti tanda hubung. Sangat bagus untuk membawa programmer lebih dekat ke kegilaan: 1 + 2 === 3.
`';'`	U + 037E Tanda Tanya Yunani	Tampak seperti titik koma. Juga cara yang menyenangkan untuk menjamah pengembang.
`'‭'`	U + 202D	Mengubah arah teks dari kiri ke kanan.
`'‮'`	U + 202E	Mengubah arah teks dari kanan ke kiri.
`'ꓸ'`	U + A4F8 Lisu nada huruf mya ti	Gandakan poinnya.
`'ꓹ'`	U + A4F9 Lisu nada huruf na po	Gandakan koma.
`'ꓼ'`	U + A4FC Lisu nada huruf mya na	Ganda untuk titik koma.
`'ꓽ'`	U + A4FD Lisu nada huruf mya jeu	Gandakan untuk usus besar.
`'︀'`	Pemilih opsi (dari U + FE00 ke U + FE0F dan dari U + E0100 ke U + E01EF)	Blok 256 karakter dengan lebar nol yang memiliki properti ID_Continue, yaitu, dapat digunakan dalam nama variabel (bukan huruf pertama). Apa yang membuat mereka istimewa adalah kursor mouse melewati mereka, karena mereka menggabungkan karakter, tidak seperti kebanyakan karakter lain dengan lebar nol.
`'ᅟ'`	U + 115F Placeholder Hangul Choson	Pada dasarnya mengisi ruang. Dirender sebagai karakter lebar nol (tidak terlihat) kecuali didukung secara eksplisit dalam rendering. Ditandai sebagai ID_Start
`'ᅠ'`	U + 1160 Placeholder Chunson	Mungkin mengisi ruang? Dirender sebagai karakter lebar nol (tidak terlihat) kecuali didukung secara eksplisit dalam rendering. Ditandai sebagai ID_Start
`'ㅤ'`	Agregat Hangul U + 3164	Secara umum, ini mengisi ruang. Dirender sebagai karakter lebar nol (tidak terlihat) kecuali didukung secara eksplisit dalam rendering. Ditandai sebagai ID_Start

Tunggu ... apa yang baru saja saya baca?

Pengidentifikasi variabel dapat mencakup spasi!

U + 3164 placeholder Hangul ditampilkan sebagai ruang yang luas. Jika karakter jelas tidak didukung dalam rendering , maka ditampilkan sebagai benar-benar tidak terlihat (dan tidak memakan ruang, yaitu, "lebar nol"). Ini berarti Anda tidak akan pernah melihat karakter pengganti karakter jelek ( ).

Saya belum yakin mengapa U + 3164 diperintahkan untuk berperilaku seperti ini. Menariknya, U + 3164 ditambahkan ke Unicode dalam versi 1.1 (1993) - sehingga spesialis Konsorsium punya banyak waktu untuk memikirkannya. Bagaimanapun, berikut adalah beberapa contoh.

 > var ᅟ = 'foo'; undefined > ᅟ 'foo' > var ㅤ= alert; undefined > var foo = 'bar' undefined > if ( foo ===ㅤ`baz` ){} // alert undefined > var varㅤfooㅤ\u{A60C}ㅤπ = 'bar'; undefined > varㅤfooㅤꘌㅤπ 'bar'

** Catatan: ** Saya menguji rendering U + 3164 di Ubuntu dan OS X dengan parameter berikut: `node`,` php`, `ruby`,` python3.5`, `scala`,` vim`, `cat` , `chrome` +` github gist '. Atom adalah satu-satunya sistem yang gagal dengan (salah) menampilkan bidang kosong. Saya belum memeriksa kode di Emacs dan Sublime. Seperti yang saya pahami, Konsorsium Unicode tidak akan menetapkan ulang atau mengubah nama karakter atau poin kode, tetapi dapat dibujuk untuk mengubah properti karakter, seperti ID_Start dan ID_Continue.

Pengubah

Zero Width Combiner (ZWJ) adalah karakter yang tidak dapat dicetak dalam set komputer dari beberapa font yang kompleks, seperti Arab atau font India. Ketika ditempatkan di antara dua karakter yang seharusnya tidak terhubung, ZWJ memaksa mereka untuk mencetak dalam bentuk gabungan.

Zero Width Disconnector (ZWNJ) adalah karakter yang tidak dapat ditulis dalam set tulisan berbasis komputer dengan ligatur. Ketika ditempatkan di antara dua karakter yang jika tidak akan bergabung ke dalam ligatur, ZWNJ memaksa mereka untuk mencetak dalam bentuk final dan asli masing-masing. Bertindak sebagai ruang, tetapi digunakan ketika diinginkan untuk menjaga kata-kata dekat satu sama lain atau menggabungkan kata dengan morfemnya.

 > 'a' "a" > 'a\u{0308}' "ä" > 'a\u{20DE}\u{0308}' "a⃞̈" > 'a\u{20DE}\u{0308}\u{20DD}' "a⃞̈⃝" // Modifying Invisible Characters > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}' "‎‎‎‎‎‎‎‎‎‎" > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}'.length 10

Huruf besar mengubah benturan

Simbol	Poin kode	Hasil
ß	0x00DF	`SS`
ı	0x0131	`I`
ſ	0x017F	`S`
ﬀ	0xFB00	`FF`
fi	0xFB01	`FI`
fl	0xFB02	`FL`
ﬃ	0xFB03	`FFI`
ﬄ	0xFB04	`FFL`
ﬅ	0xFB05	`ST`
ﬆ	0xFB06	`ST`

Tabrakan konversi huruf kecil

Simbol	Poin kode	Hasil
K	0x212A	`k`

Keanehan dan pemecahan masalah

Panjang garis biasanya ditentukan oleh jumlah titik kode . Ini berarti bahwa pasangan pengganti akan dianggap dua karakter. Beberapa diakritik dapat ditumpangkan pada simbol: a + ̈ == ̈a . Ini meningkatkan panjang string, hanya menghasilkan satu karakter.
Demikian pula, inversi string sering menjadi tugas yang tidak sepele . Sekali lagi, pasangan pengganti dan diakritik harus dibalik bersama. ES Reverser menawarkan solusi yang cukup bagus.

Perbandingan huruf besar dan kecil tidak selalu cocok . Mereka dapat diekspresikan dalam hubungan seperti itu:

Satu ke banyak: (ß → SS)
Mengingat konteksnya: (... Σ ← → ... ς dan ... ΣΤ ... ← → ... στ ...)
Berdasarkan lokal: (I ← → ı dan İ ← → i)

Satu banding banyak

Sebagian besar karakter di bawah ini mengekspresikan pemetaan satu-ke-banyak mereka dalam huruf besar dan lainnya dalam huruf kecil. Pada prinsipnya, daftar ini dapat dibagi menjadi dua bagian.

Poin kode	Simbol	Judul	Karakter yang terkait	Poin Kode Terkait
U + 00DF	`ß`	Escet huruf kecil latin (S akut)	`s` , `s`	U + 0073, U + 0073
U + 0130	`İ`	Huruf latin "I" dengan titik di atas	`i` , `̇`	U + 0069, U + 0307
U + 0149	`ŉ`	Huruf kecil latin "n" oleh tanda kutip sebelumnya	`ʼ` , `n`	U + 02BC, U + 006E
U + 01F0	`ǰ`	Huruf kecil latin j	`j` , `̌`	U + 006A, U + 030C
U + 0390	`ΐ`	Yunani huruf kecil dengan dialisis dan tono.	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 03B0	`ΰ`	Yunani huruf kecil ipsilon dengan dialisis dan tono.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 0587	`և`	Ligatur huruf kecil Armenia ech yiwn	`ե` , `ւ`	U + 0565, U + 0582
U + 1E96	`ẖ`	Huruf kecil latin h dengan garis di bawah ini	`h` ,	U + 0068, U + 0331
U + 1E97	`ẗ`	Huruf kecil latin t dengan dieresis	`t` , `̈`	U + 0074, U + 0308
U + 1E98	`ẘ`	Huruf kecil latin w dengan cincin di atas	`w` , `̊`	U + 0077, U + 030A
U + 1E99	`ẙ`	Huruf kecil latin y dengan cincin di atas	`y` , `̊`	U + 0079, U + 030A
U + 1E9A	`ẚ`	Huruf kecil latin a dengan separuh kanan ring	`a` , `ʾ`	U + 0061, U + 02BE
U + 1E9E	`ẞ`	Huruf latin akut s	`s` , `s`	U + 0073, U + 0073
U + 1F50	`ὐ`	Yunani huruf kecil ipsilon dengan psil	`υ` , `̓`	U + 03C5, U + 0313
U + 1F52	`ὒ`	Huruf kecil Yunani ipsilon dengan psili dan varia	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0300
U + 1F54	`ὔ`	Huruf kecil Yunani ipsilon dengan psily dan oxy	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0301
U + 1F56	`ὖ`	Huruf kecil Yunani ipsilon dengan psily dan perisome	`υ` , `̓` ,	U + 03C5, U + 0313, U + 0342
U + 1F80	`ᾀ`	Alfa huruf kecil Yunani dengan psili dan ipogemen	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F81	`ᾁ`	Alfa huruf kecil Yunani dengan dasia dan ipogemen	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F82	`ᾂ`	Alfa huruf kecil Yunani dengan psilia dan varia dan ipogemen	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F83	`ᾃ`	Alfa huruf kecil Yunani dengan dasia dan varia dan ipogemen	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F84	`ᾄ`	Alfa huruf kecil Yunani dengan psily dan oxy dan ipogemen	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F85	`ᾅ`	Alfa huruf kecil Yunani dengan dasia dan oxy dan ipogemen	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F86	`ᾆ`	Yunani huruf kecil alfa dengan psily dan perispomenti dan ipogemen	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F87	`ᾇ`	Yunani huruf kecil alfa dengan dasia dan perispomenti dan hypogrammen	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F88	`ᾈ`	Alfa huruf besar Yunani dengan psil dan programmer	`ἀ` , `ι`	U + 1F00, U + 03B9
U + 1F89	`ᾉ`	Alfa huruf besar Yunani dengan dasia dan programmer	`ἁ` , `ι`	U + 1F01, U + 03B9
U + 1F8A	`ᾊ`	Alfa huruf kapital Yunani dengan psilia dan varia dan program	`ἂ` , `ι`	U + 1F02, U + 03B9
U + 1F8B	`ᾋ`	Huruf kapital huruf Yunani alfa dengan dasia dan varia dan prog	`ἃ` , `ι`	U + 1F03, U + 03B9
U + 1F8C	`ᾌ`	Alfa huruf kapital Yunani dengan psily dan oxy dan prog	`ἄ` , `ι`	U + 1F04, U + 03B9
U + 1F8D	`ᾍ`	Alfa huruf besar Yunani dengan dasia dan oksi dan program	`ἅ` , `ι`	U + 1F05, U + 03B9
U + 1F8E	`ᾎ`	Huruf alfabet Yunani dengan psily dan perispomenti dan programmemeny	`ἆ` , `ι`	U + 1F06, U + 03B9
U + 1F8F	`ᾏ`	Alfa huruf kapital Yunani dengan dasia dan perispomenti dan prog	`ἇ` , `ι`	U + 1F07, U + 03B9
U + 1F90	`ᾐ`	Huruf kecil Yunani ini dengan psily dan ipogemen	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F91	`ᾑ`	Huruf kecil Yunani a dengan dasia dan ipogemen	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F92	`ᾒ`	Huruf kecil Yunani ini dengan psilia dan varia dan ipogemen	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F93	`ᾓ`	Huruf kecil Yunani eta dengan dasia dan varia dan ipogemen	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F94	`ᾔ`	Huruf kecil Yunani a dengan psilia dan oksia dan ipogemen	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F95	`ᾕ`	Huruf kecil Yunani eta dengan dasia dan oksia dan ipogemen	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F96	`ᾖ`	Huruf kecil Yunani ini dengan psily dan perispomenti dan ipogemen	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F97	`ᾗ`	Huruf kecil Yunani eta dengan dasia dan perisopmenti dan hypogrammen	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1F98	`ᾘ`	Huruf kapital Yunani ini dengan psilah dan program	`ἠ` , `ι`	U + 1F20, U + 03B9
U + 1F99	`ᾙ`	Huruf kapital Yunani ini dengan dasia dan programmer	`ἡ` , `ι`	U + 1F21, U + 03B9
U + 1F9A	`ᾚ`	Huruf kapital Yunani ini dengan psilia dan varia dan prosgrammemeny	`ἢ` , `ι`	U + 1F22, U + 03B9
U + 1F9B	`ᾛ`	Huruf kapital Yunani ini dengan dasia dan varia dan prosgrammemeny	`ἣ` , `ι`	U + 1F23, U + 03B9
U + 1F9C	`ᾜ`	Huruf kapital Yunani ini dengan psilia dan oxy dan programmer	`ἤ` , `ι`	U + 1F24, U + 03B9
U + 1F9D	`ᾝ`	Huruf kapital Yunani ini dengan dasia dan oksia dan programmer	`ἥ` , `ι`	U + 1F25, U + 03B9
U + 1F9E	`ᾞ`	Huruf kapital Yunani ini dengan psily dan perispomenty dan prosgrammeny	`ἦ` , `ι`	U + 1F26, U + 03B9
U + 1F9F	`ᾟ`	Huruf kapital Yunani ini dengan dasia dan perispomenti dan programmer	`ἧ` , `ι`	U + 1F27, U + 03B9
U + 1FA0	`ᾠ`	Huruf kecil Yunani omega dengan psili dan ipogemen	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA1	`ᾡ`	Huruf kecil Yunani omega dengan dasia dan ipogemen	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FA2	`ᾢ`	Huruf kecil Yunani omega dengan psilia dan varia dan ipogemen	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FA3	`ᾣ`	Huruf Yunani kecil omega dengan dasia dan varia dan ipogemen	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FA4	`ᾤ`	Huruf Yunani kecil omega dengan psily dan oxy dan ipogemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FA5	`ᾥ`	Huruf kecil Yunani omega dengan dasia dan oxy dan ipogemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FA6	`ᾦ`	Huruf Yunani kecil omega dengan psily dan perispomenti dan ipogemen	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FA7	`ᾧ`	Huruf kecil Yunani omega dengan dasia dan perispomenti dan hipogram	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FA8	`ᾨ`	Bahasa Yunani huruf omega dengan psili dan program	`ὠ` , `ι`	U + 1F60, U + 03B9
U + 1FA9	`ᾩ`	Huruf kapital Yunani Omega dengan dasia dan programmer	`ὡ` , `ι`	U + 1F61, U + 03B9
U + 1FAA	`ᾪ`	Huruf kapital Yunani omega dengan psilia dan varia dan prosgrammemeny	`ὢ` , `ι`	U + 1F62, U + 03B9
U + 1FAB	`ᾫ`	Huruf kapital bahasa Yunani Omega dengan dasia dan varia dan programmer	`ὣ` , `ι`	U + 1F63, U + 03B9
U + 1FAC	`ᾬ`	Huruf kapital Yunani omega dengan psilia dan oxy dan progamemen	`ὤ` , `ι`	U + 1F64, U + 03B9
U + 1FAD	`ᾭ`	Huruf kapital Yunani omega dengan dasia dan oksia dan programmemen	`ὥ` , `ι`	U + 1F65, U + 03B9
U + 1FAE	`ᾮ`	Huruf kapital Yunani omega dengan psily dan perispomenti dan prosgrammemeny	`ὦ` , `ι`	U + 1F66, U + 03B9
U + 1FAF	`ᾯ`	Huruf kapital Yunani omega dengan dasia dan perispomenti dan prosgrammemeny	`ὧ` , `ι`	U + 1F67, U + 03B9
U + 1FB2	`ᾲ`	Alfa huruf kecil Yunani dengan varia dan ipogemen	`ὰ` , `ι`	U + 1F70, U + 03B9
U + 1FB3	`ᾳ`	Alfa huruf kecil Yunani dengan ogogerammeni	`α` , `ι`	U + 03B1, U + 03B9
U + 1FB4	`ᾴ`	Alfa huruf kecil Yunani dengan oxy dan ipogemen	`ά` , `ι`	U + 03AC, U + 03B9
U + 1FB6	`ᾶ`	Alfa huruf kecil Yunani dengan perispomenti	`α` ,	U + 03B1, U + 0342
U + 1FB7	`ᾷ`	Alfa huruf kecil Yunani dengan perispomenti dan ipogemen	`α` , `͂` `ι`	U + 03B1, U + 0342, U + 03B9
U + 1FBC	`ᾼ`	Alfa huruf besar Yunani dengan prog	`α` , `ι`	U + 03B1, U + 03B9
U + 1FC2	`ῂ`	Huruf kecil Yunani et dengan varia dan ipogemen	`ὴ` , `ι`	U + 1F74, U + 03B9
U + 1FC3	`ῃ`	Huruf kecil Yunani a dengan ipogemen	`η` , `ι`	U + 03B7, U + 03B9
U + 1FC4	`ῄ`	Huruf kecil Yunani eta dengan oxy dan ipogemen	`ή` , `ι`	U + 03AE, U + 03B9
U + 1FC6	`ῆ`	Huruf kecil Yunani a dengan perispomenti	`η` ,	U + 03B7, U + 0342
U + 1FC7	`ῇ`	Huruf kecil Yunani a dengan perispomenti dan ipogemen	`η` , `͂` `ι`	U + 03B7, U + 0342, U + 03B9
U + 1FCC	`ῌ`	Huruf kapital Yunani ini dengan prog	`η` , `ι`	U + 03B7, U + 03B9
U + 1FD2	`ῒ`	Yunani huruf kecil dengan dialisis dan varia	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0300
U + 1FD3	`ΐ`	Yunani huruf kecil dengan dialisis dan oxy	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0301
U + 1FD6	`ῖ`	Yunani huruf kecil dengan perispomenti	`ι` ,	U + 03B9, U + 0342
U + 1FD7	`ῗ`	Yunani huruf kecil dengan dialisis dan periode	`ι` , `̈` ,	U + 03B9, U + 0308, U + 0342
U + 1FE2	`ῢ`	Yunani huruf kecil ipsilon dengan dialisis dan varia.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0300
U + 1FE3	`ΰ`	Yunani huruf kecil ipsilon dengan dialisis dan oxy.	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0301
U + 1FE4	`ῤ`	Yunani huruf kecil rho dengan psili	`ρ` , `̓`	U + 03C1, U + 0313
U + 1FE6	`ῦ`	Yunani huruf kecil ipsilon dengan perispomenti	`υ` ,	U + 03C5, U + 0342
U + 1FE7	`ῧ`	Yunani huruf kecil ipsilon dengan dialisis dan titik	`υ` , `̈` ,	U + 03C5, U + 0308, U + 0342
U + 1FF2	`ῲ`	Huruf Yunani kecil omega dengan varia dan ipogemen	`ὼ` , `ι`	U + 1F7C, U + 03B9
U + 1FF3	`ῳ`	Huruf kecil Yunani omega dengan ogogemen	`ω` , `ι`	U + 03C9, U + 03B9
U + 1FF4	`ῴ`	Huruf kecil Yunani omega dengan oxia dan ipogemen	`ώ` , `ι`	U + 03CE, U + 03B9
U + 1FF6	`ῶ`	Huruf kecil Yunani omega dengan perispomenti	`ω` ,	U + 03C9, U + 0342
U + 1FF7	`ῷ`	Huruf Yunani kecil omega dengan perispomenti dan ipogemen	`ω` , `͂` `ι`	U + 03C9, U + 0342, U + 03B9
U + 1FFC	`ῼ`	Greek Capital Letter Omega dengan Program	`ω` , `ι`	U + 03C9, U + 03B9
U + FB00	`ﬀ`	Ligatur huruf kecil Latin Ff	`f` `f`	U + 0066, U + 0066
U + FB01	`ﬁ`	Ligatur huruf kecil Fi Fi	`f` , `i`	U + 0066, U + 0069
U + FB02	`ﬂ`	Ligatur huruf kecil latin Fl	`f` `l`	U + 0066, U + 006C
U + FB03	`ﬃ`	Ligatur huruf kecil latin Ffi	`f` , `f` , `i`	U + 0066, U + 0066, U + 0069
U + FB04	`ﬄ`	Ligatur huruf kecil latin Ffl	`f` , `f` , `l`	U + 0066, U + 0066, U + 006C
U + FB05	`ﬅ`	Ligatur huruf kecil latin panjang ST	`s` , `t`	U + 0073, U + 0074
U + FB06	`ﬆ`	Ligatur huruf kecil latin St	`s` , `t`	U + 0073, U + 0074
U + FB13	`ﬓ`	Ligatur huruf kecil Armenia Men Now	`մ` , `ն`	U + 0574, U + 0576
U + FB14	`ﬔ`	Ligatur huruf kecil Armenia Men Ech	`մ` , `ե`	U + 0574, U + 0565
U + FB15	`ﬕ`	Ligatur huruf kecil Armenia Men Ini	`մ` , `ի`	U + 0574, U + 056B
U + FB16	`ﬖ`	Ligatur huruf kecil Armenia Vew Now	`վ` , `ն`	U + 057E, U + 0576
U + FB17	`ﬗ`	Ligatur huruf kecil Armenia Men Xeh	`մ` , `խ`	U + 0574, U + 056D

Paket dan pustaka hebat

PhantomScript -: ghost :: flashlight: Melaksanakan JavaScript yang tak terlihat dan rekayasa sosial
ESReverser - Penanganan string JavaScript berbasis Unicode .
mimic - Penyalahgunaan Unicode
python-ftfy - Mencoba membuat representasi teks yang benar dan lengkap maksimum yang diterima dalam Unicode.
vim-troll-stopper - Melindungi kode Anda dari troll unicode.

Emoji

Unicode (diversity), . .

, , . — . :


U+1F469 U+200D U+2764 U+FE0F U+200D U+1F469
U+1F468 U+200D U+1F468 U+200D U+1F467 U+200D U+1F466

, .

8.0 ( 2015 ) - . , ( , FitzpatrickSkinType.pdf). .

Unicode


U+1F3FB	-1-2
U+1F3FC	-3
U+1F3FD	-4
U+1F3FE	-5
U+1F3FF	-6

, \u{1F466}\u{1F3FE} .

+

→

JavaScript (ES6)

, ID_START , . , ID_CONTINUE , .

 // How convenient! var π = Math.PI; // Sometimes, you just have to use the Bad Parts of JavaScript: var ಠ_ಠ = eval; // Code, YU NO WORK?! var ლ_ಠ益ಠ_ლ = 42; // How about a JavaScript library for functional programming? var λ = function() {}; // Obfuscate boring variable names for great justice var \u006C\u006F\u006C\u0077\u0061\u0074 = 'heh'; // …or just make up random ones var Ꙭൽↈⴱ = 'huh'; // While perfectly valid, this doesn't work in most browsers: var foo\u200Cbar = 42; // This is *not* a bitwise left shift (`<<`): var 〱〱 = 2; // This is, though: 〱〱 << 〱〱; // 8 // Give yourself a discount: var price_9̶9̶_89 = 'cheap'; // Fun with Roman numerals var Ⅳ = 4; var Ⅴ = 5; Ⅳ + Ⅴ; // 9 // Cthulhu was here var Hͫ̆̒̐ͣ̊̄ͯ͗͏̵̗̻̰̠̬͝ͅE̴̷̬͎̱̘͇͍̾ͦ͊͒͊̓̓̐_̫̠̱̩̭̤͈̑̎̋ͮͩ̒͑̾͋͘Ç̳͕̯̭̱̲̣̠̜͋̍O̴̦̗̯̹̼ͭ̐ͨ̊̈͘͠M̶̝̠̭̭̤̻͓͑̓̊ͣͤ̎͟͠E̢̞̮̹͍̞̳̣ͣͪ͐̈T̡̯̳̭̜̠͕͌̈́̽̿ͤ̿̅̑Ḧ̱̱̺̰̳̹̘̰́̏ͪ̂̽͂̀͠ = 'Zalgo';

CSS .

 <!-- place this within the document head --> <meta charset="UTF-8" /> <!-- error message --> <div class="ಠ_ಠ">You do not have access to this page.</div> <!-- success message --> <div class="">Your changes have been saved successfully!</div>

 .ಠ_ಠ { border: 1px solid #f00; } . { background: lightgreen; }

HTML

HTML- , , .

, HTML .

 // U+1160 HANGUL JUNGSEONG FILLER transformAllTags('ᅠ'); // An actual HTML element node designed to look like a comment node, using the U+01C3 LATIN LETTER RETROFLEX CLICK // <ǃ-- name="viewport" content="width=device-width"></ǃ--> transformAllTags('ǃ--'); // or even <ᅠ⃝ transformAllTags('\u{1160}\u{20dd}'); // and for a bonus, all existing tag names will have each character ensquared. h⃞t⃞m⃞l⃞ transformAllTags(); function transformAllTags (newName){ // querySelectorAll doesn't actually return an array. Array.from(document.querySelectorAll('*')) .forEach(function(x){ transformTag(x, newName); }); } function wonky(str){ return str.split('').join('\u{20de}') + '\u{20de}'; } function transformTag(tagIdOrElem, tagType){ var elem = (tagIdOrElem instanceof HTMLElement) ? tagIdOrElem : document.getElementById(tagIdOrElem); if(!elem || !(elem instanceof HTMLElement))return; var children = elem.childNodes; var parent = elem.parentNode; var newNode = document.createElement(tagType||wonky(elem.tagName)); for(var a=0;a<elem.attributes.length;a++){ newNode.setAttribute(elem.attributes[a].nodeName, elem.attributes[a].value); } for(var i= 0,clen=children.length;i<clen;i++){ newNode.appendChild(children[0]); //0...always point to the first non-moved element } newNode.style.cssText = elem.style.cssText; parent.replaceChild(newNode,elem); }

 function testBegin(str){ try{ eval(`document.createElement( '${str}' );`) return true; } catch(e){ return false; } } function testContinue(str){ try{ eval(`document.createElement( 'a${str}' );`) return true; } catch(e){ return false; } }

 // Test if dashes can start an HTML Tag > testBegin('-') < false > testContinue('-') < true > testBegin('ᅠ-') // Prepend dash with U+1160 HANGUL JUNGSEONG FILLER < true

TrueType OpenType UTF-8, 65 535 . 1,1 UTF-8, .

256 .

, () (CJK). , , « ».

. 17- .

			#
	U+0000	U+007F	128
— 1	U+0080	U+00FF	128
— A	U+0100	U+017F	128
— B	U+0180	U+024F	208
	U+0250	U+02AF	96
	U+02B0	U+02FF	80
	U+0300	U+036F	112
	U+0370	U+03FF	135
	U+0400	U+04FF	256
	U+0500	U+052F	48
	U+0530	U+058F	89
	U+0590	U+05FF	87
	U+0600	U+06FF	255
	U+0700	U+074F	77
	U+0750	U+077F	48
	U+0780	U+07BF	50
	U+07C0	U+07FF	59
	U+0800	U+083F	61
	U+0840	U+085F	Tanggal 29
— A	U+08A0	U+08FF	50
	U+0900	U+097F	128
	U+0980	U+09FF	93
	U+0A00	U+0A7F	79
	U+0A80	U+0AFF	85
	U+0B00	U+0B7F	90
	U+0B80	U+0BFF	72
	U+0C00	U+0C7F	96
	U+0C80	U+0CFF	87
	U+0D00	U+0D7F	100
	U+0D80	U+0DFF	90
	U+0E00	U+0E7F	87
	U+0E80	U+0EFF	67
	U+0F00	U+0FFF	211
	U+1000	U+109F	160
	U+10A0	U+10FF	88
	U+1100	U+11FF	256
	U+1200	U+137F	358
	U+1380	U+139F	26
	U+13A0	U+13FF	92
	U+1400	U+167F	640
	U+1680	U+169F	Tanggal 29
	U+16A0	U+16FF	89
	U+1700	U+171F	20
	U+1720	U+173F	23
	U+1740	U+175F	20
	U+1760	U+177F	18
	U+1780	U+17FF	114
	U+1800	U+18AF	156
	U+18B0	U+18FF	70
	U+1900	U+194F	68
	U+1950	U+197F	35
	U+1980	U+19DF	83
	U+19E0	U+19FF	32
	U+1A00	U+1A1F	30
	U+1A20	U+1AAF	127
	U+1AB0	U+1AFF	15
	U+1B00	U+1B7F	121
	U+1B80	U+1BBF	64
	U+1BC0	U+1BFF	56
	U+1C00	U+1C4F	74
-	U+1C50	U+1C7F	48
	U+1CC0	U+1CCF	8
	U+1CD0	U+1CFF	41
	U+1D00	U+1D7F	128
	U+1D80	U+1DBF	64
U+1DFF	U+1DC0	U+1DFF	58
	U+1E00	U+1EFF	256
	U+1F00	U+1FFF	233
	U+2000	U+206F	111
	U+2070	U+209F	42
	U+20A0	U+20CF	31
	U+20D0	U+20FF	33
	U+2100	U+214F	80
	U+2150	U+218F	60
	U+2190	U+21FF	112
	U+2200	U+22FF	256
	U+2300	U+23FF	251
	U+2400	U+243F	39
	U+2440	U+245F	11
	U+2460	U+24FF	160
	U+2500	U+257F	128
	U+2580	U+259F	32
	U+25A0	U+25FF	96
	U+2600	U+26FF	256
Dingbats	U+2700	U+27BF	192
— A	U+27C0	U+27EF	48
— A	U+27F0	U+27FF	16
	U+2800	U+28FF	256
— B	U+2900	U+297F	128
— B	U+2980	U+29FF	128
	U+2A00	U+2AFF	256
	U+2B00	U+2BFF	206
	U+2C00	U+2C5F	94
— C	U+2C60	U+2C7F	32
	U+2C80	U+2CFF	123
	U+2D00	U+2D2F	40
	U+2D30	U+2D7F	59
	U+2D80	U+2DDF	79
— A	U+2DE0	U+2DFF	32
	U+2E00	U+2E7F	67
	U+2E80	U+2EFF	115
	U+2F00	U+2FDF	214
	U+2FF0	U+2FFF	12
	U+3000	U+303F	64
	U+3040	U+309F	93
	U+30A0	U+30FF	96
	U+3100	U+312F	41
	U+3130	U+318F	94
	U+3190	U+319F	16
	U+31A0	U+31BF	27
	U+31C0	U+31EF	36
	U+31F0	U+31FF	16
	U+3200	U+32FF	254
	U+3300	U+33FF	256
— A	U+3400	U+4DBF	6191
« »	U+4DC0	U+4DFF	64
	U+4E00	U+9FFF	20941
	U+A000	U+A48F	1165
	U+A490	U+A4CF	55
	U+A4D0	U+A4FF	48
	U+A500	U+A63F	300
— B	U+A640	U+A69F	96
	U+A6A0	U+A6FF	88
	U+A700	U+A71F	32
— D	U+A720	U+A7FF	159
	U+A800	U+A82F	44
	U+A830	U+A83F	10
	U+A840	U+A87F	56
	U+A880	U+A8DF	81
	U+A8E0	U+A8FF	30
-	U+A900	U+A92F	48
	U+A930	U+A95F	37
— A	U+A960	U+A97F	Tanggal 29
	U+A980	U+A9DF	91
— B	U+A9E0	U+A9FF	31
	U+AA00	U+AA5F	83
— A	U+AA60	U+AA7F	32
-	U+AA80	U+AADF	72
	U+AAE0	U+AAFF	23
— A	U+AB00	U+AB2F	32
— E	U+AB30	U+AB6F	54
	U+AB70	U+ABBF	80
	U+ABC0	U+ABFF	56
	U+AC00	U+D7AF	2
— B	U+D7B0	U+D7FF	72
	U+D800	U+DB7F	2
	U+DB80	U+DBFF	2
	U+DC00	U+DFFF	2
	U+E000	U+F8FF	2
	U+F900	U+FAFF	472
	U+FB00	U+FB4F	58
— A	U+FB50	U+FDFF	643
	U+FE00	U+FE0F	16
	U+FE10	U+FE1F	10
	U+FE20	U+FE2F	16
	U+FE30	U+FE4F	32
	U+FE50	U+FE6F	26
— B	U+FE70	U+FEFF	141
	U+FF00	U+FFEF	225
Karakter khusus	U+FFF0	U+FFFF	7
	U+10000	U+1007F	88
	U+10080	U+100FF	123
	U+10100	U+1013F	57
	U+10140	U+1018F	77
	U+10190	U+101CF	13
	U+101D0	U+101FF	46
	U+10280	U+1029F	Tanggal 29
	U+102A0	U+102DF	49
	U+102E0	U+102FF	28
	U+10300	U+1032F	36
	U+10330	U+1034F	27
	U+10350	U+1037F	43
	U+10380	U+1039F	31
	U+103A0	U+103DF	50
	U+10400	U+1044F	80
	U+10450	U+1047F	48
	U+10480	U+104AF	40
	U+10500	U+1052F	40
	U+10530	U+1056F	53
	U+10600	U+1077F	341
	U+10800	U+1083F	55
	U+10840	U+1085F	31
	U+10860	U+1087F	32
	U+10880	U+108AF	40
	U+108E0	U+108FF	26
	U+10900	U+1091F	Tanggal 29
	U+10920	U+1093F	27
	U+10980	U+1099F	32
	U+109A0	U+109FF	90
	U+10A00	U+10A5F	65
	U+10A60	U+10A7F	32
	U+10A80	U+10A9F	32
	U+10AC0	U+10AFF	51
	U+10B00	U+10B3F	61
	U+10B40	U+10B5F	30
	U+10B60	U+10B7F	27
	U+10B80	U+10BAF	Tanggal 29
	U+10C00	U+10C4F	73
	U+10C80	U+10CFF	108
	U+10E60	U+10E7F	31
	U+11000	U+1107F	109
	U+11080	U+110CF	66
-	U+110D0	U+110FF	35
	U+11100	U+1114F	67
	U+11150	U+1117F	39
	U+11180	U+111DF	94
	U+111E0	U+111FF	20
	U+11200	U+1124F	61
	U+11280	U+112AF	38
	U+112B0	U+112FF	69
	U+11300	U+1137F	85
	U+11480	U+114DF	82
	U+11580	U+115FF	92
	U+11600	U+1165F	79
	U+11680	U+116CF	66
	U+11700	U+1173F	57
-	U+118A0	U+118FF	84
	U+11AC0	U+11AFF	57
	U+12000	U+123FF	922
	U+12400	U+1247F	116
	U+12480	U+1254F	196
	U+13000	U+1342F	1071
	U+14400	U+1467F	583
	U+16800	U+16A3F	569
	U+16A40	U+16A6F	43
	U+16AD0	U+16AFF	36
	U+16B00	U+16B8F	127
	U+16F00	U+16F9F	133
	U+1B000	U+1B0FF	2
	U+1BC00	U+1BC9F	143
	U+1BCA0	U+1BCAF	4
	U+1D000	U+1D0FF	246
	U+1D100	U+1D1FF	231
	U+1D200	U+1D24F	70
« »	U+1D300	U+1D35F	87
	U+1D360	U+1D37F	18
	U+1D400	U+1D7FF	996
SignWriting	U+1D800	U+1DAAF	672
	U+1E800	U+1E8DF	213
	U+1EE00	U+1EEFF	143
	U+1F000	U+1F02F	44
	U+1F030	U+1F09F	100
	U+1F0A0	U+1F0FF	82
	U+1F100	U+1F1FF	173
	U+1F200	U+1F2FF	57
	U+1F300	U+1F5FF	766
	U+1F600	U+1F64F	80
	U+1F650	U+1F67F	48
	U+1F680	U+1F6FF	98
	U+1F700	U+1F77F	116
	U+1F780	U+1F7FF	85
— C	U+1F800	U+1F8FF	148
	U+1F900	U+1F9FF	15
— B	U+20000	U+2A6DF	42676
— C	U+2A700	U+2B73F	60
— D	U+2B740	U+2B81F	27
— E	U+2B820	U+2CEAF	2
	U+2F800	U+2FA1F	542
Tags	U+E0000	U+E007F	97
	U+E0100	U+E01EF	240
— A	U+F0000	U+FFFFF	4
— B	U+100000	U+10FFFF	4

— - .
— , .
— .
— , . .
, — , . , .
— , . , [Ä] [A] [¨].
— .
— , , . .
— , .
— .

: c codepoints.net .

11.0 ()
10.0 ( , 20.06.2017 .)
9.0
8.0
7.0
6.3
6.2
6.1
6.0
5.2
5.1
5.0 ()
4.0.1
4.0

Unicode yang menggemaskan ini

Isi