هذا رائعتين يونيكود



وهنا قائمة محدثة من "الأشياء الجيدة" يونيكود أروع ، وكذلك الحزم والموارد

يونيكود رائع! قبل ظهوره ، كان التواصل الدولي مرهقًا: حدد كل منهم مجموعة الأحرف الموسعة المنفصلة الخاصة به في النصف العلوي من ASCII (ما يسمى صفحات الرموز). هذا خلق الصراع. فقط فكر في أن الألمان اضطروا للتفاوض مع الكوريين ، حيث توجد صفحة الكود. لحسن الحظ ، ظهر يونيكود وقدم معيار مشترك. يغطي Unicode 8.0 أكثر من 120،000 حرف من أكثر من 129 نصًا. كلاهما قديما وحديثا ، وما زال غير مشفر. يدعم Unicode النص من اليسار إلى اليمين ومن اليمين إلى اليسار ، ويغطي الحروف ويتضمن مجموعة متنوعة من الرموز الثقافية والسياسية والدينية والرموز التعبيرية. يونيكود هو الإنسان بشكل مثير للدهشة ، ويتم التقليل من قدراتها إلى حد كبير.

محتوى



مقدمة موجزة


ما هي الشخصيات المدرجة في يونيكود قياسي؟


يعرّف معيار Unicode رموز الأحرف في اللغات الحديثة الرئيسية. هذه هي النصوص الأبجدية الأوروبية ، والنصوص الشرق أوسطية من اليمين إلى اليسار والعديد من النصوص الآسيوية.

يحتوي المعيار أيضًا على علامات الترقيم ، علامات التشكيل ، الرموز الرياضية ، الرموز الفنية ، الأسهم ، dingbats ، الرموز التعبيرية ، إلخ. وهو يوفر رموزًا لأدوات التشكيل التي تغير علامات الأحرف ، مثل علامات التلدة (~). يتم استخدامها في تركيبة مع تلك الأساسية لتمثيل الأحرف المحركة (على سبيل المثال ، ñ). بشكل عام ، يوفر Unicode الإصدار 9.0 رموزًا لـ 128،172 حرفًا من الحروف الهجائية العالمية ومجموعات ideogram ومجموعات الحروف.

يتم وضع معظم الأحرف الشائعة في أول نقاط رمز 64 كيلو بايت ، وهي مساحة من مساحة الرمز تسمى المستوى الرئيسي متعدد اللغات ، أو BMP لفترة قصيرة. هناك ستة عشر طائرة إضافية متاحة لترميز الأحرف الأخرى ، مع أكثر من 850،000 نقطة كود غير مستخدمة. قد تكون في متناول اليد لإضافة أحرف جديدة إلى الإصدارات المستقبلية من المعيار.

يحتفظ Unicode القياسي أيضًا بنقاط الكود للاستخدام الخاص. يمكن للبائعين أو المستخدمين النهائيين تعيينهم في أنظمتهم الخاصة لشخصياتهم أو استخدامها مع خطوط متخصصة. يحتوي BMP على 6400 نقطة رمز للاستخدام الخاص ونقاط 131 068 إضافية للرمز للاستخدام الخاص ، إذا كان 6400 لا يكفي لتطبيقات محددة.

ترميزات أحرف Unicode


لا تحدد معايير ترميز الأحرف فقط هوية كل حرف وقيمته الرقمية أو نقطة الرمز ، ولكن أيضًا كيفية تمثيل هذه القيمة بالبت.

يعرّف معيار Unicode ثلاثة أشكال من الترميز تسمح بنقل البيانات نفسها: بايت ، كلمة ، وكلمة مزدوجة (أي ، 8 ، 16 ، أو 32 بت لكل وحدة كود). ترميز النماذج الثلاثة نفس مجموعة الأحرف الشائعة ويمكن تحويلها بفعالية إلى بعضها البعض دون فقد البيانات. يوافق Unicode Consortium تمامًا على استخدام أي من نماذج الترميز هذه كطريقة متفق عليها لتنفيذ Unicode Standard.

UTF-8 شائع بالنسبة إلى HTML والبروتوكولات المشابهة. UTF-8 هو وسيلة لتحويل جميع أحرف Unicode إلى ترميز بطول البايت المتغير. ميزته هي أن أحرف Unicode المطابقة لمجموعة ASCII المألوفة لها نفس قيم البايت مثل ASCII ، ويمكن استخدام أحرف Unicode المحولة إلى UTF-8 مع الكثير من البرامج الموجودة دون تعديلات البرامج الرئيسية.

UTF-16 شائع في العديد من البيئات حيث من الضروري موازنة الوصول الفعال إلى الأحرف مع التخزين الاقتصادي. إنه مضغوط تمامًا ، ويتم وضع جميع الأحرف المستخدمة بشكل متكرر في مقطع شفرة 16 بت واحد ، بينما تتوفر جميع الأحرف الأخرى من خلال أزواج من كتل التعليمات البرمجية 16 بت.

يعد UTF-32 مفيدًا حيث لا يمثل مقدار الذاكرة مصدر قلق ، ولكنه يتطلب الوصول إلى الأحرف في رمز واحد ثابت العرض. هنا ، يتم ترميز كل حرف Unicode في كتلة رمز 32 بت واحد.

لا تتطلب أشكال الترميز الثلاثة أكثر من 4 بايت (أو 32 بت) لكل حرف.

نتحدث عن الأرقام


تنقسم مجموعة أحرف Unicode إلى 17 مقطعًا رئيسيًا (طائرات) ، وهي مقسمة إلى كتل. في كل مستوى ، يوجد مكان لـ 65 536 (2 16 ) نقطة رمز ، مما ينشئ إجمالي 111112 نقطة رمز. يوجد "طائرتان للاستخدام الخاص" (رقم 16 ورقم 17) مخصصة للاستخدام حسب تقدير الشركات / المستخدمين. لديهم 131،072 نقطة رمز.

عدداسمتتراوح من
1.الطائرة الرئيسية متعددة اللغات(من U + 0000 إلى U + FFFF)
2.طائرة إضافية متعددة اللغات(من U + 10000 إلى U + 1FFFF)
3.طائرة إيديوغرافية إضافية(من U + 20،000 إلى U + 2FFFF)
4.طائرة إيديوغرافية ثلاثية(من U + 30000 إلى U + 3FFFF)
5.الطائرة 5 (غير مستخدمة)(من U + 40،000 إلى U + 4FFFF)
6.الطائرة 6 (غير مستخدمة)(من U + 50000 إلى U + 5FFFF)
7.الطائرة 7 (غير مستخدمة)(من U + 60،000 إلى U + 6FFFF)
8.الطائرة 8 (غير مستخدمة)(من U + 70،000 إلى U + 7FFFF)
9.الطائرة 9 (غير مستخدمة)(من U + 80،000 إلى U + 8FFFF)
10.الطائرة 10 (غير مستخدمة)(من U + 90،000 إلى U + 9FFFF)
11.الطائرة 11 (غير مستخدمة)(من U + A0000 إلى U + AFFFF)
12.الطائرة 12 (غير مستخدمة)(من U + B0000 إلى U + BFFFF)
13.الطائرة 13 (غير مستخدمة)(من U + C0000 إلى U + CFFFF)
14.الطائرة 14 (غير مستخدمة)(من U + D0000 إلى U + DFFFF)
15.طائرة إضافية متخصصة(من U + E0000 إلى U + EFFFF)
16.مساحة إضافية للاستخدام الخاص - أ(من U + F0000 إلى U + FFFFF)
17.مساحة إضافية للاستخدام الخاص - B(من U + 100000 إلى U + 10FFFF)

تسمى الطائرة الأولى بالطائرة الرئيسية متعددة اللغات أو BMP. يحتوي على نقاط رمز من U + 0000 إلى U + FFFF ، أي الأحرف الأكثر استخدامًا. تسمى الطائرات الستة عشر المتبقية (U + 010000 → U + 10FFFF) إضافية أو نجمي.

أزواج بديلة UTF-16


يمكن تشفير الرموز خارج المستوى الرئيسي ، مثل tetragrammaton التي تعني الوسط (U + 1D306) ، في UTF-16 بوحدتي رمز 16 بت فقط: 0xD834 0xDF06. وهذا ما يسمى زوج بديل. يرجى ملاحظة أن الزوج البديل يمثل شخصية واحدة فقط.

تكون الوحدة البرمجية الأولى لزوج بديل دائمًا في النطاق من 0xD800 إلى 0xDBFF وتسمى الجزء العلوي من الزوج.

الوحدة البرمجية الثانية للزوج البديل تكون دائمًا في النطاق من 0xDC00 إلى 0xDFFF وتسمى أسفل الزوج.

ماتياس بينينس

زوج بديل: تمثيل لرمز تجريدي واحد ، يتألف من تسلسل من وحدتي كود 16 بت ، حيث تكون القيمة الأولى للزوج هي وحدة كود بديل علوي والثاني هو وحدة كود بديلة أقل. تستخدم الأزواج البديلة فقط في UTF-16.

يونيكود 8.0 الفصل 3.8 - بدائل

حساب أزواج بديلة


يجب ترميز حرف Unicode "Pile of shit" (U + 1F4A9) في UTF-16 كزوج بديل ، أي بديلين. لتحويل أي نقطة رمز إلى زوج بديل ، استخدم هذه الخوارزمية (في JavaScript). ضع في اعتبارك أننا نستخدم الرموز السداسية عشرية.

var High_Surrogate = function(Code_Point){ return Math.floor((Code_Point - 0x10000) / 0x400) + 0xD800 }; var Low_Surrogate = function(Code_Point){ return (Code_Point - 0x10000) % 0x400 + 0xDC00 }; // Reverses The Conversion var Code_Point = function(High_Surrogate, Low_Surrogate){ return (High_Surrogate - 0xD800) * 0x400 + Low_Surrogate - 0xDC00 + 0x10000; }; 



التكوين والتحلل


يتضمن Unicode آلية لتغيير شكل حرف ، مما يمتد إلى حد كبير مجموعة الحروف الرسومية المدعومة. وهذا ينطبق على علامات التشكيل المدمجة. يتم إدراجها بعد الشخصية الرئيسية. يمكن تطبيق علامات التشكيل المتعددة على نفس العلامة. يحتوي Unicode أيضًا على إصدارات سابقة التجميع لمعظم هذه المجموعات للاستخدام العادي.

يمكن أيضًا تمثيل بعض تسلسل الأحرف كحرف واحد يسمى حرفًا مركبًا مسبقًا ، ويعرف أيضًا باسم الحرف المركب. على سبيل المثال ، يمكن تشفير الحرف [ü] كنقطة الشفرة الوحيدة U + 00FC أو كحرف أساسي U + 0075 (u) ، متبوعًا بالحرف غير المستقل U + 0308 (¨). يقوم معيار Unicode بتشفير الأحرف المركبة للتوافق مع المعايير المعمول بها ، مثل Latin 1 ، والذي يتضمن العديد من الأحرف المركبة ، مثل [ü] و [ñ].

يمكن توسيع الأحرف المركبة للتناسق أو التحليل. على سبيل المثال ، عند التصنيف أبجديًا ، يمكن فك الرمز [ü] إلى [u] متبوعًا بالرمز غير المستقل [¨]. بعد هذا التحلل ، تصبح الخوارزمية أسهل في العمل مع سلسلة من الأحرف. هذا يجعل من السهل الفرز باللغات التي لا تؤثر فيها معدِّلات الأحرف على الترتيب الأبجدي. يعين Unicode القياسي ترتيب التحلل لجميع الأحرف المركبة. كما يحدد أشكال التطبيع لتوفير تمثيلات فريدة من الأحرف.

يونيكود الخرافات


من شرائح عرض مارك ديفيس "أساطير يونيكود" .

  • Unicode هو رمز 16 بت فقط . - يعتقد بعض الأشخاص عن طريق الخطأ أن Unicode هو مجرد رمز من 16 بت ، حيث يشغل كل حرف 16 بت ، وبالتالي هناك 65.536 حرفًا ممكنًا. في الواقع ، هذا ليس صحيحا تماما. هذه هي أسطورة يونيكود الأكثر شيوعًا ، لذلك إذا كنت تعتقد ذلك أيضًا من قبل ، فلا تثبط عزمك.
  • يمكنك أن تأخذ أي نقطة كود غير مستخدمة لاحتياجاتك . - كلا. يوما ما سيتم استبدال هذا المكان برمز آخر. بدلاً من ذلك ، استخدم الطائرات للاستخدام الخاص أو المساحات التي لا تحتوي على أحرف في كل مستوى حيث لن يكون هناك أحرف وفقًا للمعايير.
  • تمثل كل نقطة رمز Unicode حرفًا . - كلا. هناك العديد من النقاط بدون أحرف (FFFE ، FFFF ، 1FFFE ، وما إلى ذلك). بالإضافة إلى ذلك ، نقاط رمز بديلة ونقاط رمز خاصة وغير مستعملة ، بالإضافة إلى "أحرف" التحكم / التنسيق (RLM ، ZWNJ ، إلخ.)
  • يونيكود ينفد من الفضاء . - إذا تم ملؤها خطيا ، فإنه سينتهي في عام 2140. لكن المكان لا يملأ خطياً. الخطط المستقبلية انظر هنا .
  • تتم مطابقة جميع الشخصيات من شخص إلى آخر . - كلا. الخيارات هي:
    • واحد للكثيرين: (β → SS)
    • بالنظر إلى السياق: (... Σ ← → ... ς وفي الوقت نفسه ... ΣΤ ... ← → ... στ ...)
    • بناءً على الإعدادات المحلية: (I ← → ı وفي الوقت نفسه ، ← ← i)

يونيكود ترميزات التطبيق


نوع الترميزمثال
كائن HTML (عشري)
كائن HTML (ست عشري)
رمز التحكم URL٪ F0٪ 9F٪ 96٪ 96
UTF-8 (عرافة)0xF0 0x9F 0x96 0x96 (f09f9696)
UTF-8 (ثنائي)11110000: 10011111: 10010110: 10010110
UTF-16 / UTF-16BE (عرافة)0xD83D 0xDD96 (d83ddd96)
UTF-16LE (عرافة)0x3DD8 0x96DD (3dd896dd)
UTF-32 / UTF-32BE (عرافة)0x0001F596 (0001f596)
UTF-32LE (عرافة)0x96F50100 (96f50100)
ثماني تسلسل هروب\ 360 \ 237 \ 226 \ 226

شفرة المصدر


نوع الترميزمثال
جافا سكريبت\ u1F596
JSON\ u1F596
C\ u1F596
C ++\ u1F596
جافا\ u1F596
الثعبان\ u1F596
بيرل\ {{1F596}
ياقوت\ u {1F596}
CSS\ 01F596

قائمة الشخصيات المدهشة.



يمكن أن تتسبب مشاركة مستند في التحرير بسرعة إلى معركة راب مكتوبة ، يشنها ترتيب مربك بشكل متزايد من المديرين من U + 202a إلى U + 202e

شخصيات خاصة


نشر Unicode Consortium مخططًا للترقيم العام حيث يمكنك العثور على مزيد من المعلومات.

رمزاسموصف
''U + FEFF مساحة غير قابلة للكسر بعرض صفري (علامة ترتيب البايت - BOM)لديها خاصية هامة من التفرد عند تغيير ترتيب البايتات. كما أن لديها الصفر العرض والخفاء. في البرامج غير المناسبة (مثل مترجم PHP) ، يؤدي هذا إلى جميع أنواع أمثلة السلوك الممتع.
'￯'"\ uFFEF" عكس BOMغير مساوٍ لحرف ما ، باستثناء بداية النص.
'​'مساحة غير قابلة للكسر بعرض صفريرمز بدون مظهر وبدون تأثير ، باستثناء منع تشكيل الأربطة.
' 'U + 00A0 مساحة غير قابلة للكسريجعل الشخصيات المجاورة تلتصق ببعضها البعض. معروف باسم   في HTML.
''U + 00AD واصلة ناعمةفي HTML ، يعمل مثل مساحة ذات عرض صفري ، ولكن عندما يصادف نهاية السطر (وفي هذه الحالة فقط) تظهر الواصلة.
'‍'علامة U + 200D صفر العرض (مع الاتحاد)يؤدي إلى اتصال الأحرف المجاورة (على سبيل المثال ، الأحرف العربية أو الرموز التعبيرية المدعومة). يمكن استخدامها ل emojis مجتمعة بالتتابع.
'⁠'U + 2060 كلمة الموصلمثل U + 00A0 ، لكن غير مرئي تمامًا. جيد لـ @ font-face على Twitter.
' 'U + 1680 حرف مساحة أوغاميحدد مسافة تشبه الشرطة. كبيرة لجعل المبرمجين أقرب إلى الجنون: 1 + 2 === 3.
';'U + 037E علامة استفهام يونانيةيشبه منقوطة. أيضا وسيلة ممتعة لقزم المطورين.
'‭'U + 202Dيغير اتجاه النص من اليسار إلى اليمين.
'‮'U + 202Eيغير اتجاه النص من اليمين إلى اليسار.
'ꓸ'حرف U + A4F8 Lisu لهجة mya tiمضاعفة لهذه النقطة.
'ꓹ'U + A4F9 Lisu letter tone na poمضاعفة لفاصلة.
'ꓼ'U + A4FC Lisu letter tone mya naضعف لفاصلة منقوطة.
'ꓽ'حرف U + A4FD Lisu نغمة ميا جيومضاعفة للقولون.
'︀'محددات الخيار (من U + FE00 إلى U + FE0F ومن U + E0100 إلى U + E01EF)يمكن استخدام كتلة من 256 حرفًا ذات عرض صفري تحتوي على خاصية ID_Continue ، أي ، في أسماء المتغيرات (وليس الحرف الأول). ما يجعلهم مميزين هو أن مؤشر الماوس يمر فوقهم ، لأنهم يجمعون بين الأحرف ، على عكس معظم الأحرف الأخرى ذات العرض الصفري.
'ᅟ'U + 115F Placeholder Hangul Chosonيملأ أساسا الفضاء. يتم تقديمه كحرف صفري (غير مرئي) ما لم يكن مدعومًا بشكل واضح في العرض. تم وضع علامة ID_Start عليها
'ᅠ'U + 1160 Placeholder تشونسونربما يملأ الفضاء؟ يتم تقديمه كحرف صفري (غير مرئي) ما لم يكن مدعومًا بشكل واضح في العرض. تم وضع علامة ID_Start عليها
'ㅤ'U + 3164 هانغول الكليبشكل عام ، يملأ الفضاء. يتم تقديمه كحرف صفري (غير مرئي) ما لم يكن مدعومًا بشكل واضح في العرض. تم وضع علامة ID_Start عليها

انتظر ... ماذا قرأت للتو؟

يمكن أن تشمل المعرفات المتغيرة مسافات!


يتم عرض العنصر النائب U + 3164 Hangul كمساحة واسعة. إذا كان الحرف غير مدعوم بوضوح في العرض ، فسيتم عرضه على أنه غير مرئي تمامًا (ولا يشغل مساحة ، أي "عرض صفري"). هذا يعني أنك لن ترى أبدًا حرفًا بديلاً للشخصية القبيحة ( ).

لست متأكدًا بعد من سبب توجيه U + 3164 إلى التصرف بهذه الطريقة. ومن المثير للاهتمام ، تمت إضافة U + 3164 إلى Unicode في الإصدار 1.1 (1993) - لذلك كان لدى متخصصي الاتحاد الكثير من الوقت للتفكير فيه. على أي حال ، وهنا بعض الأمثلة.

 > var ᅟ = 'foo'; undefined > ᅟ 'foo' > var ㅤ= alert; undefined > var foo = 'bar' undefined > if ( foo ===ㅤ`baz` ){} // alert undefined > var varㅤfooㅤ\u{A60C}ㅤπ = 'bar'; undefined > varㅤfooㅤꘌㅤπ 'bar' 

** ملاحظة: ** اختبرت تقديم U + 3164 على Ubuntu و OS X مع المعلمات التالية: "العقدة" ، و "php" ، و "روبي" ، و "python3.5" ، و "scala" ، و "vim" ، و "cat" ، "chrome` +" github gist ". Atom هو النظام الوحيد الذي فشل (عن طريق الخطأ) في عرض الحقول الفارغة. لا يزال يتعين علي التحقق من الكود في Emacs و Sublime. كما أفهمها ، لن يعيد Unicode Consortium إعادة تعيين أو إعادة تسمية الأحرف أو نقاط الرمز ، ولكن يمكن إقناعها بتغيير خصائص الأحرف مثل ID_Start و ID_Continue.

معدلات


Zero Width Combiner (ZWJ) هو حرف غير قابل للطباعة في مجموعة كمبيوتر من بعض الخطوط المعقدة ، مثل العربية أو أي خط هندي. عند وضعها بين حرفين لا يمكن ربطهما بخلاف ذلك ، فإن ZWJ تجبرهما على الطباعة في شكل مشترك.

Zero Width Disconnector (ZWNJ) هو حرف غير قابل للطباعة في مجموعات الكتابة المستندة إلى الكمبيوتر مع الحروف المركبة. عند وضعها بين حرفين يمكن ضمهما بطريقة أخرى إلى رابط ، فإن ZWNJ تجبرهما على الطباعة في صيغتهما الأصلية والأصلية ، على التوالي. تعمل كمسافة ، ولكنها تُستخدم عندما يكون من المستحسن إبقاء الكلمات قريبة من بعضها البعض أو الجمع بين كلمة ما مع مورفها.

 > 'a' "a" > 'a\u{0308}' "ä" > 'a\u{20DE}\u{0308}' "a⃞̈" > 'a\u{20DE}\u{0308}\u{20DD}' "a⃞̈⃝" // Modifying Invisible Characters > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}' "‎‎‎‎‎‎‎‎‎‎" > '\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}\u{200E}'.length 10 

الأحرف الكبيرة تحويل الاصطدامات


رمزنقطة الرمزيؤدي
ß0x00DFSS
ı0x0131I
الصورة0x017FS
وما يليها0xFB00FF
فاي0xFB01FI
فلوريدا0xFB02FL
إسنا0xFB03FFI
FFL0xFB04FFL
قدم0xFB05ST
شارع0xFB06ST

اصطدامات تحويل الحالة الصغيرة


رمزنقطة الرمزيؤدي
K0x212Ak

المراوغات واستكشاف الأخطاء وإصلاحها


  • يتم تحديد طول الخط عادةً بعدد نقاط الكود . هذا يعني أن الأزواج البديلة ستعتبر حرفين. يمكن تركيب عدة علامات التشكيل على الرمز: a + ̈ == ̈a . هذا يزيد من طول السلسلة ، وإنتاج حرف واحد فقط.
  • وبالمثل ، فإن انقلاب السلسلة غالبًا ما يصبح مهمة غير تافهة . مرة أخرى ، ينبغي عكس الأزواج البديلة والتشكيلات معًا. تقدم ES Reverser حلاً جيدًا جدًا.
  • المقارنات الكبيرة والصغيرة لا تتطابق دائمًا . يمكن التعبير عنها في مثل هذه العلاقات:

    • واحد للكثيرين: (ß → SS)
    • بالنظر إلى السياق: (... Σ ← → ... ς و ... ΣΤ ... ← → ... στ ...)
    • بناءً على الإعدادات المحلية: (I ← → ı و İ ← → i)

    واحد لكثير من المقارنات


    تعبر معظم الأحرف الموضحة أدناه عن تعيينات رأس برأس في الأحرف الكبيرة والبعض الآخر في الأحرف الصغيرة. من حيث المبدأ ، يمكن تقسيم القائمة إلى قسمين.

    نقطة الرمزرمزاسمشخصية مرتبطةنقاط الكود المرتبطة
    U + 00DFßصغيرة اللاتينية الخفية (S حاد)s ، sU + 0073 ، U + 0073
    U + 0130İالحرف اللاتيني الكبير "I" مع نقطة أعلاهi ، ̇U + 0069 ، U + 0307
    U + 0149ʼnحرف صغير اللاتينية "ن" من الفاصلة العليا السابقةʼ ، nU + 02BC ، U + 006E
    U + 01F0ǰحرف صغير اللاتينية jj ، ̌U + 006A ، U + 030C
    U + 0390ΐصغيرة iota اليونانية مع غسيل الكلى و tonos.ι ، ̈ ،U + 03B9 ، U + 0308 ، U + 0301
    U + 03B0ΰالحروف الصغيرة ipsilon اليونانية مع غسيل الكلى و tonos.υ ، ̈ ،U + 03C5 ، U + 0308 ، U + 0301
    U + 0587ևالرباط الأرمني الصغير صغيراե ، ւU + 0565 ، U + 0582
    U + 1E96حرف صغير اللاتينية h مع سطر أدناهh ،U + 0068 ، U + 0331
    U + 1E97حرف صغير اللاتينية ر مع dieresist ، ̈U + 0074 ، U + 0308
    U + 1E98اللاتينية حرف صغير ث مع عصابة أعلاهw ، ̊U + 0077 ، U + 030A
    U + 1E99حرف صغير اللاتينية y مع عصابة أعلاهy ، ̊U + 0079 ، U + 030A
    U + 1E9Aحرف صغير اللاتينية مع النصف الأيمن من الحلبةa ، ʾU + 0061 ، U + 02BE
    U + 1E9Eحرف لاتيني كبيرs ، sU + 0073 ، U + 0073
    U + 1F50الحروف الصغيرة ipsilon اليونانية مع psilυ ، ̓U + 03C5 ، U + 0313
    U + 1F52الحروف الصغيرة ipsilon اليونانية مع psili و variaυ ، ̓ ،U + 03C5 ، U + 0313 ، U + 0300
    U + 1F54الحروف الصغيرة ipsilon اليونانية مع psily و oxyυ ، ̓ ،U + 03C5 ، U + 0313 ، U + 0301
    U + 1F56الحروف الصغيرة ipsilon اليونانية مع psily وتلفυ ، ̓ ،U + 03C5 ، U + 0313 ، U + 0342
    U + 1F80الحروف الصغيرة اليونانية ألفا مع psili و ipogemen ، ιU + 1F00 ، U + 03B9
    U + 1F81الحروف الصغيرة اليونانية ألفا مع dasia و ipogemen ، ιU + 1F01 ، U + 03B9
    U + 1F82الحروف الصغيرة اليونانية ألفا مع psilia و varia و ipogemen ، ιU + 1F02 ، U + 03B9
    U + 1F83الحروف الصغيرة اليونانية ألفا مع dasia و varia و ipogemen ، ιU + 1F03 ، U + 03B9
    U + 1F84الحروف الصغيرة اليونانية ألفا مع psily و oxy و ipogemen ، ιU + 1F04 ، U + 03B9
    U + 1F85الحروف الصغيرة اليونانية ألفا مع dasia و oxy و ipogemen ، ιU + 1F05 ، U + 03B9
    U + 1F86الحروف الصغيرة اليونانية ألفا مع psily و perispomenti و ipogemen ، ιU + 1F06 ، U + 03B9
    U + 1F87الحروف الصغيرة اليونانية ألفا مع dasia و perispomenti و hypogrammen ، ιU + 1F07 ، U + 03B9
    U + 1F88حرف العاصمة اليونانية ألفا مع psil والمبرمجين ، ιU + 1F00 ، U + 03B9
    U + 1F89حرف العاصمة اليونانية ألفا مع داسيا والبرمجة ، ιU + 1F01 ، U + 03B9
    U + 1F8Aحرف عاصمة اليونانية ألفا مع psilia و varia والبرامج ، ιU + 1F02 ، U + 03B9
    U + 1F8Bحرف عاصمة اليونانية ألفا مع داسيا وفاريا وبروغ ، ιU + 1F03 ، U + 03B9
    U + 1F8Cحرف عاصمة اليونانية ألفا مع psily وأوكسي وبروغ ، ιU + 1F04 ، U + 03B9
    U + 1F8Dحرف العاصمة اليونانية ألفا مع dasia و oxy و المبرمجين ، ιU + 1F05 ، U + 03B9
    U + 1F8Eحرف العاصمة اليونانية ألفا مع psily و perispomenti والبرمجة ، ιU + 1F06 ، U + 03B9
    U + 1F8Fحرف العاصمة اليونانية ألفا مع dasia و perispomenti وبروغ ، ιU + 1F07 ، U + 03B9
    U + 1F90الحروف الصغيرة اليونانية هذا مع psily و ipogemen ، ιU + 1F20 ، U + 03B9
    U + 1F91الأحرف الصغيرة اليونانية a مع dasia و ipogemen ، ιU + 1F21 ، U + 03B9
    U + 1F92الحروف الصغيرة اليونانية هذا مع psilia و varia و ipogemen ، ιU + 1F22 ، U + 03B9
    U + 1F93الحروف الصغيرة اليونانية eta مع dasia و varia و ipogemen ، ιU + 1F23 ، U + 03B9
    U + 1F94الأحرف الصغيرة اليونانية a مع psilia و oksia و ipogemen ، ιU + 1F24 ، U + 03B9
    U + 1F95الحروف الصغيرة اليونانية eta مع dasia و oksia و ipogemen ، ιU + 1F25 ، U + 03B9
    U + 1F96الحروف الصغيرة اليونانية هذا مع psily و perispomenti و ipogemen ، ιU + 1F26 ، U + 03B9
    U + 1F97الحروف الصغيرة اليونانية eta مع dasia و perisopmenti و hypogrammen ، ιU + 1F27 ، U + 03B9
    U + 1F98هذه الرسالة عاصمة اليونانية مع psilah والبرامج ، ιU + 1F20 ، U + 03B9
    U + 1F99هذه الرسالة عاصمة اليونانية مع dasia والمبرمجين ، ιU + 1F21 ، U + 03B9
    U + 1F9Aهذه الرسالة عاصمة اليونانية مع psilia و varia و prosgrammemeny ، ιU + 1F22 ، U + 03B9
    U + 1F9Bهذه الرسالة عاصمة اليونانية مع dasia و varia و prosgrammemeny ، ιU + 1F23 ، U + 03B9
    U + 1F9Cهذه الرسالة عاصمة اليونانية مع psilia و oxy والمبرمجين ، ιU + 1F24 ، U + 03B9
    U + 1F9Dهذه الرسالة عاصمة اليونانية مع dasia و oksia والمبرمجين ، ιU + 1F25 ، U + 03B9
    U + 1F9Eهذه الرسالة عاصمة اليونانية مع psily و perispomenty و prosgrammeny ، ιU + 1F26 ، U + 03B9
    U + 1F9Fهذه الرسالة عاصمة اليونانية مع dasia و perispomenti والمبرمجين ، ιU + 1F27 ، U + 03B9
    U + 1FA0الحروف الصغيرة أوميغا اليونانية مع psili و ipogemen ، ιU + 1F60 ، U + 03B9
    U + 1FA1الأحرف الصغيرة أوميغا اليونانية مع داسيا و ipogemen ، ιU + 1F61 ، U + 03B9
    U + 1FA2الأحرف الصغيرة أوميغا اليونانية مع psilia و varia و ipogemen ، ιU + 1F62 ، U + 03B9
    U + 1FA3الحروف الصغيرة أوميغا اليونانية مع dasia و varia و ipogemen ، ιU + 1F63 ، U + 03B9
    U + 1FA4الحروف الصغيرة أوميغا اليونانية مع psily و oxy و ipogemen ، ιU + 1F64 ، U + 03B9
    U + 1FA5الأحرف الصغيرة أوميغا اليونانية مع داسيا وأوكسي و ipogemen ، ιU + 1F65 ، U + 03B9
    U + 1FA6الحروف الصغيرة أوميغا اليونانية مع psily و perispomenti و ipogemen ، ιU + 1F66 ، U + 03B9
    U + 1FA7الأحرف الصغيرة أوميغا اليونانية مع dasia و perispomenti و hypogrammemen ، ιU + 1F67 ، U + 03B9
    U + 1FA8عاصمة اليونان أوميغا حرف مع psili والبرنامج ، ιU + 1F60 ، U + 03B9
    U + 1FA9الرسالة العاصمة اليونانية أوميغا مع داسيا والبرمجة ، ιU + 1F61 ، U + 03B9
    U + 1FAAحرف أوميغا الكبير باليونانية مع psilia و varia و prosgrammemeny ، ιU + 1F62 ، U + 03B9
    U + 1FABالرسالة العاصمة اليونانية أوميغا مع داسيا وفاريا والبرمجة ، ιU + 1F63 ، U + 03B9
    U + 1FACرسالة أوميغا عاصمة اليونان مع psilia و oxy و progamemen ، ιU + 1F64 ، U + 03B9
    U + 1FADحرف عاصمة أوميغا اليونانية مع dasia و oksia والمبرمجين ، ιU + 1F65 ، U + 03B9
    U + 1FAEالعاصمة اليونانية أوميغا حرف مع psily و perispomenti و prosgrammemeny ، ιU + 1F66 ، U + 03B9
    U + 1FAFالعاصمة اليونانية أوميغا حرف مع dasia و perispomenti و prosgrammemeny ، ιU + 1F67 ، U + 03B9
    U + 1FB2الحروف الصغيرة اليونانية ألفا مع فاريا و ipogemen ، ιU + 1F70 ، U + 03B9
    U + 1FB3الحروف الصغيرة اليونانية ألفا مع ogogerammeniα ، ιU + 03B1 ، U + 03B9
    U + 1FB4الحروف الصغيرة اليونانية ألفا مع أوكسي و ipogemenά ، ιU + 03AC ، U + 03B9
    U + 1FB6الحروف الصغيرة اليونانية ألفا مع perispomentiα ،U + 03B1 ، U + 0342
    U + 1FB7الحروف الصغيرة اليونانية ألفا مع perispomenti و ipogemenα ، ͂ ιU + 03B1 ، U + 0342 ، U + 03B9
    U + 1FBCحرف عاصمة اليونانية ألفا مع بروغα ، ιU + 03B1 ، U + 03B9
    U + 1FC2الحروف الصغيرة اليونانية وآخرون مع varia و ipogemen ، ιU + 1F74 ، U + 03B9
    U + 1FC3الحروف الصغيرة اليونانية مع ipogemenη ، ιU + 03B7 ، U + 03B9
    U + 1FC4الحروف الصغيرة اليونانية إيتا مع أوكسي و ipogemenή ، ιU + 03AE ، U + 03B9
    U + 1FC6الحروف الصغيرة اليونانية مع perispomentiη ،U + 03B7 ، U + 0342
    U + 1FC7الأحرف الصغيرة اليونانية a مع perispomenti و ipogemenη ، ͂ ιU + 03B7 ، U + 0342 ، U + 03B9
    U + 1FCCهذه الرسالة عاصمة اليونانية مع بروغη ، ιU + 03B7 ، U + 03B9
    U + 1FD2صغيرة iota اليونانية مع غسيل الكلى وفاريι ، ̈ ،U + 03B9 ، U + 0308 ، U + 0300
    U + 1FD3صغيرة iota اليونانية مع غسيل الكلى وأوكسيι ، ̈ ،U + 03B9 ، U + 0308 ، U + 0301
    U + 1FD6صغيرة iota اليونانية مع perispomentiι ،U + 03B9 ، U + 0342
    U + 1FD7صغيرة iota اليونانية مع غسيل الكلى والفترةι ، ̈ ،U + 03B9 ، U + 0308 ، U + 0342
    U + 1FE2أحرف صغيرة ipsilon اليونانية مع غسيل الكلى وفاري.υ ، ̈ ،U + 03C5 ، U + 0308 ، U + 0300
    U + 1FE3الحروف الصغيرة ipsilon اليونانية مع غسيل الكلى وأوكسي.υ ، ̈ ،U + 03C5 ، U + 0308 ، U + 0301
    U + 1FE4اليونانية الصغيرة رو مع psiliρ ، ̓U + 03C1 ، U + 0313
    U + 1FE6الحروف الصغيرة ipsilon اليونانية مع perispomentiυ ،U + 03C5 ، U + 0342
    U + 1FE7الحروف الصغيرة ipsilon اليونانية مع غسيل الكلى وفترةυ ، ̈ ،U + 03C5 ، U + 0308 ، U + 0342
    U + 1FF2الحروف الصغيرة أوميغا اليونانية مع فاريا و ipogemen ، ιU + 1F7C ، U + 03B9
    U + 1FF3الأحرف الصغيرة أوميغا اليونانية مع ogogerammeniω ، ιU + 03C9 ، U + 03B9
    U + 1FF4الأحرف الصغيرة أوميغا اليونانية مع oxia و ipogemenώ ، ιU + 03CE ، U + 03B9
    U + 1FF6الأحرف الصغيرة أوميغا اليونانية مع perispomentiω ،U + 03C9 ، U + 0342
    U + 1FF7الأحرف الصغيرة أوميغا اليونانية مع perispomenti و ipogemenω ، ͂ ιU + 03C9 ، U + 0342 ، U + 03B9
    U + 1FFCالعاصمة اليونانية رسالة أوميغا مع البرنامجω ، ιU + 03C9 ، U + 03B9
    U + FB00الرباط اللاتينية الصغيرة Fff fU + 0066 ، U + 0066
    U + FB01الرباط اللاتينية صغيرة فايf ، iU + 0066 ، U + 0069
    U + FB02الرباط اللاتينية الصغيرة Flf lU + 0066 ، U + 006C
    U + FB03الرباط اللاتينية الصغيرة Ffif ، f ، iU + 0066 ، U + 0066 ، U + 0069
    U + FB04الرباط اللاتينية الصغيرة Fflf ، f ، lU + 0066 ، U + 0066 ، U + 006C
    U + FB05رباط صغير اللاتينية ST طويلs ، tU + 0073 ، U + 0074
    U + FB06الرباط اللاتينية الصغيرة Sts ، tU + 0073 ، U + 0074
    U + FB13الأرمنية الصغيرة الرباط الرجال الآنմ ، նU + 0574 ، U + 0576
    U + FB14ربطة صغيرة أرمنيةմ ، եU + 0574 ، U + 0565
    U + FB15الأرمنية الصغيرة الأرصاد الرجال إينيմ ، իU + 0574 ، U + 056B
    U + FB16الأرمنية الصغيرة الرباط الآنվ ، նU + 057E ، U + 0576
    U + FB17الأرمنية الصغيرة الرباط الرجال Xehմ ، խU + 0574 ، U + 056D

    حزم كبيرة والمكتبات


    • PhantomScript -: ghost :: flashlight: تنفيذ جافا سكريبت والهندسة الاجتماعية غير المرئي
    • ESReverser - معالجة سلسلة JavaScript على أساس Unicode .
    • تقليد - إساءة استخدام يونيكود
    • python-ftfy - محاولات لإنشاء أقصى تمثيل صحيح وكامل للنص الوارد في Unicode.
    • vim-troll-stopper - حماية التعليمات البرمجية الخاصة بك من المتصيدون يونيكود.

    رمز تعبيري




    Unicode (diversity), . .

    , , . — . :

    U+1F469 U+200D U+2764 U+FE0F U+200D U+1F469️‍️‍️‍couple with heart: woman, woman
    U+1F468 U+200D U+1F468 U+200D U+1F467 U+200D U+1F466

    , .

    8.0 ( 2015 ) - . , ( , FitzpatrickSkinType.pdf). .

    Unicode

    قانوناسم
    U+1F3FB-1-2
    U+1F3FC-3
    U+1F3FD-4
    U+1F3FE-5
    U+1F3FF-6

    , \u{1F466}\u{1F3FE} .


    +






    JavaScript (ES6)

    , ID_START , . , ID_CONTINUE , .

     // How convenient! var π = Math.PI; // Sometimes, you just have to use the Bad Parts of JavaScript: var ಠ_ಠ = eval; // Code, YU NO WORK?! var ლ_ಠ益ಠ_ლ = 42; // How about a JavaScript library for functional programming? var λ = function() {}; // Obfuscate boring variable names for great justice var \u006C\u006F\u006C\u0077\u0061\u0074 = 'heh'; // …or just make up random ones var Ꙭൽↈⴱ = 'huh'; // While perfectly valid, this doesn't work in most browsers: var foo\u200Cbar = 42; // This is *not* a bitwise left shift (`<<`): var 〱〱 = 2; // This is, though: 〱〱 << 〱〱; // 8 // Give yourself a discount: var price_9̶9̶_89 = 'cheap'; // Fun with Roman numerals var Ⅳ = 4; var Ⅴ = 5; Ⅳ + Ⅴ; // 9 // Cthulhu was here var Hͫ̆̒̐ͣ̊̄ͯ͗͏̵̗̻̰̠̬͝ͅE̴̷̬͎̱̘͇͍̾ͦ͊͒͊̓̓̐_̫̠̱̩̭̤͈̑̎̋ͮͩ̒͑̾͋͘Ç̳͕̯̭̱̲̣̠̜͋̍O̴̦̗̯̹̼ͭ̐ͨ̊̈͘͠M̶̝̠̭̭̤̻͓͑̓̊ͣͤ̎͟͠E̢̞̮̹͍̞̳̣ͣͪ͐̈T̡̯̳̭̜̠͕͌̈́̽̿ͤ̿̅̑Ḧ̱̱̺̰̳̹̘̰́̏ͪ̂̽͂̀͠ = 'Zalgo'; 

    CSS .

     <!-- place this within the document head --> <meta charset="UTF-8" /> <!-- error message --> <div class="ಠ_ಠ">You do not have access to this page.</div> <!-- success message --> <div class="">Your changes have been saved successfully!</div> 

     .ಠ_ಠ { border: 1px solid #f00; } . { background: lightgreen; } 

    HTML


    HTML- , , .

    , HTML .

     // U+1160 HANGUL JUNGSEONG FILLER transformAllTags('ᅠ'); // An actual HTML element node designed to look like a comment node, using the U+01C3 LATIN LETTER RETROFLEX CLICK // <ǃ-- name="viewport" content="width=device-width"></ǃ--> transformAllTags('ǃ--'); // or even <ᅠ⃝ transformAllTags('\u{1160}\u{20dd}'); // and for a bonus, all existing tag names will have each character ensquared. h⃞t⃞m⃞l⃞ transformAllTags(); function transformAllTags (newName){ // querySelectorAll doesn't actually return an array. Array.from(document.querySelectorAll('*')) .forEach(function(x){ transformTag(x, newName); }); } function wonky(str){ return str.split('').join('\u{20de}') + '\u{20de}'; } function transformTag(tagIdOrElem, tagType){ var elem = (tagIdOrElem instanceof HTMLElement) ? tagIdOrElem : document.getElementById(tagIdOrElem); if(!elem || !(elem instanceof HTMLElement))return; var children = elem.childNodes; var parent = elem.parentNode; var newNode = document.createElement(tagType||wonky(elem.tagName)); for(var a=0;a<elem.attributes.length;a++){ newNode.setAttribute(elem.attributes[a].nodeName, elem.attributes[a].value); } for(var i= 0,clen=children.length;i<clen;i++){ newNode.appendChild(children[0]); //0...always point to the first non-moved element } newNode.style.cssText = elem.style.cssText; parent.replaceChild(newNode,elem); } 

    :

     function testBegin(str){ try{ eval(`document.createElement( '${str}' );`) return true; } catch(e){ return false; } } function testContinue(str){ try{ eval(`document.createElement( 'a${str}' );`) return true; } catch(e){ return false; } } 

    :

     // Test if dashes can start an HTML Tag > testBegin('-') < false > testContinue('-') < true > testBegin('ᅠ-') // Prepend dash with U+1160 HANGUL JUNGSEONG FILLER < true 


    TrueType OpenType UTF-8, 65 535 . 1,1 UTF-8, .








    256 .



    , () (CJK). , , « ».


    . 17- .

    اسمإلى#
    U+0000U+007F128
    — 1U+0080U+00FF128
    — AU+0100U+017F128
    — BU+0180U+024F208
    U+0250U+02AF96
    U+02B0U+02FF80
    U+0300U+036F112
    U+0370U+03FF135
    U+0400U+04FF256
    U+0500U+052F48
    U+0530U+058F89
    U+0590U+05FF87
    U+0600U+06FF255
    U+0700U+074F77
    U+0750U+077F48
    U+0780U+07BF50
    U+07C0U+07FF59
    U+0800U+083F61
    U+0840U+085F29
    — AU+08A0U+08FF50
    U+0900U+097F128
    U+0980U+09FF93
    U+0A00U+0A7F79
    U+0A80U+0AFF85
    U+0B00U+0B7F90
    U+0B80U+0BFF72
    U+0C00U+0C7F96
    U+0C80U+0CFF87
    U+0D00U+0D7F100
    U+0D80U+0DFF90
    U+0E00U+0E7F87
    U+0E80U+0EFF67
    U+0F00U+0FFF211
    U+1000U+109F160
    U+10A0U+10FF88
    U+1100U+11FF256
    U+1200U+137F358
    U+1380U+139F26
    U+13A0U+13FF92
    U+1400U+167F640
    U+1680U+169F29
    U+16A0U+16FF89
    U+1700U+171F20
    U+1720U+173F23
    U+1740U+175F20
    U+1760U+177F18
    U+1780U+17FF114
    U+1800U+18AF156
    U+18B0U+18FF70
    U+1900U+194F68
    U+1950U+197F35
    U+1980U+19DF83
    U+19E0U+19FF32
    U+1A00U+1A1F30
    U+1A20U+1AAF127
    U+1AB0U+1AFF15
    U+1B00U+1B7F121
    U+1B80U+1BBF64
    U+1BC0U+1BFF56
    U+1C00U+1C4F74
    -U+1C50U+1C7F48
    U+1CC0U+1CCF8
    U+1CD0U+1CFF41
    U+1D00U+1D7F128
    U+1D80U+1DBF64
    U+1DFFU+1DC0U+1DFF58
    U+1E00U+1EFF256
    U+1F00U+1FFF233
    U+2000U+206F111
    U+2070U+209F42
    U+20A0U+20CF31
    U+20D0U+20FF33
    U+2100U+214F80
    U+2150U+218F60
    U+2190U+21FF112
    U+2200U+22FF256
    U+2300U+23FF251
    U+2400U+243F39
    U+2440U+245F11
    U+2460U+24FF160
    U+2500U+257F128
    U+2580U+259F32
    U+25A0U+25FF96
    U+2600U+26FF256
    DingbatsU+2700U+27BF192
    — AU+27C0U+27EF48
    — AU+27F0U+27FF16
    U+2800U+28FF256
    — BU+2900U+297F128
    — BU+2980U+29FF128
    U+2A00U+2AFF256
    U+2B00U+2BFF206
    U+2C00U+2C5F94
    — CU+2C60U+2C7F32
    U+2C80U+2CFF123
    U+2D00U+2D2F40
    U+2D30U+2D7F59
    U+2D80U+2DDF79
    — AU+2DE0U+2DFF32
    U+2E00U+2E7F67
    U+2E80U+2EFF115
    U+2F00U+2FDF214
    U+2FF0U+2FFF12
    U+3000U+303F64
    U+3040U+309F93
    U+30A0U+30FF96
    U+3100U+312F41
    U+3130U+318F94
    U+3190U+319F16
    U+31A0U+31BF27
    U+31C0U+31EF36
    U+31F0U+31FF16
    U+3200U+32FF254
    U+3300U+33FF256
    — AU+3400U+4DBF6191
    « »U+4DC0U+4DFF64
    U+4E00U+9FFF20941
    U+A000U+A48F1165
    U+A490U+A4CF55
    U+A4D0U+A4FF48
    U+A500U+A63F300
    — BU+A640U+A69F96
    U+A6A0U+A6FF88
    U+A700U+A71F32
    — DU+A720U+A7FF159
    U+A800U+A82F44
    U+A830U+A83F10
    U+A840U+A87F56
    U+A880U+A8DF81
    U+A8E0U+A8FF30
    -U+A900U+A92F48
    U+A930U+A95F37
    — AU+A960U+A97F29
    U+A980U+A9DF91
    — BU+A9E0U+A9FF31
    U+AA00U+AA5F83
    — AU+AA60U+AA7F32
    -U+AA80U+AADF72
    U+AAE0U+AAFF23
    — AU+AB00U+AB2F32
    — EU+AB30U+AB6F54
    U+AB70U+ABBF80
    U+ABC0U+ABFF56
    U+AC00U+D7AF2
    — BU+D7B0U+D7FF72
    U+D800U+DB7F2
    U+DB80U+DBFF2
    U+DC00U+DFFF2
    U+E000U+F8FF2
    U+F900U+FAFF472
    U+FB00U+FB4F58
    — AU+FB50U+FDFF643
    U+FE00U+FE0F16
    U+FE10U+FE1F10
    U+FE20U+FE2F16
    U+FE30U+FE4F32
    U+FE50U+FE6F26
    — BU+FE70U+FEFF141
    U+FF00U+FFEF225
    شخصيات خاصةU+FFF0U+FFFF7
    U+10000U+1007F88
    U+10080U+100FF123
    U+10100U+1013F57
    U+10140U+1018F77
    U+10190U+101CF13
    U+101D0U+101FF46
    U+10280U+1029F29
    U+102A0U+102DF49
    U+102E0U+102FF28
    U+10300U+1032F36
    U+10330U+1034F27
    U+10350U+1037F43
    U+10380U+1039F31
    U+103A0U+103DF50
    U+10400U+1044F80
    U+10450U+1047F48
    U+10480U+104AF40
    U+10500U+1052F40
    U+10530U+1056F53
    U+10600U+1077F341
    U+10800U+1083F55
    U+10840U+1085F31
    U+10860U+1087F32
    U+10880U+108AF40
    U+108E0U+108FF26
    U+10900U+1091F29
    U+10920U+1093F27
    U+10980U+1099F32
    U+109A0U+109FF90
    U+10A00U+10A5F65
    U+10A60U+10A7F32
    U+10A80U+10A9F32
    U+10AC0U+10AFF51
    U+10B00U+10B3F61
    U+10B40U+10B5F30
    U+10B60U+10B7F27
    U+10B80U+10BAF29
    U+10C00U+10C4F73
    U+10C80U+10CFF108
    U+10E60U+10E7F31
    U+11000U+1107F109
    U+11080U+110CF66
    -U+110D0U+110FF35
    U+11100U+1114F67
    U+11150U+1117F39
    U+11180U+111DF94
    U+111E0U+111FF20
    U+11200U+1124F61
    U+11280U+112AF38
    U+112B0U+112FF69
    U+11300U+1137F85
    U+11480U+114DF82
    U+11580U+115FF92
    U+11600U+1165F79
    U+11680U+116CF66
    U+11700U+1173F57
    -U+118A0U+118FF84
    U+11AC0U+11AFF57
    U+12000U+123FF922
    U+12400U+1247F116
    U+12480U+1254F196
    U+13000U+1342F1071
    U+14400U+1467F583
    U+16800U+16A3F569
    U+16A40U+16A6F43
    U+16AD0U+16AFF36
    U+16B00U+16B8F127
    U+16F00U+16F9F133
    U+1B000U+1B0FF2
    U+1BC00U+1BC9F143
    U+1BCA0U+1BCAF4
    U+1D000U+1D0FF246
    U+1D100U+1D1FF231
    U+1D200U+1D24F70
    « »U+1D300U+1D35F87
    U+1D360U+1D37F18
    U+1D400U+1D7FF996
    SignWritingU+1D800U+1DAAF672
    U+1E800U+1E8DF213
    U+1EE00U+1EEFF143
    U+1F000U+1F02F44
    U+1F030U+1F09F100
    U+1F0A0U+1F0FF82
    U+1F100U+1F1FF173
    U+1F200U+1F2FF57
    U+1F300U+1F5FF766
    U+1F600U+1F64F80
    U+1F650U+1F67F48
    U+1F680U+1F6FF98
    U+1F700U+1F77F116
    U+1F780U+1F7FF85
    — CU+1F800U+1F8FF148
    U+1F900U+1F9FF15
    — BU+20000U+2A6DF42676
    — CU+2A700U+2B73F60
    — DU+2B740U+2B81F27
    — EU+2B820U+2CEAF2
    U+2F800U+2FA1F542
    TagsU+E0000U+E007F97
    U+E0100U+E01EF240
    — AU+F0000U+FFFFF4
    — BU+100000U+10FFFF4


    :

    • — - .
    • — , .
    • — .
    • — , . .
    • , — , . , .
    • — , . , [Ä] [A] [¨].
    • — .
    • — , , . .
    • — , .
    • — .

    : c codepoints.net .


Source: https://habr.com/ru/post/ar485148/


All Articles