Comment j'ai ajouté 6 caractères en Unicode
Les symboles d'étoile (☆ ★) sont depuis longtemps inclus dans Unicode, et peuvent donc apparaître sous forme de symboles sur les pages Web, dans les textes et dans le courrier. Mais il n'y avait pas de demi-étoiles, ils avaient donc besoin d'images ou de polices spéciales. J'ai récemment participé à la rédaction d'une proposition d'ajout de demi-étoiles à Unicode, et maintenant notre offre vient d'être acceptée. Dans la prochaine version Unicode, les demi-étoiles peuvent être utilisées avec n'importe quel personnage. Dans l'article, je vais vous expliquer comment j'ai réussi à ajouter des demi-étoiles et deux autres personnages en Unicode.4 utilisations différentes d'une demi-étoile pour représenter une coteUnicode de 3,5 est une norme informatique qui détermine quels caractères seront utilisés par presque tous les ordinateurs. Il permet à divers ordinateurs d'afficher du texte dans presque toutes les langues et avec presque tous les caractères nécessaires (avant Unicode, travailler avec des textes non anglais était terriblement déroutant). Mais Unicode ne comprend pas tout. En juin dernier, un commentaire sur Hacker News s'est plaint que Unicode n'avait pas le symbole demi-étoile nécessaire pour les classements et les critiques de films.J'ai suggéré à quelqu'un d'écrire une proposition pour ajouter ce symbole, mais j'ai rapidement réalisé que je devais être cette personne. Comme j'avais précédemment ajouté avec succès deux caractères à Unicode, je connaissais le processus nécessaire.Il y a quelques années, un article détaillé décrivait comment deux personnes ont ajouté des symboles de désignation de puissance à Unicode. Ajouter un nouveau personnage à Unicode est plus facile que vous ne le pensez. Pas besoin de payer de l'argent, de travailler dans une grande entreprise ou de rejoindre une commission. Il vous suffit d'écrire une phrase expliquant la nécessité d'inclure un symbole. Si le comité Unicode est d'accord avec lui, il approuvera l'ajout à Unicode.En 2015, j'ai commencé à programmer le mainframe IBM 1401 à partir des années 1960 au Museum of Computer History. Mais quand j'ai décrit ce système, j'ai eu des difficultés. L'ordinateur a utilisé un jeu de caractères 6 bits (prédécesseur EBCDIC) avec quelques caractères étranges. Tous étaient en Unicode, à l'exception des balises à un groupe. J'ai été choqué que dans Unicode contenant 128.172 caractères, le caractère dont j'avais besoin était manquant. Après avoir lu les succès du groupe qui a ajouté des symboles alimentaires, j'ai décidé qu'il serait intéressant de voir si je pouvais ajouter le symbole d'étiquette de groupe à Unicode. J'ai écrit une proposition, je l'ai envoyée à la commission et à la prochaine réunion, elle a été approuvée.Description de l'étiquette du groupe dans le manuel IBM 705 de 1959Après quelques mois, j'ai découvert qu'il n'y avait pas de symbole pour les bitcoins dans Unicode. C'était inattendu car ce symbole est largement utilisé. Il a déjà été rejeté, donc en octobre 2015, j'ai écrit une proposition plus approfondie, en utilisant le support actif de / r / bitcoin et d'autres groupes. Cette proposition a été acceptée par le comité Unicode en novembre 2015.

 Source: https://habr.com/ru/post/fr398145/
All Articles