Comment j'ai ajouté 6 caractères en Unicode

Les symboles d'étoile (☆ ★) sont depuis longtemps inclus dans Unicode, et peuvent donc apparaître sous forme de symboles sur les pages Web, dans les textes et dans le courrier. Mais il n'y avait pas de demi-étoiles, ils avaient donc besoin d'images ou de polices spéciales. J'ai récemment participé à la rédaction d'une proposition d'ajout de demi-étoiles à Unicode, et maintenant notre offre vient d'être acceptée. Dans la prochaine version Unicode, les demi-étoiles peuvent être utilisées avec n'importe quel personnage. Dans l'article, je vais vous expliquer comment j'ai réussi à ajouter des demi-étoiles et deux autres personnages en Unicode.


4 utilisations différentes d'une demi-étoile pour représenter une cote

Unicode de 3,5 est une norme informatique qui détermine quels caractères seront utilisés par presque tous les ordinateurs. Il permet à divers ordinateurs d'afficher du texte dans presque toutes les langues et avec presque tous les caractères nécessaires (avant Unicode, travailler avec des textes non anglais était terriblement déroutant). Mais Unicode ne comprend pas tout. En juin dernier, un commentaire sur Hacker News s'est plaint que Unicode n'avait pas le symbole demi-étoile nécessaire pour les classements et les critiques de films.

J'ai suggéré à quelqu'un d'écrire une proposition pour ajouter ce symbole, mais j'ai rapidement réalisé que je devais être cette personne. Comme j'avais précédemment ajouté avec succès deux caractères à Unicode, je connaissais le processus nécessaire.

Il y a quelques années, un article détaillé décrivait comment deux personnes ont ajouté des symboles de désignation de puissance à Unicode. Ajouter un nouveau personnage à Unicode est plus facile que vous ne le pensez. Pas besoin de payer de l'argent, de travailler dans une grande entreprise ou de rejoindre une commission. Il vous suffit d'écrire une phrase expliquant la nécessité d'inclure un symbole. Si le comité Unicode est d'accord avec lui, il approuvera l'ajout à Unicode.

En 2015, j'ai commencé à programmer le mainframe IBM 1401 à partir des années 1960 au Museum of Computer History. Mais quand j'ai décrit ce système, j'ai eu des difficultés. L'ordinateur a utilisé un jeu de caractères 6 bits (prédécesseur EBCDIC) avec quelques caractères étranges. Tous étaient en Unicode, à l'exception des balises à un groupe. J'ai été choqué que dans Unicode contenant 128.172 caractères, le caractère dont j'avais besoin était manquant. Après avoir lu les succès du groupe qui a ajouté des symboles alimentaires, j'ai décidé qu'il serait intéressant de voir si je pouvais ajouter le symbole d'étiquette de groupe à Unicode. J'ai écrit une proposition, je l'ai envoyée à la commission et à la prochaine réunion, elle a été approuvée.


Description de l'étiquette du groupe dans le manuel IBM 705 de 1959

Après quelques mois, j'ai découvert qu'il n'y avait pas de symbole pour les bitcoins dans Unicode. C'était inattendu car ce symbole est largement utilisé. Il a déjà été rejeté, donc en octobre 2015, j'ai écrit une proposition plus approfondie, en utilisant le support actif de / r / bitcoin et d'autres groupes. Cette proposition a été acceptée par le comité Unicode en novembre 2015.


Et quand j'ai vu le commentaire sur les demi-étoiles sur Hacker News, j'ai décidé qu'il serait assez simple d'assurer son adoption en Unicode. Après des discussions sur HN et sur la liste de diffusion Unicode, j'ai écrit une phrase. La commission l'a examinée en août 2016, mais à ma grande surprise, elle a reçu une autre proposition similaire et a décidé d'attendre une seule proposition. Il s'est avéré qu'Andrew West a également rédigé une proposition de demi-étoiles, et nous avons envoyé nos offres de manière indépendante. Nous avons donc uni nos forces et fait une proposition combinée, qui a été adoptée par la commission le 30 septembre 2016.

Pourquoi avons-nous proposé quatre types différents de demi-étoiles? Nous avons inclus à la fois des étoiles cerclées et des étoiles solides, car ces deux types sont souvent utilisés (je ne savais pas si la commission considérerait ces symboles suffisamment différents pour inclure les deux, mais il en est ainsi). Dans les langues écrites de droite à gauche, comme l'hébreu, la cote des astérisques est également écrite de droite à gauche (ce qui m'a surpris), nous avons donc inclus des versions miroir des astérisques pour ces langues. En conséquence, quatre versions différentes couvraient tous les cas d'utilisation.


S'il existe un tel personnage que vous aimeriez voir dans Unicode et qu'il répond aux exigences, vous devez placer une proposition, car ce processus est simple et intéressant. Assurez-vous que le symbole répond aux exigences. En particulier, il est nécessaire de trouver quelques exemples de son utilisation dans le texte. Le comité Unicode n'ajoutera pas de personnage juste parce que vous pensez qu'il est cool, vous aurez donc besoin d'exemples de son utilisation. La création d'une police pour démontrer un nouveau caractère est la partie la plus difficile. J'ai utilisé FontForge. L'équipe avec les symboles de pouvoir avait de nombreux conseillers pour aider à faire une proposition réussie. Je serai également heureux de vous offrir de tels conseils.

Il convient de mentionner que le processus est très différent pour les emoji, il n'est donc pas nécessaire de dire que «puisqu'il y a des emoji pour merde, mon personnage a également le droit d'exister» (le symbole a été ajouté pour une compatibilité ascendante avec les téléphones mobiles japonais). Pour les emojis, la popularité attendue du symbole est le principal facteur influençant l'approbation. Mais Unicode ne se soucie pas de la popularité - les rouleaux historiques des Tanguts n'auront pas un millionième part de la popularité du nouvel emoji - mais dans le texte. J'ai le sentiment que de nombreux membres du comité Unicode ne voudraient pas du tout pratiquer les emoji.

Après avoir accepté le symbole, il a un long chemin à parcourir dans les polices et l'utilisation possible. Une nouvelle version d'Unicode est publiée en juin, donc les demi-étoiles devraient apparaître dans Unicode 11.0 à la mi-2018. La communauté Bitcoin a dû attendre très longtemps, car le symbole de Bitcoin a manqué un peu la sortie d'Unicode 9.0, il devrait donc apparaître dans Unicode 10.0 à la mi-2017. Donc, si vous êtes patient, vous pourrez éventuellement voir l'utilisation de l'étiquette de groupe, du symbole bitcoin et des demi-étoiles sur les pages Web ainsi que d'autres symboles.

★★★★★

Source: https://habr.com/ru/post/fr398145/


All Articles