Fantômes Unicode

En 1978, le ministère de l'Économie, du Commerce et de l'Industrie du Japon a établi un codage, qui sera plus tard appelé JIS X 0208. Il est toujours la base de tous les codages japonais. Mais après la sortie de la norme JIS, les gens ont remarqué quelque chose d'étrange: certains des personnages ajoutés n'avaient pas de sources évidentes. Personne ne pouvait dire ce qu'ils signifiaient et comment les prononcer. Personne ne savait d'où ils venaient. Ces personnages sont désormais connus sous le nom de fantômes ( 幽 霊 文字 ).


Faites attention à ce que vous écrivez. via NDL

Pendant longtemps, les symboles fantômes sont restés une curiosité inexplicable et presque oubliée, mais en 1997 une enquête sur leur origine a commencé. Bien que la source doive être spécifiée pour tous les caractères dans la norme JIS, mais même s'il existe un tel enregistrement, il n'est pas très spécifique: généralement le document d'où provient le caractère est simplement indiqué.

Vous pourriez penser que le nom facilitera la recherche de l'origine des personnages. Mais il est important de préciser que l’une des «sources» les plus courantes pour les fantômes était «l’enquête sur les zones administratives nationales» (国土 行政区 画 総 覧), une liste complète de tous les noms de lieux japonais. Comme je l'ai suggéré initialement, vous pouvez imaginer une sorte d'atlas, un petit livre de plusieurs centaines de pages. Mais non, la dernière édition du manuel est un livre en sept volumes, chacun ayant environ neuf cents pages. Imaginez trouver un seul personnage sans lien vers une page.

Malgré les difficultés, l'enquête sur les personnages fantômes, la recherche de l'origine des personnages a réussi - surtout. Les chercheurs ont interviewé les catalogueurs impliqués dans la création de la norme et ont constaté que certains personnages avaient été accidentellement inventés comme des erreurs dans le processus de catalogage. Par exemple, 妛 est une erreur qui s'est produite lors de la tentative d'écriture de «山 sur 女». Cette phrase apparaît au nom d'un certain endroit et, par conséquent, pouvait être incluse dans la norme JIS, mais comme il n'était toujours pas possible d'imprimer un symbole composite entier, les catalogueurs ont imprimé 山 et 女 séparément, les ont découpés et ancrés sur une feuille de papier. Mais lors de la copie, la jonction de deux petits morceaux de papier ressemblait à un tiret - et elle a été ajoutée par erreur au symbole. Caractère correct ( ) ajouté à JIS et Unicode beaucoup plus tard - et il n'apparaît toujours pas sur la plupart des sites.


Personnages fantômes de base: 妛 挧 暃 椦 槞 蟐 袮 閠 駲 墸 壥 彁

En conséquence, pour un seul symbole, ils n'ont pas trouvé la source exacte, ni aucun précédent historique: c'est le symbole 彁. L'explication la plus probable est qu'il a été créé comme une mauvaise lecture du symbole 彊, mais aucun incident spécifique n'a pu être détecté.

Après l'adoption générale de la norme JIS, tous ces personnages sont tombés dans Unicode, qui avait déjà son propre ensemble distinct de personnages fantômes à partir de l'unification de CJK.

Pour résumer: en 1978, suite à une série d'erreurs mineures, plusieurs personnages sont apparus de nulle part. Les erreurs sont passées inaperçues assez longtemps pour que les symboles prennent racine dans la norme, alors maintenant, ces fantômes, au moins théoriquement, ont pénétré tous les ordinateurs de la planète, se cachant dans les coins sombres des tables de symboles.

Il est probable qu'ils resteront à jamais avec l'humanité. Ψ

Références / liens:

Source: https://habr.com/ru/post/fr418717/


All Articles