Fantasmas Unicode

En 1978, el Ministerio de Economía, Comercio e Industria de Japón estableció una codificación, que luego se llamaría JIS X 0208. Sigue siendo la base de todas las codificaciones japonesas. Pero después del lanzamiento del estándar JIS, la gente notó algo extraño: algunos de los personajes agregados no tenían fuentes obvias. Nadie podría decir qué significan y cómo pronunciarlos. Nadie estaba seguro de dónde venían. Estos personajes ahora se conocen como fantasmas ( 幽 霊 文字 ).


Ten cuidado con lo que escribes. vía NDL

Durante mucho tiempo, los símbolos fantasmas siguieron siendo una curiosidad inexplicable y casi olvidada, pero en 1997 comenzó una investigación sobre su origen. Aunque la fuente debe especificarse para todos los caracteres en el estándar JIS, pero incluso si existe un registro de este tipo, no es muy específico: por lo general, el documento de donde proviene el carácter simplemente se indica.

Puede pensar que el nombre facilitará la búsqueda del origen de los caracteres. Pero es importante aclarar que una de las "fuentes" más comunes para los fantasmas fue la "Encuesta de áreas administrativas nacionales" (国土 行政区 画 総 覧), una lista completa de todos los nombres de lugares japoneses. Como sugerí inicialmente, puedes imaginar una especie de atlas, un pequeño libro con varios cientos de páginas. Pero no, la última edición del manual es un libro de siete volúmenes, cada uno de los cuales tiene alrededor de novecientas páginas. Imagina encontrar un solo personaje sin un enlace a una página.

A pesar de las dificultades, la investigación de los personajes fantasmas, la búsqueda del origen de los personajes fue exitosa, principalmente. Los investigadores entrevistaron a los catalogadores involucrados en la creación del estándar y descubrieron que algunos personajes fueron inventados accidentalmente como errores en el proceso de catalogación. Por ejemplo, 妛 es un error que ocurrió al intentar escribir "山 sobre 女". Esta frase aparece en el nombre de un lugar determinado y, por lo tanto, era adecuada para su inclusión en el estándar JIS, pero dado que todavía no era posible imprimir un símbolo compuesto completo, los catalogadores imprimieron 山 y 女 por separado, los recortaron y los atracaron en una hoja de papel. Pero al copiar, la unión de dos pequeños trozos de papel parecía un guión, y se agregó por error al símbolo. Carácter correcto ( ) se agregó a JIS y Unicode mucho más tarde, y todavía no aparece en la mayoría de los sitios.


Caracteres fantasmas básicos: 妛 挧 暃 椦 槞 蟐 袮 閠 駲 墸 壥 彁

Como resultado, para un solo símbolo, no encontraron la fuente exacta, ni ningún precedente histórico: este es el símbolo 彁. La explicación más probable es que se creó como una lectura incorrecta del símbolo 彊, pero no se pudo detectar un solo incidente específico.

Después de la adopción general del estándar JIS, todos estos personajes cayeron en Unicode, que ya tenía su propio conjunto separado de personajes fantasmas desde el momento de la unificación de CJK.

Para resumir: en 1978, como resultado de una serie de errores menores, varios personajes aparecieron de la nada. Los errores pasaron desapercibidos el tiempo suficiente para que los símbolos echen raíces en el estándar, por lo que ahora estos fantasmas, al menos en teoría, han penetrado en todas las computadoras del planeta, escondiéndose en los rincones oscuros de las tablas de símbolos.

Es probable que permanezcan con la humanidad para siempre. Ψ

Referencias / enlaces:

Source: https://habr.com/ru/post/es418717/


All Articles