Como adicionei 6 caracteres no Unicode
Os símbolos em estrela (☆ ★) já estão incluídos no Unicode e, portanto, podem aparecer como símbolos em páginas da Web, em textos e em mensagens. Mas como não havia meia-estrela, eles precisavam de imagens ou fontes especiais. Recentemente, participei da redação de uma proposta para adicionar meias estrelas ao Unicode e agora nossa oferta acaba de ser aceita. Na próxima versão Unicode, meias estrelas podem ser usadas junto com qualquer caractere. No artigo, vou contar como consegui a adição de meias estrelas e dois outros caracteres no Unicode.4 usos diferentes de uma meia estrela para representar uma classificação de 3,5Unicode é um padrão de computador que determina quais caracteres serão usados por quase todos os computadores. Ele permite que vários computadores exibam texto em quase qualquer idioma e com quase todos os caracteres necessários (antes do Unicode, trabalhar com textos em inglês era terrivelmente confuso). Mas o Unicode não inclui tudo. Em junho passado, um comentário no Hacker News reclamou que o Unicode não tinha o símbolo de meia estrela necessário para classificações e críticas de filmes.Sugeri que alguém escrevesse uma proposta para adicionar esse símbolo, mas rapidamente percebi que eu precisava ser esse alguém. Como eu adicionara dois caracteres ao Unicode com sucesso, eu estava familiarizado com o processo necessário.Alguns anos atrás, um artigo detalhado descreveu como duas pessoas adicionaram símbolos de designação de energia ao Unicode. Adicionar um novo caractere ao Unicode é mais fácil do que você imagina. Não há necessidade de pagar, trabalhar em uma grande empresa ou participar de uma comissão. Você só precisa escrever uma frase explicando a necessidade de incluir um símbolo. Se o comitê Unicode concordar com isso, eles aprovarão a adição ao Unicode.Em 2015, comecei a programar o mainframe IBM 1401 a partir da década de 1960 no Museu de História da Computação. Mas quando descrevi esse sistema, tive dificuldades. O computador usou um conjunto de caracteres de 6 bits (EBCDIC predecessor) com alguns caracteres estranhos. Todos eles estavam em Unicode, exceto as tags de um grupo. Fiquei chocado que no Unicode contendo 128.172 caracteres, o caractere de que eu precisava estava ausente. Depois de ler sobre os sucessos do grupo que adicionaram símbolos alimentares, decidi que seria interessante ver se eu poderia adicionar o símbolo do rótulo do grupo ao Unicode. Escrevi uma proposta, enviei-a à comissão e, na reunião seguinte, ela foi aprovada.Descrição do rótulo do grupo do manual IBM 705 de 1959Depois de alguns meses, descobri que não havia símbolo para bitcoins no Unicode. Isso foi inesperado, pois esse símbolo é amplamente usado. Já foi rejeitada, então, em outubro de 2015, escrevi uma proposta mais completa, usando o suporte ativo do / r / bitcoin e de outros grupos. Esta proposta foi aceita pelo comitê Unicode em novembro de 2015.E quando vi o comentário sobre as meias estrelas no Hacker News, decidi que seria bastante simples garantir sua adoção no Unicode. Após discussões no HN e na lista de discussão Unicode, escrevi uma frase. A comissão considerou isso em agosto de 2016, mas, para minha surpresa, eles receberam outra proposta semelhante e decidiram esperar por uma única proposta. Aconteceu que Andrew West também escreveu uma proposta para meia-estrela e enviamos nossas ofertas de forma independente. Então, unimos forças e fizemos uma proposta combinada, que foi adotada pela comissão em 30 de setembro de 2016.Por que oferecemos quatro tipos diferentes de meias estrelas? Incluímos estrelas em círculo e estrelas sólidas, porque esses dois tipos são usados com frequência (eu não tinha certeza se a comissão consideraria esses símbolos diferentes o suficiente para incluir os dois, mas acabou sendo assim). Em idiomas escritos da direita para a esquerda, como o hebraico, a classificação em asteriscos também é escrita da direita para a esquerda (o que me surpreendeu); portanto, incluímos versões espelhadas de asteriscos para esses idiomas. Como resultado, quatro versões diferentes cobriram todos os casos de uso.
Se existe um personagem que você gostaria de ver no Unicode e ele atende aos requisitos, é necessário fazer uma proposta, pois esse processo é simples e interessante. Verifique se o símbolo atende aos requisitos. Em particular, é necessário encontrar alguns exemplos de seu uso no texto. O comitê Unicode não adicionará um caractere apenas porque você acha que é legal; portanto, você precisará de exemplos de seu uso. Criar uma fonte para demonstrar um novo caractere é a parte mais difícil. Eu usei o FontForge. A equipe com símbolos de poder tinha muitos consultores para ajudar a fazer uma proposta bem-sucedida. Também terei o maior prazer em oferecer esse conselho a você.Deve-se mencionar que o processo é muito diferente para emojis, portanto, não há necessidade de dizer que “como existem emojis para cocô, meu personagem também tem o direito de existir” (o símbolo foi adicionado para compatibilidade com versões anteriores com os telefones celulares japoneses). Para os emojis, a popularidade esperada do símbolo é o principal fator que influencia a aprovação. Mas o Unicode não está preocupado com a popularidade - os pergaminhos históricos dos Tanguts não terão uma milionésima parte da popularidade do novo emoji - mas com o uso de textos. Tive a sensação de que muitos membros do comitê Unicode não gostariam de praticar emoji.Depois de aceitar o símbolo, ele tem um longo caminho a percorrer em fontes e uso possível. Uma nova versão do Unicode é lançada todo mês de junho, então as estrelas intermediárias devem aparecer no Unicode 11.0 em meados de 2018. A comunidade Bitcoin teve que esperar muito tempo, já que o símbolo do Bitcoin perdeu um pouco o lançamento do Unicode 9.0, por isso deve aparecer no Unicode 10.0 em meados de 2017. Portanto, se você for paciente, poderá ver o uso do rótulo do grupo, o símbolo do bitcoin e as meias estrelas nas páginas da web, juntamente com outros símbolos.★★★★★ Source: https://habr.com/ru/post/pt398145/
All Articles