Conceitos errôneos dos programadores sobre nomes - com exemplos



Em 2010, Patrick Mackenzie escreveu o famoso artigo, "Equívocos dos programadores sobre nomes", listando 40 factóides que nem sempre são verdadeiros em relação aos nomes humanos.

Você acha que os programadores sentaram-se, pensaram e mudaram o processamento de nomes em sistemas de computador? Infelizmente, na verdade não. Ainda somos solicitados a preencher todos os formulários on-line que exigem a presença de um nome e sobrenome (além disso, nessa ordem). Esses sistemas ainda assumem que nossos nomes sempre podem ser escritos em caracteres alfabéticos, geralmente apenas em ASCII.

Suspeito que o artigo de Patrick não tenha tido impacto suficiente sobre o setor, inclusive porque não havia exemplos de cada concepção errada. Mas como ex-funcionário do projeto IBM Global Name Management , posso garantir que tudo o que é dito é verdadeiro.

Não acredita? Neste artigo, listarei todos os 40 equívocos, dando um exemplo (ou dois) da minha experiência nesta área. Você está pronta? Vamos lá!

1. Cada pessoa tem um nome completo canônico.
Parece que algumas pessoas pensam que você recebe um nome e isso nunca muda. Mas mesmo nos países ocidentais, uma pessoa pode mudar seu sobrenome no casamento. Na tradição católica, uma pessoa pode obter um nome do meio durante a confirmação.

2. Cada pessoa tem um nome completo que ele usa.
O conhecido escritor de ficção científica John Wyndham (autor de Triffids Day) nasceu com o nome John Wyndham Parks Lucas Beynon Harris, e publicou livros sob os nomes John Beynon e Lucas Parks, além de John Wyndham.

3. Nesse momento, cada pessoa tem um nome completo canônico.
Um ator pode ter um nome artístico, que é completamente diferente do nome na certidão de nascimento, ele pode até ter um passaporte para o nome artístico.

4. Nesse momento, cada pessoa tem um nome completo que ele usa.
Não é assim, mesmo nos países ocidentais uma mulher pode manter seu nome de solteira no trabalho (onde ela já é conhecida por esse nome) e usar o sobrenome do marido na comunicação ou em documentos legais, como hipotecas e empréstimos.

5. Cada pessoa tem exatamente N nomes, independentemente do valor de N.
Tradicionalmente, o nome em inglês contém dois nomes (geralmente chamados de nome e nome do meio) e sobrenome, mas não necessariamente dessa maneira. Uma pessoa pode não ter um nome do meio ou pode haver vários. Por exemplo, os portugueses têm um ou dois nomes e até quatro sobrenomes (até seis no caso de uma mulher casada), e esses sobrenomes podem ser frases como da Silva ou dos Santos, ou mesmo Costa i Silva.

6. Os nomes se encaixam em um certo número de caracteres.
O famoso artista, geralmente chamado Picasso, tinha o nome completo Pablo Diego José Francisco de Paula Juan Nepomuseno Maria dos Remédios Sipriano da Santíssima Trindade Martir Patricio Ruiz e Picasso. Tente encaixar isso em uma forma de 30 caracteres ...

7. Os nomes não mudam.
Já mencionamos meninas que mudam de nome no casamento, então isso claramente não é verdade. Além disso, os católicos podem usar um nome do meio no momento da confirmação. Além disso, uma pessoa geralmente adiciona um nome ou muda completamente quando muda para outra religião - lembre-se de que, após a conversão ao Islã, Kat Stevens se tornou o Yusuf Islam e Cassius Clay se transformou em Mohammed Ali.

8. Os nomes mudam, mas apenas em certos casos limitados.
Para alguns tailandeses, o normal é mudar o nome para evitar falhas. Isso pode acontecer sem muita razão. Às vezes, uma pessoa muda de nome quando outra pessoa com o mesmo nome se torna famosa ou notória: um exemplo notável quando muitas pessoas abandonam o sobrenome Hitler.

9. Os nomes estão escritos em ASCII.
Um equívoco claro, apenas porque o ASCII não contém caracteres acentuados de nomes franceses ou portugueses. Este conjunto de caracteres não inclui o alfabeto grego usado em nomes gregos, caracteres cirílicos para nomes russos. Existem scripts como Devanagari para nomes indianos, caracteres chineses (Hanzi), caracteres japoneses (Kanji) e muito mais.

10. Os nomes são escritos em qualquer codificação.
Alguns nomes têm codificações mistas. Por exemplo, kanji com caracteres latinos ou hanzi com caracteres latinos ou hangul coreano com caracteres latinos. Em muitos casos, isso ocorre porque uma pessoa tem um "nome ocidental" para agradar àqueles que não podem pronunciar seu nome em seu idioma nativo.

11. Todos os nomes correspondem aos pontos de código Unicode.
Os desenvolvedores Unicode continuam adicionando pontos de código para caracteres cada vez mais raros ao padrão. A grande maioria dos nomes já corresponde a eles, mas ainda há exceções, como o símbolo "artista, anteriormente conhecido como Prince" . Mesmo se excluirmos essas esquisitices, vários scripts ainda não entraram no Unicode. Talvez o exemplo mais realista seja o aimara, uma língua escrita para uma língua falada por mais de um milhão de pessoas na América do Sul. Exemplos menos realistas são a língua ou os símbolos klingon inventados por Tolkien para a Terra-média. Além disso, o Unicode inclui apenas uma parte dos caracteres chinês e japonês, e alguns dos caracteres ausentes são usados ​​nos nomes.

Para complicar ainda mais, em alguns idiomas não há símbolos escritos - eles não podem ser escritos. E para esses idiomas, não há pontos de código no Unicode. Os nomes nessas línguas podem ser escritos foneticamente, mas isso não é particularmente útil porque a maioria das pessoas não está familiarizada com o alfabeto fonético.

12. Os nomes diferenciam maiúsculas de minúsculas.
Muitos conjuntos de caracteres não diferenciam maiúsculas de minúsculas: por exemplo, chinês e japonês. Para eles, a idéia de letras maiúsculas e minúsculas simplesmente não é aplicável.

13. Os nomes não diferenciam maiúsculas de minúsculas.
Alguns scripts diferenciam maiúsculas de minúsculas: por exemplo, latim. Mais importante, em alguns idiomas, os caracteres podem ser escritos em letras minúsculas, mas não em maiúsculas, por isso é impossível traduzi-los de um caso para outro.

O registro correto pode ser muito importante para algumas pessoas, como aquelas com os nomes Mackenzie e Mackenzie.

Além disso, o registro correto é importante para nomes como Van Gogh, du Barry, da Costa, O'Brien e D'Agostino e nomes como Jean-Pierre.

14. Às vezes, prefixos ou sufixos aparecem nos nomes, mas você pode ignorá-los com segurança.
Nada poderia estar mais longe da verdade. O nome holandês Peter van der Meer não é o mesmo que Peter Meer, embora "van der" seja um prefixo.

Você pode considerar o sufixo "mais jovem" no nome de Robert Downey Jr., mas se você o omitir, nomeará o pai dele, não o dele.

Nos nomes árabes, o sufixo al-Din significa "fé" ou "religião" - nomes como Taj al-Din ("coroa da fé") ou Saif al-Din ("espada da religião") não permanecerão os mesmos se o sufixo for usado. O nome italiano Di Stefano não é o mesmo que Stefano.

Uma mulher espanhola com o sobrenome "Viuda de la Cruz" é a viúva de um homem com o sobrenome de la Cruz. A ausência de prefixos altera o valor do nome.

15. Os nomes não contêm números.
Mesmo que as dinastias (por exemplo, Thurston Howell III) sejam ignoradas, em alguns casos o número se torna parte do nome legal de alguém. Por exemplo, Jennifer 8 Lee escolheu o nome do meio 8, porque 8 está associado à sorte.

16. Os nomes não podem ser escritos em letras maiúsculas.
Em alguns países (especialmente de língua francesa), é costume escrever o sobrenome de uma pessoa em letras maiúsculas, para que fique claro qual parte é o sobrenome. Esta convenção foi consolidada a tal ponto que escrever um sobrenome em letras minúsculas pode ser considerado indelicado.

17. Os nomes não podem ser escritos em letras minúsculas inteiras.
Poeta e. e Cummings preferia que seu nome fosse escrito em letras minúsculas. Como o cantor kd lang . Educado para seguir a ortografia preferida pelo proprietário do nome.

Existe um sobrenome irlandês / britânico em francês , que é tradicionalmente escrito em letras minúsculas, embora essa tradição sofra um software ruim que obriga a especificar a primeira letra maiúscula.

18. Os nomes têm uma ordem. A seleção de um dos esquemas de pedido de gravação levará automaticamente a um pedido constante entre todos os sistemas, se todos usarem o mesmo esquema de pedido.
Na Holanda, o nome de Vincent van Gogh é indexado e classificado pela letra G como Gog; na Bélgica, o mesmo nome é indexado por B para Van Gogh. É impossível adotar um sistema unificado de nomes que leve a uma ordem geralmente aceita. Em muitas bibliotecas, o sistema é baseado no local de nascimento da pessoa (eu não gostaria que essa regra fosse aplicada em software).

19. Nome e sobrenome são necessariamente diferentes.
Benjamin, um empresário e político australiano, morreu em 1905. Jerome K. Jerome é um escritor inglês conhecido por seu trabalho "Três em um barco, sem contar um cachorro". Owen Owen é um galês que fundou a Owen Owen Ltd, uma cadeia de lojas de departamento. E nem tocaremos nos atletas e atores que adotaram esses pseudônimos.

20. As pessoas têm um sobrenome ou algo semelhante em comum aos parentes.
Em Java, era costume dar a uma pessoa apenas um nome sem sobrenome. Por exemplo, os presidentes da Indonésia Suharto e Sukarno não tinham sobrenome.

21. O nome de uma pessoa é único.
Conte para alguém chamado John Smith! Eu tenho um nome um pouco menos comum, mas encontrei uma pessoa com o mesmo nome e sobrenome trabalhando no mesmo setor no mesmo país (Austrália).

22. O nome de uma pessoa é quase único.
Mesmo com a ortografia não padrão, geralmente é fácil encontrar pessoas com o mesmo nome completo: tente pesquisar no Google.

23. Tudo bem, tudo bem, mas os nomes são raros o suficiente, então não há um milhão de pessoas com o mesmo nome e sobrenome.
O nome chinês, Zhang Wei, é carregado por mais de um quarto de milhão de pessoas.

Se nos limitarmos a sobrenomes, cerca de 20% da população da Coréia do Sul terá o sobrenome Kim. Cerca de 10% da população do norte da China ostenta o sobrenome Wang e mais de 10% da população do sul da China ostenta o sobrenome Chen. Em segundo lugar, tanto lá como no sobrenome Lee, o que a torna a mais popular do país. E cerca de 40% dos vietnamitas têm o sobrenome Nguyen.

Os nomes também estão longe de serem únicos.

24. Meu sistema nunca lidará com nomes da China.
A migração estendeu os nomes de cada cultura para (quase) todos os países. Os dias estão quase no fim quando os imigrantes receberam novos nomes ao entrar no país (embora, por exemplo, o Vietnã ainda exija que o requerente de cidadania aceite o nome vietnamita). Não é realista esperar a completa ausência de nomes de outros países, embora você possa vê-los de forma transliterada.

Portanto, um nome chinês como 周潤發 em seu sistema pode aparecer como Chow Yun Fat, ou Chow Yun Fat, ou mesmo Yun Fat Chow (Chow é um sobrenome).

25. Ou Japão.
veja acima.

26. Ou Coréia.
veja acima.

27. Ou Irlanda, Grã-Bretanha, EUA, Espanha, México, Brasil, Peru, Suécia, Botsuana, África do Sul, Trinidad, Haiti, França, Império Klingon - todos eles usam esquemas de nomes "estranhos".
veja acima.

28. O Império Klingon era uma piada, certo?
É difícil encontrar exemplos de pessoas oficialmente usando nomes Klingon, mas por que não? Se implementarmos um sistema com suporte para outras culturas (por exemplo, o apóstrofo incorporado para O'Brien), também poderemos dar suporte aos nomes Klingon sem trabalho adicional.

29. Para o inferno com o relativismo cultural! As pessoas da minha sociedade , pelo menos, têm a mesma idéia de um padrão universalmente aceito para nomes.
E seu software funcionará apenas com pessoas que receberam nomes em sua comunidade?

30. Existe um algoritmo que converte nomes para um e o outro lado sem perda. (Sim, sim, você pode fazer isso se o algoritmo de saída retornar o mesmo da entrada e receber uma medalha por si mesmo).
Não existe outro algoritmo (além de lembrar o formato original) que converte o nome de maneira reversível garantida.

31. Posso assumir com confiança que este dicionário de palavras obscenas não contém sobrenomes.
Esse é um erro comum: muitas “palavrões” não são ruins em outros idiomas e algumas são usadas em nomes. Além disso, nem toda sociedade limita quais palavras podem ser usadas em um nome: é possível que o nome de alguém seja atribuído em tal jurisdição.

32. Os nomes são dados às pessoas no nascimento.
Os nascimentos são registrados na maioria dos países, mas a eficácia desse sistema não é a mesma.

As regras exatas variam de acordo com a jurisdição, mas sempre há algum atraso no registro de nascimento. Os atrasos permitidos variam de três semanas (Escócia) a dois meses (Austrália), mas há mais.

O nome do bebê pode ser registrado no momento do registro de nascimento, mas isso nem sempre acontece (em alguns lugares, as crianças ainda são registradas com nomes como Baby Boy ou Baby Girl, quando os pais têm problemas para escolher um nome ou se a criança é uma fundadora, por exemplo).

33. OK, talvez não no nascimento, mas logo depois.

34. Ok, ok, por mais ou menos um ano.

35. cinco anos?

36. Você está brincando, certo?
Existem culturas nas quais um nome adulto não é dado a uma pessoa antes da puberdade. Antes disso, a criança pode ter um "leite" ou nome temporário.

37. Dois sistemas diferentes nos quais o nome da mesma pessoa é indicado usarão o mesmo nome para ele.
Se assim fosse, não haveria mercado de software para reconciliar vários bancos de dados.

No meu caso pessoal, alguns sistemas continham meu nome oficial, incluindo meu nome do meio, e outros apenas meu nome e sobrenome ou o nome e sobrenome abreviados. E este ainda é um caso simples. Minha esposa é indicada em alguns sistemas pelo nome de solteira e em outros - com o sobrenome do marido, com ou sem o nome completo, com ou sem o nome do meio e com qualquer uma das duas grafias do nome abreviado.

38. Dois operadores diferentes de entrada de dados, se receberem o nome de uma pessoa, necessariamente inserirão o mesmo conjunto de caracteres se o sistema for bem projetado.
Imagine o que acontece quando uma pessoa digita um nome que ouve no telefone. Por exemplo, Thomson e Thompson; ou Johnson, Johnston, Johnstone e Johnsson.

39. As pessoas cujos nomes quebram meu sistema são estranhos estranhos. Eles devem ter nomes normais e aceitáveis, como 田中 太郎.
Não, seu sistema está mal projetado.

Em particular, o nome mencionado acima é freqüentemente encontrado como o nome de um estrangeiro em anime (e mangá). Havia pessoas reais com esse nome.

40. As pessoas têm nomes.
Nesse caso, talvez seja o mais difícil de dar exemplos convincentes. Havia uma cultura isolada na qual ninguém tinha nomes: eles se chamavam termos relativos, como "irmã mais velha da minha mãe".

Resumir


Então, fizemos: encontramos exemplos (quase) para todos os quarenta pontos do artigo de Patrick Mackenzie "Concepções errôneas dos programadores sobre nomes" . Se você sentir uma certa superabundância de informações, deixe-nos resumir. Aqui está a coisa mais importante ao desenvolver um sistema que processa nomes:

  • Não use termos como “primeiro nome” ou “nome cristão”: simplesmente “nome próprio” é o termo mais comum.
  • Lembre-se de que metade do mundo indica primeiro um sobrenome.
  • Muitas culturas usam um sistema diferente de um sobrenome comum a todos os membros da família. Alguns usam um sobrenome ou matrônimo (às vezes não um); e outros não têm sobrenome.
  • A pontuação pode ser uma parte vital de um nome: o sobrenome irlandês de O'Hara não corresponde ao sobrenome japonês Ohara. O nome Jean-Pierre não corresponde ao nome Jean-Pierre ou Jean Pierre, e Jean-Pierre é o mesmo nome e Jean Pierre é dois nomes separados.
  • Os espaços não separam necessariamente partes do nome e do sobrenome: de la Cruz - um sobrenome, não três separados; Os nomes em chinês Hanzi são escritos sem espaços entre o nome e o sobrenome.
  • O uso de letras maiúsculas não é tão óbvio: o sobrenome van der Meer pode ser maiúsculo quando usado sem nome, mas com minúsculas após o nome.
  • Use o nome inteiro, não o quebre em pedaços. Por exemplo, não tente se referir a uma pessoa como "Sr. Sobrenome do Nome": aqui erros são possíveis em diferentes casos:
    • Se o sobrenome for escrito antes do primeiro nome (por exemplo, chinês).
    • Se você usar corretamente o nome, mas não é o último.
    • Se o sobrenome consistir em mais de uma palavra, por exemplo, o sobrenome espanhol de la Torre
    • Se o nome contiver um sufixo, por exemplo, "menor".

Finalmente, recomendo que você verifique o guia de nomes pequenos no artigo do W3C .

Source: https://habr.com/ru/post/pt431866/


All Articles