Idées fausses des programmeurs sur les noms - avec des exemples



En 2010, Patrick Mackenzie a écrit le célèbre article, "Programmers 'Misconceptions about Names", énumérant 40 factoïdes qui ne sont pas toujours vrais au sujet des noms humains.

Pensez-vous que les programmeurs se sont assis, ont réfléchi et ont changé le traitement des noms dans les systèmes informatiques? Malheureusement pas vraiment. On nous demande toujours partout de remplir des formulaires en ligne qui nécessitent la présence d'un nom et prénom (d'ailleurs, dans cet ordre). Ces systèmes supposent toujours que nos noms peuvent toujours être écrits en caractères alphabétiques, souvent uniquement en ASCII.

Je soupçonne que l'article de Patrick n'a pas eu suffisamment d'impact sur l'industrie, notamment parce qu'il n'y avait aucun exemple de chaque idée fausse. Mais en tant qu'ancien employé du projet IBM Global Name Management , je peux vous assurer que tout ce qui y est dit est vrai.

Ne croyez pas? Dans cet article, je vais énumérer les 40 idées fausses, en donnant un exemple (ou deux) de mon expérience dans ce domaine. Êtes-vous prêt? C'est parti!

1. Chaque personne a un nom complet canonique.
Il semble que certaines personnes pensent que vous obtenez un nom, et cela ne change jamais. Mais même dans les pays occidentaux, une personne peut changer son nom de famille au mariage. Dans la tradition catholique, une personne peut obtenir un deuxième prénom lors de la confirmation.

2. Chaque personne a un nom complet qu'elle utilise.
Le célèbre écrivain de science-fiction John Wyndham (auteur de Triffids Day) est né sous le nom de John Wyndham Parks Lucas Beynon Harris, et a publié des livres sous les noms John Beynon et Lucas Parks, ainsi que John Wyndham.

3. À ce stade, chaque personne a un nom complet canonique.
Un acteur peut avoir un nom de scène, qui est complètement différent du nom dans le certificat de naissance, il peut même avoir un passeport pour le nom de scène.

4. À ce stade, chaque personne a un nom complet qu'elle utilise.
Ce n'est pas le cas, même dans les pays occidentaux, une femme peut garder son nom de jeune fille au travail (où elle est déjà connue sous ce nom) et utiliser le nom de famille de son mari dans la communication ou dans des documents juridiques tels que les hypothèques et les prêts.

5. Chaque personne a exactement N noms, quelle que soit la valeur de N.
Le nom anglais contient traditionnellement deux noms (ils sont souvent appelés le prénom et le deuxième prénom) et le nom de famille, mais pas nécessairement de cette façon. Une personne peut ne pas avoir de deuxième prénom ou il peut y en avoir plusieurs. Par exemple, les Portugais ont un ou deux noms et jusqu'à quatre noms de famille (jusqu'à six dans le cas d'une femme mariée), et ces noms de famille peuvent être des expressions telles que da Silva ou dos Santos, ou même Costa i Silva.

6. Les noms tiennent dans un certain nombre de caractères.
Le célèbre artiste, qui s'appelle généralement simplement Picasso, avait un nom complet Pablo Diego José Francisco de Paula Juan Nepomuseno Maria de los Remedios Sipriano de la Santisima Trinidad Martir Patricio Ruiz et Picasso. Essayez de l'adapter à une forme de 30 caractères ...

7. Les noms ne changent pas.
Nous avons déjà mentionné les filles qui changent de nom au mariage, ce n'est donc clairement pas vrai. De plus, les catholiques peuvent prendre un deuxième prénom au moment de la confirmation. En outre, une personne ajoute souvent un nom ou le change complètement lorsqu'elle passe à une autre religion - rappelez-vous comment, après sa conversion à l'islam, Kat Stevens est devenue Yusuf Islam et Cassius Clay s'est transformé en Mohammed Ali.

8. Les noms changent, mais seulement dans certains cas limités.
Pour certains Thaïlandais, la chose habituelle est de changer le nom pour éviter l'échec. Cela peut arriver sans grande raison. Parfois, une personne change de nom lorsque quelqu'un d'autre du même nom est devenu célèbre ou notoire: un exemple notable lorsque de nombreuses personnes ont abandonné le nom de famille d'Hitler.

9. Les noms sont écrits en ASCII.
Une idée fausse claire, ne serait-ce que parce que l'ASCII ne contient pas de caractères accentués de noms français ou portugais. Ce jeu de caractères ne comprend pas l'alphabet grec utilisé dans les noms grecs, les caractères cyrilliques pour les noms russes. Il existe des scripts tels que Devanagari pour les noms indiens, les caractères chinois (Hanzi), les caractères japonais (Kanji) et bien plus encore.

10. Les noms sont écrits dans n'importe quel codage.
Certains noms ont des encodages mixtes. Par exemple, kanji avec des caractères latins ou hanzi avec des caractères latins, ou hangul coréen avec des caractères latins. Dans de nombreux cas, c'est parce qu'une personne a un «nom occidental» pour plaire à ceux qui ne peuvent pas prononcer son nom dans sa langue maternelle.

11. Tous les noms correspondent aux points de code Unicode.
Les développeurs Unicode continuent d'ajouter des points de code pour des caractères de plus en plus rares à la norme. La grande majorité des noms leur correspondent déjà, mais il existe encore des exceptions, comme le symbole «artiste, anciennement appelé Prince» . Même si nous excluons ces bizarreries, plusieurs scripts ne sont pas encore entrés en Unicode. L'exemple le plus réaliste est peut-être l'Aymara, une langue écrite pour une langue parlée par plus d'un million de personnes en Amérique du Sud. Des exemples moins réalistes sont la langue ou les symboles klingons inventés par Tolkien pour la Terre du Milieu. De plus, Unicode ne comprend qu'une partie des caractères chinois et japonais, et certains des caractères manquants sont utilisés dans les noms.

Pour compliquer encore les choses, dans certaines langues, il n'y a pas de symboles écrits - ils ne peuvent pas être écrits. Et pour ces langues, il n'y a pas de points de code dans Unicode. Les noms dans ces langues peuvent être orthographiés phonétiquement, mais ce n'est pas particulièrement utile car la plupart des gens ne connaissent pas l'alphabet phonétique.

12. Les noms sont sensibles à la casse.
De nombreux jeux de caractères ne sont pas sensibles à la casse: par exemple, le chinois et le japonais. Pour eux, l'idée de majuscules et de minuscules n'est tout simplement pas applicable.

13. Les noms ne sont pas sensibles à la casse.
Certains scripts sont sensibles à la casse: par exemple, le latin. Plus important encore, dans certaines langues, les caractères peuvent être écrits en minuscules, mais pas en majuscules, il est donc impossible de les traduire d'un cas à l'autre.

Le bon registre peut être très important pour certaines personnes, comme celles portant les noms Mackenzie et Mackenzie.

En outre, le registre correct est important pour des noms tels que Van Gogh, du Barry, da Costa, O'Brien et D'Agostino, et des noms tels que Jean-Pierre.

14. Parfois, les préfixes ou suffixes apparaissent dans les noms, mais vous pouvez les ignorer en toute sécurité.
Rien n'est plus éloigné de la vérité. Le nom néerlandais Peter van der Meer n'est pas le même que Peter Meer, bien que «van der» soit un préfixe.

Vous pouvez considérer le suffixe «plus jeune» au nom de Robert Downey Jr., mais si vous l'omettez, vous nommerez son père, pas le sien.

Dans les noms arabes, le suffixe al-Din signifie «foi» ou «religion» - des noms comme Taj al-Din («couronne de foi») ou Saif al-Din («épée de religion») ne resteront pas les mêmes si le suffixe est utilisé. Le nom italien Di Stefano n'est pas le même que Stefano.

Une Espagnole avec le nom de famille "Viuda de la Cruz" est la veuve d'un homme avec le patronyme de la Cruz. L'absence de préfixes modifie la valeur du nom.

15. Les noms ne contiennent pas de chiffres.
Même si les dynasties (par exemple, Thurston Howell III) sont ignorées, dans certains cas, le numéro fait partie du nom légal de quelqu'un. Par exemple, Jennifer 8 Lee a choisi le deuxième prénom 8, car 8 est associé à la chance.

16. Les noms ne peuvent pas être écrits en lettres majuscules.
Dans certains pays (notamment francophones), il est de coutume d'écrire le nom de famille d'une personne en lettres majuscules pour qu'il soit clair quelle partie est le nom de famille. Cette convention s'est tellement ancrée que l'écriture d'un nom de famille en minuscules peut être considérée comme impolie.

17. Les noms ne peuvent pas être écrits en lettres minuscules entières.
Poète e. e. Cummings a préféré que son nom soit écrit en minuscules. Comme le chanteur kd lang . Poli pour suivre l'orthographe préférée par le propriétaire du nom.

Il existe un nom de famille irlandais / britannique français , qui est traditionnellement écrit en minuscules, bien que cette tradition souffre d'un logiciel médiocre qui vous oblige à spécifier le premier majuscule.

18. Les noms ont un ordre. La sélection d'un des schémas de commande d'enregistrement entraînera automatiquement un ordre constant parmi tous les systèmes s'ils utilisent tous le même schéma de commande.
Aux Pays-Bas, le nom de Vincent van Gogh est indexé et trié par la lettre G comme Gog; en Belgique, le même nom est indexé par B pour Van Gogh. Il est impossible d'adopter un système unifié de noms qui conduira à un ordre généralement accepté. Dans de nombreuses bibliothèques, le système est basé sur le lieu de naissance de la personne (je ne voudrais pas que cette règle soit appliquée dans le logiciel).

19. Le nom et le prénom sont nécessairement différents.
Benjamin, homme d'affaires et homme politique australien, est décédé en 1905. Jerome K. Jerome est un écrivain anglais connu pour son travail «Trois dans un bateau, sans compter un chien». Owen Owen est un Gallois qui a fondé Owen Owen Ltd, une chaîne de grands magasins. Et nous ne toucherons même pas les athlètes et les acteurs qui ont adopté de tels pseudonymes.

20. Les gens ont un nom de famille ou quelque chose de similaire commun à leurs proches.
À Java, il était d'usage de ne donner à une personne qu'un nom sans nom de famille. Par exemple, les présidents de l'Indonésie Suharto et Sukarno n'avaient pas de nom de famille.

21. Le nom d'une personne est unique.
Dites-le à toute personne nommée John Smith! J'ai un nom un peu moins courant, mais j'ai trouvé une personne du même nom et du même prénom travaillant dans la même industrie dans le même pays (Australie).

22. Le nom d'une personne est presque unique.
Même avec une orthographe non standard, il est généralement facile de trouver des personnes portant le même nom complet: essayez de rechercher votre propre nom sur Google.

23. D'accord, d'accord, mais les noms sont assez rares, donc il n'y a pas un million de personnes avec le même nom et prénom.
Le nom chinois Zhang Wei serait porté par plus d'un quart de million de personnes.

Si nous nous limitons aux noms de famille, environ 20% de la population de Corée du Sud porte le nom de famille Kim. Environ 10% de la population du nord de la Chine porte le nom de famille Wang et plus de 10% de la population du sud de la Chine porte le nom de famille Chen. En second lieu, à la fois là et il y a le nom de famille Lee, ce qui fait d'elle la plus populaire du pays. Et environ 40% des Vietnamiens ont le nom de famille Nguyen.

Les noms sont également loin d'être uniques.

24. Mon système ne traitera jamais les noms de Chine.
La migration a étendu les noms de chaque culture à (presque) chaque pays. L'époque est presque révolue où les immigrants ont reçu de nouveaux noms à leur arrivée dans le pays (bien que, par exemple, le Vietnam exige toujours que le demandeur de citoyenneté accepte le nom vietnamien). Il n'est pas réaliste de s'attendre à l'absence complète de noms d'autres pays, bien que vous puissiez les voir sous forme translittérée.

Ainsi, un nom chinois comme 周潤發 dans votre système peut apparaître comme Chow Yun Fat, ou Chow Yun Fat, ou même Yun Fat Chow (Chow est un nom de famille).

25. Ou au Japon.
voir ci-dessus.

26. Ou la Corée.
voir ci-dessus.

27. Ou l'Irlande, la Grande-Bretagne, les États-Unis, l'Espagne, le Mexique, le Brésil, le Pérou, la Suède, le Botswana, l'Afrique du Sud, Trinidad, Haïti, la France, l'Empire Klingon - tous ces systèmes utilisent des schémas de noms «étranges».
voir ci-dessus.

28. L'Empire Klingon était une blague, non?
Il est difficile de trouver des exemples de personnes utilisant officiellement des noms Klingons, mais pourquoi pas? Si nous implémentons un système prenant en charge d'autres cultures (par exemple l'apostrophe intégrée à O'Brien), nous pouvons également prendre en charge les noms Klingons sans travail supplémentaire.

29. Au diable le relativisme culturel! Les gens de ma société , au moins, ont la même idée d'une norme universellement acceptée pour les noms.
Et votre logiciel ne fonctionnera qu'avec des personnes qui ont reçu des noms dans votre communauté?

30. Il existe un algorithme qui convertit les noms de part et d'autre sans perte. (Oui, oui, vous pouvez le faire si l'algorithme de sortie renvoie le même que l'entrée, prenez une médaille pour vous-même).
Il n'y a pas d'algorithme (autre que la mémorisation du format d'origine) qui convertit le nom de manière réversible garantie.

31. Je peux supposer avec confiance que ce dictionnaire de mots obscènes ne contient pas de noms de famille.
Il s'agit d'une erreur courante: de nombreux «mauvais mots» ne sont pas mauvais dans d'autres langues et certains sont utilisés dans les noms. En outre, toutes les sociétés ne limitent pas les mots pouvant être utilisés dans un nom: il est possible que le nom d’une personne soit attribué dans une telle juridiction.

32. Les noms sont donnés aux personnes à la naissance.
Les naissances sont enregistrées dans la plupart des pays, mais l'efficacité de ce système n'est pas la même.

Les règles exactes varient selon la juridiction, mais il y a toujours un certain retard dans l'enregistrement des naissances. Les délais autorisés varient de trois semaines (Écosse) à deux mois (Australie), mais il y en a plus.

Le nom du bébé peut être enregistré au moment de l'enregistrement de la naissance, mais cela ne se produit pas toujours (dans certains endroits, les enfants sont toujours enregistrés avec des noms comme Baby Boy ou Baby Girl, lorsque les parents ont du mal à choisir un nom ou si l'enfant est un enfant trouvé, par exemple).

33. D'accord, peut-être pas à la naissance, mais peu de temps après.

34. D'accord, d'accord, pendant environ un an.

35. Cinq ans?

36. Vous plaisantez, non?
Il existe des cultures dans lesquelles un nom d'adulte n'est pas donné à une personne avant la puberté. Avant cela, l'enfant peut avoir un «lait» ou un nom temporaire.

37. Deux systèmes différents dans lesquels le nom d'une même personne est indiqué utiliseront le même nom pour elle.
S'il en était ainsi, il n'y aurait pas de marché de logiciels pour réconcilier diverses bases de données.

Dans mon cas personnel, certains systèmes contenaient mon nom officiel, y compris mon deuxième prénom, et d'autres uniquement mon prénom et mon nom ou le prénom et le nom abrégés. Et c'est toujours un cas simple. Ma femme est indiquée dans certains systèmes par son nom de jeune fille, et dans d'autres - avec le nom de famille de son mari, avec ou sans nom complet, avec ou sans deuxième prénom, et avec l'une des deux orthographes de son nom abrégé.

38. Deux opérateurs de saisie de données différents, s'ils reçoivent le nom d'une personne, entreront nécessairement le même jeu de caractères si le système est bien conçu.
Imaginez ce qui se passe lorsqu'une personne entre un nom qu'il entend au téléphone. Par exemple, Thomson et Thompson; ou Johnson, Johnston, Johnstone et Johnsson.

39. Les personnes dont les noms brisent mon système sont d'étranges étrangers. Ils doivent avoir des noms normaux et acceptables, comme 田中 太郎.
Non, votre système est mal conçu.

En particulier, le nom susmentionné est souvent trouvé comme le nom d'un étranger dans l'anime (et le manga). Il y avait de vraies personnes avec ce nom.

40. Les gens ont des noms.
Dans ce cas, il est peut-être le plus difficile de donner des exemples convaincants. Il y avait une culture isolée dans laquelle personne n’avait de nom: ils s’appelaient des termes relatifs, comme «sœur aînée de ma mère».

Pour résumer


Donc, nous l'avons fait: nous avons trouvé (presque) des exemples pour les quarante points de l'article de Patrick Mackenzie «Idées fausses des programmeurs sur les noms» . Si vous ressentez une certaine surabondance d'informations, résumons-les. Voici la chose la plus importante lors du développement d'un système qui traite les noms:

  • N'utilisez pas de termes tels que «prénom» ou «nom chrétien»: simplement «prénom» est le terme le plus courant.
  • Gardez à l'esprit que la moitié du monde indique d'abord un nom de famille.
  • De nombreuses cultures utilisent un système différent d'un nom de famille commun à tous les membres de la famille. Certains utilisent un patronyme ou matronyme (parfois pas un); et d'autres n'ont pas de nom de famille.
  • La ponctuation peut être un élément essentiel d'un nom: le nom de famille irlandais d'O'Hara ne correspond pas au nom de famille japonais Ohara. Le nom Jean-Pierre ne correspond ni au nom Jean-Pierre ni au nom Jean Pierre, et Jean-Pierre est le même nom, et Jean Pierre est deux noms distincts.
  • Les espaces ne séparent pas nécessairement les parties du nom et du prénom: de la Cruz - un nom de famille, pas trois séparés; Les noms chinois Hanzi sont épelés sans espaces entre le prénom et le nom.
  • L'utilisation des majuscules n'est pas si évidente: le nom de famille van der Meer peut être mis en majuscule lorsqu'il est utilisé sans nom, mais avec une minuscule après le nom.
  • Utilisez le nom entier, ne le divisez pas en morceaux. Par exemple, n'essayez pas de faire référence à une personne sous le nom de "M. dernier mot": ici des erreurs sont possibles dans différents cas:
    • Si le nom de famille est écrit avant le prénom (par exemple, chinois).
    • Si vous utilisez correctement le patronyme, mais ce n'est pas le dernier.
    • Si le nom de famille se compose de plusieurs mots, par exemple, le nom espagnol de la Torre
    • Si le nom contient un suffixe, par exemple, "mineur".

Enfin, je vous recommande vivement de consulter le guide des petits noms dans l' article du W3C .

Source: https://habr.com/ru/post/fr431866/


All Articles