Conceptos erróneos de los programadores sobre nombres, con ejemplos



En 2010, Patrick Mackenzie escribió el famoso artículo, "Conceptos erróneos de los programadores sobre los nombres", en el que se enumeran 40 factoides que no siempre son ciertos acerca de los nombres humanos.

¿Crees que los programadores se sentaron, pensaron y cambiaron el procesamiento de nombres en los sistemas informáticos? Lamentablemente, no realmente. Todavía en todas partes se nos pide que completemos formularios en línea que requieren la presencia de un nombre y un apellido (además, en ese orden). Estos sistemas aún suponen que nuestros nombres siempre se pueden escribir en caracteres alfabéticos, a menudo solo ASCII.

Sospecho que el artículo de Patrick no tuvo suficiente impacto en la industria, incluso porque no había ejemplos de cada error. Pero como ex empleado del proyecto IBM Global Name Management , puedo asegurarle que todo lo que se dice en él es cierto.

No lo creo? En este artículo enumeraré los 40 conceptos erróneos, dando un ejemplo (o dos) de mi experiencia en esta área. Estas listo Vamos!

1. Cada persona tiene un nombre completo canónico.
Parece que algunas personas piensan que obtienes un nombre, y nunca cambia. Pero incluso en los países occidentales, una persona puede cambiar su apellido en el matrimonio. En la tradición católica, una persona puede obtener un segundo nombre durante la confirmación.

2. Cada persona tiene un nombre completo que usa.
El conocido escritor de ciencia ficción John Wyndham (autor de Triffids Day) nació con el nombre de John Wyndham Parks, Lucas Beynon Harris, y publicó libros con los nombres de John Beynon y Lucas Parks, así como John Wyndham.

3. En este momento, cada persona tiene un nombre completo canónico.
Un actor puede tener un nombre artístico, que es completamente diferente del nombre en el certificado de nacimiento, incluso puede tener un pasaporte para el nombre artístico.

4. En este momento, cada persona tiene un nombre completo que usa.
Esto no es así, incluso en los países occidentales una mujer puede mantener su apellido de soltera en el trabajo (donde ya se la conoce por ese nombre) y usar el apellido de su esposo en la comunicación o en documentos legales como hipotecas y préstamos.

5. Cada persona tiene exactamente N nombres, independientemente del valor de N.
El nombre en inglés tradicionalmente contiene dos nombres (a menudo se llaman primer nombre y segundo nombre) y apellido, pero no necesariamente de esa manera. Una persona puede no tener un segundo nombre o puede haber varios. Por ejemplo, los portugueses tienen uno o dos nombres y hasta cuatro apellidos (hasta seis en el caso de una mujer casada), y estos apellidos pueden ser frases como da Silva o dos Santos, o incluso Costa i Silva.

6. Los nombres caben en un cierto número de caracteres.
El famoso artista, que generalmente se llama simplemente Picasso, tenía un nombre completo Pablo Diego José Francisco de Paula Juan Nepomuseno María de los Remedios Sipriano de la Santísima Trinidad Mártir Patricio Ruiz y Picasso. Intenta ajustar esto en una forma de 30 caracteres ...

7. Los nombres no cambian.
Ya hemos mencionado a las chicas que cambian su nombre en el matrimonio, por lo que esto claramente no es cierto. Además, los católicos pueden tomar un segundo nombre en el momento de la confirmación. Además, una persona a menudo agrega un nombre o lo cambia por completo cuando cambia a otra religión; recuerde cómo, después de la conversión al Islam, Kat Stevens se convirtió en Yusuf Islam, y Cassius Clay se convirtió en Mohammed Ali.

8. Los nombres cambian, pero solo en ciertos casos limitados.
Para algunos tailandeses, lo habitual es cambiar el nombre para evitar el fracaso. Esto puede suceder sin mucha razón. A veces, una persona cambia su nombre cuando otra persona con el mismo nombre se hizo famosa o notoria: un ejemplo notable cuando muchas personas abandonaron el apellido Hitler.

9. Los nombres están escritos en ASCII.
Una idea errónea clara, aunque solo sea porque ASCII no contiene caracteres acentuados de nombres franceses o portugueses. Este conjunto de caracteres no incluye el alfabeto griego usado en nombres griegos, caracteres cirílicos para nombres rusos. Hay guiones como Devanagari para nombres indios, caracteres chinos (Hanzi), caracteres japoneses (Kanji) y mucho más.

10. Los nombres están escritos en cualquier codificación.
Algunos nombres tienen codificaciones mixtas. Por ejemplo, kanji con caracteres latinos o hanzi con caracteres latinos, o hangul coreano con caracteres latinos. En muchos casos, esto se debe a que una persona tiene un "nombre occidental" para complacer a quienes no pueden pronunciar su nombre en su idioma nativo.

11. Todos los nombres corresponden a puntos de código Unicode.
Los desarrolladores de Unicode continúan agregando puntos de código para caracteres cada vez más raros al estándar. La gran mayoría de los nombres ya les corresponden, pero todavía hay excepciones, como el símbolo "artista, anteriormente conocido como Príncipe" . Incluso si excluimos tales rarezas, varios scripts aún no han ingresado a Unicode. Quizás el ejemplo más realista es el aymara, un idioma escrito para un idioma hablado por más de un millón de personas en América del Sur. Ejemplos menos realistas son el lenguaje o símbolos klingon inventados por Tolkien para la Tierra Media. Además, Unicode incluye solo una parte de los caracteres chinos y japoneses, y algunos de los caracteres que faltan se usan en los nombres.

Para complicar aún más las cosas, en algunos idiomas no hay símbolos escritos, no se pueden escribir. Y para tales idiomas, no hay puntos de código en Unicode. Los nombres en estos idiomas se pueden deletrear fonéticamente, pero esto no es particularmente útil porque la mayoría de las personas no están familiarizadas con el alfabeto fonético.

12. Los nombres distinguen entre mayúsculas y minúsculas.
Muchos juegos de caracteres no distinguen entre mayúsculas y minúsculas: por ejemplo, chino y japonés. Para ellos, la idea de letras mayúsculas y minúsculas simplemente no es aplicable.

13. Los nombres no distinguen entre mayúsculas y minúsculas.
Algunas secuencias de comandos distinguen entre mayúsculas y minúsculas: por ejemplo, latín. Más importante aún, en algunos idiomas, los caracteres se pueden escribir en minúsculas, pero no en mayúsculas, por lo que es imposible traducirlos de un caso a otro.

El registro correcto puede ser muy importante para algunas personas, como aquellas con los nombres Mackenzie y Mackenzie.

Además, el registro correcto es importante para nombres como Van Gogh, du Barry, da Costa, O'Brien y D'Agostino, y nombres como Jean-Pierre.

14. A veces aparecen prefijos o sufijos en los nombres, pero puede ignorarlos con seguridad.
Nada podría estar más lejos de la verdad. El nombre holandés Peter van der Meer no es el mismo que Peter Meer, aunque "van der" es un prefijo.

Puede considerar el sufijo "más joven" en el nombre de Robert Downey Jr., pero si lo omite, nombrará a su padre, no al suyo.

En los nombres árabes, el sufijo al-Din significa "fe" o "religión" - nombres como Taj al-Din ("corona de fe") o Saif al-Din ("espada de la religión") no seguirán siendo los mismos si se usa el sufijo. El nombre italiano Di Stefano no es lo mismo que Stefano.

Una mujer española con el apellido "Viuda de la Cruz" es la viuda de un hombre con el nombre de la Cruz. La ausencia de prefijos cambia el valor del nombre.

15. Los nombres no contienen números.
Incluso si se ignoran las dinastías (por ejemplo, Thurston Howell III), en algunos casos el número se convierte en parte del nombre legal de alguien. Por ejemplo, Jennifer 8 Lee eligió el segundo nombre 8, porque 8 está asociado con la suerte.

16. Los nombres no pueden escribirse en letras FULL CAPITAL.
En algunos países (especialmente de habla francesa), se acostumbra escribir el apellido de una persona en mayúsculas para que quede claro qué parte es el apellido. Esta convención se ha arraigado hasta tal punto que escribir un apellido en letras minúsculas puede considerarse descortés.

17. Los nombres no pueden escribirse en letras minúsculas enteras.
Poeta e. e. Cummings prefería que su nombre se escribiera en minúsculas. Como el cantante kd lang . Cortés para seguir la ortografía preferida por el dueño del nombre.

Hay un apellido irlandés / británico francés , que se escribe tradicionalmente en minúsculas, aunque esta tradición adolece de un software deficiente que le obliga a especificar la primera mayúscula.

18. Los nombres tienen un orden. La selección de uno de los esquemas de orden de grabación conducirá automáticamente a un orden constante entre todos los sistemas si todos usan el mismo esquema de orden.
En los Países Bajos, el nombre de Vincent van Gogh está indexado y ordenado por la letra G como Gog; en Bélgica, el mismo nombre está indexado por B para Van Gogh. Es imposible adoptar un sistema unificado de nombres que conduzca a un orden generalmente aceptado. En muchas bibliotecas, el sistema se basa en el lugar de nacimiento de la persona (no quisiera que esta regla se aplique en el software).

19. El nombre y el apellido son necesariamente diferentes.
Benjamin, un empresario y político australiano, murió en 1905. Jerome K. Jerome es un escritor inglés conocido por su trabajo "Tres en un bote, sin contar un perro". Owen Owen es un galés que fundó Owen Owen Ltd, una cadena de tiendas por departamento. Y ni siquiera tocaremos a los atletas y actores que adoptaron tales seudónimos.

20. Las personas tienen un apellido o algo similar común a sus familiares.
En Java, era costumbre dar a una persona solo un nombre sin apellido. Por ejemplo, los presidentes de Indonesia Suharto y Sukarno no tenían apellido.

21. El nombre de una persona es único.
¡Díselo a cualquiera llamado John Smith! Tengo un nombre un poco menos común, pero encontré una persona con el mismo nombre y apellido trabajando en la misma industria en el mismo país (Australia).

22. El nombre de una persona es casi único.
Incluso con la ortografía no estándar, generalmente es fácil encontrar personas con el mismo nombre completo: intente buscar su propio google.

23. Está bien, está bien, pero los nombres son bastante raros, por lo que no hay un millón de personas con el mismo nombre y apellido.
Según los informes, el nombre chino, Zhang Wei, lo llevan más de un cuarto de millón de personas.

Si nos limitamos a los apellidos, aproximadamente el 20% de la población de Corea del Sur tiene el apellido Kim. Alrededor del 10% de la población del norte de China lleva el apellido Wang, y más del 10% de la población del sur de China lleva el apellido Chen. En segundo lugar, tanto allí como el apellido Lee, lo que la convierte en la más popular del país. Y alrededor del 40% de los vietnamitas tienen el apellido Nguyen.

Los nombres también están lejos de ser únicos.

24. Mi sistema nunca tratará con nombres de China.
La migración extendió los nombres de cada cultura a (casi) todos los países. Los días casi han pasado cuando los inmigrantes recibieron nuevos nombres al ingresar al país (aunque, por ejemplo, Vietnam todavía requiere que el solicitante de la ciudadanía acepte el nombre vietnamita). No es realista esperar la ausencia total de nombres de otros países, aunque puede verlos en forma transliterada.

Entonces, un nombre chino como 周潤發 en su sistema puede aparecer como Chow Yun Fat, o Chow Yun Fat, o incluso Yun Fat Chow (Chow es un apellido).

25. O Japón.
ver arriba

26. O Corea.
ver arriba

27. O Irlanda, Gran Bretaña, Estados Unidos, España, México, Brasil, Perú, Suecia, Botswana, Sudáfrica, Trinidad, Haití, Francia, el Imperio Klingon, todos ellos usan esquemas de nombres "extraños".
ver arriba

28. El Imperio Klingon fue una broma, ¿verdad?
Es difícil encontrar ejemplos de personas que usan oficialmente nombres klingon, pero ¿por qué no? Si implementamos un sistema con soporte para otras culturas (por ejemplo, el apóstrofe incorporado para O'Brien), también podemos soportar nombres Klingon sin trabajo adicional.

29. ¡Al diablo con el relativismo cultural! Las personas en mi sociedad , al menos, tienen la misma idea de un estándar universalmente aceptado para los nombres.
¿Y su software solo funcionará con personas que hayan recibido nombres en su comunidad?

30. Existe un algoritmo que convierte los nombres a uno y otro lado sin pérdida. (Sí, sí, puedes hacer esto si el algoritmo de salida devuelve lo mismo que la entrada, toma una medalla para ti).
No existe un algoritmo (que no sea recordar el formato original) que convierte el nombre de forma reversible garantizada.

31. Puedo suponer con confianza que este diccionario de palabras obscenas no contiene apellidos.
Este es un error común: muchas "malas palabras" no son malas en otros idiomas, y algunas se usan en los nombres. Además, no todas las sociedades limitan las palabras que se pueden usar en un nombre: es posible que el nombre de alguien se asigne en dicha jurisdicción.

32. Se dan nombres a las personas al nacer.
Los nacimientos se registran en la mayoría de los países, pero la efectividad de este sistema no es la misma.

Las reglas exactas varían según la jurisdicción, pero siempre hay algún retraso en el registro de nacimientos. Los retrasos permitidos varían de tres semanas (Escocia) a dos meses (Australia), pero hay más.

El nombre del bebé se puede registrar en el momento de la inscripción del nacimiento, pero esto no siempre sucede (en algunos lugares, los niños todavía están registrados con nombres como Baby Boy o Baby Girl, cuando los padres tienen problemas para elegir un nombre o si el niño es un niño, por ejemplo).

33. Bien, tal vez no al nacer, pero poco después.

34. Vale, vale, durante un año más o menos.

35. ¿Cinco años?

36. Estás bromeando, ¿verdad?
Hay culturas en las que no se le da un nombre de adulto a una persona antes de la pubertad. Antes de esto, el niño puede tener una "leche" o un nombre temporal.

37. Dos sistemas diferentes en los que se indica el nombre de la misma persona usarán el mismo nombre para él.
Si esto fuera así, entonces no habría mercado de software para conciliar varias bases de datos.

En mi caso personal, algunos sistemas contenían mi nombre oficial, incluido mi segundo nombre, y otros solo mi nombre y apellido o el nombre y apellido abreviado. Y este sigue siendo un caso simple. Mi esposa se indica en algunos sistemas por su apellido de soltera, y en otros, con el apellido de su esposo, con o sin nombre completo, con o sin segundo nombre, y con cualquiera de las dos ortografías de su nombre abreviado.

38. Dos operadores de entrada de datos diferentes, si reciben el nombre de una persona, ingresarán necesariamente el mismo juego de caracteres si el sistema está bien diseñado.
Imagine lo que sucede cuando una persona ingresa un nombre que escucha en el teléfono. Por ejemplo, Thomson y Thompson; o Johnson, Johnston, Johnstone y Johnsson.

39. Las personas cuyos nombres rompen mi sistema son extraños extraños. Deben tener nombres normales y aceptables, como 田中 太郎.
No, su sistema está mal diseñado.

En particular, el nombre mencionado a menudo se encuentra como el nombre de un extranjero en el anime (y el manga). Había personas reales con ese nombre.

40. Las personas tienen nombres.
Para este caso, quizás sea el más difícil de dar ejemplos convincentes. Había una cultura aislada en la que nadie tenía nombres: se llamaban unos a otros términos relativos, como "la hermana mayor de mi madre".

Para resumir


Entonces, lo hicimos: encontramos ejemplos (casi) de los cuarenta puntos del artículo de Patrick Mackenzie "Conceptos erróneos de los programadores sobre los nombres" . Si siente cierta sobreabundancia de información, permítanos resumirlo. Aquí está lo más importante al desarrollar un sistema que procesa nombres:

  • No utilice términos como "nombre" o "nombre cristiano": simplemente "nombre de pila" es el término más común.
  • Tenga en cuenta que la mitad del mundo primero indica un apellido.
  • Muchas culturas usan un sistema diferente a un apellido común a todos los miembros de la familia. Algunos usan un patronimo o un matronimo (a veces no uno); y otros no tienen apellido.
  • La puntuación puede ser una parte vital de un nombre: el apellido irlandés de O'Hara no coincide con el apellido japonés Ohara. El nombre Jean-Pierre no coincide ni con el nombre Jean-Pierre ni con el nombre Jean Pierre, y Jean-Pierre es el mismo nombre, y Jean Pierre tiene dos nombres distintos.
  • Los espacios no necesariamente separan partes del nombre y apellido: de la Cruz - un apellido, no tres separados; Los nombres chinos Hanzi se escriben sin espacios entre el nombre y el apellido.
  • El uso de mayúsculas no es tan obvio: el apellido van der Meer se puede poner en mayúscula cuando se usa sin nombre, pero con minúscula después del nombre.
  • Usa el nombre completo, no lo rompas en pedazos. Por ejemplo, no intente referirse a una persona como "Sr. Apellido-Palabra-en-Nombre": aquí los errores son posibles en diferentes casos:
    • Si el apellido se escribe antes del primer nombre (por ejemplo, chino).
    • Si usa correctamente el patronímico, pero no es el último.
    • Si el apellido consta de más de una palabra, por ejemplo, el apellido español de la Torre
    • Si el nombre contiene un sufijo, por ejemplo, "menor".

Finalmente, le recomiendo que consulte la guía de nombres pequeños en el artículo del W3C .

Source: https://habr.com/ru/post/es431866/


All Articles