
في عام 2010 ، كتب باتريك ماكنزي المقالة الشهيرة ،
"المفاهيم الخاطئة للمبرمجين حول الأسماء" ، والتي تضمنت 40 حقيقة واقعة ليست صحيحة دائمًا في الأسماء البشرية.
هل تعتقد أن المبرمجين جلسوا وفكروا وغيروا معالجة الأسماء في أنظمة الكمبيوتر؟ لسوء الحظ ، ليس حقا. لا يزال يُطلب منا في كل مكان ملء النماذج عبر الإنترنت التي تتطلب وجود اسم ولقب (علاوة على ذلك ، بهذا الترتيب). لا تزال هذه الأنظمة تفترض أنه يمكن دائمًا كتابة أسماءنا بأحرف أبجدية ، وغالبًا ما تكون ASCII فقط.
أظن أن مقالة باتريك لم يكن لها تأثير كاف على الصناعة ، بما في ذلك لأنه لم تكن هناك أمثلة لكل فكرة خاطئة. ولكن كموظف سابق في مشروع IBM
Global Name Management ، يمكنني أن أؤكد لك أن كل ما يقال فيه صحيح.
لا تصدق؟ في هذه المقالة سأذكر جميع المفاهيم الخاطئة الأربعين ، مع إعطاء مثال (أو اثنين) من تجربتي في هذا المجال. هل انت جاهز دعنا نذهب!
1. كل شخص له اسم كامل متعارف عليه.يبدو أن بعض الأشخاص يعتقدون أن لديك اسمًا ، ولا يتغير أبدًا. ولكن حتى في الدول الغربية ، يمكن للشخص تغيير اسمه الأخير عند الزواج. في التقليد الكاثوليكي ، يمكن للشخص الحصول على اسم الأوسط أثناء التأكيد.
2. كل شخص له اسم واحد كامل يستخدمه.وُلِد كاتب الخيال العلمي المعروف جون ويندهام (مؤلف يوم تريفيدز) تحت اسم جون ويندهام باركس لوكاس بينون هاريس ، ونشر كتبًا تحت اسم جون بيون ولوكاس باركس ، وكذلك جون ويندهام.
3. في هذه المرحلة الزمنية ، يكون لكل شخص اسم كامل متعارف عليه.قد يكون للممثل اسم المرحلة ، والذي يختلف تمامًا عن الاسم في شهادة الميلاد ، وقد يكون لديه حتى جواز سفر لاسم المرحلة.
4. في هذه المرحلة الزمنية ، يكون لكل شخص اسم واحد كامل يستخدمه.هذا ليس كذلك ، حتى في الدول الغربية ، يمكن للمرأة أن تبقي اسمها قبل الزواج في العمل (حيث كانت معروفة بهذا الاسم بالفعل) وأن تستخدم اسم زوجها الأخير في التواصل أو في الوثائق القانونية مثل القروض العقارية والقروض.
5. كل شخص لديه أسماء N بالضبط ، بغض النظر عن قيمة N.يحتوي الاسم الإنجليزي تقليديًا على اسمين (غالبًا ما يطلق عليهم الاسم الأول والاسم الأوسط) والاسم الأخير ، ولكن ليس بالضرورة بهذه الطريقة. قد لا يكون للشخص اسم الأوسط أو قد يكون هناك العديد. على سبيل المثال ، يحمل البرتغاليون اسمًا واحدًا أو اسمين وأربعة ألقاب (بحد أقصى ستة في حالة امرأة متزوجة) ، ويمكن أن تكون هذه الألقاب عبارات مثل دا سيلفا أو دوس سانتوس ، أو حتى كوستا إي سيلفا.
6. أسماء تناسب في عدد معين من الشخصيات.كان للفنان الشهير ، الذي يُسمى عادةً بيكاسو ، اسمًا كاملاً بابلو دييغو خوسيه فرانسيسكو دي بولا خوان نيبوموسينو ماريا دي لوس ريميديوس سيبريانو دي لا سانتيسيما ترينيداد مارتير باتريسيو رويز وبيكاسو. حاول احتواء هذا في نموذج مكون من 30 حرفًا ...
7. الأسماء لا تتغير.لقد ذكرنا بالفعل الفتيات اللاتي يغيرن اسمهن عند الزواج ، لذلك فمن الواضح أنه غير صحيح. بالإضافة إلى ذلك ، يمكن للكاثوليك أن يأخذوا اسمًا متوسطًا في وقت التأكيد. أيضًا ، غالبًا ما يضيف الشخص اسمًا أو يغيره تمامًا عند التحول إلى دين آخر - تذكر كيف ، بعد اعتناق الإسلام ، أصبحت كات ستيفنز يوسف إسلام ، وتحولت كاسيوس كلاي إلى محمد علي.
8. الأسماء تتغير ، ولكن فقط في بعض الحالات المحدودة.بالنسبة لبعض التايلانديين ، فإن الشيء المعتاد هو تغيير الاسم لدرء الفشل. هذا يمكن أن يحدث دون سبب كبير. في بعض الأحيان يغير الشخص اسمه عندما يصبح شخص آخر بنفس الاسم مشهورًا أو سيئ السمعة: مثال بارز عندما تخلى كثير من الناس عن لقب هتلر.
9. الأسماء مكتوبة في أسكي.فكرة خاطئة واضحة ، فقط لأن ASCII لا يحتوي على أحرف معلمة من أسماء فرنسية أو برتغالية. لا تتضمن مجموعة الأحرف هذه الأبجدية اليونانية المستخدمة في الأسماء اليونانية ، والأحرف السيريلية للأسماء الروسية. هناك نصوص مثل Devanagari للأسماء الهندية والأحرف الصينية (Hanzi) والأحرف اليابانية (Kanji) وغير ذلك الكثير.
10. يتم كتابة الأسماء في أي ترميز واحد.بعض الأسماء لها ترميزات مختلطة. على سبيل المثال ، كانجي بأحرف لاتينية أو hanzi بأحرف لاتينية ، أو هانغول كوري بأحرف لاتينية. في كثير من الحالات ، يكون هذا بسبب وجود "اسم غربي" للشخص لإرضاء أولئك الذين لا يستطيعون نطق اسمه بلغته الأم.
11. جميع الأسماء تتوافق مع نقاط كود Unicode.يواصل مطورو Unicode إضافة نقاط رمز للأحرف النادرة بشكل متزايد إلى المعيار. الغالبية العظمى من الأسماء تتوافق معهم بالفعل ، ولكن لا تزال هناك استثناءات ، مثل الرمز
"فنان ، المعروف سابقًا باسم Prince" . حتى لو استبعدنا مثل هذه الشذوذ ، فإن العديد من النصوص لم تدخل يونيكود بعد. ولعل المثال الأكثر واقعية هو أيمارا ، وهي لغة مكتوبة بلغة يتحدث بها أكثر من مليون شخص في أمريكا الجنوبية. الأمثلة الأقل واقعية هي لغة أو رموز Klingon التي ابتكرها Tolkien for Middle-earth. بالإضافة إلى ذلك ، يحتوي Unicode على جزء فقط من الأحرف الصينية واليابانية ، وتستخدم بعض الأحرف المفقودة في الأسماء.
لزيادة تعقيد الأمور ، لا توجد رموز مكتوبة في بعض اللغات - لا يمكن تدوينها. ولمثل هذه اللغات ، لا توجد نقاط رمز في Unicode. يمكن تهجئة الأسماء في هذه اللغات صوتيًا ، ولكن هذا ليس مفيدًا بشكل خاص لأن معظم الناس ليسوا على دراية بالأبجدية الصوتية.
12. الأسماء حساسة لحالة الأحرف.العديد من مجموعات الأحرف ليست حساسة لحالة الأحرف: على سبيل المثال ، الصينية واليابانية. بالنسبة لهم ، فإن فكرة الأحرف الكبيرة والصغيرة هي ببساطة غير قابلة للتطبيق.
13. الأسماء ليست حساسة لحالة الأحرف.بعض البرامج النصية حساسة لحالة الأحرف: على سبيل المثال ، اللاتينية. الأهم من ذلك ، في بعض اللغات ، يمكن كتابة الأحرف في الأحرف الصغيرة ، ولكن ليس في الأحرف الكبيرة ، لذلك يستحيل ترجمتها من حالة إلى أخرى.
يمكن أن يكون السجل الصحيح مهمًا للغاية بالنسبة لبعض الأشخاص ، مثل الأشخاص الذين لديهم أسماء Mackenzie و Mackenzie.
بالإضافة إلى ذلك ، يعد السجل الصحيح مهمًا لأسماء مثل Van Gogh و du Barry و da Costa و O'Brien و D'Agostino وأسماء مثل Jean-Pierre.
14. تظهر أحيانًا البادئات أو اللاحقات في الأسماء ، لكن يمكنك تجاهلها بأمان.لا شيء يمكن أن يكون أبعد عن الحقيقة. بيتر هول دير الهولندي ليس هو نفسه بيتر مير ، على الرغم من أن "فان دير" بادئة.
يمكنك التفكير في اللاحقة "الأصغر" باسم روبرت داوني جونيور ، لكن إذا حذفتها ، فسوف تسمي والده وليس اسمه.
في الأسماء العربية ، تعني كلمة لاحقة الدين "الإيمان" أو "الدين" - أسماء مثل تاج الدين ("تاج الإيمان") أو سيف الدين ("سيف الدين") لن تبقى كما هي في حالة استخدام اللاحقة. الاسم الإيطالي دي ستيفانو ليس هو نفسه ستيفانو.
امرأة إسبانية تحمل لقب "Viuda de la Cruz" هي أرملة رجل مع راعي دي la Cruz. يؤدي غياب البادئات إلى تغيير قيمة الاسم.
15. الأسماء لا تحتوي على أرقام.حتى إذا تم تجاهل السلالات (على سبيل المثال ، Thurston Howell III) ، في بعض الحالات يصبح الرقم جزءًا من الاسم القانوني لشخص ما. على سبيل المثال ، اختارت
Jennifer 8 Lee الاسم الأوسط 8 ، لأن 8 يرتبط بالحظ.
16. لا يمكن كتابة الأسماء بحروف كاملة.في بعض البلدان (خاصة الناطقة بالفرنسية) ، من المعتاد أن تكتب اسم شخص ما بحروف كبيرة بحيث يكون واضحًا أي جزء هو اللقب. ترسخت هذه الاتفاقية إلى حد أن كتابة اللقب في أحرف صغيرة يمكن اعتبارها غير مهذبة.
17. لا يمكن كتابة الأسماء بأحرف صغيرة كاملة.الشاعر
ه. ه. فضل
كامينغز أن يكتب اسمه بحروف صغيرة. مثل المغني
دينار كويتي لانج . مؤدب لاتباع الهجاء المفضل من قبل صاحب الاسم.
هناك لقب
فرنسي أيرلندي / بريطاني ، وهو مكتوب بشكل تقليدي في الأحرف الصغيرة ، على الرغم من أن هذا التقليد يعاني من البرامج الرديئة التي تجبرك على تحديد الأحرف الكبيرة الأولى.
18. أسماء لها أمر. سيؤدي تحديد أحد أنظمة ترتيب التسجيل تلقائيًا إلى ترتيب ثابت بين جميع الأنظمة إذا كانت جميعها تستخدم نفس نظام الطلب.في هولندا ، يتم فهرسة اسم Vincent van Gogh وتصنيفه بالحرف G باسم Gog ؛ في بلجيكا ، يتم فهرسة الاسم نفسه بواسطة B لـ Van Gogh. من المستحيل اعتماد نظام موحد للأسماء يؤدي إلى ترتيب مقبول عمومًا. في العديد من المكتبات ، يعتمد النظام على مكان ميلاد الشخص (لا أريد تطبيق هذه القاعدة في البرامج).
19. الاسم واللقب مختلفان بالضرورة.توفي بنيامين ، رجل أعمال وسياسي أسترالي ، في عام 1905. جيروم ك. جيروم كاتب إنجليزي اشتهر بعمله "ثلاثة في قارب ، وليس عد كلب". أوين أوين هو الويلزي الذي أسس أوين أوين المحدودة ، سلسلة متاجر. ولن نلمس حتى الرياضيين والممثلين الذين تبنوا هذه الأسماء المستعارة.
20. للناس اللقب أو شيء مشابه للأقارب.في Java ، كان من المعتاد إعطاء الشخص اسمًا فقط بدون اسم عائلة. على سبيل المثال ، لم يكن لرئيسي إندونيسيا سوهارتو وسوكارنو لقب.
21. اسم الشخص فريد من نوعه.أخبره لأي شخص يدعى جون سميث! لدي اسم أقل شيوعًا بعض الشيء ، لكنني وجدت شخصًا يحمل نفس الاسم واللقب يعمل في نفس الصناعة في نفس البلد (أستراليا).
22. اسم الشخص فريد من نوعه.حتى مع الإملاء غير القياسي ، من السهل عادةً العثور على أشخاص لهم نفس الاسم بالكامل: حاول استخدام google الخاص بك.
23. حسنا ، حسنا ، لكن الأسماء نادرة بما فيه الكفاية ، لذلك لا يوجد مليون شخص بنفس الاسم واللقب.يقال إن الاسم الصيني ، تشانغ وى ، يحمله أكثر من ربع مليون شخص.
إذا قصرنا أنفسنا على الألقاب ، فإن حوالي 20 ٪ من سكان كوريا الجنوبية لديهم اللقب كيم. حوالي 10 ٪ من سكان شمال الصين يحملون اللقب وانغ ، وأكثر من 10 ٪ من سكان جنوب الصين يحملون اللقب تشن. في المرتبة الثانية ، هناك وهناك لقب لي ، مما يجعلها الأكثر شعبية في البلاد. وحوالي 40 ٪ من الفيتناميين لديهم اللقب نجوين.
الأسماء هي أبعد ما تكون عن فريدة من نوعها.
24. لن يتعامل نظامي أبدًا مع أسماء من الصين.قامت الهجرة بتوسيع أسماء كل ثقافة (تقريبًا) إلى كل بلد. لقد ولت الأيام تقريبًا عندما مُنح المهاجرون أسماء جديدة عند دخولهم إلى البلاد (على سبيل المثال ، على الرغم من ذلك ، لا تزال فيتنام تتطلب أن يقبل طالب الجنسية الاسم الفيتنامي). من غير الواقعي توقع الغياب التام لأسماء من دول أخرى ، على الرغم من أنه يمكنك رؤيتها في شكل حرفي.
لذلك ، قد يظهر اسم صيني مثل
周潤發 في نظامك باسم Chow Yun Fat ، أو Chow Yun Fat ، أو حتى Yun Fat Chow (Chow هو اللقب).
25. أو اليابان.انظر أعلاه.
26. أو كوريا.انظر أعلاه.
27. أو أيرلندا ، بريطانيا العظمى ، الولايات المتحدة الأمريكية ، إسبانيا ، المكسيك ، البرازيل ، بيرو ، السويد ، بوتسوانا ، جنوب أفريقيا ، ترينيداد ، هايتي ، فرنسا ، إمبراطورية كلينجون - كل هذه تستخدم مخططات أسماء "غريبة".انظر أعلاه.
28. كانت كلينجون إمبراطورية مزحة ، أليس كذلك؟من الصعب العثور على أمثلة لأشخاص يستخدمون أسماء Klingon رسميًا ، ولكن لماذا لا؟ إذا طبقنا نظامًا يدعم الثقافات الأخرى (على سبيل المثال ، الفاصلة العليا المضمنة لـ O'Brien) ، فيمكننا أيضًا دعم أسماء Klingon بدون عمل إضافي.
29. إلى الجحيم بالنسبية الثقافية! لدى الناس في مجتمعي ، على الأقل ، نفس فكرة وجود معيار مقبول عالميًا للأسماء.وسوف يعمل البرنامج الخاص بك فقط مع الأشخاص الذين تلقوا أسماء في مجتمعك؟
30. هناك خوارزمية تحول الأسماء إلى واحد والآخر دون خسارة. (نعم ، نعم ، يمكنك القيام بذلك إذا كانت خوارزمية المخرجات تُرجع نفس المدخلات ، فاخذ ميدالية لنفسك).لا توجد خوارزمية (بخلاف تذكر التنسيق الأصلي) التي تحول الاسم بطريقة يمكن عكسها مضمونة.
31. يمكنني أن أفترض بثقة أن هذا القاموس من الكلمات البذيئة لا يحتوي على الألقاب.هذا خطأ شائع: العديد من "الكلمات السيئة" ليست سيئة في اللغات الأخرى ، والبعض الآخر يستخدم في الأسماء. بالإضافة إلى ذلك ، ليس كل مجتمع يحد من الكلمات التي يمكن استخدامها في الاسم: من الممكن أن يتم تعيين اسم شخص ما في هذه الولاية القضائية.
32. تعطى الأسماء للأشخاص عند الولادة.يتم تسجيل المواليد في معظم البلدان ، ولكن فعالية هذا النظام ليست هي نفسها.
تختلف القواعد الدقيقة حسب الاختصاص ، ولكن هناك دائمًا بعض التأخير في تسجيل المواليد. تختلف التأخيرات المسموح بها من ثلاثة أسابيع (اسكتلندا) إلى شهرين (أستراليا) ، ولكن هناك المزيد.
يمكن تسجيل اسم الطفل في وقت تسجيل المواليد ، لكن هذا لا يحدث دائمًا (في بعض الأماكن ، لا يزال الأطفال مسجلين بأسماء مثل Baby Boy أو Baby Girl ، عندما يواجه الآباء مشاكل في اختيار اسم أو إذا كان الطفل غير مسيد ، على سبيل المثال).
33. حسنا ، ربما ليس عند الولادة ، ولكن بعد فترة وجيزة.34. حسنًا ، حسنًا ، لمدة عام أو نحو ذلك.35. خمس سنوات؟36. أنت تمزح ، أليس كذلك؟هناك ثقافات لا يُعطى فيها اسم شخص بالغ قبل البلوغ. قبل ذلك ، قد يكون للطفل "حليب" أو اسم مؤقت.
37. سيستخدم نظامان مختلفان يشار إليهما اسم الشخص نفسه.إذا كان الأمر كذلك ، فلن يكون هناك سوق للبرمجيات للتوفيق بين قواعد البيانات المختلفة.
في حالتي الشخصية ، تضمنت بعض الأنظمة اسمي الرسمي ، بما في ذلك اسمي الأوسط ، وبعضها الآخر اسمي الأول والأخير فقط أو الاسم المختصر الأول والأخير. وهذه لا تزال حالة بسيطة. يشار إلى زوجتي في بعض النظم باسمها قبل الزواج ، وفي حالات أخرى - مع الاسم الأخير لزوجها ، مع أو بدون اسم كامل ، مع أو بدون اسم الأوسط ، وبأي من هجاء اسمها المختصر.
38. سيُدخل بالضرورة مشغّلان مختلفان لإدخال البيانات ، إذا تم إعطاؤهما اسم شخص ما ، بنفس مجموعة الأحرف إذا كان النظام مصممًا بشكل جيد.تخيل ما يحدث عندما يدخل الشخص اسمًا يسمعه على الهاتف. على سبيل المثال ، طومسون وتومبسون ؛ أو جونسون ، جونستون ، جونستون وجونسون.
39. الأشخاص الذين تحطيم أسمائهم نظامي هم غرباء غريبون. يجب أن يكون لديهم أسماء عادية ومقبولة ، مثل 田中 太郎.لا ، نظامك مصمم بشكل سيء.
على وجه الخصوص ، غالبًا ما يتم العثور على الاسم المذكور كاسم أجنبي في أنيمي (المانجا). كان هناك أناس حقيقيون بهذا الاسم.
40. للناس أسماء.في هذه الحالة ، ربما يكون من الأصعب إعطاء أمثلة مقنعة. كانت هناك ثقافة منعزلة لم يكن فيها لأحد أسماء: فقد أطلقوا على بعضهم أسماء مصطلحات أخرى مثل "أخت أمي الكبرى".
لتلخيص
لذلك ، فعلنا ذلك: وجدنا أمثلة (تقريبًا) لجميع النقاط الأربعين من مقالة باتريك ماكنزي
"مفاهيم خاطئة للمبرمجين حول الأسماء" . إذا كنت تشعر بوجود بعض الإفراط في المعلومات ، فدعنا نلخص. إليك أهم شيء عند تطوير نظام يعالج الأسماء:
- لا تستخدم مصطلحات مثل "الاسم الأول" أو "الاسم المسيحي": ببساطة "الاسم المحدد" هو المصطلح الأكثر شيوعًا.
- ضع في اعتبارك أن نصف العالم يشير أولاً إلى اللقب.
- تستخدم العديد من الثقافات نظامًا مختلفًا عن اللقب المشترك لجميع أفراد الأسرة. يستخدم بعض المستفيدين أو المختصرة (في بعض الأحيان لا واحدة) ؛ الآخرين ليس لديهم اسم العائلة على الإطلاق.
- يمكن أن تكون علامات الترقيم جزءًا حيويًا من الاسم: لا يتوافق اسم O'Hara الأيرلندي مع اللقب الياباني Ohara. اسم جان بيير لا يتطابق مع اسم جان بيير أو اسم جان بيير ، وجان بيير هو نفس الاسم ، وجان بيير اسمان منفصلان.
- لا تفصل المسافات بالضرورة أجزاء من الاسم واللقب: de la Cruz - لقب واحد ، وليس ثلاثة أحرف منفصلة ؛ يتم تهجئة أسماء Hanzi الصينية بدون مسافات بين الأسماء الأولى والأخيرة.
- استخدام الحروف الكبيرة ليس واضحًا جدًا: يمكن استخدام الأحرف الكبيرة في اللقب van der Meer عند استخدامه بدون اسم ، ولكن باستخدام أحرف صغيرة بعد الاسم.
- استخدم الاسم بالكامل ، وليس تقسيمه إلى أجزاء. على سبيل المثال ، لا تحاول الإشارة إلى شخص باسم "السيد Last-Word-in-Name": هنا الأخطاء ممكنة في حالات مختلفة:
- إذا تم كتابة الاسم الأخير قبل الاسم الأول (على سبيل المثال ، الصينية).
- إذا كنت تستخدم المستفيد بشكل صحيح ، إلا أنه ليس الأخير.
- إذا كان اللقب يتكون من أكثر من كلمة واحدة ، على سبيل المثال ، اللقب الأسباني دي لا توري
- إذا كان الاسم يحتوي على لاحقة ، على سبيل المثال ، "ثانوي".
أخيرًا ، أوصي بشدة بمراجعة دليل الأسماء الصغيرة في
مقالة W3C .