
Pada 2010, Patrick Mackenzie menulis artikel terkenal,
"Kesalahpahaman Programer tentang Nama," mendaftar 40 factoids yang tidak selalu benar tentang nama manusia.
Apakah Anda pikir programmer duduk, berpikir dan mengubah pemrosesan nama dalam sistem komputer? Sayangnya, tidak juga. Kami masih di mana-mana diminta untuk mengisi formulir online yang memerlukan kehadiran nama dan nama keluarga (apalagi, dalam urutan itu). Sistem ini masih menganggap bahwa nama kami selalu dapat ditulis dalam karakter alfabet, seringkali hanya ASCII.
Saya menduga bahwa artikel Patrick tidak memiliki dampak yang cukup pada industri, termasuk karena tidak ada contoh masing-masing kesalahpahaman. Tetapi sebagai mantan karyawan proyek IBM
Global Name Management , saya dapat meyakinkan Anda bahwa semua yang dikatakan di dalamnya adalah benar.
Tidak percaya Dalam artikel ini saya akan mencantumkan 40 kesalahpahaman, memberikan contoh (atau dua) dari pengalaman saya di bidang ini. Apakah kamu siap Ayo pergi!
1. Setiap orang memiliki satu nama lengkap kanonik.Tampaknya beberapa orang berpikir bahwa Anda mendapatkan nama, dan itu tidak pernah berubah. Tetapi bahkan di negara-negara Barat, seseorang dapat mengubah nama belakangnya saat menikah. Dalam tradisi Katolik, seseorang bisa mendapatkan nama tengah selama konfirmasi.
2. Setiap orang memiliki satu nama lengkap yang ia gunakan.Penulis fiksi ilmiah terkenal John Wyndham (penulis Triffids Day) lahir dengan nama John Wyndham Parks Lucas Beynon Harris, dan menerbitkan buku-buku dengan nama John Beynon dan Lucas Parks, serta John Wyndham.
3. Pada titik waktu ini, setiap orang memiliki satu nama lengkap kanonik.Seorang aktor mungkin memiliki nama panggung, yang sama sekali berbeda dari nama dalam akta kelahiran, ia bahkan mungkin memiliki paspor untuk nama panggung.
4. Pada titik waktu ini, setiap orang memiliki satu nama lengkap yang ia gunakan.Ini tidak demikian, bahkan di negara-negara Barat seorang wanita dapat menjaga nama gadisnya di tempat kerja (di mana dia sudah dikenal dengan nama itu) dan menggunakan nama belakang suaminya dalam komunikasi atau dalam dokumen-dokumen hukum seperti hipotek dan pinjaman.
5. Setiap orang memiliki nama N persis, terlepas dari nilai N.Nama bahasa Inggris secara tradisional berisi dua nama (mereka sering disebut nama depan dan nama tengah) dan nama belakang, tetapi tidak harus seperti itu. Seseorang mungkin tidak memiliki nama tengah atau mungkin ada beberapa. Misalnya, orang Portugis memiliki satu atau dua nama dan hingga empat nama keluarga (hingga enam dalam kasus wanita yang sudah menikah), dan nama keluarga ini dapat berupa frasa seperti da Silva atau dos Santos, atau bahkan Costa i Silva.
6. Nama masuk dalam sejumlah karakter tertentu.Seniman terkenal, yang biasanya hanya disebut Picasso, memiliki nama lengkap Pablo Diego JosΓ© Francisco de Paula Juan Nepomuseno Maria de los Remedios Sipriano de la Santisima Trinidad Martir Patricio Ruiz dan Picasso. Cobalah untuk memasukkan ini ke dalam bentuk 30 karakter ...
7. Nama tidak berubah.Kami telah menyebutkan gadis-gadis yang mengubah nama mereka saat menikah, jadi ini jelas tidak benar. Selain itu, umat Katolik dapat mengambil nama tengah pada saat konfirmasi. Juga, seseorang sering menambahkan nama atau benar-benar mengubahnya ketika beralih ke agama lain - ingat bagaimana, setelah masuk Islam, Kat Stevens menjadi Yusuf Islam, dan Cassius Clay berubah menjadi Mohammed Ali.
8. Nama berubah, tetapi hanya dalam kasus terbatas tertentu.Bagi sebagian orang Thailand, hal yang biasa adalah mengganti nama untuk menangkal kegagalan. Ini bisa terjadi tanpa banyak alasan. Terkadang seseorang mengubah namanya ketika orang lain dengan nama yang sama menjadi terkenal atau terkenal: contoh penting ketika banyak orang meninggalkan nama keluarga Hitler.
9. Nama-nama ditulis dalam ASCII.Kesalahpahaman yang jelas, jika hanya karena ASCII tidak mengandung karakter beraksen dari nama Perancis atau Portugis. Rangkaian karakter ini tidak termasuk alfabet Yunani yang digunakan dalam nama Yunani, karakter Sirilik untuk nama Rusia. Ada skrip seperti Devanagari untuk nama India, karakter Cina (Hanzi), karakter Jepang (Kanji), dan banyak lagi.
10. Nama ditulis dalam salah satu penyandian.Beberapa nama memiliki penyandian campuran. Misalnya, kanji dengan karakter latin atau hanzi dengan karakter latin, atau hangul korea dengan karakter latin. Dalam banyak kasus, ini karena seseorang memiliki "nama Barat" untuk menyenangkan mereka yang tidak bisa mengucapkan namanya dalam bahasa aslinya.
11. Semua nama sesuai dengan poin kode Unicode.Pengembang Unicode terus menambahkan poin kode untuk karakter yang semakin langka ke standar. Sebagian besar nama sudah sesuai dengan mereka, tetapi masih ada pengecualian, seperti simbol
"artis, yang sebelumnya dikenal sebagai Prince .
" Bahkan jika kita mengecualikan keanehan seperti itu, beberapa skrip belum memasukkan Unicode. Mungkin contoh yang paling realistis adalah Aymara, bahasa tertulis untuk bahasa yang digunakan oleh lebih dari satu juta orang di Amerika Selatan. Contoh yang kurang realistis adalah bahasa atau simbol Klingon yang ditemukan oleh Tolkien untuk Middle-earth. Selain itu, Unicode hanya menyertakan sebagian karakter Cina dan Jepang, dan beberapa karakter yang hilang digunakan dalam nama.
Untuk memperumit masalah lebih jauh, dalam beberapa bahasa tidak ada simbol tertulis - mereka tidak dapat ditulis. Dan untuk bahasa seperti itu, tidak ada poin kode di Unicode. Nama-nama dalam bahasa-bahasa ini dapat dieja secara fonetis, tetapi ini tidak terlalu berguna karena kebanyakan orang tidak terbiasa dengan alfabet fonetik.
12. Nama sensitif terhadap huruf besar-kecil.Banyak set karakter tidak peka huruf besar-kecil: misalnya, Cina dan Jepang. Bagi mereka, gagasan huruf besar dan kecil sama sekali tidak berlaku.
13. Nama tidak membedakan huruf besar kecil.Beberapa skrip peka huruf besar-kecil: misalnya, Latin. Lebih penting lagi, dalam beberapa bahasa, karakter dapat ditulis dalam huruf kecil, tetapi tidak dalam huruf besar, sehingga tidak mungkin untuk menerjemahkannya dari satu kasus ke yang lain.
Daftar yang benar bisa sangat penting bagi sebagian orang, seperti yang namanya Mackenzie dan Mackenzie.
Selain itu, daftar yang benar penting untuk nama-nama seperti Van Gogh, du Barry, da Costa, O'Brien dan D'Agostino, dan nama-nama seperti Jean-Pierre.
14. Terkadang awalan atau sufiks muncul dalam nama, tetapi Anda dapat mengabaikannya dengan aman.Tidak ada yang bisa lebih jauh dari kebenaran. Nama Belanda Peter van der Meer tidak sama dengan Peter Meer, meskipun "van der" adalah awalan.
Anda dapat mempertimbangkan sufiks "muda" dalam nama Robert Downey Jr., tetapi jika Anda mengabaikannya, Anda akan menamai ayahnya, bukan ayahnya.
Dalam nama Arab, sufiks al-Din berarti "iman" atau "agama" - nama-nama seperti Taj al-Din ("mahkota iman") atau Saif al-Din ("pedang agama") tidak akan tetap sama jika sufiks digunakan. Nama Italia Di Stefano tidak sama dengan Stefano.
Seorang wanita Spanyol dengan nama keluarga "Viuda de la Cruz" adalah janda seorang pria dengan patronim de la Cruz. Tidak adanya awalan mengubah nilai nama.
15. Nama tidak mengandung angka.Bahkan jika dinasti (misalnya, Thurston Howell III) diabaikan, dalam beberapa kasus nomor tersebut menjadi bagian dari nama resmi seseorang. Misalnya,
Jennifer 8 Lee memilih nama tengah 8, karena 8 dikaitkan dengan keberuntungan.
16. Nama tidak dapat ditulis dalam huruf MODAL PENUH.Di beberapa negara (terutama yang berbahasa Prancis), adalah kebiasaan untuk menulis nama keluarga seseorang dengan huruf kapital sehingga jelas bagian mana yang merupakan nama keluarga. Konvensi ini telah mengakar sedemikian rupa sehingga menulis nama keluarga dengan huruf kecil dapat dianggap tidak sopan.
17. Nama tidak dapat ditulis dalam huruf kecil utuh.Penyair
e. e. Cummings lebih suka namanya ditulis dalam huruf kecil. Seperti penyanyi
kd lang . Sopan untuk mengikuti ejaan yang disukai oleh pemilik nama.
Ada nama keluarga Irlandia / Inggris, yang secara tradisional ditulis dalam huruf kecil, meskipun tradisi ini menderita perangkat lunak yang buruk yang memaksa Anda untuk menentukan huruf besar pertama.
18. Nama punya pesanan. Memilih salah satu skema pemesanan rekaman akan secara otomatis mengarah ke urutan konstan di antara semua sistem jika mereka semua menggunakan skema pemesanan yang sama.Di Belanda, nama Vincent van Gogh diindeks dan diurutkan dengan huruf G sebagai Gog; di Belgia, nama yang sama diindeks oleh B untuk Van Gogh. Tidak mungkin untuk mengadopsi sistem nama yang disatukan yang akan mengarah pada pesanan yang diterima secara umum. Di banyak perpustakaan, sistem ini didasarkan pada tempat kelahiran orang tersebut (saya tidak ingin aturan ini diterapkan dalam perangkat lunak).
19. Nama dan nama keluarga tentu berbeda.Benjamin, seorang pengusaha dan politisi Australia, meninggal pada tahun 1905. Jerome K. Jerome adalah seorang penulis bahasa Inggris yang dikenal karena karyanya "Tiga di atas kapal, tidak termasuk seekor anjing." Owen Owen adalah seorang Welshman yang mendirikan Owen Owen Ltd, sebuah rantai department store. Dan kita bahkan tidak akan menyentuh atlet dan aktor yang mengadopsi nama samaran seperti itu.
20. Orang memiliki nama keluarga atau sesuatu yang mirip dengan kerabat.Di Jawa, orang biasa hanya memberi nama tanpa nama keluarga. Misalnya, Presiden Indonesia Soeharto dan Sukarno tidak memiliki nama keluarga.
21. Nama seseorang itu unik.Ceritakan kepada siapa pun yang bernama John Smith! Saya memiliki nama yang sedikit kurang umum, tetapi saya menemukan seseorang dengan nama dan nama yang sama yang bekerja di industri yang sama di negara yang sama (Australia).
22. Nama seseorang hampir unik.Bahkan dengan ejaan non-standar, biasanya mudah menemukan orang dengan nama lengkap yang sama: coba google milik Anda sendiri.
23. Baiklah, baiklah, tetapi nama cukup langka, jadi tidak ada satu juta orang dengan nama dan nama keluarga yang sama.Nama China, Zhang Wei, dilaporkan dibawa oleh lebih dari seperempat juta orang.
Jika kita membatasi diri pada nama keluarga, maka sekitar 20% populasi Korea Selatan memiliki nama keluarga Kim. Sekitar 10% populasi Cina Utara menyandang nama keluarga Wang, dan lebih dari 10% populasi Cina Selatan menyandang nama keluarga Chen. Di tempat kedua, baik di sana maupun di sana ada nama keluarga Lee, yang membuatnya menjadi yang paling populer di negara ini. Dan sekitar 40% orang Vietnam memiliki nama keluarga Nguyen.
Nama-nama juga jauh dari unik.
24. Sistem saya tidak akan pernah berurusan dengan nama-nama dari China.Migrasi memperluas nama masing-masing budaya ke (hampir) setiap negara. Hari-hari hampir berlalu ketika para imigran diberi nama baru saat memasuki negara itu (meskipun, misalnya, Vietnam masih mengharuskan pemohon kewarganegaraan menerima nama Vietnam). Adalah tidak realistis untuk mengharapkan tidak adanya nama-nama dari negara lain, walaupun Anda dapat melihatnya dalam bentuk transliterasi.
Jadi, nama Cina seperti
ε¨ζ½€ηΌ dalam sistem Anda dapat muncul sebagai Chow Yun Fat, atau Chow Yun Fat, atau bahkan Yun Fat Chow (Chow adalah nama keluarga).
25. Atau Jepang.lihat di atas.
26. Atau Korea.lihat di atas.
27. Atau Irlandia, Inggris, Amerika Serikat, Spanyol, Meksiko, Brasil, Peru, Swedia, Botswana, Afrika Selatan, Trinidad, Haiti, Prancis, Kekaisaran Klingon - semuanya menggunakan skema nama "aneh".lihat di atas.
28. Kekaisaran Klingon adalah lelucon, bukan?Sulit menemukan contoh orang yang secara resmi menggunakan nama Klingon, tetapi mengapa tidak? Jika kami menerapkan sistem dengan dukungan untuk budaya lain (misalnya, tanda kutip bawaan untuk O'Brien), kami juga dapat mendukung nama Klingon tanpa pekerjaan tambahan.
29. Persetan dengan relativisme budaya! Orang-orang di masyarakat saya , setidaknya, memiliki gagasan yang sama tentang standar yang diterima secara universal untuk nama.Dan perangkat lunak Anda hanya akan berfungsi dengan orang yang telah menerima nama di komunitas Anda?
30. Ada algoritma yang mengubah nama menjadi satu dan sisi lain tanpa kehilangan. (Ya, ya, Anda dapat melakukan ini jika algoritma output mengembalikan sama dengan input, ambil medali untuk diri Anda sendiri).Tidak ada algoritma (selain mengingat format asli) yang mengubah nama dengan cara yang dapat dijamin.
31. Saya yakin dapat berasumsi bahwa kamus kata-kata cabul ini tidak mengandung nama keluarga.Ini adalah kesalahan umum: banyak "kata-kata buruk" tidak buruk dalam bahasa lain, dan beberapa digunakan dalam nama. Selain itu, tidak setiap masyarakat membatasi kata-kata apa yang dapat digunakan dalam nama: ada kemungkinan bahwa nama seseorang ditugaskan di yurisdiksi tersebut.
32. Nama diberikan kepada orang-orang saat lahir.Kelahiran terdaftar di sebagian besar negara, tetapi efektivitas sistem ini tidak sama.
Aturan yang tepat bervariasi berdasarkan yurisdiksi, tetapi selalu ada penundaan dalam pendaftaran kelahiran. Penundaan yang diizinkan bervariasi dari tiga minggu (Skotlandia) hingga dua bulan (Australia), tetapi ada lebih banyak.
Nama bayi dapat dicatat pada saat pencatatan kelahiran, tetapi ini tidak selalu terjadi (di beberapa tempat, anak-anak masih terdaftar dengan nama-nama seperti Bayi Laki-laki atau Bayi Perempuan, ketika orang tua memiliki masalah dalam memilih nama atau jika anak tersebut sedang dirongrong, misalnya).
33. Oke, mungkin tidak saat lahir, tetapi segera setelah itu.34. Oke, oke, selama satu tahun atau lebih.35. Lima tahun?36. Anda bercanda, bukan?Ada budaya di mana nama orang dewasa tidak diberikan kepada seseorang sebelum masa pubertas. Sebelum ini, anak mungkin memiliki "susu" atau nama sementara.
37. Dua sistem berbeda di mana nama orang yang sama ditunjukkan akan menggunakan nama yang sama untuknya.Jika demikian, maka tidak akan ada pasar perangkat lunak untuk merekonsiliasi berbagai database.
Dalam kasus pribadi saya, beberapa sistem berisi nama resmi saya, termasuk nama tengah saya, dan yang lain hanya nama depan dan belakang saya atau disingkat nama depan dan belakang. Dan ini masih merupakan kasus sederhana. Istri saya ditunjukkan dalam beberapa sistem dengan nama gadisnya, dan yang lain - dengan nama belakang suaminya, dengan atau tanpa nama lengkap, dengan atau tanpa nama tengah, dan dengan salah satu dari dua ejaan dari nama pendeknya.
38. Dua operator entri data yang berbeda, jika diberi nama seseorang, harus memasukkan karakter yang sama jika sistem dirancang dengan baik.Bayangkan apa yang terjadi ketika seseorang memasukkan nama yang dia dengar di telepon. Misalnya, Thomson dan Thompson; atau Johnson, Johnston, Johnstone dan Johnsson.
39. Orang-orang yang namanya melanggar sistem saya adalah orang asing yang aneh. Mereka harus memiliki nama yang normal dan dapat diterima, seperti η°δΈ ε€ͺι.Tidak, sistem Anda dirancang dengan buruk.
Secara khusus, nama tersebut sering ditemukan sebagai nama orang asing di anime (dan manga). Ada orang sungguhan dengan nama itu.
40. Orang-orang punya nama.Untuk kasus ini, mungkin yang paling sulit adalah memberikan contoh yang meyakinkan. Ada budaya yang terisolasi di mana tidak ada yang punya nama: mereka memanggil satu sama lain istilah relatif, seperti "kakak perempuan ibuku".
Untuk meringkas
Jadi, kami melakukannya: kami menemukan contoh (hampir) untuk semua empat puluh poin dari artikel oleh Patrick Mackenzie
"Kesalahpahaman programmer tentang nama .
" Jika Anda merasakan informasi yang meluap-luap tertentu, maka mari kita rangkum. Inilah hal terpenting ketika mengembangkan sistem yang memproses nama:
- Jangan menggunakan istilah seperti "nama depan" atau "nama Kristen": cukup "nama yang diberikan" adalah istilah yang paling umum.
- Ingatlah bahwa separuh dunia lebih dulu menunjukkan nama keluarga.
- Banyak budaya menggunakan sistem yang berbeda dari satu nama umum untuk semua anggota keluarga. Beberapa menggunakan patronym atau matronym (kadang-kadang bukan satu); dan yang lainnya tidak memiliki nama belakang sama sekali.
- Tanda baca bisa menjadi bagian penting dari sebuah nama: Nama Irlandia O'Hara tidak cocok dengan nama keluarga Jepang Ohara. Nama Jean-Pierre tidak cocok dengan nama Jean-Pierre atau nama Jean Pierre, dan Jean-Pierre adalah nama yang sama, dan Jean Pierre adalah dua nama yang terpisah.
- Spasi tidak harus memisahkan bagian nama dan nama keluarga: de la Cruz - satu nama keluarga, bukan tiga yang terpisah; Nama Cina Hanzi dieja tanpa spasi antara nama depan dan belakang.
- Penggunaan huruf kapital tidak begitu jelas: nama keluarga van der Meer dapat dikapitalisasi saat digunakan tanpa nama, tetapi dengan huruf kecil setelah nama.
- Gunakan seluruh nama, jangan dipecah-pecah. Misalnya, jangan mencoba menyebut seseorang sebagai "Tuan Kata Belakang-Nama": di sini kesalahan mungkin terjadi dalam beberapa kasus:
- Jika nama belakang ditulis sebelum nama depan (misalnya, bahasa Cina).
- Jika Anda menggunakan patronim dengan benar, tetapi itu bukan yang terakhir.
- Jika nama keluarga terdiri dari lebih dari satu kata, misalnya, nama keluarga Spanyol de la Torre
- Jika nama mengandung akhiran, misalnya, "minor".
Akhirnya, saya sangat menyarankan Anda membaca panduan nama kecil di
artikel W3C .