Hadirin sekalian, rencananya adalah ini:- semua yang ingin Anda ketahui tentang tulisan Jepang, tetapi takut untuk bertanya
- Apa itu teks ruby
- cara menulis addons untuk libreoffice dengan python
- cara menghasilkan bacaan untuk kanzi
- Menyatukan semuanya dalam furiganizer!
Bahasa Jepang modern terutama menggunakan tiga sistem penulisan.Pertama, ini adalah dua huruf suku kata: hiragana dan katakana. Hiragana lebih bulat, terlihat seperti ini: γ γ γ― γ² γ γ γͺ γ§ γ dan, seolah-olah, alfabet utama.γ Katakana lebih sudut (γ« γΏ γ γ γΉ) dan digunakan terutama untuk kata-kata pinjam, secara umum, himpunan tanda-tanda hiragana dan katakana hampir mirip. Selanjutnya kita akan menyebutnya semua hanya "kana". "Alfabet suku kata" berarti bahwa alih-alih vokal dan konsonan kita "a", "b" dan "c" - hanya seluruh suku kata seperti "ka", "sa" dan "itu". Namun, ada juga vokal, lima potong ("a", "dan", "y", "e", "o" + "i", "u" dan "e") dan hanya satu konsonan "n" di pesanan pengecualian.Itulah mengapa sangat sulit bagi orang Jepang untuk mengucapkan kata-kata dengan konsonan berturut-turut - mereka tidak terbiasa dengan itu, tetapi ini tidak penting bagi kita sekarang. Dengan satu cana, pada prinsipnya, Anda dapat menulis frase apa pun dalam bahasa Jepang.Sistem lain adalah karakter-karakter yang dipinjam dari Tiongkok, yang akan terus kita sebut kanji , lalu apa sebutannya. Setelah meminjam, Jepang, ya sobsno dan Cina juga, kanji telah berubah secara signifikan, dan sekarang mereka sangat berbeda, walaupun tentu saja, di sisi lain, mereka sebagian besar mirip. Anggap saja melihat teks Cina, orang Jepang bisa kurang lebih mengerti apa yang mereka bicarakan. Kanji terlihat seperti ini: ε ι γ ζ₯ζ¬ ι
γ δΈηγ Ya, dalam bahasa Jepang itu adalah titik bulat.Inilah poin kunci untuk memahami: Jepang dan Cina pada tingkat tata bahasa pada umumnya tidak berhubungan sama sekali. Jadi seperti itu, tidak mungkin untuk mengambil karakter Cina dan mulai menulisnya. Sebenarnya, dengan bantuan kanji, Anda dapat menulis kata-kata individual, bahkan dasar-dasar kata, dan kana masih digunakan untuk menunjukkan bentuk tata bahasa dan hubungan kata-kata di antara mereka sendiri. Itu terlihat seperti ini: ι γ γ γͺ γ― γ¨ γ£ γ¦ γ δΎΏε© γ§ γ. Jika Anda melihat lebih dekat, Anda dapat melihat bahwa karakter pertama adalah kanji, diikuti oleh beberapa tanda kana, dll. Trik ini membuatnya mudah untuk membedakan secara visual antara teks Jepang dan Cina, yang terlihat secara grafis lebih "padat" karena hanya ada kanji. Kana ini, yang melekat pada kanji untuk menunjukkan bentuk tata bahasa, disebut "okurigan."Di sini, dan akhirnya ... Jumlah kanji cukup besar, dan jika Anda bukan robot, maka mengingat semuanya itu sulit. Jika kata tersebut ditulis oleh kanji, maka seringkali tidak jelas bagaimana cara membacanya secara langsung, meskipun dalam bahasa lisan kata tersebut dapat ditemukan dan orang tersebut mengetahuinya. Untuk membantu dalam situasi ini, terutama untuk kanji langka atau ketika teks ditujukan untuk anak-anak, orang asing, atau kategori warga negara yang secara mental terbatas - membaca kanji ditandatangani dari atas dengan kana. Ini disebut " furigana ". Sepertinya pada gambar di awal posting.Fuh, lanjutkan ke item berikutnya.Untuk menambahkan anotasi pada teks, ruby ββyang disebut digunakan. Itu tidak ada hubungannya dengan bahasa pemrograman. Seperti yang baru saya pelajari dari Wikipedia, dalam bahasa Rusia disebut "agate"Dukungan Ruby tersedia dalam html menggunakan tag ruby:<ruby>
<rt></rt>
</ruby>
Tapi sekarang kami tertarik pada LibreOffice. Dalam mode manual, Anda dapat menambahkan anotasi ruby ββke teks melalui menu Format -> Asian Phonetic Guide. Ini agak aneh, karena Anda dapat menggunakan bidang gosok tidak hanya untuk fonetik, tetapi juga ara. Jika ini tidak ada dalam menu, maka Anda dapat mencoba menambahkan dukungan untuk bahasa Asia di Alat -> Opsi -> Pengaturan Bahasa.Selanjutnya, kami ingin melakukan ini secara otomatis untuk teks yang dipilih. LibreOffice luar biasa karena Anda dapat menulis makro dengan Python di dalamnya. Untuk melakukan ini, modul libreoffice-script-provider-python harus diinstal (diinstal melalui apt-get), yang tidak sebanding dengan standarnya. Oh ya, saya melakukan semuanya di Ubuntu, jika Anda memiliki sistem operasi yang berbeda, maka Anda dapat membagikan resepnya di komentar :)Makro itu sendiri ditulis sebagai fungsi reguler pada Python. Dokumen ini terlihat melalui variabel global dengan turunan dari kelas yang sesuai dan, pada kenyataannya, di dalamnya semua metode yang diperlukan.Ini adalah contoh sederhana:def HelloWorldPython():
desktop = XSCRIPTCONTEXT.getDesktop()
model = desktop.getCurrentComponent()
if not hasattr(model, "Text"):
model = desktop.loadComponentFromURL("private:factory/swriter","_blank", 0, () )
text = model.Text
tRange = text.End
tRange.String = "Hello World (in Python)"
return None
g_exportedScripts = HelloWorldPython,
Kami menyimpan ke file, meletakkannya, atau membuat tautan simbolis di folder tempat LibreOffice menyimpan skrip. Dalam kasus saya ini adalah "~ / .config / libreoffice / 4 / user / Scripts / python".Buka LibreOffice Writer (OpenOffice juga bisa berfungsi), buka Tools -> Macro -> Run Macro dan lihat skrip kami di sana, jika semuanya berhasil.Masih menulis skrip yang akan mengambil kanji dari dokumen dan menambahkan bacaan mereka dalam rubel karakter yang sesuai. Semuanya sederhana: ada program khusus untuk membaca generasi, kami hanya menjalankannya dari skrip makro kami, melalui input-output standar, menjalankan teks Jepang dan memasukkan output ke dalam dokumen.Sebuah program yang disebut kakasi mengambil teks bahasa Jepang dan memberikan seluruh bacaan, tetapi ini bukan apa yang Anda butuhkan, karena Saya ingin mendistribusikan fragmen petunjuk fonetik antara bidang ruby ββdari karakter yang sesuai. Untuk melakukan ini, menggunakan mecab, Anda dapat tokenize teks Jepang, dan karena itu sudah memberi makan kakasi di beberapa bagian. Bahkan, akurasi generasi membaca dari ini sedikit memburuk, tetapi tata letak dokumen membaik. Beberapa kekurangan kemudian dapat diperbaiki secara manual.Itu sobsno dan hanya itu, pasang apt-get install kakasi, mecab,buka github.com/undertherain/furiganize , unduh skrip canggung yang saya tulis dari sana dan isakan mana yang melakukan semuanya. Taruh di folder yang diinginkan dan nikmati. Jika seseorang berbagi pengalaman mereka dengan sistem operasi lain - umumnya akan luar biasa.