Dmitry Muromtsev (ITMO) - tentang pemodelan ontologis dan pembentukan kecerdasan percakapan

Dmitry Muromtsev, kepala laboratorium internasional "Metode Pemrosesan Informasi Cerdas dan Teknologi Semantik" ITMO dan kepala departemen IPM , berbicara tentang esensi pemodelan ontologis, penggunaan grafik pengetahuan dalam proses bisnis dan pekerjaan menciptakan kecerdasan percakapan.



Pewawancara: Anna Angelova (A.A.)
Termohon: Dmitry Muromtsev (D.M.)

AA: Apa esensi pemodelan ontologis dan bagaimana kompilasi grafik pengetahuan berlangsung?

DM: Pemodelan ontologis adalah kompilasi model informasi dalam bentuk deskripsi konseptual bidang studi yang memenuhi standar tertentu. Ada bahasa khusus untuk ontologi, mereka terstandarisasi dan sudah digunakan dalam industri ini. Tujuan utama ontologi adalah untuk mendeskripsikan skema data dan pengetahuan yang dapat ada di berbagai sumber. Masalahnya adalah bahwa ada banyak sumber-sumber ini, mereka sangat berbeda dalam jenis penyimpanan data, dalam arsitektur perangkat lunak, dll. Untuk menghubungkan mereka ke dalam ruang informasi tunggal, diperlukan mekanisme integrasi khusus - mereka justru ontologi. Mereka digunakan ketika mengintegrasikan basis data, menggambarkan data yang terstruktur dengan buruk di Internet, ketika membuat basis pengetahuan pada topik tertentu atau non-tematik, basis pengetahuan besar - misalnya, berdasarkan informasi Wikipedia.

Proses pembuatan itu sendiri menyiratkan partisipasi dari para ahli domain: para ahli selalu terlibat dalam masalah-masalah yang datanya akan disajikan dalam kolom pengetahuan. Misalnya, ini mungkin masalah yang berkaitan dengan warisan budaya, kedokteran, pendidikan, atau produksi apa pun.

Para ahli ini mengidentifikasi konsep-konsep kunci - objek yang sangat penting untuk area subjek tertentu. Misalnya, warisan budaya adalah benda seni, pencipta benda-benda ini, proses kreatif, proses restorasi atau semacam modifikasi (jika itu adalah objek arsitektur, itu dapat dibangun kembali), ini adalah masalah memamerkan, menyimpan, dll. Segala sesuatu yang penting untuk deskripsi lengkap tentang subjek area yang dirumuskan oleh seorang ahli. Selanjutnya menunjukkan hubungan, hubungan antara benda-benda ini. Deskripsi yang diformalkan ini selanjutnya memungkinkan untuk mengajukan pertanyaan ke grafik pengetahuan.

Secara teknologi, prosedur transformasi bisa sangat kompleks dan mencakup banyak alat: alat pemrosesan bahasa alami, pembelajaran mesin, pengenalan pola dan sejumlah alat lainnya. Pada akhirnya, kita mendapatkan jaringan atau grafik dari objek yang saling berhubungan. Fitur utama dari sistem seperti itu, tidak seperti database, adalah bahwa jaringan ini bersifat deskriptif sendiri, mendokumentasikan diri sendiri. Tidak perlu penjelasan tambahan dari pengembang .

AA: Apa ruang lingkup grafik pengetahuan?

D. M.: Hampir ada. Sekarang ada grafik pengetahuan tentang konten universal (yang paling terkenal adalah Google), ada Wikidata, Dbpedia, yang lebih mengingatkan pada Wikipedia dalam hal cakupan. Ada grafik pengetahuan khusus: tentang obat-obatan, tentang warisan budaya, menurut data negara terbuka. Ada kolom pengetahuan perusahaan - mereka berada di domain publik.

AA: Ceritakan tentang proyek untuk DataFabric. Apa yang mereka butuhkan dan hasil apa yang dicapai?

DM: Mari kita ajukan pertanyaan sedikit lebih luas. Proyek untuk DataFabric adalah salah satu contoh, kami memiliki beberapa di antaranya. Kami memulai aktivitas kami sekitar 8 tahun yang lalu. Kami menghabiskan sebagian besar waktu untuk mempopulerkan teknologi semantik, pada berbagai acara ilmiah dan pendidikan , hackathon, dll. Kami secara rutin bertemu dengan perwakilan industri. Lusinan pertemuan semacam itu berlangsung setiap tahun, dan beberapa perwakilan industri tertarik.

Dalam situasi dengan DataFabric, terutama spesialis mereka bekerja, yang kami konsultasikan dalam hal metodologi dan merekomendasikan teknologi dan alat tertentu. Kami juga memeriksa hasilnya - sebuah analisis tentang bagaimana semuanya dilakukan dengan benar. Proyek perusahaan ini sendiri menarik karena merupakan contoh pertama di Rusia ketika bisnis telah menginvestasikan dananya sendiri dalam pengembangan grafik pengetahuan, dalam pengembangan teknologi data terkait dan telah berhasil membuktikan bahwa itu bisa menguntungkan. Sejauh yang saya tahu, perusahaan terus menggunakan grafik pengetahuan yang dibuat dan rencana untuk mengembangkannya. Dari pidato perwakilannya, kita dapat menyimpulkan bahwa berkat grafik pengetahuan mereka mampu mengotomatisasi sejumlah besar pekerjaan manual. Tetapi untuk informasi yang lebih akurat, lebih baik untuk menghubungi perusahaan secara langsung.

Sergey Isaev,
CEO DataFabric

Kami ingin membuat sistem verifikasi rekanan pintar dan mengumpulkan informasi perusahaan. Kami adalah perusahaan yang sangat kecil dan ingin mendapatkan keunggulan kompetitif. Pesaing kami - Spark Interfax, Kontur.Fokus - sangat besar, kuat, telah berada di pasar selama bertahun-tahun, dan begitu saja, "langsung", tidak mungkin untuk bersaing dengan mereka.

Kami mengumpulkan semua informasi yang sama tentang perusahaan sebagai pesaing kami: data dari Layanan Pajak Federal, Rosstat dan sumber lainnya. Kami memuatnya ke dalam satu basis data. Karena kita memiliki grafik, koneksi antara semua objek muncul di dalamnya. Sistem ini menggunakan pemodelan ontologis: kami menggambarkan nilai mutlak dari semua data yang digunakannya. Oleh karena itu, dia mulai memahami konteks, beban semantik dari data tertentu. Berkat ini, dia bahkan dapat ditanyai pertanyaan terbuka, misalnya: "Tunjukkan semua perusahaan yang kemungkinan bangkrut tahun depan." Karena dia mengerti arti dari setiap kata dalam hal ini, dia akan memberikan daftar.

Saya tidak tahu berapa banyak pesaing menghabiskan waktu, uang, dan energi untuk menyelesaikan masalah mereka. Tapi saya tahu mereka memiliki ratusan pengembang, dan kami hanya memiliki 12 orang, dan kami membuat sistem kami dalam satu setengah tahun. Sekarang Anda dapat dengan cepat membuat prototipe kasus baru, layanan baru, karena lebih cerdas dan fleksibel.

AA: Ada banyak mitra di lokasi laboratorium yang Anda pimpin. Siapa di antara mereka yang berkolaborasi dalam proyek yang sedang berjalan?

DM: Jika kita bekerja sama dalam arti luas, maka Dewan Data Terbuka Federasi Rusia akan menjadi yang utama berdasarkan jumlah waktu yang dialokasikan. Kami mencoba untuk melakukan pekerjaan metodologis dan penelitian di sana, yang bertujuan untuk mempromosikan grafik pengetahuan kepada otoritas federal dan struktur lain yang diperlukan untuk mempublikasikan data terbuka. Sekarang persyaratan hukum untuk publikasi data terbuka cukup formal dan terbatas. Kami berusaha membuktikan bahwa ini dapat dilakukan jauh lebih efisien, dan ini akan membawa manfaat yang jauh lebih besar bagi perekonomian. Kami juga aktif bekerja sama dalam teknologi pendidikan e-learning dengan struktur yang berbeda, ada proyek penelitian dengan beberapa universitas di Jerman, Finlandia, Austria.

AA: Apa kegiatan perusahaan dalam industri yang harus dimonitor?

DM: Untuk komunitas secara keseluruhan. Jelas bahwa perusahaan besar, dalam arti tertentu, merupakan indikator seberapa matang teknologi. Tetapi pada konferensi ISWC terakhir di Austria - dan ini adalah konferensi terbesar dunia tentang teknologi semantik - sebuah laporan dari Google menimbulkan banyak pertanyaan: masalah yang mereka ajukan sendiri seringkali sudah diselesaikan oleh lebih banyak perusahaan riset.

Secara karakteristik, pemain besar, sebagai aturan, tidak melakukan penelitian dari awal. Mereka menimbulkan masalah tertentu, kemudian menemukan tim yang dapat memecahkan masalah ini, dan mulai bekerja sama dengannya atau membelinya jika itu semacam startup. Artinya, pemain besar lebih cenderung memainkan peran sistemik.

Dan jika Anda mengikuti komunitas secara keseluruhan, Anda dapat melihat banyak grup riset menarik, perusahaan, startup yang menawarkan solusi paling inovatif. Misalnya, sekarang ada tren yang sangat serius dalam pengembangan bot obrolan , antarmuka suara, dan sistem lainnya, yang setelah beberapa saat akan menjadi asisten, asisten yang lengkap.

AA: Laboratorium Anda juga sedang mengembangkan proyek pemrosesan wicara. Dua di antaranya ditunjukkan di situs: satu selesai, yang lain berlanjut. Beri tahu kami tentang mereka.

[catatan: "Pengembangan morfologi komputer untuk studi kasus teks variabel", 2015-2016; "Pengembangan penganalisa sintaksis pidato spontan Rusia menggunakan metode penambangan data menggunakan basis pengetahuan semantik", 2015-2018]

DM: Proyek pertama diprakarsai oleh Pusat Teknologi Pidato - penciptaan manajer dialog cerdas. Solusi yang ada sekarang cukup primitif. Mereka dihadapkan dengan ketika klien memanggil suatu organisasi atau bank dan dia harus beralih dari satu baris ke yang lain untuk waktu yang lama. Sistem yang lebih maju dapat menganalisis teks yang diperoleh selama pengenalan - misalnya, Siri, Amazon Alexa. Tetapi konten teks ini untuk mesin tetap tidak diketahui. Di Rusia, omong-omong, proyek iPavlov baru-baru ini diluncurkan, tetapi sejauh ini hanya ada sedikit data tentang hasilnya.

Selanjutnya, begitu kita mengenali sinyal bicaranya, kita perlu memahami jenis pertanyaan apa yang dikandungnya. Masalahnya adalah bahwa ketika orang berkomunikasi, saluran percakapan interaksi hanya satu dari banyak. Secara informasi, ia bukan yang paling banyak memuat. Ada saluran komunikasi non-verbal, ada pengetahuan umum tentang dunia, konteks yang dipahami seseorang, dll. Dengan tidak adanya informasi tambahan, hampir tidak mungkin untuk memahami tentang apa itu. Jika kita mengambil transkrip dari teks-teks dan mencoba untuk memberikannya kepada seseorang, sama sekali tidak termasuk konteksnya, kemungkinan besar bahkan seseorang tidak akan dapat memahaminya. Oleh karena itu, sekarang kami mencoba membuat analisis yang secara efisien akan memproses ucapan dan mengidentifikasi objek dan hubungan di antara mereka - yaitu, membuat model informasi dari pesan yang terkandung dalam teks. Dan pekerjaan lebih lanjut direncanakan untuk memperkaya model ini dengan informasi dari sumber lain.

AA: Bisakah Anda menguraikan? Apa perbedaan antara arah penelitian dari proyek yang diselesaikan dan proyek yang saat ini sedang berlangsung?

DM: Ini adalah arah yang saling berhubungan. Tidak mungkin membuat analisis kualitatif tanpa studi kasus, karena Anda perlu mengajarkan pola algoritma pengenalan pola dalam teks. Ini kami lakukan di proyek pertama. Yang kedua mempelajari prinsip-prinsip pembentukan objek. Teks tersebut berisi deskripsi konsep-konsep tertentu. Konsep-konsep ini sendiri mungkin lebih informatif daripada informasi yang ada tentang mereka dalam teks. Karenanya, Anda perlu menghubungi basis pengetahuan dan grafik lainnya dan mencoba untuk melengkapi informasi ini dari sumber lain.

Misalkan pelanggan memanggil dukungan dan berbicara tentang masalah. Dia mungkin tidak memberi nama perangkat atau proses menggunakan sistem dengan benar. Pengguna tidak diharuskan memiliki kelengkapan informasi teknis. Ketika memahami konteksnya, sistem dapat melengkapi data pengguna dengan informasi dari sumbernya. Ini sangat menyederhanakan proses identifikasi masalah.

Proyek pertama kecil, dilakukan bekerja sama dengan Pusat Teknologi Pidato. Kami membuktikan di dalamnya bahwa penggunaan gabungan ontologi, sistem pengenalan ucapan, dan pengurai teks dapat mengarah pada pembentukan apa yang disebut kecerdasan percakapan. Kami telah menunjukkan dengan cukup sukses bagaimana ini bekerja. Tahap selanjutnya adalah penelitian yang lebih mendalam di masing-masing bidang ini. Di bidang pemodelan ontologis, kami tidak lagi bekerja dengan pidato pada umumnya, tetapi dengan informasi dari internet di bidang warisan budaya: bagaimana memodelkannya, memperkayanya, bagaimana membuat pencarian terstruktur untuk informasi ini. Di bidang parsing, pekerjaan berlanjut. Kami telah mencapai hasil yang baik pada kualitas pemrosesan teks.

Tahap selanjutnya adalah kombinasi dari area-area ini dan pembuatan sistem untuk memperkaya data dari berbagai sumber, termasuk modalitas non-teks.

AA: Pertanyaan terakhir: apa rencana laboratorium untuk bekerja pada tahun depan?

DM: Dua arah mengkristal di dalam kita: Internet hal-hal dan kecerdasan percakapan. Arah kedua akan menjadi dominan. Internet of things adalah arah yang mendukung: itu adalah penciptaan antarmuka suara dan teks (chat bots) untuk interaksi dengan berbagai perangkat, robot, sistem informasi.

Semua ini akan membuat interaksi manusia dengan objek informasi lebih transparan dan alami.

Source: https://habr.com/ru/post/id409051/


All Articles