Ilmu Data di CodeFest: Flavour of the Revolution

gambar

Diri, dalam pendekatan pertama, adalah paralel. Automatisme benar-benar menciptakan egosentrisme. Ide-ide hedonisme adalah pusat utilitarianisme Mill dan Bentham, tetapi keraguan mengubah konflik fenomenologis. Kode mulai memahami gender.

Sponsor bergabung dengan Yandex. Essays.

Ilmu Data dan Pembelajaran Mesin telah lama menembus kehidupan kami dan CodeFest, tetapi untuk pertama kalinya kami memilihnya di bagian terpisah . Karena ada lebih banyak bagian ke dewa bagian!

Lantai diberikan kepada kurator bagian bond005 . Ngomong-ngomong, dia akan senang dengan lois dan hadiah karma Anda.

Apa yang akan terjadi di bagian Ilmu Data?

Sebelum menulis tentang ini, saya akan membuat penyimpangan filosofis kecil (sangat kecil!).

Kita manusia adalah makhluk sosial, dan kita tidak bisa hidup tanpa komunikasi: di ruang rapat kantor di tempat kerja atau dengan segelas bir di bar yang nyaman. Tetapi tidak semua komunikasi “sama-sama bermanfaat.” Ada profesi - misalnya, operator call center - di mana berkomunikasi dengan orang-orang yang berbeda, kadang-kadang tidak terlalu menyenangkan, membuat seluruh titik kerja dan berlangsung dari hari ke hari, minggu ke minggu. Kemudian komunikasi berubah menjadi pekerjaan yang sulit, melelahkan secara psikologis yang tidak dapat difasilitasi atau otomatis. Atau mungkin?

Tampaknya dalam kasus ini, algoritma tidak hanya perlu mengenali kucing dalam gambar dari ImageNet, tetapi untuk memahami (mendengar atau membaca) apa yang diinginkan lawan bicara, cukup menanggapi, "sia-sia", jika perlu, bertanya atau mengklarifikasi sesuatu. Tugas yang menantang!

Tidak mudah, tetapi dipecahkan dengan metode modern kecerdasan buatan. Dan karena itu, bukan kebetulan bahwa mayoritas pidato pembicara kami di bagian ini akan dikhususkan untuk metode dan teknologi untuk menyelesaikan masalah ini.

gambar Akankah jaringan saraf membantu kita dengan ini atau tidak? Dan apakah itu, arsitektur jaringan saraf modern untuk teks dan komunikasi? Bisakah IT-shnik sederhana mengatasinya? “ Jaringan saraf dalam pengolah kata: hype atau serius dan untuk waktu yang lama? ”- seorang spesialis linguistik komputer, pendiri proyek rusvectores.org, dan seorang peneliti di Universitas Oslo, Andrey Kutuzov, akan memberi tahu kami tentang hal ini.


gambar Tetapi bagaimana jika kita ingin mengajarkan algoritma kita tidak hanya membaca tetapi juga mendengar? Bagaimana cara membuat sistem pengenalan ucapan yang baik? Dan secara umum, apa yang "baik" dalam kaitannya dengan teknologi bicara? Apa itu "di bawah tudung" dari generasi baru sistem pengenalan ucapan? Apakah klasik lama yang baik cukup bagi kita - model Markov tersembunyi, atau jaringan saraf - dan di sini adalah "segalanya untuk kita"? Jawaban untuk pertanyaan-pertanyaan ini yang menjadi perhatian banyak orang (dan saya tentu saja) akan diberikan dalam ceritanya oleh Nikolai Shmyrev , kepala AC Technologies dan salah satu kontributor utama untuk proyek pengenalan ucapan open source CMU Sphinx dan Kaldi.


gambar Ya, kami mendengar seseorang atau membaca pesannya, mengenali teksnya. Dan bagaimana cara mengekstrak dari teks hal utama yang ingin disampaikan lawan bicara kita kepada kita? Mereka telah mencoba memecahkan masalah meringkas teks (auto-abstrak) untuk waktu yang lama. Saya ingat bahwa saya pernah menggunakan salah satu sistem peringkasan untuk menyiapkan esai tentang filsafat di universitas. Dan bagaimana dengan ini sekarang? “ Meringkas teks: dari menghasilkan berita utama hingga berita hingga merangkum segalanya dan segalanya ” - ini akan didedikasikan untuk presentasi Daniil Gavrilov, seorang pengembang dan spesialis pembelajaran mesin dari tim VKontakte.


gambar Akhirnya, robot menyadari apa yang diinginkan seorang pria darinya. Sekarang dia harus menjawab dengan memadai! Mungkin bahkan tidak prosa, tetapi puisi! Cara mengembangkan algoritme yang dapat menulis teks, memahami topik apa yang perlu Anda tulis secara mandiri, dan pada saat yang sama meniru gaya yang tepat - penting untuk tidak hanya berpartisipasi dalam kontes puisi, tetapi juga untuk membuat bot obrolan berpendidikan dan budaya yang berkomunikasi dengan pelanggan di perbankan call center misalnya. Anya Mosolova dari Novosibirsk State University dalam cerita pendeknya " Meniru seorang penyair, atau bagaimana Pushkin akan menulis dalam dua ratus tahun " akan memperkenalkan kita pada "isian" algoritmik sebuah generator teks dalam bahasa Rusia yang bisa masuk akal dan berima!


gambar Semua topik ini, yang akan diungkapkan oleh pembicara kami yang luar biasa, sangat penting baik untuk mereka sendiri maupun untuk pembuatan bot obrolan modern. Pada prinsipnya, setelah mendengarkan cerita mereka dan berbicara dengan mereka di zona pakar, Anda sudah dapat membuat (atau mencoba membuat) chatbot Anda sendiri dengan kecerdasan buatan yang dapat menjaga percakapan bahkan tentang varietas pizza, setidaknya bunga pinjaman bank.

Tetapi saya tidak ingin merancang dan memprogram semuanya sendiri, bahkan jika menggunakan perpustakaan perangkat lunak yang ada (yang, omong-omong, Anda juga akan mendengar tentangnya dalam cerita, karena open source itu suci)! Mungkin ada beberapa solusi siap pakai atau templat solusi untuk bot obrolan secara keseluruhan, dan bukan hanya untuk komponennya saja? Dalam laporan Vladislav Lyalin , pengembang laboratorium sistem saraf dan pelatihan mendalam di MIPT, Anda akan mendengar "ya" yang menentukan sebagai jawaban untuk pertanyaan ini. Vladislav akan memperkenalkan Anda ke proyek kecerdasan buatan percakapan iPavlov dan perpustakaan python DeepPavlov, yang, pada kenyataannya, merupakan platform terbuka untuk membangun berbagai sistem dialog: bot obrolan bertarget, bot tanya-jawab, bot obrolan tanya-jawab, dll.


gambar Dan akhirnya, Ilmu Data bukan satu-satunya AI percakapan yang hidup! Tentang visi komputer juga harus diingat. Ini tentang ini - tentang visi spasial dan penentuan otomatis lokasi objek di dunia tiga dimensi - akan ada cerita oleh Alexei Grishchenko , insinyur dari perusahaan Novosibirsk Motiv. Alexei dan rekan-rekannya baru-baru ini memenangkan kontes visi komputer di mana perlu untuk membuat dan melatih jaringan saraf yang tahu persis seluruh proses perakitan turbocharger KamAZ dan mampu mengendalikan pekerja di jalur perakitan sehingga mereka tidak akan gagal. Tetapi setelah kemenangan tidak ada yang berpuas diri, dan perbaikan sistem berlanjut! Ingin tahu caranya? Datanglah ke kinerja Alexey!


gambar Dan juga Anda perlu mengingat tentang dasar-dasar - teknologi pembelajaran mesin! Terlepas dari apa yang dipecahkan jaringan saraf - menganalisis teks atau memilih objek dalam gambar, jaringan saraf ini perlu dilatih. Semakin besar jumlah data pelatihan, semakin baik dan "pintar" jaringan saraf ini akan menjadi, tetapi belajar dengan data besar menjadi sangat sulit dalam arti teknologi. Leonid Kuligin, pengembang dan spesialis pembelajaran mesin dari Google Cloud di Munich, akan berbicara tentang bagaimana memecahkan masalah big data dalam pelatihan jaringan saraf modern , bagaimana pembelajaran terdistribusi bekerja dengan perpustakaan jaringan saraf terkenal TensorFlow, bagaimana pemrosesan data diatur dan alat apa yang tersedia untuk pelatihan profiling .

Strategi penetapan harga mengembalikan prinsip persepsi konsumen, mengoptimalkan anggaran. Spot action memantau jajaran produk secara seragam. Dengan kata lain, teman-teman, pertama, sejak 4 Maret, harganya telah meningkat, dan kedua, mereka mengangkat siaran online .

Komunikasi sangat berharga, dan bahkan AI yang diucapkan akan setuju!

Diperlukan pendaftaran . Partisipasi juga. Ayo, itu akan luar biasa!

Source: https://habr.com/ru/post/id441072/


All Articles