Kami biasanya menggunakan pencarian Internet, berkomunikasi dengan bot obrolan, membaca dokumen dalam bahasa apa pun berkat para penerjemah. Beritahu robot penyedot debu untuk mulai membersihkan dengan suaranya? Tidak ada yang istimewa ... Bagi banyak orang, asisten suara pada smartphone masuk ke kehidupan sehari-hari. Masa depan, di mana komputer, setelah membaca catatan asing tentang sepak bola, mengubah nada berita cuaca yang sesuai, telah datang.
Bagaimana cara kerjanya? Bagaimana menjadi ahli dalam NLP (kependekan dari Natural Language Processing, jangan bingung dengan pemrograman neuro-linguistik :))?
Warga Khabrovsk yang mengajukan pertanyaan seperti itu, kami mengundang Anda ke kursus online Samsung Research Russia yang baru dibuka. Di bawah detail kucing ...
Penulis kursus "Neural Networks dan Text Processing"Pada bulan Juni tahun ini,
kami menulis tentang peluncuran kursus online pertama kami "
Jaringan Saraf dan Visi Komputer ." Ternyata berhasil: sudah ada lebih dari 20 ribu pendengar, ulasan bagus dan kami bahkan menerima Penghargaan Stepik pada bulan September untuk Kursus Terbaik dari Penulis Baru!

Sejak peluncuran pertama saja mengambil 5 bulan dan kami belum duduk diam! Berbekal pengalaman yang diperoleh dan diilhami oleh keberhasilan rekan-rekan, tim penulis lain - pengembang Samsung Center for Artificial Intelligence di Moskow, pakar pembelajaran mesin Roman Suvorov, Anastasia Yanina dan Alexey Silvestrov, dengan dukungan editorial yang terus-menerus dari Nikolai Kapyrin, yang menguasai jumlah pekerjaan raksasa, dan pada 15 Oktober di saluran tersebut “ Samsung Research Russia Open Education »Platform Stepik meluncurkan kursus kedua -"
Jaringan saraf dan pemrosesan kata . "
Kursus ini dirancang selama 7 minggu. Jika Anda menghabiskan rata-rata 3-5 jam setiap minggu untuk kuliah menonton video, menjawab pertanyaan, dan latihan praktis, Anda akan memahami apa yang di bawah kap mesin pencari saat ini, bot chatting dan generator teks. Tim melakukan banyak upaya untuk memastikan bahwa, setelah lulus hanya satu kursus, siswa dapat dengan percaya diri menavigasi teknologi di tingkat pengembang junior atau spesialis teknis yang tidak memiliki pengalaman khusus dalam bekerja dengan NLP, tetapi sekarang harus menghadapinya.
Jadi apa saja keunggulan khas kursus kita?
- itu dikembangkan oleh Samsung Center for Artificial Intelligence, yang memiliki di belakang mereka bagasi proyek komersial di daerah ini
- ada teori dan praktik - Anda akan melihat cara membuat jaringan saraf untuk memproses teks di PyTorch, mengimplementasikan arsitektur yang paling relevan dan belajar bagaimana menyesuaikannya dengan kebutuhan Anda
- Seperti pada tahun pertama dalam visi komputer, lulusan terbaik diundang untuk wawancara di Samsung Research Russia!
Dalam infografis di bawah ini, kami secara singkat mencerminkan konten dan karakteristik kuantitatif saat ini dari kursus baru:

Lulusan kursus menerima sertifikat. Dalam hal ini, dua opsi dimungkinkan:
- sertifikat biasa, poin yang dapat Anda nilai dengan menyelesaikan semua masalah pada bagian utama kursus;
- Sertifikat dengan perbedaan: karena ia harus menyelesaikan semua masalah pada skor tertinggi, melewati trek saja teoritis (ada tantangan sama dengan yang diajukan kepada karyawan untuk wawancara) dan memecahkan masalah dalam Kaggle final.
Guru dan pengembang kursus
Program kursus
1. PendahuluanDalam modul ini, untuk pendekatan pertama, kita belajar bahwa hari ini adalah kata alat pembelajaran mesin, yang memiliki kompleksitas dan apa tugas linguistik saat ini dapat diselesaikan hanya dengan metode pembelajaran mesin pengolahan.
- Halo semuanya! Ceritakan tentang diri Anda!
- Secara umum: bahasa dan teks alami
- Fitur pemrosesan bahasa alami
- Secara umum: Analisis Linguistik
- Secara umum: Ekstraksi fitur
- Tugas dan total pengolah kata yang diterapkan
2. Model teks vektor dan klasifikasi teks panjang
Matematika dimulai. Model vektor, token, informasi timbal balik yang jarang ... apa semua ini? Kami akan memandu metode terjemahan struktur multidimensi dan multifaset yang terkandung dalam teks - di angka untuk ML-algoritma dapat memulai pekerjaan mereka.
- Model teks vektor dan TF-IDF
- Membuat jaringan saraf untuk bekerja dengan teks
- masalah teoritis: Vector Model teks
- Workshop: klasifikasi teks berita
3. Metode jaringan saraf dasar untuk bekerja dengan teksApakah kita menggunakan jaringan saraf yang terhubung penuh? Apa operasi "konvolusi atas teks"? Tampaknya menjadi operasi untuk matriks? Jawabannya ada dalam modul ini, di mana kita akan mempelajari upaya pertama yang berhasil untuk mengajarkan jaringan saraf untuk bekerja dengan makna teks.
- Algoritma umum kata pengolahannya menggunakan jaringan saraf
- Distribusi semantik dan representasi vektor kata-kata
- Workshop: Resep Makanan dan Word2Vec di PyTorch
- Pertanyaan teoritis: Dasar-dasar pemrosesan teks oleh jaringan saraf
- Jenis utama dari model jaringan saraf untuk pengolah kata
- Jaringan saraf convolutional untuk pemrosesan kata
- Workshop: Penandaan POS dengan Neural Networks Konvolusional
- Pertanyaan teoritis: Jaringan saraf konvolusional dalam pengolah kata
4. Model bahasa dan generasi teksMenyelam lebih dalam ke jaringan saraf. Teks bisa panjang, tetapi hanya jaringan saraf berulang memungkinkan algoritma untuk menghasilkan teks tanpa trik khusus. Kami telah mencoba untuk mengajar jaringan untuk membaca, dan sekarang memberinya kesempatan untuk menulis.
- Jaringan Saraf Berulang
- Pemodelan bahasa
- Workshop: Menghasilkan Nama dan Slogan Menggunakan RNN
- Mekanisme Perhatian Agregasi
- Transformer dan perhatian diri
- bahasa pemodelan menggunakan Transformer: Seminar
- Masalah Teoritis: Model Bahasa dan Transformer
5. Konversi urutan: 1-ke-1 dan N-ke-MTetapi bagaimana jika input adalah teks, dan output membutuhkan teks? Ini adalah pekerjaan untuk penerjemah, kepada siapa, seperti kita ketahui, konteks adalah yang paling penting. Jika Anda harus menerjemahkan satu array teks ke yang lain, atau ke beberapa, maka modul ini akan memberikan semua yang Anda butuhkan!
- Mengenali struktur teks pendek yang datar
- Lokakarya: Pengakuan Resep
- Workshop: analisis aspek sentimen sebagai NER
- Konversi Urutan (seq2seq)
- Workshop: Menghasilkan Potongan Kode dengan Stack Overflow
- Pertanyaan teoritis
6. Transfer pembelajaran, adaptasi modelApakah Anda memiliki proyek hebat tetapi tidak memiliki sumber daya komputasi superhero? Kemudian ambil jaringan saraf siap pakai dan latih lebih lanjut untuk menyelesaikan masalah khusus Anda! Anda perlu tahu beberapa nama dan beberapa trik pelatihan, dan intinya ada di topi.
- Representasi kontekstual dan transfer pengetahuan
- Seminar: pytorch-transformer atau bagaimana menjalankan Bert sebuah
- Workshop: BERT untuk pencarian tanya jawab
- Pertanyaan teoritis
7. Kompetisi terakhir di Kaggle dan kesimpulanDengan menggerakkan kursor lebih dekat ke tombol "Mulai pelatihan", Anda sudah melihat bagaimana rantai multidimensi karakter semu dibuka dan perhatian mesin mengalir antar konsep? Kemudian tunjukkan diri Anda di kompetisi terakhir kami!
- Apa lagi untuk membaca, bagaimana mengembangkan
- Persaingan Kaggle: Tinjauan Masalah dan Solusi Dasar
Persyaratan siswa
Kursus ini dirancang untuk siswa yang sedikit berpengalaman dalam bidang pembelajaran mesin.
Apa yang Anda butuhkan untuk memulai kursus?
- Memiliki pengetahuan dasar tentang jaringan saraf
- Memiliki pengetahuan dasar di bidang statistik matematika
- Bersiaplah untuk memprogram dengan Python
Kita dapat mengatakan bahwa kursus "
Jaringan Saraf dan Pemrosesan Teks " adalah kelanjutan dari kursus pertama dalam visi komputer, karena ia bergantung pada tingkat pengetahuan dasar tentang jaringan saraf yang telah kami berikan.
Anda mungkin sudah tahu sesuatu tentang NLP - itu bukan hanya tentang mengedit teks; bahwa penciptaan chatting bots, menceritakan kembali teks, klasifikasi emosi, pertanyaan dan jawaban di Wikipedia - tugas sederhana yang tidak memerlukan penelitian. Tugas-tugas ini akan tersedia untuk Anda setelah Anda melewati kursus ini. Tetapi, yang paling penting, kami akan mengajarkan Anda untuk mengajukan pertanyaan yang tepat di dunia NLP modern, dan apakah Anda akan menemukan jawabannya sendiri atau jaringan saraf eksternal - apakah ada perbedaan. Apa selanjutnya Terserah kamu.
Apakah Anda dengan kami?
Maka
selamat datang di kursus online !