💃 🤳🏼 🛃 "Kenapa kita semua melakukan ini?" - Pencipta Prisma dan mantan pemimpin proyek VK tentang proyek rahasia barunya 🧓🏻 👐🏿 👒

Ingat aplikasi Prisma? Pada tahun 2016, sepertinya setiap foto kedua di dunia dilewati. Sejarah naik turunnya popularitasnya juga dibahas di mana-mana (termasuk di Habré ).

Tetapi pada bulan Juni tahun ini, pencipta Prism, Alexei Moiseenkov ( darkolorin ), bersama dengan co-founder, meninggalkan perusahaan tanpa mengomentari alasan untuk pergi. Segera mereka menjadi dikenal dan begitu. Alexey meluncurkan startup baru dan telah mengumpulkan investasi $ 1 juta.

Perusahaan ini disebut Capture Technologies, tetapi mereka tidak akan mengatakan apa yang akan dirilis. Diketahui bahwa ini adalah semacam "analog dari jaringan sosial di mana kamera dan teknologi kecerdasan buatan akan memainkan peran besar".

Fillpackart dan saya meminta percakapan dan mencoba mencari tahu, bahkan jika proyek ini berada di bawah tenda, tetapi sekali lagi jatuh ke dalam diskusi "menjadi atau tidak menjadi."

Tentang Alexey Moiseenkov

Alexey telah memprogram sejak dia berusia 11 tahun, di sekolah dia adalah pemain profesional di World of Warcraft (dia masih bermain di Hearthstone), entah bagaimana berhasil menghasilkan uang dengan mengajar sepatu roda, kemudian dia belajar di St. Petersburg Polytechnic di fakultas teknik sibernetika. Dia bekerja di Yandex, Mail.ru, mewawancarai di Google. Dia mengajar di Institut Fisika dan Teknologi Moskow, tetapi mengatakan bahwa para siswa tidak percaya - "Saya tidak punya startup sendiri."

Kemudian, Prisma dimulai dan selama beberapa bulan berada di puncak AppStore hampir di seluruh dunia. Jutaan pengguna, perhatian media yang konstan, perjalanan ke Lembah Silikon. Kedengarannya indah, tetapi Alex tampaknya melihatnya lebih kritis:

“Wawancara apa pun adalah distorsi. Tidak ada yang tertarik pada kebenaran, media apa pun beradaptasi dengan pembaca dan menjenuhkan cerita dengan fiksi. Kisah bahwa, misalnya, dua cowok duduk dan melakukan startup di komputer dan yang mereka butuhkan adalah komputer, tidak akan pernah populer. Program mereka mungkin populer, tetapi media akan selalu menghasilkan sesuatu tentang penciptaannya. "

Tapi kita tidak seperti itu! Kami hanya membutuhkan komputer.

Apakah Anda melihat ke kode sekarang?

Alex: Saya tidak akan mengatakannya. Hanya untuk saya sendiri, beberapa hal tentang Deep Learning melihat cara melatih jaringan. Saya mengerti matematika dengan baik, karena saya suka matematika, tetapi saya tidak menulis apa pun dalam produksi.

Tetapi apakah ini membantu kerja tim?

Saya bisa membaca kode, saya mengerti pola proyeksi. Anda secara teknis memahami apa yang sedang dilakukan, Anda dapat mempelajari. Tapi tetap saja, ini lebih tentang bahasa yang sama dengan tim.
Secara umum, saya selalu memainkan peran semi-teknis di mana pun saya bekerja - di Yandex dan Mail.ru. Saya selalu mengerti apa yang terjadi di sekitar.

Dan siapa yang bekerja di sana?

Di Yandex, saya bekerja di program terakhir di universitas, saya adalah seorang manajer di Maps. Di Mail.ru, saya bekerja di persimpangan analitik produk untuk beberapa proyek. Setelah saya beralih dan mulai lebih banyak berurusan dengan produk - visi, strategi, dll. Dan setelah itu ada Prisma dan titik balik terjadi.

Anda tidak menggabungkan "prisma" dengan pekerjaan?

Pada awalnya, itu adalah proyek di samping - bahkan sebuah ide untuk proyek sampingan. Fultime dimulai kemudian, ketika aplikasi muncul.

Phil: Anda memulai Prism ketika tidak ada jaringan saraf sama sekali, kan?

Saya akan mengatakan bahwa tidak ada hype seperti itu. Sekarang ada di mana-mana dan topeng, dan pelacakan, dan segmentasi, dan hal-hal lainnya. Dan kemudian itu tidak begitu populer, mungkin karena membutuhkan banyak sumber daya. Bahkan tugas transfer gaya selesai selama beberapa menit. Tidak ada yang akan menunggu satu gambar selama lima menit. Tetapi saya memiliki pemahaman bahwa jaringan saraf pasti akan menanjak, jadi saya mulai berurusan dengan mereka.

Tentang Oleg Illarionov

Pada musim semi 2018, pemimpin proyek Oleg Illarionov meninggalkan VK. Dia bekerja di sana sejak 2010 dan mungkin melihat semua tahapan terpenting dalam kehidupan perusahaan.

"Pavel duduk melalui satu kantor dari saya, tepat di jalan menuju meja dengan makanan, di dekat mana kita semua sering membahas solusi untuk berbagai masalah teknis," katanya enam tahun lalu.
Selain fitur utama jaringan sosial, Oleg terlibat dalam meluncurkan layanan Vinci (klon Prisma), Snapster dan Stickerface.

Seperti Alex, dia tidak mengomentari keberangkatannya pada awalnya. Dan baru-baru ini diumumkan bahwa ia menjadi direktur teknis Teknologi Capture.

Oleg, apakah Anda merasa tidak bisa lagi menulis kode belanjaan?

A: Sebenarnya tidak, saya masih menulis kode. Itu hanya keinginan untuk terlibat dalam aplikasi sepenuhnya. Artinya, saya tidak ingin berhenti pemrograman - saya ingin mengambil lebih banyak tanggung jawab.

F: Tapi tidak ada perasaan bahwa karena tugas lain Anda tidak dapat lagi melakukan pemrograman juga?

A: Tentu saja, saya tidak bisa menghadapinya juga jika saya hanya menulis kode. Di sisi lain, di VK, kami selalu mencurahkan banyak waktu untuk produk. Ketika tugasnya adalah membuat beberapa fitur, mendesain ulang, bagian dari teman atau sesuatu seperti itu, saya harus berkomunikasi dengan desainer sendiri, memutuskan bagaimana cara kerjanya. Secara umum, saya memiliki latar belakang belanja hampir sejak awal, dan saya hanya menginginkannya lagi.

Saya membaca wawancara kuno Anda tahun 2011. Anda sudah bekerja di VK dan memberi tahu banyak hal tentang itu. Ternyata Anda menemukan semua tonggak paling penting di perusahaan. Ceritakan tentang itu?

A: Itu benar. Saya bisa melihat, saya katakan, perusahaan yang sangat berbeda selama waktu ini. Saya menetap di satu, beberapa bulan yang lalu meninggalkan yang sama sekali berbeda - dan dalam semangat, dan dalam karakter, dan segalanya.

VK lancar berubah selama bertahun-tahun, ada segala macam periode transisi ketika tidak ada yang mengerti apa yang akan menjadi perusahaan dalam beberapa tahun. Mereka mengerti bahwa dia tidak akan tetap sebagai startup kecil, tetapi juga tidak tahu apa yang akan tumbuh darinya. Saya akan mencatat tiga langkah.

Tahap perkembangan pesat adalah ketika saya tiba di sana - pada tahun 2010. Itu berlangsung hingga 2012–13. Kemudian kami hanya bereksperimen, duduk di kantor dari pagi hingga sore, melakukan segala macam fitur. Mereka melakukan banyak hal.

Lalu ada fase penolakan fitur. Kami fokus pada hal-hal penting, melihat metrik, dan berusaha untuk tidak menyemprot. Ini mungkin dari 2013 hingga 2014.

Dan ada tahap pertumbuhan besar - dari 2014 hingga saat ini. VK berubah menjadi perusahaan besar, dengan banyak orang, dengan budaya perusahaan yang kompleks.

Jadi, pertumbuhan dimulai ketika Durov pergi?

A: Ya, sekitar itu. Perusahaan mulai tumbuh dan mempekerjakan orang baru. Sebelum itu, ukuran staf hampir tidak berubah. Tidak banyak orang, dan ketika seseorang mengatakan bahwa dia tidak tepat waktu, dia tidak bisa melakukannya - pilihan untuk menyewa seseorang untuk membantu bahkan tidak dibahas. Ada pendekatan awal dengan sumber daya terbatas.

Ini adalah dua pendekatan berbeda untuk pengembangan - Anda dapat membuat produk keren dengan tim kecil, tetapi Anda tidak dapat membatasi diri dalam sumber daya dan merekrut tim besar. Setiap pendekatan memiliki pro dan kontra. Dengan tim besar, Anda dapat mencakup banyak hal, dengan yang kecil Anda dapat membuat produk yang sangat halus.

Tim kecil lebih mudah dikelola, lebih mudah memperhatikan yang penting. Di perusahaan besar, banyak hal yang hilang dari pandangan, jatuh di persimpangan tanggung jawab ketika tidak jelas siapa yang bertanggung jawab atas hal-hal ini. Akibatnya, sering ada kasus ketika hal-hal penting untuk bisnis hilang begitu saja dan tidak berkembang.

F: Saya bekerja di salah satu raksasa industri sebagai pengembang reguler dan menghabiskan sebagian besar waktu untuk mencari surat dan semua jenis komunikasi. Saya takut membayangkan berapa banyak waktu yang dihabiskan pemimpin proyek untuk hal-hal seperti itu.

A: Dengan meningkatnya jumlah orang di VK, semakin banyak waktu yang dihabiskan untuk itu. Ketika VK berada dalam format startup, kami menggunakan pendekatan yang sangat menarik untuk menyelesaikan masalah - seminggu sekali, pada hari Jumat, selama sekitar satu jam seluruh tim berkumpul di sebuah ruangan (omong-omong, di kamar kecil, dan semua orang ada di sana). Kami memiliki proyektor dan layar, semua orang keluar dan hanya memberi tahu dan menunjukkan apa yang telah ia lakukan. Praktis tidak ada pilihan untuk tidak keluar dan tidak memberi tahu. Itu perlu untuk menjelaskan apa yang diperlukan seminggu, sehingga semua orang bekerja dengan sangat produktif.

Di sebuah perusahaan besar, saya dapat dengan mudah membayangkan orang-orang yang tidak bekerja untuk waktu yang relatif lama, dan tidak ada yang menyadarinya. Di sebuah perusahaan kecil, bukan berarti Anda tidak bekerja - bahkan mustahil untuk bekerja dengan santai.

Tentang kejenuhan dan kesuksesan

Ada hal-hal yang Anda pikirkan - jadikan perusahaan startup saya sebuah perusahaan besar, sampah seperti itu tidak akan pernah ada.

A: Saya datang ke Yandex pada 2013, dan sekitar seribu lima ratus orang dipekerjakan bersama saya. Ada jadwal internal, dan Anda bisa melihat secara real time bagaimana orang tumbuh. Bahkan di kantor kami orang ditambahkan.

Ketika Anda mulai merekrut ratusan dan ribuan, untuk memastikan bahwa Anda mengendalikan semua orang, semua orang datang dan mengatakan sesuatu - itu tidak mungkin. Saya sangat yakin secara budaya bahwa masalah pada tahap ini tidak dapat dihindari.

Pertanyaan lain adalah apakah manajemen dapat membangun budaya (bagaimana nilai disampaikan dari atas ke bawah) sedemikian rupa sehingga orang memiliki keinginan dan kemampuan untuk menyelesaikan tugas ketika mereka tidak malu untuk berbicara tentang masalah dan kesulitan mereka kepada orang-orang yang duduk di dekatnya. Bukannya saya datang dan melaporkan bahwa hari ini saya menutup tiga tugas - tetapi ada keterbukaan. Untuk segera mengatakan dari ambang pintu: "kami mempraktikkan transparansi."

Jika transparansi ini akan diangkat di antara orang-orang yang dipekerjakan - meskipun tidak sama sekali, karena sama sekali tidak mungkin - maka ini akan sangat menyederhanakan pertumbuhan. Orang akan terbiasa melakukan, membiasakan diri berbicara tentang masalah mereka, tentang harapan mereka. Ini penting bagi saya.

Tetapi saya tidak percaya bahwa saya akan melakukan blackjack saya sekarang dan semuanya akan ada di sana seperti yang saya inginkan, dan semuanya akan sempurna. Masalah pertumbuhan adalah hal yang alami dan mustahil untuk dihindari.

Ngomong-ngomong, Anda mengatakan kepada saya bahwa sebelum Prisma, ia sangat lelah bekerja.

A: Di Yandex, saya terlibat dalam manajemen universal. Saya tidak memiliki daftar tanggung jawab tertentu, jadi saya melakukan semuanya secara berurutan. Dan setelah sekitar satu tahun ada perasaan pribadi sehingga saya dibakar olehnya.

Pikiran apa yang paling tersiksa saat itu?

A: Mungkin, itu menyiksa saya bahwa saya berdiri diam dan tidak mengerti jika saya siap untuk pindah. Saya tidak bisa mengevaluasi diri secara objektif. Sepertinya tidak ada yang terjadi. Selalu ada pertanyaan besar di kepala saya - mengapa kita semua melakukan ini secara global? Terkadang sangat sulit untuk mendapatkan jawaban atas pertanyaan ini. Itu menyiksaku banyak pada waktunya. Saya datang ke demonstrasi dan tidak mengerti apa yang terjadi selanjutnya.

Kombinasi fakta bahwa saya melakukan semuanya secara berurutan, tersiksa oleh hal yang sama, dan saya tidak mengerti di mana semua itu berjalan. Saya makan sendiri terus-menerus di kepala saya. Itu agak pribadi ketika tidak ada jawaban untuk pertanyaan Anda sendiri. Anda tidak dapat menjawabnya dan mulai membakar.

Dan ketika Prisma terjadi, dan menjadi jelas bahwa sesuatu yang keren mulai - apakah sudah sembuh?

A: Perasaan bahwa sesuatu yang keren mulai muncul hanya ketika pertumbuhan menjadi liar. Dan ketika kami merilis aplikasi, sepertinya tidak ada yang membutuhkannya. Selama sekitar satu minggu ada keheningan fana yang absolut. Bisa jadi seratus atau dua ratus unduhan.

Ini adalah saat transisi ketika Anda sedang duduk dan begitu, sungguh, sekali lagi, tidak ada yang perlu? Jadi apa yang harus dilakukan?

Dan kemudian pada suatu titik pertumbuhan yang cepat dimulai, dan kesadaran muncul bahwa banyak hal harus dilakukan sekarang. Banyak hal. Dan itu memberi dorongan. Ketika jutaan orang menggunakan produk Anda, dan Anda memiliki tim kecil yang terdiri dari lima setengah orang, semuanya tumbuh, orang-orang di sekitar berusaha mencari sesuatu, tanyakan. Dan Anda masih memiliki tugas produk - ini adalah drive, dan itu menjadi menarik. Pengalaman seperti itu sulit didapat di tempat lain.

Beberapa hari yang lalu, kami berbicara dengan orang - orang yang kembali dari lembah setelah akselerator dan menerima investasi - mereka penuh antusiasme. Dan bagaimana perasaan Anda setelah lembah?

A: Saya punya sedikit berbeda. Matanya menyala bukan dari kenyataan bahwa kami berada di lembah dan akan mengenali orang-orang, tetapi dari kenyataan bahwa sesuatu yang tidak terpikirkan sedang terjadi. Saya memiliki tiga juta unduhan per hari. Saya tidak bisa membayangkan situasi seperti itu. Di Rusia, kami memiliki 350 ribu unduhan per hari, dan AppStore teratas saat itu adalah 13 ribu. Anda tahu ada celah apa? Jadi selama beberapa bulan. Kami hanya secara organik duduk di atas tanpa membuat apa pun, tanpa upaya pemasaran.

Menangkap gelombang seperti itu tentu saja tak ternilai harganya.

Bagaimana Vinci dan Prisma diatur

Tampak bagi saya bahwa Anda terus melakukan sesuatu yang serupa - Prisma dan Vinci, Sticky AI dan Stickerface. Jujur, siapa yang memata-matai siapa?

J: Sejujurnya, kami tidak pernah menyembunyikan bahwa kami telah memata-matai. Vinci dimulai setelah pembebasan Prisma. Kami melihat dan memutuskan - kami perlu menyalin. Dan tentang Stickerface - ini umumnya hal yang berbeda, dan di sini tidak ada yang mengintip siapa pun. Terlebih lagi, ide Stickerface muncul di benak saya waktu yang sangat, sangat lama ketika tidak ada yang melakukan hal seperti ini. Jika saya bisa mengambilnya dengan semua tangan dan kepala saya, maka mungkin sesuatu akan berhasil. Dan sekarang sudah ada banyak pemain.

Kenapa Anda datang bersama di satu perusahaan?

A: Kami mulai berbicara saat kami meluncurkan Vinci. Yang mengejutkan saya, Alexey bereaksi sangat positif terhadap ini. Saya pikir dia akan marah, dan entah bagaimana dia merasa dengan senyuman bahwa kami telah menyalin aplikasi. Ini adalah asal mula komunikasi.

A: Saya menyadari di universitas bahwa saya tidak takut menyalin. Saya pikir ini normal. Karena itu, saya tidak memiliki kebencian atau kebencian.

Menurut Anda siapa yang secara teknis kebetulan melakukan hal ini dengan lebih baik?

A: Saya pikir itu keren untuk melakukan sesuatu terlebih dahulu, dan menyalin tidak keren. Saya biasanya tidak suka menyalin, dan saya suka melakukan hal-hal asli yang belum pernah dilakukan sebelumnya.

Terlepas dari kenyataan bahwa selama semua pekerjaan saya, saya terlibat dalam beberapa jenis proyek non-asli, dari sudut pandang teknologi saya selalu mencoba untuk menangani tugas-tugas yang masih belum terpecahkan.

Banyak hal yang harus dilakukan VK ketika tidak ada informasi sama sekali. Saya harus menciptakan dan menciptakan. Di Snapster, terlepas dari fakta bahwa ide itu sendiri adalah yang kedua, ada koreksi warna dewasa penuh dengan pencelupan yang dalam, yang belum pernah dilakukan sebelumnya oleh siapa pun dalam aplikasi seluler. Kami merilis hal yang relatif unik pada waktu itu. Masalah lainnya adalah implementasi teknis tidak cukup untuk mengganggu pasar.

Di Vinci, ide dan teknologi itu sendiri adalah yang kedua. Tetapi itu adalah pengalaman yang menarik, karena tidak pernah dijelaskan bagaimana membuatnya. Saya harus memahami dan menghadapi tugas yang tidak jelas.

Oleg berbicara tentang teknologi yang digunakan oleh Vinci sebelum meluncurkan pemrosesan offline pada CPU.

Versi pertama dibuat dalam 24 jam, rilis - dalam 2 minggu.

Stack: Torch untuk bekerja dengan jaringan saraf, tetapi ada banyak masalah dengannya. Lua / Turbo untuk komunikasi antara frontend dan backend - dan dengan mereka juga, tidak semuanya berjalan lancar. Backend pertama kali di NodeJS karena kurangnya waktu, kemudian ditulis ulang di Go.

Besi: pada awalnya kami mempertimbangkan opsi server virtual dengan kartu video, tetapi memutuskan untuk membeli peralatan kami. Kami memilih antara empat opsi dari Nvidia - Tesla M40, Tesla K80, GTX 1080 dan Titan X. Kami memilih dua pilihan terakhir, karena keunggulan utama opsi industri (Tesla) adalah toleransi kesalahan, dan masalah ini telah diselesaikan oleh arsitektur.

Arsitektur: Setiap gaya diproses pada kartu video sendiri. Distribusi gaya pada kartu video bersifat dinamis dan diatur oleh fungsi khusus.

Botnek yang paling tidak terduga - kartu video dapat memproses lebih banyak gambar daripada yang dilewati jaringan.

Organisasi pelatihan: mereka menempatkan FGlab di semua server, mulai membombardir setiap gambar dengan parameter acak, dan secara manual memilih yang mana yang paling mereka sukai. Ini membantu membuat gaya sangat berbeda satu sama lain.

Rasio kecepatan lapisan: input - 42%, menengah - 10%, dan output 28%.

Dan bagaimana Prisma diatur di bawah tenda?

A: Model berada di "Torche". Ini adalah hal yang lama, sekarang tidak terlalu populer, karena ada PyTorch dan TensorFlow. Model itu sendiri dikemas ke dalam pemrosesan pada kartu video. Dia menyetir Inference, dan dari sana, "Python" menarik semuanya ke atas. Yaitu, backend, pembungkus pada Python, antrian, dan sisi server juga pada Python. Tidak ada tumpukan yang rumit. Perangkat ini hanya klien tipis, antarmuka plus bekerja dengan api.

Kami melewati dua tahap. Yang pertama adalah ketika semuanya online. Kami awalnya mempercepat algoritma sekitar seratus kali dalam waktu dari versi backpropagation, meluncurkannya pada kartu video game sewaan. Seluruh kesulitan adalah bahwa ketika aplikasi tumbuh, antrian muncul. Aliran permintaan gambar sangat besar. Gambar pergi ke server, dan dengan memuat beberapa juta unduhan, sangat mahal untuk menggerakkan foto terabyte. Kami harus membayar lebih untuk server dan lalu lintas daripada sumber daya - bahkan jika kami mengurangi waktu tunggu.

Jadi tahap kedua dimulai. Kami memikirkan apakah mungkin melakukannya secara offline atau dengan pemrosesan prosesor yang murah. Kami berhasil melakukan ini pada Agustus 2016, dan pada akhir September kami mulai mengerahkan. Lalu tidak ada Core ML, tidak ada pemrosesan di telepon. Kami adalah pelopor Logam, membangun segalanya dari tongkat dan tongkat, tetapi kami mengerti bahwa ini adalah masa depan. Karena menjaga privasi - tidak mengarahkan foto pengguna di mana pun, dan ini sangat mengurangi biaya pemrosesan.

Transisi adalah kuncinya bagi kami, kami dapat mengimplementasikan serangkaian algoritma untuk memproses model pada perangkat. Dan kami mulai memahami bahwa seluruh industri pemrosesan, AI, Pembelajaran mesin - semuanya akan ada di perangkat, dengan data yang ada di perangkat ini.

F: Yaitu, pada awal pengerjaan Prism, ide melakukan perhitungan pada klien bahkan tidak dipertimbangkan?

A: Tidak juga. Kami melihat ke arah sana, tetapi berpikir seperti, “Oh, ayolah! Ini tidak realistis. " Pada awalnya, bahkan model-model ini sulit masuk ke dalam memori GPU, dan ada 8 atau 12 GB. Gagasan bahwa ini dimungkinkan pada perangkat itu tampak futuristik.

Tapi kami sudah mulai tumbuh - semuanya terbakar, server terbakar, ada jutaan pengguna. Fokus telah bergeser untuk membuat sistem yang kami bangun pada GPU berfungsi.Kami mengoptimalkan bagian server selama sebulan, tetapi menyadari bahwa tanpa pemrosesan pada perangkat, tidak ada tempat. Kalau tidak, Anda akan langsung bangkrut.

Saya tidak berpikir bahwa akan ada aliran gambar seperti itu.

Dan beban apa yang Anda harapkan?

A: Sebelum diluncurkan, kami pikir akan ada maksimum tiga gambar per detik. Maksimal! Dari sini Anda berpura-pura - 60 x 60, 3 x 600, 12 lainnya, dan sepertinya - banyak, di mana begitu banyak! Bayangkan berapa banyak pengguna seharusnya dan pikirkan, tiga gambar per detik - ini normal.

Kami menjalankan pemrosesan, dan seluruh siklus membutuhkan 400 milidetik. Kupikir itu hebat. Seperti yang kemudian menjadi jelas, ini sama sekali tidak bagus. Ketika jutaan pengguna menuangkan, semua pikiran mulai bergerak ke arah yang sama sekali berbeda.

Dan apa yang kamu lakukan? Mereka berlari, padam?

A: Ketika dibakar, kami menggunakan semua sumber daya yang mungkin ada di pasar. Semua itu bisa mereka temukan. Saya ingat, kami bahkan menelepon teman, bertanya apakah mereka memiliki server pada kartu video. Saya menelepon hampir semua orang yang saya kenal. Pengembang dari Yandex, dari tempat lain, berkata, "Sialan, bantu seseorang yang punya beberapa gerobak dorong untuk dinaikkan." Mereka mengambil 5-6 mobil dari seseorang, dan mereka bahkan tidak menggunakan kartu grafis gaming, prosesor mereka lebih lambat.

Mereka menyebut Amazon, tempat mereka memberi kami peningkatan batas. Serius, ketika kami mendapat empat mobil hingga empat kartu video di Amazon, kami sangat senang - garis sepuluh gambar turun menjadi delapan. Kami adalah mitra dengan Servers.com - mereka juga banyak membantu pada saat itu.

F: Apakah kode itu ditulis dengan buruk dan harus diperbaiki dan ditulis ulang setelah rilis?

A: Dengan cepat ada banyak koreksi, serius. Justru kemacetan yang sobek yang diperbaiki di mana tidak mungkin untuk mengharapkan beban seperti itu. Bagaimanapun, semuanya ditulis hanya untuk bekerja. Awalnya tidak ada antrian sama sekali. Mungkin sulit bagi saya untuk menghargai kebersihan dan melek kode. Karena semuanya ditulis secara harfiah dalam sebulan - ya, mungkin tidak ada pendekatan industri, karena semua orang suka, dengan mempertimbangkan beban, dengan mempertimbangkan diperpanjang. Karena itu, banyak yang berhubungan.

Apa yang akan terjadi pada AI, ML dan neuron

F: Ketika saya menemukan cara kerja jaringan saraf, saya kehilangan perasaan bahwa ini adalah sihir dan terobosan. Bagaimana dengan kamu?

A: Sebenarnya, ya. Bagi saya, semua pembelajaran mendalam bukanlah keajaiban. Geometri diferensial adalah sihir, dan pembelajaran mendalam cukup transparan dan dapat dipahami secara teknis. Dari sudut pandang algoritma mana yang ada di dalamnya dan bagaimana cara kerjanya, ada kotak hitam tertentu yang dibangun di atas heuristik percobaan. Tetapi secara umum, benda itu sendiri pada waktu itu jelas bukan sesuatu yang supranatural. Penting untuk percaya bahwa ini akan bekerja dengan cepat pada perangkat, dan ketika kami mencapai ini, saya hanya memperkuat keyakinan saya.

Begitu juga dengan teknologi apa pun. Mari kita ambil basis data di tahun sembilan puluhan. Ada juga perasaan bahwa tidak ada yang rumit, tetapi entah bagaimana itu sulit. Dan ketika semua orang mengerti bahwa ini berfungsi, itu berguna dan umumnya satu-satunya hal di mana data harus disimpan, basis data telah menjadi hal yang sangat normal, sekarang semua orang menggunakannya. Hal yang sama harus terjadi dengan model ML.

F: Misalkan saya melihat AI yang agak abstrak menggunakan algoritma jaringan saraf di garasi. Dan sekarang perasaan itu tidak meninggalkan saya bahwa jika saya hati-hati mempelajari bagaimana hal ini dilakukan, maka pengetahuan akan mempersempit rentang peluang yang akan saya putuskan. Karena saya akan berhenti percaya pada kemungkinan teknologi. Apakah kamu tidak memilikinya?

A: AI umum untuk semuanya belum ada. Bahkan kombinasi teknologi sedikit jumlahnya. Contoh yang baik dari beberapa teknologi dalam hubungannya adalah Google Duplex. Dia mendengarkan apa yang Anda katakan, dan mencoba untuk mendapatkan konteks, dan mencoba untuk menganalisis konteks ini, ditambah dia juga menghasilkan pidato. Ini adalah seluruh kompleks, tetapi bahkan itu tetap merupakan sejarah yang sangat sempit - panggilan dan tabel buku. Artinya, ia melakukan tugas-tugas dengan skenario yang dapat dipahami dan serangkaian tugas yang akurat dan dijelaskan dengan baik.

Tampak bagi saya bahwa sekarang adalah tahap pengembangan AI dan ML, ketika mereka hanya dapat melakukan tugas-tugas yang terdefinisi dengan baik, yang sudah ada set data yang memadai. Tapi saya belum melihat aplikasi yang lebih umum.

Perasaan akan kapabilitas teknologi lebih maju dari kapabilitas sesungguhnya.

A: Ya. Tetapi saya berpikir bahwa segera kita akan melihat upaya untuk membuat kombinasi algoritma dan sistem yang akan memungkinkan kita untuk melakukan tugas yang lebih abstrak.

F: Saya sering mendengar bahwa kami mencuri implementasi pemrosesan gambar dari pandangan, dari mekanisme biologis. Apakah Anda juga berpikir demikian?

A: Tidak, sebenarnya tidak. Ketika ada ledakan dalam jaringan saraf yang berkobar tepat karena neuron konvolusional, sepertinya penglihatan manusia, dan segala sesuatu akan berkembang seperti itu. Tentu saja ada pola yang sama, tetapi mengatakan bahwa semua satu-ke-satu bekerja dengan cara yang sama jelas mustahil. Dari sudut pandang teknologi neuro, jaringan konvolusional adalah satu bagian kecil. Dan ada begitu banyak jenis jaringan.

F: Apakah Anda pikir pendekatan ini memiliki hak untuk hidup secara umum - untuk mencoba memahami mekanisme alami manusia dan menyalin implementasinya?

A: Berdasarkan pengamatan saya tentang tren terbaru, sekarang, sebaliknya, teknologi dalam pembelajaran yang dalam bergerak menjauh dari ini. Ada segala macam keputusan rumit yang tidak mirip dengan biologi. Tetapi dari waktu ke waktu ada upaya, artikel dan sebagainya. Saya tidak tahu kita akan berakhir dengan apa.

Pembelajaran mendalam memiliki tugas-tugas tertentu - untuk meningkatkan kualitas dan meningkatkan hasil. Dan dengan cara apa itu akan berubah, suka seseorang atau tidak suka seseorang, itu tidak masalah lagi. Ini adalah bidang yang berkembang bebas, di mana ia akan menjadi seperti itu.

Dan sekarang semua orang mendiskusikan jaringan saraf kapsul. Sudahkah Anda mencoba melakukan sesuatu dengan mereka?

A: Sejauh ini, sayangnya, ini tidak cocok untuk beberapa penggunaan yang dekat dengan produksi. Masih belum ada implementasi yang memadai dan cepat. Contoh-contoh yang bekerja dengan dataset sederhana yang sangat kecil. Saya pikir komunitas memiliki banyak pekerjaan yang harus dilakukan dengan mereka agar sesuatu dapat diselesaikan. Tapi menurut saya ide itu sangat tepat, juga arah pengembangan secara keseluruhan.

Lagipula, Anda juga bekerja dengan feystreking. Benarkah algoritma lain menang di sana?

A: Yah, bukannya mereka menang. Sebagai contoh, MSQRD dibangun di atas pohon keputusan dengan berbagai trik. Tapi sekarang, mungkin, semuanya beralih ke neuron. Mereka menjadi secepat implementasi sebelumnya, tetapi ada lebih banyak potensi untuk meningkatkan kualitas di sana. Saya tidak begitu akrab dengan pelacakan, tetapi tampaknya ada semacam botnek yang sulit. Dan di neuron, karena fakta bahwa mereka lebih baik belajar bagaimana menggunakannya, kekuatan perangkat telah meningkat, telepon menjadi lebih kuat - kualitasnya semakin meningkat seiring rilis. Karena itu, tampaknya mereka memiliki lebih banyak prospek daripada pendekatan sebelumnya.

Apa yang ada di balik tudung aplikasi rahasia

Teknologi apa yang Anda andalkan sekarang?

A: Sekarang kami telah memutuskan untuk beralih dari pendekatan standar ke membangun backend dan membangun semuanya di FondationDB, yang baru-baru ini muncul di open source. Kami akan memiliki lebih banyak dukungan daripada Prism atau Vinci. Kami sedang melakukan aplikasi waktu nyata, dan ini akan membutuhkan pengerjaan optimasi yang kompleks.

Hal utama di sini, tentu saja, bukan FoundationDB itu sendiri, tetapi pendekatannya - penyimpanan nilai kunci transaksional, dalam hal transaksi nyata yang disinkronkan antara server. Pendekatan ini seperti masa depan untuk backend. Kami memilih FoundationDB sebagai repositori yang paling menjanjikan dengan karakteristik seperti itu, kami akan mengujinya, dan kemudian, mungkin, kami akan pindah ke repositori lain jika sesuatu menunjukkan hasil yang lebih baik.

Ini tentang penyimpanan data. Maka kita memiliki segalanya di Go sekarang. Vinci juga ditulis di Go. Lyosha mengatakan bahwa Python awalnya di Prism, tetapi kemudian mereka juga menyalinnya di Go. Tampaknya menjadi bahasa yang baik untuk melakukan backend sekarang. Saya melihat reaksi positif dari masyarakat. Jauh lebih mudah untuk mempekerjakan orang, dan secara umum tampaknya ini adalah keputusan yang tepat.

Dalam hal infrastruktur, kami akan mencoba membangun semuanya di Amazon untuk saat ini. Saya pikir dalam hal ini tidak masuk akal untuk menyelamatkan dan mencari sesuatu yang lain. Anda harus mulai dulu, untuk memahami apakah Anda perlu menabung. Namun secara keseluruhan, Amazon tidak memiliki harga setinggi itu. Mereka secara berkala mengindeksnya.

Karena itu, karena kami meluncurkan hosting bersama, arsitekturnya akan berbeda dari proyek dan aplikasi seperti VK. Di VK, banyak trik datang dari kehidupan penuh di server. Di sana, pada satu server, peran yang sangat berbeda dapat dilakukan - mereka dapat menyimpan gambar, berisi database, dan melakukan sesuatu yang lain.

Kami memecah semuanya menjadi contoh, semuanya sangat atom. Saya menetapkan tujuan untuk membuat backend yang tidak jatuh. Saya ingin pengguna tidak melihat adanya penurunan zat besi, langsung ke pusat data di Amazon.

Saya tidak akan berjanji bahwa itu akan berhasil. Tapi saya benar-benar ingin mewujudkan arsitektur yang paling terlindungi dari jatuh. Saya tidak yakin dapat memberi tahu Anda lebih banyak tanpa membakar konsep kami.

Kami tidak takut seseorang akan menyalinnya. Kami hanya ingin menahan intrik tertentu.

F: Bisakah Anda memberi tahu kami lebih lanjut tentang motivasi untuk menggunakan Go? Selain itu, apa yang lebih nyaman untuk mempekerjakan pengembang?

J: Secara umum, bahasa bukanlah hal yang penting. Kami bukan yang akan melakukan hanya dalam bahasa seperti itu dan tidak lagi dalam bahasa apa pun. Jika seseorang ingin melakukannya dalam PHP, kami akan melakukannya dalam PHP. Tapi saat ini, tampaknya Go adalah pilihan terbaik di pasar, yang paling keren.

F: Bagaimana lebih tepat bagi startup untuk memilih teknologi? Jadi Anda memutuskan untuk menulis di Noda, tetapi Anda memiliki 5 juta orang dan itu saja - Noda Anda tidak tahan, dan sekarang sangat mahal untuk menulis ulang. Bagaimana cara memprediksi ini?

Nod tidak mau memilih sedikit karena alasan lain. Saya tidak akan mengatakan bahwa Noda sangat lambat. Jika kode ditulis dengan baik, itu akan berfungsi dengan baik.

F: Ada lebih sedikit ruang untuk optimasi.

A: Saya akan takut untuk membuat cadangan node karena sangat mudah untuk membuat kesalahan. Ketika Anda perlu segera melakukan sesuatu atau memperbaiki sesuatu, situasi yang tidak menyenangkan dapat muncul. Dan bahkan jika Anda menggunakan TypeScript, semuanya cerdas, mengetik, dan sebagainya - semua situasi yang sama, kompleks, bug yang sulit ditangkap pada node terjadi.

Dan Go adalah bahasa yang sangat mudah. Dia melakukan persis apa yang Anda tulis. Itu tidak menyediakan ruang untuk semua jenis abstraksi dan trik. Jauh lebih tenang untuk menulis backend dengannya. Anda dapat mengambil dan mengulang sepotong kode besar kapan saja, dan semuanya akan baik-baik saja. Jika ada sesuatu yang salah, kemungkinan besar tidak akan dikompilasi, dan tidak sehingga semuanya tidak akan berfungsi.

F: Yaitu, apakah menurut Anda pengetikan statis dan kuat merupakan faktor penentu?

A: Ini sangat penting untuk startup, lebih penting daripada kinerja. Penting bahwa Anda dapat dengan cepat memperbaiki bug tanpa membuat yang baru. Untuk meminimalkan risiko.

Jika Anda menggunakan pola pengembangan modern pada Node, terutama jika ada beberapa perpustakaan pihak ketiga di sana, sangat mudah untuk menghubungi kebocoran memori. Dan kemudian temukan dia keseluruhan cerita. Dan saat Anda mencari kebocoran ini, buang-buang waktu, backend Anda turun sepuluh kali sehari. Saya ingin menghindari hal-hal seperti itu, ini adalah bahaya yang sangat besar untuk startup.

Ada banyak aplikasi yang diluncurkan, dan tim, bukannya melihat fitur-fitur baru, mendukung dan memperkuat minat pada proyek, terlibat dalam memperbaiki sejuta bug. Aplikasi bekerja dengan tidak stabil, dan ini menewaskan proyek keren.

Orang macam apa yang Anda rekrut sekarang?

A: Dengan backend, kami belum mulai merekrut siapa pun. Saya menulis seluruh backend sendiri. Jadi, saya memiliki sedikit pendekatan Google untuk merekrut orang - tidak terlalu penting bagi seseorang untuk mengetahui saat ini. Pikiran utama, pembelajaran, dan pengetahuan bahasa Anda yang baik. Selama booming VK, saya mewawancarai banyak orang dan selalu melihatnya.

Seorang karyawan baru masih harus menghabiskan banyak waktu untuk memahami arsitektur backend. Bahasa apa pun dapat dipelajari - tidak begitu sulit. Oleh karena itu, setiap pengembang backend yang hanya memahami cara kerja database, yang cukup pintar dan cukup pintar, akan cocok untuk kita.

Dalam hal neuron, kondisi lainnya. Kami telah mempekerjakan orang dengan keterampilan tertentu. Dalam kasus kami, belajar dan menunggu tidak akan berhasil. Pada neuron, periode pelatihan sangat lama.

Dengan pengembang seluler, perhatian terhadap detail menjadi penting. Pengembang yang membuat antarmuka harus memperhatikan dan memperbaiki banyak hal kecil. Kalau tidak, Anda harus menusuknya sepanjang waktu, dan ini akan memakan banyak waktu dan saraf.

Di VK, Anda tidak terbatas pada sumber daya. Saya membayangkannya seperti ini: Saya perlu melihat Tesla untuk $ 5.000 - setidaknya sepuluh. Kami membutuhkan server seharga $ 700 per bulan - ambillah. Bisakah Anda melakukan eksperimen seperti itu sekarang?

A: Tampaknya kami tidak memiliki masalah dengan sumber daya. Tentang VK - itu benar. Ketika kami menyadari bahwa kami membutuhkan server dengan vidyashki, kami diberitahu - tidak ada pertanyaan. Kami menyewa hampir sebuah pesawat pribadi untuk mengirimkan vidyoshki ini secepat mungkin. Dalam hal ini, tangan selalu terlepas, dan tidak ada yang selamat dari besinya.

Tetapi di sisi lain, kami sekarang ingin menggunakan Amazon bukan karena tidak ada sumber daya.

Tetapi Anda tidak lagi beruntung dengan jet pribadi.

Ya benar. Tetapi di sisi lain, tidak perlu.

Apa gunanya startup?

Anda ingin menyimpan intrik di sekitar proyek, dan saya berjanji untuk tidak mengacaukan pertanyaan. Pada kesempatan ini, saya ingat satu cerita. Saya membaca di reddit bagaimana seorang pria dapat melakukan presentasi pribadi tentang headset VR dan tidak dapat membicarakannya karena embargo. Karena itu, ia menulis ulasan tentang makan malamnya. Tetapi dengan tangkapan, seperti "piring makanan itu sedikit lebih berat dari HTC Vive, tapi cukup nyaman di tangan." Bisakah Anda ceritakan tentang makan malam Anda kemarin?

Yah, kami tidak melakukan besi, kami melakukan perangkat lunak, Anda tidak dapat membandingkan dengan makan malam.

Sial, usahanya gagal. Tetapi fakta bahwa ini akan menjadi jejaring sosial - Anda telah mengatakan.

A: Mungkin tidak tepat untuk memanggil jaringan sosial. Sebaliknya, ini adalah produk yang didasarkan pada beberapa jenis interaksi sosial.

Apakah sulit meyakinkan orang tentang ide ini?

A: Penting bagi investor untuk memberi tahu bukan hanya ide, penting untuk mengatakan siapa yang Anda miliki di tim Anda.

Secara umum, kemungkinan mereka akan memberi Anda investasi terdiri dari siapa yang ada di tim Anda, apa ide Anda dan apakah Anda pergi ke orang yang tepat.

Pergi ke orang-orang acak dan hanya mengambil uang dari mereka mungkin tidak tepat. Mereka mungkin salah mengerti apa yang Anda lakukan. Dapatkan uang di kios untuk orang-orang yang membuat roket? Mereka tidak memahami bisnis penjualan shawarma.

Karena itu, penting untuk melakukan investasi kepada orang yang tepat yang relevan dengan bidang di mana Anda akan bekerja. Saya melakukan hal itu.

Jika Anda menyentuh tim, sangat penting bagi saya bahwa seseorang menyukai apa yang dia lakukan. Sulit untuk menggambarkan ide atau tidak sulit, tergantung pada bagaimana seseorang memahami bidang ini. Terkadang pendapat bertemu, keyakinan pada sesuatu bertemu, dan Anda bekerja dengan orang-orang seperti itu.

Keberhasilan platform sosial sangat sering tergantung pada citra, stereotip, audiens yang terbentuk di sekitar mereka - bahkan, mungkin, lebih dari pada teknologi. Apakah ini membuatmu takut?

A: Ini adalah faktor kombo, saya setuju. Ada momen budaya, kombinasi bagaimana Anda menyajikannya, bagaimana Anda memberi tahu pasar. Mengapa itu diperlukan, bagaimana itu membuat hidup lebih baik. Banyak yang mengatakan bahwa mereka memecahkan masalah dengan produk mereka. Saya cenderung melakukan lebih baik apa yang telah dilakukan, untuk menyederhanakan.

Ada kombinasi pitch dan kinerja. Dan kemudian datang tes hipotesis - apakah asumsi Anda benar? Setiap produk didasarkan pada beberapa asumsi. Ambil Dropbox: hipotesisnya adalah orang perlu menyimpan file di cloud, tidak ada ruang di komputer, dan mereka membutuhkan akses di mana-mana. Mereka melakukannya dan memeriksanya. Ternyata seseorang membutuhkannya, orang-orang mulai menyimpan file di cloud. Hipotesis dikonfirmasi.

Hipotesis kami adalah bahwa dunia membutuhkannya. Saya tidak berpikir bahwa ada faktor sosial yang penting di sini, karena sudah dijabarkan dalam hipotesis.

Setiap hal sosial yang sukses juga merupakan tanggung jawab besar, bahkan berdampak pada dunia. Ingat hanya sejarah terkini tentang bagaimana Zuckerberg melaporkan ke Senat. Apakah Anda siap untuk tanggung jawab ini jika semuanya menembak?

A: Sulit dikatakan. Harus menembak terlebih dahulu. Hipotesis harus dikonfirmasi dan selamat dari tahap pertumbuhan. Zuckerberg, jelas, tidak menjawab senat di tahun pertama karyanya, dan bahkan di tahun ketiga, dan tidak di tahun kelima. Mungkin, pada saat itu kita akan belajar jika kesempatan seperti itu muncul dengan sendirinya. Saya ingin memperkenalkan diri.

Oleg, saya semua akan kembali ke laporan Vinci Anda. Jika Anda mengubah strukturnya, Anda dapat mencapai beberapa efek lucu. Di sini Anda berbicara tentang teknologi canggih, solusi teknik, arsitektur, perangkat keras mahal selama setengah jam - dan kemudian pada akhir ini: "Itu sebabnya kita semua melakukan ini." Dan gambar-gambar hanya muncul di foto.

Karena itu pertanyaannya - tidakkah Anda berpikir bahwa pikiran terbaik zaman kita tidak terlibat dalam hal apa pun?

(Lalu ada keheningan tujuh detik yang sangat sangat lama. Ternyata Oleg kehilangan kontak, jadi Alex masuk)

J: Menurut saya ini tidak sepenuhnya benar. Industri TI baru-baru ini muncul. Itu sepenuhnya terbentuk hanya pada akhir tahun delapan puluhan. Internet muncul sebagai semacam proyek infrastruktur yang tumbuh dari teknologi militer. Berdasarkan ini, daerah baru telah muncul, dan saat ini kita melihat bahwa itu menembus ke semua bidang kehidupan. Ini memunculkan sejumlah besar peluang, tetapi ambang masuk meningkat.

Untuk memulai sesuatu yang sederhana menurut Anda, dengan hasil sederhana - bingkai foto dengan pola - Anda perlu mengetahui seluruh tumpukan teknologi, cara kerjanya, cara pemasaran dan distribusi bekerja.

Dan untuk berdebat bahwa pikiran terbaik berjuang untuk semacam nilai palsu mungkin tidak tepat. Ambang pintu masuk hanya membutuhkan lebih banyak pengetahuan dan keterampilan. Sulit dipahami sebelumnya di mana nilai sebenarnya akan lahir.

Facebook pada awalnya bukanlah ide teknis yang brilian. Mereka hanya membuat situs web, melakukan beberapa hal dasar, dan itu pergi dan pergi. Dan kemudian kesulitan teknis dan jutaan pengguna muncul.

Saya pikir tampaknya begitu dari kenyataan bahwa industri telah berkembang, dan hal-hal sederhana menjadi lebih sulit untuk dilakukan daripada sebelumnya.

(Oleg muncul di sini dan setuju dengan Alexei).

Untuk apa Anda melakukan startup?

A: Saya hanya ingin membuat aplikasi seperti itu. Semuanya berkembang, dan kami mendapatkan efek yang bagus dan bagus untuk industri secara keseluruhan.

Dan mengapa kita tidak semua meluncurkan roket ruang angkasa, tetapi apakah kita membuat semacam aplikasi sosial? Setiap orang harus melakukan apa yang dia suka. Alexey dan saya suka aplikasi sosial, dan kita harus menghadapinya. Jika seseorang suka meluncurkan roket, maka sejauh mungkin Anda perlu melakukan ini.

Hanya saja, jangan meremehkan aplikasi sosial. Padahal, ini adalah hal yang sangat penting, ini memiliki dampak besar pada masyarakat.

A: Saya setuju dengan Oleg, penting untuk melakukan apa yang Anda suka. Kedengarannya seperti klise, tetapi saya ingin membuat hidup sedikit lebih baik, saya ingin membantu membuat beberapa hal rutin lebih cepat, lebih baik orang-orang memiliki peluang baru. Misalnya, Instagram memberi Anda kesempatan untuk memposting foto, tetapi sebelumnya tidak. Anda sendiri melihat bagaimana Instagram memengaruhi kehidupan kami bersama Anda. Sebelumnya, ini sepertinya hal yang mudah, dan itulah yang sekarang menjadi.

A: Instagram mungkin bukan contoh terbaik. Contoh yang baik adalah Facebook. Tidak dalam arti bahwa kami sedang melakukan Facebook lain sekarang. Saya ingin berpikir bahwa kami membuat aplikasi yang agak berguna yang pasti membawa lebih banyak manfaat sosial daripada Instagram.

Jika Anda terus-menerus membuat dunia lebih baik dan lebih baik, bukankah ini pada akhirnya akan mengarah pada efek sebaliknya?

A: Tidak ada yang tahu. Jika saya tahu bahwa ini akan mengarah pada hal-hal buruk, mungkin saya tidak akan melakukannya. Atau mungkin dia melakukannya. Tidak ada yang tahu masa depan.

"Kenapa kita semua melakukan ini?" - Pencipta Prisma dan mantan pemimpin proyek VK tentang proyek rahasia barunya