Pada 14 Maret 2017, Arthur Khachuyan, CEO Social Data Hub, berbicara di ruang kuliah BBDO. Arthur berbicara tentang pemantauan cerdas, membangun model perilaku, pengenalan konten foto dan video, serta alat dan studi lain dari Social Data Hub, yang memungkinkan Anda untuk menargetkan audiens Anda menggunakan jaringan sosial dan teknologi Big Data.
Arthur Khachuyan (selanjutnya - AH): - Halo! Halo semuanya! Nama saya Arthur Khachuyan, saya memimpin perusahaan Social Data Hub, dan kami terlibat dalam berbagai analisis intelektual yang menarik tentang sumber data terbuka, bidang informasi dan melakukan segala macam studi menarik dan sebagainya.
Dan hari ini, rekan-rekan dari BBDO Group meminta untuk berbicara tentang teknologi modern untuk menganalisis data besar, data besar dan tidak begitu banyak untuk iklan: bagaimana penggunaannya, menunjukkan beberapa contoh menarik. Saya harap Anda akan mengajukan pertanyaan di sepanjang jalan, karena saya bisa mulai mengganggu dan tidak mengungkapkan esensi dan sebagainya, jadi jangan malu-malu.
Sebenarnya, arahan utama, di suatu tempat semacam solusi "hampir-bigdigit" pernah digunakan, semuanya jelas - ini adalah penargetan audiens, analisis, semacam analisis, dan riset pemasaran. Tetapi selalu menarik apa data tambahan dapat ditemukan, apa arti tambahan dapat ditemukan setelah menerapkan analisis.
Mengapa kita membutuhkan teknologi untuk iklan?
Di mana kita mulai? Yang paling dimengerti adalah beriklan di jejaring sosial. Hari ini saya mengambilnya di pagi hari: untuk beberapa alasan, Vkontakte percaya bahwa saya harus melihat iklan khusus ini ... Baik atau buruk, ini adalah pertanyaan kedua. Kami melihat bahwa saya termasuk dalam kategori wajib militer:

Hal pertama dan menarik yang dapat diambil sebagai solusi teknologi ... Hal pertama yang ingin saya pecahkan sebelum kita mulai adalah mendefinisikan istilah: apa itu data terbuka dan apa itu data besar? Karena semua orang memiliki pemahaman mereka sendiri tentang hal ini, dan saya tidak ingin memaksakan syarat saya pada siapa pun, tapi ... Hanya supaya tidak ada perbedaan.
Secara pribadi, saya pikir data terbuka adalah semua data yang dapat saya jangkau tanpa login atau kata sandi. Ini adalah profil terbuka di jejaring sosial, ini adalah hasil pencarian, ini adalah register terbuka, dll. Data besar, menurut pemahaman saya sendiri, saya melihat ini: jika ini adalah data plate - ini adalah satu miliar baris, jika ini semacam penyimpanan file - itu adalah suatu tempat petabyte data. Sisanya dalam terminologi saya bukan data besar, tetapi sesuatu di sekitar.
Profil yang sangat akurat dan profil penilaian
Mari kita mulai. Hal pertama dan paling menarik yang dapat Anda pikirkan dari analisis sumber data terbuka adalah profiling presisi tinggi dan penilaian profil. Apa ini Ini adalah cerita ketika Anda dapat memprediksi tidak hanya siapa Anda, tidak hanya minat Anda di akun jejaring sosial Anda.
Tetapi sekarang, dengan menggabungkan berbagai sumber, Anda dapat memahami tingkat rata-rata gaji Anda, berapa apartemen Anda, di mana letaknya. Dan semua data ini dapat digunakan secara harfiah dari cara improvisasi. Misalnya, jika Anda mengambil akun di jejaring sosial, lihat, katakanlah, di mana Anda tinggal, di mana Anda bekerja; pahami bagian bisnis apa dari perusahaan tempat Anda bekerja; Ambil bongkar lowongan serupa dari HH dan SuperJob jika Anda seorang analis, manajer, dll. lihat di mana Anda tinggal (pangkalan, katakanlah CIAN), pahami berapa biaya untuk menyewa rumah di tempat ini, berapa biaya untuk membeli rumah di tempat ini, untuk memperkirakan berapa banyak yang Anda hasilkan. Lebih jauh di jejaring sosial Anda, Anda dapat memahami seberapa banyak Anda bepergian, di mana Anda berada, seberapa setia Anda kepada majikan.
Dengan demikian, dari sejumlah besar metrik kita dapat melakukan apa saja. Kami dapat menghadirkan produk yang menarik bagi Anda. Bayangkan sebuah toko online? Anda pergi ke sana - toko online ini menangkap akun Anda di jejaring sosial dan memberi tahu Anda: "Masha, Anda baru saja putus dengan seorang pria, di sini Anda memiliki produk tertentu dan tertentu." Ini bukan waktu dekat ...
Bagaimana cara menentukan geolokasi seseorang?
Jawaban atas pertanyaan dari audiens:- Biasanya 80% dari semua check-in dianggap sebagai tempat tinggal yang tepat. Tetapi untuk orang yang tidak check-in di mana pun, ada beberapa opsi: check-in, atau geo-posisi, atau analisis posting dan publikasi untuk seluruh periode waktu ketika ada sesuatu yang ditulis oleh seseorang ... Dan di suatu tempat, biarkan sesuatu muncul seperti "Saya ingin membeli kereta dorong dekat Akademik" atau "Saya baru-baru ini melihat grafiti jelek di dinding." Artinya, hampir 80% orang dapat menentukan geolokasi mereka, tempat kerja mereka dan tempat tinggal mereka menurut data atau metadata yang dapat dikumpulkan dari jejaring sosial.
Ini, sekali lagi, adalah analisis posting. Dalam arti paling sederhana, ini adalah analisis check-in dan geolokasi di jejaring sosial yang tidak menghapus metadata jpeg (Anda dapat menguraikan sesuatu pada mereka). Tetapi untuk orang-orang yang tersisa, ini biasanya siaran teks: baik seseorang "menyinari" lokasinya ketika dia menulis tentang sesuatu, atau dia "menyinari" teleponnya, di mana Anda dapat menemukan beberapa iklannya di Avito atau akunnya di "Auto.ru". Menurut data ini, Anda dapat menggabungkan (misalnya, "Saya menjual mobil di dekat Mayakovskaya") dan kira-kira menganggap ini. - Biasanya orang memposting ini di jejaring sosial. Kami hanya bekerja dengan sumber terbuka dan di sini kami berbicara secara eksklusif tentang sumber terbuka. Biasanya iklan diterbitkan, yaitu, enam puluh persen dari waktu cerita yang paling sering adalah ketika orang "bersinar" nomor ponsel mereka saat ini - ini adalah iklan untuk menjual sesuatu. Entah dalam beberapa kelompok seseorang menulis ("Saya menjual ini atau itu di sana), atau dia pergi ke suatu tempat.
Ya! Mereka biasanya berkomentar, seperti: "Jawab saya atau lempar SMS, telepon saya di nomor itu. Ini sangat sering terjadi pada orang yang menjual sesuatu, membeli di jejaring sosial, berkomunikasi dengan seseorang ... Dengan demikian, dengan nomor ini Anda dapat mengikat profilnya dengannya di Cyan Institute, jika ia pernah menerbitkan sesuatu, atau , sekali lagi, di Avito. Ini hanyalah sumber paling populer dan teratas, akan terus menjadi seperti ini - ini adalah Avito, CIAN dan sebagainya. - Ini merujuk ke toko online. Selanjutnya adalah pengenalan wajah dan teknologi pencocokan profil (kami akan membicarakannya). Secara teoritis, ini juga dapat diterapkan ke toko offline. Dan secara umum, impian besar saya adalah ketika spanduk jalan muncul, ketika Anda melewati kamera, itu "melesat" wajah Anda. Tetapi kasus ini akan dilarang oleh hukum, karena ini merupakan pelanggaran privasi. Saya berharap cepat atau lambat itu akan terjadi.
- Saya dapatkan dari pengalaman pribadi. Sangat sering, ketika seseorang menulis sesuatu kepada Anda, Anda beroperasi pada beberapa fakta dari hidupnya yang Anda seharusnya tidak tahu ... Orang-orang dalam banyak kasus menjadi takut. Tapi! Berdasarkan statistik terbaru, jumlah akun tertutup di jejaring sosial telah berkurang 14%. Jumlah palsu bertambah, jumlah akun terbuka meningkat - orang semakin bergerak menuju keterbukaan. Saya pikir bahwa setelah 3-4 tahun mereka akan berhenti bereaksi begitu tajam terhadap fakta bahwa seseorang mengetahui informasi tentang mereka sehingga ia mungkin tidak perlu tahu. Namun sebenarnya sangat mudah didapat dengan melihat temboknya.
Apa yang bisa diambil dari sumber terbuka?
Daftar perkiraan hal-hal yang dapat dipahami dengan keandalan yang cukup tinggi dari sumber terbuka - itu. Bahkan, ada lebih banyak lagi segala macam metrik; itu tergantung pada pelanggan dari penelitian tersebut. Ada beberapa agensi SDM yang tertarik pada apakah Anda bersumpah di jejaring sosial atau di suatu tempat di ruang publik. Seseorang tertarik pada apakah Anda suka suka di bawah publikasi Navalny atau, sebaliknya, di bawah publikasi Rusia Bersatu, atau semacam konten porno - hal-hal seperti itu cukup sering terjadi.
Yang utama adalah nilai-nilai keluarga, perkiraan biaya apartemen, rumah, pencarian mobil, dan sebagainya. Untuk alasan ini, orang dapat dibagi menjadi kelompok sosial. Ini adalah pengguna Moskow "Tinder", siapa mereka (menurut gambar mereka ditemukan di akun Facebook mereka); berdasarkan minat mereka, mereka dibagi menjadi berbagai kelompok sosial:

Jika kami bergerak lebih dekat ke periklanan, maka kami telah secara bertahap meninggalkan penargetan standar periklanan ketika Anda memilih dalam Vkontakte bersyarat yang Anda minati pada pria berusia 18 tahun, yang berlangganan grup tertentu. Saya memiliki gambaran seperti itu lebih jauh, sekarang saya akan menunjukkan kepada Anda:

Intinya adalah bahwa sebagian besar layanan saat ini yang menganalisis, pada prinsipnya, orang yang menganalisis jejaring sosial, tertarik untuk menganalisis minat ... Hal pertama yang muncul di benak orang adalah menganalisis kelompok teratas pelanggan mereka. Mungkin ini bekerja dengan seseorang, tetapi secara pribadi saya pikir ini pada dasarnya salah. Mengapa
Suka Anda mengumpulkan dan menganalisis
Sekarang ambil ponsel Anda, lihat grup teratas Anda - pasti akan ada lebih dari 50% dari grup yang sudah Anda lupakan, ini adalah semacam konten yang sebenarnya tidak relevan bagi Anda. Anda tidak mengkonsumsinya sama sekali, tetapi sistem akan membentang Anda menurut mereka: bahwa Anda berlangganan resep, ke beberapa grup populer. Artinya, Anda melanggar sistem yang menganalisis profil Anda, dan minat Anda tidak akan dibenarkan.
Pindah ... Apa yang ada di sana? Kami berasumsi bahwa orang lain melakukannya. Menurut pendapat kami, cara yang paling tepat untuk menilai minat pengguna adalah suka. Sebagai contoh, di Vkontakte tidak ada feed seperti, dan orang berpikir bahwa tidak ada yang tahu apa yang mereka sukai. Ya, sebagian suka suka diperkenalkan di Instagram, di Facebook kami melihat sesuatu, tetapi sebagian besar konten dalam grup tertentu tidak menyiarkan ini dengan aliran yang sama, dan orang-orang hidup dan berpikir bahwa tidak ada yang akan tahu apa yang mereka sukai.
Dan dengan mengumpulkan konten tertentu dari beberapa konten yang menarik minat kami, mengumpulkan posting ini, mengumpulkan suka ini, kemudian memeriksa orang ini dari database ini, kita dapat menentukan dengan akurasi tinggi siapa dia, apa nasibnya, apa yang dia minati. Identifikasi secara tepat dalam kelompok sosial tertentu dan berinteraksi dengannya.
Membeli mobil mengubah perilaku
Saya punya contoh seperti itu. Saya akan segera membuat reservasi bahwa saya memiliki contoh iklan dekat dan pemasaran dekat, karena, seperti yang Anda tahu, sebagian besar kasus dilindungi oleh NDA dan sebagainya. Namun tetap akan ada banyak hal menarik. Jadi, cerita dengan orang-orang ini: ini adalah pria yang membeli mobil antara 2010 dan 2015. Bagaimana perilaku sosial mereka di jaringan berubah kode warna. Persentase anak perempuan di pelanggan telah berubah, berlangganan ke publik "patsansky", menemukan pasangan seksual permanen ...

Semua ini dipecah oleh merek mobil dan oleh jumlah orang. Dari sini Anda dapat menarik banyak kesimpulan menarik tentang perilaku orang, bagaimana semuanya bekerja. Saya dapat mengatakan bahwa "Porsche Cayenne" dan "Priora" yang ditanam dalam hal jumlah pemirsa yang tertarik hampir sama. Kualitas audiens ini, perilaku mereka berbeda, tetapi jumlahnya hampir sama. Kesimpulan dari sini dapat dibuat, lebih dekat ke pasar Anda, apa pun. Anda menjual Audi, Anda membuat slogan "Beli Audi," mengemudi jauh dari orang tua Anda! "Dan seterusnya.
Ini adalah ya, contoh konyol dari fakta bahwa perilaku orang berdasarkan analisis suka, berdasarkan kelompok yang mereka tuju, konten yang mereka analisis, membuat hampir 100% kemungkinannya siapa Anda. Karena jika Anda tidak memiliki akses ke lalu lintas jaringan, jangan membaca pesan pribadi, suka akan selalu memberi tahu Anda siapa orang ini - seorang wanita hamil, ibu, militer, petugas polisi. Dan bagi Anda, bagi orang yang dapat beriklan, ini adalah target besar.
Jawaban untuk pertanyaan audiens:- Setiap kolom adalah jumlah orang di mobil tertentu; bagaimana pola perilaku mereka berubah. Lihat: orang yang membeli Porsche Cayenne - sekitar 550 orang (kuning), persentase anak perempuan dalam pelanggan telah meningkat.
- Sampel termasuk pengguna VKontakte, Facebook, dan jejaring sosial Instagram dari 2010 hingga 2015. Satu-satunya klarifikasi: di sini adalah mesin terpilih yang dapat ditentukan dengan akurasi lebih dari 80% dalam foto menggunakan alat tertentu.
- Untuk jangka waktu tertentu, mobilnya (yah, bukan dia, kita tinggalkan untuk jejaring sosial) ... Untuk jangka waktu tertentu, seseorang terus-menerus mengambil gambar dengan mobil, bersamanya, publikasi berbeda, foto berbeda dari sudut dan sebagainya . Akan ada gambar lebih lanjut, di mana orang difoto dengan mesin dan ... Ya, ini adalah pertanyaan kedua - kepercayaan pada data jejaring sosial.
- Karena kami mengangkatnya - sayangnya, data di jejaring sosial tidak selalu benar. Orang tidak selalu cenderung mempublikasikan informasi mereka. Secara pribadi, saya melakukan penelitian seperti itu: Saya membandingkan jumlah lulusan dari universitas-universitas Moskow dengan jumlah orang yang terdaftar di jejaring sosial. Rata-rata, 60% lebih banyak orang terdaftar di jejaring sosial - lulusan MSU untuk tahun tertentu dalam spesialisasi tertentu daripada yang sebenarnya ada pada prinsipnya. Jadi ya - di sini, tentu saja, ada persentase kesalahan, dan tidak ada yang menyembunyikannya. Di sini, mobil-mobil yang dapat ditentukan dengan probabilitas lebih dari 80% hanya diambil sebagai dasarnya.
Daftar sumber untuk pelatihan model
Berikut adalah daftar sampel sumber yang dapat digunakan, yang digunakan untuk menentukan dengan pasti profil sosial seseorang, siapa dia.

Dari jejaring sosial kami mengambil profil, dari CIAN - biaya apartemen sekitar, "Head Hunter", "Super Job" - ini adalah gaji rata-rata untuk orang ini. Saya harap tidak ada perwakilan Head Hunter di sini, karena mereka percaya bahwa tidak baik mengambil data ini dari mereka. Namun demikian, ini adalah gaji rata-rata untuk daerah tertentu untuk jenis aktivitas pekerjaan tertentu.
Avito, Avto.ru: sangat sering orang, ketika mereka menyalakan telepon mereka, mereka selalu memiliki (dalam banyak kasus) setidaknya sesuatu pada Avito, atau Avto.ru, atau bahkan beberapa situs dari mana Anda dapat memahami siapa mereka. Jika Anda menjual kereta dorong atau mobil di ponsel ini ... Rosstat dan USRLE masih lebih banyak pendaftar di mana Anda dapat memberi peringkat pada perusahaan pemberi kerja berdasarkan beberapa formula, sesuai dengan model yang dapat ditanyakan oleh siapa saja (Anda dapat menentukan kira-kira uang orang ini) dll.)
"Tinder" membantu mengumpulkan data tentang situasi orang
Plus, ada hal yang sangat menarik (sebagai pilihan, sangat lucu dalam penelitian ini) - ini, sekali lagi, mengumpulkan data dari Moscow Tinder menggunakan bot untuk Tinder ini. Jarak ke orang ditentukan, dan kemudian perkiraan lokasi mereka ditentukan.

Tujuan dari penelitian ini adalah untuk menentukan jumlah akun Tinder di wilayah lembaga negara - di Duma, kantor kejaksaan, dan sebagainya. Tapi Anda, sebagai pengiklan, bisa membayangkan apa saja: itu bisa, misalnya, Starbucks atau orang lain ... Artinya, jumlah orang dari Tinder yang sama yang minum kopi dari Anda, memesan sesuatu, ada di toko. Mengenai geolokasi ini: ini dapat dilakukan dengan layanan apa pun.
Jawaban atas pertanyaan dari hadirin:- Tinder? Kamu tidak tahu "Tinder" adalah aplikasi kencan yang membuat Anda melihat foto (kiri-kanan), dan aplikasi ini menunjukkan jarak ke seseorang. Jika Anda mendapatkan jarak ke orang ini dari tiga titik berbeda, Anda dapat kira-kira (+ 5-7 meter) menentukan lokasi. Dalam hal ini, untuk menentukan wilayah kantor kejaksaan atau Duma Negara, tidak begitu sulit. Tapi, sekali lagi, bisa jadi toko Anda, bisa apa saja.
Sebagai contoh, kami memiliki kasus seperti itu (bukan penelitian) untuk waktu yang lama, ketika kami menerima data dari salah satu operator seluler pada kepadatan fluks, data tentang kepadatan pergerakan titik seluler, dan semua informasi ini ditumpangkan pada koordinat papan reklame yang terletak di jalan raya. . Dan tugas operator seluler adalah menentukan berapa kira-kira sejumlah orang yang melaju dan berpotensi melihat iklan papan iklan ini.
Jika ada spesialis dalam periklanan papan iklan, Anda dapat mengatakan: tidak mungkin untuk memahami dengan sangat andal - seseorang bepergian, seseorang belum melihat, seseorang telah melihat ... Namun demikian, ini adalah contoh bagaimana 20 miliar poligon seperti itu di Moskow yang ada kepadatan orang-orang ini setiap jam di rute tertentu ... Anda dapat melihat apa yang orang-orang ini lewati setiap saat dan memperkirakan arus penumpang.
Jawaban atas pertanyaan dari hadirin:- Tidak ada yang memberikan data seperti itu. Kami melakukan penelitian semacam itu untuk salah satu operator, ini adalah kisah internal yang eksklusif, oleh karena itu, sayangnya, tidak disajikan dalam bentuk gambar. , . , , , , «», , , ( – , – ), . , - – , .
Mari kita lanjutkan. Favorit saya adalah pengenalan gambar. Akan ada bagian kecil tentang menemukan orang dengan wajah, tetapi kami sebagian besar tidak mengambil bagian ini. Kami mengambil pengenalan pola dan definisi bahwa dalam gambar ini adalah merek mobil, warnanya dan sebagainya.
Saya punya contoh komik seperti itu:
Ada penelitian tentang pencarian tato di berbagai jejaring sosial. Dengan demikian, hal yang sama dapat diterapkan pada merek apa pun, ke citra visual apa pun, ke hampir semua citra visual. Ada yang tidak bisa ditentukan dengan andal (kami tidak mengambilnya).
Ini favorit saya. Merek otomotif sering beralih ke tugas seperti itu, karena tugas mereka, misalnya, adalah menemukan semua pemilik BMW X6, untuk memahami siapa mereka, bagaimana mereka terkait, apa yang mereka minati, dan sebagainya. Ini adalah pertanyaan tentang mobil apa yang difoto orang di jejaring sosial.
Tidak ada penyaringan sama sekali: subjek mereka, mobil itu bukan milik mereka; hanya kerusakan seperti mobil - usia dan sebagainya. Tetapi pengenalan pola visual cukup sering digunakan: ini adalah pencarian wanita hamil, dan pencarian logo merek di beberapa media massa (siapa yang memposting apa).
Kasing favorit saya (yang digunakan oleh berbagai restoran): gulungan mana yang diposting di jejaring sosial. Ini adalah hal yang lucu, tetapi sebenarnya itu memungkinkan Anda untuk memahami banyak hal menarik, pertama, tentang pelanggan Anda sendiri: siapa yang datang kepada Anda dan mengapa mereka melakukannya. Karena bukan rahasia lagi bahwa di bar sushi kebanyakan orang (saya tidak akan mengatakan "perempuan") mengambil gambar untuk check-in, mengambil foto, dll. Merek dapat menggunakan ini. Merek tersebut tertarik pada produk seperti apa yang dia butuhkan untuk memotret dengan indah dan mengunggah, orang macam apa yang datang ke sana. Hal seperti itu dapat dihidupkan dengan hampir semua hal, mulai dari makanan.Pengakuan gambar di video
Jawaban atas pertanyaan dari hadirin:- Di video - tidak. Kami memilikinya dalam mode uji. Kami mencoba teknologi ini, tetapi ternyata ... Ini mengenali semuanya dengan video dengan cukup baik, tetapi kami tidak menemukan aplikasi untuk itu. Sampai jumpa. Kecuali analisis berapa banyak, yang dikatakan blogger video di suatu tempat ... Ada penelitian semacam itu. Berapa banyak wajah yang bertemu, seberapa sering. Tetapi untuk merek, mereka belum menemukan di mana harus datang dengan ini. Mungkin suatu hari nanti akan datang.
Sekali lagi, ini makanan, bisa wanita hamil, pria (tidak hamil), mobil - apa saja.Sebagai pilihan, ada studi Tahun Baru untuk satu media. Juga jauh dari iklan, namun demikian. Ini adalah jenis makanan apa yang diposkan orang pada Malam Tahun Baru:
Masih rusak karena usia. Anda dapat melihat korelasi yang sedemikian rupa sehingga anak muda kebanyakan memesan makanan, orang dewasa kebanyakan membuat meja tradisional. Suatu hal yang lucu, tetapi membayangkannya sebagai pemilik merek, Anda dapat menghargai banyak hal: siapa dan bagaimana produk Anda diperlakukan, apa yang mereka tulis tentang itu. Seringkali, orang tidak selalu menyebutkan merek itu sendiri dalam teks, dan sistem pemantauan analitis tradisional tidak selalu dapat memahami apakah menemukan merek ini hanya karena tidak disebutkan dalam teks. Atau dalam teks itu ditulis dengan kesalahan, tidak ada tag hash atau apa pun.Foto terlihat. Dengan fotografi, Anda dapat memahami apakah itu objek bingkai pusat, bukan objek bingkai pusat. Maka Anda dapat melihat apa yang ditulis orang ini. Tetapi paling sering digunakan sebagai pencarian untuk audiens potensial yang mengendarai mobil tertentu dan sebagainya. Dan kemudian kita akan melakukan banyak hal menarik dengan mobil-mobil ini.Bot diajarkan untuk meniru manusia.
Berikut ini adalah aplikasi penghitungan orang:
Ada varian orang yang cocok ketika Anda perlu menemukan orang dari beberapa foto, memahami profil sosial mereka, siapa mereka. Sekali lagi, kami kembali ke pertanyaan bahwa jika kami memiliki kamera di toko offline, maka ini adalah cara yang cukup baik untuk memahami siapa yang mendatangi Anda, siapa orang-orang ini, apa yang mereka minati, apa yang membuat mereka mendatangi Anda.Maka hal yang paling menarik: jika kita mengumpulkan akun mereka di jejaring sosial, memahami siapa orang-orang ini, apa yang mereka minati, kita dapat (sebagai pilihan) membuat bot yang mirip dengan orang-orang ini; bot ini akan mulai hidup seperti orang-orang ini dan menganalisis iklan seperti apa yang dilihatnya di berbagai jejaring sosial. Ini akan memungkinkan Anda untuk memahami merek mana yang difokuskan pada orang ini secara akurat. Ini juga merupakan kisah yang cukup umum ketika perlu tidak hanya menganalisis siapa orang ini dan apa minatnya, tetapi juga jenis iklan yang dapat ditargetkan pesaing Anda atau orang lain yang tertarik.
Analisis koneksi di jejaring sosial
Hal berikutnya yang menarik: ini adalah analisis hubungan antar manusia. Sebenarnya, analisis koneksi dalam jaringan itu sendiri, grafik jaringan ini - ini bukan setetes sama sekali, tidak ada yang baru, semua orang tahu itu.
Tetapi aplikasi untuk tugas-tugas periklanan adalah yang paling menarik. Ini adalah pencarian untuk orang yang menetapkan tren, ini adalah pencarian untuk orang yang menyebarkan informasi sesuai dengan kriteria tertentu dalam jaringan ini. Katakanlah kita tertarik pada pemilik yang sama dari model BMW tertentu. Dengan menyatukan mereka semua, kita dapat menemukan mereka yang memegang opini publik. Ini belum tentu blogger otomotif dan sebagainya. Biasanya ini adalah kawan biasa yang duduk di berbagai tempat umum, tertarik pada beberapa jenis konten dan dapat, dalam waktu yang sangat singkat, memikat merek Anda atau seseorang yang menarik bagi Anda ke dalam zona tanggung jawab ini, ke dalam zona minat.Ada contoh seperti itu. Kami memiliki beberapa orang potensial, koneksi antar orang. Di sini, oranye adalah orang, titik-titik kecil adalah kelompok umum, teman biasa.
Jika Anda mengumpulkan semua koneksi ini di antara mereka, Anda dapat dengan jelas melihat bahwa ada orang-orang yang memiliki sejumlah besar kelompok bersama, teman-teman biasa, mereka ada di antara mereka sendiri ... Dan jika kita membagi visualisasi ini menjadi kelompok-kelompok sesuai dengan minat dan konten mereka, yang mereka sebarkan, seberapa banyak mereka berinteraksi satu sama lain ... Di sini Anda dapat melihat seperti apa gambar sebelumnya:
Itu jelas membedakan warna kelompok. Dalam hal ini, ini adalah mahasiswa pascasarjana kami di Sekolah Tinggi Ekonomi. Di sini Anda dapat melihat bahwa ungu / biru adalah mereka yang menyukai Transparency International, Open Russia, dan publik Khodorkovsky. Kiri bawah berwarna hijau, mereka yang mencintai Rusia Bersatu.Anda dapat melihat bahwa gambar sebelumnya seperti ini (itu hanya komunikasi antara orang-orang), tetapi telah menjadi jelas digambarkan. Artinya, semua orang selalu terhubung, mereka memiliki minat yang sama, mereka berteman satu sama lain. Di atas satu, di bawah yang lain, masih ada beberapa kawan. Dan jika masing-masing subgraph kecil ini secara terpisah divisualisasikan dengan parameter lain dan melihat kecepatan distribusi konten (secara kasar, siapa yang memposting ulang), Anda dapat menemukan di setiap bagian satu atau dua orang yang selalu memegang opini publik di tangan mereka, berinteraksi dengan yang, bertanya kirim postingan atau sejenisnya - Anda bisa mendapat respons dari semua audiens yang menarik ini.Saya punya satu contoh lagi. Juga sebuah grafik: ini adalah karyawan BBDO Group yang ditemukan di jejaring sosial sebagai contoh. Sepertinya ada hubungan yang tidak menarik, besar, hijau, di antara mereka ...
Tapi saya punya pilihan di mana kelompok telah dibangun di antara mereka. Lalu, jika ada yang tertarik, ada versi interaktif - Anda dapat mengklik, lihat.Di atas kanan adalah mereka yang mencintai Putin. Di sini, violet adalah perancang; mereka yang gemar desain, sesuatu yang sangat menarik dan sebagainya. Di sini, barang putih adalah tim manajemen (tampaknya, seperti yang saya mengerti); ini adalah orang-orang yang umumnya tidak terhubung dengan cara apa pun, tetapi bekerja di posisi yang kira-kira sama. Sisanya adalah kelompok umum mereka, hubungan, dan sebagainya.Merek tidak perlu blogger, tetapi pemimpin opini
Kami mengambil orang-orang ini dan menemukan - kemudian agen periklanan, perusahaan periklanan memutuskan sendiri: dia dapat memberikan uang kepada orang ini sehingga ia entah bagaimana berinteraksi dengan konten ini, sesuatu yang lain, atau mengarahkan kampanye iklan spesifiknya kepada mereka. Ini juga sering digunakan, terutama sekarang, karena semua merek ingin bekerja dengan blogger, mereka ingin mempromosikan konten mereka, dan biro iklan tidak benar-benar ingin menghubungi (yah, itu terjadi).Dan jalan keluar sebenarnya dari situasi ini adalah menemukan orang yang bukan blogger, bukan blogger kecantikan, tetapi, misalnya, beberapa makhluk nyata yang berinteraksi dengan merek ini, mereka dapat menulis di beberapa tempat umum yang menyedihkan. dapatkan sejumlah tampilan. Orang-orang ini, yang terus-menerus tertarik pada konten orang ini, mereka akan menyebarkan semuanya, dan merek akan mendapatkan keterlibatannya.Opsi kedua, bagaimana menggunakan teknologi serupa sekarang, cukup relevan - ini adalah pencarian bot, favorit saya. Ini adalah risiko reputasi bagi pesaing Anda, dan kemampuan untuk menyingkirkan orang-orang yang tidak relevan dari kampanye iklan, dan yang lainnya (dan menghapus komentar serta mencari koneksi di antara orang-orang). Saya punya contoh seperti itu, ia juga punya satu interaktif besar - itu bisa dipindahkan. Ini adalah koneksi orang-orang yang menulis komentar di komunitas Lentach.Contoh seperti itu - sehingga Anda memahami seberapa baik dan sederhana Anda dapat melihat bot; dan untuk ini Anda tidak perlu memiliki pengetahuan teknis. Jadi, Lentach merilis posting tentang penyelidikan FBK tentang Dmitry Medvedev, dan orang-orang tertentu mulai menulis komentar. Kami mengumpulkan semua orang yang menulis komentar - orang-orang ini berwarna hijau. Sekarang pindah:
Orang berwarna hijau (yang menulis komentar). Mereka ada di sini, mereka ada di sini. Titik-titik biru di antara mereka adalah kelompok umum mereka, kuning adalah pelanggan umum, teman, dan sebagainya. Inilah sebagian besar orang yang terhubung. Karena, apa pun teori tiga, empat, lima jabat tangan, semua orang saling terhubung di jejaring sosial. Tidak ada orang yang terpisah satu sama lain. Bahkan teman-teman sosiofobik saya yang menggunakan Vkontakte secara eksklusif untuk menonton video semuanya sama berlangganan beberapa pos publik bersama kami.Massal juga menggunakan bot. Setiap orang punya bot
Sebagian besar orang (ini dia, ini) saling berhubungan. Tetapi ada sekelompok kecil kawan yang berteman secara eksklusif satu sama lain. Inilah mereka, greenbacks, ini adalah teman dan kelompok bersama mereka. Mereka bahkan jatuh secara terpisah di sini:
Dan kebetulan, orang-orang inilah yang menulis di bawah posting ini: "Navalny tidak memiliki bukti," dan seterusnya, menulis komentar yang sama. Tentu saja, saya tidak berani mengambil kesimpulan. Namun demikian, saya punya posting lain di Facebook, ketika ada perdebatan antara Lebedev dan Navalny, saya menganalisis komentar dengan cara yang sama: ternyata semua orang yang menulis "Lebedev - sial", mereka tidak pergi ke jejaring sosial lalu empat bulan, tidak berlangganan salah satu publik, tiba-tiba pergi ke posting ini, menulis komentar ini dan pergi. Kesimpulan, sekali lagi, dari sini tidak mungkin untuk menggambar, tetapi seseorang dari tim Navalny menulis komentar kepada saya bahwa mereka tidak menggunakan bot. Baiklah, oke!Lebih dekat dengan iklan, lebih dekat dengan merek. Setiap orang memiliki bot sekarang! Kami memilikinya, ada pesaing, dan orang lain. Mereka harus dibuang atau ditinggalkan agar mereka hidup dengan baik; berdasarkan data tersebut (menunjukkan slide sebelumnya) untuk menyempurnakan mereka sehingga mereka terlihat seperti orang sungguhan dan hanya kemudian menggunakannya. Meskipun menggunakan bot itu buruk! Namun demikian, cerita yang cukup umum ...Dalam mode otomatis, hal seperti itu memungkinkan Anda untuk menyaring orang-orang yang tidak relevan untuk analisis dari analisis Anda, orang-orang yang seharusnya tidak berada dalam sampel, tidak boleh dalam penelitian ini. Sangat sering digunakan. Sekali lagi, tidak semua pemilik mobil memang pemilik mobil. Kadang-kadang itu menarik hanya untuk orang-orang yang memiliki mobil potensial, yang duduk dalam beberapa kelompok, berkomunikasi dengan seseorang, mereka memiliki audiens tertentu di sana.Analisis fakta dan pendapat
Hal berikutnya yang saya miliki adalah juga favorit saya. Ini adalah analisis fakta dan pendapat.
Menyebutkan merek Anda di berbagai sumber kini dapat melakukan segalanya. Tidak ada rahasia untuk ini. Dan sepertinya semua orang tahu bagaimana menghitung nada suara ... Meskipun saya pribadi berpikir bahwa metrik nada suara itu sendiri tidak terlalu menarik, karena ketika Anda datang dan berkata kepada klien, "Man, Anda memiliki 37% netral, - dan dia mengatakan itu," Wow! Keren! ”Oleh karena itu, akan lebih menarik untuk bergerak sedikit lebih jauh: dari menilai nada suara hingga mengevaluasi pendapat tentang apa yang dikatakan tentang produk Anda.Dan ini juga merupakan hal yang sangat menarik, karena ... Saya pribadi berpikir bahwa pada prinsipnya tidak ada pesan netral, karena jika seseorang menulis sesuatu di ruang publik, pesan ini entah bagaimana berwarna. Jadi saya pribadi belum pernah melihat pesan netral yang menyebutkan merek. Biasanya ini semacam kotoran.Jika kita mengambil sejumlah besar pesan ini (mungkin ada jutaan, 10 juta), pilih ide utama dari setiap pesan, gabungkan mereka, kita dapat memahami dengan cukup andal bahwa orang berbicara tentang merek ini, apa yang mereka pikirkan. "Aku tidak suka kemasannya," "Aku tidak suka teksturnya," dan seterusnya.Apa yang mereka pikirkan tentang Transaero, Chupa Chups dan Presiden AS
Saya punya contoh konyol: ini adalah infografis tentang apa yang akan dilakukan pengguna jaringan sosial dengan Transaero setelah kebangkrutannya.
Ada banyak contoh menarik: bakar, bunuh, kirim ke Eropa, bahkan ada 2% yang menulis - "Kirim mereka ke Suriah untuk operasi militer." Beranjak dari hal yang konyol, bisa jadi merek apa saja secara praktis - mulai dari makanan anjing favorit saya, berakhir dengan beberapa mobil. Siapa pun yang tidak suka kemasan, yang tidak suka hal-hal nyata, Anda selalu bisa bekerja dengan ini, Anda selalu bisa memperhitungkannya. Ada banyak contoh ketika orang hampir mengubah produksi mereka, karena di jejaring sosial mereka menulis bahwa lollipop tidak cukup bulat atau tidak cukup manis.Masih ada contoh yang konyol. Tebak komentar apa dan tentang siapa?
Untuk beberapa alasan, sekarang merupakan analisis pendapat, analisis fakta yang disorot dari pesan, yang tidak terlalu digunakan, tidak terlalu luas. Meskipun teknologi ini bukan rahasia super, praktis tidak ada pengetahuan dalam hal ini, karena dari komentar orang untuk memilih subjek, predikat dan kelompokkan mereka - Anda tidak perlu menjadi jenius linguistik komputer. Ini tidak begitu sulit. Tetapi saya berharap bahwa dalam beberapa tahun ke depan orang akan mulai menggunakannya, karena ... Itu akan keren - ini adalah umpan balik otomatis! Anda selalu tahu apa yang mereka katakan tentang Anda. Nah, Anda mengerti bahwa ini tentang Presiden Amerika Serikat.Jawaban atas pertanyaan dari hadirin:- Ya, ini Facebook English. Mereka diterjemahkan ke dalam bahasa Rusia di sini. Di suatu tempat itu ditulis.
Big Data
Sebenarnya, saya memiliki banyak contoh politik menarik yang berbeda tentang Trump dan tentang orang lain, tetapi saya memutuskan untuk tidak membawanya ke sini. Tetapi ada satu contoh politik.
Ini adalah pemilihan ke Duma Negara. Kapan kamu Tahun lalu Hampir satu setengah tahun yang lalu.

Berikut adalah orang-orang yang berhasil menentukan lokasi pasti mereka, hingga titik geografis tertentu, untuk memahami apa PEC selektif mereka. Dan kemudian hanya mereka yang menyatakan pendapat tertentu diambil dari orang-orang ini, untuk siapa mereka akan memilih.
Dari sudut pandang teknologi politik, ini tidak terlalu benar, karena semuanya perlu dinormalisasi untuk kepadatan populasi dan sebagainya. Namun demikian, blues akan memilih di sini, Anda tahu untuk siapa, yang merah untuk kawan-kawan oposisi, yang, omong-omong, tidak begitu banyak.
Saya pribadi berpikir bahwa Big Data tidak akan mencapai teknologi politik segera, tetapi, sebagai pilihan, kandidat juga merupakan merek. Dan ini juga, sampai batas tertentu, analisis fakta dan pendapat tentang merek Anda, dan hal yang cukup menarik, karena Anda dapat memahami secara real time siapa yang melakukan apa. Saya sekarang tahu beberapa kasus dari BBC ketika mereka memonitor jaringan sosial secara real time di beberapa siaran: responnya begini dan begitu, orang-orang menulis tentang itu, menanyakan pertanyaan ini dan itu - dan itu keren! Saya pikir itu akan diterapkan segera, karena menarik bagi semua orang.
Memodelkan posisi merek

Selanjutnya saya telah memodelkan posisi merek. Suatu hal kecil dan pendek tentang bagaimana menggunakan berbagai metrik (bukan suka pelanggan di jejaring sosial, tetapi menggunakan metrik yang kompleks, minat pada konten, waktu yang dihabiskan untuk mendapatkan metrik) Anda dapat menentukan peringkat merek.

Saya punya contoh untuk "pertanian" untuk yang tertentu. Di sini, lingkaran bundar kecil adalah internal, cerah - ini adalah jumlah konten teks yang dibuat oleh merek, lingkaran bundar besar - ini adalah jumlah konten foto dan video yang dibuat oleh merek.
Kedekatan dengan pusat menunjukkan betapa menariknya konten ini bagi pemirsa. Ada model besar, ada banyak jenis parameter: suka, repost, waktu respons, yang dibagi rata di sana ... Di sini Anda dapat melihat: ada "Kagocel" yang hebat yang menghasilkan banyak uang untuk membuat konten Anda sendiri, dan karena ini mereka cukup dekat ke pusat. Dan ada kawan-kawan yang juga membuat konten mereka, tetapi tidak menarik bagi audiens. Ini bukan contoh yang sangat memadai, karena semua akun ini hampir mati.
Cinta Yegor Creed lebih dari Basta

Sayangnya, sisanya ... dari apa yang ditampilkan ... Di sini, masih ada rapper Rusia, sebagai pilihan, dari perusahaan nyata.
Apa plusnya? Fakta bahwa perusahaan dapat memasukkan hampir semua hal ke dalam model seperti itu, mulai dari gaji rata-rata pelanggan yang ada di merek Anda; model apa pun yang mereka suka. Karena setiap biro iklan menganggap metriknya sendiri berbeda, merek menganggap metrik mereka sendiri berbeda.
Ada juga satu di sini - Basta, yang menghasilkan sejumlah besar konten, tetapi terletak di pinggiran, karena konten ini, tampaknya, tidak terlalu menarik bagi penonton. Sekali lagi, saya tidak berani menilai. Namun demikian, ada Yegor Creed, yang, menurut jejaring sosial, hampir merupakan penampil terbaik di zaman kita, dan pada saat yang sama hanya mempublikasikan foto pribadinya. Namun demikian, ia memiliki sejumlah besar pelanggan: ada sekitar satu juta dari mereka. Saya tidak ingat jumlah persisnya; Saya ingat bahwa persentase keterlibatan orang-orang ini jauh lebih tinggi dari 85%, yaitu, untuk satu juta pelanggan ia menerima 850 ribu tanggapan dari orang-orang nyata ini - ini benar-benar gila. Begitulah.
Jawaban untuk pertanyaan audiens:Berapa banyak waktu yang diperlukan untuk menyusun model analisis rapper?
- Masing-masing memiliki target audiensnya sendiri, minatnya, orang-orang ini dihitung ... Semua ini dinormalisasi ke jarak ke pusat, posisi radial mereka tidak penting (hanya dioleskan di sini untuk kecantikan, sehingga mereka tidak saling bertemu). Hanya perkiraan kedekatan dengan pusat yang penting. Ini adalah model yang kami gunakan. Sebagai contoh, saya lebih menyukai lingkaran, seseorang melakukannya dalam pikiran setengah lingkaran.
- Model ini dikompilasi dengan cepat, dalam dua jam, dalam tiga (ya, satu orang). Di sini, secara eksklusif metrik dimasukkan: apa yang kita gandakan, tambahkan, lalu tuli. Tergantung pada modelnya. Ada orang yang tertarik dengan gaji rata-rata (ini bukan lelucon) dari pelanggan mereka. Dan untuk ini, Anda perlu menemukan kontak mereka, "Avito", semua ini untuk menghitung, kalikan. Itu terjadi, butuh waktu lama, tetapi secara khusus (menunjuk ke slide sebelumnya) - berikut adalah parameter yang sangat sederhana: pelanggan, repost, dan sebagainya. Butuh sekitar dua hingga tiga jam. Dengan demikian, benda ini kemudian diperbarui secara real time, dapat digunakan.
Sekarang bagian yang menyenangkan. Saya punya segalanya dengan contoh, karena tidak menarik untuk berbicara sendirian untuk waktu yang lama. Dan saya harap Anda sekarang akan mengajukan pertanyaan, dan kami akan bergerak lebih jauh, dari satu topik ke topik lainnya, karena saya memiliki contoh bagaimana teknologi dapat digunakan dan seterusnya ...
Jawaban untuk pertanyaan audiens:- Saya punya satu dan satu-satunya kasus pribadi dengan satu, jadi untuk berbicara, okolokazino, ketika kamera ditempatkan di sana, wajah-wajah dikenali, dan sebagainya. Persentase orang yang dikenal jelas sangat besar - apa yang kita miliki, apa yang dimiliki pesaing kita. Namun sebenarnya ini cukup menarik. Saya melihat ini sebagai hal yang menarik: Anda dapat memahami siapa orang-orang ini dan untuk memprediksi dengan baik mengapa mereka datang ke sini, apa yang telah berubah dalam hidup mereka, sehingga mereka memutuskan untuk datang ke kasino. Tetapi tentang jenis-jenis bisnis tertentu ... Jika Anda menaruh barang semacam itu di apotek, maka tidak masuk akal - Anda tidak dapat memprediksi mengapa seseorang datang ke apotek.
Tugas global di sini adalah membangun model untuk memahami kapan seseorang berpotensi ingin menarik minat merek Anda, untuk memberinya iklan bukan setelah ia membeli sesuatu (seperti yang terjadi sekarang), tetapi untuk memberinya iklan "sesuai perkiraan" ketika semuanya terjadi. Dengan "okolokazino" itu menarik; di sana, persentase yang agak menarik dari orang-orang ini ternyata - mengapa: seseorang tiba-tiba mendapat kenaikan gaji, orang lain sesuatu - wawasan yang menarik. Tetapi dengan beberapa toko, dengan ritel, dengan toko beberapa pil, menurut saya itu tidak akan benar.
Apakah Big Data digunakan offline?
- Itu offline. Anda hanya perlu mengerti persis, kira-kira - model ini akan konvergen, tidak akan konvergen. Sekali lagi, dengan air soda ... Saya sebenarnya tertarik pada segalanya, tetapi saya pribadi tidak mengerti seberapa besar profil orang-orang ini tergantung pada perilaku mereka ketika mereka ingin membeli air botolan. Meskipun ini mungkin benar, saya tidak tahu.
Berapa banyak akun terbuka di jejaring sosial?
- Kami memiliki 11 jejaring sosial khusus - ini Vkontakte, Facebook, Twitter, Odnoklassniki, Instagram, dan beberapa hal kecil di sana (saya dapat melihat daftar, seperti Mail.ru dan sebagainya). "Vkontakte" kita pasti memiliki salinan dari semua kawan ini. Kami memiliki orang-orang Vkontakte - ini adalah 430 juta dari semua yang pernah ada (yang sekitar 200 juta terus aktif); ada kelompok, ada koneksi antara orang-orang ini, dan ada konten yang menarik bagi kita (teks), dan bagian dari media, tetapi sangat kecil ... Secara kasar, kita melihat gambar ini: jika ada wajah, kita menyelamatkan mereka, jika memesik kita menggunakannya Kami tidak menyimpan, karena bahkan dengan kami, tidak akan ada cukup apa pun untuk mempertahankan konten media.
Ada Facebook berbahasa Rusia. Di suatu tempat sekarang 60-80% adalah Odnoklassniki, dalam beberapa bulan kita mungkin akan mendapatkan semuanya sampai akhir. Rusia "Instagram". Untuk semua jejaring sosial ini, ada kelompok, orang, koneksi di antara mereka dan teks. - Sekitar 400 juta orang. Ada kehalusan: ada orang yang tidak memiliki kota (mereka berpotensi Rusia / non-Rusia); dari mereka rata-rata di jejaring sosial, di sini - di Vkontakte - 14% dari akun tertutup, saya tidak tahu angka pastinya di Facebook.
- Di Instagram kami juga tidak menyimpan media - hanya jika ada wajah di sana. Kami tidak menyimpan konten media (lainnya) tersebut. Biasanya menarik: hanya teks, komunikasi antar orang; itu saja. Penelitian Instagram yang paling sering adalah penelitian yang biasa dilakukan oleh audiensi: siapa orang-orang ini, seperti hal terpenting di sini adalah hubungan orang-orang ini dengan jejaring sosial lainnya. Temukan profil orang ini di Vkontakte dan Facebook untuk menghitung usianya dan seterusnya.
- Sejauh ini, tidak perlu membawa orang lain - hanya karena tidak ada pelanggan. Mengenai bahasa: kami memiliki Rusia, Inggris, Spanyol, tetapi masih digunakan sejauh ini untuk merek-merek dari Rusia; baik, atau perusahaan yang memimpin mereka dari Rusia.
- Setiap hari kami mewawancarai banyak orang, banyak, banyak aliran: kami mengumpulkan data dengan mengumpulkan web, dan kami memperbarui indikator ini menggunakan Api. Dalam 2-3 hari Anda dapat melewati seluruh Vkontakte, setelah memindai mereka; suatu tempat dalam seminggu Anda dapat pergi melalui seluruh Facebook, menyadari siapa yang telah memperbarui di sana, apa yang tidak. Dan kemudian orang-orang ini harus disusun kembali secara terpisah: apa yang sebenarnya telah berubah, untuk menuliskan seluruh cerita ini. Dalam ingatan saya, sangat jarang beberapa tugas bisnis nyata menggunakan profil lama seseorang di jejaring sosial. Ini adalah saat ketika seorang politisi mendekat, dan tugasnya adalah memahami orang seperti apa yang datang ke markas, siapa orang-orang ini 6-8 bulan yang lalu (bukankah mereka menghapus profil mereka, tetapi pada kenyataannya untuk kandidat lain, surat suara datang merusak).
Dan beberapa kali - kisah pribadi ketika foto seseorang dipublikasikan untuk umum. Itu perlu untuk menemukan koneksi, dll. Sayangnya, itu sangat menyedihkan, tetapi kami tidak dapat bersaksi di pengadilan, karena basis kami tidak sah secara hukum. - Repositori MongoDB adalah favorit saya.
Jejaring sosial bergumul dengan pengumpulan data
- Biasanya, kami pengiklan membongkar hanya daftar akun ini, dan kemudian mereka menggunakan standar ... Artinya, di jejaring sosial, di Vkontakte sana, Anda dapat menentukan daftar orang-orang ini.
Tetapi untuk Facebook, cookie yang dibeli digunakan. Kami sendiri tidak bekerja dengan cookie, tetapi ada beberapa cerita ketika pengiklan sendiri memberi beberapa orang, kami berinteraksi dengan mereka - mereka memiliki jaringan ini, dengan penggoda, iklan non-penggoda, cookie ini. Anda dapat mengikat - tidak ada pertanyaan! Tetapi saya tidak terlalu suka hal-hal ini, karena saya pikir ini tidak terlalu dapat diandalkan. Itu murni menurut saya, seperti TNS, yang “mengalirkan” TV - tidak jelas apakah Anda menonton TV ini, jangan menonton, Anda mencuci piring saat TV Anda bekerja ... Dan hal yang sama di sini: Saya sangat sering mencari sesuatu di Google Internet, tetapi itu tidak berarti bahwa saya ingin membelinya. - Jika Anda menggunakan jaringan standar semacam iklan kontekstual: Saya punya beberapa cerita ketika kami menurunkan orang-orang ini kepada mereka, mencoba menggunakan antarmuka mereka untuk mengikat mereka dengan "cookie" di situs mereka. Tapi saya tidak terlalu suka hal-hal seperti itu.
Formula Penggajian Pengguna Internet
- Rumus umum untuk gaji rata-rata: ini adalah wilayah di mana orang itu tinggal, ini adalah kategori bisnis tempat dia bekerja (yaitu, perusahaan yang menjadi majikannya), maka posisinya di perusahaan ini diambil, gaji rata-rata dalam posisi ini dianggap ... Gaji rata-rata diambil dari Head Hunter dan Super Job (dan ada beberapa sumber lagi) untuk lowongan yang diberikan di wilayah tertentu dan untuk konteks bisnis tertentu.
Dengan Avito dan Auto.ru, parameter tambahan biasanya diambil jika seseorang menyalakan telepon. Dengan Avito Anda dapat melihat barang-barang apa yang dijual seseorang - mahal, murah, digunakan, tidak digunakan. Dengan "Auto.ru" Anda dapat melihat apakah ia memiliki mobil - yang dimilikinya, bukan miliknya. Ini adalah suatu tempat yang kurang dari 20% orang yang secara tidak sengaja menjatuhkan ponsel mereka di suatu tempat, dan akun mereka dapat diikat dengan data ini.
Seberapa besar perusahaan pengumpulan data?
- Volume foto yang disimpan dalam petabyte adalah 6,4. Saya tidak bisa mengatakan dengan pasti tingkat pertumbuhan saat ini, karena pada tahun 2016 kami mulai merekam periskop dan mulai merekam video sedikit.
Saya tidak bisa mengatakan kapan tepatnya nol. Kami pergi dari perusahaan ke perusahaan - semua ini adalah cerita yang panjang. Tetapi saya dapat mengatakan bahwa VK, Facebook, Instagram, dan Twitter - semua bisnis ini (orang, grup, dan tautan di antara mereka) dengan teks dan konten - ini sebenarnya bukan data yang banyak, hampir tidak ada petabyte dijemput. Saya pikir ini adalah gigabyte 700, mungkin 800.
Bantu klien mengidentifikasi niche saat ini, di mana "menggali"?
- Ketika klien datang, kami memberitahunya hal-hal seperti itu, tetapi kami, seperti Google Trends, tidak melakukan hal-hal ini.
- Kami memiliki beberapa kisah sosiologis yang dekat, dengan sejarah pra-pemilihan yang elektif - kami menganalisis semua ini. Dengan merek dan mengevaluasi pendapat tentang merek, semuanya hampir selalu setuju. Inilah kisah-kisah pemilihan-elektif - tidak (dengan penilaian calon mana yang akan menang). Nah, siapa yang salah di sini - kita, atau mereka yang percaya pada VTsIOM - saya tidak tahu.
- Biasanya kami mengambil hasil kontrol ini dari merek itu sendiri, mereka mengambilnya dari kawan-kawan yang memesan penelitian - telepon di sana, pemasaran, dan sebagainya. Plus, semua ini dapat diperiksa dengan hal-hal dasar: seseorang menjawab buletin di sana, seseorang polling ... Jika ini adalah merek besar (Coca-Cola, misalnya), mereka harus memiliki sejuta atau dua ulasan pelanggan internal - ini bukan hanya komentar di jejaring sosial dan pendapat apa pun; beberapa sistem internal, ulasan, dan sebagainya.
Undang-undang tidak “tahu” apa data pribadi itu!
- Kami menganalisis sumber data terbuka secara eksklusif, kami tidak pernah naik ke chernukha kotor. Model kami didasarkan pada kenyataan bahwa kami menyimpan semua data terbuka di beberapa pusat data publik, menyewanya di tempat lain, dan menganalisanya di rumah, di wilayah kantor, di server kami, dan ini tidak pergi ke mana pun di luar wilayah tersebut.
Tetapi undang-undang data terbuka kami sangat kabur.
Kami tidak memiliki pemahaman yang jelas tentang apa itu data terbuka, apa itu data pribadi - ada Undang-undang Federal ke 152 ini, tetapi bagaimanapun ... Mereka berpikir bagaimana caranya? Sekarang, jika saya memiliki nama dan telepon Anda di satu basis data, saya punya telepon dan surel Anda di basis data lain, dan di yang ketiga, katakanlah, surel dan mobil Anda; semua ini seperti data non-pribadi. Jika Anda menggabungkan semuanya, sepertinya secara hukum itu akan menjadi data pribadi.
Kami menyiasati ini dengan dua cara. Pertama, kami menempatkan server dengan perangkat lunak ke klien, dan kemudian data ini tidak melampaui wilayahnya, dan kemudian klien bertanggung jawab untuk menyebarluaskan data pribadi ini, bukan data pribadi, dan sebagainya. Atau opsi kedua: jika ini adalah semacam cerita di mana Anda harus menuntut jaringan sosial atau yang lain ...
Kami melakukan penelitian seperti itu ketika kami mengumpulkan (adalah pendahuluan Rusia Bersatu) untuk akun LifeNews dari kawan-kawan ini dan menonton film porno apa yang mereka sukai. Lucunya, tapi tetap saja. Kami menjual ini sebagai pendapat pribadi kami, tanpa mengungkapkan secara hukum dalam dokumen yang kami analisis - daftar, gaji, jejaring sosial; kami menjual pendapat ahli, dan sudah ada di sela-sela kami menjelaskan kepada orang itu apa yang kami analisis dan bagaimana.
Ada beberapa cerita, tetapi mereka dikaitkan dengan beberapa proyek komersial publik. Misalnya, kami memiliki proyek nirlaba gratis bagi mereka yang mengendarai longboard (papan seperti itu panjang): tugasnya adalah mengumpulkan publikasi orang - ketika seseorang memposting, "Saya pergi ke taman Gorky untuk ditunggangi." Dan kemudian dia harus masuk ke peta, dan orang-orang di sekitarnya dapat melihat seseorang di sebelahnya. VK menghabiskan waktu yang sangat lama untuk bertengkar dengan kami mengenai hal ini, karena mereka tidak suka kami mempublikasikan informasi ini tanpa seizin orang. Tetapi kemudian masalah tersebut tidak dibawa ke pengadilan, karena kami di dalam beberapa komunitas besar menambahkan aturan bahwa data dapat digunakan oleh agensi pihak ketiga, agensi, analisis, dll. Tentu saja, itu tidak terlalu etis, tetapi tetap saja. - Kami tiba-tiba menangkap dan mulai menjual pendapat ahli kami kepada semua orang.
Apakah Anda bekerja dengan lembaga pendidikan?
- Kami bekerja sama dengan pendidikan, ya. Kami memiliki seluruh rangkaian: kami memiliki program master di Sekolah Tinggi, kami bekerja sama dengan universitas lain. Universitas yang sangat kami cintai!
- Ada kontak saya - Anda dapat menulis. Dan referensi ke presentasi, jika ada yang tertarik - ada semua contoh ini, Anda bisa pindah.
- Jika telepon diketahui, surat hampir merupakan pilihan mutlak, tidak ada yang akan menghapusnya. Jika tidak ada telepon, ini biasanya sebuah gambar, tidak ada gambar - ini adalah tahun, tempat tinggal, pekerjaan. Artinya, dari tahun ke tahun, tempat tinggal dan pekerjaan hampir semua dapat selalu diidentifikasi secara halus. Tapi ini, sekali lagi, adalah pertanyaan tentang tugas itu.
Kami memiliki, katakanlah, klien yang menjual TV Internet. Seseorang membeli langganan Game of Thrones ini dari mereka, dan tugasnya adalah menemukan orang-orang ini dari CRM mereka di jejaring sosial, dan kemudian menemukan yang potensial dari wilayah pengaruh mereka. Saya hanya mengatakan bahwa mereka memiliki, katakanlah, nama, nama keluarga dan email ... Dan karenanya sangat sulit untuk melakukan sesuatu. Dalam kebanyakan kasus, Anda dapat menemukan orang melalui email. - Dalam hal teman, kami biasanya "mencocokkan" orang dengan jaringan sosial, tetapi ini tidak selalu benar. Bukan berarti itu tidak selalu benar - itu tidak selalu berhasil. Pertama, ini membutuhkan banyak tenaga kerja, karena operasi ini (untuk orang yang cocok) harus dilakukan terlebih dahulu untuk masing-masing teman - untuk memahami apakah mereka beralih dari jejaring sosial atau tidak. Dan kemudian - karena tidak ada yang tahu fakta bahwa "Vkontakte" kita hanya punya teman, di "Facebook" kita punya teman lain. Bukan untuk semua orang, tetapi untuk saya, misalnya, seperti itu; .
?
- . , , . NDA. , , , , – , , . , – , – .
?
- , , , – , , – . , , , – Social Data Hub, . . , , , , . , …
- ( ?) , , .
( ): , , . - «» – 14%, «» ( ). , – .
, !
- , – . , «». , , … , ! - – , . – , . , , …
- : «, - ! !» , . - , – , , … , , 5 , - . , HR-, , : « – »!
. ?
- -10 . : … – , HR- , . , , - …
- ( ) 25 , .
- , , , 50 %. , - . , 40 , 50-60 % . . , - , , - , , … , – , . .
Sedikit iklan :)
Terima kasih telah tinggal bersama kami. Apakah Anda suka artikel kami? Ingin melihat materi yang lebih menarik? Dukung kami dengan melakukan pemesanan atau merekomendasikan kepada teman Anda
VPS berbasis cloud untuk pengembang mulai $ 4,99 ,
analog unik dari server entry-level yang diciptakan oleh kami untuk Anda: Seluruh kebenaran tentang VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps mulai dari $ 19 atau cara membagi server? (opsi tersedia dengan RAID1 dan RAID10, hingga 24 core dan hingga 40GB DDR4).
Dell R730xd 2 kali lebih murah di pusat data Equinix Tier IV di Amsterdam? Hanya kami yang memiliki
2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV dari $ 199 di Belanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - mulai dari $ 99! Baca tentang
Cara Membangun Infrastruktur Bldg. kelas menggunakan server Dell R730xd E5-2650 v4 seharga 9.000 euro untuk satu sen?