Halo semuanya! Tanner Stokes
menulis add-on yang dibuat ulang teks komentar di YouTube di "herp derp". Ini telah membuat hidup lebih baik bagi sebagian orang. Kami pergi dengan cara yang sama, tetapi sedikit mengubah konsep. Kami menyajikan komentar YouTube dalam bentuk gambar, atau lebih tepatnya grafik dengan simpul dan ujung. Dan kami memvisualisasikan semua jenis objek - dari video dan saluran ke persimpangan lintas genre. Bagaimana kita melakukan ini? Ayo cari tahu.

Mengapa kita memvisualisasikan
Para filsuf mengatakan bahwa bukan fakta yang penting, tetapi perbandingannya. Penting juga bagi kita untuk tidak mengomentari video itu sendiri, tetapi untuk membandingkan tindakan komentator dalam video yang berbeda. Situasi yang dapat direproduksi secara berkelanjutan sesuai dengan pola yang terlihat dalam visualisasi. Tugas utama yang kami pilih adalah visualisasi dan deteksi wilayah - pola berdasarkan basisnya, serta pemetaan umum interaksi para komentator di YouTube untuk menyusun atlas komentar.
Perangkat lunak
Sampai saat ini, kami menggunakan layanan web
Scraper Komentar Youtube untuk
mengempiskan komentar , tetapi tampaknya sudah tidak didukung lagi, sehingga Anda dapat menggunakan layanan
ini .
Sekarang kami menggunakan alat kami sendiri, yang memungkinkan kami untuk memompa komentar dari satu atau beberapa saluran secara keseluruhan, yang jauh lebih nyaman untuk keperluan kami.
Untuk visualisasi data, kami menggunakan
Gephi v. 0.9.2 . Untuk menumpuk simpul dan tepi, kami menggunakan algoritma Force Atlas 2. Untuk menampilkan statistik, fungsi "Tingkat rata-rata (tertimbang)" dan "Modularitas" digunakan.
Algoritma
Muncul pertanyaan, tetapi bagaimana seseorang dapat melacak komentar, indikator objektif apa yang harus diambil untuk ini? Kami mencoba untuk mengikat nama pengguna ke pengidentifikasi video - dalam kasus kami, penomoran berurutan mereka, misalnya, "OverlordXXX" - "1"; "Tuan XXY" - "2" dan seterusnya. Kemudian dibuat dua file, "Nodes" dan "Edges", sesuai dengan
manual ini .
Visualisasi dalam Gephi adalah sebagai berikut. Komentator (1) terhubung ke rol (2), yang merupakan komentar. Jika komentator telah mengomentari lebih dari satu klip, itu terkait dengan semua klip yang dia komentari (3).

Visualisasi komentar video
Untuk membandingkan komentator, tiga video dipilih (
1 ,
2 ,
3 ).
Hasil memvisualisasikan komentar video dalam Gephi:

Komentar pada video disajikan dalam bentuk grafik terarah dengan 10.462 simpul dan 10.692 tepi. Visualisasi menunjukkan bahwa interaksi komentator antara ketiga video tersebut tidak terwujud. Ini sebagian besar sesuai dengan perbedaan dalam konten video, yang tercermin dalam komentar masing-masing. Video pertama menunjukkan pengalaman dengan magnetron. Video kedua mencakup pengalaman dan liputan acara yang tidak terkait langsung dengan pengalaman. Video ketiga dikhususkan hanya untuk acara tanpa referensi percobaan.
Untuk pengukuran kontrol, rol dari saluran yang sama digunakan (
1 ,
2 ,
3 ), tetapi tidak seperti yang sebelumnya, mereka lebih erat terkait satu sama lain dalam konteks yang sama (eksperimen yang melibatkan stuntman memetika).
Hasil Visualisasi:

Komentar pada video disajikan dalam bentuk grafik terarah dengan 10108 simpul dan 10857 tepi. Konteks umum sesuai dengan interaksi yang kuat dari komentator dalam setidaknya dua dari tiga video.
Artinya, perbedaannya, atau sebaliknya, komunitas komentator dalam video yang berbeda berkorelasi dengan yang berbeda atau sebaliknya konteks keseluruhan video. Menariknya, visualisasi, bahkan tanpa terlebih dahulu membiasakan diri dengan konten, menangkapnya dengan sangat baik.
Memvisualisasikan Komentar Saluran YouTube
Untuk visualisasi, 472.286 komentar dari 172 saluran video dipilih:

Awan komentar umum menautkan sebagian besar video. Atas dasar ini, kita dapat berbicara tentang saluran sebagai integritas semantik (semantik dan kontekstual). Tetapi ada juga fitur regional yang menarik. Sangat mudah untuk melihat wilayah dari dua set komentar simetris yang disorot di bagian atas gambar, dicat hijau dan biru:

Ternyata, mereka dibentuk oleh komentar di empat video tentang petasan (
1 ,
2 ,
3 ,
4 ), di mana gambar teknik kembang api diadakan.
Dapat diasumsikan bahwa konektivitas yang relatif rendah dari video-video ini dengan yang lain disebabkan oleh transisi ke mereka melalui tautan eksternal dan, sebagai akibatnya, penampilan pemirsa tertentu yang secara tidak langsung terkait dengan sisa konten saluran.
Kesimpulan awal - dalam visualisasi komentar, pemilihan wilayah bekerja dengan baik. Dan kemudian Anda dapat menjelajahi wilayah yang terpisah dengan bantuan metode kualitatif - misalnya, analisis konten dan etnografi.
Visualisasi komentar YouTube: ulasan film
Sembilan saluran YouTube (
1 ,
2 ,
3 ,
4 ,
5 ,
6 ,
7 ,
8 ,
9 ) digunakan untuk bekerja dengan bidang genre, penulis yang menunjukkan ulasan film sebagai jenis konten utama dalam deskripsi.
Visualisasi 1 920 865 komentar di video semua saluran:

Visualisasi menunjukkan bahwa dua saluran besar (dari 1 juta pelanggan) benar-benar menyerap tujuh saluran kecil (hingga 500 ribu pelanggan). Bahkan, saluran kecil telah menjadi daerah saluran besar, yang terlihat dalam gambar sebagai warna yang sesuai dari wilayah tersebut. Dapat diasumsikan bahwa komentator di saluran kecil sebagian besar di antara komentator di saluran besar. Yaitu, diagram Venn lebih cocok untuk penelitian mereka, misalnya, di mana Anda dapat melihat dengan tepat berapa banyak dari mereka dan dalam proporsi apa mereka disajikan dalam saluran yang berbeda.
Untuk perbandingan kontrol, 513282 komentar dari delapan saluran (
1 ,
2 ,
3 ,
4 ,
5 ,
6 ,
7 ,
8 ) dalam genre blog kecantikan divisualisasikan:

Persimpangan saluran yang kuat diamati hanya dalam dua himpunan bagian, sedangkan dua saluran (hitam dan ungu) relatif lemah terhubung dengan yang lain. Berbeda dengan contoh pertama, komentator blog kecantikan cenderung berinteraksi dan, dalam beberapa kasus, adalah audiens yang relatif terisolasi. Karena itu, ini harus diperhitungkan saat menetapkan cakupan maksimum pemirsa saluran, misalnya, untuk tujuan iklan. Jika dalam hal ulasan film, cukup untuk memesan iklan di jutaan saluran plus, maka dalam kasus blog kecantikan, Anda perlu memesan iklan, termasuk di saluran yang terisolasi, jika tidak maka pemirsa mereka tidak akan ditanggung.
Visualisasi komentar persimpangan lintas-genre
Untuk memvisualisasikan persimpangan lintas-genre, tiga saluran dipilih dalam genre blog kecantikan (
1 , 14.231 komentar pada 115 klip), eksperimen (
2 , 72.163 komentar pada 81 klip) dan travel (
3 , 135.403 komentar pada 482 klip).
1) Visualisasi dari persimpangan komentator dan eksperimen blog kecantikan:

2) Visualisasi komentator pada percobaan dan perjalanan:

3) Visualisasi blog kecantikan dan komentator perjalanan:

4) Visualisasi komentator dari semua saluran:

Secara visual, Anda dapat melihat bahwa komentator saluran pada perjalanan dan eksperimen memiliki sejumlah persimpangan, dan komentator blog kecantikan, meskipun terisolasi dari yang lain, lebih terkait dengan komentator perjalanan daripada dengan komentator eksperimen.
Hasil Awal
Tren umum untuk visualisasi membenarkan dirinya dalam kasus studi komentar.
Dalam kasus studi tentang saluran atau video individual, visualisasi memungkinkan Anda untuk menyoroti dan merinci wilayah yang diminati peneliti. Ini sangat menyederhanakan studi kualitatif berikutnya dari komentar dan konten video di saluran YouTube.
Di sisi praktis, visualisasi dari persimpangan audiens aktif saluran (komentator) dapat berguna, misalnya, dalam kasus optimasi iklan di saluran. Jika selama visualisasi, persimpangan yang kuat dan stabil dari komentator saluran / set saluran terdeteksi, ini memungkinkan Anda untuk mendistribusikan iklan dengan benar dan, sebagai akibatnya, menghemat penempatannya.