Page Rank di Era Web 2.0 - Bagian 1

gambar
Pemilihan diadakan untuk mengetahui siapa yang ramalan pemilihannya ternyata lebih akurat. (c) Robert Orben
Untuk mengevaluasi kontribusi Google dalam pengembangan mesin pencari, Anda harus pindah sekitar 20 tahun yang lalu. Di masa-masa sulit itu, jumlah informasi di Internet ratusan kali lebih sedikit daripada sekarang, tetapi pencarian informasi yang tepat jauh lebih sulit. Pengguna dapat menghabiskan waktu yang lama di situs web mesin pencari, mencoba merumuskan permintaan yang berbeda dengan mesin pencari dan masih belum mendapatkan hasil yang diinginkan. Bahkan ada agen yang menawarkan layanan pencarian Internet mereka untuk uang. Pada awal mesin pencari, pentingnya halaman ditentukan oleh banyak faktor subjektif, seperti markup html, jumlah istilah, judul dan keberanian font pada halaman. Tidak jarang, halaman yang dibuat khusus atau salinan halaman asli, diisi dengan judul dan istilah yang diperlukan, ternyata berada di atas. Selain itu, dari sudut pandang manusia, itu sama sekali tidak ada artinya, tetapi memiliki peringkat yang sangat tinggi di mesin pencari.

Pada tahun 1997, dua mahasiswa di Stanford University mengusulkan algoritma Page Rank yang terkenal. Bahkan, ini adalah kasus yang jarang terjadi ketika para insinyur melompat keluar dari rawa yang sudah lama berdiri dan menemukan solusi elegan sederhana yang dalam satu langkah sederhana menutup tumpukan masalah dan menentukan hasil pertempuran antara CEO dan mesin pencari selama bertahun-tahun yang akan datang. Inti dari Page Rank adalah "demokrasi" di dunia Web. Setiap halaman di situs yang berisi tautan ke situs lain "suara" untuk itu. Dengan demikian, situs sumber primer yang paling sering dikutip dan otoriter naik ke atas. Page Rank membantu memuncaki situs-situs paling populer, yang, seperti gelembung udara di dalam air, muncul berdasarkan β€œpendapat” sejumlah besar situs yang kurang populer. Skema semacam itu bekerja dengan baik di ekosistem awal 2000-an, tempat situs-situs Internet kecil mendominasi, yang isinya dihadiri oleh webmaster dan pengelola konten. Dengan munculnya Web 2.0, pengguna Internet sendiri menjadi sumber utama informasi di Internet, yang mengubah Internet. Pertama, arus besar informasi dari pengguna telah menyebabkan munculnya situs raksasa dengan jutaan, dan terkadang puluhan dan ratusan juta halaman. Kedua, situs mulai mengandung sejumlah besar informasi yang tidak terstruktur dan tidak diadaptasi untuk mesin pencari, sejumlah besar meme lokal dan kesalahan sintaksis. Setelah suatu topik dibuat, katakanlah di forum atau blog di bawah satu judul, topik tersebut dapat dengan mudah dipindahkan ke area lain untuk diskusi. Saat mencari di situs-situs tersebut, masalah utama bukanlah menentukan otoritas situs, tetapi untuk menentukan peringkat halaman di dalam situs itu sendiri, karena sekarang ratusan dan ribuan halaman dapat jatuh di bawah permintaan pencarian. Tentu saja, dalam kasus seperti itu, Page Rank tidak berfungsi dan banyak mesin pencari menggunakan trik dari era "pra-Google", seperti menganalisis judul, tag, dan sebagainya.

Pada bagian selanjutnya saya akan memberi tahu Anda apakah mungkin untuk mengatasi masalah ini dengan bantuan pembelajaran mesin, cara membuat halaman peringkat mesin di dalam situs itu sendiri, mengingat terminologi uniknya menggunakan contoh pencarian di situs ini.

Source: https://habr.com/ru/post/id429902/


All Articles