
يتم إجراء الانتخابات من أجل معرفة من كانت توقعاته الانتخابية أكثر دقة. (ج) روبرت أوربن
لتقييم مساهمة Google في تطوير محركات البحث ، تحتاج إلى الانتقال قبل حوالي 20 عامًا. في تلك الأوقات العصيبة ، كانت كمية المعلومات على الإنترنت أقل بمئات المرات من الآن ، ولكن البحث عن المعلومات الصحيحة كان أكثر صعوبة. يمكن للمستخدم قضاء وقت طويل على موقع محرك البحث على الإنترنت ، محاولاً صياغة استعلام مختلف لمحرك البحث ولا يزال لا يحصل على النتيجة المرجوة. حتى أن هناك وكالات عرضت خدمات البحث على الإنترنت عن المال. في فجر محركات البحث ، تم تحديد أهمية الصفحة من خلال العديد من العوامل الذاتية ، مثل ترميز html ، وعدد المصطلحات ، والعناوين ، وجريئة الخط على الصفحة. ليس من غير المألوف أن يتم عرض صفحة تم إنشاؤها خصيصًا أو نسخة من الصفحة الأصلية ، مليئة بالعناوين والمصطلحات الضرورية ، في الأعلى. علاوة على ذلك ، من وجهة نظر الشخص ، لم يكن له أي معنى على الإطلاق ، ولكن كان له تصنيف مرتفع جدًا في محرك البحث.
في عام 1997 ، اقترح طالبان في جامعة ستانفورد خوارزمية تصنيف الصفحة الشهيرة. في الواقع ، هذه هي الحالة النادرة عندما قفز المهندسون من مستنقع طويل الأمد ووجدوا حلًا أنيقًا بسيطًا أدى في خطوة واحدة بسيطة إلى إغلاق مجموعة المشاكل وتحديد نتائج المعركة بين الرؤساء التنفيذيين ومحركات البحث مسبقًا لسنوات عديدة قادمة. جوهر ترتيب الصفحات هو "الديمقراطية" في عالم الويب. كل صفحة على الموقع تحتوي على رابط لموقع آخر "يصوت" له. وبالتالي ، فإن المواقع الأكثر موثوقية والمورد عنها من المصادر الأولية ترتفع إلى الأعلى. يساعد ترتيب الصفحة على احتلال المواقع الأكثر شيوعًا ، والتي تنبثق ، مثل فقاعات الهواء في الماء ، بناءً على "رأي" عدد كبير من المواقع الأقل شهرة. عمل هذا المخطط بشكل جيد في النظام البيئي في أوائل العقد الأول من القرن الحادي والعشرين ، حيث هيمنت مواقع الإنترنت الصغيرة ، وحضر محتواها مشرفو المواقع ومديرو المحتوى. مع ظهور الويب 2.0 ، أصبح مستخدمو الإنترنت أنفسهم المصدر الرئيسي للمعلومات على الإنترنت ، والتي غيرت الإنترنت. أولاً ، أدى التدفق الهائل للمعلومات من المستخدمين إلى ظهور مواقع عملاقة بملايين ، وأحيانًا عشرات ومئات الملايين من الصفحات. ثانيًا ، بدأت المواقع تحتوي على عدد كبير من المعلومات غير المهيكلة وغير المعدلة لمحركات البحث ، وعدد كبير من الميمات المحلية وأخطاء بناء الجملة. بمجرد إنشاء موضوع ، على سبيل المثال في منتدى أو مدونة تحت عنوان واحد ، يمكن أن ينتقل بسهولة إلى منطقة أخرى للمناقشة. عند البحث في مثل هذه المواقع ، لا تتمثل المشكلة الرئيسية في تحديد سلطة الموقع ، ولكن في ترتيب الصفحات داخل الموقع نفسه بشكل صحيح ، لأنه الآن يمكن أن تقع مئات وآلاف الصفحات تحت استعلام البحث. بالطبع ، في مثل هذه الحالات ، لا يعمل ترتيب الصفحة ويستخدم العديد من محركات البحث حيلًا من عصر "ما قبل Google" ، مثل تحليل العناوين والعلامات وما إلى ذلك.
في الجزء التالي ، سأخبرك ما إذا كان من الممكن التغلب على هذه المشكلة بمساعدة التعلم الآلي ، وكيفية جعل الجهاز يصنف الصفحات داخل الموقع نفسه ، نظرًا لمصطلحاته الفريدة باستخدام مثال البحث على هذا الموقع.