مثال Wikibook (توضيح من مقالة علمية )يعلم الجميع أن ويكيبيديا هي مصدر معلومات قيم. يمكنك قضاء ساعات في دراسة موضوع ما ، والانتقال من رابط إلى آخر للحصول على سياق حول موضوع مهم. ولكن ليس من الواضح دائمًا كيفية جمع كل المحتوى على أي موضوع مشترك واحد. على سبيل المثال ، كيفية الجمع بين جميع المقالات حول الكيمياء غير العضوية أو تاريخ العصور الوسطى ، مع تلخيص الأكثر أهمية؟ حول هذا الموضوع ، حاول شاه أدماتي وزملاؤه من بن غوريون في النقب (إسرائيل) ، مطورو برنامج تعلم الآلة
Wikibook-Bot ، القيام بذلك.
ويكيبيديا والكتاب المدرسي هما شيئان مختلفان. لهذا السبب تم إنشاء مشروع
Wikibooks ، حيث يحاول الناس بشكل مشترك تلخيص أهم ما يتعلق بالموضوع. على سبيل المثال ، يمكنك العثور على كتاب تعليمي آلي يحتوي على أكثر من 6000 صفحة ، مع أقسام محدّثة على الشبكات العصبية والخوارزميات الجينية ورؤية الماكينة.
Wikibook-Bot يحل العديد من مهام التعلم الآلي. أولاً ، هذه مهمة
تصنيف ، بمعنى أنك تحتاج إلى تحديد ما إذا كانت المقالة تنتمي إلى Wikibook معين. ثانياً ، تحتاج إلى تقسيم المقالات المحددة إلى فصول - هذه هي مهمة
التجميع . تم حلها عن طريق خوارزميات معروفة. أخيرًا ، مهمة
التنظيم ، والتي تتضمن مهمتين فرعيتين: ترتيب المقالات في كل فصل وترتيب الفصول نفسها.

في الواقع ، البرنامج يعمل بسيطة نسبيا. المبدأ واضح لكل من واجه تعلم الشبكات العصبية. الخطوة الأولى هي إنشاء مجموعة بيانات التدريب. من بين ما يقرب من 6700 من ويكي الكتب الموجودة باللغة الإنجليزية ، تم اختيار الكتب التي تضم أكثر من 1000 مشاهدة وبها 10 مقالات أو أكثر.

نظرًا لأن Wikibooks هذه تشكل نوعًا من المعيار الذهبي للتدريب والاختبار ، فقد اعتبره المطورون كمعيار للجودة. بعد تدريب الشبكة العصبية ، تم تقسيم العمل الإضافي إلى عدة خطوات مذكورة أعلاه: التصنيف والتكتيل والتنظيم. يبدأ العمل بعنوان كتاب مدرَّس من قِبل الإنسان. يصف الاسم أي مفهوم تعسفي. على سبيل المثال ، التعلم الآلي: دليل كامل.
المهمة الأولى هي فرز مجموعة المقالات بأكملها وتحديد المقالات ذات الصلة بما يكفي لتضمينها في هذا الموضوع. "هذه المهمة صعبة بسبب الحجم الهائل من المقالات على ويكيبيديا ، والحاجة إلى اختيار المقالات الأكثر صلة بالملايين المتاحة" ، يكتب المؤلفون في ورقة علمية. لحل هذه المشكلة ، استخدموا بنية شبكة Wikipedia ، لأن بعض المقالات غالبًا ما ترتبط بمقالات أخرى. من المنطقي أن نفترض أن المقالة ذات الصلة ستكون أيضًا في الموضوع.
لذلك ، يبدأ العمل بمجموعة صغيرة من المقالات التي يُذكر فيها عنوان معين. ثم يتم تحديد جميع المقالات الموجودة على مسافة تصل إلى ثلاثة انتقالات من القلب. ولكن كم من المقالات التي تم العثور عليها مدرجة في الكتاب المدرسي؟ يتم تقديم إجابة هذا السؤال بواسطة ويكي الكتب التي أنشأها الأشخاص. يسمح لك التحليل التلقائي لمحتواها بتحديد مقدار المحتوى من ويكيبيديا في الكتب التي من صنع الإنسان والتي يتم تضمينها في الكتاب المدرسي.
لكل موقع wikibook من صنع الإنسان بنية شبكة محددة بواسطة عدد الروابط التي تشير إلى مقالات أخرى ، وعدد معين من الروابط التي تشير إلى الصفحات ، وترتيب المقالات المضمّنة ، وما إلى ذلك. تقوم الخوارزمية المطورة بتحليل كل مقال يتم تحديده تلقائيًا لموضوع معين والإجابة على السؤال: إذا قمت بإدراجه في Wikibook ، فهل ستصبح بنية شبكته أكثر تشابهًا للكتب التي أنشأها شخص أم لا. إذا لم يكن كذلك ، تم حذف المقال.
استنادًا إلى بيانات التدريب وأساليب التعلم الآلي الحالية ، يتم أيضًا حل المهام الأخرى. وبالتالي ، كان الفريق قادرًا على إنشاء Wikibooks تلقائيًا التي أنشأها الأشخاص بالفعل. تم تقييم فعالية الطريقة المقترحة من خلال مقارنة الكتب التي تم إنشاؤها تلقائيًا مع 407 Wikibooks الحقيقية. يقال إنه بالنسبة لجميع المهام ، كان من الممكن الحصول على نتائج عالية وذات دلالة إحصائية عند المقارنة. لكن مع ذلك ، يمكن تقدير الفعالية الحقيقية للخوارزمية بعد إنشاء Wikibooks على مواضيع أخرى ، وليس فقط على تلك التي درسها.
تم نشر وصف البوت كمقال علمي بعنوان
"Wikibook-Bot - الجيل التلقائي لكتب ويكيبيديا" على موقع الطباعة المسبق لـ arXiv.org.