ذات مرة في
مجرة بعيدة بعيدة ، عندما كانت الأشجار كبيرة ، وكان الإنترنت صغيرًا ، لم يكن هناك هيمنة على محركات البحث. لقد بدأوا للتو في الظهور وكانوا ببساطة "أغبياء". تم تقديم تطور مهم للأدلة ، حيث تم تحديد المواقع حسب مواقعك على الإنترنت الخاصة بك. ذهبت إلى القسم ، وجدت موقع ، والتمتع بها.

ثم ظهرت شركة AltaVista و Google و Yahoo و Yandex و Aport و Rambler وغيرها. والآن ، يتكرر هذا الوضع برمته مع Telegram ، كما يبدو لي. هناك أدلة ، ولكن لا يوجد بحث تقريبًا.
بالطبع ، هناك بحث في Telegram نفسه ، لكنه يعمل فقط مع تلك المجموعات والقنوات والمراسلات التي أضفتها بالفعل إلى نفسك. لا يوجد بحث عالمي عن المجموعات والقنوات.
وبما أنه ليس هناك ، لماذا لا تفعل ذلك ، فكرت؟ إن يدي كانت تخدش يدي لفترة طويلة لتجربة Elasticsearch ، وهنا ظهرت المناسبة.
الفكرة بسيطة - "الجلوس" على قوة Telegram ، وعدم القيام بمزارعك من خلال تحليل القنوات والمجموعات. للقيام بذلك ، نقوم بعمل روبوت يقوم ببساطة بقراءة جميع الرسائل الموجودة في المجموعة وإضافتها إلى الفهرس في Elasticsearch. حسنًا ، ثم بالفعل في واجهة الويب أو من خلال برنامج الروبوت ، يمكننا البحث في جميع المجموعات والقنوات التي يوجد بها هذا الروبوت.
وبالفعل في مرحلة التنفيذ ، خضع هذا التفكير الرائع لبعض التغييرات. كما اتضح ، يمكنك إضافة إلى الروبوت في القناة فقط كمسؤول. ولا يمكن حرمان المسؤول من كافة الإجراءات. اتضح أنه من أجل إضافة روبوت لشخص آخر إلى قناته ، فإنه يحتاج إلى السماح بشيء على الأقل. وهناك كل الأذونات حساسة للغاية. لذلك لدي بعض الصعوبات. أي من الواضح أنه من الممكن الاتفاق على الإيمان والقناعة الشخصية. على سبيل المثال ، "تغيير ملف تعريف القناة" ليس امتيازًا فظيعًا ، ولكن بدءًا من بعض المواضع القوية للقناة ، لن يكون من المستحسن أيضًا منحها لأي شخص أيضًا. إذن ، أطلب من المجتمع المساعدة - هل هناك أي طريقة للتغلب بطريقة أو بأخرى على هذه القيود؟
حسنا ، على الأقل لم تكن هناك مثل هذه المشاكل مع المجموعات!
لم يكن من الصعب إجراء روبوت ، مع elasticsearch أنا أيضا برزت بسرعة ، استغرق الأمر عدة أيام. ولكن كانت هناك بعض المشاكل مع البحث المورفولوجي الروسي في أحدث إصدار من Elasticsearch. اضطررت إلى التدخين كتيبات حول موضوع ربط القواميس الروسية هانسبل. الفهرس بسيط جدا. يؤخذ في الاعتبار نص الرسالة واسم القناة / المجموعة ورقمها ومعرف الرسالة والمستخدم. حسنًا ، قمت بعمل فهرس بشكل منفصل حيث تتم إضافة طلبات إلى الروبوت ، للإحصائيات.
أردت أن أتحدث عن المكون الفني للعمل ، ولكني أدركت أنهم كتبوا عن كتابة روبوتات بالفعل عشرات المرات بالفعل ، عن elasticsearch نفسها وهناك أيضا الكثير من المقالات ، وليس لدي ميزات الاستخدام - مجرد بحث النص الكامل. تبدو كيفية التعامل مع elasticsearch من php بسيطة للغاية - لقد قمت بتثبيتها من الملحن والذهاب.
نتيجةً لذلك ، اتضح أن النظام بسيط للغاية وقابل للتوسعة بسهولة ، ونأمل أنه مفيد. من الواضح أنه لم تتم إضافة سوى عدد قليل من المجموعات إلى برنامج الروبوت ، ويجب ألا تعتمد على أي بحث ذي صلة.
ولكني آمل أن يضيف مشغلو البرقية البوت لمجموعاتهم وأن تزيد قاعدته زيادة كبيرة. هنا هو
الروبوتTelegaIndexBot ، هنا هو واجهة الويب
tgindex.ru - مرحبا!
حسنًا ، بالطبع ، النقد وغيره من الأمنيات مرحب به.
قدمت مجموعة ل "اللعب حولها".
t.me/telegaindex - إذا أضفت نصًا إليه ،
فسيتم فهرسته بواسطة الروبوت. يمكنك إجراء بعض التجارب.