SVLAB-Suchmaschinenalgorithmus

Suchmaschine SVLAB Search .

Bild

Mit der neuen Suchmaschine können Sie Ihre Seiten mithilfe des Google Chrome- Plugins zu Suchmaschinenindizes hinzufügen.

Nach der Installation des Plugins steht Ihnen die Schaltfläche "Seite speichern" zur Verfügung. Jede Seite, die Sie der Suchmaschine hinzufügen, ist Ihrer IP zugeordnet. Somit können Sie auf Ihrer Seite nur von Ihrer IP aus suchen. Suchmaschine verfügbar unter
svlaboratory.org/application/search und svlaboratory.com

Algorithmus, Implementierung, Technologie-Stack.

Suchmaschinenindizes werden in einer MySQL-Datenbank gespeichert . Als Indizes wird Text in den HTML-Tags von Seiten verwendet, die nach dem Laden und dynamischen Anzeigen im Browser des Benutzers abgerufen wurden. Außerdem wird der Text verwendet, der nach dem Konvertieren der Wörter in die Grundform durch die Bibliothek des morphologischen Analysators Az.js erhalten wurde .

Nach dem gleichen Prinzip werden Indizes von Links zu Medienressourcen von HTML- Seiten gespeichert: Hyperlinks, Bilder, Videos.

Alle Indizes entsprechen einzelnen MySQL-Datenbanktabellen, deren einzelne Zeilen der Beschreibung der indizierten Seiten entsprechen.

Das dynamische Laden und Parsen von Seiten erfolgt über das Google Chrome- Plugin mithilfe der jQuery- Bibliothek.

Nachdem das Plug-In mit dem Browser verbunden ist und der Benutzer auf der gewünschten Seite auf die Schaltfläche "Seite speichern" klickt, werden die Analysedaten mithilfe des Zend Framework- Abfrageanwendungsframeworks an den in PHP geschriebenen Suchmaschinen-Webserver gesendet.

Um Ihre Seiten zu durchsuchen, werden Ihre Daten mit Ihrer IP- Adresse verknüpft und eine Suchanforderung wird von der Webseite der Webanwendung svlaboratory.org/application/search und svlaboratory.com an die Aktion des Apache -Webservers mithilfe der Ajax- Technologie gesendet.

Als Seitensuchalgorithmus werden Suchanfragen an die MySQL-Datenbank verwendet.
Um nach Sätzen zu suchen - Sätze werden in Wörter unterteilt, Wörter werden in der Grundform von einem morphologischen Analysator angegeben. Es wird nach einzelnen Wörtern gesucht.

An erster Stelle in den Suchergebnissen steht die Seite, auf der die meisten Wörter, Wortpaare und Quellensätze gefunden werden.

Die spezifische Implementierung der Suchmaschine in Ihrem Fall hängt nur von Ihren Programmierkenntnissen ab.

Ich lade alle ein, meine Suchmaschine zu benutzen.

Mit freundlichen Grüßen,
SVLAB

Source: https://habr.com/ru/post/de461767/


All Articles