SVLAB Search搜索引擎算法

搜索引擎SVLAB Search

图片

新的搜索引擎允许您使用Google Chrome插件将页面添加到搜索引擎索引中。

安装插件后,“保存页面”按钮将对您可用。 您添加到搜索引擎的每个页面都与您的IP相关联。 因此,您只能在IP上搜索页面。 搜索引擎位于
svlaboratory.org/application/searchsvlaboratory.com

算法,实现,技术堆栈。

搜索引擎索引存储在MySQL数据库中 。 作为索引,在将页面加载并在用户浏览器中动态显示后获得的页面的html标记内使用文本。 还使用了通过形态分析器Az.js的库将单词转换为基本形式后获得的文本。

按照相同的原则,将保存指向HTML页面媒体资源的链接的索引:超链接,图像,视频。

所有索引对应于单个MySQL数据库表,其单个行对应于索引页面的描述。

Google Chrome插件使用jQuery库执行页面的动态加载和解析。

在将插件连接到浏览器并且用户单击所需页面上的“保存页面”按钮后,解析数据将发送到使用Zend Framework查询应用程序框架PHP编写的搜索引擎Web服务器。

为了搜索页面,您的数据与IP地址相关联,并且搜索请求从svlaboratory.org/application/searchsvlaboratory.com Web应用程序的网页发送到使用Ajax技术的Apache Web服务器。

作为页面搜索算法,使用对MySQL数据库的搜索查询。
要搜索句子-句子被分为单词,单词的基本形式由形态分析仪给出。 搜索单个单词。

在搜索结果中的第一位置是找到最多单词,单词对和原始句子的页面。

对于您而言,搜索引擎的具体实现将仅取决于您的编程技能。

我邀请所有人使用我的搜索引擎。

最好的问候
SVLAB

Source: https://habr.com/ru/post/zh-CN461767/


All Articles