基於es實現一個簡單的搜索引擎


一、什么是es

Elasticsearch是一個基於ApacheLucene(TM)的開源搜索引擎。無論在開源還是專有領域,Lucene可以被認為是迄今為止最先進、性能最好的、功能最全的搜索引擎庫。但是,Lucene只是一個庫。想要使用它,你必須使用Java來作為開發語言並將其直接集成到你的應用中,更糟糕的是,Lucene非常復雜,你需要深入了解檢索的相關知識來理解它是如何工作的。Elasticsearch也使用Java開發並使用Lucene作為其核心來實現所有索引和搜索的功能,但是它的目的是通過簡單的RESTfulAPI來隱藏Lucene的復雜性,從而讓全文搜索變得簡單。你以為這些就完了? elasticsearch除了Lucene和全文搜索,我們還可以描述它:分布式的實時文件存儲,每個字段都被索引並可被搜索分布式的實時分析搜索引擎可以擴展到上千台服務器,處理PB級結構化或非結構化數據。

二、獲取數據

通過python的requests爬取柯林斯詞典(https://www.collinsdictionary.com/zh/browse/word-lists/)的詞匯用來為我們的搜索引擎提供建議;爬取汽車之家(https://www.autohome.com.cn/all/)所有的分類為搜索引擎提供搜索結果。

三、后台管理

  1. 基於flask建立后台管理
  2. 利用bootstrap以及ajax實現網頁前端展示


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM