Django + DRF + Elasticsearch 實現搜索功能


 

django使用haystack來調用Elasticsearch搜索引擎

 如何使用django來調用Elasticsearch實現全文的搜索

  Haystack為Django提供了模塊化的搜索。它的特點是統一的,熟悉的API,可以讓你在不修改代碼的情況下使用不同的搜索后端(比如 Solr, Elasticsearch, Whoosh, Xapian 等等)。

環境:django ==1.11.11

1.首先安裝相關的依賴包:(這里原作者使用的是drf-haystack,如果項目沒有使用drf組件,應該選用haystack包)

pip install drf-haystack 
pip install elasticsearch==2.4.1

# drf-haystack官方文檔:https://drf-haystack.readthedocs.io/en/latest/

2.在django項目配置文件settings.py中注冊應用:

INSTALLED_APPS = [
    ...
    'haystack',
    ...
]

3.在django項目配置文件settings.py中指定搜索的后端:(指定使用那個搜索引擎,服務器地址的配置,索引庫的名稱等配置)

# Haystack
HAYSTACK_CONNECTIONS = {
    'default': {
        'ENGINE': 'haystack.backends.elasticsearch_backend.ElasticsearchSearchEngine', # 指定使用 elasticsearch 為搜索引擎, 如果搜索內容包含中文, 需要將 elasticsearch 配置支持中文分詞
        'URL': 'http://your_ip:9200/',  # 此處為elasticsearch運行的服務器ip地址,端口號默認為9200
     # elasticsearch建立的索引庫的名稱
     'INDEX_NAME': 'demo',
     # 保存索引文件的路徑
     # 'PATH': os.path.join(BASE_DIR, 'elastic_index'), # 如果搜索引擎是whoosh, 還需要設置PATH參數
},
}
# 當添加、修改、刪除數據時,自動生成索引
HAYSTACK_SIGNAL_PROCESSOR = 'haystack.signals.RealtimeSignalProcessor'

 # 指定搜索結果每頁的條數 這里設置成了1條
 HAYSTACK_SEARCH_RESULTS_PER_PAGE = 1

注意:

HAYSTACK_SIGNAL_PROCESSOR 的配置保證了在Django運行起來后,有新的數據產生時,haystack仍然可以讓Elasticsearch實時生成新數據的索引

4.創建索引類:(在需要進行索引的應用的目錄下創建文件search_indexes.py, 在該文件內創建該索引類,轉載者注

 

from haystack import indexes
from
.models import Demo
# 原作者在代碼中沒有給出模型代碼,這個模型里擁有的字段就是需要提供搜索的字段,建議保留模型字段中自增的主鍵字段id, 在我實際項目開發中發現如果不保留就無法實現搜索 # 索引模型類的名稱必須是 模型類名稱 + Index
class DemoIndex(indexes.SearchIndex, indexes.Indexable): """ 索引數據模型類 """ text = indexes.CharField(document=True, use_template=True) # 一般此字段約定為text
   default_image_url = indexes.CharField(model_attr='default_image_url')
def get_model(self): """返回建立索引的模型類""" return Demomodel def index_queryset(self, using=None): """返回要建立索引的數據查詢集""" return self.get_model().objects.filter(is_launched=True) """ 說明: 1.在DemoIndex建立的字段,都可以借助haystack由elasticsearch搜索引擎查詢。 2.其中text字段聲明為document=True,表名該字段是主要進行關鍵字查詢的字段, 該字段的索引值可以由多個數據庫模型類字段組成(是多個字段,不是多個數據庫模型類,轉者注),具體由哪些模型類字段組成,我們用use_template=True表示后續通過模板來指明,其他字段都是通過model_attr選項指明引用數據庫模型類的特定字段。 3.在 REST framework中,索引類的字段會作為查詢結果返回數據的來源, """

5. 在templates目錄中創建text字段使用的模板文件:

templates/search/indexes/demo/demo_text.txt文件中定義

(關於路徑的定義和文件的命名的說明:templates是項目原來的html文件的目錄,search是在其下新建的,名稱一定,indexes名稱也一定,demo是應用的名稱,demo_text.txt 就是需要進行索引的模型類名的小寫 + "_" + 索引類中定義的字段名稱(text) + ".txt" 轉載者注)

在demo_text.txt文件中 指定為模型類中那些字段建立索引

{{ object.name }}
{{ object.id }}

然后使用命令手動創建索引:

  進入manage.py所在的目錄執行命令:

    python manage.py rebuild_index

 

6.創建haystack序列化器:(返回查詢到的查詢集數據)

from drf_haystack.serializers import HaystackSerializer

class DemoSerializer(serializers.ModelSerializer):
    """
    序列化器
    """
    class Meta:
        model = Demo 
     # 返回除了搜索字段外的所需要的其他字段數據, 可以將所有需要返回的字段數據寫上,便於提取 fields
= ('id', 'name') class DemoIndexSerializer(HaystackSerializer): """ SKU索引結果數據序列化器 """
   # 變量名稱必須為 object 否則無法返回 object = DemoSerializer(read_only=True)# 只讀,不可以進行反序列化 class Meta: index_classes = [DemoIndex] # 索引類的名稱,可以有多個
     
# text 由索引類進行返回, object 由序列化類進行返回,第一個參數必須是text
fields = ('text', object, 'default_image_url')

注意:fields屬性的字段名與DemoIndex類的字段對應。

 

7.創建視圖

from drf_haystack.viewsets import HaystackViewSet

class DemoSearchViewSet(HaystackViewSet):
  index_models
= [Demo]#這里可以寫入多個已經進行了索引的模型類
  
  serializer_class = DemoIndexSerializer
  # 這里是通過父類默認的方法進行返回了數據, 可以在視圖中對數據進行篩選和處理,詳細的使用方法可以去查看官方文檔,drf-haystack官方文檔:https://drf-haystack.readthedocs.io/en/latest/
  • 該視圖會返回搜索結果的列表數據,所以如果可以為視圖增加REST framework的分頁功能。
  • 我們在配置文件已經定義了分頁配置,所以此搜索視圖會進行分頁。

8. 添加路由,使用通過REST framework的router來定義路由

router = DefaultRouter()
router.register('/', views.DemoSearchViewSet, base_name='demo_search')

...

urlpatterns += router.urls

9.測試

http://127.0.0.1:8000/?text=something

如果在配置完haystack並啟動程序后,出現如下異常,是因為drf-haystack還沒有適配最新版本的REST framework框架

 

 

可以通過修改REST framework框架代碼,補充_get_count函數定義即可

文件路徑 虛擬環境下的 lib/python3.6/site-packages/rest_framework/pagination.py

 

def _get_count(queryset):
    """
    Determine an object count, supporting either querysets or regular lists.
    """
    try:
        return queryset.count()
    except (AttributeError, TypeError):
        return len(queryset)

原文地址:  http://www.cnblogs.com/x931890193/p/9385312.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM