18.match_phrase的用法

本文轉載自查看原文 2018-03-08 09:00 3220

主要知識點：

match_phrase的使用場景
match_phrase的用法
match_phrase的原理

一、什么是近似匹配

　match_phrase的使用場景

現假設有兩個句子

１、java is my favourite programming language, and I also think spark is a very good big data system.

２、java spark are very related, because scala is spark's programming language and scala is also based on jvm like java.

進行match query，ｑｕｅｒｙ語法如下：

{

＂ｑｕｅｒｙ＂：｛

"match": {

"content": "java spark"

}

｝

}

match query進行搜索，只能搜索到包含java或spark的document，包含java和spark的doc都會被返回回來。現在假如說我們要實現以下三個需求：

1、java spark，就靠在一起，中間不能插入任何其他字符，就要搜索出來這種doc

2、java spark，但是要求，java和spark兩個單詞靠的越近，doc的分數越高，排名越靠前

３、我們搜索時，文檔中必須包含java spark這兩個文檔，且他們之間的距離不能超過５，

要實現上述三個需求，用match做全文檢索，是搞不定的，必須得用proximity match（近似匹配），proximity match分兩種，短語匹配（phrase match）和近似匹配（proximity match）。這一講，要學習的是phrase match，就是僅僅搜索出java和spark靠在一起的那些doc，比如有個doc，是java use'd spark，這就不是結果。

二、match_phrase的用法

　　phrase match，就是要去將多個term作為一個短語，一起去搜索，只有包含這個短語的doc才會作為結果返回。match是只在包含其中任何一個分詞就返回。

１、match語法：

GET /forum/article/_search

{

"query": {

"match": {

"content": "java spark"

}

單單包含java的doc也返回了，不是我們想要的結果

２、改一個數據，將一個doc的content設置為恰巧包含java spark這個短語，以方便搜索

POST /forum/article/5/_update

{

"doc": {

"content": "spark is best big data solution based on scala ,an programming language similar to java spark"

}

３、match_phrase語法

GET /forum/article/_search

{

"query": {

"match_phrase": {

"content": "java spark"

}

結果只返回了最后我們修改的那個ｄｏｃ，只包含java或ｓｐａｒｋ的doc不會返回

三、match_phrase的原理

１、理解term position

ｅｓ分詞器在分詞做倒排索引時，會記錄下每個分詞在對應的ｄｏｃ中的位置（position）

比如有下面兩個ｄｏｃ＞

doc1：hello world, java spark

doc2：hi, spark java

做倒排索引時：

hello doc1(0)

wolrd doc1(1)

java 　　　doc1(2) 　doc2(2)

spark doc1(3) 　doc2(1)

（）中表示位置。可以通過以下語句進行查看。

GET _analyze

{

"text": "hello world, java spark",

"analyzer": "standard"

}

２、match_phrase的基本原理

match_phrase執行過程：

１.如ｍａｔｃｈ搜索一樣進行分詞，

２.對分詞后的單詞到ｆｉｅｌｄ中去進行搜索。這一步返回每個單詞對應的ｄｏｃ，並返回這些單詞在對應的ｄｏｃ中的位置，

３.對返回的ｄｏｃ進行第一步的篩選，找到每個單詞都在同一個ｆｉｅｌｄ的ｄｏｃ。

４.對第３步進行篩選后的ｄｏｃ進行再一次的篩選，選回位置符合要求的ｄｏｃ。比如，對於match_phrase，就是找到后一個單詞的位置比前一個單詞的位置大１。

５．proximity match原理一樣，只是第四位對位置進行篩選時的方法不同。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Match Phrase Prefix Query es match之match_phrase、match_phrase_prefix Elasticsearch短語搜索——match_phrase Elasticsearch之match_phrase小坑記錄【ElasticSearch（六）進階】match匹配，match_phrase 短語匹配 elasticsearch-搜索-match和match_phrase匹配原理(四) 【Elasticsearch】搜索小記之 match VS match_phrase js中match的用法 Mysql全文搜索match against的用法 Mysql 全文搜索 Match Against用法