elasticsearch query 和 filter 的區別

本文轉載自查看原文 2016-05-09 00:41 3458

Query查詢器與 Filter 過濾器

盡管我們之前已經涉及了查詢DSL，然而實際上存在兩種DSL：查詢DSL（query DSL）和過濾DSL（filter DSL）。
過濾器（filter）通常用於過濾文檔的范圍，比如某個字段是否屬於某個類型，或者是屬於哪個時間區間
* 創建日期是否在2014-2015年間？
* status字段是否為success？

* lat_lon字段是否在某個坐標的10公里范圍內？

查詢器（query）的使用方法像極了filter，但query更傾向於更准確的查找。

* 與full text search的匹配度最高

* 正則匹配

* 包含run單詞，如果包含這些單詞：runs、running、jog、sprint，也被視為包含run單詞
* 包含quick、brown、fox。這些詞越接近，這份文檔的相關性就越高
查詢器會計算出每份文檔對於某次查詢有多相關（relevant），然后分配文檔一個相關性分數：_score。而這個分數會被用來對匹配了的文檔進行相關性排序。相關性概念十分適合全文搜索（full-text search），這個很難能給出完整、“正確”答案的領域。

query filter在性能上對比：filter是不計算相關性的，同時可以cache。因此，filter速度要快於query。

下面是使用query語句查詢的結果,第一次查詢用了300ms,第二次用了280ms.

#blog: http://xiaorui.cc

{

"size": 1,

"query": {

"bool": {

"must": [

{

"terms": {

"keyword": [

"手機",

"iphone"

]

}

{

"range": {

"cdate": {

"gt": "2015-11-09T11:00:00"

}

]

}

{

"took": 51,

"timed_out": false,

"_shards": {

"total": 30,

"successful": 30,

"failed": 0

"hits": {

"total": 6818,

"max_score": 0,

"hits": []

}

下面是使用filter查詢出來的結果,第一次查詢時間是280ms,第二次130ms…. 速度確實快了不少，也證明filter走了cache緩存。但是如果我們對比下命中的數目，query要比filter要多一點，換句話說，更加的精准。

#blog: xiaorui.cc

{

"size": 0,

"filter": {

"bool": {

"must": [

{

"terms": {

"keyword": [

"手機",

"iphone"

]

}

{

"range": {

"cdate": {

"gt": "2015-11-09T11:00:00"

}

]

}

{

"took": 145,

"timed_out": false,

"_shards": {

"total": 30,

"successful": 30,

"failed": 0

"hits": {

"total": 6804,

"max_score": 0,

"hits": []

}

}<span style="font-size:13.2px;line-height:1.5;"></span>

如果你想同時使用query和filter查詢的話，需要使用 {query:{filtered：{}}} 來包含這兩個查詢語法。他們的好處是，借助於filter的速度可以快速過濾出文檔，然后再由query根據條件來匹配。

"query": {

"filtered": {

"query": { "match": { "email": "business opportunity" }},

"filter": { "term": { "folder": "inbox" }}

}

{ "size":0,

"query": {

"filtered": {

"query": {

"bool": {

"should": [],

"must_not": [

"must": [

{

"term": {

"channel_name":"微信自媒體微信"

}

]

}

}，

"filter":{

"range": {

"idate": {

"gte": "2015-09-01T00:00:00",

"lte": "2015-09-10T00:00:00"

}

我們這業務上關於elasticsearch的查詢語法基本都是用query filtered方式進行的，我也推薦大家直接用這樣的方法。should ，must_not, must 都是列表，列表里面可以寫多個條件。這里再啰嗦一句，如果你的查詢是范圍和類型比較粗大的，用filter ！如果是那種精准的，就用query來查詢。

{

”bool”:{

”should”:[], #相當於OR條件

”must_not”:[], #必須匹配的條件，這里的條件都會被反義

”must”:[] #必須要有的

}

END..

原文地址：

http://xiaorui.cc/2015/11/09/elasticsearch%e7%9a%84%e6%9f%a5%e8%af%a2%e5%99%a8query%e4%b8%8e%e8%bf%87%e6%bb%a4%e5%99%a8filter%e7%9a%84%e5%8c%ba%e5%88%ab/

轉載時必須以鏈接形式注明原始出處及本聲明。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Elasticsearch query和filter的區別 Elasticsearch 之 Filter 與 Query 有啥不同？ Elasticsearch(6) --- Query查詢和Filter查詢 Elasticsearch系列(二)--query、filter、aggregations ElasticSearch中Filter和Query的異同 Elasticsearch DSL中Query與Filter的不同 ElasticSearch的 Query DSL 和 Filter DSL Elasticsearch學習筆記（十二）filter與query ES之六：ElasticSearch中Filter和Query的異同 ES 23 - 檢索和過濾的區別 (query v.s filter)