Elasticsearch學習之查詢去重

本文轉載自查看原文 2018-07-08 17:29 12112 Elasticsearch/ Elasticsearch學習

1. 實現查詢去重、分頁，例如：實現依據qid去重，createTime排序，命令行為：

GET  /nb_luban_answer/_search
{
  "query": {
    "match": {
      "status": 1
    }
  },
  "sort": [
    {
      "createTime": {
        "order": "desc"
      }
    }
  ],"aggs": {
    "qid": {
      "terms": {
        "field": "qid",
        "size": 10
      },"aggs": {
        "rated": {
          "top_hits": {
            "sort": [{
              "createTime": {"order": "desc"}
            }], 
            "size": 1
          }
        }
      }
    }
  }, 
  "size": 0,
  "from": 0
}

JAVA API

String indexName="nb_luban_answer";
        String typeName="luban_answer";
        AggregationBuilder aggregation =
                AggregationBuilders
                        .terms("agg").field("qid")
                        .subAggregation(
                                AggregationBuilders.topHits("top").addSort("createTime",SortOrder.DESC).setSize(1)
                        );
 
        SearchResponse sResponse = Tool.CLIENT.prepareSearch(indexName).setTypes(typeName)
                .setQuery(QueryBuilders.matchQuery("status",1))
                .addSort("createTime", SortOrder.DESC)
                .addAggregation(aggregation)
                .execute().actionGet();
        Terms agg = sResponse.getAggregations().get("agg");
        for (Terms.Bucket entry : agg.getBuckets()) {
            String key = String.valueOf(entry.getKey()) ;
            long docCount = entry.getDocCount();
            System.out.println("key:"+ key +" doc_count:"+ docCount);
 
            TopHits topHits= entry.getAggregations().get("top");
            for (SearchHit hit : topHits.getHits()){
                System.out.println(" -> id: "+ hit.getId()+" createTime: "+hit.getSource().get("createTime"));
            }
        }

2. 取得某個索引中某個字段中的所有出現過的值

這種操作類似於使用SQL的SELECT UNIQUE語句。當需要獲取某個字段上的所有可用值時，可以使用terms聚合查詢完成：eg: select distinct street_name from table_name ;

GET /index_streets/_search?search_type=count
{
 "aggs": {
   "street_values": {
     "terms": {
       "field": "name.raw",
       "size": 0
     }
   }
 } 
}

因為目標是得到name字段上的所有出現過的值，因此search_type被設置為了count，這樣在返回的響應中不會出現冗長的hits部分。另外，查詢的目標字段的索引類型需要設置為not_analyzed。所以上面的field指定的是name.raw。

3. 取得某個索引/類型下某個字段中出現的不同值的個數

這種操作類似於使用SQL的select count( * ) from (select distinct * from table)語句。當需要獲取某個字段上的出現的不同值的個數時，可以使用cardinality聚合查詢完成：

GET /index_streets/_search?search_type=count
{
  "aggs": {
    "uniq_streets": {
      "cardinality": {
        "field": "name.raw"
      }
    }
  }
}

因為目標是得到name字段上的所有出現過的值，因此search_type被設置為了count，這樣在返回的響應中不會出現冗長的hits部分。另外，查詢的目標字段如果是字符串類型的，那么其索引類型需要設置為not_analyzed。所以上面的field指定的是name.raw。

轉自：https://blog.csdn.net/a422100210/article/details/60959450

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Elasticsearch 7.x 去重查詢並返回去重后的總數 java操作elasticsearch實現分頁、去重查詢、統計去重后的實際數量 elasticsearch去重計數 Elasticsearch學習系列之term和match查詢 Elasticsearch學習筆記——安裝、數據導入和查詢 Elasticsearch學習筆記之—數據范圍查詢 es去重查詢 sql 查詢去重 MySQL查詢去重語句 Sql去重及查詢重復