ES的基本內容介紹的已經差不多了,最后我們再來看看GEO位置搜索,現在大部分APP都有基於位置搜索的功能,比如:我們點外賣,可以按照離我們的距離進行排序,這樣可以節省我們的配送費和送餐的時間;還有找工作時,也可以按照離自己家的距離進行排序,誰都想找個離家近的工作,對吧。這些功能都是基於GEO搜索實現的,目前支持GEO搜索功能的中間件有很多,像MySQL、Redis、ES等。我們看看在ES當中怎么實現GEO位置搜索。
GEO字段的創建
GEO類型的字段是不能使用動態映射自動生成的,我們需要在創建索引時指定字段的類型為geo_point
,geo_point
類型的字段存儲的經緯度,我們看看經緯度是怎么定義的,
英文 | 簡寫 | 正數 | 負數 | |
---|---|---|---|---|
維度 | latitude | lat | 北緯 | 南緯 |
經度 | longitude | lon或lng | 東經 | 西經 |
經度的簡寫有2個,一般常用的是lon,lng則在第三方地圖的開放平台中使用比較多。下面我們先創建一個帶有geo_point
類型字段的索引,如下:
PUT /my_geo
{
"settings":{
"analysis":{
"analyzer":{
"default":{
"type":"ik_max_word"
}
}
}
},
"mappings":{
"dynamic_date_formats":[
"MM/dd/yyyy",
"yyyy/MM/dd HH:mm:ss",
"yyyy-MM-dd",
"yyyy-MM-dd HH:mm:ss"
],
"properties":{
"location":{
"type":"geo_point"
}
}
}
}
創建了一個my_geo索引,在索引中有一些基礎的配置,默認IK分詞器,動態映射的時間格式。重點是最后我們添加了一個字段location,它的類型是geo_point
。
索引創建完了,我們添加兩條數據吧,假設,路人甲在北京站,路人乙在朝陽公園。那么我們怎么“北京站”和“朝陽公園”的經緯度呢?我們在做項目時,前端都會接地圖控件,經緯度的信息可以調用地圖控件的API獲取。在咱們的示例中,也不接地圖控件了,太麻煩了,直接在網上找到“北京站”和“朝陽公園”的坐標吧。
我們查到“北京站”的坐標如下:
然后添加一條數據:
POST /my_geo/_doc
{
"name":"路人甲",
"location":{
"lat": 39.90279998006104,
"lon": 116.42703999493406
}
}
再查“朝陽公園”的坐標
再添加“路人乙”的信息
POST /my_geo/_doc
{
"name":"路人乙",
"location":{
"lat": 39.93367367974064,
"lon": 116.47845257733152
}
}
我們再用elasticsearch-head
插件看一下索引中的數據:
GEO查詢
“路人甲”和“路人乙”的信息都有了,但是沒有location
字段的信息,因為location
是特性類型的字段,在這里是展示不出來的。我們搜索一下吧,看看怎么用geo搜索,假設“我”的位置在“工體”,我們先要查到“工體”的坐標,
然后再查詢5km范圍內都有誰,發送請求如下:
POST /my_geo/_search
{
"query":{
"bool":{
"filter":{
"geo_distance":{
"distance":"5km",
"location":{
"lat":39.93031708627304,
"lon":116.4470385453491
}
}
}
}
}
}
在查詢的時候用的是filter
查詢,再filter查詢里再使用geo_distance
查詢,我們定義距離distance
為5km,再指定geo類型的字段location
,當前的坐標為:39.93031708627304N,116.4470385453491E。查詢一下,看看結果:
{
……
"hits":[
{
"_index":"my_geo",
"_type":"_doc",
"_id":"AtgtXnIBOZNtuLQtIVdD",
"_score":0,
"_source":{
"name":"路人甲",
"location":{
"lat": 39.90279998006104,
"lon": 116.42703999493406
}
}
},
{
"_index":"my_geo",
"_type":"_doc",
"_id":"ZdguXnIBOZNtuLQtMVfA",
"_score":0,
"_source":{
"name":"路人乙",
"location":{
"lat": 39.93367367974064,
"lon": 116.47845257733152
}
}
}
]
}
看來,我們站在“工體”,“北京站”的路人甲和“朝陽公園”的路人乙都在5km的范圍內。把范圍縮短一點如何,改為3km看看,搜索的請求不變,只是把distance
改為3km,看看結果吧,
{
……
"hits":[
{
"_index":"my_geo",
"_type":"_doc",
"_id":"ZdguXnIBOZNtuLQtMVfA",
"_score":0,
"_source":{
"name":"路人乙",
"location":{
"lat": 39.93367367974064,
"lon": 116.47845257733152
}
}
}
]
}
只有在“朝陽公園”的路人乙被搜索了出來。完全符合預期,我們再看看程序中怎么使用GEO搜索。
JAVA 代碼
在定義實體類時,對應的GEO字段要使用特殊的類型,如下:
@Setter@Getter
public class MyGeo {
private String name;
private GeoPoint location;
}
location的類型是GeoPoint
,添加數據的方法沒有變化,轉化成Json就可以了。再看看查詢怎么用,
public void searchGeo() throws IOException {
SearchRequest searchRequest = new SearchRequest("my_geo");
SearchSourceBuilder ssb = new SearchSourceBuilder();
//工體的坐標
GeoPoint geoPoint = new GeoPoint(39.93367367974064d,116.47845257733152d);
//geo距離查詢 name=geo字段
QueryBuilder qb = QueryBuilders.geoDistanceQuery("location")
//距離 3KM
.distance(3d, DistanceUnit.KILOMETERS)
//坐標工體
.point(geoPoint);
ssb.query(qb);
searchRequest.source(ssb);
SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);
for (SearchHit hit : response.getHits().getHits()) {
System.out.println(hit.getSourceAsString());
}
}
- SearchRequest指定索引
my_geo
- 創建工體的坐標點
GeoPoint
- 創建geo距離查詢,指定geo字段
location
,距離3km,坐標點工體 - 其他的地方沒有變化
運行一下,看看結果,
{"name":"路人乙","location":{"lat":39.93360786576342,"lon":116.47853840802}}
只有在“朝陽公園”的路人乙被查詢了出來,符合預期。
距離排序
有的小伙伴可能會有這樣的疑問,我不想按照距離去查詢,只想把查詢結果按照離“我”的距離排序,該怎么做呢?再看一下,
public void searchGeoSort() throws IOException {
SearchRequest searchRequest = new SearchRequest("my_geo");
SearchSourceBuilder ssb = new SearchSourceBuilder();
//工體的坐標
GeoPoint geoPoint = new GeoPoint(39.93367367974064d,116.47845257733152d);
GeoDistanceSortBuilder sortBuilder = SortBuilders
.geoDistanceSort("location", geoPoint)
.order(SortOrder.ASC);
ssb.sort(sortBuilder);
searchRequest.source(ssb);
SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);
for (SearchHit hit : response.getHits().getHits()) {
System.out.println(hit.getSourceAsString());
}
}
這次查詢並沒有設置查詢條件,而是創建了一個geo距離排序,同樣,先指定geo字段location
,和當前的坐標工體,再設置排序是升序。運行一下,看看結果,
{"name":"路人乙","location":{"lat":39.93360786576342,"lon":116.47853840802}}
{"name":"路人甲","location":{"lat":39.902799980059335,"lon":116.42721165631102}}
離“工體”比較近的“路人乙”排在了第一個,也是符合預期的。有問題大家評論區留言吧~