一.如果有一批數據,知道某個主鍵比如ip地址、人的身份證、車牌、訂單以及經緯度信息
那可以做出哪些事情?
1.某個ip對應的經緯度在哪個地區?
1.某個人出現的經緯度,根據人與經緯度關系,形成出行軌跡
3.某車牌或者車架對應的經緯度信息,車輛軌跡,借助地圖做出,可以做交通數據應用
4.某個地區的訂單信息
5.根據經緯度,一些十字路口或者地鐵口附件乘車人比較多,來做出一些虛擬車站,就像打車軟件上面綠色
二、虛擬車站的業務難點
1.找出人們出行打車的所有小區域
2.篩選出打車人數、訂單數比較多的區域,不能說歷史數據中某個區域內只有一個訂單就作為虛擬車站,約定一個閾值
3.根據這些區域內訂單的經緯度的精度,那個精度最小選擇哪個經緯度作為虛擬車站
三、使用uber-h3實現地圖上小區域划分
uber h3算法介紹
H3,是一個六邊形分層索引網格系統,也是最近幾年實現數據聚合的主要趨勢,在h3出現之前大部分情況采用的是geohash算法,墨卡托投影,還有一些其他投影技術,比如google s2.地理索引
六邊形網格與周圍網格的距離有且僅有一個,而四邊形存在兩類距離,三角形有三類距離3.1 h3的特點
1.將數據划分為六邊形網格
H3有一個簡單的API,可將坐標索引到六角形的全局網格中。
2.分層網格系統
容易按位截斷粗略的近似單元,以及區域壓縮/解壓縮算法。
3.全面全球化
連同十二個五邊形,整個世界都可以在H3中尋址,分辨率可達平方米
3.2 分辨率
精度說明:0-15個精度級別,六邊形區域要為9m 那就是選擇精度12-----》對應的格子邊長為0.00941km=9.4m
4.六邊形區域的定義
1.南京市六邊形樣例:
2、定義每個六邊形為10米左右,如果兩個經緯度的距離在10米之內,就在這個區域,他們的進行h3算法返回的索引值就是想等的
三、測試兩個經緯度是否在想要的區域內
測試 19.714932,110.563756與19.714986,110.563684 兩個點是否在同一個區域
測試 19.715584,110.563654與19.715617,110.563743兩個點是否在同一個區域

測試結果:第一組不在精度為12(六邊形邊長為9.4米)的區域內,第二組在精度為12的區域內。