概念
POI(一般作為Point of Interest的縮寫,也有Point of Information的說法),通常稱作興趣點,泛指互聯網電子地圖中的點類數據,基本包含名稱、地址、坐標、類別四個屬性;源於基礎測繪成果DLG(Digital Line Graphic,數字線划地圖)產品中點類地圖要素矢量數據集;在GIS(Geographic Information System,地理信息系統)中指可以抽象成點進行管理、分析和計算的對象。
解讀
隨着互聯網電子地圖服務與LBS應用的普及,POI無論從概念范疇,還是從信息縱深都有了長足發展,已成長為信息空間的參天大樹。甚至可以說目前如日中天的互聯網各個風口或火山口都和POI有一定關系,如O2O、電商、社交、互聯網金融、共享經濟等。(風口=飛上天的豬,火山口=飛上天的炮灰
)
一方面各行各業把越來越多的內容包裝成POI供其用戶消費,如互聯網電子地圖提供的周邊搜索服務中的各類商家門店,網約車平台提供的上車點,O2O行業提供的推薦收貨地址等等;
另一方面POI所包含的屬性也越來越多,如商家信息、服務介紹、點評信息、排行榜、推薦、狀態、社交互動信息、消費金融信息等等。以高德地圖為例,其POI數據中對外開放的基礎字段就有45個之多。
因此POI也具備了跨行業、跨部門整合數據,基於空間位置進行大數據挖掘的天然優勢。非GIS行業做空間大數據挖掘接觸到的第一份空間大數據極有可能就是一份POI,從POI開始,到行政區划結束。(此處應該有掌聲,這是目前空間大數據挖掘的極簡總結。)
從另一個角度理解,POI之所以有這樣的能力,是因為POI是一種頂級抽象的產物,三維的、二維的、真實的、虛擬的萬事萬物抽象成一個零維的點,大到一個城市,小到數學世界中的一個高程點。當我們真正領悟了抽象便不再有抽象,真正的抽象就是當下。此處致敬抽象電影鼻祖The Matrix,期待沃卓斯基姐妹能夠超越沃卓斯基兄弟,再續經典:
注:
(1)據滴滴2016年底公布的數據,滴滴在全國范圍目前有超過3000萬個推薦上車點,並根據出行大數據每天更新大約8萬個推薦上車點。基於推薦上車點,滴滴平台上超過30%的司機和乘客,按照小綠點不需要通話就可以找到對方,司機的通話量平均下降10%,乘客等候時間平均減少1分鍾。
(2)O2O行業提供的推薦收貨地址能夠有效提升用戶地址輸入速度,杜絕問題收貨地址,降低整體派送成本。
整體分類
從GIS應用層次看,POI整體可以分為兩類:基礎框架類POI,業務應用類POI。
基礎框架類POI用於表達真實世界的基本組成要素,如城市部件、地名數據等,主要來源於作為國家基礎測繪成果之一的DLG數據產品;
業務應用類POI根據應用場景的需要,將一些事、物進行統一建模,以帶有屬性信息的地理位置點的方式進行管理、分析和計算,如網約車平台系統中的上車推薦點、O2O行業中的各類門店點、導航服務中的門牌地名點等,該類POI數據隨相關的GIS應用系統進行設計、采集、更新維護。
大家接觸最多的互聯網電子地圖POI數據其實是上述兩類POI數據的融合產物,既有基礎框架類POI數據(該類數據主要來源於基礎測繪成果),又有根據互聯網電子地圖產品需要而建立的業務應用類POI(該類數據主要由各互聯網平台自行規划設計、采集、更新維護。關於這事業界有許多故事,喜歡互聯網考古或感興趣的可以自行搜索,畢竟每個大佬都有那么一段不願被人提及的往事)。
目前在國內互聯網電子地圖POI數據在數據量、覆蓋面、准確性、更新頻率方面都是領先的,基本能夠滿足不同行業GIS應用場景對基礎類POI數據的需求。以高德地圖為例,其官方對外公布的POI數據如下:
注:
目前網絡上有許多能夠提供互聯網電子地圖POI數據的組織和個人,號稱有上億的POI數據,大家需要注意,目前高德對外宣稱其POI搜索服務在國內有超過6000萬POI數據,估計實際6500萬左右,上億的POI數據極有可能是較長時間段內POI數據的集合,其中有大量已無效或重復的POI數據。POI數據一是重數量,另外一個重要的指標就是時效性,目前國內互聯網電子地圖都基本能夠做到每天更新POI數據,因此大家在獲取POI數據時不要只看數量,更要看時效。
分類體系
互聯網電子地圖POI數量大,包羅萬象,想要恰到好處的管理和使用,一個良好的分類體系是必不可少的,此處推薦高德地圖的POI分類體系,繼承和發揚了基礎測繪關於點類要素分類體系的優點,分為大、中、小三類,覆蓋全面,能夠較好的適應不同的應用場景,建議大家在規划自有POI數據庫時在此基礎上進行擴展,高德地圖最新的POI分類體系說明可以從以下地址下載:
https://lbs.amap.com/api/webservice/download
應用與獲取
POI數據有廣泛的應用場景,較強的計算和表達能力。即可以用於分析計算,如導航定位、地理編碼、周邊搜索、熱度分析、密度分析、選址決策分析等;也可以用於可視化展示,如燈光圖、聚簇圖等。
目前國內主流的互聯網電子地圖服務提供商都提供開放平台,上面提供了基本的POI應用服務API,如POI搜索(包含關鍵字搜索、區域搜索、周邊搜索)、地理編碼/逆地理編碼服務、地址輸入智能補全和建議列表服務等,基本能夠滿足POI相關的應用需求,並且具有和官方基本一致的時效性(百度地圖開放平台中的POI相關服務在數量和時效性上和百度地圖官網具有一定的差異,具體參考官方說明:http://lbsyun.baidu.com/index.php?title=webapi/guide/webservice-placeapi)
因此大多數場景下大家不需要獲取POI數據到本地。除非需要將業務數據和互聯網電子地圖POI數據進行關聯、整合分析計算、離線或內網應用時,需要獲取互聯網電子地圖POI數據矢量數據。
目前獲取互聯網電子地圖POI數據的技術已經比較成熟,大家需要注意的是POI數據的時效性、坐標系一致性(高德地圖和騰訊地圖采用GCJ-02坐標系,百度地圖采用BD09坐標系)、數據完整性幾個方面;
出於尊重版權的考慮,對於互聯網電子地圖POI數據獲取技術或工具,只提示大家按需獲取、分區域獲取、分類獲取、隨用隨取、多用Python、不迷信1000元左右賣License的各類采集工具。
此處貼一張購物服務全國范圍的分區域獲取網格,以供參考
由內到外動態看一下