基於 Python 批量實現地理位置和經緯度坐標轉換


做地圖可視化時需要提供經緯度坐標,但一般來說我們手上拿到的通常只有地理位置,比如說 北京市東大街302號狗不理包子店,可視化之前需要經緯度坐標轉換

需要轉換的坐標如果僅有幾個還好,可以直接借助谷歌地圖自帶的經緯度轉換,但真實場景下需要轉換的數據量可能要上百甚至上千,再手動的話就比較頭疼了

如何將地理位置批量轉化為經緯度坐標? 本文將針對這個問題,介紹兩個用 Python 來實現的方法

1,調用第三方 API

最常見辦法就是調用第三方 API,例如百度、高德地圖等服務平台,提供了相應的功能接口,它們的這類技術已經非常成熟啦,准確穩定,關鍵還是免費的 ~,本期教程以百度為例(高德的用方類似),介紹一下其用法

1.1,用百度賬號登陸百度地圖控制台

百度地圖開放平台

image-20210417142947516

1.2,創建一個應用,獲取 AK 參數

登錄控制台之后,選擇左側 應用管理-> 我的應用 -> 創建應用

image-20210417143233823

創建應用頁面中有三項信息需要填寫

  • 應用名稱,無限制隨意填寫即可;
  • 應用類型 ,選擇服務端
  • IP 白名單,只是個人簡單測試的話0.0.0.0/0 即可,如果考慮安全問題, 可以將自己的 IP 填進去, AK 參數泄露的話非本機 IP 無法訪問,這樣也不用擔心額度被其他用戶盜用

image-20210417150550228

1.3,地理編碼、逆地理編碼

經緯度地理位置根據轉換方向分為兩類,接下來我們分別演示一下其用法:

  • 地理編碼: 將地理地址轉換為坐標點(經緯度);
  • 逆地理編碼,將經緯度轉化為地理地址;

1.3.1 地理編碼

下面就是 Python 測試代碼塊,將 AK 參數(前面申請到的)和你需要轉換的地理位置拼接到 官方提供的 url 中,用 requests 訪問即可,

import requests
import json
import re

AK = '你的AK'
address ='北京市海淀區上地十街10號'
url = 'http://api.map.baidu.com/geocoding/v3/?address={}&output=json&ak={}&callback=showLocation'.format(address,AK)
res = requests.get(url)

print(res.text)
results = json.loads(re.findall(r'\((.*?)\)',res.text)[0])

print('\n')
print('location is ',results['result']['location'])

輸出結果如下

showLocation&&showLocation({"status":0,"result":{"location":{"lng":116.3084202915042,"lat":40.05703033345938},"precise":1,"confidence":80,"comprehension":100,"level":"門址"}})


location is  {'lng': 116.3084202915042, 'lat': 40.05703033345938}

1.3.2 逆地理編碼

逆地理編與地理編碼用法相似

lat = '40.05703033345938'
lng = '116.3084202915042'
AK = '你的AK'


url = 'http://api.map.baidu.com/reverse_geocoding/v3/?ak={}&output=json&coordtype=wgs84ll&location={},{}'.format(AK,lat,lng)

res = requests.get(url)

print(res.text)
address = json.loads(res.text)['result']['formatted_address']

print('\n')
print('address is ',address)

像我們這類免(bai) 費 piao) 用戶,借助百度 API 每天最高可調用 6000 次,這個量級基本上能滿足我們日常需要,但如果這個數量滿足不了你的話,可以在線購買更高的使用額度

image-20210417151134728

2,Geopy

2.1 Geopy 庫介紹

這里介紹一個Python 包 Geopy ,借助它也可以實現經緯度地理位置轉換,

這款包之經緯度轉換原理其實還是借助了第三方 API 平台,因為市面上提供經緯度轉換 第三方平台很多,為了方便, Geopy 把這些接口都分別封裝在一個類中,借助 Geopy 模塊來調用,支持的第三放平台如下

image-20210417161926347

Geopy作為一個專注於地理處理包之外, 除了能實現上面地理編碼逆地理編碼功能之外,還有一個其它令我經驗的功能, 提供兩個經緯度坐標,計算他們在地球上的最短距離

下面將介紹一下 Geopy 的具體用法,

2. 2 地理編碼

使用 地理編碼功能時,需要借助 Geopy 的 geocoders 模塊,Geopy 把所有第三方API封裝到 geocoders 中

image-20210417164945976

這里選用 OpenStreetMap 平台上提供的 Nominatim 地理編碼器,因為可以免費供我們使用,不需要申請 API ,但缺點是限流,限額,不能大規模頻繁訪問,否則會返回 403,429錯誤代碼

from geopy.geocoders import Nominatim
geolocator=Nominatim()
location= geolocator.geocode("北京市海淀區西二旗北路")
print(location.address)
print(location.latitude,location.longitude)

結果如下

西二旗北路, 東北旺村, 海淀區, 北京市, 102208, 中國
40.056793 116.305811

2.3 逆地理編碼

from geopy.geocoders import Nominatim
geolocator=Nominatim()
location= geolocator.reverse("40.056793 116.305811")
print(location.address)

結果如下

1#, 西二旗北路, 東北旺村, 海淀區, 北京市, 102208, 中國

結果看起來還不錯,簡單方便;但提醒一下,因為前面說過 Nominatim 模塊是限額度的,不要頻繁訪問,否則會出現以下錯誤

image-20210417175101978

2.4 根據經緯度計算距離

Geopy 最讓我驚喜的是這個用法,提供兩個經緯度坐標計算他們之間的距離,因為地球具體來說是橢圓,所以不能按照常規方法來計算 ,目前現有比較流行的幾個模型有以下幾個

              model             major (km)   minor (km)     flattening
ELLIPSOIDS = {'WGS-84':        (6378.137,    6356.7523142,  1 / 298.257223563),
              'GRS-80':        (6378.137,    6356.7523141,  1 / 298.257222101),
              'Airy (1830)':   (6377.563396, 6356.256909,   1 / 299.3249646),
              'Intl 1924':     (6378.388,    6356.911946,   1 / 297.0),
              'Clarke (1880)': (6378.249145, 6356.51486955, 1 / 293.465),
              'GRS-67':        (6378.1600,   6356.774719,   1 / 298.25),
              }

根據官方介紹,官網選擇的是 WGS-84 模型,根據統計最終計算到的距離誤差最高在0.5%左右;使用方法如下

from geopy import distance
newport_ri = (41.49008, -71.312796)
cleveland_oh = (41.499498, -81.695391)
print(distance.distance(newport_ri, cleveland_oh).miles)#最后以英里單位輸出

#output
538.39044536

wellington = (-41.32, 174.81)
salamanca = (40.96, -5.50)
print(distance.distance(wellington, salamanca).km)# 以 km 作為單位輸出
19959.6792674

3 批量地址坐標轉換

上面聊了這么多知識點,下面引入一個案例來簡單回顧一下;本案例中借助百度API 來實現地理位置坐標轉換,把一個 csv 表格內的所有地址位置數據批量轉換為經緯度

3.1 數據讀取

import pandas as pd
import string
data_path = 'H:/Data/Latlon/map-location.csv'
df = pd.read_csv(data_path,encoding='GB18030')
df

一共有 98 條數據,每條數據都表示一個地理位置;數據明顯有一些擾亂項,例如左端的數字字符、以及數據中的分隔符\t;因此轉換之前需要對數據進行一次預處理操作

image-20210417213923485

3.2 數據預處理

def process_str(x):
    # 數據預處理,去掉前面的數字、及字符串中 \t
    x = str(x).replace('\t','')
    x = str(x).strip(string.digits)
    return x 
df['location']  = df['location'].apply(process_str)
df

預處理結果如下

image-20210417214443969

3.3 地理編碼(經緯度轉換)

import time
start = time.time()
AK = '你的AK'
def get_location(str1):
    # 獲取經緯度坐標
    url = 'http://api.map.baidu.com/geocoding/v3/?address={}&output=json&ak={}&callback=showLocation'.format(str1,AK)
    res = requests.get(url)
    results = json.loads(re.findall(r'\((.*?)\)',res.text)[0])
    return (results['result']['location']['lat'],results['result']['location']['lng'])
df['(lat,lng)'] = df['location'].apply(get_location)
print('耗時 {}s'.format(time.time()-start))
print(df)

為了測試轉換效率,這里我加了一個計時器;98 條數據成功轉換后共耗時 4.65s 左右,效率還不錯,要比 Geopy 優秀得多,

image-20210417214833306

3.5 案例源碼數據

我已經把本案例中用到代碼的數據打包再一起了,感興趣的可以在公號小張Python后台回復關鍵字:210418 ,即可獲取!

4. 小結

上面介紹了這么多,最后做個小結;聊一下這兩種方法在 地理坐標轉換方面 各自的優勢和劣勢

  • 第三方API
    • 優勢:地理編碼、逆編碼比較准確,精度高;且支持高並發;
    • 劣勢:不支持國外,環境配置較為復雜;
  • Geopy (用 Nominatim 模塊的話)
    • 優勢:簡單方便,上手快;支持國外地理編碼
    • 劣勢:不支持並發訪問、效率低且精度較低;

這里給大家一個建議,如果地址數據在國內的話 經緯度轉換 建議用第三方 API,穩定且准確;若是涉及下緯度距離計算、單位換算或地址數據在國外,建議用 Geopy

好了,以上就是本篇文章的全部內容啦,如果對你有所幫助,點個贊是對我最大的鼓勵

最后感謝大家的閱讀,我們下期見~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM