怎样用Python实现地理编码
专栏作者:时空Drei
❈
时空Drei,德国德累斯顿工业大学在读博士生,个人的擅长领域为:利用Python进行空间数据(遥感GIS)处理分析,掌握常用的机器学习工具。个人公众号:stdrei,分享时空数据分析与德国留学笔记。
❈
引言
今天看到一篇阿里云的文章"
天下武功,唯快不破"
,以物流行业为例,分析了PostgreSQL 与 Greenplum 在地理位置信息处理,最佳路径算法,机器学习等方面的物流行业应用方法。其中提到了地址转换成坐标 的问题,更专业些的名词应该是“地理编码”,即知道一个地址,如
北京市海淀区上地十街10号
,怎么样可以获取到对应的经纬度位置信息
(40,116)
,或者反过来。
地理编码概念
很多地图相关的厂商都提供了相关的API,我们可以直接利用这些API得到这些信息。比如百度的
Geocoding API
。
Geocoding API是一类接口,用于提供从地址到经纬度坐标或者从经纬度坐标到地址的转换服务,用户可以使用C# 、C++、Java等开发语言发送请求且接收JSON、XML的返回数据。Geocoding API包括地址解析和逆地址解析功能:
借用ESRI文档中更直观的一张图
地理编码 :
即地址解析,由详细到街道的结构化地址得到百度经纬度信息,例如:“北京市海淀区中关村南大街27号”地址解析的结果是lng:116.31985,lat:39.959836
同时,地理编码也支持名胜古迹、标志性建筑名称直接解析返回百度经纬度,例如:“百度大厦”地址解析的结果是lng:116.30815,lat:40.056885
逆地理编码 :
即逆地址解析,由百度经纬度信息得到结构化地址信息,例如:“lat:31.325152,lng:120.558957”逆地址解析的结果是“江苏省苏州市虎丘区塔园路318号”。
不过,需要说明的一点是,若想使用百度的这套API的前提是,有百度账号并申请相应的Key。其实,除了百度之外,谷歌、ESRI、微软的Bing等都有类似的地理编码服务。不过这些服务大多没有专门针对Python的库并且彼此之间的Json结构也不一致。于是乎专治不服的Python大神做了一个专门的地理编码工具
geocoder
,将这些不同厂商的服务整合统一起来。
地理编码工具
geocoder
首先看一下它都支持哪些公司的地理编码服务:
| Provider | Optimal | Usage Policy |
|---|---|---|
| ArcGIS | World | |
| Baidu | China | API key |
| Bing | World | API key |
| CanadaPost | Canada | API key |
| FreeGeoIP | World | |
| Geocoder.ca | CA & US | Rate Limit |
| GeocodeFarm | World | Policy |
| GeoNames | World | Username |
| GeoOttawa | Ottawa | |
| World | Rate Limit, | |
| Policy | ||
| HERE | World | API key |
| IPInfo | World | |
| Mapbox | World | API key |
| MapQuest | World | API key |
| Mapzen | World | API key |
| MaxMind | World | |
| OpenCage | World | API key |
| OpenStreetMap | World | Policy |
| Tamu | US | API key |
| TomTom | World | API key |
| What3Words | World | API key |
| Yahoo | World | |
| Yandex | Russia | |
| TGOS | Taiwan |
安装
1. `pip install geocoder`
地理编码
1. `import geocoder`
2. `g = geocoder.google("1403 Washington Ave, New Orleans, LA 70130")`
3. `g = geocoder.arcgis(u"北京市海淀区上地十街10号")`
4. `g.latlng`
输出为
1. `[
29.9287839
,
-
90.08421849999999
]`
也可以查看完整的geojson
1. `g
.
geojson`
输出为
1. `{'bbox': [-90.0855674802915,`
2. `29.9274349197085,`
3. `-90.0828695197085,`
4. `29.9301328802915],`
5. `'geometry': {'coordinates': [-90.08421849999999, 29.9287839],`
6. `'type': 'Point'},`
7. `'properties': {'accuracy': u'ROOFTOP',`
8. `'address': u'1403 Washington Ave, New Orleans, LA 70130, USA',`
9. `'bbox': [-90.0855674802915,`
10. `29.9274349197085,`
11. `-90.0828695197085,`
12. `29.9301328802915],`
13. `'city': u'New Orleans',`
14. `'confidence': 9,`
15. `'country': u'US',`
16. `'county': u'Orleans Parish',`
17. `'encoding': 'utf-8',`
18. `'housenumber': u'1403',`
19. `'lat': 29.9287839,`
20. `'lng': -90.08421849999999,`
21. `'location': '1403 Washington Ave, New Orleans, LA 70130',`
22. `'neighborhood': u'Garden District',`
23. `'ok': True,`
24. `'place': u'ChIJGyFHWc2lIIYRYSoneaXAUiw',`
25. `'postal': u'70130',`
26. `'provider': 'google',`
27. `'quality': u'street_address',`
28. `'state': u'LA',`
29. `'status': 'OK',`
30. `'status_code': 200,`
31. `'street': u'Washington Ave'},`
32. `'type': 'Feature'}`
直接用Google尝试查询中文地址时失败
1. `g = geocoder.google(u"北京市海淀区上地十街10号")`
2. `g.ok`
输出为
1. `False`
用百度应该没问题,不过我没有申请相应的key。切换到arcgis,能够成功编码
1. `g = geocoder.arcgis(u"北京市海淀区上地十街10号")`
2. `g.latlng`
输出为
1. `[
40.050934
,
116.30079
]`
逆地理编码
1. `g = geocoder.google([29.9287839, -90.08421849999999], method='reverse')`
2.
3. `print g.address`
4. `print g.city`
5. `print g.state`
6. `print g.country`
输出为
1. `1403 Washington Ave, New Orleans, LA 70115, USA`
2. `New Orleans`
3. `LA`
4. `US`
换成中国的地址
1. `g = geocoder.google([40.050934, 116.30079], method='reverse')`
2. `print g.address`
3. `print g.city`
4. `print g.state`
5. `print g.country`
输出为
1. `Bai Du Da Sha, Haidian Qu, Beijing Shi, China, 100193`
2. `Beijing`
3. `Beijing Shi`
4. `CN`
用arcgis的服务试试
1. `g = geocoder.arcgis([40.050934, 116.30079], method='reverse')`
2. `print g.address`
3. `print g.city`
4. `print g.state`
5. `print g.country`
输出为
1. `None`
2. `北京市`
3. `北京市`
4. `CHN`
Google转换成的是英文,但地址比较全。arcgis虽然是中文,但是详细的地址居然输出为了None,这有个
X
用。
其他
geocoder
的功能不止于此,它还可以查IP(包括自己的)。
1. `g = geocoder.ip('199.7.157.0')`
2. `print g.latlng`
3. `print g.city`
4. `g = geocoder.ip('me')`
5. `print g.latlng`
6. `print g.city`
输出为
1. `[43.6934, -79.4857]`
2. `Toronto`
3. `[51.05, 13.75]`
4. `Dresden`
查询一个城市的空间包围盒
1. `g = geocoder.arcgis(u"山东")`
2. `g.bbox`
输出为
1. `{'northeast': [38.976997, 121.976998], 'southwest': [33.022997, 116.022998]}`
小结
空间信息既可以利用行政区划、自然地理区域等文本信息描述,也可以用坐标系统、数字(邮编等)来标识。利用地理编码技术,可以将空间信息的地理定位要素与相应的文本信息关联起来。本文主要介绍了
geocoder
地理编码这一小工具,可以方便快捷地利用地图等相关厂商提供的地理编码服务,将文字描述的位置转换成地图上的经纬度,或者通过地图上的某个位置坐标获得相应的位置信息文字描述。
Python中文社区
致力于成为
国内最好的Python社区
QQ群:152745094
简书、知乎专栏:Python中文社区
Github:github.com/PyCN
专栏作者申请请发邮件至:
