怎样用Python实现地理编码

怎样用Python实现地理编码

专栏作者:时空Drei

时空Drei,德国德累斯顿工业大学在读博士生,个人的擅长领域为:利用Python进行空间数据(遥感GIS)处理分析,掌握常用的机器学习工具。个人公众号:stdrei,分享时空数据分析与德国留学笔记。

引言

今天看到一篇阿里云的文章" 天下武功,唯快不破" ,以物流行业为例,分析了PostgreSQL 与 Greenplum 在地理位置信息处理,最佳路径算法,机器学习等方面的物流行业应用方法。其中提到了地址转换成坐标 的问题,更专业些的名词应该是“地理编码”,即知道一个地址,如 北京市海淀区上地十街10号 ,怎么样可以获取到对应的经纬度位置信息 (40,116) ,或者反过来。

地理编码概念

很多地图相关的厂商都提供了相关的API,我们可以直接利用这些API得到这些信息。比如百度的 Geocoding API

Geocoding API是一类接口,用于提供从地址到经纬度坐标或者从经纬度坐标到地址的转换服务,用户可以使用C# 、C++、Java等开发语言发送请求且接收JSON、XML的返回数据。Geocoding API包括地址解析和逆地址解析功能:

picture.image

借用ESRI文档中更直观的一张图

picture.image

地理编码

即地址解析,由详细到街道的结构化地址得到百度经纬度信息,例如:“北京市海淀区中关村南大街27号”地址解析的结果是lng:116.31985,lat:39.959836

同时,地理编码也支持名胜古迹、标志性建筑名称直接解析返回百度经纬度,例如:“百度大厦”地址解析的结果是lng:116.30815,lat:40.056885

逆地理编码

即逆地址解析,由百度经纬度信息得到结构化地址信息,例如:“lat:31.325152,lng:120.558957”逆地址解析的结果是“江苏省苏州市虎丘区塔园路318号”。

不过,需要说明的一点是,若想使用百度的这套API的前提是,有百度账号并申请相应的Key。其实,除了百度之外,谷歌、ESRI、微软的Bing等都有类似的地理编码服务。不过这些服务大多没有专门针对Python的库并且彼此之间的Json结构也不一致。于是乎专治不服的Python大神做了一个专门的地理编码工具 geocoder ,将这些不同厂商的服务整合统一起来。

地理编码工具 geocoder

首先看一下它都支持哪些公司的地理编码服务:

ProviderOptimalUsage Policy
ArcGISWorld
BaiduChinaAPI key
BingWorldAPI key
CanadaPostCanadaAPI key
FreeGeoIPWorld
Geocoder.caCA & USRate Limit
GeocodeFarmWorldPolicy
GeoNamesWorldUsername
GeoOttawaOttawa
GoogleWorldRate Limit,
Policy
HEREWorldAPI key
IPInfoWorld
MapboxWorldAPI key
MapQuestWorldAPI key
MapzenWorldAPI key
MaxMindWorld
OpenCageWorldAPI key
OpenStreetMapWorldPolicy
TamuUSAPI key
TomTomWorldAPI key
What3WordsWorldAPI key
YahooWorld
YandexRussia
TGOSTaiwan

安装


      1. `pip install geocoder`


    

地理编码


      1. `import geocoder`
2. `g = geocoder.google("1403 Washington Ave, New Orleans, LA 70130")`
3. `g = geocoder.arcgis(u"北京市海淀区上地十街10号")`
4. `g.latlng`


    

输出为


      1. `[
 29.9287839
 ,
  
 -
 90.08421849999999
 ]`


    

也可以查看完整的geojson


      1. `g
 .
 geojson`


    

输出为


      1. `{'bbox': [-90.0855674802915,`
2. `29.9274349197085,`
3. `-90.0828695197085,`
4. `29.9301328802915],`
5. `'geometry': {'coordinates': [-90.08421849999999, 29.9287839],`
6. `'type': 'Point'},`
7. `'properties': {'accuracy': u'ROOFTOP',`
8. `'address': u'1403 Washington Ave, New Orleans, LA 70130, USA',`
9. `'bbox': [-90.0855674802915,`
10. `29.9274349197085,`
11. `-90.0828695197085,`
12. `29.9301328802915],`
13. `'city': u'New Orleans',`
14. `'confidence': 9,`
15. `'country': u'US',`
16. `'county': u'Orleans Parish',`
17. `'encoding': 'utf-8',`
18. `'housenumber': u'1403',`
19. `'lat': 29.9287839,`
20. `'lng': -90.08421849999999,`
21. `'location': '1403 Washington Ave, New Orleans, LA 70130',`
22. `'neighborhood': u'Garden District',`
23. `'ok': True,`
24. `'place': u'ChIJGyFHWc2lIIYRYSoneaXAUiw',`
25. `'postal': u'70130',`
26. `'provider': 'google',`
27. `'quality': u'street_address',`
28. `'state': u'LA',`
29. `'status': 'OK',`
30. `'status_code': 200,`
31. `'street': u'Washington Ave'},`
32. `'type': 'Feature'}`


    

直接用Google尝试查询中文地址时失败


      1. `g = geocoder.google(u"北京市海淀区上地十街10号")`
2. `g.ok`


    

输出为


      1. `False`


    

用百度应该没问题,不过我没有申请相应的key。切换到arcgis,能够成功编码


      1. `g = geocoder.arcgis(u"北京市海淀区上地十街10号")`
2. `g.latlng`


    

输出为


      1. `[
 40.050934
 ,
  
 116.30079
 ]`


    

逆地理编码


      1. `g = geocoder.google([29.9287839, -90.08421849999999], method='reverse')`
2. 
3. `print g.address`
4. `print g.city`
5. `print g.state`
6. `print g.country`


    

输出为


      1. `1403 Washington Ave, New Orleans, LA 70115, USA`
2. `New Orleans`
3. `LA`
4. `US`


    

换成中国的地址


      1. `g = geocoder.google([40.050934, 116.30079], method='reverse')`
2. `print g.address`
3. `print g.city`
4. `print g.state`
5. `print g.country`


    

输出为


      1. `Bai Du Da Sha, Haidian Qu, Beijing Shi, China, 100193`
2. `Beijing`
3. `Beijing Shi`
4. `CN`


    

用arcgis的服务试试


      1. `g = geocoder.arcgis([40.050934, 116.30079], method='reverse')`
2. `print g.address`
3. `print g.city`
4. `print g.state`
5. `print g.country`


    

输出为


      1. `None`
2. `北京市`
3. `北京市`
4. `CHN`


    

Google转换成的是英文,但地址比较全。arcgis虽然是中文,但是详细的地址居然输出为了None,这有个 X 用。

其他

geocoder 的功能不止于此,它还可以查IP(包括自己的)。


      1. `g = geocoder.ip('199.7.157.0')`
2. `print g.latlng`
3. `print g.city`
4. `g = geocoder.ip('me')`
5. `print g.latlng`
6. `print g.city`


    

输出为


      1. `[43.6934, -79.4857]`
2. `Toronto`
3. `[51.05, 13.75]`
4. `Dresden`


    

查询一个城市的空间包围盒


      1. `g = geocoder.arcgis(u"山东")`
2. `g.bbox`


    

输出为


      1. `{'northeast': [38.976997, 121.976998], 'southwest': [33.022997, 116.022998]}`


    

小结

空间信息既可以利用行政区划、自然地理区域等文本信息描述,也可以用坐标系统、数字(邮编等)来标识。利用地理编码技术,可以将空间信息的地理定位要素与相应的文本信息关联起来。本文主要介绍了 geocoder 地理编码这一小工具,可以方便快捷地利用地图等相关厂商提供的地理编码服务,将文字描述的位置转换成地图上的经纬度,或者通过地图上的某个位置坐标获得相应的位置信息文字描述。

picture.image

picture.image

Python中文社区

www.python-cn.com

picture.image

picture.image

致力于成为

国内最好的Python社区

QQ群:152745094

简书、知乎专栏:Python中文社区

Github:github.com/PyCN

专栏作者申请请发邮件至:

sinoandywong@gmail.com

0
0
0
0
评论
未登录
暂无评论