欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

利用Python抓取行政區(qū)劃碼的方法

 更新時間:2016年11月28日 11:53:46   作者:標點符  
做項目的時候會需要用到各個行政區(qū)劃的代碼,最近就碰巧遇到有這個需求,于是就上網(wǎng)搜了一下,測試后分享給大家,這篇文章就給大家分享了利用Python抓取行政區(qū)劃碼的示例代碼,有需要的朋友們可以參考借鑒,下面跟著小編一起去學習學習吧。

前言

國家統(tǒng)計局網(wǎng)站上有相對比較齊的行政區(qū)劃碼,對于一些網(wǎng)站來說這是非?;A的數(shù)據(jù),所以寫了個Python程序?qū)⑦@部分數(shù)據(jù)抓取下來。

注意:抓取下來以后還要進行簡單的人工的整理

示例代碼:

# -*- coding:utf-8 -*-
'''
獲取國家統(tǒng)計局上的行政區(qū)劃碼
'''
import requests,re
base_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html'
 
def get_xzqh():
 html_data = requests.get(base_url).content
 pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(\d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>')
 areas = re.findall(pattern,html_data)
 print "code,name,level"
 for area in areas:
  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ')
 
if __name__=='__main__':
 get_xzqh()

注意事項:

另外,關于國家地區(qū)表的信息,還有另外一種獲取渠道,那就是QQ軟件自帶的國家地區(qū)信息表。(文件名為LocList.xml),一般的存儲位置為:C:\Program Files\Tencent\QQ\I18N\2052

如需中文版安裝中文版QQ即可獲取,如需英文版則安裝英文版QQ。國際版在1033目錄。

code都是按照ISO3166標準寫的,極易導入數(shù)據(jù)庫。

總結(jié)

以上就是利用Python獲取行政區(qū)劃碼的全部內(nèi)容,希望本文的內(nèi)容對大家學習或者使用python能有所幫助,如果有疑問大家可以留言交流。

相關文章

最新評論