欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 調(diào)用API接口 獲取和解析 Json數(shù)據(jù)

 更新時間:2020年09月28日 11:53:12   作者:蝦米堡  
這篇文章主要介紹了python 如何調(diào)用API接口 獲取和解析 Json數(shù)據(jù),幫助大家更好的理解和使用python,感興趣的朋友可以了解下

任務(wù)背景:

調(diào)用API接口數(shù)據(jù),抽取我們所需類型的數(shù)據(jù),并寫入指定mysql數(shù)據(jù)庫。

先從宏觀上看這個任務(wù),并對任務(wù)進(jìn)行分解:

step1:需要學(xué)習(xí)python下的通過url讀取數(shù)據(jù)的方式;

step2:數(shù)據(jù)解析,也是核心部分,數(shù)據(jù)格式從python角度去理解,是字典?列表?還是各種嵌套?

step3:連接mysql數(shù)據(jù)庫,將數(shù)據(jù)寫入。

從功能上看,該數(shù)據(jù)獲取程序可以分為3個方法,即step1對應(yīng)方法request_data(),step2對應(yīng)方法parse_data(),step3對應(yīng)data_to_db()。

第一輪,暫不考慮異常,只考慮正常狀態(tài)下的功能實(shí)現(xiàn)。

1、先看request_data():

 import requests
 def request_data(url): 
 req = requests.get(url, timeout=30) # 請求連接
 req_jason = req.json() # 獲取數(shù)據(jù)
 return req_jason 

入?yún)ⅲ簎rl地址;return:獲取到的數(shù)據(jù)。

2、然后看parse_data():

不同的API接口下的數(shù)據(jù)格式各不相同,需要先理清,打開之后密密麻麻一大串,有的可能連完整的一輪數(shù)據(jù)間隔在哪都不知道,這時候可以巧用符號{ [ , ] }輔助判斷。

梳理之后,發(fā)現(xiàn)本接口下的數(shù)據(jù)格式為,最外層為字典,我們所需的數(shù)據(jù)在第一個key“data”下,data對應(yīng)的value為列表,列表中的每個元素為字典,字典中的部分鍵值

即為我們需要的內(nèi)容。這樣,就明確了我們的數(shù)據(jù)結(jié)構(gòu)為字典套列表,列表再套字典的格式,最后一層的字典還存在一鍵多值(比如“weather”)的情況。

當(dāng)然,還有懶人方法,就是百度json在線解析格式化。

摘取部分?jǐn)?shù)據(jù)如下:{"data":[{"timestamp_utc":"2020-08-31T08:00:00","weather":{"icon":"c02d","code":802,
wind_dir":336,"clouds_hi":0,"precip":0.0625},{"timestamp_utc":"2020-08-31T08:00:00","weather":{"icon":"c02d","code":802,},
wind_dir":336,"clouds_hi":0,"precip":0.0625],"city_name":"Dianbu","lon":117.58,"timezone":"Asia\/Shanghai","lat":31.95,"country_code":"CN"}

def parse_data(req_jason):
 data_trunk = req_jason['data']# 獲取data鍵值下的列表
 time_now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") #獲取當(dāng)前時刻
 for i in range(len(data_trunk)):
  data_unit = data_trunk[i] # 依次獲取列表下第i個元素即字典
  del data_unit['weather'] # 刪除該字典中不需要的一鍵多值的key和value,不刪除的話會影響后續(xù)的dataframe轉(zhuǎn)換,但是,如果該鍵值需要的話,需要采取其他處理方式
  df = pd.DataFrame([data_unit]) # 將刪除鍵值后的字典轉(zhuǎn)為datafrme
  list_need = ['timestamp_utc', 'wind_dir', 'precip','clouds_hi'] # 列出我們需要的列
  df_need = df[list_need] # 保留df中需要的列  10  df_need.insert(0, 'update_time', time_now) #表格中還需額外增加獲取數(shù)據(jù)的當(dāng)前時間,并且需要放在dataframe的第一列

備注:數(shù)據(jù)插入數(shù)據(jù)庫,有兩種方式,一種是采用insert的sql語句,采用字典的形式插入,另一種是采用dataframe的方式,采用pandas中的to_sql方法。本案例選擇了后者,所以在數(shù)據(jù)解析時,將字典數(shù)據(jù)轉(zhuǎn)成dataframe格式。

入?yún)ⅲ韩@取到的數(shù)據(jù);return值:無

運(yùn)行以后,發(fā)現(xiàn)這樣的程序存在一些問題:就是這個for循環(huán)括起來的過多,導(dǎo)致寫數(shù)據(jù)庫時是一條條寫入而不是一整塊寫入,會影響程序效率,所以需要對程序進(jìn)行如下修改:

def parse_data(req_jason):
 data_trunk = req_jason['data']# 獲取data鍵值下的列表
 time_now = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") #獲取當(dāng)前時刻
 for i in range(len(data_trunk)):
  data_unit = data_trunk[i] # 依次獲取列表下第i個元素即字典
  del data_unit['weather'] # 刪除該字典中不需要的一鍵多值的key和value,不刪除的話會影響后續(xù)的dataframe轉(zhuǎn)換,但是,如果該鍵值需要的話,需要采取其他處理方式
 df = pd.DataFrame(data_trunk) # 將刪除鍵值后的整個列表套字典轉(zhuǎn)為datafrme
 list_need = ['timestamp_utc', 'wind_dir', 'precip','clouds_hi'] # 列出我們需要的列
 df_need = df[list_need] # 保留df中需要的列
 df_need.insert(0, 'update_time', time_now) #表格中還需額外增加獲取數(shù)據(jù)的當(dāng)前時間,并且需要放在dataframe的第一列

也就是從第7行之后跳出循環(huán);

如果覺得for循環(huán)影響整體美觀,也可以用map代替,將代碼第4/5/6行改為如下代碼,不過性能上來說可能還是for循環(huán)更好,具體對比可看其他博主的測試,或者自己測試下運(yùn)行時間。

map(data_trunk.pop, ['weather'])

3. 最后就是data_to_sql():

def data_to_sql(df):
 table = 'request_data_api'
 engine = create_engine("mysql+pymysql://" + 'root' + ":" + '123' + "@" + 'localhost' + ":" + '3306' + "/" + 'test' + "?charset=utf8")
 df.to_sql(name=table, con=engine, if_exists='append',
   index=False, index_label=False)

入?yún)ⅲ篸ataframe類型數(shù)據(jù)。

當(dāng)當(dāng)當(dāng),正常部分已完成,就下來就需要想象各種異常以及處理對策。

第二輪,想象各種異常以及異常的記錄與處理對策。

1.讀取url后,獲取不到數(shù)據(jù) → 休息幾秒,嘗試再次重連獲取

2.連接數(shù)據(jù)庫異常 → 數(shù)據(jù)庫可能關(guān)閉,嘗試重新ping,

3.寫入數(shù)據(jù)庫的內(nèi)容為空 → 記錄異常,放棄入庫

第三輪,讓程序定時跑起來。

方法一:在代碼中采用apscheduler下的cron功能(trigger='cron‘,類似linux下的crontab)實(shí)現(xiàn)定時運(yùn)行(當(dāng)然,apscheduler還有另一種trigger=‘interval'模式);

方法二:在linux下的crontab增加定時任務(wù)。

具體可以看別的帖子。

以上就是python 調(diào)用API接口 獲取和解析 Json數(shù)據(jù)的詳細(xì)內(nèi)容,更多關(guān)于python 解析數(shù)據(jù)的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • 利用tkinter改變下拉列表(Combobox)的選項(xiàng)值

    利用tkinter改變下拉列表(Combobox)的選項(xiàng)值

    這篇文章主要介紹了利用tkinter改變下拉列表(Combobox)的選項(xiàng)值,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-01-01
  • 基于Python開發(fā)云主機(jī)類型管理腳本分享

    基于Python開發(fā)云主機(jī)類型管理腳本分享

    這篇文章主要為大家詳細(xì)介紹了如何基于Python開發(fā)一個云主機(jī)類型管理腳本,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2023-02-02
  • 利用Python探測附近WIFI密碼的詳細(xì)代碼

    利用Python探測附近WIFI密碼的詳細(xì)代碼

    這篇文章主要介紹了利用Python探測附近WIFI密碼,基于python腳本實(shí)現(xiàn)wifi密碼的暴力破解從而實(shí)現(xiàn)免費(fèi)蹭網(wǎng),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友參考下吧
    2022-01-01
  • python基礎(chǔ)之函數(shù)的返回值

    python基礎(chǔ)之函數(shù)的返回值

    這篇文章主要介紹了Python函數(shù)返回值,實(shí)例分析了Python中返回一個返回值與多個返回值的方法,需要的朋友可以參考下
    2021-10-10
  • 使用Python操作ArangoDB的方法步驟

    使用Python操作ArangoDB的方法步驟

    這篇文章主要介紹了使用Python操作ArangoDB的方法步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-02-02
  • Python中的pickle模塊常用函數(shù)

    Python中的pickle模塊常用函數(shù)

    這篇文章主要介紹了Python中的pickle模塊常用函數(shù),pickle模塊使用的數(shù)據(jù)格式是python專用的,能夠把python對象直接保存到文件,而不需要轉(zhuǎn)化為字符串,也不用底層的文件訪問操作把它們寫入到一個二進(jìn)制文件中,需要的朋友可以參考下
    2023-09-09
  • keras修改backend的簡單方法

    keras修改backend的簡單方法

    這篇文章主要介紹了keras修改backend的簡單方法,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-05-05
  • 基于Python的XML格式的文件示例代碼詳解

    基于Python的XML格式的文件示例代碼詳解

    這篇文章主要介紹了基于Python的XML格式的文件示例代碼詳解,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2021-03-03
  • Python利用字典樹實(shí)現(xiàn)獵詞游戲

    Python利用字典樹實(shí)現(xiàn)獵詞游戲

    獵詞(word hunt)是一類很常見的游戲,給你一張字母組成的表,然后讓你在這些字母中盡可能多的去尋找單詞。這類游戲用字典樹就能輕松完成,本文就來具體講講實(shí)現(xiàn)步驟,需要的可以參考一下
    2022-06-06
  • K-近鄰算法的python實(shí)現(xiàn)代碼分享

    K-近鄰算法的python實(shí)現(xiàn)代碼分享

    這篇文章主要介紹了K-近鄰算法的python實(shí)現(xiàn)代碼分享,具有一定借鑒價(jià)值,需要的朋友可以參考下。
    2017-12-12

最新評論