python爬取全國水雨情信息詳解
分析
我們沒有找到接口,所以打算利用selenium來爬取。
代碼
import datetime import pandas as pd from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.chrome.options import Options #建議使用谷歌瀏覽器 import time chrome_options = Options() chrome_options.add_argument('--headless') driver = webdriver.Chrome() # 存儲中英文對應(yīng)的變量的中文名 word_dict = {"poiBsnm": "流域", "poiAddv": "行政區(qū)", "rvnm": "河名", "stnm": "站名", "tm": "時間", "zl": "水位(米)", "ql": "流量(立方米/秒)", "wrz": "警戒水位(米)"} # 空df接收結(jié)果 rain_total = pd.DataFrame([]) url = 'http://xxfb.mwr.cn/sq_dxsk.html' driver.get(url) time.sleep(5) infos = driver.find_elements_by_xpath("/html/body//tbody[@id='DataContainer']/tr") # pd.set_option('display.max_columns', None)#所有列 # pd.set_option('display.max_rows', None)#所有行 # 列表提取 for info in infos: poiBsnm = info.find_element_by_xpath("./td[1]").text poiAddv = info.find_element_by_xpath("./td[2]").text rvnm = info.find_element_by_xpath("./td[3]").text stnm = info.find_element_by_xpath("./td[4]").text tm = info.find_element_by_xpath("./td[5]").text zl = info.find_element_by_xpath("./td[6]").text ql = info.find_element_by_xpath("./td[7]").text wrz = info.find_element_by_xpath("./td[8]").text # 組成pandas對象 rain_data = [[poiBsnm,poiAddv,rvnm,stnm,tm,zl,ql,wrz]] rain_df = pd.DataFrame(data=rain_data,columns=list(word_dict.values())) rain_total = pd.concat([rain_total,rain_df]) print(rain_total) # 關(guān)閉瀏覽器 driver.close() # 保存數(shù)據(jù) data_str = datetime.datetime.now().strftime('%Y_%m_%d') rain_total.to_csv("%s_全國水雨情信息.csv" % (data_str),index=None, encoding="GB18030")
結(jié)果
總結(jié)
時間爬取出現(xiàn)了一點(diǎn)問題,我也很不理解,其次,循環(huán)哪里應(yīng)該可以簡潔代碼,寫的不是很好,第三,沒有形成模塊化的代碼。還有就是謝謝崔工的支持。
本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!
相關(guān)文章
關(guān)于命令行執(zhí)行Python腳本的傳參方式
這篇文章主要介紹了關(guān)于命令行執(zhí)行Python腳本的傳參方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-09-09Python實(shí)現(xiàn)提取音樂頻譜的方法詳解
你有沒有經(jīng)常好奇一些音樂軟件的頻譜特效是怎么做的,為什么做的這么好看?有沒有想試試自己提取音樂頻譜并可視化展現(xiàn)出來?本文就來教你如何利用Python提取音樂頻譜,快來學(xué)習(xí)一下吧2022-06-0610個python爬蟲入門基礎(chǔ)代碼實(shí)例 + 1個簡單的python爬蟲完整實(shí)例
這篇文章主要介紹了10個python爬蟲入門基礎(chǔ)代碼實(shí)例和1個簡單的python爬蟲爬蟲貼吧圖片的實(shí)例,需要的朋友可以參考下2020-12-12python爬蟲基礎(chǔ)教程:requests庫(二)代碼實(shí)例
這篇文章主要介紹了python爬蟲基礎(chǔ)教程:requests庫(二),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-04-04python xlsxwriter庫生成圖表的應(yīng)用示例
這篇文章主要介紹了python xlsxwriter庫生成圖表的應(yīng)用示例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-03-03在Python開發(fā)環(huán)境中調(diào)用ChatGPT模型詳細(xì)過程
在開發(fā)過程當(dāng)中時常需要使用 ChatGPT 來完成一些任務(wù),但總是使用網(wǎng)頁交互模式去 Web 端訪問 ChatGPT 是很麻煩的,這時候我們可以使用代碼來調(diào)用 ChatGPT 模型,本文將詳細(xì)介紹在 Python 開發(fā)環(huán)境中調(diào)用 ChatGPT 模型過程,,需要的朋友可以參考下2023-05-05