Python爬蟲獲取基金凈值信息詳情
1 前言
前面的文章中我們已經(jīng)獲取到了基金的階段變動信息和ETF信息的獲取,那么在本章中,我們將繼續(xù)前面的內(nèi)容,獲取基金的價格信息,并且把之前的抓取到的數(shù)據(jù)存入到數(shù)據(jù)庫中,方便我們進行后續(xù)的分析操作。
2 獲取基金凈值
獲取基金的凈值信息,也就是基金的最近一個交易日的價格,如下圖所示,展示了單位凈值更新的日期,價格以及漲跌幅度信息。順便我們也獲取一下基金的規(guī)模信息,后續(xù)選擇到同類基金不知道怎么去選擇的時候,可以選擇按照基金規(guī)模進行倒排序,選取規(guī)模比較大的進行投資,大概率能夠保證投資收益的穩(wěn)定性和可靠性。
過分分析,我們可以知道,基金的價格信息需要先獲取 class="dataItem0"
的 dl
標簽,基金規(guī)模信息的獲取方式也如上圖,可以知道規(guī)模信息在 <div class="infoOfFund">
標簽中的table
中的第二個td
中 :
單位凈值日期獲取方式:
dt>p 標簽內(nèi)容
基金凈值和變動信息獲取方式:
- dd.dataNums>span[0] 標簽為單位凈值
- dd.dataNums>span[1] 標簽為變動百分比
基金規(guī)模信息的獲取方式:
div>table>td[2]
基于以上的分析,我們最終實現(xiàn)的代碼如下圖所示,通過以上方式我們就獲取到了基金的價格信息數(shù)據(jù):
打印的結(jié)果如下圖所示:
code 159779 price 1.0007 percent 0.07 fund_size 3.55 update_date 2021-11-19
3 數(shù)據(jù)庫結(jié)構(gòu)設(shè)計
在獲取到數(shù)據(jù)之后,需要將數(shù)據(jù)進行結(jié)構(gòu)化存儲
4 如何進行數(shù)據(jù)存儲
需要進行存儲,就需要使用數(shù)據(jù)庫。在java
中存儲數(shù)據(jù)有各種各樣的orm框架進行操作,但是Python中沒有這么重的操作,需要自己書寫sql進行操作。首先我們需要安裝操作數(shù)據(jù)庫的類庫。
# 安裝 pymysql pip install pymysql
接下來我們需要配置數(shù)據(jù)庫的連接信息,通過連接信息,編寫兩個方法,一個是查詢數(shù)據(jù)庫的信息,另外一個是修改數(shù)據(jù)庫的信息(增/刪/改)。修改數(shù)據(jù)的時候一定要記得commit()
數(shù)據(jù)庫信息,否則不會保存成功。
5 總結(jié)
本文介紹了如何獲取基金的價格信息,同時也進行了數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計以及數(shù)據(jù)存儲的操作方法,由于代碼和表結(jié)構(gòu)會占用大量的文案,文章就貼圖展示
到此這篇關(guān)于Python爬蟲獲取基金凈值信息詳情的文章就介紹到這了,更多相關(guān)Python獲取信息內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
基于python3抓取pinpoint應(yīng)用信息入庫
這篇文章主要介紹了基于python3抓取pinpoint應(yīng)用信息入庫,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-01-01Python數(shù)據(jù)分析之雙色球統(tǒng)計單個紅和藍球哪個比例高的方法
這篇文章主要介紹了Python數(shù)據(jù)分析之雙色球統(tǒng)計單個紅和藍球哪個比例高的方法,涉及Python數(shù)值運算及圖形繪制相關(guān)操作技巧,需要的朋友可以參考下2018-02-02AMP?Tensor?Cores節(jié)省內(nèi)存PyTorch模型詳解
這篇文章主要為大家介紹了AMP?Tensor?Cores節(jié)省內(nèi)存PyTorch模型詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-10-10Python實現(xiàn)學(xué)生管理系統(tǒng)的完整代碼(面向?qū)ο?
這篇文章主要介紹了Python實現(xiàn)學(xué)生管理系統(tǒng)的完整代碼(面向?qū)ο?,本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-04-04