欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python 微信公眾號(hào)文章爬取的示例代碼

 更新時(shí)間:2020年11月30日 08:31:45   作者:稚小白  
這篇文章主要介紹了Python 微信公眾號(hào)文章爬取的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

一.思路

我們通過網(wǎng)頁版的微信公眾平臺(tái)的圖文消息中的超鏈接獲取到我們需要的接口

圖文消息

超鏈接

從接口中我們可以得到對(duì)應(yīng)的微信公眾號(hào)和對(duì)應(yīng)的所有微信公眾號(hào)文章。

二.接口分析

獲取微信公眾號(hào)的接口:
https://mp.weixin.qq.com/cgi-bin/searchbiz?
參數(shù):
action=search_biz
begin=0
count=5
query=公眾號(hào)名稱
token=每個(gè)賬號(hào)對(duì)應(yīng)的token值
lang=zh_CN
f=json
ajax=1
請(qǐng)求方式:
GET
所以這個(gè)接口中我們只需要得到token即可,而query則是你需要搜索的公眾號(hào),token則可以通過登錄后的網(wǎng)頁鏈接獲取得到。

微信公眾號(hào)

獲取對(duì)應(yīng)公眾號(hào)的文章的接口:
https://mp.weixin.qq.com/cgi-bin/appmsg?
參數(shù):
action=list_ex
begin=0
count=5
fakeid=MjM5NDAwMTA2MA==
type=9
query=
token=557131216
lang=zh_CN
f=json
ajax=1
請(qǐng)求方式:
GET
在這個(gè)接口中我們需要獲取的值有上一步的token以及fakeid,而這個(gè)fakeid則在第一個(gè)接口中可以獲取得到。從而我們就可以拿到微信公眾號(hào)文章的數(shù)據(jù)了。

微信公眾號(hào)

三.實(shí)現(xiàn)

 第一步:

首先我們需要通過selenium模擬登錄,然后獲取到cookie和對(duì)應(yīng)的token

def weChat_login(user, password):
  post = {}
  browser = webdriver.Chrome()
  browser.get('https://mp.weixin.qq.com/')
  sleep(3)
  browser.delete_all_cookies()
  sleep(2)
  # 點(diǎn)擊切換到賬號(hào)密碼輸入
  browser.find_element_by_xpath("http://a[@class='login__type__container__select-type']").click()
  sleep(2)
  # 模擬用戶點(diǎn)擊
  input_user = browser.find_element_by_xpath("http://input[@name='account']")
  input_user.send_keys(user)
  input_password = browser.find_element_by_xpath("http://input[@name='password']")
  input_password.send_keys(password)
  sleep(2)
  # 點(diǎn)擊登錄
  browser.find_element_by_xpath("http://a[@class='btn_login']").click()
  sleep(2)
  # 微信登錄驗(yàn)證
  print('請(qǐng)掃描二維碼')
  sleep(20)
  # 刷新當(dāng)前網(wǎng)頁
  browser.get('https://mp.weixin.qq.com/')
  sleep(5)
  # 獲取當(dāng)前網(wǎng)頁鏈接
  url = browser.current_url
  # 獲取當(dāng)前cookie
  cookies = browser.get_cookies()
  for item in cookies:
    post[item['name']] = item['value']
  # 轉(zhuǎn)換為字符串
  cookie_str = json.dumps(post)
  # 存儲(chǔ)到本地
  with open('cookie.txt', 'w+', encoding='utf-8') as f:
    f.write(cookie_str)
  print('cookie保存到本地成功')
  # 對(duì)當(dāng)前網(wǎng)頁鏈接進(jìn)行切片,獲取到token
  paramList = url.strip().split('?')[1].split('&')
  # 定義一個(gè)字典存儲(chǔ)數(shù)據(jù)
  paramdict = {}
  for item in paramList:
    paramdict[item.split('=')[0]] = item.split('=')[1]
  # 返回token
  return paramdict['token']

定義了一個(gè)登錄方法,里面的參數(shù)為登錄的賬號(hào)和密碼,然后定義了一個(gè)字典用來存儲(chǔ)cookie的值。通過模擬用戶輸入對(duì)應(yīng)的賬號(hào)密碼并且點(diǎn)擊登錄,然后會(huì)出現(xiàn)一個(gè)掃碼驗(yàn)證,用登錄的微信去掃碼即可。
刷新當(dāng)前網(wǎng)頁后,獲取當(dāng)前cookie以及token然后返回。

第二步:

1.請(qǐng)求獲取對(duì)應(yīng)公眾號(hào)接口,取到我們需要的fakeid

 url = 'https://mp.weixin.qq.com'
  headers = {
    'HOST': 'mp.weixin.qq.com',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36 Edg/86.0.622.63'
  }
  with open('cookie.txt', 'r', encoding='utf-8') as f:
    cookie = f.read()
  cookies = json.loads(cookie)
  resp = requests.get(url=url, headers=headers, cookies=cookies)
  search_url = 'https://mp.weixin.qq.com/cgi-bin/searchbiz?'
  params = {
    'action': 'search_biz',
    'begin': '0',
    'count': '5',
    'query': '搜索的公眾號(hào)名稱',
    'token': token,
    'lang': 'zh_CN',
    'f': 'json',
    'ajax': '1'
  }
  search_resp = requests.get(url=search_url, cookies=cookies, headers=headers, params=params)

將我們獲取到的token和cookie傳進(jìn)來,然后通過requests.get請(qǐng)求,獲得返回的微信公眾號(hào)的json數(shù)據(jù)

lists = search_resp.json().get('list')[0]

通過上面的代碼即可獲取到對(duì)應(yīng)的公眾號(hào)數(shù)據(jù)

fakeid = lists.get('fakeid')

通過上面的代碼就可以得到對(duì)應(yīng)的fakeid

2.請(qǐng)求獲取微信公眾號(hào)文章接口,取到我們需要的文章數(shù)據(jù)

 appmsg_url = 'https://mp.weixin.qq.com/cgi-bin/appmsg?'
  params_data = {
    'action': 'list_ex',
    'begin': '0',
    'count': '5',
    'fakeid': fakeid,
    'type': '9',
    'query': '',
    'token': token,
    'lang': 'zh_CN',
    'f': 'json',
    'ajax': '1'
  }
  appmsg_resp = requests.get(url=appmsg_url, cookies=cookies, headers=headers, params=params_data)

我們傳入fakeid和token然后還是調(diào)用requests.get請(qǐng)求接口,獲得返回的json數(shù)據(jù)。
我們就實(shí)現(xiàn)了對(duì)微信公眾號(hào)文章的爬取。

四.總結(jié)

通過對(duì)微信公眾號(hào)文章的爬取,需要掌握selenium和requests的用法,以及如何獲取到請(qǐng)求接口。但是需要注意的是當(dāng)我們循環(huán)獲取文章時(shí),一定要設(shè)置延遲時(shí)間,不然賬號(hào)很容易被封禁,從而得不到返回的數(shù)據(jù)。

到此這篇關(guān)于Python 微信公眾號(hào)文章爬取的示例代碼的文章就介紹到這了,更多相關(guān)Python 微信公眾號(hào)文章爬取內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python簡(jiǎn)單實(shí)現(xiàn)插入排序?qū)嵗a

    python簡(jiǎn)單實(shí)現(xiàn)插入排序?qū)嵗a

    在本篇文章里小編給大家整理了一篇關(guān)于python簡(jiǎn)單實(shí)現(xiàn)插入排序?qū)嵗a,有需要的朋友們可以學(xué)習(xí)參考下。
    2020-12-12
  • 使用Python批量移除Word文檔水印的代碼示例

    使用Python批量移除Word文檔水印的代碼示例

    移除Word文檔中的水印可以減少不必要的麻煩,通過使用Python這樣的編程語言,我們可以輕松實(shí)現(xiàn)自動(dòng)化操作,高效地移除Word文檔中的水印,確保文檔的專業(yè)性和準(zhǔn)確性,本文將介紹如何使用Python批量移除Word文檔中的水印
    2024-07-07
  • python實(shí)現(xiàn)俄羅斯方塊小游戲

    python實(shí)現(xiàn)俄羅斯方塊小游戲

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)俄羅斯方塊小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-04-04
  • Numpy的各種下標(biāo)操作的示例代碼

    Numpy的各種下標(biāo)操作的示例代碼

    本文主要介紹了Numpy的各種下標(biāo)操作的示例代碼,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2022-02-02
  • python利用beautifulSoup實(shí)現(xiàn)爬蟲

    python利用beautifulSoup實(shí)現(xiàn)爬蟲

    這篇文章主要介紹了python利用beautifulSoup實(shí)現(xiàn)爬蟲,需要的朋友可以參考下
    2014-09-09
  • Python TestSuite生成測(cè)試報(bào)告過程解析

    Python TestSuite生成測(cè)試報(bào)告過程解析

    這篇文章主要介紹了Python TestSuite生成測(cè)試報(bào)告過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-07-07
  • 淺談python標(biāo)準(zhǔn)庫--functools.partial

    淺談python標(biāo)準(zhǔn)庫--functools.partial

    這篇文章主要介紹了python標(biāo)準(zhǔn)庫--functools.partial,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • Python 條件判斷的縮寫方法

    Python 條件判斷的縮寫方法

    開始以為Python中沒有像其他語言一樣的條件判斷的縮寫形式:
    2008-09-09
  • Python的裝飾器使用詳解

    Python的裝飾器使用詳解

    最近在學(xué)習(xí)python,下面是在Python學(xué)習(xí)小組上介紹的內(nèi)容,現(xiàn)學(xué)現(xiàn)賣、多練習(xí)是好的學(xué)習(xí)方式,希望大家能夠喜歡
    2017-06-06
  • Python下的Softmax回歸函數(shù)的實(shí)現(xiàn)方法(推薦)

    Python下的Softmax回歸函數(shù)的實(shí)現(xiàn)方法(推薦)

    下面小編就為大家?guī)硪黄狿ython下的Softmax回歸函數(shù)的實(shí)現(xiàn)方法(推薦)。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧
    2017-01-01

最新評(píng)論