通過(guò)微信公眾平臺(tái)獲取公眾號(hào)文章的方法示例
我之前自己維護(hù)了一個(gè)公眾號(hào),但因?yàn)閭€(gè)人關(guān)系很久沒(méi)有更新了,今天上來(lái)緬懷一下,卻偶然發(fā)現(xiàn)了一個(gè)獲取微信公眾號(hào)文章的方法。
之前獲取方法有很多,通過(guò)搜狗、清博、網(wǎng)頁(yè)端、客戶端等等都還可以,這個(gè)可能并沒(méi)有其他的優(yōu)秀,但是操作簡(jiǎn)單,很容易理解。
so、 首先需要有一個(gè)微信公眾平臺(tái)的賬號(hào)
微信公眾平臺(tái):https://mp.weixin.qq.com/
登陸之后,進(jìn)入首頁(yè),點(diǎn)擊新建群發(fā)。
選擇自建圖文:
似乎像是公眾號(hào)運(yùn)營(yíng)教學(xué)了
進(jìn)入編輯頁(yè)面之后,點(diǎn)擊超鏈接
彈出選擇框,我們?cè)诳蛑休斎雽?duì)應(yīng)的公眾號(hào)名字,即可出現(xiàn)對(duì)應(yīng)的文章列表
是不是很驚奇,可以打開(kāi)控制臺(tái),查看一下請(qǐng)求的接口
打開(kāi)response,里面就是我們需要的文章鏈接
確定了數(shù)據(jù)以后,我們需要分析一下這個(gè)接口。
感覺(jué)很簡(jiǎn)單,一個(gè)GET請(qǐng)求,攜帶一些參數(shù)。
fakeid是公眾號(hào)的獨(dú)有ID,所以想通過(guò)名字直接獲取文章列表,還需要先獲取一下fakeid。
當(dāng)我們輸入公眾號(hào)名字后,點(diǎn)擊搜索??梢钥吹接|發(fā)了搜索接口,返回了fakeid。
這個(gè)接口所需參數(shù)也不多。
接下來(lái),我們可以用代碼來(lái)模擬以上的操作了。
但是還需要使用現(xiàn)有Cookie避免登陸。
目前Cookie的有效期,我還沒(méi)有測(cè)試??赡苄枰皶r(shí)更新Cookie。
測(cè)試代碼:
import requests import json Cookie = '請(qǐng)換上自己的Cookie,獲取方法:直接復(fù)制下來(lái)' url = "https://mp.weixin.qq.com/cgi-bin/appmsg" headers = { "Cookie": Cookie, "User-Agent": 'Mozilla/5.0 (Linux; Android 10; YAL-AL00 Build/HUAWEIYAL-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/70.0.3538.64 HuaweiBrowser/10.0.1.335 Mobile Safari/537.36' } keyword = 'pythonlx' # 公眾號(hào)名字:可自定義 token = '你的token' # 獲取方法:如上述 直接復(fù)制下來(lái) search_url = 'https://mp.weixin.qq.com/cgi-bin/searchbiz?action=search_biz&begin=0&count=5&query={}&token={}&lang=zh_CN&f=json&ajax=1'.format(keyword,token) doc = requests.get(search_url,headers=headers).text jstext = json.loads(doc) fakeid = jstext['list'][0]['fakeid'] data = { "token": token, "lang": "zh_CN", "f": "json", "ajax": "1", "action": "list_ex", "begin": 0, "count": "5", "query": "", "fakeid": fakeid, "type": "9", } json_test = requests.get(url, headers=headers, params=data).text json_test = json.loads(json_test) print(json_test)
這樣就能獲取最新的10篇文章了,如果想要獲取更多的歷史文章,可以修改data中的"begin"參數(shù),0是第一頁(yè),5是第二頁(yè),10是第三頁(yè)(以此類推)
但是如果想要大規(guī)模抓取的話:
請(qǐng)給自己安排一個(gè)穩(wěn)定的代理,降低爬蟲(chóng)的速度,準(zhǔn)備多個(gè)賬號(hào),來(lái)減少被封禁的可能性。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Javascript實(shí)現(xiàn)元素選擇器功能
這篇文章主要為大家詳細(xì)介紹了Javascript實(shí)現(xiàn)元素選擇器功能,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-07-07用JavaScript實(shí)現(xiàn)使用鼠標(biāo)畫(huà)線的示例代碼
用JavaScript實(shí)現(xiàn)用鼠標(biāo)畫(huà)線,具體步驟是首先是畫(huà)點(diǎn),在根據(jù)兩點(diǎn)坐標(biāo)畫(huà)直線,最后是獲取鼠標(biāo)位置,需要的朋友可以參考下2014-08-08webpack打包后直接訪問(wèn)頁(yè)面圖片路徑錯(cuò)誤的解決方法
這篇文章主要給大家介紹了在webpack打包后直接訪問(wèn)頁(yè)面圖片路徑錯(cuò)誤的解決方法,文中介紹的非常詳細(xì),對(duì)遇到這個(gè)問(wèn)題的朋友們具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧。2017-06-06返回上一頁(yè)并自動(dòng)刷新的JavaScript代碼
返回上一頁(yè)并自動(dòng)刷新,JavaScript一般的使用history.go(-1)和history.back()等,需要的朋友可以參考下2014-02-02讓IDE識(shí)別webpack的別名alias的實(shí)現(xiàn)方法
這篇文章主要介紹了讓IDE識(shí)別webpack的別名alias的實(shí)現(xiàn)方法,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-05-05JavaScript運(yùn)動(dòng)函數(shù)實(shí)例詳解
這篇文章主要為大家詳細(xì)介紹了JavaScript的運(yùn)動(dòng)函數(shù),使用實(shí)例在論證,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-02-02javascript跟隨滾動(dòng)條滾動(dòng)的層(浮動(dòng)AD效果)
javascript跟隨滾動(dòng)條滾動(dòng)的層(浮動(dòng)AD效果)...2007-08-08