Python實(shí)現(xiàn)推送百度鏈接的示例代碼
通過代碼實(shí)現(xiàn)抓取個(gè)人博客中某一頁(yè)指定文章鏈接,并批量將該鏈接推送到百度站長(zhǎng)平臺(tái),起到快速收錄的目的。?
import sys
import requests
from bs4 import BeautifulSoup
# 推送百度爬蟲
def push_page(url):
headers = {
'User-Agent': 'curl/7.12.1',
'Host': 'data.zz.baidu.com',
'Content-Type': 'text/plain',
'Content-Length': '83'
}
urls = "http://data.zz.baidu.com/urls?site=https://www.lyshark.com&token=xxxxxxx"
try:
html = requests.post(urls, headers=headers, data=url, timeout=5).text
push_status = eval(html)['success']
if push_status == 1:
return 1
else:
return 0
except:
return 0
# 獲取路徑
def get_page(page):
html = requests.get(page,timeout=5).text
try:
bs = BeautifulSoup(html,"html.parser")
ret = bs.select('div[class="container"] div[class="row"] h2[class="post-title"] a')
for item in ret:
push_url = item.get('href')
push_ref = push_page(push_url)
print("推送: {} --> 狀態(tài): {}".format(push_url,push_ref))
return 1
except:
return 0
if __name__ == "__main__":
arg = sys.argv
get_page(arg[1])
補(bǔ)充
在百度的站長(zhǎng)平臺(tái)上介紹了鏈接提交方法,目前有這四種:
主動(dòng)推送:最快的提交方式,推薦將站點(diǎn)當(dāng)天新產(chǎn)出鏈接立即通過此方式推送給百度,以保證新鏈接可以及時(shí)被百度收錄。
自動(dòng)推送:最為便捷的提交方式,將自動(dòng)推送的JS代碼部署在站點(diǎn)的每一個(gè)頁(yè)面源代碼中,部署代碼的頁(yè)面在每次被瀏覽時(shí),鏈接會(huì)被自動(dòng)推送給百度??梢耘c主動(dòng)推送配合使用。
sitemap:將網(wǎng)站鏈接放到sitemap中,然后將sitemap的地址提交給百度。百度會(huì)周期性的抓取檢查您提交的sitemap,對(duì)其中的鏈接進(jìn)行處理,但收錄速度慢于主動(dòng)推送。
手動(dòng)提交:操作起來麻煩。
為了讓網(wǎng)站最新的內(nèi)容更加及時(shí)的提交給百度,使用主動(dòng)推送就很必要,百度給的例子中沒有 Python 的。根據(jù) Google 了一下,還真找到了不錯(cuò)的腳本,分享收藏一下。
以下腳本使用 Python3,未在 Python2 環(huán)境下測(cè)試過。

讀取本地生成的 sitemap.txt 文件

另外,可嘗試以下腳本。

到此這篇關(guān)于Python實(shí)現(xiàn)推送百度鏈接的示例代碼的文章就介紹到這了,更多相關(guān)Python推送百度鏈接內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python使用threading獲取線程函數(shù)返回值的實(shí)現(xiàn)方法
這篇文章主要介紹了python使用threading獲取線程函數(shù)返回值的實(shí)現(xiàn)方法,需要的朋友可以參考下2017-11-11
簡(jiǎn)單談?wù)凱ython中的反轉(zhuǎn)字符串問題
本文給大家總結(jié)了5種可以實(shí)現(xiàn)python中反轉(zhuǎn)字符串的方法,非常的實(shí)用,有需要的小伙伴可以參考下2016-10-10
Python讀取Word文檔中的Excel嵌入文件的方法詳解
這篇文章主要為大家詳細(xì)介紹了Python讀取Word文檔中的Excel嵌入文件的方法,文中的示例代碼講解詳細(xì),具有一定的借鑒價(jià)值,需要的可以參考一下2022-12-12
python求numpy中array按列非零元素的平均值案例
這篇文章主要介紹了python求numpy中array按列非零元素的平均值案例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-06-06
python實(shí)現(xiàn)拉普拉斯特征圖降維示例
今天小編就為大家分享一篇python實(shí)現(xiàn)拉普拉斯特征圖降維示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-11-11
解決pytorch讀取自制數(shù)據(jù)集出現(xiàn)過的問題
這篇文章主要介紹了解決pytorch讀取自制數(shù)據(jù)集出現(xiàn)過的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-05-05
Django如何利用uwsgi和nginx修改代碼自動(dòng)重啟
這篇文章主要介紹了Django如何利用uwsgi和nginx修改代碼自動(dòng)重啟問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
python實(shí)現(xiàn)windows倒計(jì)時(shí)鎖屏功能
這篇文章主要介紹了python實(shí)現(xiàn)windows倒計(jì)時(shí)鎖屏功能,代碼簡(jiǎn)單易懂,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-07-07

