排名難頁面不收錄什么原因?網(wǎng)站存在抓取錯誤的解決方法

不抓取如何會收錄,又怎么有排名?然而就這樣一個明顯的問題,卻有大量的網(wǎng)站將其忽略掉。在A5這里做SEO診斷服務(wù)的客戶中,其中“20%”的網(wǎng)站都會存在抓取錯誤,直接嚴(yán)重影響到網(wǎng)站的成長效果。今天這篇文章,如果你有幸看到,希望可以閱讀完今天這篇文章,并分享出去,因為真的會很有價值。
賀貴江:曾經(jīng)診斷過一個千萬級別收錄的站點(diǎn),但是索引總是被反復(fù)的剔除,又反復(fù)的收錄,企業(yè)一直找不到問題。可是當(dāng)我們對網(wǎng)站檢查之初就發(fā)現(xiàn)一個怪的現(xiàn)象了:

1、錯誤的封禁
在百度的robots.txt的更新上,如果多次點(diǎn)擊“檢測并更新”就會出現(xiàn)時??梢愿拢怯謺r常無法更新的問題。如此一來:不應(yīng)當(dāng)被收錄的東西,在robots.txt上禁止的被收錄了,又刪除就很正常了。那么它的問題是什么呢?并非服務(wù)器負(fù)載過度,而是因為防火墻錯誤的將部分Baiduspider列入了黑名單。
上面這個例子是robots.txt方面的抓取錯誤,作為站長最少應(yīng)該每周都檢查更新一下robots.txt是否可以正常更新。之后我們再看下“頁面抓取”方面的錯誤:
2、服務(wù)器異常
常規(guī)的服務(wù)器就不說啦,大家都知道的,北上廣的一般都不錯。不過有一些特殊服務(wù)器,想必絕大多數(shù)的站長都不知道吧?例如西部數(shù)碼的“港臺服務(wù)器”就很有趣,真的是港臺的嗎?本身機(jī)房在國內(nèi),還算什么港臺?為了逃避備案而用一個港臺的IP,數(shù)據(jù)全部在國內(nèi)。

這樣有什么不好呢?我們會發(fā)現(xiàn):站點(diǎn)的服務(wù)器是經(jīng)過CDN的,哪怕是你上傳的一張圖片,都會顯示為“302狀態(tài)碼”,訪問速度是提升上去了,可是這樣利于SEO嗎?呵呵噠。真不知道西數(shù)做為國內(nèi)大型idc服務(wù)商是如何想的,利用那些無知嗎?
3、獲取不到真實IP
規(guī)模較大的網(wǎng)站,一般都會使用CDN加速,但是有些站點(diǎn)不僅僅對“設(shè)備”使用了CDN加速,而且還對Spider使用了加速功能。最后的結(jié)果是什么呢?如果CDN節(jié)點(diǎn)不穩(wěn)定,那么對網(wǎng)站spider來講,這個問題將是致命的。

很多大型站點(diǎn)開放CDN的原因就是容易被攻擊,這個時候如果不做“蜘蛛回源”就可想而知了。你的站點(diǎn)做了CDN了嗎?請登錄百度站長平臺查看一下spider是否可以抓取真實IP地址吧!
4、頻繁的50X類錯誤

這樣的鏈接其中一個共同的特點(diǎn)是:當(dāng)打開后,全部都是正常的,那么Spider為什么會報錯提醒呢?只是因為在爬蟲發(fā)起抓取的那一刻,httpcode返回了5XX",你的站點(diǎn)是否頻繁有這樣的問題呢?有的話需要立即安排技術(shù),或者通報IDC服務(wù)商做解決了!
5、錯誤的抓取比例

任何網(wǎng)站都做不到100%不出問題,但是萬事有一個度:我們認(rèn)為,這個比例不超過5%,對網(wǎng)站基本上是無影響的,且這樣的錯誤不應(yīng)當(dāng)每天都出現(xiàn)。最常見的抓取錯誤一般都是連接超時:"抓取請求連接建立后,下載頁面速度過慢,導(dǎo)致超時,可能原因服務(wù)器過載,帶寬不足"這種情況:
A:盡量在不影響圖片質(zhì)量的情況下,對圖片進(jìn)行壓縮,上傳的時候就進(jìn)行了壓縮。
B:減少如JS腳本文件類型的使用,或者進(jìn)行合并
C:頁面大小進(jìn)行控制,尤其是一些瀏覽量、抓取量較高的頁面,不建議超過2MB。
D:增加網(wǎng)站的帶寬,提升下載速度,或者更換服務(wù)器。
今天這篇分享,是否對你有幫助呢?希望能對大家有所幫助!
相關(guān)文章
這幾天爆火的chatgpt是啥? 與SEO有沒有關(guān)系? 速看
近日,OpenAI 帶來了一種全新的 AI 聊天機(jī)器人——ChatGPT,它不僅能對話、寫作還能編程、Debug,厲害得嚇人,那么chatgpt與SEO有沒有關(guān)系?詳細(xì)請看下文介紹2022-12-10- 這篇文章主要介紹了收錄與索引是什么意思?收錄和索引的區(qū)別是什么?的相關(guān)資料,需要的朋友可以參考下本文詳細(xì)內(nèi)容介紹2022-11-07
大網(wǎng)站與小網(wǎng)站做排名流量的區(qū)別是什么
這篇文章主要介紹了大網(wǎng)站與小網(wǎng)站做排名流量的區(qū)別是什么的相關(guān)資料,需要的朋友可以參考下本文詳細(xì)內(nèi)容介紹2022-11-07- 不同的搜索引擎提供了服務(wù)后臺常見功能來優(yōu)化網(wǎng)站搜索,下面文章就為大家詳細(xì)介紹,一起看看吧2021-10-14
新站如何優(yōu)化 網(wǎng)站收錄/關(guān)鍵詞排名等問題解答
筆者最近收到很多關(guān)于新站優(yōu)化的咨詢,問題無外乎是網(wǎng)站首頁怎么還沒收錄、網(wǎng)站內(nèi)容什么時候收錄、關(guān)鍵詞排名什么時候才能上來等等。這些問題看似很重要,但筆者認(rèn)為對上線2021-03-19如何快速收錄網(wǎng)站內(nèi)容 想要快速收錄網(wǎng)站內(nèi)容的注意事項
對于網(wǎng)站SEO優(yōu)化而言,頁面收錄是很重要的環(huán)節(jié),因為如果網(wǎng)站沒有收錄,或者網(wǎng)站收錄少的話,那么就談不上關(guān)鍵詞排名了。那么如何快速收錄網(wǎng)站,如何快速收錄一篇文章呢?本2021-03-19- 2020年如何利用SEO增加流量?下文小編就為大家?guī)碓敿?xì)教程,感興趣的朋友可以一起看看2020-03-06
- 當(dāng)我們優(yōu)化我們的網(wǎng)站時,有時發(fā)現(xiàn)我們優(yōu)化好的關(guān)鍵詞的排名突然變得不穩(wěn)定。這要怎么辦呢?下文小編就為大家整理了幾天避免下降方法,一起看看吧2020-03-02
企業(yè)網(wǎng)站被降權(quán)的具體原因有那些 企業(yè)網(wǎng)站被降權(quán)的原因分析
企業(yè)網(wǎng)站被降權(quán)的具體原因有那些?下文中為大家?guī)砹似髽I(yè)網(wǎng)站被降權(quán)的四大因素分析。感興趣的朋友不妨閱讀下文內(nèi)容,參考一下吧2019-11-13老網(wǎng)站突然不收錄了為什么 多年的老網(wǎng)站突然不收錄的原因及解決方法
老網(wǎng)站突然不收錄了為什么?下文中為大家?guī)砹硕嗄甑睦暇W(wǎng)站突然不收錄的14個原因及解決方法。感興趣的朋友不妨閱讀下文內(nèi)容,參考一下吧2019-11-13