禁止搜索引擎收錄網(wǎng)站內(nèi)容的幾種方法

第一種、robots.txt方法
搜索引擎默認(rèn)的遵守robots.txt協(xié)議,創(chuàng)建robots.txt文本文件放至網(wǎng)站根目錄下,編輯代碼如下:
User-agent: *
Disallow: /
通過以上代碼,即可告訴搜索引擎不要抓取采取收錄本網(wǎng)站,注意慎用如上代碼:這將禁止所有搜索引擎訪問網(wǎng)站的任何部分。
如何只禁止百度搜索引擎收錄抓取網(wǎng)頁
1、編輯robots.txt文件,設(shè)計(jì)標(biāo)記為:
User-agent: Baiduspider
Disallow: /
以上robots文件將實(shí)現(xiàn)禁止所有來自百度的抓取。
這里說一下百度的user-agent,Baiduspider的user-agent是什么?
百度各個(gè)產(chǎn)品使用不同的user-agent:
產(chǎn)品名稱 對(duì)應(yīng)user-agent
無線搜索 Baiduspider
圖片搜索 Baiduspider-image
視頻搜索 Baiduspider-video
新聞搜索 Baiduspider-news
百度搜藏 Baiduspider-favo
百度聯(lián)盟 Baiduspider-cpro
商務(wù)搜索 Baiduspider-ads
網(wǎng)頁以及其他搜索 Baiduspider
你可以根據(jù)各產(chǎn)品不同的user-agent設(shè)置不同的抓取規(guī)則,以下robots實(shí)現(xiàn)禁止所有來自百度的抓取但允許圖片搜索抓取/image/目錄:
User-agent: Baiduspider
Disallow: /
User-agent: Baiduspider-image
Allow: /image/
請(qǐng)注意:Baiduspider-cpro和Baiduspider-ads抓取的網(wǎng)頁并不會(huì)建入索引,只是執(zhí)行與客戶約定的操作,所以不遵守robots協(xié)議,這個(gè)就需要和百度的人聯(lián)系才能解決了。
如何只禁止Google搜索引擎收錄抓取網(wǎng)頁,方法如下:
編輯robots.txt文件,設(shè)計(jì)標(biāo)記為:
User-agent: googlebot
Disallow: /
編輯robots.txt文件
搜索引擎默認(rèn)的遵守robots.txt協(xié)議
robots.txt文件放在網(wǎng)站根目錄下。
舉例來說,當(dāng)搜索引擎訪問一個(gè)網(wǎng)站時(shí),首先會(huì)檢查該網(wǎng)站根目錄中是否存在robots.txt這個(gè)文件,如果搜索引擎找到這個(gè)文件,它就會(huì)根據(jù)這個(gè)文件里的內(nèi)容,來確定它抓取的權(quán)限的范圍。
User-agent:
該項(xiàng)的值用于描述搜索引擎robot的名字,在”robots.txt”文件中,如果有多條User-agent記錄說明有多個(gè)robot會(huì)受到該協(xié)議的限制,對(duì)該文件來說,至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*,則該協(xié)議對(duì)任何機(jī)器人均有效,在”robots.txt”文件中,”User-agent:*”這樣的記錄只能有一條。
Disallow:
該項(xiàng)的值用于描述不希望被訪問到的一個(gè)URL,這個(gè)URL可以是一條完整的路徑,也可以是部分的,任何以Disallow開頭的URL均不會(huì)被robot訪問到。例如”Disallow:/help”對(duì)/help.html 和/help/index.html都不允許搜索引擎訪問,而”Disallow:/help/”則允許robot訪問/help.html,而不能訪問/help/index.html。任何一條Disallow記錄為空,說明該網(wǎng)站的所有部分都允許被訪問,在”/robots.txt”文件中,至少要有一條Disallow記錄。如果”/robots.txt”是一個(gè)空文件,則對(duì)于所有的搜索引擎robot,該網(wǎng)站都是開放的。
下面舉幾個(gè)robots.txt用法的例子:
User-agent: *
Disallow: /
禁止所有搜索引擎訪問網(wǎng)站的所有部分
User-agent: Baiduspider
Disallow: /
禁止百度收錄全站
User-agent: Googlebot
Disallow: /
禁止Google收錄全站
User-agent: Googlebot
Disallow:
User-agent: *
Disallow: /
禁止除Google外的一切搜索引擎收錄全站
User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /
禁止除百度外的一切搜索引擎收錄全站
User-agent: *
Disallow: /css/
Disallow: /admin/
禁止所有搜索引擎訪問某個(gè)目錄
(例如禁止根目錄下的admin和css)
第二種、網(wǎng)頁代碼方法
在網(wǎng)站首頁代碼<head>與</head>之間,加入<meta name="robots" content="noarchive">代碼,此標(biāo)記禁止搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
在網(wǎng)站首頁代碼<head>與</head>之間,加入<meta name="Baiduspider" content="noarchive">即可禁止百度搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
在網(wǎng)站首頁代碼<head>與</head>之間,加入<meta name="googlebot" content="noarchive">即可禁止谷歌搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁快照。
另外當(dāng)我們的需求很怪異的時(shí)候,比如下面這幾種情況:
1. 網(wǎng)站已經(jīng)加了robots.txt,還能在百度搜索出來?
因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫的更新需要時(shí)間。雖然Baiduspider已經(jīng)停止訪問您網(wǎng)站上的網(wǎng)頁,但百度搜索引擎數(shù)據(jù)庫中已經(jīng)建立的網(wǎng)頁索引信息,可能需要數(shù)月時(shí)間才會(huì)清除。另外也請(qǐng)檢查您的robots配置是否正確。如果您的拒絕被收錄需求非常急迫,也可以通過投訴平臺(tái)反饋請(qǐng)求處理。
2. 希望網(wǎng)站內(nèi)容被百度索引但不被保存快照,我該怎么做?
Baiduspider遵守互聯(lián)網(wǎng)meta robots協(xié)議。您可以利用網(wǎng)頁meta的設(shè)置,使百度顯示只對(duì)該網(wǎng)頁建索引,但并不在搜索結(jié)果中顯示該網(wǎng)頁的快照。和robots的更新一樣,因?yàn)樗阉饕嫠饕龜?shù)據(jù)庫的更新需要時(shí)間,所以雖然您已經(jīng)在網(wǎng)頁中通過meta禁止了百度在搜索結(jié)果中顯示該網(wǎng)頁的快照,但百度搜索引擎數(shù)據(jù)庫中如果已經(jīng)建立了網(wǎng)頁索引信息,可能需要二至四周才會(huì)在線上生效。
希望被百度索引,但是不保存網(wǎng)站快照,如下代碼解決:
<meta name="Baiduspider" content="noarchive">
如果要禁止所有的搜索引擎保存你網(wǎng)頁的快照,那么代碼就是下面的:
<meta name="robots" content="noarchive">
常用的一些代碼組合:
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本頁,而且可以順著本頁繼續(xù)索引別的鏈接
<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不許抓取本頁,但是可以順著本頁抓取索引別的鏈接
<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本頁,但是不許順著本頁抓取索引別的鏈接
<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不許抓取本頁,也不許順著本頁抓取索引別的鏈接
相關(guān)文章
網(wǎng)站改版優(yōu)化怎么將搜索引擎優(yōu)化的影響降到最低?
網(wǎng)站改版優(yōu)化怎么將搜索引擎優(yōu)化的影響降到最低?老站總會(huì)經(jīng)歷一次改版,以前的模塊放到現(xiàn)在都不適用了,為了迎合現(xiàn)在的審美,改版是必須的,但是怎么才能將搜索引擎優(yōu)化的2015-12-29網(wǎng)站優(yōu)化:SEOer要了解搜索引擎和用戶之間的關(guān)系
網(wǎng)站優(yōu)化對(duì)于每一個(gè)站長(zhǎng)來說都是為用戶服務(wù),而其本質(zhì)上是在圍繞搜索引擎的目的在為用戶提供其最需要的內(nèi)容,在這個(gè)過程中,站長(zhǎng)必須對(duì)于搜索引擎和用戶之間的關(guān)系有一個(gè)深2015-12-24在搜索引擎算法不斷改變的情況下網(wǎng)站優(yōu)化該怎么做?
在搜索引擎算法不斷改變的情況下網(wǎng)站優(yōu)化該怎么做?我們都知道百度搜索引擎一周都會(huì)變好幾次,在這種情況系啊,我們?cè)撛趺磧?yōu)化網(wǎng)站呢?下面我們來看看詳細(xì)的分析,需要的朋2015-12-21- 站長(zhǎng)最關(guān)心就是搜索引擎排名,那么哪些因素不利于搜索引擎排名呢?本文就給大家?guī)聿焕谒阉饕媾琶囊蛩亟榻B,感興趣的朋友們可以過來看看2015-12-19
醫(yī)院網(wǎng)站搜索引擎優(yōu)化呢?SEO優(yōu)化注意十二個(gè)核心要素
在網(wǎng)絡(luò)飛速發(fā)展的今天,醫(yī)院的網(wǎng)絡(luò)推廣已逐步在網(wǎng)絡(luò)營(yíng)銷的領(lǐng)域占領(lǐng)了一席之地了,在醫(yī)療SEO優(yōu)化中,醫(yī)院網(wǎng)站建設(shè)之什么樣的才最符合搜索引擎優(yōu)化呢?下面就一起來看看民營(yíng)2015-12-18搜索引擎秒收實(shí)例經(jīng)驗(yàn)分享圖文教程
對(duì)于新老站長(zhǎng)來說,要做好SEO,前提是要讓你的網(wǎng)站被搜索引擎尤其是百度的收錄,發(fā)布的新文章和外鏈在極短的幾分鐘時(shí)間內(nèi)被搜索引擎索引和收錄,這種現(xiàn)象稱為秒收,下面小2015-12-15如何seo優(yōu)化外鏈?zhǔn)珍浶缘偷膯栴} 網(wǎng)站外鏈怎么優(yōu)化?
外鏈為皇的時(shí)代是不是已經(jīng)過去了?從目前的百度搜索引擎優(yōu)化角度來說,可能外鏈對(duì)網(wǎng)站的效果沒有以前的效果出色了,但對(duì)于網(wǎng)站來說外鏈仍是作為外部因素對(duì)此網(wǎng)站投票的重要2015-12-06淘寶實(shí)戰(zhàn)教程 如何做好SEO搜索獲取自然流量排名?
小賣家往往對(duì)于引流是比較糾結(jié)的,那么如何做好SEO搜索獲取自然流量排名?小賣家利用好seo搜索排名的規(guī)則,還是能拿到一點(diǎn)流量的。下面就一起來看看淘寶開店實(shí)戰(zhàn)教程吧2015-12-04全面了解SEO搜索引擎知識(shí)有助于做好SEO(新手必看)
搜索引擎的工作的過程非常復(fù)雜,而簡(jiǎn)單的講搜索引擎的工過程大體可以分成三個(gè)階段,爬行和抓取,預(yù)處理,排名,本文給大家介紹全面了解搜索引擎知識(shí)有助于做好SEO(新手必看2015-11-02信息圖:2015年全球搜索引擎和社交網(wǎng)絡(luò)報(bào)告
Webcertain發(fā)布了全球搜索及社交媒體分析報(bào)告。據(jù)報(bào)告顯示,在印度尼西亞Twitter和Facebook的滲透率全球居首2015-03-06