文章為什么被重復(fù)收錄? 文章被百度重復(fù)收錄的原因及解決方法

點擊進入鏈接,除了原網(wǎng)頁,分別出現(xiàn):
http://www.stcash.com/5273/comment-page-1
http://www.stcash.com/5273?replytocom=1989
前面一篇文章居然出現(xiàn)一個三級目錄,后面一篇文章又類似于動態(tài)網(wǎng)頁網(wǎng)址。我文章中是沒有這兩個鏈接地址的,查看網(wǎng)頁源碼,看出了一點端倪。
原因分析:
我發(fā)現(xiàn)了這兩個?replytocom=1989網(wǎng)址的來源:文章評論鏈接
四個評論剛好對應(yīng)四個replytocom,百度蜘蛛可能有一定的智能,四個replytocom網(wǎng)址中只收錄了一個,但是又不夠智能,沒有區(qū)分出來評論鏈接和原文鏈接對應(yīng)的文章內(nèi)容是相同的。
comment-page-1網(wǎng)址同樣是來源于評論鏈接,comment-page-1代表著評論頁面的第一頁。如果我的評論比較多,比如說有1000條評論,那么一頁肯定是顯示不下去的,就會出現(xiàn)comment-page-2,comment-page-3......這就是評論分頁功能,這個功能本質(zhì)上是防止評論過多時,網(wǎng)頁會被拉的很長,導(dǎo)致網(wǎng)頁加載速度慢和用戶體驗差。但是不巧的是,百度蜘蛛依然不能識別出來這和原文
解決方法:
1、對于comment-page-1重復(fù)收錄,有兩種方式解決
1)在wordpress后臺關(guān)閉評論分頁
2)修改robots.txt,加上一句項目的代碼
Disallow: /comment-page-
robots.txt在網(wǎng)站根目錄,使用 網(wǎng)址/robots.tx就可以看到設(shè)置的結(jié)果了。如果根目錄下沒有這個文件
wp-includes/funtion中有這么一段代碼:
- $output = "User-agent: *\n";
- $public = get_option( 'blog_public' );
- if ( '0' == $public ) {
- $output .= "Disallow: /\n";
- } else {
- $site_url = parse_url( site_url() );
- $path = ( !emptyempty( $site_url['path'] ) ) ? $site_url['path'] : '';
- $output .= "Disallow: $path/wp-admin/\n";
- }
在 $output .= "Disallow: $path/wp-admin/\n"; 后面增加一句$output .= "Disallow: $path/comment-page-\n";
2、對于replytocom重復(fù)收錄,設(shè)置robots.txt文件
Disallow:/*?replytocom=
或者是加上對于包含replytocom的所有鏈接都加上nofollow鏈接
- add_filter('comment_reply_link', 'add_nofollow', 420, 4);
- function add_nofollow($link, $args, $comment, $post){
- return str_replace("href=", "rel='nofollow' href=", $link);
- }
以上就是對文章被百度重復(fù)收錄的原因及解決方法全部內(nèi)容的介紹,更多內(nèi)容請繼續(xù)關(guān)注腳本之家!
相關(guān)文章
網(wǎng)站關(guān)鍵詞庫如何挖掘和優(yōu)化? 編寫優(yōu)化性質(zhì)的文章權(quán)重不再是夢想
說到網(wǎng)站優(yōu)化大多數(shù)人都在徐吹說自己也會優(yōu)化,可是看到那么多SEO博客、SEO官網(wǎng)等等,出現(xiàn)這一情況,主要原因還是網(wǎng)站關(guān)鍵詞庫沒有做好?那么網(wǎng)站關(guān)鍵詞庫如何挖掘和優(yōu)化呢2016-02-19你的文章還在被剽竊嗎?如何保護你的原創(chuàng)血淚?
你的文章還在被剽竊嗎?如何保護你的原創(chuàng)血淚?今天這篇文章就為大家詳細(xì)介紹一下,對于有需要的朋友快快來參考一下吧2016-02-16如何讓百度加快收錄偽原創(chuàng)的文章? 編寫高質(zhì)量偽原創(chuàng)的6個方法介紹
文章主要體現(xiàn)在原創(chuàng)的文章,而不是同質(zhì)非常嚴(yán)重的文章,或者偽原創(chuàng)的文章,那么如何讓百度加快收錄偽原創(chuàng)的文章?本文將提供編寫高質(zhì)量偽原創(chuàng)方法介紹供大家了解,希望對大2016-02-04文章是原創(chuàng)好還是偽原創(chuàng)好?網(wǎng)站文章發(fā)布數(shù)量及偽原創(chuàng)、原創(chuàng)分析
如果網(wǎng)站上大量的內(nèi)容都是轉(zhuǎn)載的,搜索引擎就會覺得整個網(wǎng)站沒有多大的價值,從而降低網(wǎng)站權(quán)重。網(wǎng)站排名自然也不會很高。辦文章是原創(chuàng)好還是偽原創(chuàng)好?下面就來分析網(wǎng)站文2016-01-28網(wǎng)站文章發(fā)布數(shù)量及偽原創(chuàng)/原創(chuàng)相關(guān)問題介紹
今天小編為大家?guī)砹司W(wǎng)站文章發(fā)布數(shù)量及偽原創(chuàng)/原創(chuàng)相關(guān)問題介紹,感興趣的朋友們可以跟著小編去下文了解一下哦2016-01-28- 怎么讓文章快速收錄?很多小編發(fā)現(xiàn),自己編輯的文章總是不被收錄,或者收錄的文章還沒有偽原創(chuàng)文章收錄快速,這是怎么回事呢?怎么才能有技巧的討好百度,讓文章快速收錄呢2016-01-28
seoer如何讓自己的原創(chuàng)文章受到站長的關(guān)注和歡迎
今天小編為大家?guī)砹藄eoer如何讓自己的原創(chuàng)文章受到站長的關(guān)注和歡迎相關(guān)內(nèi)容的介紹,感興趣的朋友們可以跟著小編去下文了解一下哦2016-01-27如何提高原創(chuàng)文章的可閱讀性? SEO優(yōu)化網(wǎng)站之寫原創(chuàng)文章需要注意的幾個
前期的SEO只是簡單的做做網(wǎng)站關(guān)鍵詞,對內(nèi)容的錨文本進行處理,交換友情鏈接和采集內(nèi)容發(fā)布等,而原創(chuàng)文章的書寫需要注意什么呢?本文將提供SEO優(yōu)化網(wǎng)站之寫原創(chuàng)文章需要注2016-01-22這家互聯(lián)網(wǎng)媒體年收入超200萬美元 每天卻僅更新2篇文章
你可以想想嘛,有家明教The Information每年的收入都超200萬美元,但是每天卻只發(fā)2篇文章給觀眾,最牛的就是,你需要訂閱才可以看到他們的內(nèi)容,它是怎么做到的呢?這種模2016-01-19真正的優(yōu)質(zhì)文章應(yīng)該遵循的四個基本要素
今天小編為大家分享真正的優(yōu)質(zhì)文章應(yīng)該遵循的四個基本要素,這對于網(wǎng)站建設(shè)來說是非常重要的,所以推薦過來,有需要的朋友可以參考一下哦2016-01-19