文章為什么被重復(fù)收錄? 文章被百度重復(fù)收錄的原因及解決方法

點(diǎn)擊進(jìn)入鏈接,除了原網(wǎng)頁,分別出現(xiàn):
http://www.stcash.com/5273/comment-page-1
http://www.stcash.com/5273?replytocom=1989
前面一篇文章居然出現(xiàn)一個(gè)三級(jí)目錄,后面一篇文章又類似于動(dòng)態(tài)網(wǎng)頁網(wǎng)址。我文章中是沒有這兩個(gè)鏈接地址的,查看網(wǎng)頁源碼,看出了一點(diǎn)端倪。
原因分析:
我發(fā)現(xiàn)了這兩個(gè)?replytocom=1989網(wǎng)址的來源:文章評(píng)論鏈接

四個(gè)評(píng)論剛好對(duì)應(yīng)四個(gè)replytocom,百度蜘蛛可能有一定的智能,四個(gè)replytocom網(wǎng)址中只收錄了一個(gè),但是又不夠智能,沒有區(qū)分出來評(píng)論鏈接和原文鏈接對(duì)應(yīng)的文章內(nèi)容是相同的。
comment-page-1網(wǎng)址同樣是來源于評(píng)論鏈接,comment-page-1代表著評(píng)論頁面的第一頁。如果我的評(píng)論比較多,比如說有1000條評(píng)論,那么一頁肯定是顯示不下去的,就會(huì)出現(xiàn)comment-page-2,comment-page-3......這就是評(píng)論分頁功能,這個(gè)功能本質(zhì)上是防止評(píng)論過多時(shí),網(wǎng)頁會(huì)被拉的很長,導(dǎo)致網(wǎng)頁加載速度慢和用戶體驗(yàn)差。但是不巧的是,百度蜘蛛依然不能識(shí)別出來這和原文
解決方法:
1、對(duì)于comment-page-1重復(fù)收錄,有兩種方式解決
1)在wordpress后臺(tái)關(guān)閉評(píng)論分頁

2)修改robots.txt,加上一句項(xiàng)目的代碼
Disallow: /comment-page-
robots.txt在網(wǎng)站根目錄,使用 網(wǎng)址/robots.tx就可以看到設(shè)置的結(jié)果了。如果根目錄下沒有這個(gè)文件
wp-includes/funtion中有這么一段代碼:
- $output = "User-agent: *\n";
- $public = get_option( 'blog_public' );
- if ( '0' == $public ) {
- $output .= "Disallow: /\n";
- } else {
- $site_url = parse_url( site_url() );
- $path = ( !emptyempty( $site_url['path'] ) ) ? $site_url['path'] : '';
- $output .= "Disallow: $path/wp-admin/\n";
- }
在 $output .= "Disallow: $path/wp-admin/\n"; 后面增加一句$output .= "Disallow: $path/comment-page-\n";
2、對(duì)于replytocom重復(fù)收錄,設(shè)置robots.txt文件
Disallow:/*?replytocom=
或者是加上對(duì)于包含replytocom的所有鏈接都加上nofollow鏈接
- add_filter('comment_reply_link', 'add_nofollow', 420, 4);
- function add_nofollow($link, $args, $comment, $post){
- return str_replace("href=", "rel='nofollow' href=", $link);
- }
以上就是對(duì)文章被百度重復(fù)收錄的原因及解決方法全部內(nèi)容的介紹,更多內(nèi)容請(qǐng)繼續(xù)關(guān)注腳本之家!
相關(guān)文章
網(wǎng)站關(guān)鍵詞庫如何挖掘和優(yōu)化? 編寫優(yōu)化性質(zhì)的文章權(quán)重不再是夢(mèng)想
說到網(wǎng)站優(yōu)化大多數(shù)人都在徐吹說自己也會(huì)優(yōu)化,可是看到那么多SEO博客、SEO官網(wǎng)等等,出現(xiàn)這一情況,主要原因還是網(wǎng)站關(guān)鍵詞庫沒有做好?那么網(wǎng)站關(guān)鍵詞庫如何挖掘和優(yōu)化呢2016-02-19你的文章還在被剽竊嗎?如何保護(hù)你的原創(chuàng)血淚?
你的文章還在被剽竊嗎?如何保護(hù)你的原創(chuàng)血淚?今天這篇文章就為大家詳細(xì)介紹一下,對(duì)于有需要的朋友快快來參考一下吧2016-02-16如何讓百度加快收錄偽原創(chuàng)的文章? 編寫高質(zhì)量偽原創(chuàng)的6個(gè)方法介紹
文章主要體現(xiàn)在原創(chuàng)的文章,而不是同質(zhì)非常嚴(yán)重的文章,或者偽原創(chuàng)的文章,那么如何讓百度加快收錄偽原創(chuàng)的文章?本文將提供編寫高質(zhì)量偽原創(chuàng)方法介紹供大家了解,希望對(duì)大2016-02-04文章是原創(chuàng)好還是偽原創(chuàng)好?網(wǎng)站文章發(fā)布數(shù)量及偽原創(chuàng)、原創(chuàng)分析
如果網(wǎng)站上大量的內(nèi)容都是轉(zhuǎn)載的,搜索引擎就會(huì)覺得整個(gè)網(wǎng)站沒有多大的價(jià)值,從而降低網(wǎng)站權(quán)重。網(wǎng)站排名自然也不會(huì)很高。辦文章是原創(chuàng)好還是偽原創(chuàng)好?下面就來分析網(wǎng)站文2016-01-28網(wǎng)站文章發(fā)布數(shù)量及偽原創(chuàng)/原創(chuàng)相關(guān)問題介紹
今天小編為大家?guī)砹司W(wǎng)站文章發(fā)布數(shù)量及偽原創(chuàng)/原創(chuàng)相關(guān)問題介紹,感興趣的朋友們可以跟著小編去下文了解一下哦2016-01-28- 怎么讓文章快速收錄?很多小編發(fā)現(xiàn),自己編輯的文章總是不被收錄,或者收錄的文章還沒有偽原創(chuàng)文章收錄快速,這是怎么回事呢?怎么才能有技巧的討好百度,讓文章快速收錄呢2016-01-28
seoer如何讓自己的原創(chuàng)文章受到站長的關(guān)注和歡迎
今天小編為大家?guī)砹藄eoer如何讓自己的原創(chuàng)文章受到站長的關(guān)注和歡迎相關(guān)內(nèi)容的介紹,感興趣的朋友們可以跟著小編去下文了解一下哦2016-01-27如何提高原創(chuàng)文章的可閱讀性? SEO優(yōu)化網(wǎng)站之寫原創(chuàng)文章需要注意的幾個(gè)
前期的SEO只是簡單的做做網(wǎng)站關(guān)鍵詞,對(duì)內(nèi)容的錨文本進(jìn)行處理,交換友情鏈接和采集內(nèi)容發(fā)布等,而原創(chuàng)文章的書寫需要注意什么呢?本文將提供SEO優(yōu)化網(wǎng)站之寫原創(chuàng)文章需要注2016-01-22這家互聯(lián)網(wǎng)媒體年收入超200萬美元 每天卻僅更新2篇文章
你可以想想嘛,有家明教The Information每年的收入都超200萬美元,但是每天卻只發(fā)2篇文章給觀眾,最牛的就是,你需要訂閱才可以看到他們的內(nèi)容,它是怎么做到的呢?這種模2016-01-19真正的優(yōu)質(zhì)文章應(yīng)該遵循的四個(gè)基本要素
今天小編為大家分享真正的優(yōu)質(zhì)文章應(yīng)該遵循的四個(gè)基本要素,這對(duì)于網(wǎng)站建設(shè)來說是非常重要的,所以推薦過來,有需要的朋友可以參考一下哦2016-01-19

