讓采集網(wǎng)站內(nèi)容更有有價(jià)值

站長(zhǎng)們應(yīng)該都知道“偽原創(chuàng)”這個(gè)詞的含義?,F(xiàn)在互聯(lián)網(wǎng)上上下下,都在搞信息抓取,高級(jí)的叫垂直搜索,低級(jí)的叫采集。不過(guò)這次筆者卻要說(shuō),同樣是抓取信息做站,性質(zhì)確實(shí)是會(huì)不一樣的。有的是剽竊,有的卻是在組織信息。
一個(gè)成功的站,要有自己的存在價(jià)值。筆者的個(gè)人感覺(jué),互聯(lián)網(wǎng)進(jìn)入21世紀(jì)后,重復(fù)內(nèi)容越來(lái)越多了。常常在檢索資料時(shí),點(diǎn)了許多鏈接,看到的卻是同樣的內(nèi)容。這些重復(fù)內(nèi)容的制造者們所做的工作,是沒(méi)有價(jià)值的。只制造重復(fù)內(nèi)容的網(wǎng)站,是被淘汰的對(duì)象。只是他們躲在一個(gè)一時(shí)被人忽視的角落,靠著陰暗潮濕的土壤中的一點(diǎn)營(yíng)養(yǎng),茍且活著。隨著搜索引擎的進(jìn)步,簡(jiǎn)單制造重復(fù)內(nèi)容的站正在被剿殺。
這個(gè)時(shí)候,“偽原創(chuàng)”可謂是“應(yīng)運(yùn)而生”。眾多中小站長(zhǎng)在做著類(lèi)似的一件事:瘋狂地抓東西,再把抓來(lái)的東西改頭換面發(fā)布在自己網(wǎng)站上。如果一個(gè)站只有這些內(nèi)容,那這只是赤祼剽竊的防搜索引擎“剿殺”版,同樣是沒(méi)有存在價(jià)值的。并且這種偽原創(chuàng)就如同有了抗藥性的病菌一樣,對(duì)互聯(lián)網(wǎng)危害更大。請(qǐng)廣大中小站長(zhǎng)不要怪筆者說(shuō)得過(guò)分。筆者坦言自己也干過(guò)類(lèi)似事情,但價(jià)值觀不能因?yàn)橐恍o(wú)奈而改變,不好的就是不好的。
讓我們的思維跳躍一下,觀察一下谷歌。谷歌(http://www.google.cn)是更大的信息抓取者,但它從來(lái)沒(méi)有讓人覺(jué)得“垃圾”。這是因?yàn)楣雀璋缪萘诵畔⒌慕M織者。谷歌對(duì)互聯(lián)網(wǎng)信息進(jìn)行分析索引,讓用戶(hù)更方便更快捷地找到自己所需信息,這就是谷歌的價(jià)值所在。谷歌成功地改變了人們的上網(wǎng)體驗(yàn),自身也成為了互聯(lián)網(wǎng)頭號(hào)公司。 我們?cè)賮?lái)看一看金山詞霸在詞典(http://www.iciba.com)。這個(gè)詞典里,除了傳統(tǒng)的詞典釋義,還加了網(wǎng)絡(luò)例句、網(wǎng)絡(luò)釋義等。后兩者的內(nèi)容是什么呢?是來(lái)自互聯(lián)網(wǎng)的一些文字片斷,是“采集”來(lái)的東西。
“采集”這兩個(gè)字很有意思,“采”有拿來(lái)之意,更有選擇之意。有選擇性地抓取內(nèi)容,稱(chēng)之為“采”。很多中小站長(zhǎng)做到了這一點(diǎn),但卻把“集”字給忘到一邊了。“集”就是對(duì)采來(lái)信息的一種組織。像谷歌、金山詞霸那樣的,我們做不來(lái),但我們一樣可以有所為,這就要各位站長(zhǎng)動(dòng)腦子思考了。大企業(yè)各方面實(shí)力不是中小站長(zhǎng)所能比的,但只要你動(dòng)腦思考,你一樣可以找到自身的價(jià)值所在,一樣可以做出真正有價(jià)值的網(wǎng)站來(lái)。
“集”的目的,顯然要從用戶(hù)角度出發(fā)。方便了用戶(hù),就體現(xiàn)了網(wǎng)站的價(jià)值。
這方面,其實(shí)許多大網(wǎng)站已經(jīng)給了我們很好的提示。比如同樣是做mp3搜索,Google提供了一個(gè)很有意思的挑歌功能(http://www.google.cn/music/songscreener),在這個(gè)頁(yè)面,你可以通過(guò)選擇節(jié)奏強(qiáng)弱、聲調(diào)高低、單色豐富程度等來(lái)選擇歌曲。Google可能是借助自身強(qiáng)大的技術(shù)實(shí)力用程序自動(dòng)分析mp3文件生成的這些數(shù)據(jù),但我們?nèi)绻泄Ψ驅(qū)Σ蓙?lái)的內(nèi)容做偽原創(chuàng),順手加幾個(gè)數(shù)據(jù)又有何難呢?
比如我們做一個(gè)Flash音樂(lè)站,也可以對(duì)每個(gè)FV做類(lèi)似的評(píng)分,比如畫(huà)面惟美分,內(nèi)容搞笑分,深情感人分等等。即便沒(méi)有時(shí)間整理這些,也可以放出去讓用戶(hù)來(lái)打分。當(dāng)你有了這些為用戶(hù)著想的人性化功能時(shí),就沒(méi)有人再說(shuō)你是一個(gè)剽竊者了,因?yàn)槟阋呀?jīng)做到了“集”,你已經(jīng)通過(guò)自己的努力改善了用戶(hù)體驗(yàn),你已經(jīng)體現(xiàn)了自身價(jià)值。
類(lèi)似地,也可以做小粒度的信息聚合。把某一領(lǐng)域的內(nèi)容按一系列熱門(mén)主題容聚合在一起,可以讓用戶(hù)不用到處搜索就能看到相當(dāng)全面的信息。比如考利小游戲這個(gè)網(wǎng)站,對(duì)每個(gè)小游戲都做了個(gè)相關(guān)推薦頁(yè)面,就像大的新聞?wù)纠锏南嚓P(guān)閱讀那樣,把更多相似的內(nèi)容聚合在一起列出,可以讓玩家過(guò)一把癮。
如果有一定的技術(shù)基礎(chǔ),還可以做摘要處理。自動(dòng)摘要技術(shù)可以對(duì)一段文本做精簡(jiǎn)的概括。我們常用的Word里就有自動(dòng)生成摘要的功能。互聯(lián)網(wǎng)信息龐大,有些用戶(hù)也許只想一覽眾山,而非個(gè)個(gè)細(xì)讀,這時(shí)自動(dòng)摘要就可以大顯身手了。具體做起來(lái),可以每篇做摘要,也可以對(duì)相關(guān)內(nèi)容做拼合再做摘要,這就取決于用戶(hù)體驗(yàn)了。如果你是做小說(shuō)閱讀,又沒(méi)時(shí)間一部一部地整理小說(shuō),那么可以嘗試摘要功能,可以給只在乎情節(jié)梗概的用戶(hù)一個(gè)快速閱讀版。
遺憾的是我還沒(méi)有發(fā)現(xiàn)什么開(kāi)源的自動(dòng)摘要程序。好像DedeCMS(http://www.dedecms.com)里做了這個(gè)功能,筆者還沒(méi)試過(guò)。對(duì)于有技術(shù)能力的站長(zhǎng)來(lái)說(shuō),做好的功能有時(shí)用著也未必方便。
Google、百度是“采集”的“集大成者”,我們集不了大成,也可以集小成。只要用心研究用戶(hù)體驗(yàn),再結(jié)合一些工具、技術(shù),為用戶(hù)打造一些貼心功能,讓用戶(hù)記住你,還是不難的,關(guān)鍵是要用心。“采”無(wú)過(guò),“采”而不“集”,就不是好站長(zhǎng)了。筆者拙文不過(guò)拋磚引玉,相信各位站長(zhǎng)會(huì)有自己的“集”法。祝大家都能“集”小成,而后積為大成!
本文由http://www.kaoly.com站長(zhǎng)供稿!
相關(guān)文章
網(wǎng)站收錄很低 為什么百度不采集你的網(wǎng)站?
你的網(wǎng)站為什么百度不采集呢?其實(shí)原因很多,網(wǎng)站內(nèi)容重復(fù)太多,seo過(guò)度、改版等等,對(duì)于這種現(xiàn)象我們?cè)撛趺磻?yīng)對(duì)呢?現(xiàn)在說(shuō)說(shuō)百度不采集你的網(wǎng)站的原因和解決辦法,需要的2014-12-30- 目前站長(zhǎng)圈內(nèi),比較流行的采集工具有很多,但是總結(jié)起來(lái),比較出名的免費(fèi)的就這么幾個(gè),這里簡(jiǎn)單給大家介紹下, 方便需要的朋友2014-11-01
防止網(wǎng)頁(yè)被搜索引擎爬蟲(chóng)和網(wǎng)頁(yè)采集器收錄的方法匯總
最常規(guī)的防止網(wǎng)頁(yè)被搜索引擎收錄的方法是使用robots.txt,但是這樣做的弊端是要將所有已知的搜索引的爬蟲(chóng)信息都羅列進(jìn)去,難免有疏漏。2010-07-16- Google 用戶(hù)數(shù)據(jù)采集大揭秘.2009-11-20
建站經(jīng)驗(yàn) 你的網(wǎng)站該如何應(yīng)對(duì)被采集
雖然采集站的SEO比較難。但踏實(shí)的寫(xiě)文章,在國(guó)內(nèi)這種氛圍下,很少會(huì)有人去做。2009-07-18- 現(xiàn)在很多網(wǎng)站都有抄襲和采集的行為,有了采集工具和目標(biāo)網(wǎng)站以后內(nèi)容再也不是什么頭疼的事。倒是如何提高采集內(nèi)容的排名成為了站長(zhǎng)們最為頭疼的問(wèn)題,如何提高采集內(nèi)容的排2009-05-26
業(yè)余站長(zhǎng)與專(zhuān)業(yè)站長(zhǎng)PK
業(yè)余站長(zhǎng)成功率真的很低很低,如果哪個(gè)業(yè)余站長(zhǎng)在三年之內(nèi)僥幸成功了,可以告訴我。不要把數(shù)萬(wàn)IP的垃圾站發(fā)我就行了。如果垃圾站有數(shù)萬(wàn)IP是不足不奇的,你的網(wǎng)站能在三年后2009-04-02- 聽(tīng)人說(shuō),百度最近封殺了采集的網(wǎng)站,難到采集文章的網(wǎng)站一定沒(méi)有出路嗎? 個(gè)人覺(jué)得未必。 QQ空間 站是本人的網(wǎng)站。里面的內(nèi)容全是采集來(lái)的。記得第一次百度兩個(gè)星期左2008-12-31
- 我是一個(gè)習(xí)慣在互聯(lián)網(wǎng)上閱讀的人,遇到上好的文章就另存到我的電腦上,久之電腦的資料就顯得很零亂,當(dāng)時(shí)就想建立一個(gè)數(shù)據(jù)庫(kù),把這些文章保存起來(lái),就這樣開(kāi)始了我的站長(zhǎng)的2008-11-04
- 很多站長(zhǎng)都在為自己的站發(fā)愁。為什么我的站流量那么低?為什么我的站收入那么少?原因很明顯,你建立的是垃圾站。 那么什么是垃圾站呢?網(wǎng)上關(guān)于垃圾站的定義和判斷標(biāo)準(zhǔn)2008-11-03