防止文章被抄襲的網(wǎng)絡(luò)分析軟件
這是一個獨立的可執(zhí)行的程序,完全免費,基于ACCESS數(shù)據(jù)庫,目前支持Z-Blog系統(tǒng),其實支持其他ASP的Blog修改也很簡單,有需要的可以聯(lián)系一下我。(注:其他Blog程序的使用方法:先建立一個Access文件,然后建立一個表,表名為blog_Article,表中增加字段log_ID和log_Title,log_ID為自動編號,log_Title為文章標(biāo)題,然后將你Blog上的文章標(biāo)題都復(fù)制過來,一篇文章對應(yīng)一條記錄,只復(fù)制標(biāo)題即可,然后在本程序中選擇這個數(shù)據(jù)庫)
數(shù)據(jù)挖掘我是直接通過調(diào)用搜索引擎來實現(xiàn)的。原先打算使用Java下調(diào)用Google SOAP API來實現(xiàn),不過不知什么原因,Google SOAP API搜索英文沒有任何問題,一搜索中文就報數(shù)組超界,不知道什么原因。只好去調(diào)用百度的搜索引擎。
百度的搜索引擎沒有API,不過我還是有辦法間接調(diào)用的。調(diào)用的時候發(fā)現(xiàn)中文的確沒有什么問題,也沒有錯誤,很順利就調(diào)通了程序。
我目前搜索的時候,采用了“實質(zhì)傷害”這個概念,因為目前文章轉(zhuǎn)載的情況會非常多,每一個都去處理會很麻煩。因此我們只去尋找情況惡劣的即可。這個可以通過搜索引擎排名來實現(xiàn)。只尋找那些轉(zhuǎn)載地址對于原文影響最壞的。
這個程序使用起來很簡單,先選擇數(shù)據(jù)庫文件,再選擇Z-Blog系統(tǒng),然后填寫你自己的域名,點搜索即可開始執(zhí)行。搜索完成后會自動生成一個名為list.txt的文件,就是搜索結(jié)果。此程序?qū)τ诓糠謽?biāo)題的文章會有誤判,最好文章標(biāo)題個性化濃一些。軟件的界面看起來不是很好,因為我沒有美工嘛。
點擊下載軟件:轉(zhuǎn)載文章搜索器
相關(guān)文章
提示Outlook/Foxmail收取163郵件失?。篍RR 您沒有權(quán)限使用pop3功能
提示Outlook/Foxmail收取163郵件失敗:ERR 您沒有權(quán)限使用pop3功能...2007-12-12