dedecms采集過濾常用代碼集合
更新時(shí)間:2008年03月23日 18:19:15 作者:
dede采集過程中最麻煩的莫過于采集的正則過濾函數(shù)的編寫。說實(shí)在的,dede在這點(diǎn)上和很多ASP CMS系統(tǒng)比如說動易等,采集的時(shí)候直接選擇幾個(gè)選項(xiàng)就可以了,簡單的完成想過濾的東西。不過他們只局限于對文章內(nèi)容的過濾不是很好。而DEDE卻能對所有采集的字段進(jìn)行過濾,功能上彌補(bǔ)了易用性的缺陷,期待柏拉圖在后續(xù)版本中加上選擇性過濾功能。
下面是在綜合正則的一個(gè)全集:
{dede:trim}
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} ]*)>([^>]*)
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
應(yīng)用示例一:標(biāo)題中空格的過濾
經(jīng)常在采集文章的時(shí)候,標(biāo)題文字里面有空格,采回來后應(yīng)用很是麻煩,所以需要在過濾處添加下面正則過濾
{dede:trim} {/dede:trim}
應(yīng)用示例二:來源作者中連接的過濾
在采集文章的時(shí)候,有的系統(tǒng)里面作者或者來源處都有連接,直接采集的話將連接采集回來了,然后由于這兩個(gè)字段有限制,通常會造成需要采集的內(nèi)容沒有采集回來,所以需要在過濾處添加下面正則過濾
{dede:trim}]*)>([^<]*){/dede:trim}
應(yīng)用示例三:文章內(nèi)容中連接以及其他廣告代碼的過濾
這個(gè)就不用說了,當(dāng)需要對所有東西過濾的時(shí)候,直接用上面所有的代碼過濾就可以,但是實(shí)際應(yīng)用中,我們只需要對連接、動畫、調(diào)用等進(jìn)行過濾。(這個(gè)需要按照對方內(nèi)容里面具體含有什么代碼來具體操作)
一般的只有鏈接,使用二中的代碼進(jìn)行過濾就可以了,但是實(shí)際上一般的網(wǎng)站現(xiàn)在都在內(nèi)容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
應(yīng)用示例四:過濾GG廣告代碼
其實(shí)這個(gè)就是在上面的內(nèi)容過濾,但是很多論壇里的網(wǎng)友經(jīng)常問這個(gè),所以單獨(dú)作為一個(gè)應(yīng)用列出來:
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} ]*)>([^>]*)
{/dede:trim}
{dede:trim} ]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}
]*)>([^>]*)
{/dede:trim}
{dede:trim}
]*)>{/dede:trim}
{dede:trim}
{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}]*)>{/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim} {/dede:trim}
{dede:trim}{/dede:trim}
{dede:trim}{/dede:trim}
應(yīng)用示例一:標(biāo)題中空格的過濾
經(jīng)常在采集文章的時(shí)候,標(biāo)題文字里面有空格,采回來后應(yīng)用很是麻煩,所以需要在過濾處添加下面正則過濾
{dede:trim} {/dede:trim}
應(yīng)用示例二:來源作者中連接的過濾
在采集文章的時(shí)候,有的系統(tǒng)里面作者或者來源處都有連接,直接采集的話將連接采集回來了,然后由于這兩個(gè)字段有限制,通常會造成需要采集的內(nèi)容沒有采集回來,所以需要在過濾處添加下面正則過濾
{dede:trim}]*)>([^<]*){/dede:trim}
應(yīng)用示例三:文章內(nèi)容中連接以及其他廣告代碼的過濾
這個(gè)就不用說了,當(dāng)需要對所有東西過濾的時(shí)候,直接用上面所有的代碼過濾就可以,但是實(shí)際應(yīng)用中,我們只需要對連接、動畫、調(diào)用等進(jìn)行過濾。(這個(gè)需要按照對方內(nèi)容里面具體含有什么代碼來具體操作)
一般的只有鏈接,使用二中的代碼進(jìn)行過濾就可以了,但是實(shí)際上一般的網(wǎng)站現(xiàn)在都在內(nèi)容里面加有廣告等,所以采取下面的過濾正則就可以完成過濾:
{dede:trim}]*)>([^<]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
{dede:trim}]*)>([^>]*){/dede:trim}
應(yīng)用示例四:過濾GG廣告代碼
其實(shí)這個(gè)就是在上面的內(nèi)容過濾,但是很多論壇里的網(wǎng)友經(jīng)常問這個(gè),所以單獨(dú)作為一個(gè)應(yīng)用列出來:
{dede:trim}]*)>([^>]*){/dede:trim}
相關(guān)文章
dedecms下仿chinaz二級下拉動態(tài)讀取代碼
最近用dedecms模仿chinaz的模板,發(fā)現(xiàn)每次都用靜態(tài)以后的文件特麻煩,沒想到網(wǎng)上已經(jīng)有高手給解決了,大家看代碼2008-05-05dedecms調(diào)用discuz論壇信息按照ID分類調(diào)用附詳細(xì)說明
dedecms調(diào)用discuz論壇帖子、圖片數(shù)據(jù)的方法很多人都有需要,大家一起整理了,我這里只有新帖、版塊帖子調(diào)用方法。精華、回復(fù)、圖片的調(diào)用還沒有,請高手補(bǔ)充。2008-06-06Dedecms模板常用調(diào)用標(biāo)簽代碼整理
因?yàn)橐恢庇玫絛edecms的模板,特把經(jīng)常用到的調(diào)用標(biāo)簽代碼整理如下2008-05-05dedecms v5.1 WriteBookText() code injection vul注入漏洞
來源:Ph4nt0m Google Group by Flyh4t@126.com QQ:3783679422008-05-05dedecms中如何在欄目列表和文章頁面中獲得當(dāng)前欄目標(biāo)題
我們在使用dedecms中會發(fā)現(xiàn),當(dāng)我們打開欄目的列表頁和文章頁的時(shí)候,無論我們使用什么標(biāo)簽,都無法獲得當(dāng)前欄目的標(biāo)題信息。究其原因是因?yàn)檫@兩個(gè)頁面所讀取的信息主要來源于dedecms的dede_archives表及其附加表,僅通過傳遞欄目的id編號來區(qū)別不同欄目,因此我們通過類似{dede:field name=’typename’/}這樣的方法是無法直接獲得欄目名稱的。但是我們依然可以通過程序的改造,利用欄目的唯一id編號,獲得欄目名稱。以下是實(shí)現(xiàn)方法:2008-03-03