帝國cms采集圖文教程(上,中,下)全集
發(fā)布時(shí)間:2012-05-21 10:50:22 作者:佚名
我要評論

帝國cms采集圖文教程,現(xiàn)在把上,中,下全部都發(fā)來.給大家方便的看.
前兩講我們分別介紹了帝國cms采集基本流程和帝國cms如何采集內(nèi)容分頁,最后這一講主要介紹帝國cms采集過濾與替換,還有些技巧。
一、過濾
1、帝國cms采集過濾分為兩種:
(1)“整體頁面過濾正則”:

(2)“過濾廣告正則”:

我們有些疑惑,這兩種過濾到底有什么區(qū)別?“整體頁面過濾正則”是過濾整個(gè)網(wǎng)頁的html代碼。“過濾廣告正則”是過濾文章內(nèi)容,僅對文章內(nèi)容([!--newstext--])起作用。
2、過濾實(shí)例:
過濾實(shí)例(1):

我們采集后發(fā)現(xiàn)信息內(nèi)容底部多了行代碼:“<div style="clear:both;height:0;visibility:hiddden;overflow:hidden;"> </div>”,根據(jù)格式“廣告開始[!--ad--]廣告結(jié)束”得到“過濾廣告正則
”:

過濾實(shí)例(2):

要過濾鏈接代碼怎么辦,注意“過濾廣告正則”右邊有堆代碼:

鼠標(biāo)先點(diǎn)擊A,系統(tǒng)自動生成過濾鏈接代碼“,,,”,這樣就可以把采集后的內(nèi)容鏈接過濾掉了。同理,如果想過濾其他html代碼就點(diǎn)擊相應(yīng)的標(biāo)簽代碼。
注意事項(xiàng):當(dāng)內(nèi)容分頁包含在內(nèi)容([!--newstext--])里時(shí),要過濾掉內(nèi)容分頁,否則會重復(fù)出現(xiàn)內(nèi)容分頁。
二、替換
1、帝國cms采集替換也分為兩種:
(1)“整體頁面替換”:

(2)“替換”:

他們兩種區(qū)別:“整體頁面替換”是替換整個(gè)網(wǎng)頁的html代碼。“替換”是替換文章標(biāo)題和內(nèi)容,僅對標(biāo)題([!--title--])和([!--newstext--])起作用。
2、替換實(shí)例:

我們要把內(nèi)容里的“新華網(wǎng)”替換成“中華網(wǎng)”:

預(yù)覽下:

沒有問題,替換過來了。
三、圖片采集
(1)我們采集時(shí)會碰到信息內(nèi)容可以正常采集,但是里面的圖片卻不顯示,例子:

信息內(nèi)容可以正常采集,就是圖片不顯示出來,這是由于內(nèi)容圖片的路徑不對,圖片的路徑為相對地址。
(2)查看源代碼:

圖片是相對地址,要換成絕對地址才能采集成功。
(3)替換成絕對地址:
先在目標(biāo)站的圖片右鍵查看屬性:

目標(biāo)站的圖片地址為“http://www.gdyd.com/news/PNews/a/e77366_634655073936250000.jpg”,我們采集所到的圖片地址為“/news/PNews/a/e77366_634655073936250000.jpg”,分析得到前綴“http://www.gdyd.com”,我們把前綴放到“圖片/FLASH地址前綴(內(nèi)容)”,如下圖:

(4)前臺預(yù)覽圖片:
圖片顯示出來了:

查看源代碼:

圖片地址沒錯(cuò),是本地地址。
注意事項(xiàng):我們在采集預(yù)覽和在本地臨時(shí)入庫信息時(shí),發(fā)現(xiàn)已經(jīng)添加了圖片地址前綴了,但是圖片還是不顯示,出現(xiàn)這個(gè)你不用理他,直接入庫,入庫了系統(tǒng)才會自動添加圖片地址前綴。
至此采集實(shí)例講解完畢,這三講對帝國cms采集的基本流程,重點(diǎn),難點(diǎn)基本都概括了,還有些基礎(chǔ)的功能沒能一一介紹清楚,大家可以到帝國官方網(wǎng)站看下基礎(chǔ)教程。
本文由 國外網(wǎng)站大全http://www.kguowai.com 原創(chuàng),轉(zhuǎn)載請注明出處,謝謝!
相關(guān)文章
帝國CMS根據(jù)內(nèi)容正文字段[newstext]批量獲取描述簡介字段[smalltext]的
這篇文章主要介紹了帝國CMS根據(jù)內(nèi)容正文字段[newstext]批量重新生成簡介字段[smalltext]的方法,需要的朋友可以參考下2023-06-26帝國CMS 7.2和7.5適用的火車頭采集免登陸發(fā)布模塊配置方法詳解(親測可
帝國cms7.2版本開始增加了金剛模式,登錄發(fā)布有難度。親測可用的帝國CMS 7.2/7.5適用免登陸新聞發(fā)布模塊插件配合火車采集器,可以解決這類問題??胺Q完美2022-04-21帝國cms高危SQL注入漏洞(盲注)系統(tǒng)自帶RepPIntvar過濾函數(shù)使用方法
帝國cms開發(fā)的時(shí)候要注意一些危險(xiǎn)的注入漏洞,防止被黑,RepPIntvar為系統(tǒng)自帶函數(shù)可以起到過濾字符的作用,下面就為大家介紹一下使用方法2021-07-26- 帝國cms后臺啟用SESSION驗(yàn)證所有的登錄信息都是保存在服務(wù)器端的,尤其是公共場所登錄用默認(rèn)的cookies是不安全的2021-07-26
帝國CMS7.2版升級到7.5版的詳細(xì)步驟方法(已測)
最近需要將老版本的帝國cms將7.2升級到7.5版本,參考這篇文章完美升級,特分享一下給需要的朋友2020-08-02帝國cms常用標(biāo)簽調(diào)用方法(靈動標(biāo)簽和萬能標(biāo)簽的調(diào)用方法)
整理了一些常用的帝國CMS調(diào)用,靈動標(biāo)簽和萬能標(biāo)簽的調(diào)用方法舉例,包括幻燈片、標(biāo)題、一級欄目、二級欄目、帶模版的友情鏈接(下拉菜單)、判斷內(nèi)容頁字段為空時(shí)是如何調(diào)用2020-02-04帝國cms網(wǎng)站地圖sitemap.xml的制作方法
這篇文章主要介紹了帝國cms網(wǎng)站地圖sitemap.xml的制作方法,需要的朋友可以參考下2020-02-04帝國CMS數(shù)據(jù)更新中心設(shè)置教程(更新網(wǎng)站細(xì)節(jié))
在使用帝國cms的時(shí)候有時(shí)候需要把前臺數(shù)據(jù)都更新一下,那么就可以參考下面的文章了,要不漏掉了部分就達(dá)不到更新的目地了2020-02-04- 今天接到網(wǎng)友詢問怎么修改后臺登錄界面及后臺界面,特把方法分享出來需要的朋友可以參考下2020-02-04
- 最近仿站團(tuán)隊(duì)接到很多仿站客戶訂單,這里面有一個(gè)這樣的功能,表單提交,今天花時(shí)間寫個(gè)教程給大家,需要的朋友可以參考下2020-02-02