帝國cms采集圖文教程(上,中,下)全集
發(fā)布時間:2012-05-21 10:50:22 作者:佚名
我要評論

帝國cms采集圖文教程,現(xiàn)在把上,中,下全部都發(fā)來.給大家方便的看.
帝國cms是我們用得比較多得PHP的建站系統(tǒng),在建站過程中,如果自己沒有信息源,只能靠手工不斷的重復(fù)copy和粘貼,這樣費(fèi)時費(fèi)力,于是我們就要使用帝國cms自帶的采集功能來完成信息的錄入。為了深入了解帝國cms采集功能,下面我們以“新浪各地新聞”欄目為例來進(jìn)行實(shí)戰(zhàn)采集。
一、增加采集節(jié)點(diǎn)
1、添加節(jié)點(diǎn):

2、選擇要增加采集的欄目:

3、進(jìn)入增加節(jié)點(diǎn)表單:

4、在節(jié)點(diǎn)名稱框里起個名字,然后把要采集的新浪各地新聞列表地址copy過來:


5、下來發(fā)現(xiàn)好多選項(xiàng),如“采集頁面地址方式二,內(nèi)容頁地址前綴...”先不要理他,后面再一一詳解,直接拉到 “信息鏈接區(qū)域正則”這里:

6、這里是設(shè)置采集的列表信息鏈接區(qū)域正則,我們點(diǎn)擊查看新浪各地新聞列表“源文件”:

7、把源文件代碼copy到Dreamweaver里,在Dreamweaver里選定要采集的信息鏈接區(qū)域:

8、切換到Dreamweaver代碼方式,
一、增加采集節(jié)點(diǎn)
1、添加節(jié)點(diǎn):

2、選擇要增加采集的欄目:

3、進(jìn)入增加節(jié)點(diǎn)表單:

4、在節(jié)點(diǎn)名稱框里起個名字,然后把要采集的新浪各地新聞列表地址copy過來:


5、下來發(fā)現(xiàn)好多選項(xiàng),如“采集頁面地址方式二,內(nèi)容頁地址前綴...”先不要理他,后面再一一詳解,直接拉到 “信息鏈接區(qū)域正則”這里:

6、這里是設(shè)置采集的列表信息鏈接區(qū)域正則,我們點(diǎn)擊查看新浪各地新聞列表“源文件”:

7、把源文件代碼copy到Dreamweaver里,在Dreamweaver里選定要采集的信息鏈接區(qū)域:

8、切換到Dreamweaver代碼方式,
- 就是信息鏈接區(qū)域:

9、得到信息鏈接區(qū)域正則:

10、得到信息頁鏈接正則:

11、注意:如果信息頁鏈接是相對地址,例如< a href="/c/2012-03-05/205924063527.shtml" target="_blank" >,那么“內(nèi)容頁地址前綴”要加域名:

12、現(xiàn)在要采集內(nèi)容頁的標(biāo)題和內(nèi)容:

13、查看新聞頁“源文件”,找title標(biāo)簽:

14、取得標(biāo)題正則:

15、這里是要采集的內(nèi)容區(qū)域:

16、取得新聞內(nèi)容正則:

(注意:新聞內(nèi)容正則里的 d_id='*' 用了通配符,因?yàn)槊恳黄侣劦膁_id值是不同的,所以可以用*來代替它,“*”可以代替任意字符。)
17、點(diǎn)擊提交按鈕就完成了整個采集節(jié)點(diǎn):

二、預(yù)覽采集節(jié)點(diǎn)是否正確
1、提交按鈕后返回管理節(jié)點(diǎn):

2、點(diǎn)擊“預(yù)覽”采集,進(jìn)入節(jié)點(diǎn)預(yù)覽結(jié)果:

3、采集內(nèi)容頁列表

4、采集內(nèi)容頁頁面:

三、采集
1、預(yù)覽采集節(jié)點(diǎn)無誤后,然后返回“管理節(jié)點(diǎn)”,點(diǎn)擊“開始采集”鏈接就開始進(jìn)行采集:

2、系統(tǒng)正在采集中:

3、采集完后顯示本地臨時入庫的信息,這時可以對臨時入庫的信息進(jìn)行修改或者刪除:

4、修改信息頁面如圖:

5、對采集的信息進(jìn)行審核并入庫,點(diǎn)擊“入庫全部信息按鈕”:

6、確定操作:

7、信息入庫完畢提示:

信息入庫完畢后下來點(diǎn)擊”管理信息“:

我們可以看到剛剛采集入庫的新聞信息:

最后到“數(shù)據(jù)更新”刷新首頁、欄目、和內(nèi)容頁就可以完成網(wǎng)站的信息采集了。由于帝國cms采集功能非常強(qiáng)大,一時半刻也說不完,下一頁將繼續(xù)講解其他功能的使用和技巧。
相關(guān)文章
帝國CMS根據(jù)內(nèi)容正文字段[newstext]批量獲取描述簡介字段[smalltext]的
這篇文章主要介紹了帝國CMS根據(jù)內(nèi)容正文字段[newstext]批量重新生成簡介字段[smalltext]的方法,需要的朋友可以參考下2023-06-26帝國CMS 7.2和7.5適用的火車頭采集免登陸發(fā)布模塊配置方法詳解(親測可
帝國cms7.2版本開始增加了金剛模式,登錄發(fā)布有難度。親測可用的帝國CMS 7.2/7.5適用免登陸新聞發(fā)布模塊插件配合火車采集器,可以解決這類問題??胺Q完美2022-04-21帝國cms高危SQL注入漏洞(盲注)系統(tǒng)自帶RepPIntvar過濾函數(shù)使用方法
帝國cms開發(fā)的時候要注意一些危險的注入漏洞,防止被黑,RepPIntvar為系統(tǒng)自帶函數(shù)可以起到過濾字符的作用,下面就為大家介紹一下使用方法2021-07-26- 帝國cms后臺啟用SESSION驗(yàn)證所有的登錄信息都是保存在服務(wù)器端的,尤其是公共場所登錄用默認(rèn)的cookies是不安全的2021-07-26
帝國CMS7.2版升級到7.5版的詳細(xì)步驟方法(已測)
最近需要將老版本的帝國cms將7.2升級到7.5版本,參考這篇文章完美升級,特分享一下給需要的朋友2020-08-02帝國cms常用標(biāo)簽調(diào)用方法(靈動標(biāo)簽和萬能標(biāo)簽的調(diào)用方法)
整理了一些常用的帝國CMS調(diào)用,靈動標(biāo)簽和萬能標(biāo)簽的調(diào)用方法舉例,包括幻燈片、標(biāo)題、一級欄目、二級欄目、帶模版的友情鏈接(下拉菜單)、判斷內(nèi)容頁字段為空時是如何調(diào)用2020-02-04帝國cms網(wǎng)站地圖sitemap.xml的制作方法
這篇文章主要介紹了帝國cms網(wǎng)站地圖sitemap.xml的制作方法,需要的朋友可以參考下2020-02-04帝國CMS數(shù)據(jù)更新中心設(shè)置教程(更新網(wǎng)站細(xì)節(jié))
在使用帝國cms的時候有時候需要把前臺數(shù)據(jù)都更新一下,那么就可以參考下面的文章了,要不漏掉了部分就達(dá)不到更新的目地了2020-02-04- 今天接到網(wǎng)友詢問怎么修改后臺登錄界面及后臺界面,特把方法分享出來需要的朋友可以參考下2020-02-04
- 最近仿站團(tuán)隊接到很多仿站客戶訂單,這里面有一個這樣的功能,表單提交,今天花時間寫個教程給大家,需要的朋友可以參考下2020-02-02