帝國cms采集圖文教程(上,中,下)全集
發(fā)布時間:2012-05-21 10:50:22 作者:佚名
我要評論

帝國cms采集圖文教程,現(xiàn)在把上,中,下全部都發(fā)來.給大家方便的看.
帝國cms是我們用得比較多得PHP的建站系統(tǒng),在建站過程中,如果自己沒有信息源,只能靠手工不斷的重復copy和粘貼,這樣費時費力,于是我們就要使用帝國cms自帶的采集功能來完成信息的錄入。為了深入了解帝國cms采集功能,下面我們以“新浪各地新聞”欄目為例來進行實戰(zhàn)采集。
一、增加采集節(jié)點
1、添加節(jié)點:

2、選擇要增加采集的欄目:

3、進入增加節(jié)點表單:

4、在節(jié)點名稱框里起個名字,然后把要采集的新浪各地新聞列表地址copy過來:


5、下來發(fā)現(xiàn)好多選項,如“采集頁面地址方式二,內容頁地址前綴...”先不要理他,后面再一一詳解,直接拉到 “信息鏈接區(qū)域正則”這里:

6、這里是設置采集的列表信息鏈接區(qū)域正則,我們點擊查看新浪各地新聞列表“源文件”:

7、把源文件代碼copy到Dreamweaver里,在Dreamweaver里選定要采集的信息鏈接區(qū)域:

8、切換到Dreamweaver代碼方式,
一、增加采集節(jié)點
1、添加節(jié)點:

2、選擇要增加采集的欄目:

3、進入增加節(jié)點表單:

4、在節(jié)點名稱框里起個名字,然后把要采集的新浪各地新聞列表地址copy過來:


5、下來發(fā)現(xiàn)好多選項,如“采集頁面地址方式二,內容頁地址前綴...”先不要理他,后面再一一詳解,直接拉到 “信息鏈接區(qū)域正則”這里:

6、這里是設置采集的列表信息鏈接區(qū)域正則,我們點擊查看新浪各地新聞列表“源文件”:

7、把源文件代碼copy到Dreamweaver里,在Dreamweaver里選定要采集的信息鏈接區(qū)域:

8、切換到Dreamweaver代碼方式,
- 就是信息鏈接區(qū)域:

9、得到信息鏈接區(qū)域正則:

10、得到信息頁鏈接正則:

11、注意:如果信息頁鏈接是相對地址,例如< a href="/c/2012-03-05/205924063527.shtml" target="_blank" >,那么“內容頁地址前綴”要加域名:

12、現(xiàn)在要采集內容頁的標題和內容:

13、查看新聞頁“源文件”,找title標簽:

14、取得標題正則:

15、這里是要采集的內容區(qū)域:

16、取得新聞內容正則:

(注意:新聞內容正則里的 d_id='*' 用了通配符,因為每一篇新聞的d_id值是不同的,所以可以用*來代替它,“*”可以代替任意字符。)
17、點擊提交按鈕就完成了整個采集節(jié)點:

二、預覽采集節(jié)點是否正確
1、提交按鈕后返回管理節(jié)點:

2、點擊“預覽”采集,進入節(jié)點預覽結果:

3、采集內容頁列表

4、采集內容頁頁面:

三、采集
1、預覽采集節(jié)點無誤后,然后返回“管理節(jié)點”,點擊“開始采集”鏈接就開始進行采集:

2、系統(tǒng)正在采集中:

3、采集完后顯示本地臨時入庫的信息,這時可以對臨時入庫的信息進行修改或者刪除:

4、修改信息頁面如圖:

5、對采集的信息進行審核并入庫,點擊“入庫全部信息按鈕”:

6、確定操作:

7、信息入庫完畢提示:

信息入庫完畢后下來點擊”管理信息“:

我們可以看到剛剛采集入庫的新聞信息:

最后到“數(shù)據(jù)更新”刷新首頁、欄目、和內容頁就可以完成網站的信息采集了。由于帝國cms采集功能非常強大,一時半刻也說不完,下一頁將繼續(xù)講解其他功能的使用和技巧。
相關文章
帝國CMS根據(jù)內容正文字段[newstext]批量獲取描述簡介字段[smalltext]的
這篇文章主要介紹了帝國CMS根據(jù)內容正文字段[newstext]批量重新生成簡介字段[smalltext]的方法,需要的朋友可以參考下2023-06-26帝國CMS 7.2和7.5適用的火車頭采集免登陸發(fā)布模塊配置方法詳解(親測可
帝國cms7.2版本開始增加了金剛模式,登錄發(fā)布有難度。親測可用的帝國CMS 7.2/7.5適用免登陸新聞發(fā)布模塊插件配合火車采集器,可以解決這類問題??胺Q完美2022-04-21帝國cms高危SQL注入漏洞(盲注)系統(tǒng)自帶RepPIntvar過濾函數(shù)使用方法
帝國cms開發(fā)的時候要注意一些危險的注入漏洞,防止被黑,RepPIntvar為系統(tǒng)自帶函數(shù)可以起到過濾字符的作用,下面就為大家介紹一下使用方法2021-07-26- 帝國cms后臺啟用SESSION驗證所有的登錄信息都是保存在服務器端的,尤其是公共場所登錄用默認的cookies是不安全的2021-07-26
- 最近需要將老版本的帝國cms將7.2升級到7.5版本,參考這篇文章完美升級,特分享一下給需要的朋友2020-08-02
- 整理了一些常用的帝國CMS調用,靈動標簽和萬能標簽的調用方法舉例,包括幻燈片、標題、一級欄目、二級欄目、帶模版的友情鏈接(下拉菜單)、判斷內容頁字段為空時是如何調用2020-02-04
- 這篇文章主要介紹了帝國cms網站地圖sitemap.xml的制作方法,需要的朋友可以參考下2020-02-04
帝國CMS數(shù)據(jù)更新中心設置教程(更新網站細節(jié))
在使用帝國cms的時候有時候需要把前臺數(shù)據(jù)都更新一下,那么就可以參考下面的文章了,要不漏掉了部分就達不到更新的目地了2020-02-04- 今天接到網友詢問怎么修改后臺登錄界面及后臺界面,特把方法分享出來需要的朋友可以參考下2020-02-04
- 最近仿站團隊接到很多仿站客戶訂單,這里面有一個這樣的功能,表單提交,今天花時間寫個教程給大家,需要的朋友可以參考下2020-02-02