Tsys OkHtm.com修改版數(shù)據(jù)采集方法
更新時(shí)間:2007年01月27日 00:00:00 作者:
采集功能
[1]分類管理
a 添加一個(gè)頻道
b 頻道(點(diǎn)擊進(jìn)入欄目管理)
c 添加新欄目
[2] 項(xiàng)目管理
a 添加新項(xiàng)目
項(xiàng)目名稱: 填寫采集的項(xiàng)目名稱,便于自己以后管理
所屬頻道: 請選擇采集的頻道
所屬欄目: 請選擇所屬于的欄目
所屬專題: 不屬于任何專題
網(wǎng)站名稱: 自己用來采集的對象網(wǎng)站名稱
網(wǎng)站網(wǎng)址: 自己用來采集的對象的地址
網(wǎng)站登錄: 不需要登錄 設(shè)置參數(shù)
登錄參數(shù): 需要登錄才能訪問的請?jiān)O(shè)置登錄參數(shù)(不支持驗(yàn)證碼登錄)
提交地址:點(diǎn)擊 登錄 按鈕后用來驗(yàn)證用戶名、密碼的文件網(wǎng)址,如動(dòng)力3.62的
是 http://www.****.com/Admin_ChkLogin.asp。
用戶(密碼)參數(shù):查看登錄表單源碼,找到形如下面之類的代碼
用戶名:<input type="text" name="UserName" value="">
密碼:<input type="password" name="Password" value="">
用戶參數(shù)就是--第一行的name=后面的UserName
密碼參數(shù)就是--第二行的name=后面的Password
失敗信息: 用戶名或者密碼不正確時(shí),登錄后的失敗提示信息,用于判斷登錄是否成功的一個(gè)標(biāo)志,請一定要填寫,否則不能采集,比如:您輸入的用戶名或密碼不正確,請重新輸入!
項(xiàng)目備注:該項(xiàng)目的其它要記錄的信息,以后每天都要采集
b 列 表 設(shè) 置
c 列 表 截 取 測 試
d 列 表 新 聞 鏈 接 測 試
e 正 文 設(shè) 置
f 采 樣 測 試
g 屬 性 設(shè) 置
設(shè)置一些采集的選項(xiàng),注意
采集選項(xiàng): 立即發(fā)布 保存圖片 倒序采集 外部鏈接 中 保存圖片不要勾選.
h 點(diǎn)"完成".采集設(shè)置完畢
[3] 數(shù)據(jù)采集
在這里可以看到自己剛設(shè)置好的項(xiàng)目,
然后開始漫長的采集過程.服務(wù)器速度和網(wǎng)速有關(guān)系.
[4] 數(shù)據(jù)審核
數(shù)據(jù)審核中,有"全選" "部分選擇" "全部" 這幾種模式,點(diǎn)標(biāo)題可以查看采集的文章(帶圖片) .也可以刪除數(shù)據(jù)
[5] 數(shù)據(jù)導(dǎo)出
是把數(shù)據(jù)從采集庫中導(dǎo)入到cms數(shù)據(jù)表中,默認(rèn)的是審核完的文章才可以導(dǎo)出,如果導(dǎo)出過的話會顯示"已導(dǎo)出"反之亦然.
數(shù)據(jù)導(dǎo)出時(shí)有幾個(gè)選項(xiàng)需要注意:
有三種導(dǎo)出模式: 部分選擇,全部選擇,整個(gè)欄目導(dǎo)出.但是不管那種模式都要選擇 ·請輸出的[資源類別]方向 或者[資源特性],這些是與系統(tǒng)中你建立的資源分類相掛勾的,選擇導(dǎo)出到哪個(gè)分類.
導(dǎo)出完畢.
資源管理-->常規(guī)資源 中可以看到你剛才采集到的文章,默認(rèn)為已經(jīng)審核過.
然后可以選擇生成或者編輯.
[1]分類管理
a 添加一個(gè)頻道
b 頻道(點(diǎn)擊進(jìn)入欄目管理)
c 添加新欄目
[2] 項(xiàng)目管理
a 添加新項(xiàng)目
項(xiàng)目名稱: 填寫采集的項(xiàng)目名稱,便于自己以后管理
所屬頻道: 請選擇采集的頻道
所屬欄目: 請選擇所屬于的欄目
所屬專題: 不屬于任何專題
網(wǎng)站名稱: 自己用來采集的對象網(wǎng)站名稱
網(wǎng)站網(wǎng)址: 自己用來采集的對象的地址
網(wǎng)站登錄: 不需要登錄 設(shè)置參數(shù)
登錄參數(shù): 需要登錄才能訪問的請?jiān)O(shè)置登錄參數(shù)(不支持驗(yàn)證碼登錄)
提交地址:點(diǎn)擊 登錄 按鈕后用來驗(yàn)證用戶名、密碼的文件網(wǎng)址,如動(dòng)力3.62的
是 http://www.****.com/Admin_ChkLogin.asp。
用戶(密碼)參數(shù):查看登錄表單源碼,找到形如下面之類的代碼
用戶名:<input type="text" name="UserName" value="">
密碼:<input type="password" name="Password" value="">
用戶參數(shù)就是--第一行的name=后面的UserName
密碼參數(shù)就是--第二行的name=后面的Password
失敗信息: 用戶名或者密碼不正確時(shí),登錄后的失敗提示信息,用于判斷登錄是否成功的一個(gè)標(biāo)志,請一定要填寫,否則不能采集,比如:您輸入的用戶名或密碼不正確,請重新輸入!
項(xiàng)目備注:該項(xiàng)目的其它要記錄的信息,以后每天都要采集
b 列 表 設(shè) 置
Quote
列表就像一本書的目錄,目錄可以有一頁,也可以有很多頁,列表也一樣。
列表索引頁面:
你要開始采集的列表頁。
列表開始/結(jié)束標(biāo)記:
平面上的兩點(diǎn)確定一條直線,學(xué)過幾何吧?用在這里是一樣的道理,開始/結(jié)束標(biāo)記可以確定你要采集的新聞,有的這里沒有設(shè)置好結(jié)果采集到其它新聞去了。
比如這是某一列表頁面的主要部分代碼:
<table width="98%" border="0" cellspacing="0" cellpadding="3">
<tr>
<td align="left" valign="top"><br>
<a href="News.asp?id=1" target=_blank>新聞標(biāo)題</a><br>
<a href="News.asp?id=2" target=_blank>新聞標(biāo)題</a><br>
....省略
<a href="News.asp?id=50" target=_blank>新聞標(biāo)題</a>
</td>
</tr>
</table>
紅色部分就是我們要的列表開始標(biāo)記和結(jié)束標(biāo)記,是不是把你想要的新聞夾在中間了?按照這樣的取法可以選擇好多對開始標(biāo)記和結(jié)束標(biāo)記,也就是說它們并不是唯一的。但是它們又是相對唯一的,這里的唯一是指,開始標(biāo)記在第一條新聞以上的代碼中唯一,結(jié)束標(biāo)記在開始標(biāo)記到結(jié)束標(biāo)記之間的是唯一的。
列表索引分頁:
(1)設(shè)置標(biāo)簽
列表索引頁的部分代碼如下:
<td height="24" align="center" bgcolor="#F6f7f8"> 1 <A HREF="index_2.html">2</A> <A HREF="index_3.html">3</A> <A HREF="index_4.html">3</A><a href="index_2.html">下一頁</a>
<a href="index_4.html">尾頁</a> </td>
紅色部分為分頁開始/結(jié)束標(biāo)記,只要這兩個(gè)代碼確定,不是不就可以確定“下一頁”了?,剩下的交給程序來處理,有的填寫:<A HREF="和">2</A>,這就錯(cuò)了,怎么錯(cuò)了自己想想。
索引分頁重定向:參考鏈接設(shè)置
(2)批量生成
如有些列表是這種形式:
第一頁http://www.it.com.cn/news/cyxw/yejie/index_1.html
第二頁http://www.it.com.cn/news/cyxw/yejie/index_2.html
第三頁http://www.it.com.cn/news/cyxw/yejie/index_3.html
那么可以這設(shè)置:{$ID}是必須的
原字符串:http://www.it.com.cn/news/cyxw/yejie/index_{$ID}.html
生成范圍:1--3
結(jié)果程序會生成:http://www.it.com.cn/news/cyxw/yejie/index_1.html
http://www.it.com.cn/news/cyxw/yejie/index_2.html
http://www.it.com.cn/news/cyxw/yejie/index_3.html
這樣的幾個(gè)列表頁面
(3)手動(dòng)添加
輸入一頁網(wǎng)址后按回車再輸入另一頁,如此反復(fù)可以輸入多個(gè)網(wǎng)址。
(3)鏈接設(shè)置
鏈接開始/結(jié)束標(biāo)記:
這里沒設(shè)置好采集過程中可能會路途停止
部分代碼
<table width="98%" border="0" cellspacing="0" cellpadding="3">
<tr>
<td align="left" valign="top"><br>
<a href="List.asp?type=IT新聞">[IT新聞]</a><a href="New.asp?id=1" target=_blank>新聞標(biāo)題</a>
<a href="List.asp?type=Pc新聞">[Pc新聞]</a><a href="New.asp?id=2" target=_blank>新聞標(biāo)題</a>
....省略
<a href="List.asp?type=IT新聞">[IT新聞]</a><a href="New.asp?id=50" target=_blank>新聞標(biāo)題</a>
</td>
</tr>
</table>
紅色部分為鏈接開始/結(jié)束標(biāo)記,注意:如果新聞標(biāo)題的前面有欄目鏈接(包括其它的鏈接,就像上面這個(gè)有IT新聞、Pc新聞一樣)的,開始標(biāo)記必須往前延伸,我以前做的3.62版的錄像中開始標(biāo)記是href=,這個(gè)只能用于新聞標(biāo)題前面沒有欄目鏈接的情況。
鏈接的重新定位:
如果新聞的鏈接特殊,可使用本功能對新聞網(wǎng)址重新定位,比如有些代碼可能是這樣:
<a href="Javascript:window.open('1')" target=_blank>新聞標(biāo)題</a><br>
<a href="Javascript:window.open('5')" target=_blank>新聞標(biāo)題</a><br>
....省略
<a href="Javascript:window.open('50')" target=_blank>新聞標(biāo)題</a>
把開始/結(jié)束標(biāo)記設(shè)置為紅色部分,點(diǎn)擊一條新聞看它的真實(shí)網(wǎng)頁地址,比如第一條新聞的地址是這樣,http://www.scuta.net/news.asp?id=1,那么絕對鏈接就設(shè)置為http://www.scuta.net/news.asp?id={$ID}就成了。
列表索引頁面:
你要開始采集的列表頁。
列表開始/結(jié)束標(biāo)記:
平面上的兩點(diǎn)確定一條直線,學(xué)過幾何吧?用在這里是一樣的道理,開始/結(jié)束標(biāo)記可以確定你要采集的新聞,有的這里沒有設(shè)置好結(jié)果采集到其它新聞去了。
比如這是某一列表頁面的主要部分代碼:
<table width="98%" border="0" cellspacing="0" cellpadding="3">
<tr>
<td align="left" valign="top"><br>
<a href="News.asp?id=1" target=_blank>新聞標(biāo)題</a><br>
<a href="News.asp?id=2" target=_blank>新聞標(biāo)題</a><br>
....省略
<a href="News.asp?id=50" target=_blank>新聞標(biāo)題</a>
</td>
</tr>
</table>
紅色部分就是我們要的列表開始標(biāo)記和結(jié)束標(biāo)記,是不是把你想要的新聞夾在中間了?按照這樣的取法可以選擇好多對開始標(biāo)記和結(jié)束標(biāo)記,也就是說它們并不是唯一的。但是它們又是相對唯一的,這里的唯一是指,開始標(biāo)記在第一條新聞以上的代碼中唯一,結(jié)束標(biāo)記在開始標(biāo)記到結(jié)束標(biāo)記之間的是唯一的。
列表索引分頁:
(1)設(shè)置標(biāo)簽
列表索引頁的部分代碼如下:
<td height="24" align="center" bgcolor="#F6f7f8"> 1 <A HREF="index_2.html">2</A> <A HREF="index_3.html">3</A> <A HREF="index_4.html">3</A><a href="index_2.html">下一頁</a>
<a href="index_4.html">尾頁</a> </td>
紅色部分為分頁開始/結(jié)束標(biāo)記,只要這兩個(gè)代碼確定,不是不就可以確定“下一頁”了?,剩下的交給程序來處理,有的填寫:<A HREF="和">2</A>,這就錯(cuò)了,怎么錯(cuò)了自己想想。
索引分頁重定向:參考鏈接設(shè)置
(2)批量生成
如有些列表是這種形式:
第一頁http://www.it.com.cn/news/cyxw/yejie/index_1.html
第二頁http://www.it.com.cn/news/cyxw/yejie/index_2.html
第三頁http://www.it.com.cn/news/cyxw/yejie/index_3.html
那么可以這設(shè)置:{$ID}是必須的
原字符串:http://www.it.com.cn/news/cyxw/yejie/index_{$ID}.html
生成范圍:1--3
結(jié)果程序會生成:http://www.it.com.cn/news/cyxw/yejie/index_1.html
http://www.it.com.cn/news/cyxw/yejie/index_2.html
http://www.it.com.cn/news/cyxw/yejie/index_3.html
這樣的幾個(gè)列表頁面
(3)手動(dòng)添加
輸入一頁網(wǎng)址后按回車再輸入另一頁,如此反復(fù)可以輸入多個(gè)網(wǎng)址。
(3)鏈接設(shè)置
鏈接開始/結(jié)束標(biāo)記:
這里沒設(shè)置好采集過程中可能會路途停止
部分代碼
<table width="98%" border="0" cellspacing="0" cellpadding="3">
<tr>
<td align="left" valign="top"><br>
<a href="List.asp?type=IT新聞">[IT新聞]</a><a href="New.asp?id=1" target=_blank>新聞標(biāo)題</a>
<a href="List.asp?type=Pc新聞">[Pc新聞]</a><a href="New.asp?id=2" target=_blank>新聞標(biāo)題</a>
....省略
<a href="List.asp?type=IT新聞">[IT新聞]</a><a href="New.asp?id=50" target=_blank>新聞標(biāo)題</a>
</td>
</tr>
</table>
紅色部分為鏈接開始/結(jié)束標(biāo)記,注意:如果新聞標(biāo)題的前面有欄目鏈接(包括其它的鏈接,就像上面這個(gè)有IT新聞、Pc新聞一樣)的,開始標(biāo)記必須往前延伸,我以前做的3.62版的錄像中開始標(biāo)記是href=,這個(gè)只能用于新聞標(biāo)題前面沒有欄目鏈接的情況。
鏈接的重新定位:
如果新聞的鏈接特殊,可使用本功能對新聞網(wǎng)址重新定位,比如有些代碼可能是這樣:
<a href="Javascript:window.open('1')" target=_blank>新聞標(biāo)題</a><br>
<a href="Javascript:window.open('5')" target=_blank>新聞標(biāo)題</a><br>
....省略
<a href="Javascript:window.open('50')" target=_blank>新聞標(biāo)題</a>
把開始/結(jié)束標(biāo)記設(shè)置為紅色部分,點(diǎn)擊一條新聞看它的真實(shí)網(wǎng)頁地址,比如第一條新聞的地址是這樣,http://www.scuta.net/news.asp?id=1,那么絕對鏈接就設(shè)置為http://www.scuta.net/news.asp?id={$ID}就成了。
d 列 表 新 聞 鏈 接 測 試
e 正 文 設(shè) 置
f 采 樣 測 試
g 屬 性 設(shè) 置
設(shè)置一些采集的選項(xiàng),注意
采集選項(xiàng): 立即發(fā)布 保存圖片 倒序采集 外部鏈接 中 保存圖片不要勾選.
h 點(diǎn)"完成".采集設(shè)置完畢
[3] 數(shù)據(jù)采集
在這里可以看到自己剛設(shè)置好的項(xiàng)目,
采集模式:快速模式 穩(wěn)定模式 篩選模式 采集測試 正文預(yù)覽
這幾種自己琢磨了,不多描述 .結(jié)果都差不多.然后開始漫長的采集過程.服務(wù)器速度和網(wǎng)速有關(guān)系.
[4] 數(shù)據(jù)審核
數(shù)據(jù)審核中,有"全選" "部分選擇" "全部" 這幾種模式,點(diǎn)標(biāo)題可以查看采集的文章(帶圖片) .也可以刪除數(shù)據(jù)
[5] 數(shù)據(jù)導(dǎo)出
是把數(shù)據(jù)從采集庫中導(dǎo)入到cms數(shù)據(jù)表中,默認(rèn)的是審核完的文章才可以導(dǎo)出,如果導(dǎo)出過的話會顯示"已導(dǎo)出"反之亦然.
數(shù)據(jù)導(dǎo)出時(shí)有幾個(gè)選項(xiàng)需要注意:
有三種導(dǎo)出模式: 部分選擇,全部選擇,整個(gè)欄目導(dǎo)出.但是不管那種模式都要選擇 ·請輸出的[資源類別]方向 或者[資源特性],這些是與系統(tǒng)中你建立的資源分類相掛勾的,選擇導(dǎo)出到哪個(gè)分類.
導(dǎo)出完畢.
資源管理-->常規(guī)資源 中可以看到你剛才采集到的文章,默認(rèn)為已經(jīng)審核過.
然后可以選擇生成或者編輯.
相關(guān)文章
asp 實(shí)現(xiàn)當(dāng)有新信息時(shí)播放語音提示的效果
最近做一套程序的時(shí)候,客戶要求當(dāng)有新信息的時(shí)候播放一段語音來提示一下,根據(jù)情況,總結(jié)思路如下2009-06-06ASP隱藏真實(shí)文件的下載功能實(shí)現(xiàn)代碼
將下邊的文件保存為Download.asp就可以了,然后根據(jù)需要傳要下載的文件過來就可以了。2008-12-12asp中通過addnew添加內(nèi)容后取得當(dāng)前文章的自遞增ID的方法
asp中使用addnew方法添加一條記錄后,我們經(jīng)常使用取得自遞增的ID,而使用bookmark很容易實(shí)現(xiàn)這樣的功能。2011-01-01ASP XMLDom在服務(wù)器端操作XML文件的主要方法和實(shí)現(xiàn)
我曾經(jīng)測試過不用數(shù)據(jù)庫,把網(wǎng)站的會員信息,商品數(shù)據(jù)信息,交易信息,網(wǎng)站定制信息全部存放在三個(gè)xml文件中,運(yùn)行結(jié)果十分正常,感覺上比數(shù)據(jù)庫快多了,不過沒有作測試,不能確定。2010-02-02javascript css實(shí)現(xiàn)三級目錄(簡單的)
本篇文章主要介紹了javascript css實(shí)現(xiàn)三級目錄(簡單的),這是一款不錯(cuò)的CSS樹形菜單,樹狀列表,當(dāng)然不全是CSS實(shí)現(xiàn),部分功能還使用了JavaScript代碼進(jìn)行配合,感興趣的小伙伴們可以參考一下2007-12-12asp中用數(shù)據(jù)庫生成不重復(fù)的流水號
asp中用數(shù)據(jù)庫生成不重復(fù)的流水號的實(shí)現(xiàn)代碼,需要的朋友可以參考下實(shí)現(xiàn)原理其它程序一樣。2006-09-09