asp中利用CSW中文分詞組件來(lái)實(shí)現(xiàn)自己網(wǎng)站的內(nèi)容關(guān)鍵詞自動(dòng)提取
更新時(shí)間:2007年03月09日 00:00:00 作者:
比如標(biāo)題是:騰訊QQ 2006 珊瑚蟲集成版 v4.5b
分詞后:[此資源關(guān)鍵詞:騰訊 QQ 珊瑚蟲 集成 ]
并且把關(guān)鍵詞做成專題,可以為每個(gè)內(nèi)容頁(yè)面生成相關(guān)連接了
用CSW中文分詞組件
下載:http://www.vgoogle.net/Product_CSW.asp
下面是我的ASP代碼,比較粗淺,但實(shí)用
codecsw 得到輸出的所有分詞結(jié)果,用它的組建里面有個(gè)ASP文件,你一看就知道怎么得到分詞結(jié)果了,這個(gè)不詳細(xì)說(shuō)了。
fcon=split(htm," ")
fcs=ubound(fcon)
for fci=0 to fcs
if fci mod 2=0 then
fcn=fcn&fcon(fci)&"$fc^#$" '我這里用$fc^#$來(lái)分割每個(gè)分詞
else
fcw=fcw&fcon(fci)&"$fc^#$"
end if
next
fcn=left(fcn,len(fcn)-12) '去掉最前面的$fc^#$
fcw=left(fcw,len(fcw)-6) 去掉最后面的$fc^#$
don=split(fcn,"$fc^#$")
donn=split(fcw,"$fc^#$")
dos=ubound(don)
for doi=0 to dos
fcname=don(doi) '得到分詞
fcsx=donn(doi) '得到分詞屬性
'下面是判斷分詞符合我所提出的屬性,比如名詞、名動(dòng)詞、動(dòng)詞等,排除了數(shù)詞、狀詞和連接詞等。
if fcsx="/b" or fcsx="/nz" or fcsx="/n" or fcsx="/an" or fcsx="/nx" or fcsx="/f" or fcsx="/i" or fcsx="/l" or fcsx="/ng" or fcsx="/nr" or fcsx="/ns" or fcsx="/nt" or fcsx="/nz" or fcsx="/v" or fcsx="/vn" or fcsx="/s" or fcsx="/g" then
if len(fcname)>1 then
if instr(fcname1,fcname&"$") then
else
if fcname<>" " and fcname<>"" then
fcname=replace(replace(replace(trim(fcname),chr(10),""),chr(13),""),chr(10)&chr(13),"") '去除分詞的換行和回車鍵
if len(fcname)>1 then
'這里是分詞入庫(kù),我的分詞庫(kù)只有三個(gè)字段,自動(dòng)ID、分詞名稱和分詞所屬的內(nèi)容ID
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 * from fc where fcname='"&fcname&"'"
rs.open sql,conn,1,3
if rs.eof then
rs.addnew
end if
rs("fcname")=fcname
if instr(rs("mid"),","&id&",") then
else
rs("mid")=rs("mid")&","&id&","
end if
rs.update
rs.close
set rs=nothing
'分詞入庫(kù)結(jié)束
end if
end if
response.write fcname&"("&fcsx&")<br>"
mfc=mfc&fcname&","
end if
fcname1=fcname1&fcname&"$"
end if
end if
next
'這里是將分詞添加到內(nèi)容表,在內(nèi)容表我只多加了一個(gè)分詞字段mfc
if right(mfc,1)="$" then mfc=left(mfc,len(mfc)-1)
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 mfc from m where mid="&id
rs.open sql,conn,1,3
rs("mfc")=mfc
rs.update
rs.close
set rs=nothing
end if
就這樣實(shí)現(xiàn)了,呵呵,在分詞表的內(nèi)容ID都是用,來(lái)分割的,讀取的時(shí)候自己研究下就可以
分詞后:[此資源關(guān)鍵詞:騰訊 QQ 珊瑚蟲 集成 ]
并且把關(guān)鍵詞做成專題,可以為每個(gè)內(nèi)容頁(yè)面生成相關(guān)連接了
用CSW中文分詞組件
下載:http://www.vgoogle.net/Product_CSW.asp
下面是我的ASP代碼,比較粗淺,但實(shí)用
codecsw 得到輸出的所有分詞結(jié)果,用它的組建里面有個(gè)ASP文件,你一看就知道怎么得到分詞結(jié)果了,這個(gè)不詳細(xì)說(shuō)了。
復(fù)制代碼 代碼如下:
fcon=split(htm," ")
fcs=ubound(fcon)
for fci=0 to fcs
if fci mod 2=0 then
fcn=fcn&fcon(fci)&"$fc^#$" '我這里用$fc^#$來(lái)分割每個(gè)分詞
else
fcw=fcw&fcon(fci)&"$fc^#$"
end if
next
fcn=left(fcn,len(fcn)-12) '去掉最前面的$fc^#$
fcw=left(fcw,len(fcw)-6) 去掉最后面的$fc^#$
don=split(fcn,"$fc^#$")
donn=split(fcw,"$fc^#$")
dos=ubound(don)
for doi=0 to dos
fcname=don(doi) '得到分詞
fcsx=donn(doi) '得到分詞屬性
'下面是判斷分詞符合我所提出的屬性,比如名詞、名動(dòng)詞、動(dòng)詞等,排除了數(shù)詞、狀詞和連接詞等。
if fcsx="/b" or fcsx="/nz" or fcsx="/n" or fcsx="/an" or fcsx="/nx" or fcsx="/f" or fcsx="/i" or fcsx="/l" or fcsx="/ng" or fcsx="/nr" or fcsx="/ns" or fcsx="/nt" or fcsx="/nz" or fcsx="/v" or fcsx="/vn" or fcsx="/s" or fcsx="/g" then
if len(fcname)>1 then
if instr(fcname1,fcname&"$") then
else
if fcname<>" " and fcname<>"" then
fcname=replace(replace(replace(trim(fcname),chr(10),""),chr(13),""),chr(10)&chr(13),"") '去除分詞的換行和回車鍵
if len(fcname)>1 then
'這里是分詞入庫(kù),我的分詞庫(kù)只有三個(gè)字段,自動(dòng)ID、分詞名稱和分詞所屬的內(nèi)容ID
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 * from fc where fcname='"&fcname&"'"
rs.open sql,conn,1,3
if rs.eof then
rs.addnew
end if
rs("fcname")=fcname
if instr(rs("mid"),","&id&",") then
else
rs("mid")=rs("mid")&","&id&","
end if
rs.update
rs.close
set rs=nothing
'分詞入庫(kù)結(jié)束
end if
end if
response.write fcname&"("&fcsx&")<br>"
mfc=mfc&fcname&","
end if
fcname1=fcname1&fcname&"$"
end if
end if
next
'這里是將分詞添加到內(nèi)容表,在內(nèi)容表我只多加了一個(gè)分詞字段mfc
if right(mfc,1)="$" then mfc=left(mfc,len(mfc)-1)
Set Rs = CreateObject("ADODB.Recordset")
sql="select top 1 mfc from m where mid="&id
rs.open sql,conn,1,3
rs("mfc")=mfc
rs.update
rs.close
set rs=nothing
end if
就這樣實(shí)現(xiàn)了,呵呵,在分詞表的內(nèi)容ID都是用,來(lái)分割的,讀取的時(shí)候自己研究下就可以
相關(guān)文章
ASP 環(huán)境下 VBS 事件應(yīng)用 示例代碼
ASP 環(huán)境下 VBS 事件應(yīng)用 示例代碼...2007-03-03Highlight patterns within strings
Highlight patterns within strings...2007-04-04在JScript中使用緩存技術(shù)的實(shí)際代碼
在編寫ASP程序時(shí),通常為了提高ASP程序的運(yùn)行效率及減少對(duì)數(shù)據(jù)庫(kù)的連接和查詢,會(huì)使用緩存技術(shù)來(lái)緩存一些需要從數(shù)據(jù)庫(kù)讀取的數(shù)據(jù)。而在ASP中實(shí)現(xiàn)緩存的方法常用的就是使用Application對(duì)象。在編寫ASP程序時(shí),我們有兩種語(yǔ)言可以選擇,分別是VBScript和JScript。2008-05-05asp base64 utf-8為了兼容asp.net的base64
asp base64 utf-8為了兼容asp.net的base642009-07-07關(guān)于ASP循環(huán)表格的問(wèn)題之解答[比較詳細(xì)]
在很多時(shí)候,我們采用原始的方法來(lái)解決一行內(nèi)循環(huán)3張圖片,如果上傳者只上傳了2張圖片,那么2張圖片間的距離會(huì)很大,因?yàn)槿鄙倭艘粋€(gè)<td> </td>.2008-11-11用asp實(shí)現(xiàn)文件瀏覽、上傳、下載的程序
用asp實(shí)現(xiàn)文件瀏覽、上傳、下載的程序...2007-02-02ASP刪除img標(biāo)簽的style屬性只保留src的正則函數(shù)
做手機(jī)網(wǎng)站的時(shí)候圖片要做自適應(yīng),由于手機(jī)網(wǎng)站跟PC網(wǎng)站共用1個(gè)數(shù)據(jù)庫(kù),導(dǎo)致文章內(nèi)的圖片有部分帶有:style=""等屬性,導(dǎo)致手機(jī)端圖片width:100%失效,去掉mg標(biāo)簽style屬性只保留src即可解決問(wèn)題2020-09-09