javascript 文章截取部分無損html顯示實現(xiàn)代碼
更新時間:2010年05月04日 17:09:02 作者:
近在做一些內(nèi)容搜索的工作,搜索出來的內(nèi)容為html格式,列表部分需要顯示每項內(nèi)容的一部分。
因為是html格式的內(nèi)容,直接截取內(nèi)容的前多少字符顯然不合適了。而如果直接去掉所有html格式然后再截取又無法達到想要的效果,再網(wǎng)上搜了一通之后,寫下如下代碼應(yīng)該可以滿足基本的要求了。(js寫的,因為容易調(diào)試)
var br = {};
br.spTags = ["img","br","hr"];/*不需要成對出現(xiàn)的標記*/
br.contain = function(arr,it){
for(var i=0,len=arr.length;i<len;i++){
if(arr[i]==it){
return true;
}
}
return false;
}
br.subArtc = function(article,worldNum){
var result = [];
/*首先截取需要的字串*/
var wcount = 0;
var startTags = [],endTags = [];
var isInTag = false;
for(var i=0,len=article.length;i<len;i++){
var w = article[i];
result.push(w);
if(w=="<"){
isInTag = true;
}
if(!isInTag){
wcount++;
if(wcount==worldNum){
break;
}
}
if(w==">"){
isInTag = false;
}
}
/*對字串進行處理*/
var j=0;
isInTag = false;
var isStartTag = true;
var tagTemp = "";
while(j<i){
w = result[j];
if(isInTag){
if(w==">" || w==" " || w=="/"){
isInTag = false;
if(isStartTag){
startTags.push(tagTemp);
}else{
endTags.push(tagTemp);
}
tagTemp = "";
}
if(isInTag){
tagTemp+=w;
}
}
if(w=="<"){
isInTag = true;
if(result[j+1]=="/"){
isStartTag = false;
j++;
}else{
isStartTag = true;
}
}
j++;
}
/*剔除img,br等不需要成對出現(xiàn)的標記*/
var newStartTags = [];
for(var x=0,len=startTags.length;x<len;x++){
if(!br.contain(br.spTags,startTags[x])){
newStartTags.push(startTags[x]);
}
}
/*添加沒有的結(jié)束標記*/
var unEndTagsCount = newStartTags.length - endTags.length;
while(unEndTagsCount>0){
result.push("<");
result.push("/")
result.push(newStartTags[unEndTagsCount-1]);
result.push(">");
unEndTagsCount--;
}
return result.join("");
};
基本思路:
1.繞過標記,取得實際內(nèi)容字數(shù) ,如需要顯示內(nèi)容前100個字,繞過標記檢索,得到第一百個字實際的索引。然后截取此索引前面的字串。
2.根據(jù)一得到的字串,得到這個字串中存在的開始標記和結(jié)束標記。注:此處的開始標記標識以"<"開通,且下一個字符不為"/"。
3.剔除2中 得到的開始標記中的不需要成對出現(xiàn)的標記。如br,img,hr等。
4.對比經(jīng)過3處理的開始標記和2中得到的結(jié)束標記,沒有配成對的在合適的位置為其配對。
此功能沒有經(jīng)過嚴格的測試,大家若有興趣可以可以幫忙測試,有更好的想法的也可以回帖討論。
作者:cnblogs bravfing
復(fù)制代碼 代碼如下:
var br = {};
br.spTags = ["img","br","hr"];/*不需要成對出現(xiàn)的標記*/
br.contain = function(arr,it){
for(var i=0,len=arr.length;i<len;i++){
if(arr[i]==it){
return true;
}
}
return false;
}
br.subArtc = function(article,worldNum){
var result = [];
/*首先截取需要的字串*/
var wcount = 0;
var startTags = [],endTags = [];
var isInTag = false;
for(var i=0,len=article.length;i<len;i++){
var w = article[i];
result.push(w);
if(w=="<"){
isInTag = true;
}
if(!isInTag){
wcount++;
if(wcount==worldNum){
break;
}
}
if(w==">"){
isInTag = false;
}
}
/*對字串進行處理*/
var j=0;
isInTag = false;
var isStartTag = true;
var tagTemp = "";
while(j<i){
w = result[j];
if(isInTag){
if(w==">" || w==" " || w=="/"){
isInTag = false;
if(isStartTag){
startTags.push(tagTemp);
}else{
endTags.push(tagTemp);
}
tagTemp = "";
}
if(isInTag){
tagTemp+=w;
}
}
if(w=="<"){
isInTag = true;
if(result[j+1]=="/"){
isStartTag = false;
j++;
}else{
isStartTag = true;
}
}
j++;
}
/*剔除img,br等不需要成對出現(xiàn)的標記*/
var newStartTags = [];
for(var x=0,len=startTags.length;x<len;x++){
if(!br.contain(br.spTags,startTags[x])){
newStartTags.push(startTags[x]);
}
}
/*添加沒有的結(jié)束標記*/
var unEndTagsCount = newStartTags.length - endTags.length;
while(unEndTagsCount>0){
result.push("<");
result.push("/")
result.push(newStartTags[unEndTagsCount-1]);
result.push(">");
unEndTagsCount--;
}
return result.join("");
};
基本思路:
1.繞過標記,取得實際內(nèi)容字數(shù) ,如需要顯示內(nèi)容前100個字,繞過標記檢索,得到第一百個字實際的索引。然后截取此索引前面的字串。
2.根據(jù)一得到的字串,得到這個字串中存在的開始標記和結(jié)束標記。注:此處的開始標記標識以"<"開通,且下一個字符不為"/"。
3.剔除2中 得到的開始標記中的不需要成對出現(xiàn)的標記。如br,img,hr等。
4.對比經(jīng)過3處理的開始標記和2中得到的結(jié)束標記,沒有配成對的在合適的位置為其配對。
此功能沒有經(jīng)過嚴格的測試,大家若有興趣可以可以幫忙測試,有更好的想法的也可以回帖討論。
作者:cnblogs bravfing
相關(guān)文章
JavaScrpt中如何使用 cookie 設(shè)置查看與刪除功能
這篇文章主要介紹了JavaScrpt中使用 cookie 設(shè)置查看與刪除功能的方法,文中通過實例代碼給大家介紹了js cookie常用的3個預(yù)設(shè)函數(shù)庫,需要的朋友可以參考下2017-07-07js獲取json中key所對應(yīng)的value值的簡單方法
下面小編就為大家?guī)硪黄猨s獲取json中key所對應(yīng)的value值的簡單方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-03-03JavaScript比較兩個數(shù)組的內(nèi)容是否相同(推薦)
這篇文章主要介紹了JavaScript如何比較兩個數(shù)組的內(nèi)容是否相同的相關(guān)資料,需要的朋友可以參考下2017-05-05javascript下利用for( in )語句 獲得所有事件名稱的代碼
2008-02-02