asp.net保存遠(yuǎn)程圖片的代碼
更新時(shí)間:2008年09月19日 23:50:49 作者:
最近有點(diǎn)煩,沒怎么看書,幾天下來,就研究了一個(gè)保存遠(yuǎn)程圖片的。
注意:并沒有實(shí)現(xiàn)CSS中的圖片采集,且圖片的正則還有待完善。
using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;
//引入空間
using System.Net;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;
using System.Collections;
/// <summary>
/// 采集
/// </summary>
public class caiji
{
public caiji()
{
//
// TODO: 在此處添加構(gòu)造函數(shù)邏輯
//
}
/// <summary>
/// 要采集的網(wǎng)頁(yè)的連接地址
/// </summary>
/// <param name="url">url</param>
/// <returns></returns>
public static string caijiByUrl(string url,string chargest,string path)
{
string str = GetSourceTextByUrl(url,chargest);
ArrayList lib = new ArrayList();
int i = 0;
//根據(jù)url取得網(wǎng)站域名
Uri uri = new Uri(url);
//Scheme或者協(xié)議,一般為http,Host為取得域名
string baseurl = uri.Scheme + "://" + uri.Host + "/";
//提取出url,包括src等信息
//\S匹配任何非空白字符
Regex g = new Regex(@"(src=(""|\')\S+\.(gif|jpg|png|bmp)(""|\'))", RegexOptions.Multiline | RegexOptions.IgnoreCase);
MatchCollection m = g.Matches(str);
foreach (Match math in m)
{
//已經(jīng)提取到圖片的路徑了,但還需要分絕對(duì)路徑,相對(duì)路徑,以及后綴名是否為圖片,因?yàn)榭赡転?asp,.aspx這些,比如驗(yàn)證碼圖片
string imgUrl = math.Groups[0].Value.ToLower();//轉(zhuǎn)成小寫,=號(hào)之間可能有不定的空格
//去除src與單引號(hào),雙引號(hào)
imgUrl = imgUrl.Replace("src","");
imgUrl = imgUrl.Replace("\"","");
imgUrl = imgUrl.Replace("'","");
imgUrl = imgUrl.Replace("=","");
imgUrl = imgUrl.Trim();
//路徑處理
if (imgUrl.Substring(0, 4) != "http")
{
//需要判斷是否是絕對(duì)路徑還是相對(duì)路徑
if (imgUrl.Substring(0, 1) == "/")
{
imgUrl = baseurl + imgUrl;
}
else
{
imgUrl = url.Substring(0,url.LastIndexOf("/") + 1) + imgUrl;
}
}
//判斷元素是否已經(jīng)存在,-1為不存在
if (lib.IndexOf(imgUrl) == -1)
{
lib.Add(imgUrl);
}
}
string str_ = string.Empty;
WebClient client = new WebClient();
for (int j = 0; j < lib.Count; j++)
{
string savepath = path + DateTime.Now.Month + DateTime.Now.Day + DateTime.Now.Minute + DateTime.Now.Second + j + lib[j].ToString().Substring((lib[j].ToString().Length) -4,4);
try
{
client.DownloadFile(new Uri(lib[j].ToString()), savepath);
str_ += lib[j].ToString() + "<br /> 保存路徑為:" + savepath + "<br /><br />";
}
catch (Exception e)
{
str_ += e.Message;
}
}
return str_;
}
public static string GetSourceTextByUrl(string url,string chargest)
{
WebRequest request = WebRequest.Create(url);
request.Timeout = 20000;//20秒超時(shí)
WebResponse response = request.GetResponse();
Stream resStream = response.GetResponseStream();
StreamReader sr = new StreamReader(resStream,Encoding.GetEncoding(chargest));
return sr.ReadToEnd();
}
}
使用:比如我是保存到upload文件夾中的:
string path = Server.MapPath("~/upload/");
Response.Write(caiji.caijiByUrl(http://www.dbjr.com.cn, "utf-8", path));
復(fù)制代碼 代碼如下:
using System;
using System.Data;
using System.Configuration;
using System.Web;
using System.Web.Security;
using System.Web.UI;
using System.Web.UI.WebControls;
using System.Web.UI.WebControls.WebParts;
using System.Web.UI.HtmlControls;
//引入空間
using System.Net;
using System.IO;
using System.Text;
using System.Text.RegularExpressions;
using System.Collections;
/// <summary>
/// 采集
/// </summary>
public class caiji
{
public caiji()
{
//
// TODO: 在此處添加構(gòu)造函數(shù)邏輯
//
}
/// <summary>
/// 要采集的網(wǎng)頁(yè)的連接地址
/// </summary>
/// <param name="url">url</param>
/// <returns></returns>
public static string caijiByUrl(string url,string chargest,string path)
{
string str = GetSourceTextByUrl(url,chargest);
ArrayList lib = new ArrayList();
int i = 0;
//根據(jù)url取得網(wǎng)站域名
Uri uri = new Uri(url);
//Scheme或者協(xié)議,一般為http,Host為取得域名
string baseurl = uri.Scheme + "://" + uri.Host + "/";
//提取出url,包括src等信息
//\S匹配任何非空白字符
Regex g = new Regex(@"(src=(""|\')\S+\.(gif|jpg|png|bmp)(""|\'))", RegexOptions.Multiline | RegexOptions.IgnoreCase);
MatchCollection m = g.Matches(str);
foreach (Match math in m)
{
//已經(jīng)提取到圖片的路徑了,但還需要分絕對(duì)路徑,相對(duì)路徑,以及后綴名是否為圖片,因?yàn)榭赡転?asp,.aspx這些,比如驗(yàn)證碼圖片
string imgUrl = math.Groups[0].Value.ToLower();//轉(zhuǎn)成小寫,=號(hào)之間可能有不定的空格
//去除src與單引號(hào),雙引號(hào)
imgUrl = imgUrl.Replace("src","");
imgUrl = imgUrl.Replace("\"","");
imgUrl = imgUrl.Replace("'","");
imgUrl = imgUrl.Replace("=","");
imgUrl = imgUrl.Trim();
//路徑處理
if (imgUrl.Substring(0, 4) != "http")
{
//需要判斷是否是絕對(duì)路徑還是相對(duì)路徑
if (imgUrl.Substring(0, 1) == "/")
{
imgUrl = baseurl + imgUrl;
}
else
{
imgUrl = url.Substring(0,url.LastIndexOf("/") + 1) + imgUrl;
}
}
//判斷元素是否已經(jīng)存在,-1為不存在
if (lib.IndexOf(imgUrl) == -1)
{
lib.Add(imgUrl);
}
}
string str_ = string.Empty;
WebClient client = new WebClient();
for (int j = 0; j < lib.Count; j++)
{
string savepath = path + DateTime.Now.Month + DateTime.Now.Day + DateTime.Now.Minute + DateTime.Now.Second + j + lib[j].ToString().Substring((lib[j].ToString().Length) -4,4);
try
{
client.DownloadFile(new Uri(lib[j].ToString()), savepath);
str_ += lib[j].ToString() + "<br /> 保存路徑為:" + savepath + "<br /><br />";
}
catch (Exception e)
{
str_ += e.Message;
}
}
return str_;
}
public static string GetSourceTextByUrl(string url,string chargest)
{
WebRequest request = WebRequest.Create(url);
request.Timeout = 20000;//20秒超時(shí)
WebResponse response = request.GetResponse();
Stream resStream = response.GetResponseStream();
StreamReader sr = new StreamReader(resStream,Encoding.GetEncoding(chargest));
return sr.ReadToEnd();
}
}
使用:比如我是保存到upload文件夾中的:
復(fù)制代碼 代碼如下:
string path = Server.MapPath("~/upload/");
Response.Write(caiji.caijiByUrl(http://www.dbjr.com.cn, "utf-8", path));
相關(guān)文章
asp.net 簡(jiǎn)單單點(diǎn)登錄技術(shù)分析
單點(diǎn)登錄,又叫SSO(Single Sign On)。在一些cms或者OA中比較常用到這種登錄模式,目的是為防止重復(fù)登錄。而其實(shí)現(xiàn)原理也頗為簡(jiǎn)單,只要Cache的形式就可以實(shí)現(xiàn),這里只用于簡(jiǎn)單記錄下,呵呵……2011-02-02asp.net操作Word實(shí)現(xiàn)批量替換
這篇文章主要介紹了asp.net操作Word實(shí)現(xiàn)批量替換的方法,需要的朋友可以參考下2015-10-10.NET RulesEngine(規(guī)則引擎)的使用詳解
這篇文章主要介紹了.NET RulesEngine(規(guī)則引擎)的使用詳解,幫助大家更好的理解和學(xué)習(xí)使用.net技術(shù),感興趣的朋友可以了解下2021-05-05通過剪貼板實(shí)現(xiàn)將DataGridView中的數(shù)據(jù)導(dǎo)出到Excel
這篇文章主要介紹了如何通過剪貼板實(shí)現(xiàn)將DataGridView中的數(shù)據(jù)導(dǎo)出到Excel,需要的朋友可以參考下2014-05-05高效的使用 Response.Redirect解決一些不必要的問題
這篇文章主要介紹了如何高效的使用 Response.Redirect解決一些不必要的問題,需要的朋友可以參考下2014-05-05Ajax Control Toolkit BalloonPopup的使用實(shí)例及效果
Ajax Control Toolkit 工具包的簡(jiǎn)介及獲取方式等,BalloonPopup 控件可以顯示一個(gè)彈出層,里面可以包含很多內(nèi)容。2013-02-02靈活掌握asp.net中g(shù)ridview控件的多種使用方法(下)
這篇文章繼續(xù)向大家推薦如何靈活掌握asp.net中g(shù)ridview控件的多種使用方法,感興趣的小伙伴們可以參考一下2015-11-11