C#網(wǎng)站生成靜態(tài)頁面的實例講解
在一些需要經(jīng)常更新頁面數(shù)據(jù)的網(wǎng)站中,一般訪問量不是很大的都直接發(fā)布的是帶后臺代碼,每次訪問都是有數(shù)據(jù)庫交互的。但是一旦訪問量增加了,那么這些服務(wù)器開銷變成本就要考慮進來了,像一些文章,后臺編輯后,文章內(nèi)容存入數(shù)據(jù)庫,如果1000人訪問,如果還是每次取數(shù)據(jù)庫,那這1000次的io訪問就顯得比較大了,一個好的方法就是,文章確定之后,做成靜態(tài)頁面,而這個做的方法由程序來做,就是遞歸遍歷整個網(wǎng)站,將網(wǎng)站內(nèi)容都訪問一遍,然后生成這些頁面的靜態(tài)文本頁面,在將這些頁面發(fā)布,這樣對瀏覽者而言,他看到的還是同一個地址,同一份文章,只是這份是靜態(tài)的而言。這樣就提升了網(wǎng)站的效率節(jié)約了資源;
下面附上一份C#遍歷網(wǎng)站內(nèi)容,然后生成內(nèi)容頁面代碼:
private ArrayList htmlCreatedList = new ArrayList();
/// <summary>
/// 遞歸實現(xiàn)頁面靜態(tài)化功能
/// </summary>
/// <param name="urlString">要訪問的頁面鏈接地址</param>
public void SaveHtmlCode(string urlString)
{
if (htmlCreatedList.Contains(urlString))
{
return;
}
string htmlCode = GetHtmlCodeFromUrl(urlString);
string htmlPath = urlString.ToPhysicalPath();
string direcHtmlPath = Path.GetDirectoryName(htmlPath);
if (!Directory.Exists(direcHtmlPath))
{
Directory.CreateDirectory(direcHtmlPath);
}
File.WriteAllText(htmlPath, htmlCode);
htmlCreatedList.Add(urlString);
var urlList = GetUrlLinkFromHtmlCode(htmlCode);
string urlTemp = string.Empty;
foreach (string url in urlList)
{
urlTemp = url;
urlTemp = Regex.Replace(urlTemp, "href\\s*=\\s*", "");
urlTemp = urlTemp.Replace("\"", "");
urlTemp = urlTemp.Replace("\\", "/");
urlTemp = WebConfigInfo.UrlPrefix + urlTemp;
SaveHtmlCode(urlTemp);
}
}
/// <summary>
/// 通過HttpWebRequest頁面鏈接的html代碼
/// </summary>
/// <param name="urlString">頁面鏈接地址</param>
/// <returns>頁面鏈接對應(yīng)的html代碼</returns>
private string GetHtmlCodeFromUrl(string urlString)
{
HttpWebRequest hwRequest = (HttpWebRequest)WebRequest.Create(urlString);
hwRequest.UserAgent = "User-Agent:Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.0.3705";
hwRequest.Accept = "*/*";
hwRequest.KeepAlive = true;
hwRequest.Headers.Add("Accept-Language", "zh-cn,en-us;q=0.5");
HttpWebResponse hwResponse = (HttpWebResponse)hwRequest.GetResponse();
Stream streamResponse = hwResponse.GetResponseStream();
StreamReader readerOfStream = new StreamReader(streamResponse, System.Text.Encoding.GetEncoding("utf-8"));
string strHtml = readerOfStream.ReadToEnd();
readerOfStream.Close();
streamResponse.Close();
hwResponse.Close();
return strHtml;
}
///<summary>
///正則表達式匹配出html代碼中的超鏈接
///</summary>
///<param name="htmlCode">要找出超鏈接的html代碼</param>
///<returns></returns>
private IEnumerable<string> GetUrlLinkFromHtmlCode(string htmlCode)
{
string strRegex = "href\\s*=\\s*(?:[\"'](?<1>[^\"'.#:]*)[\"'])";
Regex r = new Regex(strRegex, RegexOptions.IgnoreCase);
MatchCollection ms = r.Matches(htmlCode);
IEnumerable<string> listUrl = from Match cc in ms select cc.ToString().Replace("&", "&");
return listUrl.Distinct();
}
}
給string 擴展了一個方法。
public static string ToPhysicalPath(this string urlString)
{
System.Uri uri = new System.Uri(urlString);
string htmlPath = string.Format("{0}\\Html\\{1}\\", System.Web.HttpContext.Current.Request.PhysicalApplicationPath, uri.AbsolutePath);
string[] querys = uri.Query.Split(new char[] { '?', '&', '=' }, StringSplitOptions.RemoveEmptyEntries);
htmlPath += string.Join(string.Empty, querys);
htmlPath += querys.Length.Equals(0) ? "Index.html" : ".html";
htmlPath = htmlPath.Replace("/", "\\");
htmlPath = htmlPath.Replace("\\\\", "\\");
return htmlPath;
}
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接
相關(guān)文章
基于C#實現(xiàn)網(wǎng)絡(luò)爬蟲 C#抓取網(wǎng)頁Html源碼
這篇文章主要為大家詳細介紹了基于C#實現(xiàn)網(wǎng)絡(luò)爬蟲的相關(guān)資料,即C#抓取網(wǎng)頁Html源碼,感興趣的小伙伴們可以參考一下2016-03-03
Winform?控件優(yōu)化LayeredWindow無鋸齒圓角窗體
這篇文章主要為大家介紹了Winform?控件優(yōu)化LayeredWindow實現(xiàn)無鋸齒圓角窗體示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-09-09
C#關(guān)于System.Collections空間詳解
這篇文章主要介紹了C#關(guān)于System.Collections空間,需要的朋友可以參考下2014-07-07

