欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

c#使用nsoup解析html亂碼解決方法分享 nsoup教程

 更新時(shí)間:2014年01月14日 11:36:02   作者:  
NSoup是JSoup的Net移植版本。使用方法基本一致。如果項(xiàng)目涉及HTML的處理,強(qiáng)烈推薦NSoup。但是遺憾的是NSoup默認(rèn)的編碼是UTF-8,處理中文有亂碼,下面給出二種解決方法

下載地址:http://nsoup.codeplex.com/

簡(jiǎn)單用法如下:

復(fù)制代碼 代碼如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

處理網(wǎng)絡(luò)上的頁面:

復(fù)制代碼 代碼如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://www.dbjr.com.cn/").Get();

但是遺憾的是NSoup默認(rèn)的編碼是UTF-8,處理中文有亂碼(對(duì)于編碼是UTF-8的自然不會(huì)有亂碼,但是有些GB2312的就可能有亂碼,謝謝 forhells的提醒)。

目前我找到兩種解決辦法:

1.下載網(wǎng)頁源代碼再處理

復(fù)制代碼 代碼如下:

WebClient webClient = new WebClient();
String HtmlString=Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://www.dbjr.com.cn"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

2.獲得網(wǎng)頁的流

復(fù)制代碼 代碼如下:

WebRequest webRequest=WebRequest.Create("http://www.dbjr.com.cn");
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),"utf-8");

第二種用著比較方便,但是我覺得第一種比較合適,畢竟NSoup是個(gè)Html解析類,下載網(wǎng)頁代碼這種事情本來不應(yīng)該交給它。

相關(guān)文章

最新評(píng)論