解析xHTML源碼的DLL組件AngleSharp介紹
AngleSharp是基于.NET(C#)開發(fā)的專門為解析xHTML源碼的DLL組件。
項目地址:https://github.com/FlorianRappl/AngleSharp
我主要介紹是一些使用AngleSharp常用的方法,跟大家介紹,我會以腳本之家站點作為原型。 其它的類似組件有:
國內:Jumony
github地址: https://github.com/Ivony/Jumony
國外:Html Agility Pack
項目地址:http://htmlagilitypack.codeplex.com/
具體大家可以自行搜索對比三者的區(qū)別和性能。接下來咱們主要討論主角是AngleSharp
引入AngleSharp至項目,用NuGet工具執(zhí)行命令(其實我是在裝逼。) Install-Package AngleSharp
在項目中添加引用Using AngleSharp
首先我們獲取CnBlogs首頁的HTML源代碼
static public string GetHtml()
{
HttpWebRequest myReq =
(HttpWebRequest)WebRequest.Create("http://www.dbjr.com.cn");
HttpWebResponse response = (HttpWebResponse)myReq.GetResponse();
// Get the stream associated with the response.
Stream receiveStream = response.GetResponseStream();
// Pipes the stream to a higher level stream reader with the required encoding format.
StreamReader readStream = new StreamReader(receiveStream, Encoding.UTF8);
return readStream.ReadToEnd();
}
獲取jb51首頁當前所有博客文章的標題
private static void Main(string[] args) { //找出所有文章標題 string cnblogsHtml = GetHtml();
//加載HTML
var document = DocumentBuilder.Html(cnblogsHtml);
//這里必須要使用== 不能使用Equals
var titleItemList = document.All.Where(m => m.ClassName == "titlelnk");
int iIndex = 1;
foreach (var element in titleItemList)
{
Console.WriteLine(iIndex + ":" + element.InnerHtml);
iIndex++;
}
}
以上代碼輸出內容:
1:JNDI學習總結(三)——Tomcat下使用Druid配置JNDI數據源 2:我們前端是怎么跟設計師溝通的 3:MVC5+EF6 入門完整教程六 4:試議常用Javascript 類庫中 throttle 與 debounce 輔助函數的區(qū)別 5:孤獨的走過年輕 6:上周熱點回顧(11.10-11.16) 7:Android動畫-補間(Tween)動畫 8:樸素貝葉斯算法的python實現 9:MVC三層級聯方式 10:C# 標簽(條碼)的打印與設計(一) 11:OpenCASCADE Make Primitives-Box 12:基于solr實現hbase的二級索引 13:(十六)WebGIS中偏移補償量引發(fā)的問題之探討 14:javascript小游戲--生命游戲 15:Android動畫-幀動畫 16:C# Socket學習筆記一 17:lua表排序 18:ZooKeeper系列 第一篇:ZooKeeper快速入門 19:【插件開發(fā)】—— 9 編輯器代碼分塊著色-高亮顯示! 20:華盛頓大學計算機視覺課程筆記(一)
官方有提供詳細的文檔和例子,大家可以去看一下。此插件最大的優(yōu)勢:支持輸出Javascript、Linq語法、ID和Class選擇器、動態(tài)添加節(jié)點。實為.NET開發(fā)之利器。
AngleSharp文檔:https://github.com/FlorianRappl/AngleSharp/wiki/Documentation
AngleSharp例子(Demo):https://github.com/FlorianRappl/AngleSharp/wiki/Examples
相關文章
ASP.NET編程簡單實現生成靜態(tài)頁面的方法【附demo源碼下載】
這篇文章主要介紹了ASP.NET編程簡單實現生成靜態(tài)頁面的方法,較為詳細的分析了asp.net生成靜態(tài)頁面的步驟與相關操作技巧,并附帶相關實例源碼供讀者下載參考,需要的朋友可以參考下2017-07-07
.NET6?ConfigurationManager的實現及使用方式
這篇文章主要介紹了.NET6?ConfigurationManager的實現,我們上面展示的這一部分的ConfigurationManager代碼,其實就是替代了原來的ConfigurationBuilder類的功能,需要的朋友可以參考下2021-12-12
解決.NET?Core企業(yè)微信openapi回調地址請求不通過的問題
這篇文章介紹了解決.NET?Core企業(yè)微信openapi回調地址請求不通過的問題,文中通過示例代碼介紹的非常詳細。對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-06-06
解決ASP.NET中Type.GetType方法總返回空的問題
今天做練習的時候用到了Type.GetType方法。。 可是他總返回null。。2008-03-03
.Net Core中使用Autofac替換自帶的DI容器的示例
Autofac比Core中自帶的DI功能強大的多,比如:屬性注入、基于名稱注入、子容器、自定生存期管理、遲緩初始化,本文就詳細的來介紹一下.Net Core Autofac替換DI容器,感興趣的可以了解一下2021-06-06

