欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

jsoup HTML解析器 v1.20.1

HTML解析器

  • 源碼大?。?span>361KB
  • 源碼語(yǔ)言:簡(jiǎn)體中文
  • 源碼類型:國(guó)產(chǎn)軟件
  • 源碼授權(quán):開源軟件
  • 源碼類別:java源碼
  • 應(yīng)用平臺(tái):JAVA
  • 更新時(shí)間:2025-04-04
  • 網(wǎng)友評(píng)分:
360通過(guò) 騰訊通過(guò) 金山通過(guò)

情介紹

jsoup是一款Java的HTML解析器,可直接解析某個(gè)URL地址、HTML文本內(nèi)容。它提供了一套非常省力的API,可通過(guò)DOM,CSS以及類似于JQuery的操作方法來(lái)取出和操作數(shù)據(jù)。

jsoup的主要功能如下:

從一個(gè)URL,文件或字符串中解析HTML;

使用DOM或CSS選擇器來(lái)查找、取出數(shù)據(jù);

可操作HTML元素、屬性、文本;

jsoup是基于MIT協(xié)議發(fā)布的,可放心使用于商業(yè)項(xiàng)目。

更新日志

更改

增加了對(duì) http/2 請(qǐng)求的支持 Jsoup.connect(),當(dāng)在 Java 11+ 上運(yùn)行時(shí),通過(guò) Java HttpClient 實(shí)現(xiàn)。#2257.

在這個(gè)版本的jsoup中,默認(rèn)是通過(guò)HttpUrlConnection實(shí)現(xiàn)來(lái)發(fā)送請(qǐng)求:使用 System.setProperty("jsoup.useHttpClient", "true");來(lái)改為通過(guò)HttpClient發(fā)送請(qǐng)求,這將啟用http/2支持(如果可用)。這將在jsoup的以后版本中成為默認(rèn)設(shè)置,所以現(xiàn)在是一個(gè)驗(yàn)證的好時(shí)機(jī)。

如果你在部署中重新打包jsoup jar(即創(chuàng)建一個(gè)遮罩 jar 或胖 jar),請(qǐng)確保將其指定為 Multi-Release JAR。

如果 HttpClient 在您的 JRE 中不可用,請(qǐng)求將繼續(xù)通過(guò) HttpURLConnection 進(jìn)行 (在 http/1.1 模式下)。

將最低 Android API 級(jí)別驗(yàn)證從 10 更新到 21。與之前的 jsoup 版本一樣,Android 開發(fā)者需要啟用核心庫(kù) desugaring。最低 Java 版本仍然是 Java 8。 #2173

移除了之前已棄用的類:org.jsoup.UncheckedIOException (用java.io.UncheckedIOException替換); 將之前已棄用的方法Element Element#forEach(Consumer) 移動(dòng)到 void Element#forEach(Consumer())。#2246

已棄用方法Document#updateMetaCharsetElement(boolean)和Document#updateMetaCharsetElement(),因?yàn)樵撛O(shè)置沒(méi)有效果。當(dāng)Document#charset(Charset)被調(diào)用時(shí),文檔的meta charset或XML編碼指令總是會(huì)被設(shè)置。#2247

改進(jìn)

當(dāng)使用一個(gè)Safelist來(lái)清理HTML并保持相對(duì)鏈接時(shí),isValid()方法現(xiàn)在會(huì)認(rèn)為這些鏈接有效。此外,強(qiáng)制屬性rel=nofollow只有在安全列表中配置時(shí)才會(huì)添加到外部鏈接。#2245

添加了 Element#selectStream(String query) 和 Element#selectStream(Evaluator) 方法,這些方法返回一個(gè) Stream 匹配元素的列表。元素在找到時(shí)會(huì)被評(píng)估并返回,且流可以提前終止。#2092

Element 對(duì)象現(xiàn)在實(shí)現(xiàn)了 Iterable,使它們能夠在增強(qiáng)的 for 循環(huán)中使用。

增加了從 Reader解析片段的支持 Parser#parseFragmentInput(Reader, Element, String)。#1177

重新引入 CLI 可執(zhí)行文件示例,在 jsoup-examples.jar。 #1702

通過(guò)更好地平衡查詢計(jì)劃器中祖先評(píng)估器的成本函數(shù),優(yōu)化了選擇器的性能,如#id .class(和其他類似的后代查詢)提高了約4.6倍。#2254

移除了用于<isindex>標(biāo)簽的遺留解析規(guī)則,這些規(guī)則會(huì)自動(dòng)創(chuàng)建一個(gè)帶有標(biāo)簽的form元素。這不再在規(guī)范中。

添加了 Elements.selectFirst(String cssQuery) 和 Elements.expectFirst(String cssQuery),以從 Elements 列表中選擇第一個(gè)匹配的元素。 #2263

在使用XML解析器解析時(shí),XML聲明和處理指令是直接處理的,而不是通過(guò)HTML解析器的假注釋處理程序。非文檔類型聲明的序列化不再以虛假的!。#2275

在將解析的HTML轉(zhuǎn)換為XML或W3C DOM時(shí),包含<的元素名稱被規(guī)范為_,以確保有效的XML。例如,<foo<bar>變成<foo_bar>,因?yàn)閄ML不允許<在元素名稱中,但HTML5允許。#2276

實(shí)現(xiàn)了當(dāng)前規(guī)范的HTML5采用機(jī)構(gòu)算法。這處理了錯(cuò)誤嵌套的格式/結(jié)構(gòu)元素。#2278

錯(cuò)誤修復(fù)

如果一個(gè)元素的屬性名中包含 ;,則無(wú)法轉(zhuǎn)換為 W3C DOM 元素,因此后續(xù)的 XPath 查詢可能會(huì)忽略該元素?,F(xiàn)在,屬性名被更完全地 標(biāo)準(zhǔn)化。#2244

為了兼容性,將文檔類型名稱的內(nèi)部屬性鍵恢復(fù)為“name”。#2241

在Connection中,跳過(guò)沒(méi)有名字的Cookies,而不是拋出驗(yàn)證異常。#2242

在運(yùn)行于 JDK 1.8 時(shí),錯(cuò)誤java.lang.NoSuchMethodError: java.nio.ByteBuffer.flip()Ljava/nio/ByteBuffer; 可能在從 URL 解析后調(diào)用Response#body()且緩沖區(qū)大小被超過(guò)時(shí)拋出。#2250

為了向后兼容,允許null InputStream 輸入到Jsoup.parse(InputStream stream, ...),通過(guò)返回一個(gè)空的Document。#2252

一個(gè) template 標(biāo)簽包含一個(gè) li 在一個(gè)打開的 li 標(biāo)簽內(nèi),會(huì)被解析錯(cuò)誤,因?yàn)樗鼪](méi)有被識(shí)別為一個(gè) “特殊” 標(biāo)簽(具有額外的處理規(guī)則)。另外,將 SVG 和 MathML 命名空間標(biāo)簽添加到特殊標(biāo)簽列表中。#2258

一個(gè) template 標(biāo)簽包含一個(gè) button 在一個(gè)打開的 button 標(biāo)簽內(nèi),解析會(huì)不正確,因?yàn)?ldquo;在按鈕作用域”檢查沒(méi)有意識(shí)到 template 元素。修正了其他實(shí)例,包括 MathML 和 SVG 元素。#2271

一個(gè):nth-child選擇器的步長(zhǎng)為負(fù)且沒(méi)有數(shù)字,例如:nth-child(-n+2),會(huì)被解析為一個(gè)正步長(zhǎng),因此不會(huì)如預(yù)期那樣匹配。#1147

調(diào)用 doc.charset(charset) 在一個(gè)空的XML文檔上會(huì)拋出一個(gè) IndexOutOfBoundsException. #2266

修復(fù)了在重用嵌套時(shí)的內(nèi)存泄漏StructuralEvaluator(例如,選擇器祖先鏈如A B C)通過(guò)確保緩存重置調(diào)用傳遞到內(nèi)部成員。#2277

對(duì)doc.clone().append(html)的并發(fā)調(diào)用不被支持。當(dāng)克隆一個(gè)文檔時(shí),它的Parser沒(méi)有被克隆,而是原始解析器的淺拷貝。#2281

載地址

下載錯(cuò)誤?【投訴報(bào)錯(cuò)】

氣源碼

關(guān)文章

  • Java輕量級(jí)類隔離框架 SOFAArk Project v2.3.0

    SOFAArk 是一款基于 Java 實(shí)現(xiàn)的動(dòng)態(tài)熱部署和輕量級(jí)類隔離框架,由螞蟻集團(tuán)開源貢獻(xiàn),主要提供應(yīng)用模塊的動(dòng)態(tài)熱部署和類隔離能力。歡迎需要的朋友下載使用...

  • SpringBlade微服務(wù)開發(fā)平臺(tái) v4.4.0

    SpringBlade 是一個(gè)由商業(yè)級(jí)項(xiàng)目升級(jí)優(yōu)化而來(lái)的SpringCloud分布式微服務(wù)架構(gòu)、SpringBoot單體式微服務(wù)架構(gòu)并存的綜合型項(xiàng)目,采用Java8 API重構(gòu)了業(yè)務(wù)代碼,完全遵循阿里巴...

  • Diboot輕代碼開發(fā)平臺(tái) v2.11.0

    Diboot輕代碼開發(fā)平臺(tái)是一個(gè)面向開發(fā)人員的低代碼開發(fā)平臺(tái),將重復(fù)性的工作自動(dòng)化,提高質(zhì)量、效率、可維護(hù)性...

  • RuoYi-activiti工作流平臺(tái)源碼 v4.1

    RuoYi-activiti是一款以若依開源權(quán)限管理系統(tǒng)為基礎(chǔ)開發(fā)平臺(tái)并集成了activiti框架完成的工作流系統(tǒng),旨在打造集流程設(shè)計(jì)、流程部署、流程執(zhí)行、任務(wù)辦理、流程監(jiān)控于一體的...

  • RuoYi若依權(quán)限管理系統(tǒng) v4.7.9

    RuoYi若依權(quán)限管理系統(tǒng)是一個(gè)基于SpringBoot的權(quán)限管理系統(tǒng),代碼易讀易懂、界面簡(jiǎn)潔美觀, 核心技術(shù)采用Spring、MyBatis、Shiro沒(méi)有任何其它重度依賴,喜歡的朋友快來(lái)下載...

  • Java Struts2漏洞復(fù)現(xiàn)工具

    今天給大家分享Java Struts2漏洞復(fù)現(xiàn)工具,喜歡的朋友快來(lái)下載體驗(yàn)吧...

  • java操作excel的jar包(jxl.jar包 源碼)

    jxl.jar是通過(guò)java操作excel表格的工具類庫(kù),能夠修飾單元格屬性,是由java語(yǔ)言開發(fā)而成的,接下來(lái)通過(guò)本文給大家介紹java操作excel的jar包(jxl.jar包 源碼),喜歡的朋友快...

  • springboot整合QuartJob實(shí)現(xiàn)定時(shí)器實(shí)時(shí)管理源代碼

    Quartz是一個(gè)完全由java編寫的開源作業(yè)調(diào)度框架,形式簡(jiǎn)易,功能強(qiáng)大,,下面給大家分享springboot整合QuartJob實(shí)現(xiàn)定時(shí)器實(shí)時(shí)管理源代碼,感興趣的朋友快來(lái)下載體驗(yàn)吧...

  • SOFABoot開源框架 v3.24.0

    SOFABoot 是螞蟻集團(tuán)開源的基于 Spring Boot 的研發(fā)框架,它在 Spring Boot 的基礎(chǔ)上,提供了諸如 Readiness Check,上下文隔離,類隔離,日志空間隔離等等能力...

  • 基于SSM的應(yīng)急資源管理系統(tǒng)源碼 v1.0

    應(yīng)急資源管理系統(tǒng)用的是是比較流行的SSM和前端JSP技術(shù),用它來(lái)創(chuàng)建使用腳本語(yǔ)言,結(jié)合HTML代碼來(lái)制作動(dòng)態(tài) 網(wǎng)頁(yè),歡迎需要的朋友下載使用...

載聲明

☉ 解壓密碼:www.dbjr.com.cn 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個(gè)軟件總是不能下載的請(qǐng)?jiān)谠u(píng)論中留言,我們會(huì)盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請(qǐng)過(guò)一段時(shí)間重試!或者多試試幾個(gè)下載地址
☉ 如果遇到什么問(wèn)題,請(qǐng)?jiān)u論留言,我們定會(huì)解決問(wèn)題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請(qǐng)購(gòu)買正版。
☉ 本站提供的jsoup HTML解析器 v1.20.1資源來(lái)源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。