java 讀取網(wǎng)頁內(nèi)容的實例詳解
java 讀取網(wǎng)頁內(nèi)容的實例詳解
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.*; public class loadurl { public static void main(String args[]) { String a = null; try { String url = "(這里替換成任意網(wǎng)頁的網(wǎng)址)"; BufferedReader in = new BufferedReader(new InputStreamReader( new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根據(jù)需要替換成要讀取網(wǎng)頁的編碼 while ((a = in.readLine()) != null) { System.out.println(a); } } catch (MalformedURLException e) { } catch (IOException e) { } } }
以上的代碼程序是把一個網(wǎng)頁的源代碼,包括HTML與XML讀取到JAVA的一個字符串String a中。
Java中字符串String類型的空間很大,基本能夠容納一個網(wǎng)頁源代碼的內(nèi)容。
從網(wǎng)頁讀取內(nèi)容同樣是對于輸入流的操作。
不同于標(biāo)準(zhǔn)的輸入源,在:
BufferedReader in = new BufferedReader(new InputStreamReader(...))
InputStreamReader中輸入System.in就可以。
此處的輸入源應(yīng)該為:
(new URL(url).openConnection().getInputStream(), "GB2312")
之后的操作與處理與載入標(biāo)準(zhǔn)輸入源完全相同。
BufferedReader在JAVA中要求必須捕獲IOException異常,而使用URL源除了必須引入java.net.*包之外,還必須捕獲MalformedURLException異常。
如有疑問請留言或者到本站社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!
相關(guān)文章
Java中DataInputStream和DataOutputStream的使用方法
這篇文章主要介紹了Java中DataInputStream和DataOutputStream的使用方法,通過創(chuàng)建對象展開具體的內(nèi)容介紹,需要的小伙伴可以參考一下2022-05-05Java線程基本使用之如何實現(xiàn)Runnable接口
這篇文章主要介紹了Java線程基本使用之如何實現(xiàn)Runnable接口問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-01-01