快捷導(dǎo)航

Java 獲取URL的內(nèi)容

更新時間：2008年12月10日 12:28:50 作者：

Java的網(wǎng)絡(luò)資源比較少，問GG問的比較失敗啊，自己在不斷的摸索中才知道了不少。

Java獲取URL內(nèi)容的，我這里只給出GET方式的，POST和其它方式的都是比較類似的。其技術(shù)要點就一下三點。
第一：創(chuàng)建HttpURLConnection
第二：打開URL，創(chuàng)建一個InputStream
第三：逐行（逐字節(jié)）讀取，如果需要，轉(zhuǎn)換編碼，放入字符串。
好，一下就開始代碼吧：

復(fù)制代碼代碼如下:

public String getUrlContent(String path){ 
String rtn = ""; 
int c; 
try{ 
java.net.URL l_url = new java.net.URL(path); 
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection(); 
l_connection.setRequestProperty("User-agent","Mozilla/4.0"); 
l_connection.connect(); 
InputStream l_urlStream = l_connection.getInputStream(); 
while (( ( c= l_urlStream.read() )!=-1)){ 
int all=l_urlStream.available(); 
byte[] b =new byte[all]; 
l_urlStream.read(b); 
rtn+= new String(b, "UTF-8"); 
} 
//Thread.sleep(2000); 
l_urlStream.close(); 
}catch(Exception e){ 
e.printStackTrace(); 
} 
return rtn; 
} 

其中
l_connection.setRequestProperty("User-agent","Mozilla/4.0");
這句是必須的，很多服務(wù)器對于沒有User-agent頭的請求直接403了就。
然后采用InputStream.available()來一次性讀取，返回此輸入流方法的下一個調(diào)用方可以不受阻塞地從此輸入流讀?。ɑ蛱^）的字節(jié)數(shù)，如果需要的話，可以在后面稍微Sleep一下線程：
Thread.sleep(2000);
其中的

復(fù)制代碼代碼如下:

while (( ( c= l_urlStream.read() )!=-1)){ 
int all=l_urlStream.available(); 
byte[] b =new byte[all]; 
l_urlStream.read(b); 
rtn+= new String(b, "UTF-8"); 
} 

是個很重要的讀取過程，c表示讀取流的標注，當(dāng)結(jié)束的時候是-1，然后all是本次循環(huán)可用的最大字節(jié)數(shù)目，然后讀取全部可用字節(jié)到byte[] b中，然后轉(zhuǎn)換成UTF-8類型的字符串，注意，這里可以自己寫方式，如果讀取GB2312，就要寫GB2312，至于有沒有萬能的，可以獲取Meta，匹配下。自己想辦法吧。

您可能感興趣的文章: