快捷導(dǎo)航

對(duì)python3 urllib包與http包的使用詳解

更新時(shí)間：2018年05月10日 16:14:23 作者：ZJE_ANDY

今天小編就為大家分享一篇對(duì)python3 urllib包與http包的使用詳解，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧

urllib包和http包都是面向HTTP協(xié)議的。其中urllib主要用于處理 URL，使用urllib操作URL可以像使用和打開本地文件一樣地操作。而 http包則實(shí)現(xiàn)了對(duì) HTTP協(xié)議的封裝，是urllib.request模塊的底層。

1.urllib包簡(jiǎn)介

2. http 包簡(jiǎn)介

1.urllib包簡(jiǎn)介

urllib包主要模塊有：

1.urllib.request -----用于打開 URL網(wǎng)址；

2.urllib.error ---------定義了常見的urllib.request會(huì)引發(fā)的異常；

3.urllib.parse---------用于解析 URL；

具體方法：

urllib.request.urlopen( url，data，proxies ) ：用于打開 url

參數(shù)如下：

url：要進(jìn)行操作的 URL地址

data：可選項(xiàng)。向URL 傳遞的數(shù)據(jù)。

proxies：可選項(xiàng)。使用的代理地址

import urllib.request
url = 'http://www.baidu.com'   #網(wǎng)頁(yè)為百度首頁(yè)
respone = urllib.request.urlopen(url) #打開url地址,并返回一個(gè) HTTPRespone實(shí)例
html = respone.read().decode('utf-8') #調(diào)用實(shí)例的 read()方法，并用 utf-8進(jìn)行解碼處理。就得出完整的百度的HTML文件
print(html)

部分打印結(jié)果：

<html>
<head>
 
 <meta http-equiv="content-type" content="text/html;charset=utf-8">
 <meta http-equiv="X-UA-Compatible" content="IE=Edge">
	<meta content="always" name="referrer">
 <meta name="theme-color" content="#2932e1">
 <link rel="shortcut icon" href="/favicon.ico" rel="external nofollow" type="image/x-icon" />
 <link rel="search" type="application/opensearchdescription+xml" href="/content-search.xml" rel="external nofollow" title="百度搜索" /> 
 <link rel="icon" sizes="any" mask  rel="external nofollow" >

urllib.request.urlretrieve(url，filename，reporthook，data) ：用于將 URL的HTML文件下載并保存為本地文件

參數(shù)如下：

url：要下載的網(wǎng)頁(yè)

filename：保存在主機(jī)的路徑，可選項(xiàng)。

reporthook：一個(gè)回調(diào)函數(shù)，可選項(xiàng)。

data：發(fā)送的數(shù)據(jù)，一般用于 post，可選項(xiàng)。

特別：關(guān)于urlretrieve()的回調(diào)函數(shù)reporthook：可以用來(lái)顯示下載的進(jìn)度，幾乎已經(jīng)封裝好

import urllib.request
def callbackfunc(blocknum, blocksize, totalsize): #這三個(gè)參數(shù)是由 urlretrieve自動(dòng)賦值的
 '''回調(diào)函數(shù)
 @blocknum: 已經(jīng)下載的數(shù)據(jù)塊
 @blocksize: 數(shù)據(jù)塊的大小
 @totalsize: 遠(yuǎn)程文件的大小
 '''
 percent = 100.0 * blocknum * blocksize / totalsize
 if percent > 100:
  percent = 100
 print( "%.2f%%"% percent) #保留兩位小數(shù)
url = 'http://www.sina.com'
local = 'd:\\sina.html'        #下載的html文件保存在 d盤的sina.html里
urllib.request.urlretrieve(url,local,callbackfunc) #沒下載完一個(gè)數(shù)據(jù)塊，就會(huì)執(zhí)行回調(diào)函數(shù)一次

執(zhí)行結(jié)果：

//只顯示局部 
0.00% 
1.38% 
2.76% 
4.13% 
5.51% 
6.89%

2. http包簡(jiǎn)介

http包提供了 HTTP協(xié)議的一些功能，主要模塊有：

http.client --- 底層的 HTTP 協(xié)議的一些功能，可以為 urllib.request 模塊所用

http.server --- 提供了基于 socketserver模塊的基本 HTTP服務(wù)器類

http.cookies --- cookies 的管理工具

http.client ：

HttpClient不是一個(gè)瀏覽器。它是一個(gè)客戶端的HTTP通信實(shí)現(xiàn)庫(kù)。HttpClient的目標(biāo)是發(fā)送和接收HTTP報(bào)文。

兩個(gè)主要類(用于客戶端)：

HTTPConnection ：基于HTTP協(xié)議的客戶端，指定 URL(網(wǎng)址) 后，可以發(fā)送請(qǐng)求報(bào)文和接收響應(yīng)報(bào)文

HTTPRespone ：基于 HTTP 協(xié)議的服務(wù)端回應(yīng)。一旦用 HTTPConnection 成功連接，可以調(diào)用相關(guān)方法返回該實(shí)例(HTTPRequest實(shí)例)。

（1）HTTPConnection 的方法：

構(gòu)造方法： HTTPConnection( host，port，[timeout] ) 返回一個(gè)HTTPConnection 實(shí)例

host：表示主機(jī)域名或 ip 地址

port：表示端口

timeout：阻塞操作將會(huì)在給定時(shí)間后超時(shí)?？蛇x項(xiàng)

發(fā)送請(qǐng)求報(bào)文方法：HTTPConnection.request( method，url，body =None，headers = {} )

method：發(fā)送的操作，一般為 GET 或者 POST

url ：進(jìn)行操作的 url

body ：所發(fā)送的數(shù)據(jù)

headers：發(fā)送的 HTTP頭部，是一個(gè)字典類型

獲取響應(yīng)報(bào)文方法：HTTPConnection.getrespone( )

關(guān)閉與服務(wù)器的連接： HTTPConne.close()

發(fā)送一個(gè)頭部：HTTPConnection.putheader( header，args[ ] ) #頭部以一個(gè)字典方式發(fā)送

發(fā)送一個(gè)空白行到服務(wù)器，標(biāo)志頭部Header的結(jié)束：HTTPConnection.endheaders( )

發(fā)送數(shù)據(jù)到服務(wù)器：HTTPConnection.send( data ) ，應(yīng)該在endheaders()之后和 getrespone()之前調(diào)用。

（2）HTTPRespone：

HTTPRespone對(duì)象：一旦用 HTTPConnection 成功連接，可以調(diào)用HTTPConnection.getrespone()返回該實(shí)例(HTTPRequest實(shí)例)。

HTTPRespone.getheader(name) ：返回頭部中的 name 字段對(duì)應(yīng)的值

HTTPRespone.getheaders( ) ：以元組的方式返回整個(gè)頭部的信息

HTTPRespone.read() ：返回響應(yīng)報(bào)文中的body部分，也即正文部分

HTTPRespone.status #返回狀態(tài)碼

HTTPRespone.version #返回 HTTP協(xié)議版本

http 包應(yīng)用實(shí)例。

from http.client import HTTPConnection

con = HTTPConnection('www.baidu.com',80)
con.request('GET','/')   #發(fā)送請(qǐng)求報(bào)文
res = con.getresponse()   #獲取響應(yīng)報(bào)文對(duì)象
print(res.status) #200 (表示狀態(tài)碼)
print(res.reason) #OK	 （表示狀態(tài)碼對(duì)應(yīng)的意義）
print(res.read().decode('utf-8')) #打印www.baidu.com的html

以上這篇對(duì)python3 urllib包與http包的使用詳解就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章: