欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬蟲獲取百度首頁內(nèi)容教學(xué)

 更新時間:2018年12月23日 09:19:37   作者:1002002100a  
在本篇內(nèi)容里小編給大家分享了關(guān)于python爬蟲獲取百度首頁內(nèi)容教學(xué),需要的朋友們可以跟著學(xué)習(xí)下。

由傳智播客教程整理,我們這里使用的是python2.7.x版本,就是2.7之后的版本,因為python3的改動略大,我們這里不用它?,F(xiàn)在我們嘗試一下url和網(wǎng)絡(luò)爬蟲配合的關(guān)系,爬瀏覽器首頁信息。

1、首先我們創(chuàng)建一個urllib2_test01.py,然后輸入以下代碼:

2、最簡單的獲取一個url的信息代碼居然只需要4行,執(zhí)行寫的python代碼:

3、之后我們會看到一下的結(jié)果

4、

實際上,如果我們在瀏覽器上打開網(wǎng)頁主頁的話,右鍵選擇“查看源代碼”,你會發(fā)現(xiàn),跟我們剛打印出來的是一模一樣的。也就是說,上面的4行代碼就已經(jīng)幫我們把百度的首頁和全部代碼爬了下來了 。

5、下面我們介紹一下這四行代碼,第一行如下圖,這個就是將urllib2組件進入進來,供給我們使用。

6、圖片下面這步驟是調(diào)用urllib2庫中的urlopen方法,該方法接受一個url地址,然后將請求后的得到的回應(yīng)封裝到一個叫respones對象當中。

7、最后這里,是調(diào)用response對象的read()方法,將請求的回應(yīng)內(nèi)容以字符串的形式給html變量。最后的print html就是將字符串打出來,所以說一個基本的url請求是對應(yīng)的python代碼是很簡單的。

總結(jié):以上就是關(guān)于利用python爬蟲獲取百度信息的步驟內(nèi)容,感謝大家的學(xué)習(xí)和對腳本之家的支持。

相關(guān)文章

最新評論