欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python實現(xiàn)從web抓取文檔的方法

 更新時間:2014年09月26日 09:28:02   投稿:shichen2014  
這篇文章主要介紹了python實現(xiàn)從web抓取文檔的方法,以抓取人人網(wǎng)頁面為例講述了完整的web文檔抓取方法,需要的朋友可以參考下

本文實例講述了Python實現(xiàn)從Web的一個URL中抓取文檔的方法,分享給大家供大家參考。具體方法分析如下:

實例代碼如下:

import urllib 
doc = urllib.urlopen("http://www.python.org").read() 
print doc#直接打印出網(wǎng)頁 
def reporthook(*a): 
 print a 
#將http://www.renren.com網(wǎng)頁保存到renre.html中,
#每讀取一個塊調(diào)用一字reporthook函數(shù) 
 
urllib.urlretrieve("http://www.renren.com",'renren.html',reporthook) 
#將http://www.renren.com網(wǎng)頁保存到renre.html中 
urllib.urlretrieve("http://www.renren.com",'renren.html')

程序運行結(jié)果如下:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
..........................網(wǎng)頁內(nèi)容
</body>
</html>


(0, 8192, -1)
(1, 8192, -1)
(2, 8192, -1)

其中urllib.urlopen返回一個類文件對象。

希望本文所述對大家的Python程序設(shè)計有所幫助。

相關(guān)文章

  • 基于Python PaddleSpeech實現(xiàn)語音文字處理

    基于Python PaddleSpeech實現(xiàn)語音文字處理

    PaddleSpeech基于飛槳PaddlePaddle的語音方向的開源模型庫,用于語音和音頻中的各種關(guān)鍵任務(wù)的開發(fā),包含大量基于深度學(xué)習(xí)前沿和有影響力的模型。本文將介紹如何通過PaddleSpeech實現(xiàn)語音文字處理,感興趣的可以學(xué)習(xí)一下
    2022-01-01
  • python繪制三維圖的詳細(xì)新手教程

    python繪制三維圖的詳細(xì)新手教程

    通常我們用 Python 繪制的都是二維平面圖,但有時也需要繪制三維場景圖,下面這篇文章主要給大家介紹了關(guān)于python繪制三維圖的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下
    2022-08-08
  • Python3.6+Django2.0以上 xadmin站點的配置和使用教程圖解

    Python3.6+Django2.0以上 xadmin站點的配置和使用教程圖解

    django自帶的admin站點雖然功能強大,但是界面不是很好看。這篇文章主要介紹了Python3.6+Django2.0以上 xadmin站點的配置和使用 ,本文圖文并茂給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下
    2019-06-06
  • pycharm轉(zhuǎn)移緩存目錄的實現(xiàn)

    pycharm轉(zhuǎn)移緩存目錄的實現(xiàn)

    Pycharm在使用過程中,Pycharm會生成大量緩存文件,而這些緩存文件默認(rèn)存儲在C盤的用戶目錄里面,導(dǎo)致C盤空間被占用,本文主要介紹了pycharm轉(zhuǎn)移緩存目錄,感興趣的可以了解一下
    2023-10-10
  • 使用matlab或python將txt文件轉(zhuǎn)為excel表格

    使用matlab或python將txt文件轉(zhuǎn)為excel表格

    這篇文章主要介紹了matlab或python代碼將txt文件轉(zhuǎn)為excel表格,本文通過matlab代碼和python 代碼給大家詳細(xì)介紹,需要的朋友可以參考下
    2019-11-11
  • 最新解決'nvidia-smi' 不是內(nèi)部或外部命令也不是可運行的程序

    最新解決'nvidia-smi' 不是內(nèi)部或外部命令也不是可運行的程序

    使用cmd查看電腦顯卡的信息,調(diào)用nvidia-smi查看顯卡使用情況報錯,提示'nvidia-smi' 不是內(nèi)部或外部命令,也不是可運行的程序,本文給大家分享完美解決方案,感興趣的朋友跟隨小編一起看看吧
    2023-01-01
  • OpenAI?Function?Calling特性示例詳解

    OpenAI?Function?Calling特性示例詳解

    這篇文章主要為大家介紹了OpenAI?Function?Calling特性作用詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-07-07
  • Python 打印中文字符的三種方法

    Python 打印中文字符的三種方法

    本文給大家分享三種方法實現(xiàn)python打印中文字符的方法,代碼簡單易懂,非常不錯,具有一定的參考借鑒價值,需要的朋友參考下吧
    2018-08-08
  • Python NumPy教程之遍歷數(shù)組詳解

    Python NumPy教程之遍歷數(shù)組詳解

    這篇文章主要為大家詳細(xì)介紹了Python?NumPy中遍歷數(shù)組的方法,文中的示例代碼講解詳細(xì),對我們學(xué)習(xí)Python有一定幫助,需要的可以參考一下
    2022-08-08
  • Python-while 計算100以內(nèi)奇數(shù)和的方法

    Python-while 計算100以內(nèi)奇數(shù)和的方法

    今天小編就為大家分享一篇Python-while 計算100以內(nèi)奇數(shù)和的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-06-06

最新評論