python3抓取中文網(wǎng)頁(yè)的方法
本文實(shí)例講述了python3抓取中文網(wǎng)頁(yè)的方法。分享給大家供大家參考。具體如下:
#! /usr/bin/python3.2
import sys
import urllib.request
req = urllib.request.Request('http://www.baidu.com')
response = urllib.request.urlopen(req)
the_page = response.read()
type = sys.getfilesystemencoding()
#轉(zhuǎn)換成本地系統(tǒng)編碼
print(the_page.decode(type))
希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。
- 利用Python3分析sitemap.xml并抓取導(dǎo)出全站鏈接詳解
- python3實(shí)現(xiàn)抓取網(wǎng)頁(yè)資源的 N 種方法
- 詳解python3百度指數(shù)抓取實(shí)例
- Python3使用requests包抓取并保存網(wǎng)頁(yè)源碼的方法
- 使用Python3編寫(xiě)抓取網(wǎng)頁(yè)和只抓網(wǎng)頁(yè)圖片的腳本
- 在Python3中使用asyncio庫(kù)進(jìn)行快速數(shù)據(jù)抓取的教程
- Python使用lxml模塊和Requests模塊抓取HTML頁(yè)面的教程
- 用Python程序抓取網(wǎng)頁(yè)的HTML信息的一個(gè)小實(shí)例
- python抓取并保存html頁(yè)面時(shí)亂碼問(wèn)題的解決方法
- Python使用urllib2模塊抓取HTML頁(yè)面資源的實(shí)例分享
- Python3實(shí)現(xiàn)抓取javascript動(dòng)態(tài)生成的html網(wǎng)頁(yè)功能示例
相關(guān)文章
django restframework使用redis實(shí)現(xiàn)token認(rèn)證
本文主要介紹了django restframework使用redis實(shí)現(xiàn)token認(rèn)證,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09
PyTorch 隨機(jī)數(shù)生成占用 CPU 過(guò)高的解決方法
今天小編就為大家分享一篇PyTorch 隨機(jī)數(shù)生成占用 CPU 過(guò)高的解決方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01
python通過(guò)TimedRotatingFileHandler按時(shí)間切割日志
這篇文章主要介紹了python通過(guò)TimedRotatingFileHandler按時(shí)間切割日志的方法,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-07-07
Pandas高級(jí)教程之Pandas中的GroupBy操作
通常來(lái)說(shuō)groupby操作可以分為三部分:分割數(shù)據(jù),應(yīng)用變換和和合并數(shù)據(jù),本文將會(huì)詳細(xì)講解Pandas中的groupby操作,感興趣的朋友一起看看吧2021-07-07
pytest解讀一次請(qǐng)求多個(gè)fixtures及多次請(qǐng)求
這篇文章主要為大家介紹了一次請(qǐng)求多個(gè)fixtures,以及fixtures被多次請(qǐng)求的pytest官方解讀,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06

