python3抓取中文網(wǎng)頁的方法
更新時間:2015年07月28日 11:10:51 作者:文傻理呆
這篇文章主要介紹了python3抓取中文網(wǎng)頁的方法,實(shí)例分析了Python3頁面抓取及編碼轉(zhuǎn)換的相關(guān)技巧,具有一定參考借鑒價值,需要的朋友可以參考下
本文實(shí)例講述了python3抓取中文網(wǎng)頁的方法。分享給大家供大家參考。具體如下:
#! /usr/bin/python3.2 import sys import urllib.request req = urllib.request.Request('http://www.baidu.com') response = urllib.request.urlopen(req) the_page = response.read() type = sys.getfilesystemencoding() #轉(zhuǎn)換成本地系統(tǒng)編碼 print(the_page.decode(type))
希望本文所述對大家的Python程序設(shè)計有所幫助。
您可能感興趣的文章:
- 利用Python3分析sitemap.xml并抓取導(dǎo)出全站鏈接詳解
- python3實(shí)現(xiàn)抓取網(wǎng)頁資源的 N 種方法
- 詳解python3百度指數(shù)抓取實(shí)例
- Python3使用requests包抓取并保存網(wǎng)頁源碼的方法
- 使用Python3編寫抓取網(wǎng)頁和只抓網(wǎng)頁圖片的腳本
- 在Python3中使用asyncio庫進(jìn)行快速數(shù)據(jù)抓取的教程
- Python使用lxml模塊和Requests模塊抓取HTML頁面的教程
- 用Python程序抓取網(wǎng)頁的HTML信息的一個小實(shí)例
- python抓取并保存html頁面時亂碼問題的解決方法
- Python使用urllib2模塊抓取HTML頁面資源的實(shí)例分享
- Python3實(shí)現(xiàn)抓取javascript動態(tài)生成的html網(wǎng)頁功能示例
相關(guān)文章
django restframework使用redis實(shí)現(xiàn)token認(rèn)證
本文主要介紹了django restframework使用redis實(shí)現(xiàn)token認(rèn)證,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-09-09PyTorch 隨機(jī)數(shù)生成占用 CPU 過高的解決方法
今天小編就為大家分享一篇PyTorch 隨機(jī)數(shù)生成占用 CPU 過高的解決方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01python通過TimedRotatingFileHandler按時間切割日志
這篇文章主要介紹了python通過TimedRotatingFileHandler按時間切割日志的方法,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2019-07-07