import urllib 
import urllib2 
import urlparse 
import lxml.html 
def url_with_query(url, values): 
parts = urlparse.urlparse(url) 
rest, (query, frag) = parts[:-2], parts[-2:] 
return urlparse.urlunparse(rest + (urllib.urlencode(values), None)) 
def make_open_http(): 
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor()) 
opener.addheaders = [] # pretend we're a human -- don't do this 
def open_http(method, url, values={}): 
if method == "POST": 
return opener.open(url, urllib.urlencode(values)) 
else: 
return opener.open(url_with_query(url, values)) 
return open_http 
open_http = make_open_http() 
tree = lxml.html.fromstring(open_http("GET", "http://www.dbjr.com.cn").read()) 
form = tree.forms[0] 
form.fields["q"] = "eplussoft" 
form.action="http://www.dbjr.com.cn/search" 
response = lxml.html.submit_form(form,open_http=open_http) 
html = response.read() 
doc = lxml.html.fromstring(html) 
lxml.html.open_in_browser(doc) 

恩，驗(yàn)證碼是個(gè)大問題。還有今天看了一些百度貼吧上的東西，更是壞了心情，它的驗(yàn)證碼是用ajax取的圖片，這就更加麻煩了。不過好像現(xiàn)在大多數(shù)的論壇和博客的驗(yàn)證碼都是這樣的了。這樣第一次抓取下來的頁(yè)面就不會(huì)包含有驗(yàn)證碼圖片了，更不要說分析驗(yàn)證碼圖片了。要解決的問題還是很多的。。。

您可能感興趣的文章:

相關(guān)文章

在Python程序中操作MySQL的基本方法
這篇文章主要介紹了再Python程序中操作MySQL的基本方法,主要借助了MYSQLdb module,需要的朋友可以參考下
2015-07-07
Python中的Decorator裝飾器的使用示例
裝飾器(decorator)在Python框架中扮演著重要角色，是Python中實(shí)現(xiàn)切面編程(AOP)的重要手段，本文將通過簡(jiǎn)單的示例和大家介紹下具體的使用方法，希望對(duì)大家有所幫助
2022-12-12
Python中TCP協(xié)議的探索與實(shí)例解析
網(wǎng)絡(luò)編程在當(dāng)今數(shù)字化世界中扮演著至關(guān)重要的角色,本文將帶你深入了解 Python 中的 TCP 協(xié)議,介紹網(wǎng)絡(luò)編程的基礎(chǔ)知識(shí),并提供豐富的示例代碼,希望對(duì)大家有所幫助
2023-12-12
QML使用Python的函數(shù)過程解析
這篇文章主要介紹了QML使用Python的函數(shù)過程解析,文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2019-09-09
jupyter notebook讀取/導(dǎo)出文件/圖片實(shí)例
這篇文章主要介紹了jupyter notebook讀取/導(dǎo)出文件/圖片實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-04-04
Pygame Surface創(chuàng)建圖像的實(shí)現(xiàn)
本文主要介紹了Pygame Surface創(chuàng)建圖像的實(shí)現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2022-02-02
Python復(fù)制Excel帶有條件格式的單元格sheet實(shí)現(xiàn)步驟
這篇文章主要為大家介紹了Python復(fù)制Excel帶有條件格式的單元格sheet實(shí)現(xiàn)步驟，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪
2023-07-07
關(guān)于tensorflow的幾種參數(shù)初始化方法小結(jié)
今天小編就為大家分享一篇關(guān)于tensorflow的幾種參數(shù)初始化方法小結(jié)，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-01-01
在python中將list分段并保存為array類型的方法
今天小編就為大家分享一篇在python中將list分段并保存為array類型的方法，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2019-07-07
Python卷積神經(jīng)網(wǎng)絡(luò)圖片分類框架詳解分析
在機(jī)器視覺領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)算法作為一種新興算法出現(xiàn),在圖像識(shí)別領(lǐng)域中,卷積神經(jīng)網(wǎng)絡(luò)能夠較好的實(shí)現(xiàn)圖像的分類效果,而且其位移和形變具有較高的容忍能力
2021-11-11