Python抓取百度查詢結(jié)果的方法
更新時(shí)間:2015年07月08日 10:34:38 作者:光索與諾
這篇文章主要介紹了Python抓取百度查詢結(jié)果的方法,涉及Python正則匹配及字符串與URL操作的相關(guān)技巧,需要的朋友可以參考下
本文實(shí)例講述了Python抓取百度查詢結(jié)果的方法。分享給大家供大家參考。具體實(shí)現(xiàn)方法如下:
#win python 2.7.x import re,sys,urllib,codecs xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I) match = rc.finditer(xh) rcr = re.compile(r'<[^>]+>',re.I) f = codecs.open("xiaohei.txt", "w", "utf-8") for i in rc.finditer(xh): ss = i.group(0) s1 = rcr.sub('',ss) print (s1) f.write(s1) f.close()
希望本文所述對大家的Python程序設(shè)計(jì)有所幫助。
您可能感興趣的文章:
- python中requests模塊的使用方法
- python采用requests庫模擬登錄和抓取數(shù)據(jù)的簡單示例
- 使用Python3編寫抓取網(wǎng)頁和只抓網(wǎng)頁圖片的腳本
- python3抓取中文網(wǎng)頁的方法
- 在Python3中使用asyncio庫進(jìn)行快速數(shù)據(jù)抓取的教程
- Python 多線程抓取圖片效率對比
- Python制作爬蟲抓取美女圖
- Python實(shí)現(xiàn)周期性抓取網(wǎng)頁內(nèi)容的方法
- Python實(shí)現(xiàn)多線程抓取妹子圖
- Python3使用requests包抓取并保存網(wǎng)頁源碼的方法
相關(guān)文章
Python字典生成式、集合生成式、生成器用法實(shí)例分析
這篇文章主要介紹了Python字典生成式、集合生成式、生成器用法,結(jié)合實(shí)例形式分析了Python字典生成式、集合生成式、生成器相關(guān)原理、使用技巧與操作注意事項(xiàng),需要的朋友可以參考下2020-01-01Python閉包的兩個(gè)注意事項(xiàng)(推薦)
閉包就是根據(jù)不同的配置信息得到不同的結(jié)果。下面通過本文給大家分享Python閉包的兩個(gè)注意事項(xiàng),需要的朋友參考下2017-03-03python自動(dòng)化測試之異常及日志操作實(shí)例分析
這篇文章主要介紹了python自動(dòng)化測試之異常及日志操作,結(jié)合實(shí)例形式分析了python自動(dòng)化測試中的異常捕獲與日志記錄相關(guān)操作技巧,需要的朋友可以參考下2019-11-11python文件轉(zhuǎn)為exe文件的方法及用法詳解
py2exe是一個(gè)將python腳本轉(zhuǎn)換成windows上的可獨(dú)立執(zhí)行的可執(zhí)行程序(*.exe)的工具,這樣,你就可以不用裝python而在windows系統(tǒng)上運(yùn)行這個(gè)可執(zhí)行程序。本文重點(diǎn)給大家介紹python文件轉(zhuǎn)為exe文件的方法,感興趣的朋友跟隨小編一起看看吧2019-07-07