python 爬取免費(fèi)簡(jiǎn)歷模板網(wǎng)站的示例
更新時(shí)間:2020年09月27日 14:58:08 作者:straightup
這篇文章主要介紹了python 爬取免費(fèi)簡(jiǎn)歷模板網(wǎng)站的示例,幫助大家更好的理解和使用python 爬蟲,感興趣的朋友可以了解下
代碼
# 免費(fèi)的簡(jiǎn)歷模板進(jìn)行爬取本地保存 # http://sc.chinaz.com/jianli/free.html # http://sc.chinaz.com/jianli/free_2.html import requests from lxml import etree import os dirName = './resumeLibs' if not os.path.exists(dirName): os.mkdir(dirName) headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36' } url = 'http://sc.chinaz.com/jianli/free_%d.html' for page in range(1,2): if page == 1: new_url = 'http://sc.chinaz.com/jianli/free.html' else: new_url = format(url%page) page_text = requests.get(url=new_url,headers=headers).text tree = etree.HTML(page_text) a_list = tree.xpath('//div[@id="container"]/div/p/a') for a in a_list: a_src = a.xpath('./@href')[0] a_title = a.xpath('./text()')[0] a_title = a_title.encode('iso-8859-1').decode('utf-8') # 爬取下載頁(yè)面 page_text = requests.get(url=a_src,headers=headers).text tree = etree.HTML(page_text) dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0] resume_data = requests.get(url=dl_src,headers=headers).content resume_name = a_title resume_path = dirName + '/' + resume_name + '.rar' with open(resume_path,'wb') as fp: fp.write(resume_data) print(resume_name,'下載成功!')
爬取結(jié)果
以上就是python 爬取免費(fèi)簡(jiǎn)歷模板網(wǎng)站的示例的詳細(xì)內(nèi)容,更多關(guān)于python 爬取網(wǎng)站的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
您可能感興趣的文章:
- python爬取新聞門戶網(wǎng)站的示例
- python 爬取壁紙網(wǎng)站的示例
- Python爬取網(wǎng)站圖片并保存的實(shí)現(xiàn)示例
- Python爬蟲設(shè)置Cookie解決網(wǎng)站攔截并爬取螞蟻短租的問(wèn)題
- python 多線程爬取壁紙網(wǎng)站的示例
- python爬蟲爬取某網(wǎng)站視頻的示例代碼
- python爬蟲實(shí)現(xiàn)爬取同一個(gè)網(wǎng)站的多頁(yè)數(shù)據(jù)的實(shí)例講解
- sql coalesce函數(shù)的具體使用
- Python3 實(shí)現(xiàn)爬取網(wǎng)站下所有URL方式
- 使用python爬取taptap網(wǎng)站游戲截圖的步驟
相關(guān)文章
解決Python print輸出不換行沒(méi)空格的問(wèn)題
今天小編就為大家分享一篇解決Python print輸出不換行沒(méi)空格的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11Python爬蟲實(shí)現(xiàn)自動(dòng)登錄、簽到功能的代碼
這篇文章主要介紹了Python爬蟲實(shí)現(xiàn)自動(dòng)登錄、簽到功能的代碼,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-08-08Python unittest工作原理和使用過(guò)程解析
這篇文章主要介紹了Python unittest工作原理和使用過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-02-02小白入門篇使用Python搭建點(diǎn)擊率預(yù)估模型
本文將從零開始,僅僅利用基礎(chǔ)的numpy庫(kù),使用Python實(shí)現(xiàn)一個(gè)最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)(或者說(shuō)是簡(jiǎn)易的LR,因?yàn)長(zhǎng)R就是一個(gè)單層的神經(jīng)網(wǎng)絡(luò)),解決一個(gè)點(diǎn)擊率預(yù)估的問(wèn)題。感興趣的朋友跟隨小白一起看看吧2018-10-10關(guān)于Python-faker的函數(shù)效果一覽
今天小編就為大家分享一篇關(guān)于Python-faker的函數(shù)效果一覽,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-11-11使用python構(gòu)建WebSocket客戶端的教程詳解
WebSocket是一種在客戶端和服務(wù)器之間實(shí)現(xiàn)雙向通信的協(xié)議,常用于實(shí)時(shí)聊天、實(shí)時(shí)數(shù)據(jù)更新等場(chǎng)景,Python提供了許多庫(kù)來(lái)實(shí)現(xiàn) WebSocket客戶端,本教程將介紹如何使用Python構(gòu)建WebSocket客戶端,文中通過(guò)代碼示例給大家介紹的非常詳細(xì),需要的朋友可以參考下2023-12-12