快捷導(dǎo)航

python 爬取免費(fèi)簡歷模板網(wǎng)站的示例

更新時間：2020年09月27日 14:58:08 作者：straightup

這篇文章主要介紹了python 爬取免費(fèi)簡歷模板網(wǎng)站的示例，幫助大家更好的理解和使用python 爬蟲，感興趣的朋友可以了解下

代碼

# 免費(fèi)的簡歷模板進(jìn)行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下載頁面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下載成功!')

爬取結(jié)果

以上就是python 爬取免費(fèi)簡歷模板網(wǎng)站的示例的詳細(xì)內(nèi)容，更多關(guān)于python 爬取網(wǎng)站的資料請關(guān)注腳本之家其它相關(guān)文章！

您可能感興趣的文章:

相關(guān)文章

Python類的常用高級函數(shù)匯總
這篇文章主要介紹了Python類的常用高級函數(shù)匯總，文章圍繞python類函數(shù)展開詳細(xì)內(nèi)容，具有一的的參考價值，需要的小伙伴可以參考一下，希望對你的學(xué)習(xí)有所幫助
2022-03-03
基于PyQT5制作一個敏感詞檢測工具
這篇文章主要介紹了如何利用PyQT5制作簡易的敏感詞檢測工具?？梢愿鶕?jù)敏感詞庫文件篩選，查看輸入的文本中是否包含敏感詞匯，從而過濾出相關(guān)的敏感詞。感興趣的可以了解一下
2022-02-02
解決Python print輸出不換行沒空格的問題
今天小編就為大家分享一篇解決Python print輸出不換行沒空格的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-11-11
Python爬蟲實(shí)現(xiàn)自動登錄、簽到功能的代碼
這篇文章主要介紹了Python爬蟲實(shí)現(xiàn)自動登錄、簽到功能的代碼,本文通過圖文并茂的形式給大家介紹的非常詳細(xì)，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2020-08-08
如何利用python實(shí)現(xiàn)圖片批處理
這篇文章主要給大家介紹了關(guān)于如何利用python實(shí)現(xiàn)圖片批處理的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2021-03-03
Python unittest工作原理和使用過程解析
這篇文章主要介紹了Python unittest工作原理和使用過程解析,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2020-02-02
小白入門篇使用Python搭建點(diǎn)擊率預(yù)估模型
本文將從零開始，僅僅利用基礎(chǔ)的numpy庫，使用Python實(shí)現(xiàn)一個最簡單的神經(jīng)網(wǎng)絡(luò)(或者說是簡易的LR，因?yàn)長R就是一個單層的神經(jīng)網(wǎng)絡(luò))，解決一個點(diǎn)擊率預(yù)估的問題。感興趣的朋友跟隨小白一起看看吧
2018-10-10
Python 爬蟲的原理
這篇文章主要介紹了Python 爬蟲的原理,文中講解非常細(xì)致，幫助大家更好的學(xué)習(xí)和認(rèn)識爬蟲，感興趣的朋友可以了解下
2020-07-07
關(guān)于Python-faker的函數(shù)效果一覽
今天小編就為大家分享一篇關(guān)于Python-faker的函數(shù)效果一覽，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-11-11
使用python構(gòu)建WebSocket客戶端的教程詳解
WebSocket是一種在客戶端和服務(wù)器之間實(shí)現(xiàn)雙向通信的協(xié)議,常用于實(shí)時聊天、實(shí)時數(shù)據(jù)更新等場景,Python提供了許多庫來實(shí)現(xiàn) WebSocket客戶端,本教程將介紹如何使用Python構(gòu)建WebSocket客戶端,文中通過代碼示例給大家介紹的非常詳細(xì),需要的朋友可以參考下
2023-12-12