欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python 爬取免費(fèi)簡(jiǎn)歷模板網(wǎng)站的示例

 更新時(shí)間:2020年09月27日 14:58:08   作者:straightup  
這篇文章主要介紹了python 爬取免費(fèi)簡(jiǎn)歷模板網(wǎng)站的示例,幫助大家更好的理解和使用python 爬蟲,感興趣的朋友可以了解下

代碼

# 免費(fèi)的簡(jiǎn)歷模板進(jìn)行爬取本地保存 
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html

import requests
from lxml import etree
import os

dirName = './resumeLibs'
if not os.path.exists(dirName):
  os.mkdir(dirName)

headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
  if page == 1:
    new_url = 'http://sc.chinaz.com/jianli/free.html'
  else:
    new_url = format(url%page)
  page_text = requests.get(url=new_url,headers=headers).text
  tree = etree.HTML(page_text)
  a_list = tree.xpath('//div[@id="container"]/div/p/a')
  
  for a in a_list:
    a_src = a.xpath('./@href')[0]
    a_title = a.xpath('./text()')[0]
    a_title = a_title.encode('iso-8859-1').decode('utf-8')
    # 爬取下載頁(yè)面
    page_text = requests.get(url=a_src,headers=headers).text
    tree = etree.HTML(page_text)
    dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
    
    resume_data = requests.get(url=dl_src,headers=headers).content
    resume_name = a_title
    resume_path = dirName + '/' + resume_name + '.rar'
    with open(resume_path,'wb') as fp:
      fp.write(resume_data)
      print(resume_name,'下載成功!')

爬取結(jié)果

以上就是python 爬取免費(fèi)簡(jiǎn)歷模板網(wǎng)站的示例的詳細(xì)內(nèi)容,更多關(guān)于python 爬取網(wǎng)站的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python類的常用高級(jí)函數(shù)匯總

    Python類的常用高級(jí)函數(shù)匯總

    這篇文章主要介紹了Python類的常用高級(jí)函數(shù)匯總,文章圍繞python類函數(shù)展開詳細(xì)內(nèi)容,具有一的的參考價(jià)值,需要的小伙伴可以參考一下,希望對(duì)你的學(xué)習(xí)有所幫助
    2022-03-03
  • 基于PyQT5制作一個(gè)敏感詞檢測(cè)工具

    基于PyQT5制作一個(gè)敏感詞檢測(cè)工具

    這篇文章主要介紹了如何利用PyQT5制作簡(jiǎn)易的敏感詞檢測(cè)工具??梢愿鶕?jù)敏感詞庫(kù)文件篩選,查看輸入的文本中是否包含敏感詞匯,從而過(guò)濾出相關(guān)的敏感詞。感興趣的可以了解一下
    2022-02-02
  • 解決Python print輸出不換行沒(méi)空格的問(wèn)題

    解決Python print輸出不換行沒(méi)空格的問(wèn)題

    今天小編就為大家分享一篇解決Python print輸出不換行沒(méi)空格的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-11-11
  • Python爬蟲實(shí)現(xiàn)自動(dòng)登錄、簽到功能的代碼

    Python爬蟲實(shí)現(xiàn)自動(dòng)登錄、簽到功能的代碼

    這篇文章主要介紹了Python爬蟲實(shí)現(xiàn)自動(dòng)登錄、簽到功能的代碼,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-08-08
  • 如何利用python實(shí)現(xiàn)圖片批處理

    如何利用python實(shí)現(xiàn)圖片批處理

    這篇文章主要給大家介紹了關(guān)于如何利用python實(shí)現(xiàn)圖片批處理的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2021-03-03
  • Python unittest工作原理和使用過(guò)程解析

    Python unittest工作原理和使用過(guò)程解析

    這篇文章主要介紹了Python unittest工作原理和使用過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-02-02
  • 小白入門篇使用Python搭建點(diǎn)擊率預(yù)估模型

    小白入門篇使用Python搭建點(diǎn)擊率預(yù)估模型

    本文將從零開始,僅僅利用基礎(chǔ)的numpy庫(kù),使用Python實(shí)現(xiàn)一個(gè)最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)(或者說(shuō)是簡(jiǎn)易的LR,因?yàn)長(zhǎng)R就是一個(gè)單層的神經(jīng)網(wǎng)絡(luò)),解決一個(gè)點(diǎn)擊率預(yù)估的問(wèn)題。感興趣的朋友跟隨小白一起看看吧
    2018-10-10
  • Python 爬蟲的原理

    Python 爬蟲的原理

    這篇文章主要介紹了Python 爬蟲的原理,文中講解非常細(xì)致,幫助大家更好的學(xué)習(xí)和認(rèn)識(shí)爬蟲,感興趣的朋友可以了解下
    2020-07-07
  • 關(guān)于Python-faker的函數(shù)效果一覽

    關(guān)于Python-faker的函數(shù)效果一覽

    今天小編就為大家分享一篇關(guān)于Python-faker的函數(shù)效果一覽,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2019-11-11
  • 使用python構(gòu)建WebSocket客戶端的教程詳解

    使用python構(gòu)建WebSocket客戶端的教程詳解

    WebSocket是一種在客戶端和服務(wù)器之間實(shí)現(xiàn)雙向通信的協(xié)議,常用于實(shí)時(shí)聊天、實(shí)時(shí)數(shù)據(jù)更新等場(chǎng)景,Python提供了許多庫(kù)來(lái)實(shí)現(xiàn) WebSocket客戶端,本教程將介紹如何使用Python構(gòu)建WebSocket客戶端,文中通過(guò)代碼示例給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2023-12-12

最新評(píng)論