使用Python抓取模板之家的CSS模板
Python版本是2.7.9,在win8上測試成功,就是抓取有點慢,本來想用多線程的,有事就罷了。模板之家的網(wǎng)站上的url參數(shù)與頁數(shù)不匹配,懶得去做分析了,就自己改代碼中的url吧。大神勿噴!
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# by ustcwq
# 2015-03-15
import urllib,urllib2,os,time
from bs4 import BeautifulSoup
start = time.clock()
path = os.getcwd()+u'/模板之家抓取的模板/'
if not os.path.isdir(path):
os.mkdir(path)
url = "http://www.cssmoban.com/cssthemes/index_80.shtml" # 源網(wǎng)站中的index后面數(shù)字怎么編排的?
theme_url ='http://www.cssmoban.com/cssthemes/'
response = urllib2.urlopen(url)
soup = BeautifulSoup(response)
result = soup.select('p[class="title"] a')
print result
for item in result:
link = item['href']
# down_name = item.text # 文件名稱
new_url = theme_url+link.split('/')[-1]
response = urllib2.urlopen(new_url)
soup = BeautifulSoup(response)
result = soup.select('.btn a')
down_url = result[1]['href'] # 文件鏈接
local = path+time.strftime('%Y%m%d%H%M%S',time.localtime(time.time()))+'.zip'
urllib.urlretrieve(down_url, local) # 遠程保存函數(shù)
end = time.clock()
print u'模板抓取完成!'
print u'一共用時:',end-start,u'秒'
以上所述就是本文的全部內(nèi)容了,希望大家能夠喜歡。
相關(guān)文章
Python+Selenium實現(xiàn)讀取網(wǎng)易郵箱驗證碼
在自動化工作中,有可能會遇到一些發(fā)送郵箱驗證碼類似的功能。本文將利用Python?Selenium實現(xiàn)自動化讀取網(wǎng)易郵箱驗證碼,感興趣的可以了解一下2022-03-03Python中selenium_webdriver下拉框操作指南
selenium 雖然過了這么多年,但是到目前為止依然是比較流行的自動化框架了,下面這篇文章主要給大家介紹了關(guān)于Python中selenium_webdriver下拉框操作的相關(guān)資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下2022-01-01解決Jupyter Notebook使用parser.parse_args出現(xiàn)錯誤問題
這篇文章主要介紹了解決Jupyter Notebook使用parser.parse_args出現(xiàn)錯誤問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04Python中PyExecJS(執(zhí)行JS代碼庫)的具體使用
pyexecjs是一個用Python來執(zhí)行JavaScript代碼的工具庫,本文主要介紹了Python中PyExecJS(執(zhí)行JS代碼庫)的具體使用,具有一定的參考價值,感興趣的可以了解一下2024-02-02Python2中的raw_input() 與 input()
這篇文章主要介紹了Python2中的raw_input() 與 input(),本文分析了它們的內(nèi)部實現(xiàn)和不同之處,并總結(jié)了什么情況下使用哪個函數(shù),需要的朋友可以參考下2015-06-06Python使用pyforms實現(xiàn)輕松構(gòu)建GUI
pyforms是一個基于Python的GUI框架,它提供了一種簡單而強大的方式來構(gòu)建圖形用戶界面,本文將介紹pyforms的使用場景、優(yōu)勢以及常用的Python代碼案例,需要的小伙伴可以了解下2024-01-01