python中常見的5種框架解讀

更新時(shí)間：2022年12月19日 08:40:33 作者：__淡墨青衫__

這篇文章主要介紹了python中常見的5種框架，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方，望不吝賜教

python常見的框架有哪些

1.scrapy框架

scrapy框架是一套比較成熟的python爬蟲框架，是使用python開發(fā)的快速、高層次的信息爬取框架，可以高效率地爬取web頁面并提取出我們關(guān)注的結(jié)構(gòu)化數(shù)據(jù)。

scrapy框架的應(yīng)用領(lǐng)域有許多，比如網(wǎng)絡(luò)爬蟲，數(shù)據(jù)挖掘、數(shù)據(jù)監(jiān)測(cè)、自動(dòng)化測(cè)試等。

scrapy框架是一套開源的框架，開源也就意味著我們能夠看到并且免費(fèi)試用scrapy的所有代碼。

2.crawley框架

crawley也是使用python開發(fā)出來的一款爬蟲框架，該框架致力于改變?nèi)藗儚幕ヂ?lián)網(wǎng)中提取數(shù)據(jù)的方式，讓大家可以更高效地從互聯(lián)網(wǎng)中爬取對(duì)應(yīng)內(nèi)容。

crawley框架的主要特點(diǎn)有：

1>高速爬取對(duì)應(yīng)網(wǎng)站內(nèi)容
2> 可以將爬取到內(nèi)容輕松地存儲(chǔ)到數(shù)據(jù)庫中，比如：postgres，mysql，oracle，sqlite等數(shù)據(jù)庫
3>可以將爬取到的數(shù)據(jù)導(dǎo)出為json，xml等格式
4>支持非關(guān)系型數(shù)據(jù)庫，比如：mongodb，couchdb等
5>支持使用命令行工具
6>可以使用你喜歡的工具提取數(shù)據(jù)，比如使用xpath或者pyquery等工具
7>支持使用cookie登陸并訪問哪些只有登陸才能夠訪問的網(wǎng)頁
8>簡(jiǎn)單易學(xué)

3.portia框架

portia框架是一款允許沒有任何編程基礎(chǔ)的用戶可視化地爬取網(wǎng)頁的爬蟲框架，給出你要爬取的網(wǎng)頁中感興趣的數(shù)據(jù)內(nèi)容，通過portia框架，可以將你所需要的信息從相似的網(wǎng)頁中自動(dòng)提取出來，如果需要，可以子啊github上的主頁進(jìn)行獲取。

如果需要，上百度自己查吧，具體的我就不寫了。