快捷導(dǎo)航

python urllib爬取百度云連接的實例代碼

更新時間：2017年06月19日 10:22:35 作者：baddog_

本篇文章主要介紹了python urllib爬取百度云連接的實例代碼，具有一定的參考價值，感興趣的小伙伴們可以參考一下

翻看自己以前寫的程序，發(fā)現(xiàn)寫過一個爬取盤多多百度云資源的東西，完全是當(dāng)時想看變形金剛才自己寫的，而且當(dāng)時第一次接觸python大概寫了有2天才搞出來這個程序，學(xué)習(xí)python語言，可以看得出來那時候的代碼寫的真的low。雖然現(xiàn)在也不怎么樣，哈哈，一直學(xué)習(xí)中，不做過多解釋，上圖上代碼，因為變量的聲明是什么我自己也忘了（手動傲嬌），連寫入文件當(dāng)時都不會哈哈哈哈哈哈哈哈，也不知道class中可以通過init初始化，唉學(xué)習(xí)python原來我學(xué)到了這么多東西，感謝python

from bs4 import BeautifulSoup
import urllib
import requests
import re

adr =[]

''''對搜素資源名字進(jìn)行url編碼'''
search_text =raw_input('請輸入搜索資源名：')
search_text = search_text.decode('gbk')
search_text = search_text.encode('utf-8')
search_text = urllib.quote(search_text)


''''獲取文件地址'''
home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)


'''獲取百度云地址'''
def getbaidu(adr):
  for i in adr:
    url = urllib.urlopen('http://www.panduoduo.net'+i)
    bs = BeautifulSoup(url)
    bs1 = bs.select('.dbutton2')
    href = re.compile('http\%(\%|\d|\w|\/\/|\/|\.)*')
    b = href.search(str(bs1))
    name = str(bs.select('.center')).decode('utf-8')
    text1 = re.compile('\<h1\sclass\=\"center"\>[\d|\w|\D|\W]*\</h1\>')
    text2 = text1.search(name)
    rag1 = re.compile('\>[\d|\w|\D|\W]*\<')
    if text2:
      text3 = rag1.search(text2.group())
      if text3:
        print text3.group()
    if b:
      text = urllib.unquote(str(b.group())).decode('utf-8')
      print text

'''初始化'''
def init(adr):
  soup = BeautifulSoup(home)
  soup = soup.select('.row')
  pattern = re.compile('\/r\/\d+')
  for i in soup:
    i = str(i)
    adress = pattern.search(i)
    adress = adress.group()
    adr.append(adress)


print 'running---------'    
init(adr)
getbaidu(adr)

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Python Queue模塊詳細(xì)介紹及實例
這篇文章主要介紹了Python Queue模塊詳細(xì)介紹及實例的相關(guān)資料,需要的朋友可以參考下
2016-12-12
Python configparser模塊配置文件過程解析
這篇文章主要介紹了Python configparser模塊配置文件過程解析,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2020-03-03
提高python代碼運(yùn)行效率的一些建議
這篇文章主要介紹了提高python代碼運(yùn)行效率的一些建議，幫助大家優(yōu)化python代碼，提高運(yùn)行效率，感興趣的朋友可以了解下
2020-09-09
Django中自定義模型管理器(Manager)及方法
這篇文章主要介紹了Django中自定義模型管理器(Manager)及方法,本文給大家介紹的非常詳細(xì)，具有一定的參考借鑒價值，需要的朋友可以參考下
2019-09-09
Python多進(jìn)程Process和管道Pipe的使用方式
這篇文章主要介紹了Python多進(jìn)程Process和管道Pipe的使用方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2024-02-02
Python利用字典和列表實現(xiàn)學(xué)生信息管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了Python如何利用字典和列表實現(xiàn)一個簡易的學(xué)生信息管理系統(tǒng)，文中詳細(xì)注釋，方便理解，需要的可以參考一下
2022-06-06
python環(huán)境下OPenCV處理視頻流局部區(qū)域像素值
這篇文章主要為大家介紹了python環(huán)境下OPenCV處理視頻流局部區(qū)域像素值的實現(xiàn)示例，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步
2021-11-11
Python選擇網(wǎng)卡發(fā)包及接收數(shù)據(jù)包
今天小編就為大家分享一篇關(guān)于Python選擇網(wǎng)卡發(fā)包及接收數(shù)據(jù)包，小編覺得內(nèi)容挺不錯的，現(xiàn)在分享給大家，具有很好的參考價值，需要的朋友一起跟隨小編來看看吧
2019-04-04
python tkinter模塊的簡單使用
這篇文章主要介紹了python tkinter模塊的簡單使用，幫助大家更好的理解和學(xué)習(xí)使用python制作gui界面，感興趣的朋友可以了解下
2021-04-04
Python實現(xiàn)批量更換指定目錄下文件擴(kuò)展名的方法
這篇文章主要介紹了Python實現(xiàn)批量更換指定目錄下文件擴(kuò)展名的方法,結(jié)合完整實例分析了Python批量修改文件擴(kuò)展名的技巧,并對比分析了shell命令及scandir的兼容性代碼,需要的朋友可以參考下
2016-09-09