欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

python爬取豆瓣電影TOP250數(shù)據(jù)

 更新時(shí)間:2021年05月22日 17:16:01   作者:秋無(wú)之地  
這次以豆瓣電影TOP250網(wǎng)為例編寫(xiě)一個(gè)爬蟲(chóng)程序,并將爬取到的數(shù)據(jù)(排名、電影名和電影海報(bào)網(wǎng)址)存入MySQL數(shù)據(jù)庫(kù)中。

在執(zhí)行程序前,先在MySQL中創(chuàng)建一個(gè)數(shù)據(jù)庫(kù)"pachong"。

import pymysql
import requests
import re


#獲取資源并下載
def resp(listURL):
    #連接數(shù)據(jù)庫(kù)
    conn = pymysql.connect(
        host = '127.0.0.1',
        port = 3306,
        user = 'root',
        password = '******',  #數(shù)據(jù)庫(kù)密碼請(qǐng)根據(jù)自身實(shí)際密碼輸入
        database = 'pachong', 
        charset = 'utf8'
    )

    #創(chuàng)建數(shù)據(jù)庫(kù)游標(biāo)
    cursor = conn.cursor()

    #創(chuàng)建列表t_movieTOP250(執(zhí)行sql語(yǔ)句)
    cursor.execute('create table t_movieTOP250(id INT PRIMARY KEY 												auto_increment NOT NULL ,movieName VARCHAR(20) NOT NULL 									,pictrue_address VARCHAR(100))')

    try:
        # 爬取數(shù)據(jù)
        for urlPath in listURL:
            # 獲取網(wǎng)頁(yè)源代碼
            response = requests.get(urlPath)
            html = response.text

            # 正則表達(dá)式
            namePat = r'alt="(.*?)" src='
            imgPat = r'src="(.*?)" class='

            # 匹配正則(排名【用數(shù)據(jù)庫(kù)中id代替,自動(dòng)生成及排序】、電影名、電影海報(bào)(圖片地址))
            res2 = re.compile(namePat)
            res3 = re.compile(imgPat)
            textList2 = res2.findall(html)
            textList3 = res3.findall(html)

            # 遍歷列表中元素,并將數(shù)據(jù)存入數(shù)據(jù)庫(kù)
            for i in range(len(textList3)):
                cursor.execute('insert into t_movieTOP250(movieName,pictrue_address) 									VALUES("%s","%s")' % (textList2[i],textList3[i]))

        #從游標(biāo)中獲取結(jié)果
        cursor.fetchall()

        #提交結(jié)果
        conn.commit()
        print("結(jié)果已提交")

    except Exception as e:
        #數(shù)據(jù)回滾
        conn.rollback()
        print("數(shù)據(jù)已回滾")

    #關(guān)閉數(shù)據(jù)庫(kù)
    conn.close()

#top250所有網(wǎng)頁(yè)網(wǎng)址
def page(url):
    urlList = []
    for i in range(10):
        num = str(25*i)
        pagePat = r'?start=' + num + '&filter='
        urL = url+pagePat
        urlList.append(urL)
    return urlList


if __name__ == '__main__':
    url = r"https://movie.douban.com/top250"
    listURL = page(url)
    resp(listURL)

結(jié)果如下圖:

以上就是我的分享,如果有什么不足之處請(qǐng)指出,多交流,謝謝!

以上就是python爬取豆瓣電影TOP250數(shù)據(jù)的詳細(xì)內(nèi)容,更多關(guān)于python爬取豆瓣電影的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Python對(duì)列表去重的多種方法(四種方法)

    Python對(duì)列表去重的多種方法(四種方法)

    開(kāi)發(fā)中對(duì)數(shù)組、列表去重是非常常見(jiàn)的需求,對(duì)一個(gè)list中的id進(jìn)行去重,有下面幾種方法,具體內(nèi)容詳情大家參考下本文
    2017-12-12
  • Python如何查看兩個(gè)數(shù)據(jù)庫(kù)的同名表的字段名差異

    Python如何查看兩個(gè)數(shù)據(jù)庫(kù)的同名表的字段名差異

    這篇文章主要介紹了Python如何查看兩個(gè)數(shù)據(jù)庫(kù)的同名表的字段名差異,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • Windows系統(tǒng)下多版本pip的共存問(wèn)題詳解

    Windows系統(tǒng)下多版本pip的共存問(wèn)題詳解

    這篇文章主要給大家介紹了關(guān)于在Windows系統(tǒng)下多版本pip的共存問(wèn)題,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考借鑒,下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。
    2017-10-10
  • Python裝飾器基礎(chǔ)概念與用法詳解

    Python裝飾器基礎(chǔ)概念與用法詳解

    這篇文章主要介紹了Python裝飾器基礎(chǔ)概念與用法,結(jié)合實(shí)例形式詳細(xì)分析了Python裝飾器的概念、功能、用法及相關(guān)操作注意事項(xiàng),需要的朋友可以參考下
    2018-12-12
  • pandas處理csv文件的方法步驟

    pandas處理csv文件的方法步驟

    這篇文章主要介紹了pandas處理csv文件的方法步驟,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-10-10
  • Python進(jìn)階之迭代器與迭代器切片教程

    Python進(jìn)階之迭代器與迭代器切片教程

    迭代器是 Python 中獨(dú)特的一種高級(jí)特性,而切片也是一種高級(jí)特性,兩者相結(jié)合,會(huì)產(chǎn)生什么樣的結(jié)果呢,需要的朋友可以參考下
    2020-01-01
  • Python刪除指定目錄下過(guò)期文件的2個(gè)腳本分享

    Python刪除指定目錄下過(guò)期文件的2個(gè)腳本分享

    這篇文章主要介紹了Python刪除指定目錄下過(guò)期文件2個(gè)腳本分享,可以用在如刪除指定日期前的日志文件,需要的朋友可以參考下
    2014-04-04
  • 對(duì)python實(shí)現(xiàn)二維函數(shù)高次擬合的示例詳解

    對(duì)python實(shí)現(xiàn)二維函數(shù)高次擬合的示例詳解

    今天小編就為大家分享一篇對(duì)python實(shí)現(xiàn)二維函數(shù)高次擬合的示例詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-12-12
  • Python繪制時(shí)鐘的示例代碼

    Python繪制時(shí)鐘的示例代碼

    這篇文章主要介紹了如何利用Python和Pygame庫(kù)繪制一個(gè)簡(jiǎn)單的時(shí)鐘效果。文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定幫助,需要的可以參考一下
    2022-02-02
  • 使用Python實(shí)現(xiàn)在Windows下安裝Django

    使用Python實(shí)現(xiàn)在Windows下安裝Django

    今天小編就為大家分享一篇關(guān)于使用Python實(shí)現(xiàn)在Windows下安裝Django,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧
    2018-10-10

最新評(píng)論