欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python實(shí)現(xiàn)郵件自動(dòng)下載的示例詳解

 更新時(shí)間:2022年07月14日 16:04:13   作者:阿濤的一天  
這篇文章主要為大家詳細(xì)介紹了如何利用Python語(yǔ)言實(shí)現(xiàn)郵件自動(dòng)下載以及附件解析功能,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下

開(kāi)始碼代碼之前,我們先來(lái)了解一下三種郵件服務(wù)協(xié)議:

1、SMTP協(xié)議

SMTP(Simple Mail Transfer Protocol),即簡(jiǎn)單郵件傳輸協(xié)議。相當(dāng)于中轉(zhuǎn)站,將郵件發(fā)送到客戶端。

2、POP3協(xié)議

POP3(Post Office Protocol 3),即郵局協(xié)議的第3個(gè)版本,是電子郵件的第一個(gè)離線協(xié)議標(biāo)準(zhǔn)。該協(xié)議把郵件下載到本地計(jì)算機(jī),不與服務(wù)器同步,缺點(diǎn)是更易丟失郵件或多次下載相同的郵件。

3、IMAP協(xié)議

IMAP(Internet Mail Access Protocol),即交互式郵件存取協(xié)議。該協(xié)議連接遠(yuǎn)程郵箱直接操作,與服務(wù)器內(nèi)容同步。

然后介紹一下email包

這個(gè)包的中心組件是代表電子郵件消息的“對(duì)象模型”。 應(yīng)用程序主要通過(guò)在 message 子模塊中定義的對(duì)象模型接口與這個(gè)包進(jìn)行交互。 應(yīng)用程序可以使用此 API 來(lái)詢問(wèn)有關(guān)現(xiàn)有電子郵件的問(wèn)題、構(gòu)造新的電子郵件,或者添加或移除自身也使用相同對(duì)象模型接口的電子郵件子組件。 也就是說(shuō),遵循電子郵件消息及其 MIME 子組件的性質(zhì),電子郵件對(duì)象模型是所有提供 EmailMessage API 的對(duì)象所構(gòu)成的樹(shù)狀結(jié)構(gòu)。

接下來(lái)我們通過(guò)具體的代碼實(shí)現(xiàn)一個(gè)登錄郵箱客戶端,下載郵件,解析郵件附件內(nèi)容的功能。

首先我們需要定義一個(gè)郵件解析的類,該類需要三個(gè)變量:

1、郵箱所屬的imap服務(wù)地址;

2、郵箱賬號(hào);

3、郵箱密碼【注:不同郵箱需要不同的安全策略,例如qq郵箱需要短信驗(yàn)證,獲取登錄授權(quán)碼,而不是明文密碼去登錄遠(yuǎn)程客戶端】

class Email_parse:

    def __init__(self,remote_server_url,email_url,password):
    	# imap服務(wù)地址
        self.remote_server_url = remote_server_url
        # 郵箱賬號(hào)
        self.email_url = email_url
        # 郵箱密碼
        self.password = password

然后定義類中入口函數(shù),登錄遠(yuǎn)程,默認(rèn)獲取第一頁(yè)所有的郵件。我們獲取郵件的主題,并打印出來(lái)【不同郵件主題的編碼可能不同,二進(jìn)制需要轉(zhuǎn)碼才能正確顯示】

    def main_parse_Email(self):
        """入口函數(shù),登錄imap服務(wù)"""
        server = imaplib.IMAP4_SSL(self.remote_server_url, 993)
        server.login(self.email_url, self.password)
        server.select('INBOX')
        status,data = server.search(None,"ALL")
        if status != 'OK':
            raise Exception('read email error')
        emailids = data[0].split()
        mail_counts = len(emailids)
        print("count:",mail_counts)
        # 郵件的遍歷是按時(shí)間從后往前,這里我們選擇最新的一封郵件
        for i in range(mail_counts - 1, mail_counts - 2, -1):
            status, edata = server.fetch(emailids[i], '(RFC822)')
            msg = email.message_from_bytes(edata[0][1])
            #獲取郵件主題title
            subject = email.header.decode_header(msg.get('subject'))
            if type(subject[-1][0]) == bytes:
                title = subject[-1][0].decode(str(subject[-1][1]))
            elif type(subject[-1][0]) == str:
                title = subject[-1][0]
            print("title:", title)

其中,msg變量保存的就是郵件的主體,接下來(lái)因?yàn)闀?huì)重復(fù)用到msg和tilte,我們將構(gòu)造一個(gè)類函數(shù)返回msg和title。

    def get_email_title(msg):
        subject = email.header.decode_header(msg.get('subject'))
        if type(subject[-1][0]) == bytes:
            title = subject[-1][0].decode(str(subject[-1][1]))
        elif type(subject[-1][0]) == str:
            title = subject[-1][0]
        print("title:", title)
        return title

解析郵件,我們分為兩部分,郵件正文【HTML】和附件【xlsx等】,判斷有附件,我們就保存到固定的路徑下。表格的解析不再贅述了,pandas之類的包足以搞定。

    def get_att(msg):
        """獲取附件并下載"""
        filename = Email_parse.get_email_name(msg)
        for part in msg.walk():
            file_name = part.get_param("name")
            if file_name:
                data = part.get_payload(decode=True)
                if data != None:
                    att_file = open('./src/' + filename, 'wb')
                    att_file.write(data)
                    att_file.close()
                else:
                    pass

郵件正文內(nèi)容,我們直接解析html,將文本內(nèi)容直接保存到.txt文件中,方便讀取。

    def get_text_from_HTML(msg):
        """獲取郵件中的html"""
        filename = Email_parse.get_email_name(msg)
        current_title = Email_parse.get_email_title(msg)
        print("filename:",filename,type(filename))
        for part in msg.walk():
            if not part.is_multipart():
                result = part.get_payload(decode=True)
                result = result.decode('gbk')
                f = open(f'./src/{current_title}.txt','w')
                f.write(result)
                f.close()
                return result

完整代碼如下:

import email
import imaplib
from email.header import decode_header
import pandas as pd
import datetime


class Email_parse:
    def __init__(self,remote_server_url,email_url,password):
        self.remote_server_url = remote_server_url
        self.email_url = email_url
        self.password = password

    def get_att(msg):
        filename = Email_parse.get_email_name(msg)
        for part in msg.walk():
            file_name = part.get_param("name")
            if file_name:
                data = part.get_payload(decode=True)
                if data != None:
                    att_file = open('./src/' + filename, 'wb')
                    att_file.write(data)
                    att_file.close()
                else:
                    pass

    def get_email_title(msg):
        subject = email.header.decode_header(msg.get('subject'))
        if type(subject[-1][0]) == bytes:
            title = subject[-1][0].decode(str(subject[-1][1]))
        elif type(subject[-1][0]) == str:
            title = subject[-1][0]
        print("title:", title)
        return title


    def get_email_name(msg):
        for part in msg.walk():
            file_name = part.get_param("name")
            if file_name:
                h = email.header.Header(file_name)
                dh = email.header.decode_header(h)
                filename = dh[0][0]
                if dh[0][1]:
                    value, charset = decode_header(str(filename, dh[0][1]))[0]
                    if charset:
                        filename = value.decode(charset)
                        print("附件名稱:", filename)
                        return filename


    def main_parse_Email(self):
        server = imaplib.IMAP4_SSL(self.remote_server_url, 993)
        server.login(self.email_url, self.password)
        server.select('INBOX')
        status,data = server.search(None,"ALL")
        if status != 'OK':
            raise Exception('read email error')
        emailids = data[0].split()
        mail_counts = len(emailids)
        print("count:",mail_counts)
        for i in range(mail_counts - 1, mail_counts - 2, -1):
            status, edata = server.fetch(emailids[i], '(RFC822)')
            msg = email.message_from_bytes(edata[0][1])
            subject = email.header.decode_header(msg.get('subject'))
            if type(subject[-1][0]) == bytes:
                title = subject[-1][0].decode(str(subject[-1][1]))
            elif type(subject[-1][0]) == str:
                title = subject[-1][0]
            print("title:", title)
            Email_parse.get_att(msg)
            Email_parse.get_text_from_HTML(msg)


    def get_text_from_HTML(msg):
        filename = Email_parse.get_email_name(msg)
        current_title = Email_parse.get_email_title(msg)
        print("filename:",filename,type(filename))
        for part in msg.walk():
            if not part.is_multipart():
                result = part.get_payload(decode=True)
                result = result.decode('gbk')
                f = open(f'./src/{current_title}.txt','w')
                f.write(result)
                f.close()
                return result

if __name__ == "__main__":
    remote_server_url = 'imap.qq.com'
    email_url = "*********@qq.com"
    password = "**********"
    demo = Email_parse(remote_server_url,email_url,password)
    demo.main_parse_Email()

運(yùn)行結(jié)果:

以上就是Python實(shí)現(xiàn)郵件自動(dòng)下載的示例詳解的詳細(xì)內(nèi)容,更多關(guān)于Python郵件自動(dòng)下載的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • python xlwt模塊的使用解析

    python xlwt模塊的使用解析

    這篇文章主要介紹了python xlwt模塊的使用解析,幫助大家更好的理解和學(xué)習(xí)使用python,感興趣的朋友可以了解下
    2021-04-04
  • 基于Python實(shí)現(xiàn)wifi連接小程序

    基于Python實(shí)現(xiàn)wifi連接小程序

    這篇文章主要為大家詳細(xì)介紹了如何使用Python編程語(yǔ)言編寫(xiě)一個(gè)簡(jiǎn)單的連接Wi-Fi的程序,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下
    2024-01-01
  • Python實(shí)現(xiàn)視頻字幕時(shí)間軸格式轉(zhuǎn)換的示例

    Python實(shí)現(xiàn)視頻字幕時(shí)間軸格式轉(zhuǎn)換的示例

    本文主要介紹了Python實(shí)現(xiàn)視頻字幕時(shí)間軸格式轉(zhuǎn)換的示例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2023-11-11
  • 搭建pypi私有倉(cāng)庫(kù)實(shí)現(xiàn)過(guò)程詳解

    搭建pypi私有倉(cāng)庫(kù)實(shí)現(xiàn)過(guò)程詳解

    這篇文章主要介紹了搭建pypi私有倉(cāng)庫(kù)實(shí)現(xiàn)過(guò)程詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
    2020-11-11
  • Pandas進(jìn)行數(shù)據(jù)編碼的十種方式總結(jié)

    Pandas進(jìn)行數(shù)據(jù)編碼的十種方式總結(jié)

    在機(jī)器學(xué)習(xí)中,很多算法都需要我們對(duì)分類特征進(jìn)行轉(zhuǎn)換(編碼),即根據(jù)某一列的值,新增(修改)一列。本文為大家總結(jié)了Pandas中十種數(shù)據(jù)編碼的方式,需要的可以參考一下
    2022-04-04
  • pygame加載中文名mp3文件出現(xiàn)error

    pygame加載中文名mp3文件出現(xiàn)error

    本文主要介紹了pygame加載中文名mp3文件出現(xiàn)error的解決方案。具有很好的參考價(jià)值,下面跟著小編一起來(lái)看下吧
    2017-03-03
  • keras處理欠擬合和過(guò)擬合的實(shí)例講解

    keras處理欠擬合和過(guò)擬合的實(shí)例講解

    這篇文章主要介紹了keras處理欠擬合和過(guò)擬合的實(shí)例講解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-05-05
  • Python中使用matplotlib繪制各類圖表示例詳解

    Python中使用matplotlib繪制各類圖表示例詳解

    這篇文章主要給大家介紹了關(guān)于Python中使用matplotlib繪制各類圖表的相關(guān)資料,matplotlib是python的一個(gè)庫(kù),內(nèi)部?jī)?chǔ)存了大量的函數(shù)用于繪制圖像,通常會(huì)與pandas和numpy庫(kù)一起使用,平常我們通常只是用里面的pyplot模塊,需要的朋友可以參考下
    2023-10-10
  • 一文帶你吃透Python中的日期時(shí)間模塊

    一文帶你吃透Python中的日期時(shí)間模塊

    Python?提供了?日期和時(shí)間模塊用來(lái)處理日期和時(shí)間,還可以用于格式化日期和時(shí)間等常見(jiàn)功能。這篇文章就來(lái)帶大家了解一下它的使用,需要的可以參考一下
    2023-02-02
  • python 刪除系統(tǒng)中的文件(按時(shí)間,大小,擴(kuò)展名)

    python 刪除系統(tǒng)中的文件(按時(shí)間,大小,擴(kuò)展名)

    這篇文章主要介紹了python 如何刪除系統(tǒng)中的文件,分別按時(shí)間,大小,擴(kuò)展名刪除,滿足不同需求,感興趣的朋友可以了解下
    2020-11-11

最新評(píng)論