在Python中使用poplib模塊收取郵件的教程
SMTP用于發(fā)送郵件,如果要收取郵件呢?
收取郵件就是編寫一個MUA作為客戶端,從MDA把郵件獲取到用戶的電腦或者手機上。收取郵件最常用的協(xié)議是POP協(xié)議,目前版本號是3,俗稱POP3。
Python內(nèi)置一個poplib模塊,實現(xiàn)了POP3協(xié)議,可以直接用來收郵件。
注意到POP3協(xié)議收取的不是一個已經(jīng)可以閱讀的郵件本身,而是郵件的原始文本,這和SMTP協(xié)議很像,SMTP發(fā)送的也是經(jīng)過編碼后的一大段文本。
要把POP3收取的文本變成可以閱讀的郵件,還需要用email模塊提供的各種類來解析原始文本,變成可閱讀的郵件對象。
所以,收取郵件分兩步:
第一步:用poplib把郵件的原始文本下載到本地;
第二部:用email解析原始文本,還原為郵件對象。
通過POP3下載郵件
POP3協(xié)議本身很簡單,以下面的代碼為例,我們來獲取最新的一封郵件內(nèi)容:
import poplib
# 輸入郵件地址, 口令和POP3服務(wù)器地址:
email = raw_input('Email: ')
password = raw_input('Password: ')
pop3_server = raw_input('POP3 server: ')
# 連接到POP3服務(wù)器:
server = poplib.POP3(pop3_server)
# 可以打開或關(guān)閉調(diào)試信息:
# server.set_debuglevel(1)
# 可選:打印POP3服務(wù)器的歡迎文字:
print(server.getwelcome())
# 身份認(rèn)證:
server.user(email)
server.pass_(password)
# stat()返回郵件數(shù)量和占用空間:
print('Messages: %s. Size: %s' % server.stat())
# list()返回所有郵件的編號:
resp, mails, octets = server.list()
# 可以查看返回的列表類似['1 82923', '2 2184', ...]
print(mails)
# 獲取最新一封郵件, 注意索引號從1開始:
index = len(mails)
resp, lines, octets = server.retr(index)
# lines存儲了郵件的原始文本的每一行,
# 可以獲得整個郵件的原始文本:
msg_content = '\r\n'.join(lines)
# 稍后解析出郵件:
msg = Parser().parsestr(msg_content)
# 可以根據(jù)郵件索引號直接從服務(wù)器刪除郵件:
# server.dele(index)
# 關(guān)閉連接:
server.quit()
用POP3獲取郵件其實很簡單,要獲取所有郵件,只需要循環(huán)使用retr()把每一封郵件內(nèi)容拿到即可。真正麻煩的是把郵件的原始內(nèi)容解析為可以閱讀的郵件對象。
解析郵件
解析郵件的過程和上一節(jié)構(gòu)造郵件正好相反,因此,先導(dǎo)入必要的模塊:
import email from email.parser import Parser from email.header import decode_header from email.utils import parseaddr
只需要一行代碼就可以把郵件內(nèi)容解析為Message對象:
msg = Parser().parsestr(msg_content)
但是這個Message對象本身可能是一個MIMEMultipart對象,即包含嵌套的其他MIMEBase對象,嵌套可能還不止一層。
所以我們要遞歸地打印出Message對象的層次結(jié)構(gòu):
# indent用于縮進顯示:
def print_info(msg, indent=0):
if indent == 0:
# 郵件的From, To, Subject存在于根對象上:
for header in ['From', 'To', 'Subject']:
value = msg.get(header, '')
if value:
if header=='Subject':
# 需要解碼Subject字符串:
value = decode_str(value)
else:
# 需要解碼Email地址:
hdr, addr = parseaddr(value)
name = decode_str(hdr)
value = u'%s <%s>' % (name, addr)
print('%s%s: %s' % (' ' * indent, header, value))
if (msg.is_multipart()):
# 如果郵件對象是一個MIMEMultipart,
# get_payload()返回list,包含所有的子對象:
parts = msg.get_payload()
for n, part in enumerate(parts):
print('%spart %s' % (' ' * indent, n))
print('%s--------------------' % (' ' * indent))
# 遞歸打印每一個子對象:
print_info(part, indent + 1)
else:
# 郵件對象不是一個MIMEMultipart,
# 就根據(jù)content_type判斷:
content_type = msg.get_content_type()
if content_type=='text/plain' or content_type=='text/html':
# 純文本或HTML內(nèi)容:
content = msg.get_payload(decode=True)
# 要檢測文本編碼:
charset = guess_charset(msg)
if charset:
content = content.decode(charset)
print('%sText: %s' % (' ' * indent, content + '...'))
else:
# 不是文本,作為附件處理:
print('%sAttachment: %s' % (' ' * indent, content_type))
郵件的Subject或者Email中包含的名字都是經(jīng)過編碼后的str,要正常顯示,就必須decode:
def decode_str(s):
value, charset = decode_header(s)[0]
if charset:
value = value.decode(charset)
return value
decode_header()返回一個list,因為像Cc、Bcc這樣的字段可能包含多個郵件地址,所以解析出來的會有多個元素。上面的代碼我們偷了個懶,只取了第一個元素。
文本郵件的內(nèi)容也是str,還需要檢測編碼,否則,非UTF-8編碼的郵件都無法正常顯示:
def guess_charset(msg):
# 先從msg對象獲取編碼:
charset = msg.get_charset()
if charset is None:
# 如果獲取不到,再從Content-Type字段獲取:
content_type = msg.get('Content-Type', '').lower()
pos = content_type.find('charset=')
if pos >= 0:
charset = content_type[pos + 8:].strip()
return charset
把上面的代碼整理好,我們就可以來試試收取一封郵件。先往自己的郵箱發(fā)一封郵件,然后用瀏覽器登錄郵箱,看看郵件收到?jīng)],如果收到了,我們就來用Python程序把它收到本地:
運行程序,結(jié)果如下:
+OK Welcome to coremail Mail Pop3 Server (163coms[...]) Messages: 126. Size: 27228317 From: Test <xxxxxx@qq.com> To: Python愛好者 <xxxxxx@163.com> Subject: 用POP3收取郵件 part 0 -------------------- part 0 -------------------- Text: Python可以使用POP3收取郵件……... part 1 -------------------- Text: Python可以<a href="...">使用POP3</a>收取郵件……... part 1 -------------------- Attachment: application/octet-stream
我們從打印的結(jié)構(gòu)可以看出,這封郵件是一個MIMEMultipart,它包含兩部分:第一部分又是一個MIMEMultipart,第二部分是一個附件。而內(nèi)嵌的MIMEMultipart是一個alternative類型,它包含一個純文本格式的MIMEText和一個HTML格式的MIMEText。
小結(jié)
用Python的poplib模塊收取郵件分兩步:第一步是用POP3協(xié)議把郵件獲取到本地,第二步是用email模塊把原始郵件解析為Message對象,然后,用適當(dāng)?shù)男问桨燕]件內(nèi)容展示給用戶即可。
- python email smtplib模塊發(fā)送郵件代碼實例
- Python使用email模塊對郵件進行編碼和解碼的實例教程
- python中使用smtplib和email模塊發(fā)送郵件實例
- 用smtplib和email封裝python發(fā)送郵件模塊類分享
- python通過imaplib模塊讀取gmail里郵件的方法
- 使用Python3 poplib模塊刪除服務(wù)器多天前的郵件實現(xiàn)代碼
- Python使用poplib模塊和smtplib模塊收發(fā)電子郵件的教程
- Python網(wǎng)絡(luò)編程之使用email、smtplib、poplib、imaplib模塊收發(fā)郵件
相關(guān)文章
詳解Python Matplotlib解決繪圖X軸值不按數(shù)組排序問題
這篇文章主要介紹了詳解Python Matplotlib解決繪圖X軸值不按數(shù)組排序問題,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08
教你掌握分布式訓(xùn)練PyTorch?DDP到Accelerate到Trainer
這篇文章主要為大家介紹了教你掌握分布式訓(xùn)練PyTorch?DDP到Accelerate到Trainer2023-02-02
基于python實現(xiàn)rpc遠(yuǎn)程過程調(diào)用
本文主要介紹了基于python實現(xiàn)rpc遠(yuǎn)程過程調(diào)用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-06-06
Python 用Redis簡單實現(xiàn)分布式爬蟲的方法
本篇文章主要介紹了Python 用Redis簡單實現(xiàn)分布式爬蟲的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-11-11
python批量實現(xiàn)Word文件轉(zhuǎn)換為PDF文件
這篇文章主要為大家詳細(xì)介紹了python批量實現(xiàn)Word文件轉(zhuǎn)換為PDF文件的方法,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-03-03

