我正在使用这段代码:
import imaplib
mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(myusername, mypassword)
mail.list()
# Out: list of "folders" aka labels in gmail.
mail.select("inbox") # connect to inbox.
result, data = mail.search(None, "ALL")
ids = data[0] # data is a list.
id_list = ids.split() # ids is a space separated string
latest_email_id = id_list[-1] # get the latest
result, data = mail.fetch(latest_email_id, "(RFC822)") # fetch the email body (RFC822) for the given ID
raw_email = data[0][1] # here's the body, which is raw text of the whole email
# including headers and alternate payloads
print raw_email
它有效,除了,当我打印 raw_email
它返回一堆额外信息,我怎么能解析,比如说,额外信息并只获取发件人和正文?
原文由 Sam Tubb 发布,翻译遵循 CC BY-SA 4.0 许可协议
Python 的 电子邮件 包可能是一个不错的起点。
这应该问你问,虽然当一封电子邮件有多个部分(附件、文本和正文的 HTML 版本等)时,事情会有点复杂。
在这种情况下,
msg.is_multipart()
将返回 True,msg.get_payload()
将返回一个列表而不是字符串。 email.message 文档中有更多信息。或者,与其解析原始的 RFC822 格式的消息——如果电子邮件包含附件,它可能非常大——你可以直接向 IMAP 服务器询问你想要的信息。将您的
mail.fetch
行更改为:只会请求(并返回)来自服务器的电子邮件的 发件人 行。同样将第二个参数设置为
"(UID BODY[TEXT])"
将返回电子邮件的正文。 RFC2060 有一个应该在此处有效的参数列表。