如何在 (py)curl 中获取 HTTP 状态消息?

新手上路,请多包涵

花一些时间研究 pycurl 和 libcurl 文档,我仍然找不到一种(简单的)方法,如何在 pycurl 中获取 HTTP 状态消息(原因短语)。

状态码很简单:

 import pycurl
import cStringIO

curl = pycurl.Curl()
buff = cStringIO.StringIO()
curl.setopt(pycurl.URL, 'http://example.org')
curl.setopt(pycurl.WRITEFUNCTION, buff.write)
curl.perform()

print "status code: %s" % curl.getinfo(pycurl.HTTP_CODE)
# -> 200

# print "status message: %s" % ???
# -> "OK"

原文由 mykhal 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 795
2 个回答

我自己找到了一个解决方案,它可以满足我的需要,但可以更健壮(适用于 HTTP)。

它基于一个事实,即 pycurl.HEADERFUNCTION 获取的捕获标头包括状态行。

 import pycurl
import cStringIO
import re

curl = pycurl.Curl()

buff = cStringIO.StringIO()
hdr = cStringIO.StringIO()

curl.setopt(pycurl.URL, 'http://example.org')
curl.setopt(pycurl.WRITEFUNCTION, buff.write)
curl.setopt(pycurl.HEADERFUNCTION, hdr.write)
curl.perform()

print "status code: %s" % curl.getinfo(pycurl.HTTP_CODE)
# -> 200

status_line = hdr.getvalue().splitlines()[0]
m = re.match(r'HTTP\/\S*\s*\d+\s*(.*?)\s*$', status_line)
if m:
    status_message = m.groups(1)
else:
    status_message = ''

print "status message: %s" % status_message
# -> "OK"

原文由 mykhal 发布,翻译遵循 CC BY-SA 2.5 许可协议

这是一个旧线程,但我来这里是为了寻找类似的信息。如果它只是您要查找的状态代码,例如 200、404、500 等,那么只需执行以下操作:

your_curl_handle.getinfo(pycurl.RESPONSE_CODE)

它应该返回一个数字状态代码:)

原文由 Kalabaaz 发布,翻译遵循 CC BY-SA 3.0 许可协议

推荐问题