2010-01-22 115 views
25

httplib(現在http.client)和朋友都有conn.getresponse()和一個HTTPResponse類,但conn.getrequest()和一個HTTPRequest類的服務器端操作似乎缺乏。Python是否有解析HTTP請求和響應的模塊?

我知道BaseHTTPServer和BaseHTTPRequestHandler可以執行此功能,但他們不公開這些方法以供在模塊之外使用。

基本上我想要的是BaseHTTPRequestHandler#parse_request是一個返回HTTPRequest對象而不是填充成員變量的靜態方法。

回答

2

對於服務器端處理,你想看看像wsgiref

WSGI標準將請求解析爲包含所有相關標頭和元素的簡單字典。

2

您可能會發現WebOb有用。像Pylons,Turbogears和Bfg這樣的框架將它用作它們api的一部分。它確實在假設您正在WSGI下工作。

43

傑夫,使解析我創建基礎HTTP請求處理的小九線的子類:

from BaseHTTPServer import BaseHTTPRequestHandler 
from StringIO import StringIO 

class HTTPRequest(BaseHTTPRequestHandler): 
    def __init__(self, request_text): 
     self.rfile = StringIO(request_text) 
     self.raw_requestline = self.rfile.readline() 
     self.error_code = self.error_message = None 
     self.parse_request() 

    def send_error(self, code, message): 
     self.error_code = code 
     self.error_message = message 

現在,您可以採取字符串內的HTTP請求的文本,並通過實例解析它這個類:

# Simply instantiate this class with the request text 

request = HTTPRequest(request_text) 

print request.error_code  # None (check this first) 
print request.command   # "GET" 
print request.path    # "/who/ken/trust.html" 
print request.request_version # "HTTP/1.1" 
print len(request.headers)  # 3 
print request.headers.keys() # ['accept-charset', 'host', 'accept'] 
print request.headers['host'] # "cm.bell-labs.com" 

# Parsing can result in an error code and message 

request = HTTPRequest('GET\r\nHeader: Value\r\n\r\n') 

print request.error_code  # 400 
print request.error_message # "Bad request syntax ('GET')" 
+0

這與http://stackoverflow.com/questions/5975952/how-to-extract-http-message-body-in-basehttprequesthandler-do-post結合是非常方便的解析自己的HTTPRequest 。 – Joe 2014-08-17 15:16:01