HTTP 是一种基于请求-响应模型的网络通信协议,主要用于 Web 中客户端和服务器之间通信的数据传输。事实上,如今的互联网就是构建在 HTTP 之上的。基于请求-响应模式的通信方式很简单,客户端向服务器发送请求,服务器处理请求并进行响应。
HTTP 其实并不关心我们想要传输的是什么类型的数据,因为它什么类型的数据都可以传输!对于客户端或者服务器来说,只需要设置好合适的 Content-Type
,让另一端能够理解数据就可以了。在一个请求中,客户端发送给服务器的数据可以是文本,也可以是图片或者音视频等等。
如果客户端想在一个请求中给服务器发送多种类型的数据呢,该怎么办呢?例如,同时发送用户的基本信息和头像。方法很简单,就是使用 HTTP 的 multipart。
Multipart 消息结构
Multipart 允许客户端在一次 HTTP 请求中发送多个部分(part)数据,每部分数据之间的类型可以不同。Multipart 并不是一种专一的数据类型,它有很多子类型,例如:multipart/mixed
,multipart/form-data
等。
通俗来讲,一个 multipart 消息就是一个大包裹,包裹里面有多个不同类型的消息,每一个消息就是一个 part,每个 part 都会声明自己的消息类型(Content-Type)。除了消息类型,part 还可以附加一些元数据。
Multipart 消息的基本语法结构可以在 RFC2046 中找到:
- 每个 multipart 消息的
Content-Type
都必须包含一个叫做boundary
的参数,boundary
声明了各个 part 之间的边界,记为${boundary}
。实际上,完整的边界定义为:一行由两个-
加上${boundary}
组成的字符串。假设我们在Content-Type
里面指定的boundary=example-part-boundary
,那么按照协议规定,每个 part 之间的分隔行就是:--example-part-boundary
。 - 每个边界之后是一个
CRLF
加下一个 part 的头部信息。如果下一个 part 没有头部信息,边界之后就应该跟两个CRLF
,这样下一个 part 的消息类型就会被认为是text/plain
。 ${boundary}
不能出现在边界之间,并且长度不能超过 70 个字符。- 最后一个 part 之后的边界在末尾多了两个
-
,表示后面不会再有其它的 part 了。这个边界的完整格式为:--${boundary}--
,例如--example-part-boundary--
。
我们会在后面讲 multipart/form-data
给出一个具体的示例。
multipart/form-data
Multipart 的使用在 Web 应用程序中很常见。使用 multipart 频率最高的地方大概就是 Web 表单了,在表单提交时,文件的上传就是通过 Multipart 来实现的。
并不是所有的表单提交都会使用 multipart,如果表单只包含基于文本的输入组件(例如输入框、单选框等),浏览器会将这些数据以 key=value
的形式组织,使用一种被称为 application/x-www-form-urlencoded
的 Content-Type
传输。
如果表单中包含文件或图片等不能被编码成文本的元素,浏览器就会使用 multipart/form-data
向服务器传输数据。
下面是一个使用 multipart/form-data
传输用户信息的例子:
POST /profile HTTP/1.1
HOST: example.com
Content-Type: multipart/form-data; boundary=example-part-boundary
--example-part-boundary
Content-Disposition: form-data; name="username"
Content-Type: text/plain
Nicholas
--example-part-boundary
Content-Disposition: form-data; name="address"
Content-Type: application/json
{
"country": "China",
"city": "Beijing"
}
--example-part-boundary
Content-Disposition: form-data; name="avatar"; filename="my_avatar.jpeg"
Content-Type: image/jpeg
<binary-image data>
--example-part-boundary--
在上面这个请求中:
Content-Type: multipart/form-data; boundary=example-part-boundary
表示这个请求的的消息类型是multipart-form-data
,每个 part 之间的边界为example-part-boundary
。这个请求总共包含三个 part:
- 第一个 part 的类型为
text/plain
,它在表单上对应的key
为username
,value
为Nicholas
。 - 第二个 part 的类型为
application/json
,它在表单上对应的key
为address
。 - 第三个 part 的数据类型为
image/jpeg
,它在表单上对应的key
为avatar
,并且 part 的头部还附加了文件名相关的元数据filename="my_avatar.jpeg
。
- 第一个 part 的类型为
- 最后面的
--example-part-boundary--
表示整个 multipart 消息的结束。
总结
Multipart 是一种常见的数据格式,常用于上传文件和发送包含多种数据类型的单个请求。正确地使用 multipart 可以方便地实现多种数据的传输,提高数据传输效率和用户的使用体验,减少服务器的请求次数。
但是,在使用 multipart 的时候,客户端必须正确地设置 Content-Type
请求头,包含 boundary
参数,并且 boundary
参数的内容不能和请求体内的内容重复。服务器收到请求后,需要根据 Content-Type
设置的 boundary
来解析请求体各个部分的内容。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。