本文已收录在Github
github.com/Geekhyt,感谢Star。
观感度:?????
口味:黑糖珍珠
烹饪时间:15min
前端圈技术的爆发式增长随之而来的开发人员学不动的疲惫感、焦虑感和不想跳出舒适圈的拖延懒惰。
jQuery华丽谢幕,React v16已经普及、Angular9和Vue3即将发布。三大框架越来越贴近WebComponents标准。
TypeScript遍地开花,小程序日益火爆,快应用/PWA紧随其后……
站在浪潮之巅的我们最需要的是停下来思考,轰轰烈烈的技术本质是什么?
其实,轰轰烈烈的技术本质,是基础知识和核心概念。
看你这篇题目的文章,是要讲HTTP咯?HTTP那么简单,我们大家每天都用,有什么好讲的?
在停下来思考技术本质的同时,我们也要不断的提高自己的认识层次,你所谓的简单是因为你没有听到“遥远的哭声”。
(shout out to 男神黄执中)
有请我们今天的主角登场:HTTP
我将带你从HTTP的历史发展到各版本迭代主要特性来从全局的角度重新认识HTTP。
HTTP的世界观
先来明确一下时间线,回到30年前的那个春天。
一切的一切都始于1989年的3月,万维网之父蒂姆·伯纳斯·李(Tim Berners-Lee)的一篇论文,创造了万维网,创造了HTTP。
- 1991年
HTTP/0.9
发布 (没有RFC,版本号是后加上去的) - 1996年5月
HTTP/1.0
在RFC1945发布 - 1997年1月
HTTP/1.1
发布 RFC2616是当前最新版本 - 2014年
HTTP/1.1
再次修订,将大文档拆分为六份较小的文档,
- 2015年
HTTP/2
发布 RFC7540 (基于谷歌的SPDY协议) - 2018年,互联网标准化组织
IETF
提议将HTTP over QUIC
更名为HTTP/3
如果希望全面的了解 HTTP/3
,推荐 Daniel Stenberg(CURL 作者)的HTTP/3详解
当然如果你想看最新同步的中文,可以看我翻译的版本。
欢迎指正错误和StarHTTP/3详解中文版
纵观HTTP的历史发展长河,究其原因,是技术和需求一直在推动着它的发展。
HTTP是什么?
HTTP是一个在计算机世界里专门在两点之间传输文字、图片、音频、视频等超文本数据的约定和规范。
HTTP通常跑在TCP/IP协议栈
之上,依靠IP协议实现寻址和路由
、TCP协议实现可靠数据传输
、DNS协议实现域名查找
、SSL/TLS协议实现安全通信
。当然,WebSocket、HTTPDNS依赖于HTTP。
HTTP/0.9
GET/index.html
HTTP/0.9
当时是为了学术交流,基于请求和响应的模式,在网络中传输HTML超文本的内容。
如上所示,只有一个请求行,没有HTTP请求头和请求体。同样,服务器也没有响应头信息,只是返回了数据。
因为都是HTML格式的文件,决定了返回的文件内容通过ASCII字符流进行传输。
HTTP/1.0
1994年低开启拨号上网,网景也在同年推出了第一款浏览器,人们对万维网的需求不再仅局限于学术交流。
W3C和HTTP工作组HTTP-WG也在这个时代创建。为了满足人们对浏览器的需求(不光是HTML,还有CSS、JS、图片、音视频等),文件格式不再局限于ASCII编码。
HTTP/1.0
的解决办法是引入了请求头和响应头。
accept: text/html
accept-encoding: gzip, deflate, br
accept-Charset: ISO-8859-1,utf-8
accept-language: zh-CN,zh
同时也引入了状态码,为了减轻服务器的压力,提供了Cache机制。服务器需要统计客户端的基础信息(Windows 和 macOS),加入了用户代理字段。
HTTP/1.1
改进持久连接
一个TCP连接上可以传输多个HTTP请求,只要浏览器或者服务器没有断开连接,该TCP会一直保持。
持久连接是默认开启的,如果想要关闭,在请求头中加上Connection:close即可关闭。
目前浏览器中对于同一个域名,默认允许同时建立6个TCP持久连接。
不成熟的HTTP管线化
HTTP/1.1
中试图通过管线化的技术来解决队头阻塞的问题。但是因为各种原因,被各大厂商放弃治疗了。
增加对虚拟主机的支持
HTTP/1.0
中每个域名都只绑定唯一的IP地址,因此一个服务器只能支持一个域名。
但是随着虚拟主机技术的发展,一台物理主机上绑定多个虚拟主机的需求大大提升,每个虚拟主机都有自己单独的域名,这些单独的域名都公用同一个IP地址。
因此,请求头中也增加了Host字段,表示当前的域名地址,服务器可根据不同的Host值做不同的处理。
增加对动态生产内容的支持
HTTP/1.0
需要在响应头中设置完整的数据大小Content-Length:900,这样,浏览器就可以根据设置的数据大小来接收数据。
由于服务器端技术发展,页面都是动态生成的,传输数据之前并不知道最终数据大小,
导致浏览器不知道何时会接受完所有的文件数据。
HTTP/1.1
通过引入Chunk transfer机制来解决问题,服务器将数据分割成若干个任意大小的数据块,每个数据块发送时会附上上一个数据块的长度,最后使用一个长度为0的块作为发送数据完成的标志。
客户端Cookie、安全机制
HTTP1.1
引入了客户端Cookie机制和安全机制。
HTTP/2
HTTP/1.1的缺陷
对带宽的利用率不理想
三个问题导致
- TCP 的慢启动
- 同时开启了多条 TCP 连接,那么这些连接会竞争固定的带宽
-
HTTP/1.1
队头阻塞的问题
HTTP/2多路复用
HTTP/2
使用多路复用机制解决了上述问题。
一个域名只使用一个 TCP 长连接和消除队头阻塞问题。通过引入二进制分帧层,实现了 HTTP 的多路复用技术。
HTTP/2服务器推送
服务器可以提前将数据推送到浏览器,浏览器有权选择是否接受。浏览器发送RST_STREAM帧可以选择拒收。
HTTP/2头部压缩
头部的压缩大大的提升了传输效率。HTTP/2开发了“HPACK”算法,在客户端和服务器建立“字典”,用索引号表示重复的字符串,还采用哈夫曼编码来压缩整数和字符串。
HTTP/2可以设置请求的优先级
可以设置让某些重要的数据优先被服务器处理并返回。
HTTP/3
HTTP/2的缺陷
TCP的队头阻塞
在 TCP 传输过程中,由于单个数据包的丢失而造成的阻塞称为 TCP 上的队头阻塞。HTTP/2
只解决了应用层面的队头阻塞,队头阻塞的问题还存在于TCP协议本身。
TCP建立连接的延时
TCP
以及TCP+TLS
建立连接的所产生的延时也是影响传输效率的一个主要因素。
TCP协议僵化
中间件僵化
我们把在互联网的各处搭建的设备叫做中间设备(中间件),比如路由器、NAT、防火墙、交换机等,它们通常依赖一些很少升级的软件,这些软件使用了大量的 TCP 特性,设置之后便很少进行更新。这就对我们我们更新TCP的时候造成了很大的困难,
新协议的数据包经过这些中间件时,它们不会去理解包的内容从而丢弃掉这些数据包。
操作系统
因为 TCP 协议都是通过操作系统内核来实现的,应用程序只能使用不能修改。通常操作系统的更新都滞后于软件的更新,所以想要更新操作系统内核中的TCP协议也是非常困难的。
QUIC协议
HTTP/3
选择了一个折衷的方法——UDP 协议,基于 UDP 实现了类似于 TCP 的多路数据流、传输可靠性等功能,我们把这套功能称为QUIC 协议。
- 实现了类似 TCP 的流量控制、传输可靠性的功能
- 集成了 TLS 加密功能
- 实现了 HTTP/2 中的多路复用功能
- 实现了快速握手功能
关于HTTP/3更多详细的内容,请移步我翻译成中文版的HTTP/3详解。
欢迎Star仓库链接和提出错误或不对的地方。
参考:
《浏览器工作原理与实践》
《透视HTTP协议》
《趣谈网络协议》
《Web协议详解与抓包实战》
交流
欢迎关注我的个人公众号,优质文章将同步推送。
你的前端食堂,记得按时吃饭。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。