概念
http(超文本传输协议)是一个基于请求与响应模式的、无状态的、应用层的协议,常基于TCP的连接方式,HTTP1.1版本中给出一种持续连接的机制,绝大多数的Web开发,都是构建在HTTP协议之上的Web应用。
HTTP URL (URL是一种特殊类型的URI,包含了用于查找某个资源的足够的信息)的格式如下:
http://host":"port
http表示要通过HTTP协议来定位网络资源;host表示合法的Internet主机域名或者IP地址;port指定一个端口号,为空则使用缺省端口80;abs_path指定请求资源的URI;如果URL中没有给出abs_path,那么当它作为请求URI时,必须以“/”的形式给出,通常这个工作浏览器自动帮我们完成。
网络基础
1 七层网络协议(7 应用层 6 表示层 5 会话层 4 传输层 3 网络层 2 数据链路层 1 物理层)的内容。
2 每个HTTP传输都要依次经过应用层、传输层、网络层、链路层、(传输目标的)链路层、(传输目标的)网络层、(传输目标的)传输层和(传输目标的)的应用层。
http发生在应用层,但它的底层是tcp。
3 TCP的三次握手
第一次握手:客户端发送syn包(syn=j)到服务器,并进入SYN_SEND状态,等待服务器确认;
第二次握手:服务器收到syn包,必须确认客户的SYN(ack=j+1),同时自己也发送一个SYN包(syn=k),即SYN+ACK包,此时服务器进入SYN_RECV状态;
第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=k+1),此包发送完毕,客户端和服务器进入ESTABLISHED状态,完成三次握手。
握手过程中传送的包里不包含数据,三次握手完毕后,客户端与服务器才正式开始传送数据。理想状态下,TCP连接一旦建立,在通信双方中的任何一方主动关闭连接之前,TCP 连接都将被一直保持下去。
(断开连接时服务器和客户端均可以主动发起断开TCP连接的请求,断开过程需要经过“四次握手”)
4 电话原理
第一次上海的老王给北京的老张打电话,拨号码010-68886xx8老王电话机与电信局之间的电话线,其实有两个信道:信令信道 + 语音信道,当老王拿起电话,拨010-68886xx8,这个号码通过信令信道传到了电信局,同时将语音信道(DS0)保留,为了稍后的通信做语音信道预留。
电信局根据这个号码做路由查找,找到其上一级的交换机,通过信令信道将010-68886xx88转发给上一级交换机,同时和上一级协商好,预留一个DS0语音信道,为了语音传输。
这样一级级转接,最终号码转接到北京老张的电话机,振铃,北京电信局与老张电话机之间预留一个DS0语音信道,为了语音传输。
第二次老张拿起电话的那一刻,一个“Connected”信令顺着来时的信令信道(一跳、一跳)传输到老王的电话机。
第三次老王电话机通常还会回复一个“ACK”给对方,以示接到对方的“Connected”。
语音传输当老张拿起电话的那一刻,端到端的语音信道已经预留好了,一般为DS0= 64Kbps,这条端到端信道其实是由多条 hop-2-hop信道串联而成的。此时双方可以自由说话,语音数据会从保留的语音信道流淌到对方。
从以上的描述来看,信令数据、语音数据是在自己独立的信道里传输,大家井水不犯河水,互不干涉。
(例子出处,感谢作者:https://www.zhihu.com/people/...)
简单的 HTTP 协议
http协议是不保存状态的协议,因此引入了 Cookie 技术。
HTTP报文
http请求由三部分组成,分别是:请求行、消息报头、请求正文。
客户端发出请求报文,服务器发出响应报文。
客户端请求
在请求报文中,客户端使用不同的方法告知服务器意图,常用的方法有 POST 、GET
GET 请求获取Request-URI所标识的资源
POST 在Request-URI所标识的资源后附加新的数据
HEAD 请求获取由Request-URI所标识的资源的响应消息报头
PUT 请求服务器存储一个资源,并用Request-URI作为其标识
DELETE 请求服务器删除Request-URI所标识的资源
TRACE 请求服务器回送收到的请求信息,主要用于测试或诊断
CONNECT 保留将来使用
OPTIONS 请求查询服务器的性能,或者查询与资源相关的选项和需求
应用举例:
GET方法:在浏览器的地址栏中输入网址的方式访问网页时,浏览器采用GET方法向服务器获取资源,eg:GET /form.html HTTP/1.1 (CRLF)
POST方法要求被请求服务器接受附在请求后面的数据,常用于提交表单。
服务端响应
HTTP响应也是由三个部分组成,分别是:状态行、消息报头、响应正文
状态行格式如下
HTTP-Version Status-Code Reason-Phrase CRLF
其中,HTTP-Version表示服务器HTTP协议的版本;Status-Code表示服务器发回的响应状态代码;Reason-Phrase表示状态代码的文本描述。
状态代码有三位数字组成,第一个数字定义了响应的类别,且有五种可能取值:
1xx:指示信息--表示请求已接收,继续处理
2xx:成功--表示请求已被成功接收、理解、接受
3xx:重定向--要完成请求必须进行更进一步的操作
4xx:客户端错误--请求有语法错误或请求无法实现
5xx:服务器端错误--服务器未能实现合法的请求
常见状态代码、状态描述、说明:
200 OK //客户端请求成功
400 Bad Request //客户端请求有语法错误,不能被服务器所理解
401 Unauthorized //请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用
403 Forbidden //服务器收到请求,但是拒绝提供服务
404 Not Found //请求资源不存在,eg:输入了错误的URL
500 Internal Server Error //服务器发生不可预期的错误
503 Server Unavailable //服务器当前不能处理客户端的请求,一段时间后可能恢复正常
响应正文就是服务器返回的资源的内容。
消息报头
HTTP消息报头包括普通报头、请求报头、响应报头、实体报头。
每一个报头域都是由名字+“:”+空格+值 组成,消息报头域的名字是大小写无关的。
请求报头允许客户端向服务器端传递请求的附加信息以及客户端自身的信息。
eg Accept:image/gif Accept-Charset
响应报头允许服务器传递不能放在状态行中的附加响应信息,以及关于服务器的信息和对Request-URI所标识的资源进行下一步访问的信息。
eg Location Server
请求和响应消息都可以传送一个实体。一个实体由实体报头域和实体正文组成,但并不是说实体报头域和实体正文要在一起发送,可以只发送实体报头域。实体报头定义了关于实体正文(eg:有无实体正文)和请求所标识的资源的元信息。
eg Encoding:gzip
编码传输
HTTP 报文(message)一般和 HTTP实体(entity)是同一个东西。只有当传输过程中发生编码操作时,实体主体的内容发生变化,才导致它和报文主体产生差异。
常用的内容编码有:
gzip (GNU zip)
compress (UNIX 系统的标准压缩)
deflate (zlib)
identity (不进行编码)
web服务的过程
搜索自身的dns缓存
搜索操作系统的自身的dns缓存
读取本地host
浏览器发起一个dns的系统调用
找到ip地址后发起后续握手
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。