HTTP简介
HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准(TCP)。通过使用网页浏览器、网络爬虫或者其它的工具,客户端发起一个HTTP请求到服务器上指定端口(默认端口为80)。我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储着一些资源,比如HTML文件和图像。我们称这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel)。
尽管TCP/IP协议是互联网上最流行的应用,HTTP协议中,并没有规定必须使用它或它支持的层。事实上,HTTP可以在任何互联网协议上,或其他网络上实现。HTTP假定其下层协议提供可靠的传输。因此,任何能够提供这种保证的协议都可以被其使用。因此也就是其在TCP/IP协议族使用TCP作为其传输层。
通常,由HTTP客户端发起一个请求,创建一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如"HTTP/1.1 200 OK",以及返回的内容,如请求的文件、错误消息、或者其它信息。
HTTP的请求
请求的格式
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
0、请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
1、第三部分永远都是一个回车(n)
2、动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
3、这里的路径包括「查询参数」,但不包括「锚点」
4、如果你没有写路径,那么路径默认为 /
5、第2部分中的Content-Type标注了第 4 部分的格式
用chrome来查看请求
1、打开 Network
2、地址栏输入网址
3、右键检查,选择Network,查看request,点击「view source」
HTTP的响应
响应的格式
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
- 状态码要背,是服务器对浏览器说的话
- 1xx 不常用
- 2xx 表示成功
- 3xx 表示滚吧
- 4xx 表示你丫错了
- 5xx 表示好吧,我错了
- 状态解释没什么用
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
- 第 2 部分中的 Content-Type 遵循 MIME 规范
用 Chrome 查看响应
1、打开 Network
2、输入网址
3、选中第一个响应
4、查看 Response Headers,点击「view source」,点击「view source」,点击「view source」
5、你会看到响应的前两部分
6、查看 Response 或者 Preview,你会看到响应的第 4 部分
curl命令介绍
示例
curl -X POST -s -v -H "Pig: xxx" -- "https://www.baidu.com"
请求的内容为
GET / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Pig: xxx
curl -X POST -s -v -H "Pig: xxx" -- "https://www.baidu.com"
请求的内容为
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Pig: xxx
curl -X POST -d "1234567890" -s -v -H "Pig: xxx" -- "https://www.baidu.com"
请求的内容为
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Pig: xxx
Content-Length: 10
Content-Type: application/x-www-form-urlencoded
1234567890
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。