摘要
在互联网大厂面试过程中关于计算机中网络常问的一个问题就是关于传输层里面的协议:TCP协议,TCP协议规定了网络通信中点对点的通信,基于PORT寻址到对应的主机上的某一个应用程序(一个网络数据包过来之后,由于各个应用程序是共用一块网卡接收网络数据包数据,所以为了确认此网络数据包到底是发给我本机的哪个应用程序的呢?QQ、微信、钉钉等,因而引出了TCP协议基于port的点对点通信,TCP协议定一个一套规范,实际电脑网络通信的过程中使用的是底层实现了tcp协议的编程规范的socket来进行点对点通信),TCP协议进行通信的关键步骤:点对点建立连接(TCP三次握手)、流失拆分数据传输、点对点释放连接(TCP四次挥手)。
面试题分析
1、画一下TCP三次握手的流程图?为啥是三次而不是二次或者四次呢?然后连环炮追问,说一下TCP四次握手的过程?
背景
我们常用的使用tcp协议编程主要是:socket编程,比如netty、java nio、socket等;基于ip地址加端口号进行点对点通信时候其实是非常基础的。会经历一个tcp的3次握手过程建立连接、然后传输数据,最后经过四次挥手释放连接。
内容
三次握手主要是传递报头数据:ACK,SYN,ack,seq;
1_TCP三次握手/四次分手传递报头数据说明
TCP数据包由包头跟数据组成;包头主要由发送方端口跟接收方端口组成,以及每次我发送的数据包的起始字节数据序号seq,以及对每次发送者的确认号ack;
TCP的3次握手是在进行数据传输发送前的准备工作,所以只需要交换一些头部信息(说明性描述信息),所以我们先弄清楚下信息交换的描述性信息:
序列号: TCP数据包的第一个字节数据
编号(TCP把连接中发送的所有数据字节都编上一个序号,占4个字节,32位,用来标记数据段的顺序)。
确认号ack:期待收到对方下一个报文段的第一个数据字节的序号
()。
确认ACK:用来限定说明确认号ack.仅当ACK=1时,确认号字段才有效。ACK=0时,确认号无效(占1位)。
同步SYN: 建立连接时候的同步序列,当SYN=1,ACK=0时表示:这是一个连接请求报文段(若同意连接,则在响应报文段中使得SYN=1,ACK=1。因此,SYN=1表示这是一个连接请求,或连接接受报文。SYN这个标志位只有在TCP建产连接时才会被置1,握手完成后SYN标志位被置0)。
终止FIN:用来释放一个连接
。FIN=1表示:此报文段的发送方的数据已经发送完毕,并要求释放运输连接。
注
:ACK、SYN和FIN这些大写的单词表示标志位,其值要么是1,要么是0;ack、seq小写的单词表示序号。
2_TCP三次握手图解.
理清画出tcp三次握手的核心思路:交换数据+进入的状态
。
第一次握手:客户端主动发起连接请求,发送:SYN=1,ACK=0,seq=x,此时客户端进入SYN-SENT(同步发送)状态。
第二次握手:服务端接收到客户端发起连接请求,然后回复同意建立连接:SYN=1,ACK=1,ack=x+1,seq=y,此时服务端进入:SYN-RCVD(同步接收状态)。
第三次握手:客户端收到服务端统一建立连接的请求,然后发送准备就绪:ACK=1,ack=y+1,seq=x+1(因为已经建立了连接,所以不再发送SYN,而ACK=1是确保ack有效的),此时客户端进入ESTA-BLISHED状态,服务端收到数据之后也会进入ESTA-BLISHED状态。然后进入数据传输。
3_TCP四次握手图解
第一次挥手:客户端在ESTA-BLISHED已连接的状态下发起释放连接请求:FIN=1,seq=u,此时客户端进入FIN-WAIT1(终止等待状态1),此时客户端不再发送数据。
第二次挥手:服务端在接受到连接释放请求后,发送确认消息:ACK=1,ack=u+1,seq=v;此时服务端进入关闭等待状态,此时服务端会通知应用程序做连接关闭的准备工作.客户端收到确认消息之后进入FIN-WAIT2(终止等待2状态)。
第三次挥手:服务端做完连接关闭准备工作之后,通知服务端发送连接关闭请求给客户端:FIN=1,seq=w;此时服务端进入LAST-ACK状态。
第四次挥手:客户端接受到服务端的连接释放消息之后发送确认消息:ACK=1,ack=w+1,seq=u+1,此时客户端进入时间等待状态,在2MSL时间段内,关闭连接进入连接TIME_WAIT时间等待状态。服务端收到消息之后进入CLOSED。
4_常见面试题扩展
1、传输层数据发送都需要建立连接吗?说说TCP跟UDP协议的区别?
为什么需要握手这个操作,能不能不握手?在网络上发送数据包事可以不用握手的,使用握手的原理仅仅是为了满足在不可靠信道上可靠地传输信息
;对于主机电脑网卡而言,不同主机间发送数据包,先发的数据A并不一定比后发的数据B先到。只是TCP协议会做特殊处理而已。
如果读者对比一下UDP的通信流程和TCP的通信流程,可以发现:在UDP协议中,是没有握手这个操作的。
这里就引出了TCP与UDP的一个基本区别,TCP是可靠通信协议,而UDP是不可靠通信协议。
TCP的可靠性含义:接收方收到的数据是完整,有序,无差错的。
UDP不可靠性含义:接收方接收到的数据可能存在部分丢失,顺序也不一定能保证。
UDP和TCP协议都是基于同样的互联网基础设施,且都基于IP协议实现,互联网基础设施中对于数据包的发送过程是会发生丢包现象的,为什么TCP就可以实现可靠传输而UDP不行?
TCP 协议为了实现可靠传输,通信双方需要判断自己已经发送的数据包是否都被接收方收到,如果没收到,就需要重发。为了实现这个需求,很自然地就会引出序号(sequence number) 和 确认号(acknowledgement number)的使用。
发送方在发送数据包(假设大小为10byte)时,同时送上一个序号(假设为100),那么接收方收到这个数据包以后,就可以回复一个确认号(110 = 100 + 10) 告诉发送方 “我已经收到了你的数据包, 你可以发送下一个数据包序号从 110 开始” 。
2、TCP连接握手为啥是三次而不是二次或者四次呢?
原理:在不可靠信道上可靠地传输信息
.
可靠消息传输是基于我们的ack:确认号实现的,假如我们采用2次握手,client端发送建立连接请求后,server端收到消息之后,发送确认收到消息之后就分配资源等待client端发送数据,会存在在不可靠的网络通道下,client端发送了数据包A然后又发送了数据包B,由于网络原因,后发送的数据包B先到达,然后server端收到数据包之后给其分配资源,准备接收数据,此时client跟server端就正常发送数据。但是由于后面达到的数据包A又到达建立连接,此时server端就会再次分配资源。但是此时client端已经可以正常发送数据,已经进入了连接建立状态所以不再理会server端的资源分配,这样的话,在信道不可靠的情况下,多个请求发送时候会创建大量连接请求,服务端资源浪费。因为3次握手已经可以建立连接了不需要4次。
延伸
:三次握手不是TCP本身的要求, 而是为了满足"在不可靠信道上可靠地传输信息"这一需求所导致的. 请注意这里的本质需求,信道不可靠, 数据传输要可靠. 三次达到了, 那后面你想接着握手也好, 发数据也好, 跟进行可靠信息传输的需求就没关系了. 因此,如果信道是可靠的, 即无论什么时候发出消息, 对方一定能收到, 或者你不关心是否要保证对方收到你的消息, 那就能像UDP那样直接发送消息就可以了。
3、为什么TCP连接断开是4次分手,而不是3次或者5次?
TCP的4次挥手为了保证资源的准确释放,前两次分手是确保client端发送的释放请求被服务端接收到,后两次分手是为了server确保自己资源释放请求client端已经收到。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,"你发的FIN报文我收到了"。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。
为什么不是3次:因为服务端资源释放是有一个相对的过程,如果3次分手就关闭关联的话,应用程序可能还没有收到连接关闭请求。
4、为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态?
虽然按道理,四个报文都发送完毕,我们可以直接进入CLOSE状态了,但是我们必须假象网络是不可靠的,有可以最后一个ACK丢失。所以TIME_WAIT状态就是用来重发可能丢失的ACK报文。在Client发送出最后的ACK回复,但该ACK可能丢失。Server如果没有收到ACK,将不断重复发送FIN片段。所以Client不能立即关闭,它必须确认Server接收到了该ACK。Client会在发送出ACK之后进入到TIME_WAIT状态。Client会设置一个计时器,等待2MSL的时间。如果在该时间内再次收到FIN,那么Client会重发ACK并再次等待2MSL。所谓的2MSL是两倍的MSL(Maximum Segment Lifetime)。MSL指一个片段在网络中最大的存活时间,2MSL就是一个发送和一个回复所需的最大时间。如果直到2MSL,Client都没有再次收到FIN,那么Client推断ACK已经被成功接收,则结束TCP连接。
5、如果已经建立了连接,但是客户端突然出现故障了怎么办?
TCP设有一个保活计时器,客户端如果出现故障,服务器不能一直等下去白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器,时间通常是设置为2小时,若两小时还没有收到客户端的任何数据,服务器就会发送一个探测报文段,以后每隔75秒钟发送一次。若一连发送10个探测报文仍然没反应,服务器就认为客户端出了故障,接着就关闭连接。
6、TCP链接数据包到达顺序如何保证?
网络数据包是不一定先发先到,但是对于TCP有一点特殊,若我们接受的数据包是在应用层,并且应用层用的是TCP的传输协议的话,这个顺序是保证,这个顺序的保证是在传输层保证的:
client发生数据A,B给server,使用的TCP传输,client发送毫无疑问是先发送A,然后发送B,虽然A跟B在物理层走的链路不一样,传输速度不一样,B是会比A先到达Server,这个是没有错的,但是这个数据包被接受是在网络层跟传输层。网络跟传输层的作用,网络层是保证同一个包的完整,如果传输层发出的包过大,在网络层(也就是IP层)会被分包;同时在Sever的网络接受的时候会被组包,有一个完整的包才会交给传输层,若包不完整是会丢弃,同时他也不保证你的包的是否达到,数据包的保证是在传输层做的,就是说若传输层(TCP协议才会,UDP并不保证)没有收到对方的确认包,会有超时重传,每个数据包也是有序列号的,同时,传输层就是根据这个序列号来保证A,B包的顺序,即使B比A先到达了,TCP也会是等A到达之后,先把A提交给应用层,再把B的数据提交给应用层,从而保证了,同一条TCP链接,先发的包先到.
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。