关于高并发的两个问题?

1.都说要负载均衡,但是一开始的时候总得有一个服务器和客户端建立连接,并通知客户端和哪个负载服务器建立连接,或者把客户端的请求转交给负载服务器。那么一开始的大数据量的连接请求和数据传输是如何处理的?
我的猜测:是不是处理千万级的Tcp socket连接并不存在问题?这里有一篇文章。
还有一开始进行负载均衡需要传输的数据量比较少,所以也不存在问题?

2.面试的时候问到一个问题,怎么设计一个IM的登陆系统,同时处理千万级的并发登陆。如果我上面的猜想是正确的,那么是不是一台性能比较强的服务器就能处理登陆请求?因为登陆的数据量并不大。真正占用服务器资源的是登陆后的业务逻辑操作。

阅读 5.8k
4 个回答

我把你的两个问题合并起来回答吧。
第一,你想的方向没问题,但是如果一个服务器同时维护千万级的TCP连接(即C10M Problem),是一件非常困难的事情,需要kernel支持/在用户态里实现TCP协议解析与Procedure调度减小开销。譬如如果你针对每一个连接开一个线程去处理,那么在常见的x86 Linux server每个线程上需要4k的空间,那么你至少需要数十G的内存来处理,还不算线程里需要给你程序开辟的空间。
第二,登录这个过程也许client发给server的数据包不大,但是server处理过程是需要耗时的(更新DB等)。和上面一点相似,所以不会把这个流程放在一个server里处理。

以上均没有考虑服务可用性等因素,你可以想象下如果这个这个server单点压力过大crash了该怎么办呢。

这个还涉及到了一些网络基础知识,有空补个长文来填填这个坑。。

这个地方我们谈高并发是在谈什么?

为什么作负载均衡的处理量会高于放在后面的服务器?

其实服务器的连接数是受网络限制的,硬件,系统,网络状况,都会成为限制条件。服务器所能承载的并发,你可以理解成一个餐馆,一个餐馆就只能坐那么多人,如果你是快餐,来的人多去的人快,在单位时间内的人流量就大,如果你是精致的西餐,出菜慢,单位时间人流量就小。
人流量就是并发,而做菜时间就是我们的响应时间。

这就是为什么服务器会有并发上限,需要开分店增加并发量。

那么为什么负载均衡可以承接更多的流量呢?

负载均衡也是一台服务器,他的并发量也有上限,负载均衡是街边小摊,1分钟做好打包拿走。

负载均衡也有小部分业务,检测后端状态,转发请求,但是相比你后面的业务要去读写 SQL,Redis 什么的,那就简单太多,也就快太多。

当然如果业务量大了也是要上集群的。。这肯定是必然的。

这样解释起来,你可能理解起来要容易些,0 - 0 至于里面比较深的网络问题,以后开长文详细解释吧。。

一个服务器专门处理你说的连接问题,就是负载均衡啊。nginx+php普通服务器每秒上百个页面,但是如果那台服务器只用来做nginx的转发功能,每秒上万个都是小意思。

理论:

在整个网络里,只要某一级设备,对后一级设备有负载均衡功能,那么从后一级开始就可以搭建负载均衡系统了。

实际:

在现实中,用户居住地、办公室、厂房等,接入运营商线路,然后运营商的这些线路汇集到第一台网络设备。这种设备自身没有负载均衡功能,性能不够时只能更换为性能更强的设备。这种设备,对后面的设备,有负载均衡功能,因此负载均衡系统就这么构建起来了。

后面继续下去应该是运营商机房的网络设备 -> 地区DNs -> 互联网公司的运营商接入线路 -> 互联网公司的流量转发设备 -> 互联网公司的业务处理设备。后面的这些节点,每一级都可以做负载均衡。

案例:

有了上面两个例子,你要做的那个登录服务器就很简单了,直接做服务器集群来负载均衡就行。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏