相信大家都还记得快手“老铁”挤爆券商系统的“大动作”,足够666。
2021年刚开年,快手正式启动招股,申购情况比预测得还要火爆。认购开启仅2分钟,券商的融资额度便几乎被一抢而空,而认购页面的排队人数则还有数万人……
“手快”也抢不到的快手
让我们先来回顾下故事发生的整个过程。虎嗅网报道,当天10点30分认购开始,富途率先释放80亿港元的融资额度。短短4分钟,剩余银行融资额度就仅剩1.34万港元,而排队人数却还有4万多人。13分钟后,富途证券首日的80亿融资额度就被一抢而空。还有投资者反映,打新开始,自己刚进某券商快手打新页面,券商系统就当场表演“崩溃”,显示系统繁忙。
随后,有券商相关人士向媒体确认“宕机”,技术部门紧急修复后,系统已经正常运转。不过,对于宕机原因,技术部门也正在分析,“交易量比较大应该是原因之一”。其实,这并不是个例,还有不少券商系统有客户反映卡顿,经常掉线,导致交易不畅。
为什么快手ipo会出现券商系统崩溃?
首先,当然是快手本身属于自带流量的“网红”。券商与银行由于业务不同,科技能力建设不可同日而语,一旦遭遇快手这样的“网红”,打新页面不敌投资者高涨的热情而崩溃,就在情理之中了。
网易数帆金融解决方案专家分析,更为主要的原因,还是在于融资融券系统的稳定性保障体系建设不够。如果在流量洪峰达到之前就能准确评估当前系统的整体容量,并掌握核心链路的强弱依赖关系,同时配套相应的服务治理策略,比如限流、降级等,就能有效避免因交易回转量大带来的堵单风险。最后,即使系统出现宕机,也能够按照既定的应急预案进行恢复,最大限度保证系统的可用性。
据了解,快手打新当天释放共76亿融资额度的老虎证券,提前按蚂蚁申购人数的2倍来准备系统容量,最终扛住了压力。而富途证券认购总金额超过160亿港元,认购人数超过92000人,压力更为巨大。
针对这种情况,建议引入经过互联网验证的分布式技术架构,实现架构上的水平扩缩容。然后在分布式架构的底座上,构建一整套的稳定性保障体系,包括服务治理、容量评估、故障治理等。然而,这些基础架构能力和保障体系建设,需要基础软件层面的配合来处理复杂的技术难题,这并非券商的核心业务。
“维稳三式”让券商系统不惧网红打新
在网易数帆金融解决方案专家看来,通过服务治理、容量评估、故障治理三项措施,提供全面的稳定性保障方案,从事先预防、事中应对两个方面着手,是让券商系统能够获得内生的大并发交易处理能力,应对突发流量的狂轰乱炸,保证数字化业务服务体验的有效解决办法。网易数帆借助旗下轻舟和易测的产品能力,整合出在突发流量的狂轰乱炸中,仍能保证数字化业务服务体验的解决方案。
在服务治理方面,轻舟微服务提供了一个可插拔分布式能力框架支撑稳定性保障体系建设,这意味券商业务系统无需动大手术,即可获得先进的分布式技术底座,无论是基础的服务注册/发现,统一配置和可观测性,中级的限流、降级、灰度发布等,还是高阶的全链路标记、数据隔离、故障注入等,实现整个微服务应用生命周期的动态管控。该框架支持开源Spring Cloud、Dubbo和gRPC业务的一键托管,同时采用面向未来的设计,通过独特的Agent+Sidecar双擎模式,支持券商业务从经典的微服务框架平滑过渡到未来的服务网格。
在容量评估层面,网易数帆历经了网易电商业务多年618、双11实战大考,提供全程流程自动化的线上压测平台,压测模型能够覆盖超过93%的用户行为,通过提前粗略扩容-多轮精准扩缩容-核心服务微调-资源回收四部曲,实现了压测结果驱动资源、性能、流量三者协调,让券商能够以最低的成本来保障系统的稳定性。压测的准确性得益于全链路压测标记传递,同时数据隔离的能力保证了压测流程对业务正常响应的干扰。
针对故障治理,网易数帆也提供了包括预案管理、故障管理和故障演练的完整方案,覆盖系统级、应用级、中间件级以及自定义的故障,覆盖Kubernetes、Docker、微服务,从不同层面来解决不同的问题。
据了解,网易数帆金融解决方案已经应用于国内多家领先的大型国有银行、股份制银行以及证券公司,助力这些公司顺利开展数字化业务,在新时代的竞争中抢占先机。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。