作者:云原生可观测在上云开始使用云产品过程中,企业一定遇见过两件“讨厌”事:难以理解的复杂计费逻辑,时常冒出“这也能收费”的感叹;某个配置参数调节之后,云产品使用成本不可预估的暴涨。可观测作为企业 IT 运维必须品,在应对不同可观测场景时提供了非常多产品,以及与之对应的计费模式,供企业灵活选择。但如果产...
作者:陈昆仪(图杨)每个运维工程师都躲不开的噩梦为了更代入感地解读业务场景,这里我们以运维工程师小 A 的视角来开始今天的解读。年轻有为的运维工程师 小 A 刚接手公司最核心业务系统的稳定性保障工作。但他发现这个任务非常具有挑战性,可以说是噩梦。1)有没有合适工具,告诉小 A 应该对哪些指标配告警?这个系统非...
众所周知,随着时间的推移,算力成为了 AI 行业演进一个不可或缺的因素。在数据量日益庞大、模型体量不断增加的今天,企业对分布式算力和模型训练效率的需求成为了首要的任务。如何更好的、更高效率的以及更具性价比的利用算力,使用更低的成本来训练不断的迭代 AI 模型,变成了迫切需要解决的问题。而分布式训练的演进...
以 GPT(Generative Pre-trained Transformer)和 Diffusion model 为代表的大语言模型(Large language model,LLM)和生成式人工智能(Generative artificial intelligence,GAI)在过往两年,将人们对 AI 的梦想与期待推向了一个新高峰。这一次,AI 带来的“智能”效果和“涌现”能力,吸引着千行百业都在积极思考如何在...