iLogtail使用入门-iLogtail本地配置模式部署(For Kafka Flusher)

2022-01-10
阅读 7 分钟
简介:iLogtail使用入门-iLogtail本地配置模式部署(For Kafka Flusher)阿里已经正式开源了可观测数据采集器iLogtail。作为阿里内部可观测数据采集的基础设施,iLogtail承载了阿里巴巴集团、蚂蚁的日志、监控、Trace、事件等多种可观测数据的采集工作。​
封面图

企业如何从 0 到 1 构建整套全链路追踪体系

2022-01-05
阅读 9 分钟
简介:本文将分享 ARMS 在全链路追踪领域的最佳实践,分享主要分为四部分。首先,是对分布式链路追踪的整体简介。其次,是对 ARMS 在分布式链路追踪领域的核心能力进行介绍。然后,介绍如何从 0 到 1 构建整套全链路追踪体系。最后,介绍一些最佳实践案例。
封面图

链路分析 K.O “五大经典问题”

2021-12-20
阅读 3 分钟
提起链路追踪,大家会很自然的想到使用调用链排查单次请求的异常,或使用预聚合的链路统计指标进行服务监控与告警。其实,链路追踪还有第三种玩法:相比调用链,它能够更快的定界问题;相比预聚合的监控图表,它可以更灵活的实现自定义诊断。那就是基于明细链路数据的后聚合分析,简称链路分析。
封面图

技术揭秘:从双11看实时数仓Hologres高可用设计与实践

2021-12-13
阅读 9 分钟
2021年阿里巴巴双11完美落下为帷幕,对消费者来说是一场购物盛宴,对背后的业务支撑技术人来说,更是一场年度大考。在这场大考中,一站式实时数仓Hologres以每秒11.2亿条的高速写入,和每秒1.1亿次的查询峰值(包含点查和OLAP查询),交出了满意的答卷,稳定高效地支撑了阿里巴巴双11核心应用场景。
封面图

如何形成统一设计风格-实践篇

2021-12-10
阅读 9 分钟
简介:在上一篇《业务团队如何统一架构设计风格?》中,探讨了一种业务架构的设计规范,以期达到这些目标:用标准约束技术细节;用技术工具而非文档推行标准;持续重构而非造新轮子;重视业务建模。但通篇表述较为抽象。本篇将总结团队近来的架构演进工作,以更具体的技术细节,详细阐释该理念,作为“统一业务设计风格”...
封面图

Dubbo-Admin 正式支持 3.0 服务治理

2021-12-06
阅读 6 分钟
简介:Dubbo 相信大家并不陌生,是一款微服务开发框架,它提供了 RPC 通信与微服务治理两大关键能力。大家在日常开发中更多使用的是 Dubbo 提供的 RPC 通信这一部分能力,而对其提供的服务治理的能力使用相对少一些,本文的重点将放在服务治理这方面。Dubbo 框架提供了极其丰富的服务治理的功能如流量控制、动态配置、服...
封面图

如何利用 “集群流控” 保障微服务的稳定性?

2021-12-02
阅读 4 分钟
简介:应用高可用服务 AHAS (Application High Availability Service) 是经阿里巴巴内部多年高可用体系沉淀下来的云产品,以流量与容错为切入点,从流量控制、不稳定调用隔离、熔断降级、热点流量防护、系统自适应保护、集群流控等多个维度来帮助保障服务的稳定性,同时提供秒级的流量监控分析功能。
封面图

代理网关设计与实现(基于NETTY)

2021-11-26
阅读 28 分钟
简介:本文重点在代理网关本身的设计与实现,而非代理资源的管理与维护。作者 | 新然来源 | 阿里技术公众号一 问题背景平台端购置一批裸代理,来做广告异地展现审核。从外部购置的代理,使用方式为:通过给定的HTTP 的 API 提取代理 IP:PORT,返回的结果会给出代理的有效时长 3~5 分钟,以及代理所属地域;从提取的代理...
封面图

重拾面向对象软件设计

2021-11-25
阅读 8 分钟
简介: 从上个世纪五十年代冯·诺依曼创造第一台计算机开始,一直到现在只有短短70年时间,从第一门计算机语言FORTRAN,到现在我们常用的C++,JAVA,PYTHON等,计算机语言的演进速度远超我们所使用的任何一门自然语言。从最早的面向机器,再到面向过程,到演化为现在我们所使用的面向对象。不变的是编程的宗旨,变化的是...
封面图

阿里可观测性数据引擎的技术实践

2021-11-25
阅读 10 分钟
简介:相比传统的告警、监控,可观测性能够以更加“白盒”的方式看透整个复杂的系统,帮助我们更好的观察系统的运行状况,快速定位和解决问题。就像发动机而言,告警只是告诉你发动机是否有问题,而一些包含转速、温度、压力的仪表盘能够帮我们大致确定是哪个部分可能有问题,而真正定位细节问题还需要观察每个部件的传感...
封面图

解决 Serverless 落地困难的关键,是给开发者足够的“安全感”

2021-11-24
阅读 5 分钟
简介:越来越多的云产品都会向全托管、Serverless 形态演进。当云的产品体系 Serverless 化达到一个临界值,通过函数计算这样的 Serverless 计算服务结合其他 Serverless 形态的云服务,能够完整的实现整个应用时,Serverless 就会变成了一个确定的技术趋势,并越来越流行。
封面图

Cloudera CDP 企业数据云测试开通指导

2021-11-24
阅读 2 分钟
简介: 基于阿里云部署的 Cloudera CDP 企业数据云平台已经进入公测阶段,本文详细介绍了相关试用/试用流程。基于阿里云部署的 Cloudera CDP 企业数据云平台已经进入公测阶段,如对该平台感兴趣,可以使用下面的流程进行试用。如需要直接使用,请参考下面的流程:每家阿里云企业认证的企业可以申请一次云服务器代金券和3...
封面图

离线实时一体化数仓与湖仓一体—云原生大数据平台的持续演进

2021-11-23
阅读 4 分钟
简介: 阿里云智能研究员 林伟 :阿里巴巴从湖到仓的演进给我们带来了湖仓一体的思考,使得湖的灵活性、数据种类丰富与仓的可成长性和企业级管理得到有机融合,这是阿里巴巴最佳实践的宝贵资产,是大数据的新一代架构。
封面图

函数计算GB镜像秒级启动:下一代软硬件架构协同优化揭秘

2021-11-22
阅读 4 分钟
简介: 优化镜像加速冷启动大致分为两种做法:降低绝对延迟和降低冷启动概率。自容器镜像上线以来我们已经通过镜像加速技术,分阶段降低了绝对延迟。本文在此基础上,介绍借助函数计算下一代IaaS底座神龙裸金属和安全容器,进一步降低绝对延迟且能够大幅降低冷启动频率。
封面图

Spring Cloud Gateway一次请求调用源码解析

2021-11-22
阅读 6 分钟
简介: 最近通过深入学习Spring Cloud Gateway发现这个框架的架构设计非常简单、有效,很多组件的设计都非常值得学习,本文就Spring Cloud Gateway做一个简单的介绍,以及针对一次请求Spring Cloud Gateway的处理流程做一个较为详细的分析。
封面图

首次!统一调度系统规模化落地,全面支撑阿里巴巴双 11 全业务

2021-11-19
阅读 3 分钟
简介: 今年双 11 首次规模化亮相的统一调度,通过一套调度协议、一套系统架构,统一管理底层的计算、存储、网络资源,超大规模、高效率、自动化的资源弹性,实现了业界新的突破。在离线混部、离在线混部、新的快上快下技术,减少数万台服务器采购,带来数亿计的资源成本优化和大促效率提升。
封面图

面对DNS劫持,只能坐以待毙吗?

2021-11-19
阅读 4 分钟
DNS 劫持作为最常见的网络攻击方式,是每个站长或者运维团队最为头疼的事情。苦心经营的网站受到 DNS 劫持后,不仅会影响网站流量、权重,还会让用户置身于危险之中,泄露隐私造成财产损失。
封面图

前沿分享|阿里云资深技术专家 魏闯先:AnalyticDB PostgreSQL年度新版本发布

2021-11-18
阅读 4 分钟
简介: 本篇内容为2021云栖大会-云原生数据仓库AnalyticDB技术与实践峰会分论坛中,阿里云资深技术专家 魏闯先关于“AnalyticDB PostgreSQL年度新版本发布”的分享。
封面图

阿里云消息队列 RocketMQ 5.0 全新升级:消息、事件、流融合处理平台

2021-11-01
阅读 4 分钟
简介: RocketMQ5.0 的发布标志着阿里云消息从消息领域正式迈向了“消息、事件、流”场景大融合的新局面。未来阿里云消息产品的演进也将继续围绕消息、事件、流核心场景而开展。
封面图

ArrayList源码浅析

2021-10-22
阅读 4 分钟
简介: ArrayList作为我们开发中最常用的集合,作为极高频次使用的类,我们不妨阅读源码一谈究竟。前言ArrayList作为我们开发中最常用的集合,作为极高频次使用的类,我们不妨阅读源码一谈究竟。介绍ArrayList继承关系如下AaaryList主要实现了List接口,同时标记为可以序列化Serializable、可复制CloneAble、支持随机访...
封面图

GRPC: 如何实现分布式日志跟踪?

2021-10-21
阅读 8 分钟
简介: 本文将介绍如何在 gRPC 分布式场景中,实现 API 的日志跟踪。介绍本文将介绍如何在 gRPC 分布式场景中,实现 API 的日志追踪。什么是 API 日志追踪?一个 API 请求会跨多个微服务,我们希望通过一个唯一的 ID 检索到整个链路的日志。我们将会使用 rk-boot 来启动 gRPC 服务。请访问如下地址获取完整教程:[链接][...
封面图

10年后,阿里给千万开源人写了一封信

2020-01-15
阅读 2 分钟
阿里妹导读:年末将至,阿里巴巴开源技术委员会负责人贾扬清写了一封信,想要和热爱开源的你说一声:谢谢。未来,我们希望与更多开源人一起,用技术普惠世界。

F1 Query: Declarative Querying at Scale

2020-01-14
阅读 8 分钟
距离 Google 的上一篇 F1 论文,也就是 F1: A Distributed SQL Database That Scales 已经 5 年过去了,Google 在今年的 VLDB 上终于发布了 F1 的新版本 F1 Query: Declarative Querying at Scale,我们今天就来看一下这篇论文。安利一下,在 PingCAP 的 paper party 上,黄东旭,主页链接大神对这篇论文的讲解非常精彩...

瓜子二手车在 Dubbo 版本升级、多机房方案方面的思考和实践

2020-01-03
阅读 7 分钟
随着瓜子业务的不断发展,系统规模在逐渐扩大,目前在瓜子的私有云上已经运行着数百个 Dubbo 应用,上千个 Dubbo 实例。瓜子各部门业务迅速发展,版本没有来得及统一,各个部门都有自己的用法。随着第二机房的建设,Dubbo 版本统一的需求变得越发迫切。几个月前,公司发生了一次与 Dubbo 相关的生产事故,成为了公司 基...

读懂这本书,才算读懂阿里大数据

2020-01-02
阅读 11 分钟
2019年,是阿里巴巴第11个双11。众所周知,阿里的电商在线体系经过多年发展,可以支持峰值超过每秒50几万笔交易。但鲜有人知的是,海量的交易,创造了海量的数据,爆炸性的数据量激增,给狂欢过后的大数据处理,带来了大难题。

Fuxi2.0—飞天大数据平台调度系统全面升级,首次亮相2019双十一

2019-12-27
阅读 10 分钟
伏羲(Fuxi)是十年前创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 ODPS,分布式调度 Fuxi),当时的设计初衷是为了解决大规模分布式资源的调度问题(本质上是多目标的最优匹配问题)。

10亿计算下的合约广告,如何做个性化投放?

2019-12-27
阅读 7 分钟
合约保量广告(Guaranteed Delivery)是一种常见的品牌展示广告采买方式,现有的技术解决方案通常是在人群粒度上对问题进行抽象和建模,这种建模方式一方面忽略了相同人群下用户行为的差异,另一方面无法对用户粒度的约束进行精确的控制。

阿里腾讯今日头条纷纷翻牌子,ClickHouse到底有什么本事?

2019-12-23
阅读 7 分钟
今日头条 内部用ClickHouse来做用户行为分析,内部一共几千个ClickHouse节点,单集群最大1200节点,总数据量几十PB,日增原始数据300TB左右。

惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

2019-12-20
阅读 5 分钟
阿里妹导读:云计算场景下的大规模分布式系统中,网络异常、磁盘IO异常、时钟跳变、操作系统异常乃至软件本身可能存在bugs等,均给分布式系统正确运行带来了挑战。持续的监控报警完善是打造稳定高可用分布式系统过程中非常重要的工作,这个也就要求我们研发同学从细节处入手,本文将介绍的场景是针对线上报警的一丝异常...

Spark整合Ray思路漫谈

2019-12-20
阅读 6 分钟
之前花了大概两到三天把Ray相关的论文,官网文档看了一遍,同时特意去找了一些中文资料看Ray当前在国内的发展情况(以及目前国内大部分人对Ray的认知程度)。