如何部署自己的webhook admission

2020-04-28
阅读 17 分钟
4.2k
在之前的文章中,我们讲过webhook admission是什么以及如何在代码中实现一个webhook admission。今天我们主要讲下,如何在kubernetes中部署自己的webhook admission。

Kubernetes网络模型

2020-04-26
阅读 11 分钟
2.3k
Kubernetes旨在在一组机器集群上运行分布式系统。分布式系统的本质使网络成为Kubernetes部署的核心和必要组成部分,并且了解Kubernetes网络模型将使您能够正确运行,监视和故障排除在Kubernetes上运行的应用程序。

利用Prometheus 打造企业分布式监控平台(9)--最后的洼地Alertmanager

2020-04-24
阅读 2 分钟
2.4k
AlertManager用于处理客户端应用程序(如Prometheus)的警报。它还负责对警报进行重复数据删除,分组以及将其路由到其他收件人(例如电子邮件,Slack,Pager Duty)。

利用Prometheus 打造企业分布式监控平台(8)--VictoriaMetrics集群

2020-04-24
阅读 4 分钟
3.6k
在之前的系列文章中,我们讲到了一个远程存储对于企业级Prometheus的重要性,以及Thanos和VictoriaMetrics的对比。今天我们主要讲VictoriaMetrics,包括集群部署和如何与Prometheus结合。

利用Prometheus 打造企业分布式监控平台(7)--Thanos和VictoriaMetrics

2020-04-24
阅读 5 分钟
3.9k
本文主要从数据写入和数据查询作为切入点,对比Thanos和VictoriaMetrics,包括以下几个维度: 安装和运维复杂性 可靠性和可用性 一致性 性能表现 可扩展性 关于Thanos和VictoriaMetrics的架构,大家可以参考利用Prometheus 打造企业分布式监控平台(3)--远程读写之战。这里就不再重复讲述了。 数据写入 安装和运维复杂性 ...

利用Prometheus 打造企业分布式监控平台(6)--使用Telegraf解放Exporters运维

2020-04-23
阅读 5 分钟
6.7k
Prometheus的生态中,Exporter扮演了重要的角色。对于“知名”应用程序,服务器或数据库,Prometheus官方提供了足够多的Exporters。这也是Prometheus监视目标的主要方式。

利用Prometheus 打造企业分布式监控平台(5)--数据模型

2020-04-23
阅读 3 分钟
1.7k
Prometheus 从根本上来说将数据存储为时间序列。除了存储的时间序列外,Prometheus可能会生成临时派生的时间序列作为查询结果。Prometheus可与键值对配合使用。键以数值形式描述要测量的值,而值将实际测量值存储为数字。

利用Prometheus 打造企业分布式监控平台(4)--Recording Rules

2020-04-23
阅读 3 分钟
2.4k
在讲述什么是Recording Rules之前,让我们想想是否我们在使用Pronetheus过程中,遇到类似的场景:随着时间的推移,Prometheus中存储的指标数量增加了,查询的频次也增加了,在做一些复杂的查询的时候,经常会因为超时而导致Grafana中的图无法渲染。更坏的情况是,在你选择了较长时间维度的情况下,Prometheus 会OOM。

利用Prometheus 打造企业分布式监控平台(3)--远程读写之战

2020-04-20
阅读 3 分钟
4.6k
Prometheus远程读写存储是一个热门话题,已经存在了数个系统(Cortex,M3DB,InfluxDB),并且在过去的几个月中已经诞生了一些系统(Thanos,VictoriaMetrics)。每个系统都有自己的架构和不同的使用场景。

利用Prometheus 打造企业分布式监控平台(2)--服务发现

2020-04-20
阅读 5 分钟
2.3k
服务发现在Wikipedia的描述是:Service discovery is the automatic detection of devices and services offered by these devices on a computer network.

利用Prometheus 打造企业分布式监控平台(1)--扩展性

2020-04-19
阅读 3 分钟
4.3k
Prometheus是CNCF基金会管理的一个开源监控项目,由于其良好的架构设计和完善的生态,迅速成为了监控领域事实上的标准,尤其是在云原生领域。

通过WASM和Rust扩展Envoy

2020-04-18
阅读 5 分钟
4.3k
尽管如此,与Istio一样,每种网格实现仍以自己的速度继续发展,由于Google和IBM支持Istio,所以Istio在与功能相关的所有方面均领先于竞争对手。但是可惜-在版本1.5之前,Istio还因项目开发初期做出的许多体系结构决策而导致的性能问题而闻名。性能瓶颈的主要根源之一是名为Mixer的组件。它在网状网络中的主要职责包括执...

拥抱K8S:将ZooKeeper迁移到Kubernetes

2020-04-15
阅读 3 分钟
6.1k
我们最近将数百个ZooKeeper实例从单独的服务器实例迁移到了Kubernetes,而期间没有停机。我们使用了强大的Kubernetes功能(例如端点)来简化流程,本文主要把迁移心得分享给大家,方便有同样需求的小伙伴们参考。有关一些重要的前提条件,比如网络,请参见最后。

深度解析Istio telemetry V2

2020-04-14
阅读 6 分钟
3.9k
Istio服务网格最流行和最强大的功能之一就是其先进的可观察性。因为所有服务到服务的通信都是通过Envoy代理路由的,并且Istio的控制平面能够从这些代理收集日志和指标,所以服务网格可以为我们提供有关网络状态和服务行为的深刻见解。这为运营商提供了独特的故障排除,管理和优化服务方式,而不会给应用程序开发人员带来...

Istio在Hellofresh的实战之路

2020-04-11
阅读 3 分钟
2k
Hellofresh每周向数百万客户供餐,表面上看起来很简单,实际上要复杂得多。在幕后,要在我们范围内运营,需要大量的基础设施,然后才能最终将餐交付给客户。

在Kubernetes上对Ambassador,Contour和Nginx性能进行基准测试

2020-04-11
阅读 12 分钟
2.9k
在典型的Kubernetes部署中,所有到Kubernetes服务的流量都流经ingress。Ingress代理从Internet到后端服务的流量。这样,Ingres就在您提高性能的关键路径上。有多种基准测试和衡量性能的方法。

使用AIOps优化Kubernetes集群的成本

2020-04-09
阅读 3 分钟
3.1k
Kubernetes是Google开源的改变游戏规则的产品之一,它使许多组织的工作流程更加高效。有了Kubernetes,可以根据应用程序需求弹性管理应用程序的资源需求。它提供了根据工作负载需求为应用程序分配所需的CPU,磁盘和RAM的灵活性。

gRPC实战--gRPC简介:why,what,how?

2020-04-08
阅读 3 分钟
3.5k
gRPC实战包含一系列文章,包括原创和翻译。最终会形成一个完整的系列,后续会不断完善,增加新的内容: gRPC简介:why,what,how? gRPC服务健康检查最佳实践 Kubernetes中使用envoy负载均衡gRPC流量 用Golang编写通过gRPC进行通信的服务 如何在NodeJS中有效使用gRPC流 ==================================================...

gRPC实战--如何在NodeJS中有效使用gRPC流

2020-04-08
阅读 12 分钟
10k
gRPC实战包含一系列文章,包括原创和翻译。最终会形成一个完整的系列,后续会不断完善,增加新的内容: gRPC简介:why,what,how? gRPC服务健康检查最佳实践 Kubernetes中使用envoy负载均衡gRPC流量 用Golang编写通过gRPC进行通信的服务 如何在NodeJS中有效使用gRPC流 ==================================================...

gRPC实战--用Golang编写通过gRPC进行通信的服务

2020-04-07
阅读 9 分钟
10.6k
gRPC实战包含一系列文章,包括原创和翻译。最终会形成一个完整的系列,后续会不断完善,增加新的内容: gRPC简介:why,what,how? gRPC服务健康检查最佳实践 Kubernetes中使用envoy负载均衡gRPC流量 用Golang编写通过gRPC进行通信的服务 如何在NodeJS中有效使用gRPC流 ==================================================...

服务网格平台探索性指南

2020-04-01
阅读 6 分钟
9.8k
开发人员需要确保跨服务的通信是安全的。他们还需要实施分布式跟踪,以告知每次调用需要多长时间。重试,断路器等分布式服务的一些最佳实践为服务带来了弹性。微服务通常是多语言的,并使用不同的库和SDK。编写通用的可重用软件来管理跨HTTP,gRPC和GraphQL等不同协议的服务内通信非常复杂,昂贵且耗时。

DNS Lookups in Kubernetes

2020-03-31
阅读 3 分钟
2.1k
在Kubernetes中部署工作负载的主要优势之一是无缝应用程序发现。服务的概念使群集内通信变得容易,服务的概念代表了支持一组Pod IP的虚拟IP。例如,如果香草服务需要与巧克力服务通话,则可以直接使用虚拟IP访问巧克力服务。现在的问题是谁解决了巧克力的DNS查询,如何解决?

在Kubernetes上部署Flink作业

2020-03-31
阅读 5 分钟
6k
Kubernetes(k8s)由Google创建,现已成为最受欢迎的开源编排系统,用于管理多个主机容器化应用,提供了为分布式系统构建和部署可伸缩且可靠的应用程序所需的机制。我们正处在一个时代,服务的正常运行时间必须接近99.9%,要实现这一点,就必须拥有一种机制,即使存在系统崩溃,它们也不能失败。这些类型的系统必须具有...

Kubernetes Liveness 和 Readiness Probes的最佳实践

2020-03-18
阅读 6 分钟
3.7k
Kubernetes Liveness 和 Readiness探针可用于通过减少运行问题和提高服务质量来使服务更健壮和更具弹性。但是,如果不仔细设置这些探针,则它们可能会严重降低服务的整体运行性能。

用于监视Kubernetes和Docker的六大开源工具

2020-03-11
阅读 4 分钟
2.5k
Kubernetes和Docker是现代DevOps中最常听到的两个流行词。 Docker是使您能够容器化和运行应用程序的工具,而Kubernetes为您提供了一个平台来编排或管理这些容器--因为使用Docker CLI手动管理成千上万个容器是一个现实的噩梦。

Kubeflow 1.0:适合所有人的云原生ML

2020-03-03
阅读 4 分钟
6.5k
我们荣幸地代表整个社区宣布我们的第一个主要版本Kubeflow 1.0。 Kubeflow于2017年12月在美国Kubecon开源,并且在过去两年中,Kubeflow项目的增长超出了我们的期望。现在有来自30多个参与组织的数百名贡献者。在1.0版本中,我们将逐步提供一组稳定的应用程序,这些应用程序是在Kubernetes上有效开发,构建,训练和部署模...

深入理解kubernetes容器指标

2020-03-02
阅读 4 分钟
4.4k
Google的cAdvisor项目最初是一个独立项目,用于从节点上收集运行的容器的资源和性能指标。在Kubernetes中,cAdvisor嵌入到kubelet中。kubelet控制着集群中每个节点上的所有容器。这就很方便了,因为不需要在每个节点中都运行另一个进程来收集容器指标。

k8s与debug--解决conntrack insert failed

2020-02-28
阅读 5 分钟
7.2k
在东西向流量访问中,有一些大流量和高并发的业务,尤其是在pod扩缩的时候,经常出现丢包而导致接口错误率比较高。我们service 的backend 选择的是iptabels。所以我们怀疑是iptables带来的问题。

构建Kubernetes有状态应用程序的不同方法

2020-02-25
阅读 3 分钟
2.9k
Kubernetes是计算历史上增长最快的基础设施项目之一。在短短的五年内,它已经达到了成为现代基础设施基础的成熟水平。从公共云中的托管容器即服务(CaaS)到数据中心中的企业平台即服务(PaaS)到边缘计算,Kubernetes变得无处不在。

如何在Kubernetes中将Envoy用作负载均衡器

2020-02-21
阅读 6 分钟
7.5k
在当今分布式的世界中,单体架构越来越多地被多个,更小,相互连接的服务(不管是好是坏)所取代,代理和负载平衡技术似乎正在复兴。除了老玩家以外,近年来还涌现出几种新的代理技术,它们以各种技术实现,并以不同的功能进行普及,例如易于集成到某些云提供商(“云原生”),高性能和低内存占用,或动态配置。