阿里云出现大规模故障;2023 最佳发明榜单;愤怒的南瓜|思否技术圈周刊

2023-11-17
阅读 3 分钟
625
双十一刚结束,阿里云就大面积故障,持续长达 3 个半小时。据阿里云公告,故障源于某个底层服务组件,影响地域涵盖了国内以及海外多个国家。“淘宝崩了”、“外卖崩了”、“闲鱼崩了”等迅速冲上热搜。大批依赖阿里云的设施随之崩溃:外卖派送停止、超市无法结账、停车场不抬杆。甚至洗衣机、直饮水机和充电桩等服务也停止运转。
封面图

【精彩剧透】PyCon China 2022 邀您共赴技术 Party!

2022-12-16
阅读 4 分钟
1.9k
PyCon China 每年由 PyChina 社区定期举办,现如今已成为中国大型的 Python 技术会议。我们希望汇聚更多的开发者们,一起交流 Python 技术,包括人工智能、Python 特性、网络安全、服务端开发、运维、医疗、金融、开源项目等更多 Python 相关的技术领域。

七牛云智能运维新品发布,何以成为行业颠覆性创新?

2021-07-09
阅读 2 分钟
8.7k
PISA,即Pandora Intelligent Service Analysis,是基于七牛云的机器数据分析平台Pandora开发的智能服务分析工具。七牛云将PISA定义为Pandora上的全新应用,可见其对行业及七牛云本身的意义非同小可。

思否开源项目推介丨WeCube:一站式 IT 架构管理和运维管理工具

2020-07-10
阅读 2 分钟
3.9k
开源项目名称:WeCube 开源项目负责人:@刘超 开源项目简介:一站式 IT 架构管理和运维管理工具 开源项目类型:个人开源项目项目创建时间:2019 年 8 月 GitHub 数据:121 Star,26 Fork GitHub 地址:[链接]

低代码运维开发平台 OpsMind 获德联资本数千万元 Pre-A 轮融资

2020-07-06
阅读 2 分钟
2.6k
7 月 6 日,低代码运维开发平台 OpsMind 宣布完成由德联资本投资的数千万元 Pre-A 轮融资。此前,OpsMind 于 2018 年底获得真格资本天使轮投资。本轮融资后,OpsMind 将加速产品的开发与升级,结合用户需求推出更多场景化解决方案,完善营销体系的建设,加大市场投入及品牌打造。

Google 出版「运维宝典」,分享内部 SRE 应用实例丨附电子书下载链接

2020-04-09
阅读 2 分钟
5.4k
新书名为《Building Secure & Reliable Systems(构建安全可靠的系统)》,重点介绍 Google 如何将 SRE 方法引入安全性,以及安全性在软件产品开发和运营中的作用。

火神山医院面向全国紧急招募 IT 运维志愿者

2020-01-26
阅读 2 分钟
20.1k
为抗击新型冠状病毒感染的肺炎疫情,确保建设中的火神山医院信息系统正常运转,现面向全国 IT 企业公开招募院内 IT 运维志愿者。 委托HIT专家网发布具体需求如下: 工作地点:火神山医院(武汉市蔡甸区)。 工作内容:院内(含污染区)终端维护,包括电脑、打印机、终端网络等桌面运维工作。 报名条件:熟悉医院 IT 业务...

腾讯云+社区技术沙龙丨数字经济大潮推动下的高效智能运维

2019-11-12
阅读 4 分钟
3.6k
在数字经济大潮的推动下,信息化建设以及数字化转型加速发展,大中型乃至超大型的数据中心不断产生,但其中成百上千套的 IT 设备与业务系统的正常健康运行为传统 IT 运维带来了严峻挑战,这些都在推动着我国 IT 运维向标准化、自动化、智能化方向升级转变。

NetHogs 实时检测网络流量

2014-04-15
阅读 2 分钟
18.6k
有很多适用于Linux系统的开源网络监视工具.比如说,你可以用命令iftop来检查带宽使用情况. netstat用来查看接口统计报告,还有top监控系统当前运行进程.但是如果你想要找一个能够按进程实时统计网络带宽利用率的工具,那么NetHogs值得一看.

什么样的硬件设备在支撑 Stack Overflow?

2014-03-10
阅读 4 分钟
5.1k
我更愿意把 Stack Overflow 看作是能够运行于大规模数据下,但本身并不算大规模的(running with scale but not at scale)。意思是我们的网站非常有效率,但至少目前为止,我们的规模还不够“大”。让我们通过一些数字来介绍Stack Overflow当前是一个怎样的规模吧。以下是一些核心的数字,来自于不久前在一整天(24小时)...

2013年度Python运维工具

2014-02-20
阅读 2 分钟
12.8k
Pycoders周刊根据读者对周刊文章的点击数据,评选出了2013年最受关注的Python运维工具。 metrology (github.com) 这个库很酷, 支持你对应用进行多种测量,并轻松的输出给类似 graphite 的外部系统. python-lust (github.com) 支持在Unix 系统中用Python 实现一个守护进程. scales (github.com) Scales 对你的Python 应用...

MySQL重设root密码

2014-02-19
阅读 2 分钟
19.1k
MySQL下创建新用户、新数据库、设定访问权限控制都需要用到root密码。万一把root密码忘了,该怎么办? 幸运地是,重设密码很容易。 注意:MySQL的root用户和服务器操作系统的root用户是两个不同的用户,不要搞混了。 基本的思路是,以安全模式启动mysql,这样不需要密码可以直接以root身份登录,然后重设密码。 首先,我...

puppet简介

2014-02-05
阅读 7 分钟
4.4k
系统管理员都喜欢自己写点小工具来让自己的工作完成的更快或者更好, 不管是在大企业管理大量的服务器还是只管理两三台机器. 但是很少人会把他们的工具发布出来. 也就是是说极少有工具能被重用,或者说很多工具就只能在所在的组织内部有用.拷贝给别的组织,他们也用不上. 也就是说,每个系统管理员,在一个新的公司,都会另起...

防火墙进化史

2014-01-06
阅读 6 分钟
5.5k
此文仅代表我个人对防火墙的理解。不夸张的说,基于认识的局限性,本文很可能存在认识的误区。很多产品可能标注为防火墙,却不能在本文找到对应的分类,这往往因为包含包含了高度集成的功能,各个功能可以归在防火墙的子类里;也有些产品的名字里不含防火墙,但是可能提供防火墙的一种功能。

Opserver: Stack Exchange 的系统监控工具

2013-12-09
阅读 1 分钟
5.9k
Opserver 是 Stack Exchange(Stack Overflow 的主站) 团队的系统监控工具,它可以用于监控: 服务器 SQL 集群/实例 redis elasticsearch 异常日志 haproxy 还会有更多.. Opserver 提供一个系统的主要概况展示,并且也能非常细节地展现其具体情况。关于它的 UI 创意,可以看看他们在 2013 年的 Velocity 讲座上的截图 ...

一个开发眼中的运维

2013-11-30
阅读 3 分钟
28.6k
在云计算时代,开发和运维的结合变得越来越重要。在DIFF论坛第一期,前新浪SAE运维主管,郑志勇,分享了《一个开发眼中的运维》根据自己从开发人员转型运维之后的心得,谈如何把在开发上的运用抽象思维方式运用到运维领域。

10K 问题的解决:一个系统管理员如何管理 2000x 台服务器

2013-11-25
阅读 2 分钟
13.6k
这就是著名的 C10K 问题。 通过改善操作系统内核和从像 Apache 那样的线程服务器迁移到像 Nginx, Node 这样的事件驱动服务器,工程师们解决了这个 C10K 问题。

Facebook运维内幕曝光:一人管理2万台服务器

2013-11-25
阅读 2 分钟
5.8k
目前,Facebook 已经凭借它在网络基础建设上的可扩展能力成为了行业的领军者。Facebook 数据中心运维主管 Delfina Eberly(上图人物) 在“7x24 Exchange 2013 秋季会议”上的演讲中为我们透露了 Facebook 部分内部运维数据,下面我们来具体了解下。