物流KA商家业务监控能力建设与实践

1 月 21 日
阅读 10 分钟
127
在常规的运维及线上故障响应实践中,我们观察到系统监控指标(System-Level Metrics)的异常波动往往与业务监控指标(Business-Level Metrics)的异常呈现高度相关性。具体而言,当系统级监控指标出现异常时,业务级监控指标在绝大多数情况下亦会表现出异常状态。然而,反之则不然,即业务级监控指标的异常并不总是伴随...

京点点AIGC平台:实现高效、可控、智能的多模态内容生成和优化

1 月 21 日
阅读 5 分钟
125
2024年,京东零售技术自研的京点点AIGC内容生成平台(以下简称“京点点”)已覆盖电商运营涉及的20+核心场景,AI能力单日调用超1000万次。“京点点”致力于电商场景下商品内容、营销素材的智能化、自动化生产和运营,已帮助京东35万+第三方商家一键AI生成店铺运营所需的商品图片、运营与营销文案,提升内容制作效率和效果,...

一次线上生产库的全流程切换完整方案

1 月 21 日
阅读 3 分钟
115
需要改造的xx系统为一个较为陈旧的技术栈系统,其中MongoDB作为核心数据存储中间件,承担着存储全部xx数据的重要任务。该系统目前的配置为1主1副本模式,涉及1个数据库和2张表,服务于7个不同的应用。尽管系统架构相对简单,但其在日常运营中发挥着不可或缺的作用。由于遇到了性能问题和公司不再运维MongoDb,2024公司集...

分布式日志追踪ID实战

1 月 20 日
阅读 35 分钟
188
本文通过介绍分布式应用下各个场景的全局日志ID透传思路,以及介绍分布式日志追踪ID简单实现原理和实战效果,从而达到通过提高日志查询排查问题的效率。

大数据平台Bug Bash大扫除最佳实践

1 月 20 日
阅读 3 分钟
189
随着越来越多的"新人"在日常工作以及大促备战中担当大任,我们发现仅了解自身系统业务已不能满足日常系统开发运维需求。为此,大数据平台部门组织了一次Bug Bash活动,既能提升自己对兄弟产品的理解和使用,又能促使自家产品功能日趋完善。今天来给大家分享一些实际操作过程和经验总结\~

Seata 源码

1 月 20 日
阅读 5 分钟
152
AbstractResourceManager 实现 ResourceManager 提供模板方法。DefaultResourceManager 适配所有的 ResourceManager,所有方法调用都委派给对应负责的 ResourceManager 处理。

Code Review:提升代码质量与团队能力的利器

1 月 17 日
阅读 9 分钟
245
Code Review(下文简称CR),即代码审查,是一种通过评审代码以发现并修正错误的实践。它不是一个新概念,但在软件开发中,它的重要性毋庸置疑。首先,它可以显著降低软件中的缺陷比例;其次,它促进了知识共享,通过评审的过程,团队成员可以相互学习,增强对系统的整体理解;最后,CR是一种预防措施,它有助于维护代码...

Linux内存泄露案例分析和内存管理分享

1 月 17 日
阅读 7 分钟
219
近期我们运维同事接到线上LB(负载均衡)服务内存报警,运维同事反馈说LB集群有部分机器的内存使用率超过80%,有的甚至超过90%,而且内存使用率还再不停的增长。接到内存报警的消息,让整个团队都比较紧张,我们团队负责的LB服务是零售、物流、科技等业务服务的流量入口,承接上万个服务的流量转发,一旦有故障影响业务...

一文让你对mysql索引底层实现明明白白

1 月 17 日
阅读 3 分钟
263
作者:京东零售 韩航云开篇:图片是本人随笔画的,有点粗糙,望大家谅解,如有不对的地方,请联系本人,感谢一、索引到底底是什么.索引是帮助mysql高效获取数据的排好序的数据结构.索引是存储在文件里的.数据结构: 二叉树 HASH BTREE如果没有索引的话,循环一条一条的找,找一次就是一次IO,这样速度就会很慢我们知道...

稳定性方法论:可灰度 & 可监控 & 可回滚

1 月 16 日
阅读 4 分钟
264
前段时间写了《 稳定性治理框架 》,该文章在稳定性建设的理论和实践基础上,抽象出稳定性治理的框架,希望建立一个稳定性治理的标准动作、最佳实践。但从读者的反馈上看,有过类似经验的同学深同感触,经验不足的同学没啥感觉,导致这个结果的原因,我反思了一下,认为:概念太粗,落地容易变形。于是,想写一篇文章,...

2024 京东零售技术年度总结

1 月 16 日
阅读 7 分钟
195
2024年,京东零售技术在全面助力业务发展的同时,在大模型应用、智能供应链、端技术、XR体验等多个方向深入探索。京东APP完成阶段性重要改版,打造“又好又便宜”的优质体验;国补专区快速上线、助力“以旧换新”;大模型应用在大量零售业务场景全面铺开,实现效率提升;供应链能力一骑绝尘,为超千万订单提供更快的履约时效……

前端怎么做好稳定性保障体系建设?精准搞定“白虎”,不用叫“广智”!

1 月 16 日
阅读 3 分钟
231
作者:京东零售 刘伟东前言背景:实话实说才能做的更好1.业务间的监控策略层次不齐:前后端针对监控专项的标准规范缺失,导致有的业务监控完善,其他业务缺复用不了2.集团前端监控平台能力不完善,导致告警噪音大,一线研发无法通过自行思考抽丝剥茧,做有效合理监控,久而久之,监控告警熟视无睹3.平台大盘能力、日志能...

HBase深度历险

1 月 15 日
阅读 12 分钟
307
HBase 的全称是 Hadoop Database,是一个分布式的,可扩展,面向列簇的数据库,是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案。本文会像剥洋葱一样,层层剥开她的心,直到一丝不挂。

记录一次RPC服务有损上线的分析过程

1 月 15 日
阅读 10 分钟
195
分析日志,发现是服务依赖的藏经阁配置数据未加载完成导致。即所谓的有损上线或者是直接发布,当****应用启动时,service还没加载完,就开始对外提供服务,导致失败调用。

反向 Debug 了解一下?揭秘 Java DEBUG 的基本原理

1 月 15 日
阅读 7 分钟
301
作者:保险业务部 蒋信点赞再看,养成习惯Debug 的时候,都遇到过手速太快,直接跳过了自己想调试的方法、代码的时候吧……一旦跳过,可能就得重新执行一遍,准备数据、重新启动可能几分钟就过去了。好在IDE 们都很强大,还给你后悔的机会,可以直接删除某个 Stack Frame,直接返回到之前的状态,确切的说是返回到之前的某...

京东广告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速实践

1 月 14 日
阅读 4 分钟
280
推荐系统的主要任务是根据用户的历史行为预测其兴趣点,并向其推荐相应的商品。传统的推荐系统在处理用户请求时,会触发多个召回模块(包括热门商品召回、个性化召回、深度召回等),以召回大量候选商品。随后,系统通过相对简单的粗排模型对候选集进行初步筛选,缩小候选范围,最后通过精排和重排模型,确定最终返回给...

Java定时任务大盘点:发工资也能“指日可待”

1 月 14 日
阅读 12 分钟
320
作者:京东保险 孙昊宇引子:“指日可待”让我们先从一个成语开始,“指日可待”。没错,我说的就是定时任务😏。“指日可待”: 为任务指定好日程,就可以安心等待任务执行。在实际场景中,我们往往需要在特定时间做某件事情,或以某个时间间隔重复某件事情,如定期备份数据、定时取消超时订单等。所有和时间有关的事情,都需...

基于javaPoet的缓存key优化实践

1 月 14 日
阅读 25 分钟
340
在一次系统opsreview中,发现了一些服务配置了@Cacheable注解。@cacheable 来源于spring cache框架中,作用是使用aop的方式将数据库中的热数据缓存在redis/本地缓存中,代码如下:

数字化时代下的数字化资产及其治理

1 月 10 日
阅读 8 分钟
348
维克托·迈尔·舍恩伯格在《大数据时代》中提到:“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。”数据资源将和土地、人力、资金等生产要素一样,成为企业的资产。业界对于数据资产的定义是企业或组织拥有或控制的,能在未来带来经济利益的数据资源。

缓存之美——如何选择合适的本地缓存?

1 月 10 日
阅读 4 分钟
400
小编最近在使用系统的时候,发现尽管应用已经使用了redis缓存提高查询效率,但是仍然有进一步优化的空间,于是想到了比分布式缓存性能更好的本地缓存,因此对领域内常用的本地缓存进行了一番调研,有早期的Guava缓存、在Guava上进一步传承的Caffine以及自称在Java中使用最广泛的EhCache,那么我们该怎么选择适合自己应用...

使用 Taro 开发鸿蒙原生应用 —— 快速上手,鸿蒙应用开发指南

1 月 10 日
阅读 4 分钟
431
随着鸿蒙系统的不断完善,许多应用厂商都希望将自己的应用移植到鸿蒙平台上。最近,Taro 发布了 v4.0.0-beta.x 版本,支持使用 Taro 快速开发鸿蒙原生应用,也可将现有的小程序转换为鸿蒙原生应用。

递归算法实践--到仓合单助力京东物流提效增收

1 月 9 日
阅读 6 分钟
444
京东物流到仓业务「对商家」为了减少商家按照京东采购单分货备货过程,对齐行业直接按照流向交接,提升商家满意度;「对京东」揽收操作APP提效;到仓合单功能应运而生;

代码之美-代码整洁之道

1 月 9 日
阅读 15 分钟
326
京东零售从9月开始对技术风险系统性地跟踪汇报,以故障数、监控发现率、故障发现时间、故障恢复时间等多个指标进行统计和跟踪汇报,相比于之前线上小故障杖责二十、大故障发配宁古塔,有了向惩前毖后、治病救人方向的转变。我也有机会参与到其中部分问题的复盘,发现问题的原因要不是因为需求变更过程中理解有误,要不是...

行稳、致远 | 技术驱动下的思考感悟

1 月 9 日
阅读 4 分钟
442
我是21届校招生,博士毕业于中国科学院-自动化研究所。2021入职博士管培生,现任京东零售-技术研发与数据中心-智能平台部-智能算法部-商品图谱研发组算法应用工程师。当前我的工作焦点是低资源情况下大模型的训练与规模化应用。近期发表顶级国际会议ICLR、AAAI和EMNLP各一篇,提交专利8项。

设计模式-策略模式

1 月 8 日
阅读 2 分钟
373
策略模式(Strategy Pattern)也称为(Policy Parttern)。 它定义了算法家族,分别封装起来,让它们之间可以互相替换,此模式让算法的变换,不会影响到使用算法的客户。策略模式属性行为模式。

【A/B实验常见问题】实验异常值应该如何处理?

1 月 8 日
阅读 5 分钟
447
实验分流不太稳定,多次分流以后,发现随机分组历史数据指标波动特别大 实验结果不符合预期,在去掉几个特殊用户后结果变化较大、甚至正负反转 不同的业务场景设置的指标过滤规则不同,例如A场景过滤掉了成单超过100单的用户、但B场景没有过滤,实验指标应该选择哪个

「零售数据通道」数据炼金术:千亿级流量资产湖仓架构转型

1 月 8 日
阅读 10 分钟
437
在流量领域的转化分析、搜索推广算法及AI等数据分析应用场景中,流量资产的质量直接影响到业务的监测和运营。作为流量资产的基石,流量数仓在应对快速变化和多样化的业务需求时,如何在提高效率、优化用户体验和控制成本方面做到最佳?本文将方案设计、链路优化、湖架构新特性研发、大促保障及监控设计等多角度全方位介...

本地(或自下载)浏览器插件 安装指南

1 月 6 日
阅读 3 分钟
317
作者:京东科技 贾玉龙1 首先准备好安装包通过不用渠道下载所要安装插件的压缩包2 安装流程第一步 解压解压压缩包至文件夹中,请确保您的电脑上已安装解压工具,否则会解压失败1)mac系统中,双击压缩包即可完成解压。2)win系统解压工具可自行下载zip包解压工具2.1)安装后,可选中领航者插件安装包,然后右击鼠标,如...

供应链计划性能优化解决方案-Clickhouse本地Join

1 月 6 日
阅读 7 分钟
402
本文主要针对供应链计划业务发展过程中系统产生的瓶颈问题的解决方案进行阐述,并且分享一些问题解决过程中用到的一些工具方法,希望对其他业务同类问题提供启发,原理细节不着重介绍,如有兴趣欢迎一起探讨。

架构提效的矛盾和矛盾的主要方面

1 月 6 日
阅读 4 分钟
289
在软件开发领域,架构设计是确保系统高效、稳定运行的重要环节或者称之为重要动作。无论架构从简单到复杂,还是从复杂回归简洁的演变过程。在这个过程中,又无论是初创公司还是大型企业,架构提效始终是技术团队的核心追求。本文将从稳定、性能、代码三大维度出发,结合实战经验,探讨如何有效提升架构效能。