业内首次! 全面复现DeepSeek-R1-Zero 数学、代码能力,训练步数仅需R1-Zero 1/10

4 月 24 日
阅读 6 分钟
103
OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力。
封面图

新加坡见!快手11篇论文入选人工智能领域顶会ICLR 2025

4 月 24 日
阅读 8 分钟
132
ICLR(International Conference on Learning Representations)是人工智能领域顶级学术会议之一,主要聚焦于深度学习及其在表示学习(representation learning)方面的最新研究进展,是学术界和工业界展示最前沿机器学习成果的重要平台。ICLR 2025 将于 4 月 24 日至 28 日在新加坡博览中心举行,本届论文录用结果揭晓...
封面图

快手前端通用静态托管服务 KFX 演进历程:从崎岖土路到平坦高速

2 月 27 日
阅读 7 分钟
410
快手静态部署托管服务(KFX)历经四年发展,经历了三个阶段,一步步从勉强能行车的“崎岖土路”到现在多车道并行的“平坦高速”,这一转变极大地提升了资源利用率和效率,满足业务的实际需要。本文将带你了解其背后的演进历程。

秒开率从 18% 到 64%,我们对小程序模拟器做了什么?

2 月 26 日
阅读 6 分钟
545
小程序是一种运行在快手生态内,无需下载安装、即用即走的轻量级应用。其中,模拟器是快手开发者所使用的工具中最核心的模块之一,但因性能问题收到开发者反馈。为此,24 年 Q2 快手启动了模拟器性能优化专项,从线上数据看:模拟器秒开率从 18%提升至 64%,FCP P90 从 4.4s 提升至 1.9s。本文详细介绍优化措施和成效。

Blaze RangePartitioning 算子Native实现全解析

2 月 21 日
阅读 2 分钟
505
引言:本文将全面且深入地解析 Blaze RangePartitioning 算子的 Native 实现过程。相较于原生 Spark,RangePartitioning 的 Native 实现在执行时间上达到了 30%的显著下降,同时在资源开销方面节省了高达 76%。这一改进大幅降低了运行成本,展现了 Native 实现带来的巨大优势。
封面图

动效资源交付的突破:Vision 平台准入准出方案

2 月 21 日
阅读 6 分钟
406
导读:快手动效 Vision 平台为解决动效资源交付问题,引入了动效资源准入准出检测机制。通过分析现有交付流程的痛点,平台增加了了静态和动态检测服务,确保动效质量与性能。该套系统已成功召回并预防了多次线上问题,提升了使用动效资源的稳定性和效率。

快手 Java 透明协程:实现零代码修改提升 30%QPS

2 月 13 日
阅读 7 分钟
478
摘要:对于开发者而言,传统线程模型逻辑直观但性能受限,而异步模型虽性能高却复杂性大。协程以“同步编程,异步执行”平衡两者,成为现代语言标配。结合自身业务需求,快手基于社区开源版本自研了 Java17 透明协程技术,实现对业务无侵入的同时,吞吐能力提升 30%以上。本文将深入剖析快手协程技术的背后原理与架构演进。

KwaiCoder-23BA4-v1:以 1/30 的成本训练全尺寸 SOTA 代码续写大模型

1 月 24 日
阅读 5 分钟
710
KwaiCoder-23BA4-v1 是快手Kwaipilot 团队最新开源的自研代码续写大模型,模型的训练依托于 Kwaipilot 团队提出的一种高效的模型训练方案。通过结合模型剪枝、知识蒸馏、细粒度合并等技术,相比传统方法以1/30的成本完成了23B 宽MoE架构代码续写模型的训练,并在多个代码领域评测集上实现了新的 SOTA。