有赞技术 - SegmentFault 思否

Flink 在有赞实时计算的实践

有赞技术

2019-01-18

阅读 9 分钟

7.3k

其次是在调研阶段我们为什么选择了 Flink。在这个部分，主要是 Flink 与 Spark 的 structured streaming 的一些对比和选择 Flink 的原因。

SparkSQL 在有赞的实践

有赞技术

2019-01-16

阅读 6 分钟

3.6k

有赞数据平台从2017年上半年开始，逐步使用 SparkSQL 替代 Hive 执行离线任务，目前 SparkSQL 每天的运行作业数量5000个，占离线作业数目的55%，消耗的 cpu 资源占集群总资源的50%左右。本文介绍由 SparkSQL 替换 Hive 过程中碰到的问题以及处理经验和优化建议，包括以下方面的内容：

HBase写吞吐场景资源消耗量化分析及优化

有赞技术

2019-01-16

阅读 7 分钟

4.7k

HBase 是一个基于 Google BigTable 论文设计的高可靠性、高性能、可伸缩的分布式存储系统。网上关于 HBase 的文章很多，官方文档介绍的也比较详细，本篇文章不介绍HBase基本的细节。

有赞搜索系统的架构演进

有赞技术

2018-09-04

阅读 4 分钟

15.1k

有赞搜索平台是一个面向公司内部各项搜索应用以及部分 NoSQL 存储应用的 PaaS 产品，帮助应用合理高效的支持检索和多维过滤功能，有赞搜索平台目前支持了大大小小一百多个检索业务，服务于近百亿数据。