狗哥的专栏 - SegmentFault 思否

Fluss RoadMap里Zero Disk是啥

5 月 15 日

阅读 2 分钟

286

本文在绿泡泡“狗哥琐话”首发于2024.12.23 <-关注不走丢。上期Fluss的内容还算受欢迎，这期加更，讲讲Fluss RoadMap里提到的Zero Disks是怎么个事儿。所谓Zero Disks就是把所有的存储放在S3这种远程，容量无限的存储上。这样集群本身就可以做到无状态了。那这玩意儿会怎么做呢？我们直接看一篇先成的文章。原文链接：[...

入门向：下一代实时计算基础设施-Fluss

泊浮目

5 月 14 日

阅读 2 分钟

445

本文在绿泡泡“狗哥琐话”首发于2024.12.15 <-关注不走丢。上期讲Flink Forward Aisa的视频比较受欢迎，这期加更讲Fluss。为了方便新观众了解Fluss。简单介绍一下Fluss，这玩意儿主要是为实时分析而生的流存储。所以它会有和Kafka一样的能力，但是比起Kafka，多一个直接查的能力。用在数据湖场景，比如配合Paimon，那么...

紧跟Flink 2.0，FlinkSQL提效神器v2025.3.0发布！

泊浮目

4 月 1 日

阅读 1 分钟

468

众所周知，Flink 2.0已经释出了（[链接]），这个版本的Flink解决了很多历史包袱，相信它可以走得更远了。同时FlinkSQLHelper也进行了更新，主要针对2.0中的：单引号字符串做了支持，比如SELECT 'Hello World', 'It''s me';对于QUALIFY关键字做了支持。在窗口表值函数中，TABLE()变为可选。插件地址：[链接] 或者直接在...

Flink && Spark SQL提效神器元宵限定折扣来咯

泊浮目

2 月 12 日

阅读 1 分钟

516

祝大家元宵快乐！正如之前的约定，我会在中国的传统节日为插件做折扣，因为这个插件是中国人写的。FlinkSQLHelper（直接在Jetbrains插件市场中搜索这个名字即可），7折折扣码：E3GBU-946K7-Q396Z-XS9RP-HL4Q4TYQV5-K8Z88-7SUHQ-H7AZC-AXVR79V92S-SEVSX-223DV-TAZ5Q-X4RA2VYB8L-QJBML-5WD4Q-CLL7J-BWBAZJZMGN-LANWB-GU3YF...

Flink && Spark SQL提效神器双双更新

泊浮目

2 月 6 日

阅读 1 分钟

744

大家新年好，在这里先祝大家开工大吉，今年少bug少加班多赚钱！本次SparkSQLHelper主要更新了对于Hints的补全支持，Release版本为2025.2.0。插件地址：[链接] 或者直接在Jetbrains插件市场搜索SparkSQLHelepr。用户QQ群：782150013。而FlinkSQLHelper主要更新了对于Hive语法的支持，Release版本为2025.2.0。插件地址：[...

FlinkSQL提效神器v2025.1.0 发布！支持Pycharm与最新版IDEA

泊浮目

1 月 20 日

阅读 1 分钟

731

下个大版本还是按照老节奏release，主要做对于Hive compatibility的支持。按照目前Flink 2.0的进度，预计下下个大版本我这边会跟进支持，争取和Flink 2.0同步发布。

写SparkSQL提效神器：SparkSQLHelper for IDEA v2025.1.1发布！支持PyCharm

泊浮目

1 月 14 日

阅读 1 分钟

3.8k

每一个用户的反馈、意见对我来说都是至关重要的，每一个问题我都会尽快修复，争取当周解决当周发版。国内用户可以直接进QQ群：782150013反馈问题，我随时都在。

2024年总结：大转向

泊浮目

1 月 2 日

阅读 2 分钟

811

今年我在职业上尝试做了一个转向，具体的结果可能需要比较长的时间来检验我选择是否正确，所以转向的细节我就不全部展开了，可以确定是我依然会专注在Infra和BigData，比如今年我发布了SparkSQL和FlinkSQL的IDEA提效插件。

写SparkSQL提效神器：SparkSQLHelper for IDEA v2024.1.4发布

泊浮目

2024-12-25

阅读 1 分钟

667

自从在网上宣传了一波这个插件以后，我又收获了一批用户（包括身边的一些朋友）。因此我也获得了一些反馈。针对反馈的问题，我在休息日做了修复，并且于昨天通过了审核，正式发布了v2024.1.4版本。插件地址：[链接]这个版本主要对报错提示做了一些优化，并修复了已知的语法解析错误。下个大版本将在2025年上半年释出，我...

经典梅开二度，我把IDEA版本的SparkSQL插件也撸好了

泊浮目

2024-12-17

阅读 2 分钟

634

继上篇“被催了1年多，我终于把IDEA版本的FlinkSQL插件撸好了”，我又来梅开二度了——SparkSQL版本的插件也撸好了。主打一个给大家的日常开发提效。

2天的Flink Forward Asia 有什么值得关注的点

泊浮目

2024-12-10

阅读 4 分钟

820

本文于12.8首发于公众号“狗哥琐话”。系是B站视频的文字稿。有兴趣的同学可以看B站的视频，搜索“抽象狗哥”。11月29号和30号，Flink Forward Asia 在上海举行。这篇文章给大家搞个省流版，聊聊有什么值得关注的点。Flink近2年的一个大动作就是把Flink的场景从流式计算到流式湖仓，主要是依托于Apache Paimon来建设的。流式...

被催了1年多，我终于把IDEA版本的FlinkSQL插件撸好了

泊浮目

2024-12-04

阅读 2 分钟

917

在去年8月份的时候，我写了一篇文章来宣传自己撸VSCode插件，见历史博客：《想在DataGrip里写SQL般丝滑的写FlinkSQL？安装它就完事儿了》。

读鸿蒙论文，看性能优化

泊浮目

2024-11-04

阅读 4 分钟

1.2k

《 Microkernel Goes General: Performance and Compatibility in the HongMeng Production Microkernel》论文中提到的一些性能优化的思路和方法是很有学习价值的，结合论文里提到的点，我做了个视频。为了方便大家观看，我梳理了这个文字版本。

你说通过Kafka AdminClient获取Lag会有性能问题？尊嘟假嘟0.o

泊浮目

2024-08-25

阅读 7 分钟

819

前阵子团队里出了个大故障，本质是因为其他语言实现的client有问题，非常频繁的请求大量元数据，而Kafka服务端这边也没有做什么限制，导致Kafka Broker宕了。

浅读TiKV源码：Coprocessor

泊浮目

2024-08-14

阅读 6 分钟

10.4k

版本日期备注 1.02024.8.5文章首发1.0.12024.8.14SF忘记发了，补发本文的的源码分析全部基于TiDB6.5来做分析。前言前阵子在看TiKV统计信息收集实现的时候，看到了Coprocessor有两个版本的实现：激起了我的好奇，所以有了这篇文章。正文在这里先科普一下：TiKV上的Coprocessor 主要是负责是执行物理算子，为 SQL 计算出中...

思考：为啥Go里没有类似MyBatis支持XML配置SQL的框架

泊浮目

2024-04-22

阅读 2 分钟

1.2k

前阵子团队里有个老服务的迁移语言任务，这个服务是类似于一个OneService的实现，要从Java转到Go。有人提了这样的问题，我自己先是顺手找了一圈，结果只找到了：[链接]。这个框架是基于xorm做的加强，但是在2020年就不维护了。显得很奇怪，明明是唯一一个支持了XML配置SQL的库，后面竟然凉了。

一名Java开发的Rust学习笔记

泊浮目

2024-03-18

阅读 14 分钟

1.5k

笔者的主力语言是Java，近三年Kotlin、Groovy、Go、TypeScript写得比较多。早年间还写过一些Python和JavaScript。总得来说落地在生产中的语言都是应用级语言，对于系统编程级语言接触不多。但这不妨碍我写下这么一篇笔记，说不定也有一些常年在应用层的同学想领略一下Rust的风采呢。

掰扯掰扯需求分析：从工程到生活中的4个case

泊浮目

2024-03-04

阅读 3 分钟

806

需求分析是工程师的必备技能之一。我们常说一些架构师多少多少牛逼，系统设计的多好多好——而系统设计的底座正是需求分析。基于详细的需求分析底座加上已知的业界理论上限，才能让我们更好得去设计好一个系统。

读Paimon源码聊设计：引子

泊浮目

2024-02-26

阅读 3 分钟

10.9k

一般的数据湖都会设计成开放通用的，即不和特定的存储、计算引擎（比如Spark和Flink）绑定。所以数据湖的定位是在计算引擎之下，又在存储之上，将其称之为table format。

读TiDB源码聊设计：浅析HTAP的SQL优化器

泊浮目

2024-02-18

阅读 30 分钟

1.3k

SELECT id, name FROM person WHERE age >= 18 or height > 180 limit 100;：从条件上看，我们看到条件其实是二选一的： age >= 18 or height > 180。基于这种情况，我们肯定会去选择有索引的数据，如果都有索引or都没有，那么肯定选择扫描行数最少的数据。如果有一些算子在里面的话，则额外需要考虑数据的...

读TiDB源码聊设计：引子

泊浮目

2024-01-29

阅读 5 分钟

965

TiDB是个非常好用的开源数据库系统。我在生产中一直有接触到TiDB，也是踩了一些坑，故而陆陆续续读了很多关于它的文档，慢慢被这个系统的设计吸引到，因此我决定深入它的内核去读源码，并将一些有意思的设计剖出来聊聊。所以有了今天这篇引子。

2023年总结：大幅跑赢A股、忙里偷“学”

泊浮目

2024-01-06

阅读 2 分钟

519

今年的A股异常惨烈，Q1润了一下，剩余的日子都在吃好果子。我今年的收益率是-1.7%。对比其他的宽指今年沪深300 -11.3%，中证500 -7.4%，中证2000 +0.1%，恒生-13.82%，几乎是跑赢了大多数指数，因此我给自己打到80分，今年我的仓位总体控制较好，而随着目前A股的性价比越来越高，我开始大量买入。我坚信从A股现在的情况...

梅开二度：我在VS Code上又写了一个Hive&Spark SQL的插件

泊浮目

2023-11-20

阅读 2 分钟

2.2k

在几个月前，我在公司内部推广了我写的FlinkSQL插件，收到了较好的反馈。具体介绍可以见我之前写的博客——《想在DataGrip里写SQL般丝滑的写FlinkSQL？安装它就完事儿了》。

笔记：写Flink SQL Helper时学到的一些姿势

泊浮目

2023-08-23

阅读 4 分钟

4.8k

开发VS Code，可以选择使用TypeScript or JavaScript。虽然没学过TypeScript，但是我还是选择了它。我想起大学工作室的时候，身边有小伙伴就特别喜欢JavaScript这种写起来很快的语言，但是我却更喜欢Java这种语言。因为有些时候我根本不知道JavaScript里的一些变量的值到底是什么。

想在DataGrip里写SQL般丝滑的写FlinkSQL？安装它就完事儿了

泊浮目

2023-08-08

阅读 3 分钟

2.2k

“FlinkSQL对于大数据开发者们来说是一个很常见的API，它的存在巨幅提升了开发效率，使开发者不用再面向底层细节，可以更加专注于自己的业务。”我在刚开始写FlinkSQL时，留下了这样的印象。

一名Java开发的Go语言学习笔记（一）

泊浮目

2023-05-15

阅读 8 分钟

1.8k

版本日期备注1.02023.5.15文章首发1.12023.5.28增加代码示例1.22023.5.30改善内容1.32023.11.15增加元编程部分的讨论本文首发于泊浮目的掘金:[链接]0. 概要最近因为业务需要在学Go语言，虽然之前也用过别的语言，但主力语言一直是Java。在这里也想主要想用Java做对比，写几篇笔记。这篇主要是讲语言本身及较为表面的一些...

面向价值编程：高ROI工程之旅

泊浮目

2023-03-17

阅读 3 分钟

1.9k

在前面的系列文章中，我提到了相关的理论，实操，以及一段工作经历。在这篇文章中，我会用我自己和团队的经历来作为例子，诠释面向价值编程，并通过两个例子说明高ROI工程的打造过程。

2022年总结：输入年

泊浮目

2023-01-03

阅读 2 分钟

又是一年，感觉这一年有许多知识输入了自己的大脑，看了眼自己年初给自己定的目标，还是差了许多——距离四级工程师仍有一段距离。不过我的身边已经有了两个可以参考的人，一个是生活圈里的，一个是共事的同事——我们从事的方向也一致，我可以很明显看到自己与他们的差距——有了具体的方向，我便可以在这条路上走更少的弯路。

新冠：感染、现象与所想

泊浮目

2022-12-24

阅读 1 分钟

2.2k

12.18 我自己症状出现：早上起来发现咽喉有点疼，期间无任何症状。到了晚上8点左右开始发热，意识到不对。睡前开始腰部、大腿部分疼痛，明显畏寒。

面向价值编程：低边际成本的自动化测试

泊浮目

2022-11-19

阅读 2 分钟

2.6k

17年刚加入ZStack时，ZStack正在经历从能用到好用的阶段。这个阶段会有更多的需求，对质量的要求也会更高。举个例子，toB的产品如果在一个行业里拓展开，一般都会想办法拿下龙头企业。大家都是这么想的，你会面临更多的竞争对手。抛去其他层面，单从技术层面来说，技术人员不仅需要提供相应的功能满足客户需求，还需要考...

面向价值编程：Why, What, How

泊浮目

2022-11-12

阅读 2 分钟

2.5k

从2021年，各个大厂的反内卷，再到2022年的裁员，大多数人都意识到互联网行业进入了寒冬。其实并非这个行业如此，其他的行业也正在严寒中苟活。宏观原因其实显然易见，但这并非本文讨论的主题。在这里，更想和大家讨论的是如何在这个冬天苟活下来。

面向价值编程：那些年在Coding质量上走过的路

泊浮目

2022-08-10

阅读 3 分钟

3.3k

最近接了几个项目，代码质量参差不齐。本想按照以往的实践建议每个patch都做review，但往往dead line当头。我会想，我如果对这次patch做了review、以及长期做review能给业务带来什么价值。接着本文，我还想讨论其他技巧在coding中也能够明显带来价值。

笔记：追随云原生的Java

泊浮目

2022-07-18

阅读 5 分钟

3.5k

前阵子在B站刷到了周志明博士的视频，主题是云原生时代下java，主要内容是云原生时代下的挑战与Java社区的对策。这个视频我在两年前看到过，当时也是印象深刻。现在笔者也是想和大家一起看看相关项目的推进以及一些细节。这篇笔记会大量参考视频中提到的内容，如果读者看过相关视频，可以跳过这篇笔记。

读Flink源码谈设计：流批一体的实现与现状

泊浮目

2022-03-17

阅读 2 分钟

7.4k

由于早期的流处理框架并不支持Exactly Once，导致流处理的数据并不精准。在这个基础上，一旦数据出现问题，则要导致大量的数据重放——这是因为事件往往是有时序要求的。因此，Lambda往往会通过流处理框架获取不是特别精准的结果，同时也会定时运行批处理程序，来获取更精准的结果——当更精准的结果出来时，我们就不需要前...