Doris 导入慢该如何排查及优化?

1 月 15 日
阅读 4 分钟
61
PowerData编者荐语:来自PowerData-徐振超的精彩文章以下文章来源于数据极客圈 ,作者徐振超[数据极客圈 .一入大数据深似海?别怕!“数据极客圈” 就是你的救生圈,走对圈子跟对人,趣析数据、畅聊趋势,快进圈子!](#)在使用 Apache Doris 进行数据导入时,经常会遇到导入性能不理想的情况。今天我们就来深入分析这些问...

国内首次 | Apache Iceberg Meetup 2025深圳站活动预告

1 月 14 日
阅读 1 分钟
111
PowerData编者荐语:Iceberg深圳活动推荐!以下文章来源于Apache Iceberg ,作者Apache Iceberg[Apache Iceberg .为你提供 Iceberg 社区资讯、功能特性以及技术分享。](#)活动简介2024年是湖仓一体(Lakehouse)数据架构蓬勃发展的一年,越来越多的企业选择将数据湖作为统一的存储层,并在之上构建包括BI、AI在内的丰富...

Apache Doris 创始人:何为“现代化”的数据仓库?

1 月 13 日
阅读 8 分钟
70
PowerData编者荐语:来自PowerData的好朋友Doris的优秀文章以下文章来源于SelectDB ,作者马如悦[SelectDB .现代化实时数据仓库](#)在 12 月 14 日的 Doris Summit Asia 2024 上,Apache Doris 创始人 & PMC 成员马如悦在开场演讲中,围绕“现代化数据仓库”这一主题,指出 3.0 版本是 Apache Doris  研发路程中的重要...

【好书推荐】《大数据SQL优化:原理与实践》:大数据从业者晋升之路

1 月 10 日
阅读 2 分钟
29
PowerData编者荐语:来自PowerData独孤风大佬推荐的PowerData陈鹤大佬的新书以下文章来源于大数据流动 ,作者独孤风[大数据流动 .专注于大数据 数据治理 人工智能知识分享;提供数据要素 数据空间 数场 数据资产 数据入表 数字化转型 数据管理 数据架构 实时计算 数据中台 数据仓库 数据湖 元数据管理 DAMA资料;定期组...

全面升级!使用 Doris Manager 全方位可视化运维 Apache Doris(上)

1 月 10 日
阅读 9 分钟
75
PowerData编者荐语:来自PowerData苏奕嘉同学的文章以下文章来源于Apache Doris 补习班 ,作者苏奕嘉[Apache Doris 补习班 .Apache Doris Active Contributor 和 SelectDB SA 来做的不定时更新,主打 Apache Doris 系列学习文章和相关信息、原理解析或者新特性使用教程,争取 All In 原创,欢迎投稿~](#)引言很多非运维...

全面升级!使用 Doris Manager 全方位可视化运维 Apache Doris(下)

1 月 10 日
阅读 4 分钟
35
PowerData编者荐语:来自PowerData苏奕嘉同学的文章以下文章来源于Apache Doris 补习班 ,作者苏奕嘉[Apache Doris 补习班 .Apache Doris Active Contributor 和 SelectDB SA 来做的不定时更新,主打 Apache Doris 系列学习文章和相关信息、原理解析或者新特性使用教程,争取 All In 原创,欢迎投稿~](#)引言太难了,由...

DolphinScheduler自身容错导致的服务器持续崩溃重大问题的排查与解决

1 月 10 日
阅读 10 分钟
48
老钟 PowerData01问题复现在DolphinScheduler中有如下一个Shell任务: {代码...} 在DolphinScheduler将工作流执行策略设置为并行:定时周期调度设置为10秒一次:将定时调度上线后,会调度执行任务,此时一切正常:此时将Master节点给kill掉,模拟宕机: {代码...} 去到DolphinScheduler中查看,发现Master已经不存在了:...

【技术实践】推荐系统概述

1 月 9 日
阅读 6 分钟
52
原创 PowerData-胡洋 PowerDataPowerData数据之力 非同凡想■ ■ ■思考  交流  贡献  共赢○○全文共  3921 字,建议阅读 18 分钟  系列前言 / Series Preface       随着移动互联网的飞速发展,人们已经处于一个信息过载的时代。在这个时代中,信息的生产者很难将信息呈现在对它们感兴趣的信息消费者面前,而对于信息消费者...

Doris的Stream Load那些事儿,你踩过哪些“坑”?

1 月 8 日
阅读 2 分钟
28
PowerData编者荐语:来自PowerData徐振超同学的文章以下文章来源于数据极客圈 ,作者徐振超[数据极客圈 .一入大数据深似海?别怕!“数据极客圈” 就是你的救生圈,走对圈子跟对人,趣析数据、畅聊趋势,快进圈子!](#)“Stream Load”作为Apache Doris中一款快速导入数据的利器,虽然方便,但也让不少人“踩坑”。今天,我们...

从源码到运行:深入解析 Apache Doris 的编译与 Debug 流程

1 月 7 日
阅读 8 分钟
48
PowerData编者荐语:来自PowerData-黄海军同学的文章以下文章来源于数据微光 ,作者黄海军[数据微光 .数据微光,专注于分享 Apache Doris 的使用指南、实战经验与技术解读。无论新手还是资深用户,这里都有助你深入掌握 Doris 的实用内容。探索数据的微光,共同点亮技术之路!](#)Apache Doris 作为一款高性能、实时的分...

【活动推荐】聚社区之力|NebulaGraph 社区高校行,1月11日与你相约南京大学!

1 月 7 日
阅读 2 分钟
24
2025 年 NebulaGraph 社区高校行首站即将走进南京大学,与信息管理学院携手,正式合作开设 “知识图谱” 课程。课程将通过理论讲解与项目实践,帮助学生掌握开源社区协作与图数据库技术应用,打造技术与教育结合的全新样板。

【分享活动】手把手教你构建用户标签平台 | 2025-01-08 20:30

1 月 6 日
阅读 1 分钟
23
用户标签大家都不陌生,但是如何构建一个用户标签平台对标签进行生成、管理、存储、使用,其技术选型、以及核心算法RBM与BSI的使用,本次分享将会为你深入介绍,包教包会。

【技术实践】大数据SQL优化原理与实践系列之原理篇(一)

1 月 3 日
阅读 6 分钟
17
原创 PowerData-李钊丞 PowerDataPowerData数据之力 非同凡想■ ■ ■思考  交流  贡献  共赢○○全文共  3270 字,建议阅读 12 分钟  文章导读 / Company Nature        本系列文章为阅读学习《大数据SQL优化原理与实践》陈鹤 杨国栋◎著 一书的学习笔记。在阅读整篇之后,进行提炼和个人思考,欢迎讨论。此书分为4篇,包含10...

【技术实践】大数据SQL优化原理与实践系列之认知篇(一)

2024-12-26
阅读 6 分钟
38
PowerData-杨国栋 PowerDataPowerData数据之力 非同凡想■ ■ ■思考  交流  贡献  共赢○○   全文共  4357 字,建议阅读 15 分钟  系列前言 / Series Preface       本系列文章为阅读学习《大数据SQL优化原理与实践》陈鹤 杨国栋◎著 一书的学习笔记。在阅读整篇之后,进行提炼和个人思考,欢迎讨论。此书分为4篇,包含10章...

Cloudberry Database 正式加入 Apache 孵化器 | 上海 Meetup 2024-12-07 报名启动

2024-11-28
阅读 4 分钟
24
2024 年 10 月 12 日,Cloudberry Database 项目通过投票获准加入 Apache 软件基金会孵化器[1],这标志着 Cloudberry 项目及其社区的一个重要里程碑。2024 年 11 月 5 日,Cloudberry 项目的关联代码仓库迁移至 Apache 软件基金会。随着此次转变,Cloudberry 正式加入 Apache 孵化器,并在其旗下启动孵化开发。此外,Clo...

【广州站大数据Meetup】探索数据集成与仓库优化的最佳实践 | 2024-12-15

2024-11-28
阅读 3 分钟
24
数据孤岛:不同系统、格式的海量数据难以整合,如何打通数据流转的“任督二脉”?实时与批处理的融合需求:如何在数据复杂度和实时性要求不断提升的情况下实现高效整合?性能瓶颈:海量数据在查询和处理时的效率如何提升,尤其是复杂场景中的计算性能优化?生态协作:数据集成工具和仓库引擎如何高效协同以应对多样化业务...

议题征集 | Pulsar Developer Day 2024 开发者大会正式启动!上海 2024-12-21

2024-11-28
阅读 3 分钟
22
PowerData以下文章来源于ApachePulsar ,作者谙流科技[ApachePulsar .Apache 软件基金会顶级项目,下一代云原生分布式消息流平台,集消息、存储、轻量化函数式计算为一体,采用计算与存储分离架构设计,支持多租户、持久化存储、多机房跨区域数据复制,具有强一致性、高吞吐、低延时及高可扩展性等流数据存储特性。](#)P...

【PowerData联合主办】一场开源视角的AI对话 | 2024-11-30

2024-11-26
阅读 2 分钟
19
PowerData编者荐语:滴滴,本周末的南京开源活动,感兴趣的小伙伴可以报名参与以下文章来源于开源社KAIYUANSHE ,作者KCC@南京[开源社KAIYUANSHE .开源社 - 开源人的家 KAIYUANSHE, Home of Open-Sourcers](#)一场开源视角的AI会议,将于2024年11月30日在南京举办。此次活动,知名开源导师-庄表伟老师将为大家介绍自己搭...

【活动推荐】12 月 14 日,Doris Summit Asia 2024 议程正式公开,线下报名现已启动!

2024-11-25
阅读 2 分钟
23
一年一度的 Apache Doris 峰会再次启航,Doris Summit Asia 2024 现已开启报名,将于 2024 年 12 月 14 日在深圳正式举办。

开源人物-禅道社区王春生:让项目管理更便捷

2024-11-22
阅读 6 分钟
37
原创 PD韩立 PowerData专栏导语✦亲爱的读者小伙伴们:大家好,过去《数据人物》专栏访谈对象均为大数据方向从业者,通过他们分享自身经历中的点点滴滴,给我们的读者朋友们以启迪。在这里小编感谢之前接受采访的各位朋友的精彩分享。PowerData作为一个分享开源技术,传播开源文化的社区,我们将不再局限于数据领域的人物...

【资料下载】PowerData开源行分享PPT资料,共49份,涵盖大数据各领域

2024-11-05
阅读 3 分钟
28
今年PowerData城市开源行圆满结束,社区将分享PPT资料梳理出来供大家下载学习,内容非常全面,欢迎转发给需要的朋友,资料转发请标注来源为:PowerData。

kafka源码学习(三)消费者源码

2024-11-04
阅读 4 分钟
30
原创 PowerData-叶翔 PowerDataconsumer 初始化阶段 1:Find Group Coordinator查找 Group Coordinator的方式:先根据消费组 groupid的 hash值计算它所应该在\_\_consumer\_offsets中的分区编号;找到对应的分区号后,再寻找此分区 leader所在的 broker节点,则此节点即为自己的 Group Coordinator;注:注意这里是消费...

【议程介绍】COSCON'24 开源大数据分论坛 | PowerData 出品 邀您报名~!

2024-10-28
阅读 5 分钟
20
COSCon'24 第九届中国开源年会暨开源社十周年嘉年华,将于 2024 年 11 月 2-3 日 在中关村国家自主创新示范区会议中心举办。

开放型数据开源社区 "PowerData" 的运营思考

2024-10-25
阅读 4 分钟
20
COSCon'24 第九届 中国开源年会 暨开源社十周年嘉年华,将于 2024 年 11 月 2-3 日在中关村国家自主创新示范区会议中心举办。PowerData 作为联合出品社区,将于11月2日-11月3日 组织 开源大数据分论坛。

【活动推荐】10月26日@杭州,飞轮科技 x 阿里云举办 Apache Doris Meetup

2024-10-18
阅读 1 分钟
21
本次活动邀请了来自星火智云、玩心不止、飞轮科技、正泰集团、霖梓控股、中国电信等企业多位技术专家,为参会者分享在保险、游戏、制造和电信等领域的应用案例。演讲涵盖 Apache Doris 及阿里云数据库 SelectDB 版在各领域的数据仓库落地方案及场景实践,并将探讨在日志存储与分析、用户圈选等场景下的具体应用。现场参...

kafka源码学习(二)服务端源码

2024-10-17
阅读 14 分钟
45
      Kafka 服务端的网络设计通常采用三层架构,它包括以下三层:网络层:Acceptor负责接受来自客户端的连接请求,并创建对应的网络连接。请求层:Processor 负责处理来自客户端的请求,并将其传递给合适的 Handler 进行处理。它处于请求处理的中间层,负责请求的分发和路由。处理层:Handler 接收到 Processor 分发的...

【活动推荐】AI&Data加速沙龙上海站 | 10月19日

2024-10-16
阅读 2 分钟
17
PowerData(扫描二维码,立刻报名)活动背景在当今数字化时代,人工智能与大数据已经成为引领科技创新的重要力量。它们相互促进,共同推动着各行业的变革与发展。面对海量数据的处理需求,如何高效、快速地完成AI模型训练和部署,提高大数据分析效率并降低运维成本,已经成为行业共同面临的挑战。诚挚邀请 AI & Data...

Kafka 源码学习(一)生产者源码

2024-10-15
阅读 19 分钟
39
原创 PowerData叶翔 PowerDataproducer核心流程一个Producer客户端由两个线程协调运行,主线程和Sender线程。主线程中由 KafkaProducer创建消息,然后通过可能的拦截器、序列化器和分区器的作用之后缓存到消息累加器(RecordAccumulator,也称为消息收集器)中。注:这里的消息拦截器可以在发消息的之前对数据进行预处理...

Datavines 开动长桥证券在数据观测场景下的复兴号

2024-10-14
阅读 7 分钟
30
PowerData编者荐语:优秀开源项目推荐以下文章来源于Datavines ,作者Datavines[Datavines .下一代数据可观测性平台](#)导 读  本文主要介绍长桥科技(长桥证券背后的科技公司)通过引入 Datavines 来解决多租户场景下数据质检任务挤占资源和耗时过长的问题,重点介绍了 Datavines 与其现有的数据平台的集成方案和应对业...

【PowerData联合出品】COSCon'24 中国开源年会 开源大数据分论坛 | 北京 | 11.2-3

2024-10-09
阅读 3 分钟
18
中国开源年会 COSCon 是业界最具影响力的开源盛会之一,由 开源社 在2015年首次发起,以其独特定位及日益增加的影响力,吸引了越来越多的国内外企业、高校、开源组织/社区的大力支持。