Meetup 回顾:存算引擎一体化建设

2024-08-19
阅读 8 分钟
435
在大数据与人工智能时代,数据的生成和存储量呈指数级增长。企业面临着如何高效处理和分析海量数据的巨大挑战。在面对如此规模的数据时,数据库究竟该选择存算一体,还是存算分离架构?如何才能提升资源利用率、扩展性,降低运维成本,这是数据从业者都在思考的问题。
封面图

在 Confluent Cloud 上使用 Databend Kafka Connect 构建实时数据流同步

2024-08-07
阅读 5 分钟
342
Confluent Cloud 是由 Confluent 公司提供的云服务,它是基于 Apache Kafka 的企业级事件流平台,允许用户轻松构建和管理分布式流处理应用。Confluent 由 Apache Kafka 的原始创建者创立,专注于提供围绕 Kafka 技术的产品和服务 。
封面图

Databend 开源周报第 156 期

2024-08-06
阅读 2 分钟
337
此前,共享视图是通过创建数据库(CREATE DATABASE xx FROM SHARE xxx;)的方式来实现的,这种方法在使用和管理上存在一定的复杂性和局限性。
封面图

生成式 AI 时代的数据库:Databend 与大模型的融合探索

2024-07-31
阅读 6 分钟
787
生成式人工智能(Generative AI)近年来快速崛起,从图像生成、自然语言处理到个性化推荐系统,生成式 AI 的应用范围越来越广泛。在这其中,数据可以说是企业在生成式 AI 时代取得成功的关键,每个公司都能访问相同的基础模型,但那些能够利用自己的数据构建具有真正商业价值的生成式人工智能应用的公司,将会是成功的公...

Databend 开源周报第 155 期

2024-07-30
阅读 2 分钟
323
Databend 现已支持 SQL 变量,用户可以在查询中更方便地动态设置和使用变量。有助于减少重复代码,简化复杂查询的编写,提高开发效率。
封面图

利用 Databend 生态构建现代数据湖工作流

2024-07-25
阅读 7 分钟
368
数据是洞察力的基石,越来越多的企业开始建设以数据资产为中心的存储和分析一体化方案,这要求 Data Infra 架构能够提供可扩展、灵活且统一的数据工作流。现代数据湖架构同时兼顾数据湖的可扩展性和数据仓库的性能,满足对大规模数据处理的需求,并应对数据的复杂性挑战。本文将介绍如何围绕 Databend 生态系统构建现代...

Databend 开源周报第 154 期

2024-07-23
阅读 2 分钟
278
在窗口函数的使用中,处理 NULL 值是一个常见且重要的问题。为了提供更加灵活和精确的查询能力,Databend 正在为窗口排名函数 first\_value、last\_value 和 nth\_value 添加 IGNORE NULLS 和 RESPECT NULLS 选项。这两个选项的具体功能如下:
封面图

⾯向现代分层存储的 Caching 技术漫谈|Data Infra 研究社第十九期(含资料发布)

2024-07-18
阅读 9 分钟
379
上周六(7月13日),第 19 期 Data Infra 研究社直播活动与大家见面了。本次活动我们邀请到了 Databend 研发工程师-尚卓燃,为大家带来了一场主题为《面向现代分层存储的 Caching 技术漫谈》的分享。通过卓燃的分享,我们深入理解了面向现代分层存储的 Caching 技术,并学习了机器学习如何影响缓存的设计与应用。本次活...
封面图

Databend 完美适配 KubeSphere 企业版 4.1.1,让云原生技术更普及

2024-07-16
阅读 3 分钟
358
KubeSphere 企业版 4.1.1 目前已经正式发布,推出「在线订阅」模式,致力于让云原生技术更加普及和可负担,以惠及更多中小企业。现在,中小企业每年仅需支付¥1500 起,即可获得近千家企业生产环境验证、多重安全与防护加固,并提供专家级在线支持的商用云原生操作系统,大幅降低采用云原生技术的初始成本。
封面图

Databend 开源周报第 153 期

2024-07-16
阅读 3 分钟
325
Databend 现在已经支持在创建或修改用户时设置 must_change_password 选项,确保新用户在首次登录后必须更改密码。这一功能有助于提升账户安全性,防止初始密码泄露风险。

从 Icelake 到 Iceberg Rust

2024-07-11
阅读 3 分钟
359
本文作者丁皓是Databend 研发工程师,也是 ASF Member, Apache OpenDAL PMC Chair ,主要研究领域包括存储、自动化与开源。

Databend 开源周报第 152 期

2024-07-09
阅读 2 分钟
209
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:[链接] 。What's On In Databend探索 Databend 本周新进展,遇到更贴近你心意的 Databend。支持内置 UDFsDatabend 现在已经支持在配置文件中预定义 UDFs 的能力,允许在部署时预先内置部分实用的 UDFs。示例...
封面图

使用 bend-ingest-kafka 将数据流实时导入到 Databend

2024-07-03
阅读 4 分钟
333
Databend是一个开源、高性能、低成本易于扩展的新一代云数据仓库。bend-ingest-kafka 是一个专为 Databend 设计的实时数据导入工具,它允许用户从 Apache Kafka 直接将数据流导入到 Databend 中,实现数据的实时分析和处理。

Databend 开源周报第 151 期

2024-07-02
阅读 2 分钟
370
Databend 现在已经支持递归调用用户定义函数,使其能够适用于处理可以被分解为多个相似子问题的任务,进一步扩展了其应用场景和功能复杂性。

Databend 怎么看 OpenAI 收购实时数仓 Rockset?

2024-06-27
阅读 4 分钟
498
6月21日(上周五),OpenAI 官方宣布完成对实时分析数据库 Rockset 的收购,一时引起数据库圈和 AI 圈热议,很多朋友也来询问 Databend 如何看待这个事件。这次收购表明了市场对实时数据分析和数据处理解决方案的高度重视,数据是 AI 发展的核心要素,拥有强大的数据处理能力将帮助 OpenAI 能够更好地将数据与 AI 技术进行...
封面图

SaaS 出海:Databend Cloud 的定位与实践

2024-06-26
阅读 6 分钟
500
提到 “SaaS 出海”这个词大家肯定并不陌生,SaaS 企业将业务拓展到海外市场已经成为许多 SaaS 公司的重要战略方向。随着企业对于灵活性、可扩展性以及成本效益需求的不断增长, SaaS 模式提供了理想的解决方案。对于寻求出海机会的 SaaS 企业来说,全球化市场的巨大潜力尤为吸引人。在许多地区,尤其是发展中市场, SaaS ...
封面图

Databend 开源周报第 150 期

2024-06-25
阅读 2 分钟
447
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:[链接] 。What's On In Databend探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。Databend Grafana 数据源插件Databend 现在提供专属的 Databend Grafana 数据源插件,可以帮助用户更加高效地建立...

Toco x Databend:Databend Cloud 如何满足 Web3 大数据服务的严苛考验?

2024-06-24
阅读 3 分钟
472
Toco 是一家位于瑞士的 Web3 服务提供商,致力于通过彻底改变全球金融体系的陈旧观念来应对气候变化。他们提供了一种开创性的碳货币 Tocos,每个流通中的 Tocos 代表一吨二氧化碳当量,存储在安全可靠的数字钱包中。用户可以使用 Tocos 应用轻松地将当地货币兑换为 Tocos,然后使用 Tocos 消费、储蓄或交易。每次用户使...
封面图

Databend 开源周报第 149 期

2024-06-18
阅读 2 分钟
621
Databend 现已支持递归公共表表达式(Recursive CTE)。递归公共表表达式,允许用户以递归的方式来执行查询,有助于增强对分层数据和层次结构的查询和处理。
封面图

Databend 开源周报第 148 期

2024-06-12
阅读 2 分钟
555
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:[链接] 。What's On In Databend探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。支持 ORC 文件加载ORC(Optimized Row Columnar)格式是一种高效的列存储格式,广泛应用于数据分析领域。Databend...

Databend 开源周报第 147 期

2024-06-04
阅读 3 分钟
514
继支持 WASM 和 JavaScript 之后,Databend 现已支持使用 Python 作为嵌入用户定义函数。Python UDFs 允许用户在 SQL 查询中嵌入 Python 代码,进行数据处理和分析,提供更加灵活易用的定制化数据处理方案,以应对复杂业务逻辑的挑战。

在 Kubesphere 中开启新一代云原生数仓 Databend

2024-05-30
阅读 7 分钟
512
上周六,由 KubeSphere 社区联合 Databend 社区以及纵目科技共同组织的云原生 Meetup 北京站在北京圆满落幕。本次 Meetup 活动邀请到了 SkyWalking PMC 成员、青云科技架构及可观测性团队负责人、江苏纵目科技 APM 研发总监、青云科技容器产品经理、数元灵科技 CTO 以及 Databend 云平台负责人等专家和大咖,为小伙伴们...
封面图

Databend 开源周报第 146 期

2024-05-28
阅读 2 分钟
528
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:[链接] 。What's On In Databend探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。支持 ExpressionScan 和 CacheScan为进一步提高查询的效率和性能,Databend 近期支持了 ExpressionScan 和 CacheS...

Databend 倒排索引的设计与实现

2024-05-23
阅读 6 分钟
592
倒排索引是一种用于全文搜索的数据结构。它的主要功能是将文档中的单词作为索引项,映射到包含该单词的文档列表。通过倒排索引,可以快速准确地定位到与查询词相匹配的文档列表,从而大幅提高查询性能。倒排索引在搜索引擎、数据库和信息检索系统中被广泛应用。
封面图

Databend 开源周报第 145 期

2024-05-21
阅读 2 分钟
365
Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:[链接] 。What's On In Databend探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。支持从 Stage 加载 UDF 脚本Databend 支持从 Stage 中加载 UDF 脚本,大大简化了脚本的管理和部署流程。现在你可...
封面图

对话 Databend Labs 联合创始人王吟:大模型浪潮里,云数仓是宠儿 | 极新企服直播实录

2024-05-16
阅读 6 分钟
479
据 IDC 预测,随着企业数字化转型,到 2026 年,中国大数据 IT 支出将达到 360 亿美元。Gartner 预测,得益于托管云服务的推动,到 2023 年,全球数据库市场有望达到 1000 亿美元。这给数仓带来的巨大的市场机会。

Databend 开源周报第 144 期

2024-05-14
阅读 3 分钟
315
SEQUENCE 是一种用于自动生成唯一数值标识符的对象,通常用于为表中的行分配不同的标识符,例如用户 ID 列。通常,序列从指定的值开始,并按指定的增量递增。

成本降低 90%,出海社交平台 Typing 基于 Databend 的大数据探索与实践

2024-05-09
阅读 4 分钟
338
Typing(输入中科技)成立于 2022 年,是一家主要面向东南亚、拉美、中东等海外地区提供社交平台的出海企业。其社交平台类似于国内的 Soul、陌陌等,提供视频直播、语音聊天室、短视频、生活分享、文字聊天等社交功能,注册用户超百万,日活用户数十万。人们可以在平台内认识有趣的人,结交新朋友,还可以建立自己的社交...
封面图

Databend 开源周报第 143 期

2024-05-07
阅读 2 分钟
289
几何函数是处理空间数据类型,如点、线和多边形等几何对象的一组函数。这些函数主要用于执行空间分析和地理数据管理,是地理信息系统(GIS)、计算机辅助设计(CAD)和其他需要空间数据处理的应用领域中不可或缺的工具,在地理位置服务、实时位置分析等领域发挥重要作用。
封面图

Databend 开源周报第 142 期

2024-04-30
阅读 3 分钟
272
Databend 现已支持 WASM UDF ,结合 CREATE FUNCTION 语法和强大的 STAGE 能力,可以从存储层加载 WASM 文件增强 Databend 的计算能力。
封面图