近日,企业级智能数据分析工具 AskTable 在其产品中新增支持云原生数据湖仓 Databend。继 MySQL、PostgreSQL、ClickHouse、TiDB 等之后,Databend 成为 AskTable 支持的又一款现代分析型数据库。此次集成将自然语言分析与高性能数仓能力结合,为用户带来更便捷、更智能的数据分析体验。
从写 SQL 到问问题,企业正在改变使用数据的方式
随着数据持续积累到数据库、数据湖或业务系统中,企业内部“想查点数据”却常常意味着找人写 SQL、排期做报表,数据工程师通过 Excel 来维护一个数据需求的列表。无论是运营分析、客户画像还是管理决策,这样的流程显然已经无法满足当下对效率和敏捷的要求。
AskTable 的出现,正是为了解决这个问题。它以自然语言为交互入口,用户只需像与 AI 对话一样提出问题,系统就能理解业务意图、自动生成 SQL 并返回分析结果。支持文本、表格、图表、Excel 下载等多种展现方式,真正让数据查询回归“说一句话就能看到答案”的理想状态。
作为中国首家企业级表格智能体(Table Agent as a Service)平台,AskTable 基于 DeepSeek、通义千问、GPT、Claude 等领先大模型,广泛支持 Excel、数据库、数据仓库和知识库的智能查询,并具备身份识别、权限控制、任务自动化、私有化部署等多种功能,已在金融、制造、教育等行业落地应用。
目前 AskTable 支持的功能包括:
- 自然语言转 SQL 查询,自动理解业务语义;
- 身份识别与权限控制,基于“我”的语义解析(如“我上周负责的客户销售额”);
- 多 数据源 连接,支持包括 MySQL、PostgreSQL、Oracle、TiDB、Databend、ClickHouse 等数十种主流数据库;
- 灵活可视化,查询结果可通过文本、图表、表格、Excel 文件多种形式展示;
- 任务自动化,可触发预设流程或下游系统调用;
- 本地部署与私有化支持,确保数据隐私与合规性。
从 AskTable 的核心架构来看, AskTable 对语义到 SQL 的生成高度依赖大模型。生成 SQL 后,目标数据库执行并返回结果,其中一部分数据直接返回,另一部分则通过 AI 进行自动语义处理。
Databend + AskTable 将为用户带来什么?
Databend 是一个使用 Rust 研发、开源、基于对象存储设计的新一代云原生数据湖仓产品,提供极速的弹性扩展能力和按需、按量使用的产品体验,致力于打造开源版的 Snowflake。目前,Databend 已在游戏、社交、金融、广告、电商等多个行业领域中成功替代 Snowflake、Redshift、 BigQuery 、GreenPlum、ClickHouse、CDH 等产品,为客户提供了降本增效的 数据分析 平台。
集成 Databend 后,可以帮助 AskTable 用户获得以下收益:
- 统一数据平台, 统一存储,统一计算,统一权限管理
- 无需顾虑索引条件,支持 AskTable 生成的任意 SQL
- 在 Databend Cloud 中按需付费,尽量低的降低用户的成本
Databend 将成为 AskTable 平台上一个兼具性能、易用性与性价比的数据数据平台选项,为企业打造“自然语言分析 + 高性能数据平台”的组合提供了数据+AI 方案,以较低的成本可以给决策层或业务使用方提供一个智能数据驾驶室。
AskTable + Databend 实战:5 个自然语言问题搞定 GitHub 日志分析
以 Databend Cloud (https://app.databend.cn)为例,我们选取了 2025 年 5 月 15 日的 GitHub 事件日志作为样本,测试 AskTable 生成 SQL 并访问 Databend 的效果。
Step 1:连接 数据源
通过 AskTable 创建会话,连接 Databend Cloud,并选择要分析的表(支持最多 100 张表)。系统将自动读取表结构、字段统计信息,并准备好语义模型推理。
等待 AskTable 获取表的元数据和一些统计信息然后和大模型交流。这里如果表和字段太多,与大模型交互需要一些时间。 等待完成后,就可以开始第二步。
Step 2:发起查询对话,验证 智能数据分析
系统自动将自然语言转为 SQL,发起查询,并将结果返回。我们在 AskTable 中依次提出以下 5 个自然语言问题:
Q1: 基于 数据分析 当前最热门的前十个项目是?
以下是对应的 SQL:
该表其实只有当天 2025年5月11日一天的数据,SQL 产生的逻辑是从数据的最小值到当前时间。
AskTable 给出的可观测性数据:
下面是 Databend Cloud 提供的 SQL 执行相关的日志:
在 Databend Cloud 上的 SQL 日志中,执行时间为 640ms。但整体感觉时间应该有 9 秒左右,从两边时间上看还有不少调优空间。
下面是上述 SQL 在 Databend Cloud 上的执行计划:对应环节及用时。
从可观测性看 AskTable 和 Databend 都具备较好的可观测性来分析性能问题。AskTable 私有化也提供可观测平台交付。
Q2: 最火的开发语言有哪些?显示 top 10 , null 的不统计。
Q3: 显示被点 star 最多的项目前十名
Q4:5 月 15 日 databend 相关 repo 都有谁在活跃?
这里显示竟然没有结果,通过检查发现是对应的 SQL 把 repo_name 写成了 like '%Databend%' ,应该主要是 D 大写了。需要给它一个提示:
给出提示后可以完美展示出结果。 这种人机交互优化也可以通过术语表或语义别名机制进一步提升准确率。
Q5: 5月15日 GitHub 上共有多少事件?
这个问题和 Q4 形成了反差,提问都有点不通顺,反而 AskTable 也可以完美理解及完成工作。
使用体验总结
在实际体验中,我们观察到:
- AskTable 在单表结构化查询生成上的准确率非常高;
- AskTable 支持基于 RAG(Retrieval-Augmented Generation)方式的提示,在大模型功能强大的支撑下,能够实现较为完善的自助查询能力;
- 在单表模式下,AskTable 对 github_events 每个字段的提示均准确,生成的 SQL 也较为精确,令人感叹大模型的强大。
AskTable 的最佳使用方式是在平台内部嵌入会话窗口使用,让平台快速具备 AI 分析数据的能力。
关于 Databend
Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式湖仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。
👨💻 Databend Cloud:databend.cn
📖 Databend 文档:docs.databend.cn
💻 Wechat:Databend
✨ GitHub:github.com/databendlab...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。