分布式图数据库 Nebula Graph 的 Index 实践

2020-03-12
阅读 9 分钟
5.2k
索引是数据库系统中不可或缺的一个功能,数据库索引好比是书的目录,能加快数据库的查询速度,其实质是数据库管理系统中一个排序的数据结构。不同的数据库系统有不同的排序结构,目前常见的索引实现类型如 B-Tree index、B+-Tree index、B*-Tree index、Hash index、Bitmap index、Inverted index 等等,各种索引类型都...

一文了解各大图数据库查询语言(Gremlin vs Cypher vs nGQL)| 操作入门篇

2020-03-05
阅读 11 分钟
2.1k
虽然和关系型数据库存储的结构不同(关系型数据库为表结构,图数据库为图结构),但不计各自的性能问题,关系型数据库可以通过递归查询或者组合其他 SQL 语句(Join)完成图查询语言查询节点关系操作。得益于 1987 年 SQL 成为国际标准化组织(ISO)标准,关系型数据库行业得到了很好的发展。同 60、70 年代的关系型数据...

Kubernetes 部署 Nebula 图数据库集群

2020-02-26
阅读 18 分钟
1.6k
Kubernetes 是一个开源的,用于管理云平台中多个主机上的容器化的应用,Kubernetes 的目标是让部署容器化的应用简单并且高效,Kubernetes 提供了应用部署,规划,更新,维护的一种机制。Kubernetes 在设计结构上定义了一系列的构建模块,其目的是为了提供一个可以部署、维护和扩展应用程序的机制,组成 Kubernetes 的组...

应用 AddressSanitizer 发现程序内存错误

2020-02-19
阅读 6 分钟
2.7k
作为 C/ C++ 工程师,在开发过程中会遇到各类问题,最常见便是内存使用问题,比如,越界,泄漏。过去常用的工具是 Valgrind,但使用 Valgrind 最大问题是它会极大地降低程序运行的速度,初步估计会降低 10 倍运行速度。而 Google 开发的 AddressSanitizer 这个工具很好地解决了 Valgrind 带来性能损失问题,它非常快,只...

前端 Docker 镜像体积优化

2020-02-11
阅读 3 分钟
1.9k
如果 2019 年技术圈有十大流行词,容器化肯定占有一席之地,随着 Docker 的风靡,前端领域应用到 Docker 的场景也越来越多,本文主要来讲述下开源的分布式图数据库 Nebula Graph 是如何将 Docker 应用到可视化界面中,并将 1.3G 的 Docker 镜像优化到 0.3G 的实践经验。

从天津百货大楼 5 病例“迷局”见新冠病毒传播路径

2020-02-07
阅读 6 分钟
1.9k
天津某百货大楼内部相继出现 5 例新冠肺炎确诊病例,从起初的 3 个病例来看,似乎找不到任何流行病学上的关联性。在这种背景之下,作为技术人员可以通过什么技术来找寻病例之间的联系呢?

图数据库设计实践 | 存储服务的负载均衡和数据迁移

2020-02-06
阅读 12 分钟
1.8k
在文章《Nebula 架构剖析系列(一)图数据库的存储设计》中,我们提过分布式图存储的管理由 Meta Service 来统一调度,它记录了所有 partition 的分布情况,以及当前机器的状态。当 DBA 增减机器时,只需要通过 console 输入相应的指令,Meta Service 便能够生成整个 Balance 计划并执行。而之所以没有采用完全自动 Bala...

聊聊图数据库和图数据库的小知识 Vol.02

2020-01-15
阅读 5 分钟
1.5k
2010 年前后,对于社交媒体网络研究的兴起带动了图计算的大规模应用。2000 年前后热门的是 信息检索 和 分析 ,主要是 Google 的带动,以及 Amazon 的 e-commerce 所用的协同过滤推荐,当时 collaborative filtering也被认为是 information retrieval 的一个细分领域,包括 Google 的 PageRank 也是在信息检索领域研究较...

Jepsen 测试框架在图数据库 Nebula Graph 中的实践

2020-01-10
阅读 7 分钟
2.4k
Jepsen 是一款用于系统测试的开源软件库,致力于提高分布式数据库、队列、共识系统等的安全性。作者 Kyle Kingsbury 使用函数式编程语言 Clojure 编写了这款测试框架,并对多个著名的分布式系统和数据库进行了一致性测试。目前 Jepsen 仍在 GitHub 保持活跃,能否通过 Jepsen 的测试已经成为各个分布式数据库对自身检验...

Github Statistics 一个基于 React 的 GitHub 数据统计工具

2019-12-25
阅读 3 分钟
6.8k
V 站曾经有个热帖说为何我的开源项目只有 Fork 没有 Star,楼下有个热评说开源项目关注的不应该是 Commit 数据吗?先不论 Star、Fork 和 Commit,issue 、pr 也应是一个开源项目社区关注的数据。

Dev 日志 | 如何将 jar 包发布到 Maven 中央仓库

2019-12-12
阅读 14 分钟
1.8k
Maven 中央仓库并不支持直接上传 jar 包,因此需要将 jar 包发布到一些指定的第三方 Maven 仓库,比如:Sonatype OSSRH 仓库,然后该仓库再将 jar 包同步到 Maven ,本文详细记录整个发布、同步过程。

分布式图数据库 Nebula Graph 中的集群快照实践

2019-12-06
阅读 9 分钟
1.7k
图数据库 Nebula Graph 在生产环境中将拥有庞大的数据量和高频率的业务处理,在实际的运行中将不可避免的发生人为的、硬件或业务处理错误的问题,某些严重错误将导致集群无法正常运行或集群中的数据失效。当集群处于无法启动或数据失效的状态时,重新搭建集群并重新倒入数据都将是一个繁琐并耗时的工程。针对此问题,Neb...

分布式图数据库 Nebula RC2 发布:增强了 CSV Importer 功能

2019-12-05
阅读 2 分钟
1.6k
本次 RC2 主要新增 GO FROM ... REVERSELY 和 GROUP BY 等语句,Storage Engine 也更灵活,用户可以通过 Console 或 Http 获取配置信息,触发 compaction;客户端目前支持 Python,Java,Go;在工具方面,增强了 CSV Importer 功能

Dev 日志 | 文章《快速体验知识图谱 OwnThink》中的技术问题

2019-12-03
阅读 3 分钟
1.2k
使用 nebula-importer 时,报错: panic: yaml: line 14: mapping values are not allowed in this contex 这个错误原因是 config.yaml 文件里的第一个 **- path** 字段没对齐,更改方式是在第一个 - path 字段前面加个空格。该错误在最新打包的 oss 包里已经更正。更改之后的配置文件可去 GitHub (链接:[链接])或者...

使用图数据库 Nebula Graph 数据导入快速体验知识图谱 OwnThink

2019-11-26
阅读 7 分钟
3.1k
知识图谱是由 Google 在 2012 年提出来的一个概念。主要是用来描述真实世界中存在的各种实体和概念,以及他们之间的关系。在搜索引擎、问答机器人、知识抽取等多个领域有着诸多应用。

Nebula 架构剖析系列(二)图数据库的查询引擎设计

2019-11-21
阅读 3 分钟
1.5k
上文(存储篇)说到数据库重要的两部分为存储和计算,本篇内容为你解读图数据库 Nebula 在查询引擎 Query Engine 方面的设计实践。

Dev 日志 | 一次 Segmentation Fault 和 GCC Illegal Instruction 编译问题排查

2019-11-20
阅读 4 分钟
3.3k
摘要 笔者最近在重新整理和编译 Nebula Graph 的第三方依赖,选出两个比较有意思的问题给大家分享一下。 Flex Segmentation Fault——Segmentation fault (core dumped) 在编译 Flex 过程中,遇到了 Segmentation fault: {代码...} 使用 gdb 查看 coredump: {代码...} 可以看到,问题出在了 allocate_array 函数。因为 r...

COSCon'19 | 如何设计新一代的图数据库 Nebula

2019-11-12
阅读 6 分钟
2.5k
11 月 2 号 - 11 月 3 号,以“大爱无疆,开源无界”为主题的 2019 中国开源年会(COSCon'19)正式启动,大会以开源治理、国际接轨、社区发展和开源项目为切入点同全球开源爱好者们共同交流开源。

图数据库 Nebula Graph RC1 Release Note

2019-11-05
阅读 2 分钟
1.2k
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。

Nebula 架构剖析系列(一)图数据库的存储设计

2019-10-15
阅读 7 分钟
1.5k
在讨论某个数据库时,存储 ( Storage ) 和计算 ( Query Engine ) 通常是讨论的热点,也是爱好者们了解某个数据库不可或缺的部分。每个数据库都有其独有的存储、计算方式,今天就和图图来学习下图数据库 Nebula Graph 的存储部分。

Nebula 架构剖析系列(零)图数据库的整体架构设计

2019-10-14
阅读 2 分钟
1.9k
一个完整的 Nebula 部署集群包含三个服务,即  Query Service,Storage Service 和 Meta Service。每个服务都有其各自的可执行二进制文件,这些二进制文件既可以部署在同一组节点上,也可以部署在不同的节点上。

Open Source v.s. Open Core

2019-10-11
阅读 3 分钟
3.1k
本文翻译自 CMSWire 网站的《Open Source vs. Open Core: What's the Difference?》,主要介绍 Open Source 和 Open Core 的区别。Open Source 已广为人知,那么 Open Core 又是什么,在开源软件盛行的今天,二者会怎样影响这个市场呢?

Nebula Graph 技术总监陈恒:图数据库怎么和深度学习框架进行结合?

2019-10-10
阅读 4 分钟
4.8k
Nebula Graph 的技术总监在 09.24 - 09.30 期间同开源中国·高手问答的小伙伴们以「图数据库的设计和实践」为切入点展开讨论,包括:「图数据库的存储设计」、「图数据库的计算设计」、「图数据库的架构设计」等方面内容,本文整理于他和开源中国小伙伴对图数据库的讨论内容~

图数据库爱好者的聚会在谈论什么?

2019-09-12
阅读 4 分钟
2.1k
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。

使用 Docker 构建 Nebula Graph 源码

2019-09-06
阅读 2 分钟
1.9k
Nebula Graph 是开源的高性能分布式图数据库。项目使用 C++ 语言开发,cmake 工具构建。其中两个重要的依赖是 Facebook 的 Thrift RPC 框架和 folly 库.

图数据库 Nebula Graph 的安装部署

2019-08-29
阅读 5 分钟
2.7k
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。

聊聊图数据库和图数据库的小知识

2019-08-23
阅读 7 分钟
3.6k
图数据库 - 维基百科:在计算机科学中,图数据库(英语:graph database,GDB)是一个使用图结构进行语义查询的数据库,它使用节点、边和属性来表示和存储数据。该系统的关键概念是图,它直接将存储中的数据项,与数据节点和节点间表示关系的边的集合相关联。这些关系允许直接将存储区中的数据链接在一起,并且在许多情...

图数据库 Nebula Graph v.1.0.0-beta 已上线

2019-08-20
阅读 1 分钟
1.8k
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。

图数据库综述与 Nebula 在图数据库设计的实践

2019-08-10
阅读 12 分钟
5k
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。

图数据库 Nebula Graph 在 HBaseCon Asia2019 的分享实录

2019-07-24
阅读 8 分钟
8.4k
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。