GraphX 在图数据库 Nebula Graph 的图计算实践

2020-11-11
阅读 7 分钟
1.8k
不同来源的异构数据间存在着千丝万缕的关联,这种数据之间隐藏的关联关系和网络结构特性对于数据分析至关重要,图计算就是以图作为数据模型来表达问题并予以解决的过程。

调试 Docker 容器内部进程

2020-10-28
阅读 6 分钟
1.6k
在开发或者测试过程中,我们经常会用到 vesoft-inc/nebula-docker-compose 这个 repo 下的部署方式,因为当初为了尽可能的压缩每个 Nebula Graph 服务的 docker 镜像的体积,所以开发过程中常用的一切工具都没有安装,甚至连编辑器 VIM 都没有。

主流开源分布式图数据库 Benchmark

2020-10-21
阅读 7 分钟
2.2k
近年来,深度学习和知识图谱技术发展迅速,相比于深度学习的“黑盒子”,知识图谱具有很强的可解释性,在搜索推荐、智能助理、金融风控等场景中有着广泛的应用。美团基于积累的海量业务数据,结合使用场景进行充分地挖掘关联,逐步建立起包括美食图谱、旅游图谱、商品图谱在内的近十个领域知识图谱,并在多业务场景落地,...

用 Docker swarm 快速部署分布式图数据库 Nebula Graph 集群

2020-10-14
阅读 14 分钟
2.2k
本文作者系:视野金服工程师 | 吴海胜首发于 Nebula Graph 论坛:[链接]一、前言本文介绍如何使用 Docker Swarm 来部署 Nebula Graph 集群,并部署客户端负载均衡和高可用。二、nebula 集群搭建2.1 环境准备机器准备在安装前确保所有机器已安装 Docker2.2 初始化 swarm 集群在 192.168.1.166 机器上执行 {代码...} 2.3 ...

一文了解 Nebula Graph DBaaS 服务——Nebula Graph Cloud Service

2020-09-25
阅读 2 分钟
1.1k
作为一款 DBaaS(DataBase as s Service)的产品,Nebula Graph Cloud Service 极大地降低了研发人员使用 Nebula Graph 的成本,更专注于使用 Nebula Graph 挖掘、分析数据背后的关联价值。

用图机器学习探索 A 股个股相关性变化

2020-09-24
阅读 9 分钟
2.3k
在本系列的前文 [1,2]中,我们介绍了如何使用 Python 语言图分析库 NetworkX [3] + Nebula Graph [4] 来进行<权力的游戏>中人物关系图谱分析。

从 Neo4j 导入 Nebula Graph 实践见 SPark 数据导入原理

2020-09-16
阅读 6 分钟
1.6k
本文主要讲述如何使用数据导入工具 Nebula Graph Exchange 将数据从 Neo4j 导入到 Nebula Graph Database。在讲述如何实操数据导入之前,我们先来了解下 Nebula Graph 内部是如何实现这个导入功能的。

360 数科实践:JanusGraph 到 NebulaGraph 迁移

2020-09-09
阅读 4 分钟
1.3k
摘要:在本文中 360 数科的周鹏详细讲解了业务从 JanusGraph 迁移到 Nebula Graph 带来的性能提升,在机器资源不到之前 JanusGraph 配置三分之一的情况下,业务性能提升至少 20 倍。

用 NetworkX + Gephi + Nebula Graph 分析<权力的游戏>人物关系(下篇)

2020-09-02
阅读 9 分钟
1.8k
在上一篇[1]中,我们通过 NetworkX 和 Gephi 展示了&lt;权力的游戏&gt;中的人物关系。在本篇中,我们将展示如何通过 NetworkX 访问图数据库 Nebula Graph。

图数据库对比:Neo4j vs Nebula Graph vs HugeGraph

2020-08-27
阅读 2 分钟
3.8k
图数据库在挖掘黑灰团伙以及建立安全知识图谱等安全领域有着天然的优势。为了能更好的服务业务,选择一款高效并且贴合业务发展的图数据库就变得尤为关键。本文挑选了几款业界较为流行的开源图数据库与 Nebula Graph 进行了多角度的对比。

Nebula Graph 特性讲解——RocksDB 统计信息的收集和展示

2020-08-13
阅读 2 分钟
1.7k
由于 Nebula Graph 的底层存储使用了 RocksDB,出于运维管理需要,我们的社区用户 @chenxu14 在 pr#2243 为 Nebula Graph 贡献了 RocksDB 统计信息收集的功能 ??

新手阅读 Nebula Graph 源码的姿势

2020-08-05
阅读 5 分钟
2.4k
摘要:在本文中,我们将通过数据流快速学习 Nebula Graph,以用户在客户端输入一条 nGQL 语句 SHOW SPACES 为例,使用 GDB 追踪语句输入时 Nebula Graph 是怎么调用和运行的。

同样是查询语言,它和 SQL 竟然有这么多不同

2020-07-23
阅读 7 分钟
2.1k
虽然本文主要介绍 nGQL 和 SQL 的区别,但是我们不会深入探讨这两种语言,而是将这两种语言做对比,以帮助你从 SQL 过渡到 nGQL。

浅析图数据库 Nebula Graph 数据导入工具——Spark Writer

2020-07-16
阅读 5 分钟
1.5k
近年来随着大数据的兴起,分布式计算引擎层出不穷。Hadoop 是 Apache 开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用。Hadoop 的设计核心思想来源于 Google MapReduce 论文,灵感来自于函数式语言中的 map 和 reduce 方法。在函数式语言中,map 表示针对列表中每个元素应用一个方法,reduce 表示...

D3.js 力导向图的显示优化(二)- 自定义功能

2020-07-09
阅读 5 分钟
4.3k
摘要: 在本文中,我们将借助 D3.js 的灵活性这一优势,去新增一些 D3.js 本身并不支持但我们想要的一些常见的功能:Nebula Graph 图探索的删除节点和缩放功能。文章首发于 Nebula Graph 官博:[链接]

Nebula Graph 在大规模数据量级下的实践和定制化开发

2020-07-02
阅读 4 分钟
3.5k
图数据在社交推荐、多跳实时计算、风控和安全等领域有可期待的前景。如何用图数据库高效存储和查询大规模异构图数据,是一个重大挑战。本文描述了开源分布式图数据库 Nebula Graph 实践中遇到的问题,并通过深度定制,实现:大数据集存储、小时级全量导入、多版本控制、秒级回滚、毫秒级访问等特性。

Nebula Graph 1.0 Release Note

2020-06-11
阅读 2 分钟
1.2k
Nebula Graph 1.0 发布了。作为一款开源分布式图数据库,Nebula Graph 1.0 版本旨在提供一个安全、高可用、高性能、具有强表达能力的查询语言的图数据库。

一文读懂图数据库 Nebula Graph 访问控制实现原理

2020-06-03
阅读 7 分钟
3.7k
数据库权限管理对大家来说都已经很熟悉了。Nebula Graph 本身是一个高性能的海量图数据库,数据库的安全问题更是数据库设计的重中之重。目前 Nebula Graph 已支持基于角色的权限控制功能。在这篇文章中将详细介绍 Nebula Graph 的用户管理和权限管理。

Task Manager 的设计简述

2020-05-27
阅读 5 分钟
2.3k
图数据库 Nebula Graph 中,存在一些长期在后台运行的任务,我们称之为 Job。存储层存在的 DBA 使用的部分指令,比如:数据完成导入后,想在全局做一次 compaction,都是 Job 范畴。

CPack 入门指南

2020-05-19
阅读 7 分钟
1.7k
背景 CPack 是 CMake 2.4.2 之后的一个内置工具,用于创建软件的二进制包和源代码包。 CPack 在整个 CMake 工具链的位置。 CPack 支持打包的包格式有以下种类: 7Z (7-Zip file format) DEB (Debian packages) External (CPack External packages) IFW (Qt Installer Framework) NSIS (Null Soft Installer) NSIS64 (Nul...

图数据库 Nebula Graph 是什么

2020-05-13
阅读 3 分钟
1.8k
图数据库(英语:Graph Database)是一个使用图结构进行语义查询的数据库。该系统的关键概念是图,形式上是点 (Node 或者 Vertex) 和边 (Edge 或者 Relationship) 的集合。一个顶点代表一个实体,比如,某个人,边则表示两个实体间的关联关系,比如 “你关注 Nebula Graph”的关注关系。图广泛存在于现实世界中,从社交网...

用 GitHub Action 构建一套 CI/CD 系统

2020-05-08
阅读 11 分钟
4.1k
Nebula Graph 最早的自动化测试是使用搭建在 Azure 上的 Jenkins,配合着 GitHub 的 Webhook 实现的,在用户提交 Pull Request 时,加个 ready-for-testing 的 label 再评论一句 Jenkins go 就可以自动的运行相应的 UT 测试,效果如下:

D3.js 力导向图的显示优化

2020-04-30
阅读 5 分钟
2.6k
作为一个前端,说到可视化除了听过 D3.js 的大名,常见的可视化库还有 ECharts、Chart.js,这两个库功能也很强大,但是有一个共同特点是封装层次高,留给开发者可设计和控制的部分太少。和 EChart、Chart.js 等相比,D3.js 的相对来说自由度会高很多,得益于 D3.js 中的 SVG 画图对事件处理器的支持,D3.js 可将任意数据...

基于 Jepsen 来发现几个 Raft 实现中的一致性问题(2)

2020-04-15
阅读 4 分钟
2.1k
Nebula Graph 是一个高性能、高可用、强一致的分布式图数据库。由于 Nebula Graph 采用的是存储计算分离架构,在存储层实际只是暴露了简单的 kv 接口,采用 RocksDB 作为状态机,通过 Raft 一致性协议来保证多副本数据一致的问题。Raft 协议虽然比 Paxos 更加容易理解,但在工程实现上还是有很多需要注意和优化的地方。

用全站 CDN 部署 Discourse 论坛

2020-04-08
阅读 6 分钟
2.3k
Discourse 是一款由 Stack Overflow 的联合创始人——Jeff Atwood,基于 Ruby on Rails 开发的开源论坛。相较于传统论坛,Discourse 从他全面开放的开源态度、简介明了的页面风格到其特有的内容运作体系都在证明自己是一款为下一个 10 年的互联网而设计的产品。现在,诸如 Car Talk 等国外知名产品都采用 Discourse 为论坛...

浅谈图数据库

2020-04-01
阅读 13 分钟
2k
下面这张图是一个社交网络场景,每个用户可以发微博、分享微博或评论他人的微博。这些都是最基本的增删改查,也是大多数研发人员对数据库做的常见操作。而在研发人员的日常工作中除了要把用户的基本信息录入数据库外,还需找到与该用户相关联的信息,方便去对单个的用户进行下一步的分析,比如说:我们发现张三的账户里...

图数据库 Nebula Graph TTL 特性

2020-03-25
阅读 7 分钟
2.8k
身处在现在这个大数据时代,我们处理的数据量需以 TB、PB, 甚至 EB 来计算,怎么处理庞大的数据集是从事数据库领域人员的共同问题。解决这个问题的核心在于,数据库中存储的数据是否都是有效的、有用的数据,因此如何提高数据中有效数据的利用率、将无效的过期数据清洗掉,便成了数据库领域的一个热点话题。在本文中我们...

使用 Github Action 进行前端自动化发布

2020-03-17
阅读 4 分钟
1.4k
说起自动化,无论是在公司还是我们个人的项目中,都会用到或者编写一些工具来帮助我们去处理琐碎重复的工作,以节约时间提升效率,尤其是我们做前端开发会涉及诸如构建、部署、单元测试等这些开发工作流中重复的事项,本篇文章就是介绍如何利用 GitHub 提供的 Actions 来完成我们前端的发布自动化。

分布式图数据库 Nebula Graph 的 Index 实践

2020-03-12
阅读 9 分钟
5k
索引是数据库系统中不可或缺的一个功能,数据库索引好比是书的目录,能加快数据库的查询速度,其实质是数据库管理系统中一个排序的数据结构。不同的数据库系统有不同的排序结构,目前常见的索引实现类型如 B-Tree index、B+-Tree index、B*-Tree index、Hash index、Bitmap index、Inverted index 等等,各种索引类型都...

一文了解各大图数据库查询语言(Gremlin vs Cypher vs nGQL)| 操作入门篇

2020-03-05
阅读 11 分钟
1.9k
虽然和关系型数据库存储的结构不同(关系型数据库为表结构,图数据库为图结构),但不计各自的性能问题,关系型数据库可以通过递归查询或者组合其他 SQL 语句(Join)完成图查询语言查询节点关系操作。得益于 1987 年 SQL 成为国际标准化组织(ISO)标准,关系型数据库行业得到了很好的发展。同 60、70 年代的关系型数据...